Hướng Dẫn Sử Dụng Gemini 2.5 06-05 Pro API Mới Nhất

Phiên bản mới nhất trong dòng mô hình Gemini của Google, được phát hành dưới dạng bản xem trước vào ngày 5 tháng 6 năm 2025, mang đến những khả năng vượt trội cho các nhà phát triển. API này cho phép bạn xây dựng các ứng dụng đa phương thức (multimodal) tiên tiến có thể xử lý văn bản, hình ảnh, video, v.v., đồng thời xuất sắc trong các tác vụ suy luận và lập trình. Cho dù bạn muốn tạo ứng dụng web tương tác, phân tích tập dữ liệu phức tạp hay tự động hóa quy trình làm việc, hướng dẫn này sẽ giúp bạn thực hiện quy trình đó một cách chính xác.

💡

Trước khi tiếp tục, hãy tinh giản quy trình kiểm thử và tích hợp API của bạn với Apidog! Tải xuống Apidog miễn phí để đơn giản hóa việc gửi yêu cầu, gỡ lỗi phản hồi và quản lý quy trình làm việc cho API Gemini 2.5 06-05 Pro. Đây là một người bạn đồng hành hoàn hảo cho các nhà phát triển làm việc với các mô hình AI tiên tiến. Bắt đầu ngay hôm nay!

nút

Bây giờ, hãy cùng khám phá cách thiết lập, cấu hình và các trường hợp sử dụng thực tế để khai thác toàn bộ tiềm năng của API mạnh mẽ này.

API Gemini 2.5 06-05 Pro là gì?

API Gemini 2.5 06-05 Pro, được phát triển bởi Google DeepMind, đại diện cho đỉnh cao trong công nghệ AI đa phương thức. Được phát hành dưới dạng bản xem trước nâng cấp vào ngày 5 tháng 6 năm 2025, mô hình này xây dựng dựa trên các phiên bản trước đó, mang lại hiệu suất vượt trội trong các tác vụ lập trình, suy luận và sáng tạo. Nó tự hào có cửa sổ ngữ cảnh 1 triệu token (với 2 triệu token sắp ra mắt), cho phép xử lý các cơ sở mã (codebase) mở rộng, tài liệu và đầu vào đa phương tiện như hình ảnh và video.

Hơn nữa, API này vượt trội trong các điểm chuẩn, dẫn đầu bảng xếp hạng WebDev Arena với bước nhảy điểm Elo 24 lên 1470 và đạt 84.8% trên VideoMME về khả năng hiểu video. Khả năng suy luận của nó tỏa sáng trong toán học, khoa học và lập trình, khiến nó trở nên lý tưởng cho các nhà phát triển xây dựng các ứng dụng phức tạp. Tiếp theo, chúng ta sẽ thiết lập môi trường của bạn để bắt đầu sử dụng API này một cách hiệu quả.

Điều kiện tiên quyết để sử dụng API Gemini 2.5 06-05 Pro

Trước khi bắt đầu, hãy đảm bảo môi trường phát triển của bạn đáp ứng các yêu cầu sau:

Tài khoản Google: Đăng ký hoặc đăng nhập tại accounts.google.com để truy cập Google AI Studio.
Khóa API: Tạo khóa thông qua Google AI Studio để xác thực.
Python 3.7+: Cài đặt Python từ python.org nếu chưa có.
Môi trường ảo (Virtual Environment): Cô lập các phụ thuộc để quản lý dự án gọn gàng.
Thư viện: Cài đặt gói google-generativeai để tương tác với API.
Apidog: Tùy chọn, nhưng được khuyến nghị để kiểm thử và gỡ lỗi các yêu cầu API.

Đầu tiên, cài đặt Python và thiết lập môi trường ảo. Chạy các lệnh này trong terminal của bạn:

python -m venv gemini_env
source gemini_env/bin/activate  # On Windows: gemini_env\Scripts\activate

Sau đó, cài đặt thư viện cần thiết:

pip install google-generativeai

Hoàn thành các bước này, bạn đã sẵn sàng cấu hình API. Hãy tiếp tục với việc xác thực và thiết lập.

Thiết lập xác thực cho API Gemini 2.5 06-05 Pro

Để sử dụng API **Gemini 2.5 06-05** Pro, hãy xác thực các yêu cầu của bạn bằng khóa API. Làm theo các bước sau để bắt đầu:

Truy cập Google AI Studio: Mở trình duyệt của bạn và truy cập aistudio.google.com.

Đăng nhập: Sử dụng thông tin đăng nhập tài khoản Google của bạn để đăng nhập.

Tạo khóa API: Tìm tùy chọn “Get API key” (Lấy khóa API) trong bảng điều khiển. Nhấp vào đó, làm theo hướng dẫn và sao chép khóa được tạo. Lưu trữ khóa an toàn—không bao giờ chia sẻ công khai.

Nhấp vào đó, làm theo hướng dẫn và sao chép khóa được tạo. Lưu trữ khóa an toàn—không bao giờ chia sẻ công khai.

Đặt biến môi trường: Để bảo mật, hãy đặt khóa làm biến môi trường. Trong terminal của bạn, chạy:

export GEMINI_API_KEY='your_api_key_here'  # On Windows: set GEMINI_API_KEY=your_api_key_here

Bây giờ, khởi tạo client trong Python. Đây là thiết lập cơ bản:

import os
from google import genai

# Retrieve API key from environment variable
API_KEY = os.environ.get("GEMINI_API_KEY")
client = genai.Client(api_key=API_KEY)

Sau khi cấu hình xác thực, bạn đã sẵn sàng gửi yêu cầu. Tiếp theo, chúng ta sẽ khám phá cách thực hiện cuộc gọi API đầu tiên với mô hình **Gemini 2.5 06-05**.

Thực hiện cuộc gọi API đầu tiên với Gemini 2.5 06-05

Hãy kiểm thử API **Gemini 2.5 06-05** Pro với một yêu cầu dựa trên văn bản đơn giản. Ví dụ này yêu cầu mô hình giải thích một khái niệm cơ bản. Sử dụng mã Python này:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a text request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Explain how a neural network works in simple terms."
)

# Print the response
print(response.text)

Mã này gửi yêu cầu POST đến điểm cuối API, nhắm mục tiêu đến mô hình **Gemini 2.5 06-05**. Phản hồi giải thích mạng nơ-ron bằng ngôn ngữ rõ ràng, súc tích. Kết quả mong đợi giống như:

Mạng nơ-ron là một mô hình tính toán lấy cảm hứng từ bộ não con người. Nó bao gồm các lớp nút (nơ-ron) xử lý dữ liệu đầu vào, điều chỉnh trọng số dựa trên các mẫu và tạo ra đầu ra, chẳng hạn như dự đoán hoặc phân loại.

Để xác minh chức năng, hãy kiểm thử yêu cầu này trong Apidog. Tạo một dự án mới, đặt phương thức HTTP là POST, nhập URL điểm cuối (tìm thấy trong tài liệu Google AI Studio), thêm tiêu đề Authorization: Bearer YOUR_API_KEY và bao gồm payload JSON:

{
    "model": "gemini-2.5-pro-preview-06-05",
    "contents": "Explain how a neural network works in simple terms."
}

Nhấp vào “Send” (Gửi) trong Apidog để kiểm tra phản hồi, mã trạng thái và thời gian. Điều này xác nhận thiết lập của bạn hoạt động. Bây giờ, hãy chuyển sang các khả năng đa phương thức.

Khai thác các tính năng đa phương thức của Gemini 2.5 06-05

API **Gemini 2.5 06-05** Pro nổi bật với khả năng đa phương thức, xử lý văn bản, hình ảnh và video. Phần này sẽ chỉ cho bạn cách sử dụng hiệu quả các tính năng này.

Xử lý văn bản và hình ảnh

Kết hợp lời nhắc văn bản với hình ảnh cho các tác vụ như phân tích hình ảnh. Tải lên một hình ảnh (ví dụ: ảnh bánh scone) và yêu cầu mô hình mô tả nó. Đây là mã:

from google import genai
from google.genai.types import HttpOptions, Part

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a text and image request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents=[
        "Describe this image in detail.",
        Part.from_uri(
            file_uri="gs://cloud-samples-data/generative-ai/image/scones.jpg",
            mime_type="image/jpeg"
        )
    ]
)

# Print the response
print(response.text)

Mô hình có thể phản hồi:

Hình ảnh hiển thị bố cục phẳng của bánh scone việt quất trên giấy nướng. Sáu chiếc bánh scone hình tam giác, màu vàng nâu, được sắp xếp theo hình tròn, với những quả việt quất tươi rải rác xung quanh. Kết cấu trông vụn, đặc trưng của bánh scone được nướng kỹ.

Đảm bảo hình ảnh của bạn có thể truy cập được qua URI Google Cloud Storage hoặc tải trực tiếp lên nếu được hỗ trợ. Khả năng này phù hợp với các ứng dụng như thương mại điện tử hoặc phân tích nội dung.

Hiểu video

Mô hình **Gemini 2.5 06-05** vượt trội trong khả năng hiểu video, đạt 84.8% trên điểm chuẩn VideoMME. Gửi URL YouTube hoặc tệp video kèm theo lời nhắc để phân tích nội dung. Ví dụ:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a video request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents=[
        "Create a spec for a learning app based on this video.",
        "https://www.youtube.com/watch?v=example_video"
    ]
)

# Print the response
print(response.text)

Điều này tạo ra một đặc tả chi tiết cho một ứng dụng học tập tương tác, tận dụng nội dung của video. API xử lý tối đa 6 giờ video với cửa sổ ngữ cảnh 2 triệu token ở cài đặt độ phân giải media “thấp”, cân bằng chi phí và hiệu suất.

Sau khi nắm vững các tính năng đa phương thức, hãy chuyển sang hỗ trợ lập trình tiếp theo.

Lập trình với API Gemini 2.5 06-05 Pro

API **Gemini 2.5 06-05** Pro chiếm ưu thế trong các tác vụ lập trình, dẫn đầu bảng xếp hạng WebDev Arena với điểm Elo 1470. Nó tạo, chỉnh sửa và gỡ lỗi mã trên các ngôn ngữ như Python, JavaScript, v.v. Dưới đây là cách sử dụng:

Tạo mã

Yêu cầu một hàm, chẳng hạn như bộ tính toán dãy Fibonacci. Hãy thử điều này:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a coding request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Write a Python function to calculate the Fibonacci sequence up to n terms."
)

# Print the response
print(response.text)

Kết quả có thể là:

def fibonacci(n):
    if n <= 0:
        return []
    elif n == 1:
        return [0]
    sequence = [0, 1]
    for i in range(2, n):
        sequence.append(sequence[i-1] + sequence[i-2])
    return sequence

# Example usage
print(fibonacci(10))  # Output: [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

Hàm này hiệu quả và chính xác, thể hiện khả năng suy luận của mô hình.

Gỡ lỗi và tối ưu hóa

Gửi mã hiện có để phân tích. Ví dụ:

from google import genai
from google.genai.types import HttpOptions

# Initialize client
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# Send a debugging request
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Debug this code for errors and suggest improvements: def fib(n): if n == 0: return 0 elif n == 1: return 1 else: return fib(n-1) + fib(n-2)"
)

# Print the response
print(response.text)

Mô hình có thể phản hồi:

n

def fib(n):
    if n < 0:
        raise ValueError("Input must be non-negative")
    if n == 0:
        return 0
    elif n == 1:
        return 1
    a, b = 0, 1
    for _ in range(2, n + 1):
        a, b = b, a + b
    return b

Cải tiến: Đã thêm xử lý lỗi cho đầu vào âm; thay thế đệ quy bằng phép lặp cho độ phức tạp thời gian O(n); sử dụng giải nén tuple (tuple unpacking) để rõ ràng hơn.

Điều này cải thiện đáng kể hiệu suất. Bây giờ, hãy khám phá các trường hợp sử dụng nâng cao.

Các trường hợp sử dụng nâng cao cho API Gemini 2.5 06-05 Pro

API **Gemini 2.5 06-05** Pro mở khóa các ứng dụng phức tạp. Hãy xem xét các kịch bản sau:

Phát triển ứng dụng web: Tạo HTML, CSS và JavaScript cho giao diện người dùng (UI) tương tác. Nhắc API: “Xây dựng một ứng dụng đọc chính tả với hoạt ảnh UI micro và thiết kế đáp ứng (responsive design).” Nó cung cấp mã chức năng, khớp với các kiểu từ các tham chiếu thiết kế.
Video thành ứng dụng học tập: Phân tích một video hướng dẫn trên YouTube và tạo đặc tả cho một ứng dụng tương tác, sau đó tạo mã. Điều này phù hợp với các nền tảng giáo dục.
Phân tích cơ sở mã: Tải lên tệp ZIP dự án của bạn. API, với cửa sổ ngữ cảnh khổng lồ của nó, sẽ xem xét các phụ thuộc, đề xuất sửa lỗi và tối ưu hóa logic.

Để kiểm thử những điều này, hãy sử dụng Apidog để mô phỏng phản hồi API và xác thực chức năng. Chuyển sang các phương pháp hay nhất đảm bảo kết quả tối ưu.

Các phương pháp hay nhất cho API Gemini 2.5 06-05 Pro

Tối đa hóa hiệu quả của API **Gemini 2.5 06-05** Pro với những mẹo sau:

Soạn lời nhắc rõ ràng: Chỉ định các tác vụ một cách chính xác, ví dụ: “Tạo một hàm Python để sắp xếp một danh sách, xử lý các phần tử trùng lặp.”
Điều chỉnh tham số: Đặt thinking_budget cho các tác vụ phức tạp (ví dụ: 1024 token) để cân bằng chất lượng và độ trễ.
Kiểm thử kỹ lưỡng: Sử dụng Apidog để gửi yêu cầu, kiểm tra mã trạng thái và tinh chỉnh payload.
Bảo mật khóa: Lưu trữ khóa API trong các biến môi trường, không phải trong mã.
Theo dõi mức sử dụng: Theo dõi giới hạn tốc độ (rate limits) trong Google AI Studio để tránh gián đoạn.

Bằng cách làm theo những điều này, bạn đảm bảo hiệu quả và độ tin cậy. Hãy cùng kết thúc.

Kết luận: Khai thác API Gemini 2.5 06-05 Pro

API **Gemini 2.5 06-05** Pro trao quyền cho các nhà phát triển xây dựng các ứng dụng tiên tiến. Từ thiết lập và xác thực đến xử lý đa phương thức và lập trình, hướng dẫn này trang bị cho bạn để khai thác sức mạnh của nó. Vị trí dẫn đầu của nó trong WebDev Arena, khả năng hiểu video mạnh mẽ và khả năng suy luận khiến nó trở thành một yếu tố thay đổi cuộc chơi. Bắt đầu xây dựng ngay hôm nay—thử nghiệm trong Google AI Studio, tích hợp với Vertex AI hoặc kiểm thử trong ứng dụng Gemini. Với thực hành, bạn sẽ tạo ra các giải pháp sáng tạo một cách dễ dàng.

nút