วิธีใช้ Gemini 2.5 06-05 Pro API ฉบับล่าสุด

Google ได้เปิดตัวโมเดล Gemini รุ่นล่าสุด ซึ่งเผยแพร่ในรูปแบบพรีวิวเมื่อวันที่ 5 มิถุนายน 2025 นำความสามารถที่ยอดเยี่ยมมาสู่เหล่านักพัฒนา API นี้ช่วยให้คุณสร้างแอปพลิเคชันขั้นสูงแบบ Multimodal ที่สามารถประมวลผลข้อความ รูปภาพ วิดีโอ และอื่นๆ ได้อย่างมีประสิทธิภาพ พร้อมทั้งมีความสามารถที่โดดเด่นในด้านการให้เหตุผลและงานเขียนโค้ด ไม่ว่าคุณจะต้องการสร้างเว็บแอปแบบโต้ตอบ วิเคราะห์ชุดข้อมูลที่ซับซ้อน หรือทำให้เวิร์กโฟลว์เป็นแบบอัตโนมัติ คู่มือนี้จะแนะนำคุณตลอดกระบวนการอย่างแม่นยำ

💡

ก่อนที่เราจะดำเนินการต่อไป ทำให้การทดสอบและการรวม API ของคุณง่ายขึ้นด้วย Apidog! ดาวน์โหลด Apidog ฟรีเพื่อทำให้การส่งคำขอ การดีบักการตอบสนอง และการจัดการเวิร์กโฟลว์สำหรับ API Gemini 2.5 06-05 Pro ง่ายขึ้น เป็นเครื่องมือคู่ใจที่สมบูรณ์แบบสำหรับนักพัฒนาที่ทำงานกับโมเดล AI ล้ำสมัย เริ่มต้นได้เลยวันนี้!

ปุ่ม

ตอนนี้ มาสำรวจการตั้งค่า การกำหนดค่า และกรณีการใช้งานจริงเพื่อใช้ประโยชน์สูงสุดจาก API อันทรงพลังนี้กัน

Gemini 2.5 06-05 Pro API คืออะไร?

Gemini 2.5 06-05 Pro API พัฒนาโดย Google DeepMind ถือเป็นจุดสูงสุดของเทคโนโลยี AI แบบ Multimodal เปิดตัวในรูปแบบพรีวิวที่อัปเกรดเมื่อวันที่ 5 มิถุนายน 2025 โมเดลนี้สร้างขึ้นจากเวอร์ชันก่อนหน้า มอบประสิทธิภาพที่เหนือกว่าในงานเขียนโค้ด การให้เหตุผล และงานสร้างสรรค์ มีหน้าต่างบริบทขนาด 1 ล้านโทเค็น (และ 2 ล้านในอนาคตอันใกล้) ทำให้สามารถจัดการกับฐานรหัส เอกสาร และอินพุตมัลติมีเดียขนาดใหญ่ เช่น รูปภาพและวิดีโอได้

นอกจากนี้ API ยังโดดเด่นในการทดสอบมาตรฐาน โดยเป็นผู้นำบนกระดานผู้นำ WebDev Arena ด้วยคะแนน Elo ที่เพิ่มขึ้น 24 จุดเป็น 1470 และได้คะแนน 84.8% ใน VideoMME สำหรับความเข้าใจวิดีโอ ความสามารถในการให้เหตุผลโดดเด่นในด้านคณิตศาสตร์ วิทยาศาสตร์ และการเขียนโค้ด ทำให้เหมาะสำหรับนักพัฒนาที่สร้างแอปพลิเคชันที่ซับซ้อน ถัดไป เราจะตั้งค่าสภาพแวดล้อมของคุณเพื่อเริ่มใช้งาน API นี้อย่างมีประสิทธิภาพ

ข้อกำหนดเบื้องต้นสำหรับการใช้ Gemini 2.5 06-05 Pro API

ก่อนที่คุณจะเริ่มต้น ตรวจสอบให้แน่ใจว่าสภาพแวดล้อมการพัฒนาของคุณตรงตามข้อกำหนดเหล่านี้:

บัญชี Google: ลงทะเบียนหรือเข้าสู่ระบบที่ accounts.google.com เพื่อเข้าถึง Google AI Studio
คีย์ API: สร้างคีย์ผ่าน Google AI Studio สำหรับการยืนยันตัวตน
Python 3.7+: ติดตั้ง Python จาก python.org หากยังไม่ได้ติดตั้ง
Virtual Environment: แยกการพึ่งพาสำหรับการจัดการโครงการที่สะอาด
ไลบรารี: ติดตั้งแพ็คเกจ google-generativeai เพื่อโต้ตอบกับ API
Apidog: เป็นทางเลือก แต่แนะนำสำหรับการทดสอบและดีบักคำขอ API

ขั้นแรก ติดตั้ง Python และตั้งค่าสภาพแวดล้อมเสมือน (virtual environment) เรียกใช้คำสั่งเหล่านี้ในเทอร์มินัลของคุณ:

python -m venv gemini_env
source gemini_env/bin/activate  # บน Windows: gemini_env\Scripts\activate

จากนั้น ติดตั้งไลบรารีที่จำเป็น:

pip install google-generativeai

เมื่อทำตามขั้นตอนเหล่านี้เสร็จสิ้น คุณก็พร้อมที่จะกำหนดค่า API แล้ว ไปต่อกันที่การยืนยันตัวตนและการตั้งค่า

การตั้งค่าการยืนยันตัวตนสำหรับ Gemini 2.5 06-05 Pro API

ในการใช้ Gemini 2.5 06-05 Pro API ให้ยืนยันตัวตนคำขอของคุณด้วยคีย์ API ทำตามขั้นตอนเหล่านี้เพื่อเริ่มต้น:

ไปที่ Google AI Studio: เปิดเบราว์เซอร์ของคุณแล้วไปที่ aistudio.google.com

เข้าสู่ระบบ: ใช้ข้อมูลประจำตัวบัญชี Google ของคุณเพื่อเข้าสู่ระบบ

สร้างคีย์ API: ค้นหาตัวเลือก "Get API key" ในแดชบอร์ด คลิก ติดตามคำแนะนำ และคัดลอกคีย์ที่สร้างขึ้น จัดเก็บไว้อย่างปลอดภัย—ห้ามเปิดเผยต่อสาธารณะโดยเด็ดขาด

คลิก ติดตามคำแนะนำ และคัดลอกคีย์ที่สร้างขึ้น จัดเก็บไว้อย่างปลอดภัย—ห้ามเปิดเผยต่อสาธารณะโดยเด็ดขาด

ตั้งค่าตัวแปรสภาพแวดล้อม: เพื่อความปลอดภัย ให้ตั้งค่าคีย์เป็นตัวแปรสภาพแวดล้อม ในเทอร์มินัลของคุณ เรียกใช้:

export GEMINI_API_KEY='your_api_key_here'  # บน Windows: set GEMINI_API_KEY=your_api_key_here

ตอนนี้ ให้เริ่มต้นไคลเอ็นต์ใน Python นี่คือการตั้งค่าพื้นฐาน:

import os
from google import genai

# ดึงคีย์ API จากตัวแปรสภาพแวดล้อม
API_KEY = os.environ.get("GEMINI_API_KEY")
client = genai.Client(api_key=API_KEY)

เมื่อกำหนดค่าการยืนยันตัวตนเสร็จแล้ว คุณก็พร้อมที่จะส่งคำขอ ถัดไป เราจะสำรวจการเรียก API ครั้งแรกด้วยโมเดล Gemini 2.5 06-05

การเรียก API ครั้งแรกด้วย Gemini 2.5 06-05

มาทดสอบ Gemini 2.5 06-05 Pro API ด้วยคำขอแบบข้อความง่ายๆ ตัวอย่างนี้ขอให้โมเดลอธิบายแนวคิดพื้นฐาน ใช้โค้ด Python นี้:

from google import genai
from google.genai.types import HttpOptions

# เริ่มต้นไคลเอ็นต์
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# ส่งคำขอข้อความ
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Explain how a neural network works in simple terms."
)

# พิมพ์การตอบสนอง
print(response.text)

โค้ดนี้ส่งคำขอ POST ไปยังปลายทาง API โดยกำหนดเป้าหมายโมเดล Gemini 2.5 06-05 การตอบสนองจะอธิบายโครงข่ายประสาทเทียมด้วยภาษาที่ชัดเจนและกระชับ คาดว่าจะได้รับผลลัพธ์ดังนี้:

โครงข่ายประสาทเทียม (Neural network) เป็นโมเดลคอมพิวเตอร์ที่ได้รับแรงบันดาลใจจากสมองของมนุษย์ ประกอบด้วยชั้นของโหนด (เซลล์ประสาท) ที่ประมวลผลข้อมูลอินพุต ปรับน้ำหนักตามรูปแบบ และสร้างเอาต์พุต เช่น การคาดการณ์หรือการจัดหมวดหมู่

เพื่อตรวจสอบฟังก์ชันการทำงาน ให้ทดสอบคำขอนี้ใน Apidog สร้างโครงการใหม่ ตั้งค่าเมธอด HTTP เป็น POST ป้อน URL ปลายทาง (พบได้ในเอกสาร Google AI Studio) เพิ่มส่วนหัว Authorization: Bearer YOUR_API_KEY และรวมเพย์โหลด JSON:

{
    "model": "gemini-2.5-pro-preview-06-05",
    "contents": "Explain how a neural network works in simple terms."
}

คลิก "Send" ใน Apidog เพื่อตรวจสอบการตอบสนอง รหัสสถานะ และเวลา การทำเช่นนี้ยืนยันว่าการตั้งค่าของคุณทำงานได้ ตอนนี้ มาพัฒนาไปสู่ความสามารถแบบ Multimodal กัน

การใช้ประโยชน์จากคุณสมบัติ Multimodal ของ Gemini 2.5 06-05

API Gemini 2.5 06-05 Pro โดดเด่นด้วยความสามารถแบบ Multimodal สามารถประมวลผลข้อความ รูปภาพ และวิดีโอได้ ส่วนนี้จะแสดงวิธีใช้คุณสมบัติเหล่านี้อย่างมีประสิทธิภาพ

การประมวลผลข้อความและรูปภาพ

รวมข้อความพร้อมรูปภาพสำหรับงานต่างๆ เช่น การวิเคราะห์รูปภาพ อัปโหลดรูปภาพ (เช่น รูปถ่ายสโคน) และขอให้โมเดลอธิบาย นี่คือโค้ด:

from google import genai
from google.genai.types import HttpOptions, Part

# เริ่มต้นไคลเอ็นต์
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# ส่งคำขอข้อความและรูปภาพ
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents=[
        "Describe this image in detail.",
        Part.from_uri(
            file_uri="gs://cloud-samples-data/generative-ai/image/scones.jpg",
            mime_type="image/jpeg"
        )
    ]
)

# พิมพ์การตอบสนอง
print(response.text)

โมเดลอาจตอบสนองดังนี้:

ภาพแสดงสโคนบลูเบอร์รี่วางเรียงบนกระดาษรองอบ สโคนรูปสามเหลี่ยมสีน้ำตาลทองจำนวนหกชิ้นถูกจัดเรียงเป็นวงกลม โดยมีบลูเบอร์รี่สดกระจายอยู่รอบๆ เนื้อสัมผัสดูร่วน ซึ่งเป็นลักษณะทั่วไปของสโคนอบที่ดี

ตรวจสอบให้แน่ใจว่ารูปภาพของคุณสามารถเข้าถึงได้ผ่าน Google Cloud Storage URI หรืออัปโหลดโดยตรงหากรองรับ ความสามารถนี้เหมาะสำหรับแอปพลิเคชัน เช่น อีคอมเมิร์ซ หรือการวิเคราะห์เนื้อหา

ความเข้าใจวิดีโอ

โมเดล Gemini 2.5 06-05 โดดเด่นในด้านความเข้าใจวิดีโอ โดยได้คะแนน 84.8% ในการทดสอบมาตรฐาน VideoMME ส่ง URL YouTube หรือไฟล์วิดีโอพร้อมข้อความเพื่อวิเคราะห์เนื้อหา ตัวอย่างเช่น:

from google import genai
from google.genai.types import HttpOptions

# เริ่มต้นไคลเอ็นต์
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# ส่งคำขอวิดีโอ
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents=[
        "Create a spec for a learning app based on this video.",
        "https://www.youtube.com/watch?v=example_video"
    ]
)

# พิมพ์การตอบสนอง
print(response.text)

สิ่งนี้จะสร้างข้อกำหนดโดยละเอียดสำหรับแอปการเรียนรู้แบบโต้ตอบ โดยใช้ประโยชน์จากเนื้อหาของวิดีโอ API สามารถประมวลผลวิดีโอได้นานถึง 6 ชั่วโมง ด้วยหน้าต่างบริบท 2 ล้านโทเค็นที่การตั้งค่าความละเอียดสื่อ "ต่ำ" ซึ่งช่วยสร้างสมดุลระหว่างต้นทุนและประสิทธิภาพ

เมื่อเชี่ยวชาญคุณสมบัติ Multimodal แล้ว มาจัดการกับความช่วยเหลือด้านการเขียนโค้ดกันต่อไป

การเขียนโค้ดด้วย Gemini 2.5 06-05 Pro API

API Gemini 2.5 06-05 Pro มีความโดดเด่นในงานเขียนโค้ด โดยเป็นผู้นำบนกระดานผู้นำ WebDev Arena ด้วยคะแนน Elo 1470 สามารถสร้าง แก้ไข และดีบักโค้ดในภาษาต่างๆ เช่น Python, JavaScript และอื่นๆ นี่คือวิธีการใช้งาน:

การสร้างโค้ด

ขอฟังก์ชัน เช่น เครื่องคำนวณลำดับ Fibonacci ลองทำตามนี้:

from google import genai
from google.genai.types import HttpOptions

# เริ่มต้นไคลเอ็นต์
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# ส่งคำขอเขียนโค้ด
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Write a Python function to calculate the Fibonacci sequence up to n terms."
)

# พิมพ์การตอบสนอง
print(response.text)

ผลลัพธ์อาจเป็นดังนี้:

def fibonacci(n):
    if n <= 0:
        return []
    elif n == 1:
        return [0]
    sequence = [0, 1]
    for i in range(2, n):
        sequence.append(sequence[i-1] + sequence[i-2])
    return sequence

# ตัวอย่างการใช้งาน
print(fibonacci(10))  # ผลลัพธ์: [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]

ฟังก์ชันนี้มีประสิทธิภาพและถูกต้อง แสดงให้เห็นถึงความสามารถในการให้เหตุผลของโมเดล

การดีบักและการเพิ่มประสิทธิภาพ

ส่งโค้ดที่มีอยู่เพื่อวิเคราะห์ ตัวอย่างเช่น:

from google import genai
from google.genai.types import HttpOptions

# เริ่มต้นไคลเอ็นต์
client = genai.Client(http_options=HttpOptions(api_version="v1"))

# ส่งคำขอดีบัก
response = client.models.generate_content(
    model="gemini-2.5-pro-preview-06-05",
    contents="Debug this code for errors and suggest improvements: def fib(n): if n == 0: return 0 elif n == 1: return 1 else: return fib(n-1) + fib(n-2)"
)

# พิมพ์การตอบสนอง
print(response.text)

โมเดลอาจตอบสนองดังนี้:

n

def fib(n):
    if n < 0:
        raise ValueError("Input must be non-negative")
    if n == 0:
        return 0
    elif n == 1:
        return 1
    a, b = 0, 1
    for _ in range(2, n + 1):
        a, b = b, a + b
    return b

การปรับปรุง: เพิ่มการจัดการข้อผิดพลาดสำหรับอินพุตที่เป็นลบ; แทนที่การเรียกซ้ำด้วยการวนซ้ำเพื่อให้มีความซับซ้อนทางเวลา O(n); ใช้ tuple unpacking เพื่อความชัดเจน

สิ่งนี้ช่วยเพิ่มประสิทธิภาพได้อย่างมาก ตอนนี้ มาสำรวจกรณีการใช้งานขั้นสูงกัน

กรณีการใช้งานขั้นสูงสำหรับ Gemini 2.5 06-05 Pro API

API Gemini 2.5 06-05 Pro ปลดล็อกแอปพลิเคชันที่ซับซ้อน ลองพิจารณาสถานการณ์เหล่านี้:

การพัฒนาเว็บแอป: สร้าง HTML, CSS และ JavaScript สำหรับ UI แบบโต้ตอบ สั่งให้ API: "สร้างแอป dictation พร้อมภาพเคลื่อนไหว UI ไมโครโฟนและการออกแบบที่ตอบสนอง" จะให้โค้ดที่ใช้งานได้จริง ซึ่งตรงกับสไตล์จากข้อมูลอ้างอิงการออกแบบ
วิดีโอสู่แอปการเรียนรู้: วิเคราะห์วิดีโอสอนบน YouTube และสร้างข้อกำหนดสำหรับแอปแบบโต้ตอบ จากนั้นสร้างโค้ด สิ่งนี้เหมาะสำหรับแพลตฟอร์มการศึกษา
การวิเคราะห์ฐานรหัส: อัปโหลดไฟล์ ZIP ของโครงการของคุณ API ด้วยหน้าต่างบริบทขนาดใหญ่ จะตรวจสอบการพึ่งพา แนะนำการแก้ไข และเพิ่มประสิทธิภาพตรรกะ

ในการทดสอบสิ่งเหล่านี้ ให้ใช้ Apidog เพื่อจำลองการตอบสนอง API และตรวจสอบฟังก์ชันการทำงาน การเปลี่ยนไปใช้แนวทางปฏิบัติที่ดีที่สุดจะช่วยให้ได้ผลลัพธ์ที่ดีที่สุด

แนวทางปฏิบัติที่ดีที่สุดสำหรับ Gemini 2.5 06-05 Pro API

ใช้ประโยชน์สูงสุดจาก Gemini 2.5 06-05 Pro API ด้วยเคล็ดลับเหล่านี้:

สร้าง Prompt ที่ชัดเจน: ระบุงานอย่างแม่นยำ เช่น "สร้างฟังก์ชัน Python เพื่อจัดเรียงรายการ โดยจัดการกับค่าซ้ำ"
ปรับพารามิเตอร์: ตั้งค่า thinking_budget สำหรับงานที่ซับซ้อน (เช่น 1024 โทเค็น) เพื่อสร้างสมดุลระหว่างคุณภาพและความล่าช้า
ทดสอบอย่างละเอียด: ใช้ Apidog เพื่อส่งคำขอ ตรวจสอบรหัสสถานะ และปรับปรุงเพย์โหลด
รักษาความปลอดภัยคีย์: จัดเก็บคีย์ API ในตัวแปรสภาพแวดล้อม ไม่ใช่ในโค้ด
ตรวจสอบการใช้งาน: ติดตามขีดจำกัดอัตราใน Google AI Studio เพื่อหลีกเลี่ยงการหยุดชะงัก

การปฏิบัติตามสิ่งเหล่านี้จะช่วยให้คุณมั่นใจได้ถึงประสิทธิภาพและความน่าเชื่อถือ มาสรุปกัน

บทสรุป: การใช้ประโยชน์จาก Gemini 2.5 06-05 Pro API

API Gemini 2.5 06-05 Pro ช่วยให้นักพัฒนาสามารถสร้างแอปพลิเคชันที่ล้ำสมัยได้ ตั้งแต่การตั้งค่าและการยืนยันตัวตน ไปจนถึงการประมวลผลแบบ Multimodal และการเขียนโค้ด คู่มือนี้จะช่วยให้คุณใช้ประโยชน์จากพลังของมันได้ การเป็นผู้นำใน WebDev Arena ความเข้าใจวิดีโอที่แข็งแกร่ง และความสามารถในการให้เหตุผล ทำให้เป็นตัวเปลี่ยนเกม เริ่มสร้างสรรค์ได้แล้ววันนี้—ทดลองใน Google AI Studio ผสานรวมกับ Vertex AI หรือทดสอบในแอป Gemini ด้วยการฝึกฝน คุณจะสร้างโซลูชันที่เป็นนวัตกรรมได้อย่างง่ายดาย

ปุ่ม