คู่มือ: Google Gemini API คืออะไรและใช้งานอย่างไร?

Gemini API ของ Google เข้าถึงข้อมูลมากมาย ช่วยให้นักพัฒนาผสานรวมการค้นหา วิเคราะห์ และฟังก์ชันอื่นๆ ได้ง่าย

อาชว์

อาชว์

4 June 2025

คู่มือ: Google Gemini API คืออะไรและใช้งานอย่างไร?

Google ได้อัปเดตโมเดล Bard AI เป็น Gemini ใหม่ล่าสุด เมื่อพิจารณาว่าเป็นหนึ่งใน โมเดล AI ที่มีความสามารถและทั่วไปมากที่สุด ที่ Google สร้างขึ้นจนถึงปัจจุบัน Gemini ได้จัดเตรียม 3 โมเดลสำหรับ Gemini 1.0: Gemini Ultra, Gemini Pro และ Gemini Nano

💡
เนื่องจาก Google Gemini 1.0 API พร้อมใช้งานแล้ว นักพัฒนาซอฟต์แวร์และเว็บสามารถเริ่มนำไปใช้ในโปรเจกต์และแอปพลิเคชันของตนได้ เพื่อสร้าง ทดสอบ จัดทำเอกสาร และแก้ไขข้อบกพร่องในโปรเจกต์ Gemini API ของคุณ เราขอแนะนำให้คุณรู้จัก Apidog - เครื่องมือพัฒนา API ที่ออกแบบมาเป็นอันดับแรก

Apidog เป็นเครื่องมือ API ที่ใช้งานได้ฟรี ดังนั้นเริ่มต้นวันนี้ด้วยการคลิกปุ่มด้านล่าง! 👇 👇 👇
button

Gemini ของ Google คืออะไร

Gemini คือโมเดล AI ทั่วไป (หรือบริการ) ใหม่ล่าสุดของ Google ที่สร้างขึ้นสำหรับมัลติโมดาลิตี้

gemini twitter tweet

Gemini เป็นโมเดล AI ที่ได้รับการปรับปรุงให้สามารถประมวลผลข้อมูลประเภทต่างๆ ได้ รวมถึงข้อความ โค้ด เสียง รูปภาพ และวิดีโอ

gemini models

ครั้งนี้ Google ได้เลือกที่จะเปิดตัวโมเดล Gemini AI ที่แตกต่างกันสามแบบ: Gemini Ultra, Gemini Pro และ Gemini Nano โดยแต่ละรุ่นมีคำอธิบายเฉพาะของตนเอง โดยอ้างอิงจาก รายงาน Gemini 1:

Gemini ของ Google ยังมีชื่อเสียงในฐานะโมเดลแรกที่ทำผลงานได้ดีกว่าผู้เชี่ยวชาญด้านมนุษย์ใน Massive Multitask Language Understanding (MMLU)

เกณฑ์มาตรฐานโมเดล Gemini

ในขณะที่เปิดตัว คู่แข่งรายใหญ่ที่สุดของ Gemini คือ GPT-4 ของ OpenAI

gemini benchmarks

ด้วย 4 ด้านที่แตกต่างกันสำหรับการเปรียบเทียบ Gemini Ultra ซึ่งเป็นโมเดล Gemini ที่ทรงพลังที่สุด เอาชนะ GPT-4 ในเกือบทุกด้าน ยกเว้นการใช้เหตุผลทั่วไปสำหรับงานประจำวัน Gemini Ultra เก่งในการสร้างโค้ด Python ที่แม่นยำ ทักษะการแก้ปัญหาทางคณิตศาสตร์ และ MMLU ทั่วไป

Google ยังได้จัดทำรายงานเกณฑ์มาตรฐานที่ครอบคลุมมากขึ้นด้วย Gemini Pro และโมเดล AI อื่นๆ ที่เกี่ยวข้องซึ่งพร้อมใช้งาน:

เพื่อให้บริบทเพิ่มเติมเกี่ยวกับความสามารถของโมเดล Gemini Google ได้ทำการทดสอบภายในแบบปกติ โดยใช้ Gemini Pro เป็นเกณฑ์มาตรฐานหลัก

benchmark comparison gemini models

ฟังก์ชันการทำงานของ Gemini AI

Gemini AI ได้รับการออกแบบมาให้เป็นมัลติโมดอลิตี้โดยธรรมชาติเพื่อประสิทธิภาพที่มากขึ้น ช่วยให้ Gemini เข้าใจและให้เหตุผลด้วยอินพุตทุกชนิด ดังนั้นจึงเก่งในการช่วยเหลือผู้ใช้ที่กำลังมองหาความช่วยเหลือใน:

การให้เหตุผลที่ซับซ้อน

ความสามารถในการให้เหตุผลแบบมัลติโมดอลิตี้ที่ซับซ้อนของ Gemini สามารถช่วยให้โมเดล AI ย่อยและประมวลผลข้อมูลที่ซับซ้อนได้ ดังนั้น Gemini จึงมีทักษะในการอนุมานความหมายที่ซ่อนอยู่ท่ามกลางข้อมูลจำนวนมาก

คุณยังสามารถใช้ Gemini เพื่อดึงข้อมูลเฉพาะจากเอกสารหลายพันฉบับได้ ซึ่งสามารถกรองและทำความเข้าใจข้อมูลตามเกณฑ์ที่ป้อนเข้า และให้ข้อมูลที่คุณต้องการ

การเขียนโค้ดขั้นสูง

Gemini สามารถทำความเข้าใจ อธิบาย และสร้างโค้ดได้ สามารถสร้างโค้ดสำหรับภาษาโปรแกรมที่ใช้กันอย่างแพร่หลาย เช่น Python, Java, C++ และ Go

ซึ่งหมายความว่าหากคุณมีโค้ดที่คุณไม่เข้าใจ คุณสามารถเรียกใช้ผ่าน Gemini เพื่อดูรายละเอียดว่าโค้ดนั้นทำอะไร นอกจากนั้น Gemini ยังสามารถช่วยจัดเตรียมโค้ดสำหรับฟังก์ชันการทำงานที่คุณกำลังประสบปัญหา

การสร้างแนวคิดจากอินพุตต่างๆ

Gemini สามารถตอบสนองต่ออินพุตประเภทต่างๆ ได้ ซึ่งรวมถึงไฟล์ PDF รูปภาพ ข้อความ และวิดีโอ ด้วยทักษะการระบุที่แม่นยำและละเอียด Gemini สามารถกลายเป็นแหล่งที่มาของแรงบันดาลใจ - เครื่องมือระดมสมองหากคุณต้องการเรียกเช่นนั้น

เกี่ยวกับ Gemini API

การเปิดตัว Gemini มาพร้อมกับ Google Gemini API ซึ่งช่วยให้นักพัฒนาสามารถเข้าถึงแอปพลิเคชันที่ใช้ AI ได้หลากหลาย ด้วย Gemini คุณจะไม่ถูกผูกมัดกับข้อความเท่านั้น คุณยังสามารถป้อนรูปภาพเพื่อสร้างเอาต์พุตที่เกี่ยวข้องกับอินพุตได้

ความพร้อมใช้งานของ Gemini API

ปัจจุบัน มีรายการภาษาและภูมิภาคที่ Gemini API สามารถทำงานได้ ตรวจสอบลิงก์ด้านล่างเพื่อดูว่าคุณมีสิทธิ์ใช้ Gemini API หรือไม่!

ภาษาที่พร้อมใช้งานสำหรับ Gemini API

ภูมิภาคที่พร้อมใช้งานสำหรับ Gemini API

ราคา Gemini API

Google ให้บริการ Gemini Pro เวอร์ชันฟรี แม้ว่าจะสนับสนุนให้ผู้ใช้สร้างแอปด้วย Gemini Pro API แต่ผู้ใช้ควรทราบว่าพรอมต์และการตอบสนองที่เกี่ยวข้องกับ Gemini Pro เวอร์ชันฟรีจะถูกบันทึกและใช้ในกระบวนการวิจัยและพัฒนาของ Gemini Pro กล่าวอีกนัยหนึ่ง Google จะมีบันทึกทุกสิ่งที่ API ได้รับและให้ (ไม่มีความเป็นส่วนตัว)

เนื่องจาก Gemini ค่อนข้างใหม่ ราคาเต็มสำหรับ Gemini API ยังไม่ออกมาทั้งหมด อย่างไรก็ตาม ราคาที่อ้างอิงสำหรับอินพุตที่เอาต์พุตได้ถูกจัดเตรียมไว้แล้ว จะมีค่าใช้จ่าย $0.000125 ในการป้อน 1,000 อักขระ และ $0.0025 ในการป้อนข้อความ ในการตอบสนอง Gemini API จะเรียกเก็บเงิน $0.000375 เพื่อส่งออก 1,000 อักขระ อย่างไรก็ตาม Gemini API เวอร์ชันที่ต้องชำระเงินจะรองรับมากกว่า 60 คำค้นหาต่อนาที

คู่มือทีละขั้นตอนด้วยตนเองทางเลือกเกี่ยวกับวิธีใช้ Gemini API

โมเดล Gemini AI เป็นหนึ่งในโมเดล AI ที่ทรงพลังที่สุดที่เข้าถึงได้ฟรี หากคุณสนใจที่จะสร้างแอปพลิเคชันด้วย ให้ดำเนินการอ่านส่วนนี้ด้านล่าง

ขั้นตอนที่ 1: รับ Gemini API Key

ในการเข้าถึง Gemini API ก่อนอื่นเราต้องรับ Gemini API key จาก Google AI for Developers

gemini get an api key

จากนั้นคุณจะเข้าสู่แดชบอร์ด Google AI Studio ซึ่งพวกเขาจะแจ้งให้คุณเลือกเพื่อเริ่มพรอมต์ใหม่หรือรับ API key

gemini google api studio create api key

ค้นหาปุ่มด้านบนเพื่อสร้าง API key

select existing porject or new project gemini api key

Gemini มีตัวเลือกในการเลือกว่าคุณต้องการทำงานในโปรเจกต์ที่อยู่ใน Google Cloud อยู่แล้ว (อาจเป็นโปรเจกต์ของทีม) หรือสร้างโปรเจกต์ใหม่

gemini api key generated

เมื่อคุณเลือกตัวเลือกแล้ว Gemini จะสร้าง API key ให้คุณ!

ขั้นตอนที่ 2 - คัดลอกโค้ด cURL

gogoe gemini copy curl code

ขั้นแรก ไปที่ เว็บไซต์ Google AI for Developers และคัดลอก URL ตามที่ไฮไลต์ในภาพด้านบน อย่ารวมส่วนสุดท้าย 2> /dev/null เนื่องจากไม่ควรเป็นส่วนหนึ่งของโค้ด cURL

import curl code apidog

ถัดไป เปิด Apidog และเลือกปุ่ม + สีม่วงรอบมุมซ้ายบนของหน้าต่าง Apidog คุณควรจะเห็น Import cURL หรือคุณสามารถใช้ทางลัด Ctrl + I

import gemini curl code apidog

วางโค้ด cURL ลงในหน้าต่าง แล้วกดปุ่ม OK

Apidog ช่วยให้ผู้ใช้สามารถนำเข้าโค้ด cURL ที่มีอยู่ลงในคำขอใหม่ได้! นอกจากนี้ คุณสามารถปรับเปลี่ยนคำขอโค้ด cURL เหล่านี้ได้ตามที่คุณต้องการให้ทำงาน

ขั้นตอนด้วยตนเองทางเลือกหากโค้ด cURL ไม่ทำงาน

ให้ Apidog สร้าง API ด้วย Gemini API Key

บทความนี้จะแสดงวิธีใช้ Gemini API key กับ Apidog ซึ่งเป็นเครื่องมือพัฒนา API ที่ออกแบบมาเป็นอันดับแรก

create new project apidog

ขั้นแรก สร้างโปรเจกต์ใหม่บน Apidog คุณสามารถตั้งชื่อว่า Gemini API หรืออะไรก็ได้ที่คุณต้องการ!

create new api apidog

จากนั้น กดปุ่ม New API

ตอนนี้ ไปที่ เว็บไซต์ Google AI for Developers และคัดลอก URL ตามที่ไฮไลต์ในภาพด้านบน

paste gemini api url apidog

กลับไปที่ Apidog และวาง Gemini API URL ที่คุณคัดลอกในโซนที่ไฮไลต์ที่แสดงในภาพ เนื่องจากตัวอย่างนี้เป็นคำขอ POST ตรวจสอบให้แน่ใจว่าได้เปลี่ยนเมธอดจาก GET เป็น POST ด้วย

สังเกตว่าพารามิเตอร์การค้นหาในตอนท้ายของ URL ถูกลบออก ไม่ต้องกังวล - ใน Apidog พารามิเตอร์การค้นหาใดๆ จะถูกแยกและเติมโดยอัตโนมัติใน Request Params ซึ่งพบได้ในส่วน Params ดังที่แสดงในภาพ

button

คุณจะต้องแทนที่ส่วนนี้ด้วย Gemini API key ที่สร้างขึ้นก่อนหน้านี้ วางลงในส่วนที่ไฮไลต์ที่แสดงในภาพด้านบน คลิกบันทึกหลังจากนั้นเพื่อบันทึกความคืบหน้าของคุณ

copy gemini api post request body

กลับไปที่ เว็บไซต์ Google AI for Developers เพื่อคัดลอกเนื้อหาของคำขอ POST คัดลอกส่วนที่ไฮไลต์ของเนื้อหา

gemini api paste json body post request see response

กลับไปที่ Apidog และภายใต้ส่วน Request ให้เลือกส่วนหัว Body และเลือก json จากนั้น วางเนื้อหาคำขอ POST ในส่วน Example

หากคุณต้องการเปลี่ยนพรอมต์ที่จะส่งไปยัง Gemini API คุณสามารถแก้ไขสตริงที่พบภายในเครื่องหมายคำพูดขององค์ประกอบ "text"

สุดท้าย กดปุ่ม Send ด้านบนเพื่อทำการร้องขอ จากนั้นคุณควรได้รับการตอบสนองจาก Gemini API!

บทสรุป

Google Gemini API เป็นเครื่องมือที่ทรงพลังอย่างยิ่งที่นักพัฒนาจำนวนมากในปัจจุบันสามารถใช้สำหรับโปรแกรม แอปพลิเคชัน และธุรกิจขนาดเล็ก ด้วยความสามารถในการประมวลผลทั้งข้อความและอินพุตรูปภาพ Gemini API สามารถให้ผู้ใช้มีการตอบสนองเชิงลึกซึ่งเกี่ยวข้องกับการอนุมานเชิงบริบทที่ชาญฉลาด

Apidog นอกเหนือจากการสร้าง API แล้ว ยังสามารถจัดเตรียมสภาพแวดล้อมที่เรียบง่ายและใช้งานง่ายสำหรับการทดสอบ การจำลอง และการจัดทำเอกสาร API ด้วยกระบวนการอัตโนมัติมากมายเพื่อช่วยเพิ่มประสิทธิภาพของนักพัฒนา พิจารณา Apidog ให้เป็นแพลตฟอร์ม API ถัดไปของคุณ!

button

Explore more

สร้างทางเลือกสำหรับ Claude Web Search แบบ Open Source (พร้อมเซิร์ฟเวอร์ Firecrawl MCP)

สร้างทางเลือกสำหรับ Claude Web Search แบบ Open Source (พร้อมเซิร์ฟเวอร์ Firecrawl MCP)

สำหรับองค์กรที่ต้องการควบคุม, ปรับแต่ง, หรือความเป็นส่วนตัวมากกว่าการค้นหาเว็บของ Claude, การสร้างทางเลือกโดยใช้ Firecrawl เป็นทางออกที่ดี มาเรียนรู้กัน!

21 March 2025

10 อันดับทางเลือกที่ดีที่สุดสำหรับการเล่นวินเซิร์ฟสำหรับนักเขียนโค้ดที่ชอบความรู้สึกในปี 2025

10 อันดับทางเลือกที่ดีที่สุดสำหรับการเล่นวินเซิร์ฟสำหรับนักเขียนโค้ดที่ชอบความรู้สึกในปี 2025

ค้นพบ 10 ทางเลือก Windsurf ปี 2025 ปรับปรุงการเขียนโค้ด เหมาะสำหรับนักพัฒนาที่ต้องการโซลูชันการเขียนโค้ดที่มีประสิทธิภาพ ปลอดภัย และหลากหลาย

20 March 2025

Figma มีเซิร์ฟเวอร์ MCP แล้ว และนี่คือวิธีใช้งาน

Figma มีเซิร์ฟเวอร์ MCP แล้ว และนี่คือวิธีใช้งาน

ค้นพบวิธีเชื่อมต่อ Figma MCP กับ AI เช่น Cursor เพื่อสร้างโค้ดอัตโนมัติ เหมาะสำหรับนักพัฒนาและนักออกแบบ

20 March 2025

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API