คู่มือ: Google Gemini API คืออะไรและใช้งานอย่างไร?

Google ได้อัปเดตโมเดล Bard AI เป็น Gemini ใหม่ล่าสุด เมื่อพิจารณาว่าเป็นหนึ่งใน โมเดล AI ที่มีความสามารถและทั่วไปมากที่สุด ที่ Google สร้างขึ้นจนถึงปัจจุบัน Gemini ได้จัดเตรียม 3 โมเดลสำหรับ Gemini 1.0: Gemini Ultra, Gemini Pro และ Gemini Nano

💡

เนื่องจาก Google Gemini 1.0 API พร้อมใช้งานแล้ว นักพัฒนาซอฟต์แวร์และเว็บสามารถเริ่มนำไปใช้ในโปรเจกต์และแอปพลิเคชันของตนได้ เพื่อสร้าง ทดสอบ จัดทำเอกสาร และแก้ไขข้อบกพร่องในโปรเจกต์ Gemini API ของคุณ เราขอแนะนำให้คุณรู้จัก Apidog - เครื่องมือพัฒนา API ที่ออกแบบมาเป็นอันดับแรก

Apidog เป็นเครื่องมือ API ที่ใช้งานได้ฟรี ดังนั้นเริ่มต้นวันนี้ด้วยการคลิกปุ่มด้านล่าง! 👇 👇 👇

button

Gemini ของ Google คืออะไร

Gemini คือโมเดล AI ทั่วไป (หรือบริการ) ใหม่ล่าสุดของ Google ที่สร้างขึ้นสำหรับมัลติโมดาลิตี้

Gemini เป็นโมเดล AI ที่ได้รับการปรับปรุงให้สามารถประมวลผลข้อมูลประเภทต่างๆ ได้ รวมถึงข้อความ โค้ด เสียง รูปภาพ และวิดีโอ

ครั้งนี้ Google ได้เลือกที่จะเปิดตัวโมเดล Gemini AI ที่แตกต่างกันสามแบบ: Gemini Ultra, Gemini Pro และ Gemini Nano โดยแต่ละรุ่นมีคำอธิบายเฉพาะของตนเอง โดยอ้างอิงจาก รายงาน Gemini 1:

Gemini Ultra: โมเดล Gemini ที่มีความสามารถมากที่สุด ซึ่งให้ประสิทธิภาพที่ล้ำสมัยในงานที่ซับซ้อนหลากหลาย รวมถึงงานด้านการให้เหตุผลและมัลติโมดอลิตี้ สามารถให้บริการได้อย่างมีประสิทธิภาพในระดับ TPU accelerators เนื่องจากสถาปัตยกรรม Gemini
Gemini Pro: โมเดลที่ปรับให้เหมาะสมด้านประสิทธิภาพในแง่ของต้นทุนและเวลาแฝง ซึ่งให้ประสิทธิภาพที่สำคัญในงานที่หลากหลาย โมเดลนี้แสดงให้เห็นถึงประสิทธิภาพในการให้เหตุผลที่แข็งแกร่งและความสามารถด้านมัลติโมดอลิตี้ที่กว้างขวาง
Gemini Nano: โมเดลที่มีประสิทธิภาพมากที่สุดของ Google ซึ่งออกแบบมาให้ทำงานบนอุปกรณ์ พวกเขาได้ฝึกฝน Nano สองเวอร์ชัน โดยมีพารามิเตอร์ 1.8B (Nano-1) และ 3.25B (Nano-2) โดยมีเป้าหมายที่อุปกรณ์หน่วยความจำต่ำและสูงตามลำดับ Nano ได้รับการฝึกฝนโดยการกลั่นจากโมเดล Gemini ที่ใหญ่กว่า และมีการวัดปริมาณ 4 บิตสำหรับการปรับใช้ ซึ่งให้ประสิทธิภาพที่ดีที่สุดในระดับเดียวกัน

Gemini ของ Google ยังมีชื่อเสียงในฐานะโมเดลแรกที่ทำผลงานได้ดีกว่าผู้เชี่ยวชาญด้านมนุษย์ใน Massive Multitask Language Understanding (MMLU)

เกณฑ์มาตรฐานโมเดล Gemini

ในขณะที่เปิดตัว คู่แข่งรายใหญ่ที่สุดของ Gemini คือ GPT-4 ของ OpenAI

ด้วย 4 ด้านที่แตกต่างกันสำหรับการเปรียบเทียบ Gemini Ultra ซึ่งเป็นโมเดล Gemini ที่ทรงพลังที่สุด เอาชนะ GPT-4 ในเกือบทุกด้าน ยกเว้นการใช้เหตุผลทั่วไปสำหรับงานประจำวัน Gemini Ultra เก่งในการสร้างโค้ด Python ที่แม่นยำ ทักษะการแก้ปัญหาทางคณิตศาสตร์ และ MMLU ทั่วไป

Google ยังได้จัดทำรายงานเกณฑ์มาตรฐานที่ครอบคลุมมากขึ้นด้วย Gemini Pro และโมเดล AI อื่นๆ ที่เกี่ยวข้องซึ่งพร้อมใช้งาน:

เพื่อให้บริบทเพิ่มเติมเกี่ยวกับความสามารถของโมเดล Gemini Google ได้ทำการทดสอบภายในแบบปกติ โดยใช้ Gemini Pro เป็นเกณฑ์มาตรฐานหลัก

ฟังก์ชันการทำงานของ Gemini AI

Gemini AI ได้รับการออกแบบมาให้เป็นมัลติโมดอลิตี้โดยธรรมชาติเพื่อประสิทธิภาพที่มากขึ้น ช่วยให้ Gemini เข้าใจและให้เหตุผลด้วยอินพุตทุกชนิด ดังนั้นจึงเก่งในการช่วยเหลือผู้ใช้ที่กำลังมองหาความช่วยเหลือใน:

การให้เหตุผลที่ซับซ้อน

ความสามารถในการให้เหตุผลแบบมัลติโมดอลิตี้ที่ซับซ้อนของ Gemini สามารถช่วยให้โมเดล AI ย่อยและประมวลผลข้อมูลที่ซับซ้อนได้ ดังนั้น Gemini จึงมีทักษะในการอนุมานความหมายที่ซ่อนอยู่ท่ามกลางข้อมูลจำนวนมาก

คุณยังสามารถใช้ Gemini เพื่อดึงข้อมูลเฉพาะจากเอกสารหลายพันฉบับได้ ซึ่งสามารถกรองและทำความเข้าใจข้อมูลตามเกณฑ์ที่ป้อนเข้า และให้ข้อมูลที่คุณต้องการ

การเขียนโค้ดขั้นสูง

Gemini สามารถทำความเข้าใจ อธิบาย และสร้างโค้ดได้ สามารถสร้างโค้ดสำหรับภาษาโปรแกรมที่ใช้กันอย่างแพร่หลาย เช่น Python, Java, C++ และ Go

ซึ่งหมายความว่าหากคุณมีโค้ดที่คุณไม่เข้าใจ คุณสามารถเรียกใช้ผ่าน Gemini เพื่อดูรายละเอียดว่าโค้ดนั้นทำอะไร นอกจากนั้น Gemini ยังสามารถช่วยจัดเตรียมโค้ดสำหรับฟังก์ชันการทำงานที่คุณกำลังประสบปัญหา

การสร้างแนวคิดจากอินพุตต่างๆ

Gemini สามารถตอบสนองต่ออินพุตประเภทต่างๆ ได้ ซึ่งรวมถึงไฟล์ PDF รูปภาพ ข้อความ และวิดีโอ ด้วยทักษะการระบุที่แม่นยำและละเอียด Gemini สามารถกลายเป็นแหล่งที่มาของแรงบันดาลใจ - เครื่องมือระดมสมองหากคุณต้องการเรียกเช่นนั้น

เกี่ยวกับ Gemini API

การเปิดตัว Gemini มาพร้อมกับ Google Gemini API ซึ่งช่วยให้นักพัฒนาสามารถเข้าถึงแอปพลิเคชันที่ใช้ AI ได้หลากหลาย ด้วย Gemini คุณจะไม่ถูกผูกมัดกับข้อความเท่านั้น คุณยังสามารถป้อนรูปภาพเพื่อสร้างเอาต์พุตที่เกี่ยวข้องกับอินพุตได้

ความพร้อมใช้งานของ Gemini API

ปัจจุบัน มีรายการภาษาและภูมิภาคที่ Gemini API สามารถทำงานได้ ตรวจสอบลิงก์ด้านล่างเพื่อดูว่าคุณมีสิทธิ์ใช้ Gemini API หรือไม่!

ภาษาที่พร้อมใช้งานสำหรับ Gemini API

ภูมิภาคที่พร้อมใช้งานสำหรับ Gemini API

ราคา Gemini API

Google ให้บริการ Gemini Pro เวอร์ชันฟรี แม้ว่าจะสนับสนุนให้ผู้ใช้สร้างแอปด้วย Gemini Pro API แต่ผู้ใช้ควรทราบว่าพรอมต์และการตอบสนองที่เกี่ยวข้องกับ Gemini Pro เวอร์ชันฟรีจะถูกบันทึกและใช้ในกระบวนการวิจัยและพัฒนาของ Gemini Pro กล่าวอีกนัยหนึ่ง Google จะมีบันทึกทุกสิ่งที่ API ได้รับและให้ (ไม่มีความเป็นส่วนตัว)

เนื่องจาก Gemini ค่อนข้างใหม่ ราคาเต็มสำหรับ Gemini API ยังไม่ออกมาทั้งหมด อย่างไรก็ตาม ราคาที่อ้างอิงสำหรับอินพุตที่เอาต์พุตได้ถูกจัดเตรียมไว้แล้ว จะมีค่าใช้จ่าย $0.000125 ในการป้อน 1,000 อักขระ และ $0.0025 ในการป้อนข้อความ ในการตอบสนอง Gemini API จะเรียกเก็บเงิน $0.000375 เพื่อส่งออก 1,000 อักขระ อย่างไรก็ตาม Gemini API เวอร์ชันที่ต้องชำระเงินจะรองรับมากกว่า 60 คำค้นหาต่อนาที

คู่มือทีละขั้นตอนด้วยตนเองทางเลือกเกี่ยวกับวิธีใช้ Gemini API

โมเดล Gemini AI เป็นหนึ่งในโมเดล AI ที่ทรงพลังที่สุดที่เข้าถึงได้ฟรี หากคุณสนใจที่จะสร้างแอปพลิเคชันด้วย ให้ดำเนินการอ่านส่วนนี้ด้านล่าง

ขั้นตอนที่ 1: รับ Gemini API Key

ในการเข้าถึง Gemini API ก่อนอื่นเราต้องรับ Gemini API key จาก Google AI for Developers

จากนั้นคุณจะเข้าสู่แดชบอร์ด Google AI Studio ซึ่งพวกเขาจะแจ้งให้คุณเลือกเพื่อเริ่มพรอมต์ใหม่หรือรับ API key

ค้นหาปุ่มด้านบนเพื่อสร้าง API key

select existing porject or new project gemini api key

Gemini มีตัวเลือกในการเลือกว่าคุณต้องการทำงานในโปรเจกต์ที่อยู่ใน Google Cloud อยู่แล้ว (อาจเป็นโปรเจกต์ของทีม) หรือสร้างโปรเจกต์ใหม่

เมื่อคุณเลือกตัวเลือกแล้ว Gemini จะสร้าง API key ให้คุณ!

ขั้นตอนที่ 2 - คัดลอกโค้ด cURL

ขั้นแรก ไปที่ เว็บไซต์ Google AI for Developers และคัดลอก URL ตามที่ไฮไลต์ในภาพด้านบน อย่ารวมส่วนสุดท้าย 2> /dev/null เนื่องจากไม่ควรเป็นส่วนหนึ่งของโค้ด cURL

ถัดไป เปิด Apidog และเลือกปุ่ม + สีม่วงรอบมุมซ้ายบนของหน้าต่าง Apidog คุณควรจะเห็น Import cURL หรือคุณสามารถใช้ทางลัด Ctrl + I

วางโค้ด cURL ลงในหน้าต่าง แล้วกดปุ่ม OK

Apidog ช่วยให้ผู้ใช้สามารถนำเข้าโค้ด cURL ที่มีอยู่ลงในคำขอใหม่ได้! นอกจากนี้ คุณสามารถปรับเปลี่ยนคำขอโค้ด cURL เหล่านี้ได้ตามที่คุณต้องการให้ทำงาน

ขั้นตอนด้วยตนเองทางเลือกหากโค้ด cURL ไม่ทำงาน

ให้ Apidog สร้าง API ด้วย Gemini API Key

บทความนี้จะแสดงวิธีใช้ Gemini API key กับ Apidog ซึ่งเป็นเครื่องมือพัฒนา API ที่ออกแบบมาเป็นอันดับแรก

ขั้นแรก สร้างโปรเจกต์ใหม่บน Apidog คุณสามารถตั้งชื่อว่า Gemini API หรืออะไรก็ได้ที่คุณต้องการ!

จากนั้น กดปุ่ม New API

ตอนนี้ ไปที่ เว็บไซต์ Google AI for Developers และคัดลอก URL ตามที่ไฮไลต์ในภาพด้านบน

กลับไปที่ Apidog และวาง Gemini API URL ที่คุณคัดลอกในโซนที่ไฮไลต์ที่แสดงในภาพ เนื่องจากตัวอย่างนี้เป็นคำขอ POST ตรวจสอบให้แน่ใจว่าได้เปลี่ยนเมธอดจาก GET เป็น POST ด้วย

สังเกตว่าพารามิเตอร์การค้นหาในตอนท้ายของ URL ถูกลบออก ไม่ต้องกังวล - ใน Apidog พารามิเตอร์การค้นหาใดๆ จะถูกแยกและเติมโดยอัตโนมัติใน Request Params ซึ่งพบได้ในส่วน Params ดังที่แสดงในภาพ

button

คุณจะต้องแทนที่ส่วนนี้ด้วย Gemini API key ที่สร้างขึ้นก่อนหน้านี้ วางลงในส่วนที่ไฮไลต์ที่แสดงในภาพด้านบน คลิกบันทึกหลังจากนั้นเพื่อบันทึกความคืบหน้าของคุณ

กลับไปที่ เว็บไซต์ Google AI for Developers เพื่อคัดลอกเนื้อหาของคำขอ POST คัดลอกส่วนที่ไฮไลต์ของเนื้อหา

gemini api paste json body post request see response

กลับไปที่ Apidog และภายใต้ส่วน Request ให้เลือกส่วนหัว Body และเลือก json จากนั้น วางเนื้อหาคำขอ POST ในส่วน Example

หากคุณต้องการเปลี่ยนพรอมต์ที่จะส่งไปยัง Gemini API คุณสามารถแก้ไขสตริงที่พบภายในเครื่องหมายคำพูดขององค์ประกอบ "text"

สุดท้าย กดปุ่ม Send ด้านบนเพื่อทำการร้องขอ จากนั้นคุณควรได้รับการตอบสนองจาก Gemini API!

บทสรุป

Google Gemini API เป็นเครื่องมือที่ทรงพลังอย่างยิ่งที่นักพัฒนาจำนวนมากในปัจจุบันสามารถใช้สำหรับโปรแกรม แอปพลิเคชัน และธุรกิจขนาดเล็ก ด้วยความสามารถในการประมวลผลทั้งข้อความและอินพุตรูปภาพ Gemini API สามารถให้ผู้ใช้มีการตอบสนองเชิงลึกซึ่งเกี่ยวข้องกับการอนุมานเชิงบริบทที่ชาญฉลาด

Apidog นอกเหนือจากการสร้าง API แล้ว ยังสามารถจัดเตรียมสภาพแวดล้อมที่เรียบง่ายและใช้งานง่ายสำหรับการทดสอบ การจำลอง และการจัดทำเอกสาร API ด้วยกระบวนการอัตโนมัติมากมายเพื่อช่วยเพิ่มประสิทธิภาพของนักพัฒนา พิจารณา Apidog ให้เป็นแพลตฟอร์ม API ถัดไปของคุณ!

button