Gemini 3 Pro พร้อมใช้งานแล้วใน Ollama แบบฟรี และนักพัฒนาให้ความสนใจทันที คุณไม่จำเป็นต้องมีสมัครสมาชิก Cloud Max หรือ Pro แบบเสียเงินอีกต่อไปเพื่อทดลองใช้หนึ่งในโมเดลแบบมัลติโมดัลที่มีความสามารถมากที่สุดที่มีอยู่ นอกจากนี้ การผสานรวมนี้ยังนำความสามารถในการให้เหตุผลที่ล้ำสมัยของ Gemini 3 Pro เข้าสู่ขั้นตอนการทำงานของ Ollama ที่คุ้นเคย ซึ่งมีผู้คนนับล้านใช้งานอยู่แล้วสำหรับโมเดลท้องถิ่น
ถัดไป คุณจะสำรวจว่ามีอะไรเปลี่ยนแปลงไปบ้าง วิธีการตั้งค่า และวิธีการเพิ่มประสิทธิภาพสูงสุดบนฮาร์ดแวร์ของผู้บริโภค
มีอะไรเปลี่ยนแปลงไปบ้างกับ Gemini 3 Pro บน Ollama?
เดิมที Ollama จำกัดการเข้าถึง Gemini 3 Pro เฉพาะแผน Cloud แบบเสียเงินของ Ollama อย่างไรก็ตาม ในวันที่ 18 พฤศจิกายน 2025 บัญชีทางการของ Ollama ได้ประกาศว่าตอนนี้โมเดลนี้ปรากฏอยู่ในแบบฟรีควบคู่ไปกับแผน Pro และ Max
ตอนนี้คุณสามารถรันคำสั่งเดียว:
ollama run gemini-3-pro-preview
คำสั่งนี้จะดึงและรันโมเดลโดยไม่มีข้อจำกัดด้านการเรียกเก็บเงินเพิ่มเติม นอกจากนี้ โมเดลยังรองรับหน้าต่างบริบทขนาด 1M โทเค็น อินพุตมัลติโมดัลแบบเนทีฟ (ข้อความ รูปภาพ เสียง วิดีโอ) และความสามารถในการทำงานแบบเอเจนต์ขั้นสูง

| ระดับ | การเข้าถึง Gemini 3 Pro | อัตราการจำกัด (โดยประมาณ) | ค่าใช้จ่าย |
|---|---|---|---|
| ฟรี | มี (ตัวอย่าง) | ปานกลาง | $0 |
| Pro | มี | สูงขึ้น | มีค่าใช้จ่าย |
| Max | มี | สูงสุด | มีค่าใช้จ่ายสูงขึ้น |
การเปลี่ยนแปลงนี้ทำให้การเข้าถึงเป็นประชาธิปไตยมากขึ้น ส่งผลให้นักพัฒนาอิสระ นักวิจัย และผู้ที่ชื่นชอบงานอดิเรกได้รับความสามารถในการให้เหตุผลระดับแนวหน้าที่ก่อนหน้านี้ต้องมีการสมัครสมาชิกแบบองค์กร
ข้อกำหนดเบื้องต้นก่อนที่คุณจะเริ่มต้น
คุณต้องติดตั้ง Ollama เวอร์ชันล่าสุด — เวอร์ชัน 0.3.12 หรือใหม่กว่าจะจัดการกับโมเดลที่โฮสต์บนคลาวด์ได้อย่างราบรื่น ดาวน์โหลดได้จาก https://ollama.com/download

ทีละขั้นตอน: การรัน Gemini 3 Pro Preview บนระดับฟรี
ทำตามขั้นตอนเหล่านี้อย่างแม่นยำเพื่อเปิดใช้งานโมเดล
ขั้นแรก เปิดเทอร์มินัลของคุณและตรวจสอบว่า Ollama ทำงานอยู่:
ollama --version
คุณควรเห็นเวอร์ชัน 0.3.12 หรือสูงกว่า
ขั้นที่สอง ดึงและรันโมเดลโดยตรง:
ollama run gemini-3-pro-preview

Ollama จะตรวจจับคุณสมบัติการใช้งานฟรีของคุณโดยอัตโนมัติและเชื่อมต่อกับแบ็กเอนด์ของ Google ผ่านคีย์ API ของคุณ (จัดเก็บไว้อย่างปลอดภัยหลังจากการรันครั้งแรก) ยิ่งไปกว่านั้น การเรียกใช้งานครั้งแรกจะแจ้งให้ป้อนคีย์หากยังไม่มี
ขั้นที่สาม ทดสอบการโต้ตอบพื้นฐาน:
>>> อธิบายการพัวพันทางควอนตัมด้วยคำง่ายๆ แต่มีความแม่นยำทางคณิตศาสตร์
โมเดลตอบสนองด้วยคำอธิบายที่ชัดเจน ซึ่งมักจะรวมสมการที่จัดรูปแบบด้วย LaTeX

นอกจากนี้ คุณสามารถอัปโหลดรูปภาพหรือเอกสารโดยตรงในเครื่องมือต่างๆ เช่น Open WebUI
การทดสอบ Gemini API โดยตรงด้วย Apidog
บางครั้งคุณจำเป็นต้องเข้าถึงปลายทาง Gemini โดยตรงสำหรับการเขียนสคริปต์หรือการผสานรวม Apidog excels here เพราะมันรองรับการสร้างคำขออัตโนมัติ ตัวแปรสภาพแวดล้อม และการตรวจสอบการตอบสนอง

นี่คือวิธีทดสอบโมเดลเดียวกันผ่านปลายทางอย่างเป็นทางการ:
เปิด Apidog และสร้างคำขอใหม่
ตั้งค่าเมธอดเป็น POST และ URL เป็น:
https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent
เพิ่มพารามิเตอร์การค้นหา: key=YOUR_API_KEY
ในเนื้อหา (JSON) ใช้:
{
"contents": [{
"parts": [{
"text": "Compare Gemini 3 Pro to GPT-4o on reasoning benchmarks."
}]
}]
}
ส่งคำขอ
Apidog จะจัดรูปแบบการตอบสนองโดยอัตโนมัติ ไฮไลต์การใช้งานโทเค็น และให้คุณบันทึกคำขอเป็นคอลเล็กชัน วิธีการนี้มีค่าอย่างยิ่งเมื่อคุณเชื่อมโยงการเรียกใช้หรือสร้างเอเจนต์
ความสามารถแบบมัลติโมดัล: วิสัยทัศน์ เสียง และวิดีโอ
Gemini 3 Pro โดดเด่นด้วยการประมวลผลแบบมัลติโมดัลแบบเนทีฟ ตัวอย่างเช่น คุณสามารถป้อน URL ของรูปภาพหรือไฟล์ในเครื่อง:
ollama run gemini-3-pro-preview
>>> (อัปโหลดรูปภาพแผนผังวงจร)
อธิบายแผนผังนี้และแนะนำการปรับปรุงเพื่อเพิ่มประสิทธิภาพ
โมเดลจะวิเคราะห์แผนผัง ระบุส่วนประกอบ และเสนอการเพิ่มประสิทธิภาพ ในทำนองเดียวกัน คุณสามารถประมวลผลเฟรมวิดีโอหรือการถอดเสียงในเซสชันเดียวกันได้
ในทางปฏิบัติ นักพัฒนารายงานประสิทธิภาพที่เหนือกว่าในงานการทำความเข้าใจเอกสารเมื่อเทียบกับ Gemini 1.5 Pro รุ่นก่อนหน้า โดยเฉพาะกับ PDF ที่มีข้อความ/รูปภาพผสมกัน
เกณฑ์มาตรฐานประสิทธิภาพและการทดสอบในโลกจริง
การทดสอบอิสระที่ดำเนินการเมื่อวันที่ 18 พฤศจิกายน 2025 แสดงให้เห็นว่า Gemini 3 Pro บรรลุผลดังนี้:
- MMLU-Pro: 88.2%
- GPQA Diamond: 82.7%
- LiveCodeBench: 74.1%
- MMMU (มัลติโมดัล): 78.5%
นอกจากนี้ ความเร็วในการส่งออกในระดับฟรีโดยเฉลี่ยอยู่ที่ 45–60 โทเค็น/วินาที สำหรับข้อความแจ้งแบบข้อความเท่านั้น ซึ่งเทียบเท่ากับระดับที่ต้องจ่ายของโมเดลคู่แข่ง
คุณสามารถตอบสนองได้เร็วยิ่งขึ้นโดยใช้ส่วนหน้า Open WebUI หรือการผสานรวมผ่านปลายทางที่เข้ากันได้กับ OpenAI ที่ Ollama เปิดเผย
การผสานรวม Gemini 3 Pro เข้ากับแอปพลิเคชัน
Ollama เปิดเผย API ที่เข้ากันได้กับ OpenAI ที่ http://localhost:11434/v1 ดังนั้น คุณสามารถชี้โปรเจกต์ LangChain, LlamaIndex หรือ Haystack ไปที่นั่นได้:
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:11434/v1",
api_key="ollama", # คีย์จำลอง
)
response = client.chat.completions.create(
model="gemini-3-pro-preview",
messages=[{"role": "user", "content": "Write a FastAPI endpoint for user auth."}]
)
print(response.choices[0].message.content)
ความเข้ากันได้นี้หมายความว่าคุณสามารถสลับใช้ Gemini 3 Pro ได้โดยไม่ต้องเขียนโค้ดที่สร้างขึ้นสำหรับโมเดล GPT ใหม่
ข้อจำกัดของระดับฟรีที่คุณควรรู้
การเข้าถึงฟรีรวมถึงอัตราการจำกัดที่เอื้อเฟื้อแต่มีขีดจำกัด ผู้ใช้งานหนักจะชนขีดจำกัดที่ประมาณ 50–100 คำขอต่อนาที ขึ้นอยู่กับภูมิภาคและปริมาณงาน นอกจากนี้ โมเดลยังคงโฮสต์บนคลาวด์ ดังนั้นความหน่วงแฝงจึงขึ้นอยู่กับการเชื่อมต่อของคุณ (โดยทั่วไป 800–1500ms TTF)
สำหรับการใช้งานไม่จำกัด ให้ยกระดับเป็น Ollama Pro หรือ Max แต่โดยส่วนใหญ่แล้วนักพัฒนาพบว่าระดับฟรีเพียงพอสำหรับการสร้างต้นแบบและการทำงานประจำวัน

การใช้งานขั้นสูง: การเรียกใช้ฟังก์ชันและการใช้เครื่องมือ
Gemini 3 Pro รองรับการเรียกใช้ฟังก์ชันแบบเนทีฟ กำหนดเครื่องมือใน Modelfile หรือผ่าน API:
{
"tools": [{
"type": "function",
"function": {
"name": "get_weather",
"description": "รับสภาพอากาศปัจจุบัน",
"parameters": { ... }
}
}]
}
จากนั้นโมเดลจะตัดสินใจว่าจะเรียกใช้ฟังก์ชันของคุณเมื่อใด ซึ่งช่วยให้ขั้นตอนการทำงานแบบเอเจนต์ เช่น การท่องเว็บหรือการสอบถามฐานข้อมูล
การแก้ไขปัญหาทั่วไป
- ข้อผิดพลาด 401/403: สร้างคีย์ Gemini API ของคุณใหม่และรัน
ollama runอีกครั้งเพื่อตรวจสอบสิทธิ์ใหม่ - ไม่พบโมเดล: อัปเดต Ollama (
ollama update) แล้วลองอีกครั้ง - การตอบสนองช้า: เปลี่ยนไปใช้การเชื่อมต่อแบบมีสายหรือใช้งานในช่วงนอกเวลาทำการ
- Multimodal ล้มเหลว: ตรวจสอบให้แน่ใจว่าคุณใช้ Ollama เวอร์ชันล่าสุดและอัปโหลดไฟล์ผ่านไคลเอ็นต์ที่รองรับ (Open WebUI ทำงานได้ดีที่สุด)
เหตุใดสิ่งนี้จึงสำคัญสำหรับนักพัฒนาในปี 2025
ตอนนี้คุณสามารถเข้าถึงความฉลาดระดับแนวหน้าได้โดยไม่มีค่าใช้จ่ายโครงสร้างพื้นฐาน ซึ่งทำให้การแข่งขันมีความเท่าเทียมกันอย่างมาก ทีมขนาดเล็กสามารถสร้างเอเจนต์ที่ซับซ้อน นักวิจัยสามารถเปรียบเทียบกับโมเดล SOTA ล่าสุด และผู้ที่ชื่นชอบสามารถสำรวจ AI แบบมัลติโมดัลได้—ทั้งหมดนี้โดยไม่ต้องมีการอนุมัติงบประมาณ
นอกจากนี้ การรวมสิ่งนี้เข้ากับเครื่องมืออย่าง Apidog สำหรับการจัดการ API ยังช่วยเร่งวงจรการพัฒนาจากหลายวันให้เหลือเพียงไม่กี่ชั่วโมง
สรุป: เริ่มใช้ Gemini 3 Pro วันนี้
รัน ollama run gemini-3-pro-preview ได้เลยตอนนี้ และสัมผัสความแตกต่างด้วยตัวคุณเอง Google และ Ollama เพิ่งขจัดอุปสรรคที่ใหญ่ที่สุดในการทดลอง AI ขั้นสูง
ดาวน์โหลด Apidog ฟรีวันนี้เพื่อเสริมประสิทธิภาพเวิร์กโฟลว์การทดสอบ API ของคุณ—ไม่ว่าคุณจะดีบักคำขอ Gemini หรือสร้างแอปพลิเคชันแบบเต็มสแต็กโดยใช้ Ollama
อนาคตของ AI แบบเปิดที่เข้าถึงได้มาถึงแล้ว คุณต้องการเพียงคำสั่งเดียวเพื่อเข้าร่วม
