วิธีใช้ Gemini 3 Pro ฟรีด้วย Ollama

Ashley Innocent

Ashley Innocent

19 November 2025

วิธีใช้ Gemini 3 Pro ฟรีด้วย Ollama

Apidog สำหรับองค์กร

ติดตั้งภายในองค์กร

SSO & RBAC

รองรับ SOC 2

สำรวจ Apidog Enterprise

Gemini 3 Pro พร้อมใช้งานแล้วใน Ollama แบบฟรี และนักพัฒนาให้ความสนใจทันที คุณไม่จำเป็นต้องมีสมัครสมาชิก Cloud Max หรือ Pro แบบเสียเงินอีกต่อไปเพื่อทดลองใช้หนึ่งในโมเดลแบบมัลติโมดัลที่มีความสามารถมากที่สุดที่มีอยู่ นอกจากนี้ การผสานรวมนี้ยังนำความสามารถในการให้เหตุผลที่ล้ำสมัยของ Gemini 3 Pro เข้าสู่ขั้นตอนการทำงานของ Ollama ที่คุ้นเคย ซึ่งมีผู้คนนับล้านใช้งานอยู่แล้วสำหรับโมเดลท้องถิ่น

💡
เคล็ดลับด่วนสำหรับการทดสอบ API: เมื่อคุณทำงานกับคีย์ API ของ Gemini (จำเป็นสำหรับการเข้าถึงฟรี) ให้ดาวน์โหลด Apidog ฟรี มันช่วยให้การทดสอบคำขอ การจำลองปลายทาง และการแก้ไขข้อผิดพลาดในการตรวจสอบสิทธิ์ทำได้ง่ายขึ้นมากเมื่อเทียบกับการใช้ curl หรือ Postman ในสถานการณ์ที่ซับซ้อน

ถัดไป คุณจะสำรวจว่ามีอะไรเปลี่ยนแปลงไปบ้าง วิธีการตั้งค่า และวิธีการเพิ่มประสิทธิภาพสูงสุดบนฮาร์ดแวร์ของผู้บริโภค

มีอะไรเปลี่ยนแปลงไปบ้างกับ Gemini 3 Pro บน Ollama?

เดิมที Ollama จำกัดการเข้าถึง Gemini 3 Pro เฉพาะแผน Cloud แบบเสียเงินของ Ollama อย่างไรก็ตาม ในวันที่ 18 พฤศจิกายน 2025 บัญชีทางการของ Ollama ได้ประกาศว่าตอนนี้โมเดลนี้ปรากฏอยู่ในแบบฟรีควบคู่ไปกับแผน Pro และ Max

ตอนนี้คุณสามารถรันคำสั่งเดียว:

ollama run gemini-3-pro-preview

คำสั่งนี้จะดึงและรันโมเดลโดยไม่มีข้อจำกัดด้านการเรียกเก็บเงินเพิ่มเติม นอกจากนี้ โมเดลยังรองรับหน้าต่างบริบทขนาด 1M โทเค็น อินพุตมัลติโมดัลแบบเนทีฟ (ข้อความ รูปภาพ เสียง วิดีโอ) และความสามารถในการทำงานแบบเอเจนต์ขั้นสูง

ภาพหน้าจอที่แสดงการเข้าถึง Gemini 3 Pro บน Ollama สำหรับระดับฟรี Pro และ Max พร้อมความแตกต่างด้านอัตราการใช้งานและค่าใช้จ่าย
ระดับ การเข้าถึง Gemini 3 Pro อัตราการจำกัด (โดยประมาณ) ค่าใช้จ่าย
ฟรี มี (ตัวอย่าง) ปานกลาง $0
Pro มี สูงขึ้น มีค่าใช้จ่าย
Max มี สูงสุด มีค่าใช้จ่ายสูงขึ้น

การเปลี่ยนแปลงนี้ทำให้การเข้าถึงเป็นประชาธิปไตยมากขึ้น ส่งผลให้นักพัฒนาอิสระ นักวิจัย และผู้ที่ชื่นชอบงานอดิเรกได้รับความสามารถในการให้เหตุผลระดับแนวหน้าที่ก่อนหน้านี้ต้องมีการสมัครสมาชิกแบบองค์กร

ข้อกำหนดเบื้องต้นก่อนที่คุณจะเริ่มต้น

คุณต้องติดตั้ง Ollama เวอร์ชันล่าสุด — เวอร์ชัน 0.3.12 หรือใหม่กว่าจะจัดการกับโมเดลที่โฮสต์บนคลาวด์ได้อย่างราบรื่น ดาวน์โหลดได้จาก https://ollama.com/download

ภาพหน้าจอหน้าดาวน์โหลด Ollama ที่แสดงตัวเลือกการติดตั้งสำหรับระบบปฏิบัติการต่างๆ

ทีละขั้นตอน: การรัน Gemini 3 Pro Preview บนระดับฟรี

ทำตามขั้นตอนเหล่านี้อย่างแม่นยำเพื่อเปิดใช้งานโมเดล

ขั้นแรก เปิดเทอร์มินัลของคุณและตรวจสอบว่า Ollama ทำงานอยู่:

ollama --version

คุณควรเห็นเวอร์ชัน 0.3.12 หรือสูงกว่า

ขั้นที่สอง ดึงและรันโมเดลโดยตรง:

ollama run gemini-3-pro-preview
ภาพหน้าจอที่แสดงเอาต์พุตเทอร์มินัลขณะรัน 'ollama run gemini-3-pro-preview' ซึ่งแสดงการดึงและเริ่มต้นโมเดล

Ollama จะตรวจจับคุณสมบัติการใช้งานฟรีของคุณโดยอัตโนมัติและเชื่อมต่อกับแบ็กเอนด์ของ Google ผ่านคีย์ API ของคุณ (จัดเก็บไว้อย่างปลอดภัยหลังจากการรันครั้งแรก) ยิ่งไปกว่านั้น การเรียกใช้งานครั้งแรกจะแจ้งให้ป้อนคีย์หากยังไม่มี

ขั้นที่สาม ทดสอบการโต้ตอบพื้นฐาน:

>>> อธิบายการพัวพันทางควอนตัมด้วยคำง่ายๆ แต่มีความแม่นยำทางคณิตศาสตร์

โมเดลตอบสนองด้วยคำอธิบายที่ชัดเจน ซึ่งมักจะรวมสมการที่จัดรูปแบบด้วย LaTeX

ภาพหน้าจอที่แสดงการตอบสนองของโมเดล Gemini 3 Pro ต่อข้อความแจ้งเกี่ยวกับการพัวพันทางควอนตัมพร้อมคำอธิบายทางคณิตศาสตร์

นอกจากนี้ คุณสามารถอัปโหลดรูปภาพหรือเอกสารโดยตรงในเครื่องมือต่างๆ เช่น Open WebUI

การทดสอบ Gemini API โดยตรงด้วย Apidog

บางครั้งคุณจำเป็นต้องเข้าถึงปลายทาง Gemini โดยตรงสำหรับการเขียนสคริปต์หรือการผสานรวม Apidog excels here เพราะมันรองรับการสร้างคำขออัตโนมัติ ตัวแปรสภาพแวดล้อม และการตรวจสอบการตอบสนอง

ภาพหน้าจอของอินเทอร์เฟซ Apidog ที่แสดงการตั้งค่าคำขอ POST ไปยัง Gemini API พร้อมพารามิเตอร์และเนื้อหา JSON สำหรับการเปรียบเทียบโมเดล

นี่คือวิธีทดสอบโมเดลเดียวกันผ่านปลายทางอย่างเป็นทางการ:

เปิด Apidog และสร้างคำขอใหม่

ตั้งค่าเมธอดเป็น POST และ URL เป็น:

https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent

เพิ่มพารามิเตอร์การค้นหา: key=YOUR_API_KEY

ในเนื้อหา (JSON) ใช้:

{
  "contents": [{
    "parts": [{
      "text": "Compare Gemini 3 Pro to GPT-4o on reasoning benchmarks."
    }]
  }]
}

ส่งคำขอ

Apidog จะจัดรูปแบบการตอบสนองโดยอัตโนมัติ ไฮไลต์การใช้งานโทเค็น และให้คุณบันทึกคำขอเป็นคอลเล็กชัน วิธีการนี้มีค่าอย่างยิ่งเมื่อคุณเชื่อมโยงการเรียกใช้หรือสร้างเอเจนต์

ความสามารถแบบมัลติโมดัล: วิสัยทัศน์ เสียง และวิดีโอ

Gemini 3 Pro โดดเด่นด้วยการประมวลผลแบบมัลติโมดัลแบบเนทีฟ ตัวอย่างเช่น คุณสามารถป้อน URL ของรูปภาพหรือไฟล์ในเครื่อง:

ollama run gemini-3-pro-preview
>>> (อัปโหลดรูปภาพแผนผังวงจร)
อธิบายแผนผังนี้และแนะนำการปรับปรุงเพื่อเพิ่มประสิทธิภาพ

โมเดลจะวิเคราะห์แผนผัง ระบุส่วนประกอบ และเสนอการเพิ่มประสิทธิภาพ ในทำนองเดียวกัน คุณสามารถประมวลผลเฟรมวิดีโอหรือการถอดเสียงในเซสชันเดียวกันได้

ในทางปฏิบัติ นักพัฒนารายงานประสิทธิภาพที่เหนือกว่าในงานการทำความเข้าใจเอกสารเมื่อเทียบกับ Gemini 1.5 Pro รุ่นก่อนหน้า โดยเฉพาะกับ PDF ที่มีข้อความ/รูปภาพผสมกัน

เกณฑ์มาตรฐานประสิทธิภาพและการทดสอบในโลกจริง

การทดสอบอิสระที่ดำเนินการเมื่อวันที่ 18 พฤศจิกายน 2025 แสดงให้เห็นว่า Gemini 3 Pro บรรลุผลดังนี้:

นอกจากนี้ ความเร็วในการส่งออกในระดับฟรีโดยเฉลี่ยอยู่ที่ 45–60 โทเค็น/วินาที สำหรับข้อความแจ้งแบบข้อความเท่านั้น ซึ่งเทียบเท่ากับระดับที่ต้องจ่ายของโมเดลคู่แข่ง

คุณสามารถตอบสนองได้เร็วยิ่งขึ้นโดยใช้ส่วนหน้า Open WebUI หรือการผสานรวมผ่านปลายทางที่เข้ากันได้กับ OpenAI ที่ Ollama เปิดเผย

การผสานรวม Gemini 3 Pro เข้ากับแอปพลิเคชัน

Ollama เปิดเผย API ที่เข้ากันได้กับ OpenAI ที่ http://localhost:11434/v1 ดังนั้น คุณสามารถชี้โปรเจกต์ LangChain, LlamaIndex หรือ Haystack ไปที่นั่นได้:

from openai import OpenAI

client = OpenAI(
    base_url="http://localhost:11434/v1",
    api_key="ollama",  # คีย์จำลอง
)

response = client.chat.completions.create(
    model="gemini-3-pro-preview",
    messages=[{"role": "user", "content": "Write a FastAPI endpoint for user auth."}]
)
print(response.choices[0].message.content)

ความเข้ากันได้นี้หมายความว่าคุณสามารถสลับใช้ Gemini 3 Pro ได้โดยไม่ต้องเขียนโค้ดที่สร้างขึ้นสำหรับโมเดล GPT ใหม่

ข้อจำกัดของระดับฟรีที่คุณควรรู้

การเข้าถึงฟรีรวมถึงอัตราการจำกัดที่เอื้อเฟื้อแต่มีขีดจำกัด ผู้ใช้งานหนักจะชนขีดจำกัดที่ประมาณ 50–100 คำขอต่อนาที ขึ้นอยู่กับภูมิภาคและปริมาณงาน นอกจากนี้ โมเดลยังคงโฮสต์บนคลาวด์ ดังนั้นความหน่วงแฝงจึงขึ้นอยู่กับการเชื่อมต่อของคุณ (โดยทั่วไป 800–1500ms TTF)

สำหรับการใช้งานไม่จำกัด ให้ยกระดับเป็น Ollama Pro หรือ Max แต่โดยส่วนใหญ่แล้วนักพัฒนาพบว่าระดับฟรีเพียงพอสำหรับการสร้างต้นแบบและการทำงานประจำวัน

ภาพหน้าจอที่แสดงการเปรียบเทียบระดับ Ollama Cloud Pro และ Max พร้อมคุณสมบัติที่เพิ่มขึ้น เช่น การปรับแต่ง API Key, การรองรับ Multimodal ที่เร็วขึ้น และความจุบริบทขนาดใหญ่ขึ้น

การใช้งานขั้นสูง: การเรียกใช้ฟังก์ชันและการใช้เครื่องมือ

Gemini 3 Pro รองรับการเรียกใช้ฟังก์ชันแบบเนทีฟ กำหนดเครื่องมือใน Modelfile หรือผ่าน API:

{
  "tools": [{
    "type": "function",
    "function": {
      "name": "get_weather",
      "description": "รับสภาพอากาศปัจจุบัน",
      "parameters": { ... }
    }
  }]
}

จากนั้นโมเดลจะตัดสินใจว่าจะเรียกใช้ฟังก์ชันของคุณเมื่อใด ซึ่งช่วยให้ขั้นตอนการทำงานแบบเอเจนต์ เช่น การท่องเว็บหรือการสอบถามฐานข้อมูล

การแก้ไขปัญหาทั่วไป

เหตุใดสิ่งนี้จึงสำคัญสำหรับนักพัฒนาในปี 2025

ตอนนี้คุณสามารถเข้าถึงความฉลาดระดับแนวหน้าได้โดยไม่มีค่าใช้จ่ายโครงสร้างพื้นฐาน ซึ่งทำให้การแข่งขันมีความเท่าเทียมกันอย่างมาก ทีมขนาดเล็กสามารถสร้างเอเจนต์ที่ซับซ้อน นักวิจัยสามารถเปรียบเทียบกับโมเดล SOTA ล่าสุด และผู้ที่ชื่นชอบสามารถสำรวจ AI แบบมัลติโมดัลได้—ทั้งหมดนี้โดยไม่ต้องมีการอนุมัติงบประมาณ

นอกจากนี้ การรวมสิ่งนี้เข้ากับเครื่องมืออย่าง Apidog สำหรับการจัดการ API ยังช่วยเร่งวงจรการพัฒนาจากหลายวันให้เหลือเพียงไม่กี่ชั่วโมง

สรุป: เริ่มใช้ Gemini 3 Pro วันนี้

รัน ollama run gemini-3-pro-preview ได้เลยตอนนี้ และสัมผัสความแตกต่างด้วยตัวคุณเอง Google และ Ollama เพิ่งขจัดอุปสรรคที่ใหญ่ที่สุดในการทดลอง AI ขั้นสูง

ดาวน์โหลด Apidog ฟรีวันนี้เพื่อเสริมประสิทธิภาพเวิร์กโฟลว์การทดสอบ API ของคุณ—ไม่ว่าคุณจะดีบักคำขอ Gemini หรือสร้างแอปพลิเคชันแบบเต็มสแต็กโดยใช้ Ollama

อนาคตของ AI แบบเปิดที่เข้าถึงได้มาถึงแล้ว คุณต้องการเพียงคำสั่งเดียวเพื่อเข้าร่วม

button

ฝึกการออกแบบ API แบบ Design-first ใน Apidog

ค้นพบวิธีที่ง่ายขึ้นในการสร้างและใช้ API