กลุ่มโมเดล Gemini ของ Google เป็นโมเดลแนวหน้าที่มีประสิทธิภาพด้านต้นทุนมากที่สุดสำหรับปริมาณงานสูง โดย Gemini 2.5 Pro มีราคา $1.25 / $10 ต่อล้านโทเค็น และรุ่น Flash มีราคาถูกกว่ามาก สำหรับแอปสาธารณะฟรี โปรเจกต์ส่วนตัว หรือการสร้างในงานแฮกกาธอน แม้แต่อัตราเหล่านี้ก็ยังเพิ่มขึ้นอย่างรวดเร็วเมื่อผู้ใช้หลายพันคนเข้าถึงปลายทางของคุณ Puter.js พลิกโมเดลนี้: มันเปิดเผยโมเดล Gemini ทั้งหมด (2.5 Pro, 2.5 Flash, 2.0 Flash, 3 Flash preview, รวมถึงตระกูล Gemma 2/3/4 แบบโอเพนซอร์ส) โดยไม่ต้องใช้ Google API key และเรียกเก็บเงินจากผู้ใช้ปลายทางแทนคุณ สำหรับนักพัฒนาแล้ว บริการนี้ฟรีและไม่จำกัดการใช้งาน
สรุป (TL;DR)
- Puter.js ช่วยให้นักพัฒนาสามารถเข้าถึงแค็ตตาล็อก Gemini และ Gemma ได้ฟรีไม่จำกัด โดยไม่ต้องใช้ Google API key, โปรเจกต์ Google Cloud หรือเซิร์ฟเวอร์ใดๆ
- Gemini ที่รองรับ: 2.5 Pro, 2.5 Flash, 2.5 Flash Lite, 2.0 Flash, 2.0 Flash Lite, 3 Flash Preview, รวมถึงรุ่นพรีวิวเก่าๆ
- Gemma ที่รองรับ: Gemma 2, 3, 4 ในขนาดต่างๆ (4B, 12B, 27B, 31B, 26B-A4B)
- เพียง
<script>แท็กเดียว เรียกใช้ฟังก์ชันเดียว คุณก็สามารถสื่อสารกับ Gemini ได้แล้ว - การสตรีม, การรับภาพ (vision input), การควบคุมอุณหภูมิ (temperature control) ทั้งหมดทำงานได้ในเบราว์เซอร์
- ผู้ใช้ปลายทางจะชำระค่าใช้จ่ายจากการใช้บัญชี Puter ของตนเอง; คุณไม่ต้องเสียค่าใช้จ่ายใดๆ ตลอดไป
- ใช้ Apidog เพื่อเปรียบเทียบประสิทธิภาพ Puter กับ Gemini API อย่างเป็นทางการสำหรับการวางแผนการย้ายข้อมูล
“ฟรีไม่จำกัด” ทำงานอย่างไร
Puter.js พลิกกลับโมเดลการเรียกเก็บเงินของ LLM แทนที่คุณจะต้องถือ Google AI Studio key และรับผิดชอบค่าใช้จ่ายโทเค็นทุกครั้ง ผู้ใช้ปลายทางของคุณจะลงชื่อเข้าใช้ Puter (บัญชีฟรี) และการเรียกใช้จะถูกหักจากยอดคงเหลือของพวกเขา บัญชี Puter ใหม่จะได้รับเครดิตเริ่มต้น; ผู้ใช้สามารถเติมเงินได้หากต้องการใช้งานเพิ่มเติม
สำหรับนักพัฒนา ผลลัพธ์ที่ได้นั้นชัดเจน:
- ไม่มีโปรเจกต์ Google Cloud, ไม่มี AI Studio key. ไม่ต้องเจรจาโควต้า, ไม่ต้องหมุนเวียนคีย์, ไม่มีข้อผูกพันด้านการเรียกเก็บเงิน
- ไม่มีข้อจำกัดการใช้งานจากฝั่งคุณ. "ขีดจำกัด" ของคุณจะเพิ่มขึ้นตามจำนวนผู้ใช้ของคุณ
- ไม่ต้องผูกมัดกับระบบการเรียกเก็บเงินของ Google. Puter จัดการการเรียกใช้ปลายน้ำ
ข้อแลกเปลี่ยน: นี่คือการทำงานแบบเบราว์เซอร์เป็นหลัก งาน cron ในแบ็กเอนด์ไม่สามารถใช้ Puter ได้หากไม่มีเซสชันผู้ใช้ที่ลงชื่อเข้าใช้
ขั้นตอนที่ 1: การติดตั้ง
เพียงแท็ก CDN เดียว ไม่ต้องมีขั้นตอนการบิลด์:
<script src="https://js.puter.com/v2/"></script>
นั่นคือการติดตั้งทั้งหมด หรือสำหรับแอปแบบรวม:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
ขั้นตอนที่ 2: เลือกรุ่นโมเดล
กลุ่มผลิตภัณฑ์ Gemini บน Puter พร้อมเครื่องมือที่เหมาะสมสำหรับแต่ละรูปแบบ:
| รหัสโมเดล | ควรใช้เมื่อใด |
|---|---|
google/gemini-2.5-pro |
การให้เหตุผลที่ลึกซึ้งที่สุด; การวิเคราะห์ที่ซับซ้อนและงานที่มีบริบทขนาดยาว |
google/gemini-2.5-flash |
ใช้งานประจำวันเริ่มต้น; สมดุลที่ดีระหว่างต้นทุนและคุณภาพ |
google/gemini-2.5-flash-lite |
รุ่น Flash ที่ถูกที่สุด; การจัดหมวดหมู่ปริมาณมาก |
google/gemini-2.0-flash |
พื้นฐานที่เสถียร; พฤติกรรมที่เข้าใจง่าย |
google/gemini-3-flash-preview |
รุ่นพรีวิวล่าสุด; ความเร็วที่ล้ำสมัย |
google/gemma-3-27b-it |
Gemma แบบโอเพนซอร์ส; ปรับแต่งตามคำสั่ง, เหมาะสำหรับการปรับแต่งพื้นฐาน |
google/gemma-4-31b-it |
Gemma แบบโอเพนซอร์สที่ใหญ่ที่สุด; ใกล้เคียงกับคุณภาพของ Gemini แบบปิด |
สำหรับแอปส่วนใหญ่ ให้ใช้ gemini-2.5-flash เป็นค่าเริ่มต้น และใช้ Pro สำหรับพร้อมต์ที่ยากเท่านั้น รุ่น Lite นั้นเร็วกว่ามาก และดีพอสำหรับการแท็ก, การจัดหมวดหมู่, และ Q&A ง่ายๆ
ขั้นตอนที่ 3: ให้ Gemini สื่อสาร
การเรียกใช้ขั้นต่ำที่ใช้งานได้:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain machine learning in three sentences",
{ model: 'google/gemini-2.5-flash' }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
เปิดในเบราว์เซอร์ Puter จะจัดการการเรียกใช้ ผู้ใช้ลงชื่อเข้าใช้ (หรือสร้างบัญชี Puter ฟรีในการเรียกใช้ครั้งแรก) และการตอบกลับจะแสดงบนหน้าเว็บ ไม่ต้องใช้ API key, ไม่ต้องมีตัวแปรสภาพแวดล้อม, ไม่มีเซิร์ฟเวอร์
ขั้นตอนที่ 4: สตรีมการตอบกลับ
สำหรับ UI แชทและคำตอบยาวๆ การสตรีมเป็นค่าเริ่มต้นที่เหมาะสม:
const response = await puter.ai.chat(
"Explain photosynthesis in detail",
{
model: 'google/gemini-2.5-flash',
stream: true,
}
);
for await (const part of response) {
if (part?.text) {
outputDiv.innerHTML += part.text;
}
}
แต่ละ part.text คือส่วนหนึ่งของการตอบกลับ นำไปต่อท้ายใน UI ของคุณ; ผู้ใช้จะเห็นข้อความปรากฏขึ้นทีละคำ
ขั้นตอนที่ 5: การมองเห็น (vision) (การป้อนภาพ)
คุณสมบัติที่แข็งแกร่งที่สุดของ Gemini คือ multimodal grounding ส่ง URL รูปภาพเป็นอาร์กิวเมนต์ที่สอง:
puter.ai.chat(
"What do you see in this image? Describe colors, objects, and mood.",
"https://assets.puter.site/doge.jpeg",
{ model: 'google/gemini-2.5-flash' }
).then(response => {
puter.print(response);
});
กรณีการใช้งาน: การสร้าง alt-text, QA ภาพ, การวิเคราะห์ภาพหน้าจอ, OCR, เครื่องมือเพื่อการเข้าถึง, การติดแท็กรูปภาพสินค้า คุณภาพการมองเห็นของ Gemini นั้นแข็งแกร่งอย่างต่อเนื่องในภาพธรรมชาติและไดอะแกรม; ในภาพหน้าจอที่มีข้อความหนาแน่น บางครั้ง GPT-5.x ก็ทำได้ดีกว่า
ขั้นตอนที่ 6: ปรับอุณหภูมิ (temperature)
ส่งพารามิเตอร์มาตรฐานในอ็อบเจกต์ options:
const response = await puter.ai.chat(
'Write a creative short story about a robot chef',
{
model: 'google/gemini-2.5-flash',
temperature: 0.2,
}
);
ใช้อุณหภูมิที่ต่ำกว่า (0.0–0.3) สำหรับข้อเท็จจริงหรือผลลัพธ์ที่มีโครงสร้าง และสูงกว่า (0.7–1.0) สำหรับการเขียนเชิงสร้างสรรค์ ค่าเริ่มต้นของ Gemini Flash ทำงานได้ดีที่อุณหภูมิ 0.7 สำหรับกรณีการใช้งานแชทส่วนใหญ่
ขั้นตอนที่ 7: การสนทนาหลายรอบ
ส่งอาร์เรย์ของข้อความ:
const messages = [
{ role: 'user', content: 'I am building a Next.js app with Postgres.' },
{ role: 'assistant', content: 'Got it. What do you need help with?' },
{ role: 'user', content: 'How should I structure migrations?' },
];
const response = await puter.ai.chat(messages, {
model: 'google/gemini-2.5-pro',
});
console.log(response);
เพิ่มข้อความของผู้ใช้ทุกข้อความและการตอบกลับของผู้ช่วยทุกครั้งลงในอาร์เรย์ก่อนการเรียกใช้ครั้งถัดไป Gemini จะอ่านบทสนทนาทั้งหมดและคงความสอดคล้องกันตลอดการสนทนา
การเปรียบเทียบ Gemini กับโมเดลอื่นๆ ด้วยพร้อมต์เดียวกัน
Puter เปิดเผย LLM ที่สำคัญทุกตัวผ่านอินเทอร์เฟซเดียว วิธีที่เร็วที่สุดในการค้นหาโมเดลที่เหมาะสมสำหรับกรณีการใช้งานของคุณคือการเขียนสคริปต์พร้อมต์เดียวกันในผู้ให้บริการต่างๆ:
const models = [
'google/gemini-2.5-flash',
'claude-sonnet-4-6',
'gpt-5.5',
'x-ai/grok-4.3',
];
const prompt = "Refactor this React component to use hooks: ...";
for (const model of models) {
const start = performance.now();
const response = await puter.ai.chat(prompt, { model });
const elapsed = performance.now() - start;
console.log(`${model}: ${elapsed.toFixed(0)}ms`);
console.log(response);
console.log('---');
}
เรียกใช้เพียงครั้งเดียว คุณจะเห็นรูปแบบการแลกเปลี่ยน Gemini Flash มักจะเป็นผู้ชนะด้านความเร็ว (latency), Sonnet เป็นผู้ชนะด้านคุณภาพในการเขียนโค้ด, GPT-5.5 เป็นผู้ชนะด้านคุณภาพในการเขียนแบบยาว, Grok 4.3 ชนะด้านต้นทุน เลือกรุ่นโมเดลที่เหมาะสมกับความต้องการของคุณ
สิ่งที่คุณได้รับและสิ่งที่คุณไม่ได้รับ
การแยกอย่างตรงไปตรงมา:
สิ่งที่คุณได้รับ:
- แค็ตตาล็อก Gemini 2.5/2.0/3 Flash เต็มรูปแบบพร้อม 2.5 Pro
- ตระกูล Open Gemma (2/3/4) สำหรับเวิร์กโฟลว์แบบ open-weight
- การสนทนาหลายรอบ
- การตอบกลับแบบสตรีมมิ่ง
- การรับภาพ (vision input) (URL รูปภาพ)
- Temperature, max_tokens, system prompts
- ขนาดที่พร้อมใช้งานสำหรับการผลิต (production-ready scale)
สิ่งที่คุณอาจไม่ได้รับ (ขึ้นอยู่กับเวอร์ชันของ Puter):
- การเรียกใช้ฟังก์ชันแบบเนทีฟบน Gemini (ตรวจสอบเอกสาร Puter ล่าสุด)
- เครื่องมือสำหรับรันโค้ด
- การเชื่อมโยงกับ Google Search (grounding)
- บริบทขนาดยาวสูงสุดถึง 2 ล้านโทเค็นของ Gemini
- การใช้งานฝั่งเซิร์ฟเวอร์โดยไม่มีบริบทของเบราว์เซอร์
- การมองเห็นข้อจำกัดอัตราการใช้งาน (rate limit) โดยตรงจาก Google
สำหรับการทำงานแบบ agentic ที่ซับซ้อนซึ่งต้องการการรันโค้ดและการเชื่อมโยง (grounding) นั้น Google AI Studio API อย่างเป็นทางการจะให้คุณได้มากกว่า สำหรับงานแชททั่วไป, Q&A, การสร้างเนื้อหา, และงานภาพ, Puter ก็เพียงพอแล้ว
เมื่อใดควรใช้ Puter เทียบกับ Gemini API อย่างเป็นทางการ
ข้อแตกต่าง:
ใช้ Puter เมื่อ:
- คุณกำลังเผยแพร่แอปสาธารณะฟรีและไม่ต้องการรับภาระค่าใช้จ่าย
- คุณกำลังสร้างต้นแบบ (prototyping) และไม่ต้องการตั้งค่าโปรเจกต์ Google Cloud
- คุณต้องการใช้ Gemini ในเว็บไซต์แบบคงที่ (static site), โปรเจกต์แฮกกาธอน, หรือส่วนเสริมของเบราว์เซอร์โดยไม่มีแบ็กเอนด์
- ผู้ใช้ของคุณยินดีที่จะลงชื่อเข้าใช้ Puter
ใช้ Gemini API อย่างเป็นทางการเมื่อ:
- คุณต้องการการเรียกใช้ฝั่งเซิร์ฟเวอร์ (cron, batch, webhooks)
- คุณต้องการการรันโค้ด, Search grounding, หรือ Gemini Pro ที่มีบริบทขนาดยาวเต็ม 2 ล้านโทเค็น
- คุณต้องการความสัมพันธ์ทางสัญญา (contractual relationship) กับ Google เพื่อการปฏิบัติตามข้อกำหนด
- คุณต้องการการปรับแต่งโมเดล (fine-tuning) ด้วยชุดข้อมูลของคุณเอง
- ผู้ใช้ของคุณไม่ยอมรับขั้นตอนการลงชื่อเข้าใช้ Puter
สำหรับคำแนะนำการใช้งาน Gemini 3 Flash แบบครบวงจร โปรดดูที่ วิธีใช้ Gemini 3 Flash Preview API.
การทดสอบการผสานรวมใน Apidog
การเรียกใช้ Puter เกิดขึ้นในเบราว์เซอร์ ดังนั้นคุณจึงไม่สามารถเขียนสคริปต์จาก test runner ฝั่งแบ็กเอนด์ได้ รูปแบบที่ใช้งานได้:
- สร้างหน้าเว็บแบบคงที่ขนาดเล็กพร้อมสคริปต์ Puter และพารามิเตอร์คิวรีสำหรับพร้อมต์
- ใช้ Apidog เพื่อตรวจสอบพื้นผิว Google Gemini API ต้นทาง (เมื่อคุณย้ายข้อมูลในที่สุด)
- เก็บทั้งสองสิ่งไว้ในสภาพแวดล้อมที่แยกจากกันในคอลเลกชัน Apidog เดียวกัน เพื่อให้คุณสามารถสลับได้ด้วยคลิกเดียว
ดาวน์โหลด Apidog และตั้งค่าสองสภาพแวดล้อม: puter-prototype (URL localhost ที่โฮสต์หน้า Puter ของคุณ) และ gemini-prod (https://generativelanguage.googleapis.com/v1) คอลเลกชันจะย้ายได้อย่างราบรื่นเมื่อคุณใช้งานจริง สำหรับรูปแบบการทดสอบ API ที่กว้างขึ้น โปรดดูที่ เครื่องมือทดสอบ API สำหรับวิศวกร QA.
เส้นทาง LLM ฟรีอื่นๆ ผ่าน Puter
โมเดลผู้ใช้เป็นผู้ชำระเงินแบบเดียวกันนี้ใช้งานได้กับ LLM หลักทุกตัว:
- รับ Claude API ฟรีไม่จำกัด (Anthropic Opus, Sonnet, Haiku)
- รับ GPT-5.5 API ฟรีไม่จำกัด (แค็ตตาล็อก OpenAI ทั้งหมด)
- วิธีใช้ Grok 4.3 ฟรี (xAI)
- รับ DeepSeek API ฟรีไม่จำกัด
สคริปต์ Puter ตัวเดียวสามารถจัดการได้ทั้งหมด เพียงแค่เปลี่ยนสตริง model คุณก็สามารถเปลี่ยนผู้ให้บริการได้แล้ว
คำถามที่พบบ่อย (FAQ)
นี่เป็นแบบไม่จำกัดจริงหรือ มีข้อจำกัดซ่อนอยู่หรือไม่?จากฝั่งนักพัฒนาใช่ เป็นแบบไม่จำกัด ผู้ใช้ปลายทางจะมียอดคงเหลือในบัญชี Puter ของตนเอง; บัญชีใหม่จะได้รับเครดิตเริ่มต้นและผู้ใช้สามารถเติมเงินได้หากต้องการใช้งานเพิ่มเติม
ฉันต้องมีบัญชี Google หรือโปรเจกต์ Google Cloud หรือไม่?ไม่ Puter จัดการความสัมพันธ์กับ Google คุณจะไม่เห็น Google API key เลย
ฉันสามารถใช้สิ่งนี้ในการผลิต (production) ได้หรือไม่?ได้ สำหรับแอปพลิเคชันที่ทำงานบนเบราว์เซอร์ Puter ใช้โครงสร้างพื้นฐานที่พร้อมสำหรับการผลิต คำถามที่ถูกต้องคือ ผู้ใช้ของคุณยอมรับขั้นตอนการลงชื่อเข้าใช้ Puter หรือไม่
Gemini ผ่าน Puter ทำงานเหมือนกับ API อย่างเป็นทางการหรือไม่?ผลลัพธ์ของโมเดลเหมือนกัน Puter เรียกใช้ API ของ Google ในนามของผู้ใช้ เวลาแฝง (latency) อาจสูงขึ้นเล็กน้อยเนื่องจากมีขั้นตอนเพิ่มขึ้น แต่พฤติกรรมของโมเดลไม่เปลี่ยนแปลง
แล้ว Gemini ที่มี context window ขนาดใหญ่ 2 ล้านโทเค็นล่ะ?Puter ยังไม่ได้เปิดเผยขีดจำกัด 2 ล้านโทเค็นเต็มรูปแบบในทุกรุ่นของโมเดลในปัจจุบัน สำหรับบริบทที่ยาวเป็นพิเศษ Google AI Studio API อย่างเป็นทางการคือทางเลือกที่ถูกต้อง กรณีการใช้งานส่วนใหญ่ยังคงต่ำกว่า 200K โทเค็น ซึ่ง Puter ก็เพียงพอแล้ว
ฉันสามารถใช้ Gemini ผ่าน Puter ใน Discord bot หรือบริการแบ็กเอนด์ได้หรือไม่?ไม่สะดวก Puter เน้นที่เบราว์เซอร์เป็นหลักและคาดการณ์ถึงเซสชันของผู้ใช้ บริการแบ็กเอนด์ควรใช้ Gemini API อย่างเป็นทางการโดยตรง
ฉันควรใช้โมเดลใดเป็นค่าเริ่มต้น?google/gemini-2.5-flash เป็นค่าเริ่มต้นที่เหมาะสมที่สุด เป็นการรวมกันอย่างลงตัวระหว่างต้นทุน ความเร็ว และคุณภาพสำหรับพร้อมต์ส่วนใหญ่ เปลี่ยนไปใช้ google/gemini-2.5-pro สำหรับงานการให้เหตุผลที่ซับซ้อน และ google/gemini-2.5-flash-lite สำหรับการจัดหมวดหมู่ปริมาณมาก
รองรับการสร้างภาพ (Imagen) หรือไม่?ปัจจุบัน Puter รองรับการสร้างภาพผ่าน gpt-image-2 และ DALL-E ของ OpenAI ไม่ใช่ Imagen ดู รับ GPT-5.5 API ฟรีไม่จำกัด สำหรับเส้นทางการสร้างภาพ
สรุป
Gemini ฟรีไม่จำกัดผ่าน Puter.js เป็นวิธีที่ง่ายที่สุดสำหรับแอปพลิเคชันที่ทำงานบนเบราว์เซอร์ที่ต้องการผลลัพธ์ multimodal คุณภาพระดับ Google โดยไม่ต้องตั้งค่า Google Cloud เพียงแค่ใส่สคริปต์, เลือก gemini-2.5-flash, เขียนพร้อมต์ ผู้ใช้ปลายทางจะเป็นผู้รับผิดชอบค่าใช้จ่าย; คุณสามารถเผยแพร่ได้โดยไม่ต้องใช้คีย์
สำหรับ Gemini ฝั่งเซิร์ฟเวอร์, การปรับแต่งโมเดล (fine-tuning), เครื่องมือรันโค้ด, หรือบริบท 2 ล้านโทเค็นเต็มรูปแบบ Google AI Studio API อย่างเป็นทางการยังคงเป็นคำตอบที่ถูกต้อง สำหรับต้นแบบ, โปรเจกต์แฮกกาธอน, แอปสาธารณะฟรี, และเว็บไซต์แบบคงที่ (static sites), Puter คือคำตอบ
สร้างคำขอเพียงครั้งเดียวใน Apidog, เปรียบเทียบประสิทธิภาพ Puter กับ API อย่างเป็นทางการ, และเลือกเส้นทางที่เหมาะสมกับความต้องการของคุณ
