Keluarga Gemini Google adalah lini model terdepan yang paling hemat biaya untuk beban kerja bervolume tinggi, dengan Gemini 2.5 Pro seharga $1.25 / $10 per juta token dan varian Flash yang jauh lebih murah. Untuk aplikasi publik gratis, proyek sampingan, atau pembuatan hackathon, tarif tersebut dapat bertambah dengan cepat setelah beberapa ribu pengguna mencapai titik akhir Anda. Puter.js membalik model tersebut: ia mengekspos seluruh jajaran Gemini (2.5 Pro, 2.5 Flash, 2.0 Flash, pratinjau 3 Flash, ditambah keluarga Gemma 2/3/4 yang terbuka) tanpa kunci API Google dan menagih pengguna akhir, bukan Anda. Bagi pengembang, permukaannya gratis dan tidak terbatas.
TL;DR
- Puter.js memberikan pengembang akses gratis dan tidak terbatas ke katalog lengkap Gemini dan Gemma tanpa kunci API Google, tanpa proyek Google Cloud, tanpa server.
- Gemini yang didukung: 2.5 Pro, 2.5 Flash, 2.5 Flash Lite, 2.0 Flash, 2.0 Flash Lite, 3 Flash Preview, ditambah pratinjau lama.
- Gemma yang didukung: Gemma 2, 3, 4 dalam berbagai ukuran (4B, 12B, 27B, 31B, 26B-A4B).
- Satu tag
<script>, satu panggilan fungsi, Anda sudah berbicara dengan Gemini. - Streaming, input visual, kontrol suhu semuanya berfungsi di peramban.
- Pengguna akhir menanggung penggunaan mereka dari akun Puter; Anda membayar nol, selamanya.
- Gunakan Apidog untuk membandingkan Puter dengan API Gemini resmi untuk perencanaan migrasi.
Bagaimana “gratis tanpa batas” bekerja
Puter.js membalik model penagihan LLM. Alih-alih Anda memegang kunci Google AI Studio dan menanggung setiap biaya token, pengguna akhir Anda masuk ke Puter (akun gratis) dan panggilan tersebut akan dikenakan biaya pada saldo mereka. Akun Puter baru mendapatkan kredit awal; pengguna mengisi ulang jika mereka ingin lebih.
Bagi pengembang, konsekuensinya jelas:
- Tidak ada proyek Google Cloud, tidak ada kunci AI Studio. Tidak ada negosiasi kuota, tidak ada rotasi kunci, tidak ada hubungan penagihan.
- Tidak ada batas penggunaan di pihak Anda. "Batas" Anda berskala linier dengan basis pengguna Anda.
- Tidak ada penguncian vendor ke penagihan Google. Puter menangani panggilan upstream.
Kelemahannya: ini adalah yang utama di peramban. Tugas cron backend tidak dapat menggunakan Puter tanpa sesi pengguna yang masuk.
Langkah 1: Instalasi
Satu tag CDN, tanpa langkah build:
<script src="https://js.puter.com/v2/"></script>
Itu adalah seluruh instalasi. Atau untuk aplikasi yang dibundel:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
Langkah 2: Pilih model
Jajaran Gemini di Puter, dengan alat yang tepat untuk setiap bentuk:
| ID Model | Kapan digunakan |
|---|---|
google/gemini-2.5-pro |
Penalaran mendalam; analisis kompleks dan tugas konteks panjang |
google/gemini-2.5-flash |
Driver harian standar; keseimbangan biaya/kualitas yang kuat |
google/gemini-2.5-flash-lite |
Varian Flash termurah; klasifikasi volume tinggi |
google/gemini-2.0-flash |
Baseline stabil; perilaku yang dipahami dengan baik |
google/gemini-3-flash-preview |
Pratinjau terbaru; kecepatan mutakhir |
google/gemma-3-27b-it |
Gemma terbuka; disetel instruksi, bagus untuk baseline fine-tuning |
google/gemma-4-31b-it |
Gemma terbuka terbesar; lebih dekat ke kualitas Gemini tertutup |
Untuk sebagian besar aplikasi, gunakan standar gemini-2.5-flash dan hanya gunakan Pro untuk prompt yang sulit. Varian Lite satu tingkat lebih cepat dan cukup baik untuk penandaan, klasifikasi, dan tanya jawab sederhana.
Langkah 3: Buat Gemini berbicara
Panggilan minimum yang layak:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain machine learning in three sentences",
{ model: 'google/gemini-2.5-flash' }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
Buka di peramban. Puter menangani panggilan, pengguna masuk (atau membuat akun Puter gratis pada penggunaan pertama), dan respons dicetak ke halaman. Tidak ada kunci API, tidak ada variabel lingkungan, tidak ada server.
Langkah 4: Streaming respons
Untuk UI obrolan dan jawaban panjang, streaming adalah standar yang tepat:
const response = await puter.ai.chat(
"Explain photosynthesis in detail",
{
model: 'google/gemini-2.5-flash',
stream: true,
}
);
for await (const part of response) {
if (part?.text) {
outputDiv.innerHTML += part.text;
}
}
Setiap part.text adalah bagian dari respons. Lampirkan ke UI Anda; pengguna melihat teks muncul kata demi kata.
Langkah 5: Vision (input gambar)
Fitur terkuat Gemini adalah dasar multimodal. Teruskan URL gambar sebagai argumen kedua:
puter.ai.chat(
"What do you see in this image? Describe colors, objects, and mood.",
"https://assets.puter.site/doge.jpeg",
{ model: 'google/gemini-2.5-flash' }
).then(response => {
puter.print(response);
});
Kasus penggunaan: pembuatan teks alt, QA visual, analisis tangkapan layar, OCR, alat aksesibilitas, penandaan gambar produk. Kualitas vision Gemini secara konsisten kuat pada gambar alami dan diagram; pada tangkapan layar teks padat, GPT-5.x terkadang mengunggulinya.
Langkah 6: Sesuaikan suhu
Teruskan parameter standar dalam objek opsi:
const response = await puter.ai.chat(
'Write a creative short story about a robot chef',
{
model: 'google/gemini-2.5-flash',
temperature: 0.2,
}
);
Suhu lebih rendah (0.0–0.3) untuk output faktual atau terstruktur, lebih tinggi (0.7–1.0) untuk penulisan kreatif. Standar Gemini Flash berfungsi dengan baik pada suhu 0.7 untuk sebagian besar kasus penggunaan obrolan.
Langkah 7: Percakapan multi-giliran
Teruskan larik pesan:
const messages = [
{ role: 'user', content: 'I am building a Next.js app with Postgres.' },
{ role: 'assistant', content: 'Got it. What do you need help with?' },
{ role: 'user', content: 'How should I structure migrations?' },
];
const response = await puter.ai.chat(messages, {
model: 'google/gemini-2.5-pro',
});
console.log(response);
Masukkan setiap pesan pengguna dan setiap respons asisten ke dalam larik sebelum panggilan berikutnya. Gemini membaca seluruh transkrip dan tetap konsisten di setiap giliran.
Membandingkan Gemini dengan model lain pada prompt yang sama
Puter mengekspos setiap LLM utama melalui satu antarmuka. Cara tercepat untuk menemukan model yang tepat untuk kasus penggunaan Anda adalah dengan membuat skrip prompt yang sama di berbagai penyedia:
const models = [
'google/gemini-2.5-flash',
'claude-sonnet-4-6',
'gpt-5.5',
'x-ai/grok-4.3',
];
const prompt = "Refactor this React component to use hooks: ...";
for (const model of models) {
const start = performance.now();
const response = await puter.ai.chat(prompt, { model });
const elapsed = performance.now() - start;
console.log(`${model}: ${elapsed.toFixed(0)}ms`);
console.log(response);
console.log('---');
}
Jalankan sekali dan Anda akan melihat pola trade-off. Gemini Flash biasanya merupakan pemenang latensi, Sonnet adalah pemenang kualitas dalam pengkodean, GPT-5.5 adalah pemenang kualitas dalam penulisan panjang, Grok 4.3 menang dalam biaya. Pilih model yang sesuai dengan bentuk Anda.
Apa yang Anda dapatkan dan apa yang tidak Anda dapatkan
Pembagian yang jujur:
Anda mendapatkan:
- Katalog lengkap Gemini 2.5/2.0/3 Flash ditambah 2.5 Pro
- Keluarga Gemma terbuka (2/3/4) untuk alur kerja open-weight
- Percakapan multi-giliran
- Streaming respons
- Input visual (URL gambar)
- Suhu, max_tokens, prompt sistem
- Skala siap produksi
Anda mungkin tidak mendapatkan (tergantung versi Puter):
- Panggilan fungsi native pada Gemini (periksa dokumen Puter terbaru)
- Alat eksekusi kode
- Pengarahan Google Search
- Konteks panjang hingga batas penuh 2M-token Gemini
- Penggunaan sisi server tanpa konteks peramban
- Visibilitas batas laju langsung dari Google
Untuk alur agentik mendalam yang membutuhkan eksekusi kode dan pengarahan, API Google AI Studio resmi memberi Anda lebih banyak. Untuk obrolan tipikal, Tanya Jawab, pembuatan konten, dan tugas visual, Puter sudah cukup.
Kapan menggunakan Puter vs API Gemini resmi
Pembagiannya:
Gunakan Puter ketika:
- Anda meluncurkan aplikasi publik gratis dan tidak ingin terpapar penagihan.
- Anda membuat prototipe dan tidak ingin menyiapkan proyek Google Cloud.
- Anda ingin Gemini di situs statis, proyek hackathon, atau ekstensi peramban tanpa backend.
- Pengguna Anda senang masuk ke Puter.
Gunakan API Gemini resmi ketika:
- Anda membutuhkan panggilan sisi server (cron, batch, webhooks).
- Anda membutuhkan eksekusi kode, pengarahan Search, atau Gemini Pro konteks panjang pada batas penuh 2M.
- Anda membutuhkan hubungan kontraktual dengan Google untuk kepatuhan.
- Anda membutuhkan fine-tuning pada dataset Anda sendiri.
- Pengguna Anda tidak akan mentolerir langkah masuk Puter.
Untuk panduan Gemini 3 Flash mandiri, lihat Cara menggunakan API Pratinjau Gemini 3 Flash.
Menguji integrasi di Apidog
Panggilan Puter terjadi di peramban, sehingga Anda tidak dapat membuat skripnya dari test runner backend. Pola yang berhasil:
- Buat halaman statis kecil dengan skrip Puter dan parameter kueri untuk prompt.
- Gunakan Apidog untuk memvalidasi permukaan API Google Gemini upstream (ketika Anda akhirnya bermigrasi).
- Simpan keduanya sebagai lingkungan terpisah dalam koleksi Apidog yang sama sehingga Anda dapat beralih dengan satu klik.
Unduh Apidog dan siapkan dua lingkungan: puter-prototype (URL localhost yang menghosting halaman Puter Anda) dan gemini-prod (https://generativelanguage.googleapis.com/v1). Koleksi dapat dipindahkan dengan mudah ketika Anda lulus. Untuk pola pengujian API yang lebih luas, lihat Alat pengujian API untuk insinyur QA.
Jalur LLM gratis lainnya melalui Puter
Model bayar-pengguna yang sama berfungsi untuk setiap LLM utama:
- Dapatkan API Claude gratis tanpa batas (Anthropic Opus, Sonnet, Haiku)
- Dapatkan API GPT-5.5 gratis tanpa batas (katalog lengkap OpenAI)
- Cara menggunakan Grok 4.3 secara gratis (xAI)
- Dapatkan API DeepSeek gratis tanpa batas
Satu skrip Puter menangani semuanya. Ganti string model dan Anda beralih penyedia.
FAQ
Apakah ini benar-benar tidak terbatas, atau ada batas tersembunyi?Tidak terbatas dari sisi pengembang, ya. Pengguna akhir memiliki saldo apa pun yang ada di akun Puter mereka; akun baru mendapatkan kredit awal dan pengguna mengisi ulang jika mereka ingin lebih.
Apakah saya memerlukan akun Google atau proyek Google Cloud?Tidak. Puter menangani hubungan Google. Anda tidak pernah melihat kunci API Google.
Bisakah saya menggunakannya dalam produksi?Ya untuk aplikasi berbasis peramban. Puter menjalankan infrastruktur produksi. Pertanyaan yang tepat adalah apakah pengguna Anda mentolerir langkah masuk Puter.
Apakah Gemini melalui Puter berkinerja identik dengan API resmi?Output model sama; Puter memanggil API Google atas nama pengguna. Latensi mungkin sedikit lebih tinggi karena hop tambahan, tetapi perilaku model tidak berubah.
Bagaimana dengan jendela konteks Gemini yang besar 2M-token?Puter tidak mengekspos batas penuh 2M pada setiap varian model saat ini. Untuk konteks yang sangat panjang, API Google AI Studio resmi adalah jalur yang tepat. Sebagian besar kasus penggunaan tetap jauh di bawah 200K token, di mana Puter baik-baik saja.
Bisakah saya menggunakan Gemini melalui Puter di bot Discord atau layanan backend?Tidak secara bersih. Puter adalah yang utama di peramban dan mengasumsikan sesi pengguna. Layanan backend harus menggunakan API Gemini resmi secara langsung.
Model apa yang harus saya gunakan sebagai default?google/gemini-2.5-flash. Ini adalah keseimbangan yang tepat antara biaya, kecepatan, dan kualitas untuk sebagian besar prompt. Pindah ke google/gemini-2.5-pro untuk tugas penalaran yang sulit, dan google/gemini-2.5-flash-lite untuk klasifikasi volume tinggi.
Apakah pembuatan gambar didukung (Imagen)?Puter mengekspos pembuatan gambar melalui gpt-image-2 OpenAI dan varian DALL-E hari ini, bukan Imagen. Lihat Dapatkan API GPT-5.5 gratis tanpa batas untuk jalur pembuatan gambar.
Kesimpulan
Gemini gratis tanpa batas melalui Puter.js adalah jalur terbersih untuk aplikasi berbasis peramban apa pun yang menginginkan output multimodal berkualitas Google tanpa pengaturan Google Cloud. Masukkan skripnya, pilih gemini-2.5-flash, tulis promptnya. Pengguna akhir menanggung penggunaan; Anda meluncurkan tanpa kunci.
Untuk Gemini sisi server, fine-tuning, alat eksekusi kode, atau konteks penuh 2M-token, API Google AI Studio resmi masih merupakan jawaban yang tepat. Untuk prototipe, pembuatan hackathon, aplikasi publik gratis, dan situs statis, Puter adalah jawabannya.
Buat permintaan sekali di Apidog, bandingkan Puter dengan API resmi, dan pilih jalur yang sesuai dengan bentuk Anda.
