Dapatkan Akses API Gemini Tak Terbatas Gratis

Ashley Innocent

Ashley Innocent

9 May 2026

Dapatkan Akses API Gemini Tak Terbatas Gratis

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

Keluarga Gemini Google adalah lini model terdepan yang paling hemat biaya untuk beban kerja bervolume tinggi, dengan Gemini 2.5 Pro seharga $1.25 / $10 per juta token dan varian Flash yang jauh lebih murah. Untuk aplikasi publik gratis, proyek sampingan, atau pembuatan hackathon, tarif tersebut dapat bertambah dengan cepat setelah beberapa ribu pengguna mencapai titik akhir Anda. Puter.js membalik model tersebut: ia mengekspos seluruh jajaran Gemini (2.5 Pro, 2.5 Flash, 2.0 Flash, pratinjau 3 Flash, ditambah keluarga Gemma 2/3/4 yang terbuka) tanpa kunci API Google dan menagih pengguna akhir, bukan Anda. Bagi pengembang, permukaannya gratis dan tidak terbatas.

tombol

TL;DR

Bagaimana “gratis tanpa batas” bekerja

Puter.js membalik model penagihan LLM. Alih-alih Anda memegang kunci Google AI Studio dan menanggung setiap biaya token, pengguna akhir Anda masuk ke Puter (akun gratis) dan panggilan tersebut akan dikenakan biaya pada saldo mereka. Akun Puter baru mendapatkan kredit awal; pengguna mengisi ulang jika mereka ingin lebih.

Bagi pengembang, konsekuensinya jelas:

Kelemahannya: ini adalah yang utama di peramban. Tugas cron backend tidak dapat menggunakan Puter tanpa sesi pengguna yang masuk.

Langkah 1: Instalasi

Satu tag CDN, tanpa langkah build:

<script src="https://js.puter.com/v2/"></script>

Itu adalah seluruh instalasi. Atau untuk aplikasi yang dibundel:

npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';

Langkah 2: Pilih model

Jajaran Gemini di Puter, dengan alat yang tepat untuk setiap bentuk:

ID Model Kapan digunakan
google/gemini-2.5-pro Penalaran mendalam; analisis kompleks dan tugas konteks panjang
google/gemini-2.5-flash Driver harian standar; keseimbangan biaya/kualitas yang kuat
google/gemini-2.5-flash-lite Varian Flash termurah; klasifikasi volume tinggi
google/gemini-2.0-flash Baseline stabil; perilaku yang dipahami dengan baik
google/gemini-3-flash-preview Pratinjau terbaru; kecepatan mutakhir
google/gemma-3-27b-it Gemma terbuka; disetel instruksi, bagus untuk baseline fine-tuning
google/gemma-4-31b-it Gemma terbuka terbesar; lebih dekat ke kualitas Gemini tertutup

Untuk sebagian besar aplikasi, gunakan standar gemini-2.5-flash dan hanya gunakan Pro untuk prompt yang sulit. Varian Lite satu tingkat lebih cepat dan cukup baik untuk penandaan, klasifikasi, dan tanya jawab sederhana.

Langkah 3: Buat Gemini berbicara

Panggilan minimum yang layak:

<!DOCTYPE html>
<html>
<body>
  <script src="https://js.puter.com/v2/"></script>
  <script>
    puter.ai.chat(
      "Explain machine learning in three sentences",
      { model: 'google/gemini-2.5-flash' }
    ).then(response => {
      puter.print(response);
    });
  </script>
</body>
</html>

Buka di peramban. Puter menangani panggilan, pengguna masuk (atau membuat akun Puter gratis pada penggunaan pertama), dan respons dicetak ke halaman. Tidak ada kunci API, tidak ada variabel lingkungan, tidak ada server.

Langkah 4: Streaming respons

Untuk UI obrolan dan jawaban panjang, streaming adalah standar yang tepat:

const response = await puter.ai.chat(
  "Explain photosynthesis in detail",
  {
    model: 'google/gemini-2.5-flash',
    stream: true,
  }
);

for await (const part of response) {
  if (part?.text) {
    outputDiv.innerHTML += part.text;
  }
}

Setiap part.text adalah bagian dari respons. Lampirkan ke UI Anda; pengguna melihat teks muncul kata demi kata.

Langkah 5: Vision (input gambar)

Fitur terkuat Gemini adalah dasar multimodal. Teruskan URL gambar sebagai argumen kedua:

puter.ai.chat(
  "What do you see in this image? Describe colors, objects, and mood.",
  "https://assets.puter.site/doge.jpeg",
  { model: 'google/gemini-2.5-flash' }
).then(response => {
  puter.print(response);
});

Kasus penggunaan: pembuatan teks alt, QA visual, analisis tangkapan layar, OCR, alat aksesibilitas, penandaan gambar produk. Kualitas vision Gemini secara konsisten kuat pada gambar alami dan diagram; pada tangkapan layar teks padat, GPT-5.x terkadang mengunggulinya.

Langkah 6: Sesuaikan suhu

Teruskan parameter standar dalam objek opsi:

const response = await puter.ai.chat(
  'Write a creative short story about a robot chef',
  {
    model: 'google/gemini-2.5-flash',
    temperature: 0.2,
  }
);

Suhu lebih rendah (0.0–0.3) untuk output faktual atau terstruktur, lebih tinggi (0.7–1.0) untuk penulisan kreatif. Standar Gemini Flash berfungsi dengan baik pada suhu 0.7 untuk sebagian besar kasus penggunaan obrolan.

Langkah 7: Percakapan multi-giliran

Teruskan larik pesan:

const messages = [
  { role: 'user', content: 'I am building a Next.js app with Postgres.' },
  { role: 'assistant', content: 'Got it. What do you need help with?' },
  { role: 'user', content: 'How should I structure migrations?' },
];

const response = await puter.ai.chat(messages, {
  model: 'google/gemini-2.5-pro',
});

console.log(response);

Masukkan setiap pesan pengguna dan setiap respons asisten ke dalam larik sebelum panggilan berikutnya. Gemini membaca seluruh transkrip dan tetap konsisten di setiap giliran.

Membandingkan Gemini dengan model lain pada prompt yang sama

Puter mengekspos setiap LLM utama melalui satu antarmuka. Cara tercepat untuk menemukan model yang tepat untuk kasus penggunaan Anda adalah dengan membuat skrip prompt yang sama di berbagai penyedia:

const models = [
  'google/gemini-2.5-flash',
  'claude-sonnet-4-6',
  'gpt-5.5',
  'x-ai/grok-4.3',
];
const prompt = "Refactor this React component to use hooks: ...";

for (const model of models) {
  const start = performance.now();
  const response = await puter.ai.chat(prompt, { model });
  const elapsed = performance.now() - start;
  console.log(`${model}: ${elapsed.toFixed(0)}ms`);
  console.log(response);
  console.log('---');
}

Jalankan sekali dan Anda akan melihat pola trade-off. Gemini Flash biasanya merupakan pemenang latensi, Sonnet adalah pemenang kualitas dalam pengkodean, GPT-5.5 adalah pemenang kualitas dalam penulisan panjang, Grok 4.3 menang dalam biaya. Pilih model yang sesuai dengan bentuk Anda.

Apa yang Anda dapatkan dan apa yang tidak Anda dapatkan

Pembagian yang jujur:

Anda mendapatkan:

Anda mungkin tidak mendapatkan (tergantung versi Puter):

Untuk alur agentik mendalam yang membutuhkan eksekusi kode dan pengarahan, API Google AI Studio resmi memberi Anda lebih banyak. Untuk obrolan tipikal, Tanya Jawab, pembuatan konten, dan tugas visual, Puter sudah cukup.

Kapan menggunakan Puter vs API Gemini resmi

Pembagiannya:

Gunakan Puter ketika:

Gunakan API Gemini resmi ketika:

Untuk panduan Gemini 3 Flash mandiri, lihat Cara menggunakan API Pratinjau Gemini 3 Flash.

Menguji integrasi di Apidog

Panggilan Puter terjadi di peramban, sehingga Anda tidak dapat membuat skripnya dari test runner backend. Pola yang berhasil:

  1. Buat halaman statis kecil dengan skrip Puter dan parameter kueri untuk prompt.
  2. Gunakan Apidog untuk memvalidasi permukaan API Google Gemini upstream (ketika Anda akhirnya bermigrasi).
  3. Simpan keduanya sebagai lingkungan terpisah dalam koleksi Apidog yang sama sehingga Anda dapat beralih dengan satu klik.

Unduh Apidog dan siapkan dua lingkungan: puter-prototype (URL localhost yang menghosting halaman Puter Anda) dan gemini-prod (https://generativelanguage.googleapis.com/v1). Koleksi dapat dipindahkan dengan mudah ketika Anda lulus. Untuk pola pengujian API yang lebih luas, lihat Alat pengujian API untuk insinyur QA.

Jalur LLM gratis lainnya melalui Puter

Model bayar-pengguna yang sama berfungsi untuk setiap LLM utama:

Satu skrip Puter menangani semuanya. Ganti string model dan Anda beralih penyedia.

FAQ

Apakah ini benar-benar tidak terbatas, atau ada batas tersembunyi?Tidak terbatas dari sisi pengembang, ya. Pengguna akhir memiliki saldo apa pun yang ada di akun Puter mereka; akun baru mendapatkan kredit awal dan pengguna mengisi ulang jika mereka ingin lebih.

Apakah saya memerlukan akun Google atau proyek Google Cloud?Tidak. Puter menangani hubungan Google. Anda tidak pernah melihat kunci API Google.

Bisakah saya menggunakannya dalam produksi?Ya untuk aplikasi berbasis peramban. Puter menjalankan infrastruktur produksi. Pertanyaan yang tepat adalah apakah pengguna Anda mentolerir langkah masuk Puter.

Apakah Gemini melalui Puter berkinerja identik dengan API resmi?Output model sama; Puter memanggil API Google atas nama pengguna. Latensi mungkin sedikit lebih tinggi karena hop tambahan, tetapi perilaku model tidak berubah.

Bagaimana dengan jendela konteks Gemini yang besar 2M-token?Puter tidak mengekspos batas penuh 2M pada setiap varian model saat ini. Untuk konteks yang sangat panjang, API Google AI Studio resmi adalah jalur yang tepat. Sebagian besar kasus penggunaan tetap jauh di bawah 200K token, di mana Puter baik-baik saja.

Bisakah saya menggunakan Gemini melalui Puter di bot Discord atau layanan backend?Tidak secara bersih. Puter adalah yang utama di peramban dan mengasumsikan sesi pengguna. Layanan backend harus menggunakan API Gemini resmi secara langsung.

Model apa yang harus saya gunakan sebagai default?google/gemini-2.5-flash. Ini adalah keseimbangan yang tepat antara biaya, kecepatan, dan kualitas untuk sebagian besar prompt. Pindah ke google/gemini-2.5-pro untuk tugas penalaran yang sulit, dan google/gemini-2.5-flash-lite untuk klasifikasi volume tinggi.

Apakah pembuatan gambar didukung (Imagen)?Puter mengekspos pembuatan gambar melalui gpt-image-2 OpenAI dan varian DALL-E hari ini, bukan Imagen. Lihat Dapatkan API GPT-5.5 gratis tanpa batas untuk jalur pembuatan gambar.

Kesimpulan

Gemini gratis tanpa batas melalui Puter.js adalah jalur terbersih untuk aplikasi berbasis peramban apa pun yang menginginkan output multimodal berkualitas Google tanpa pengaturan Google Cloud. Masukkan skripnya, pilih gemini-2.5-flash, tulis promptnya. Pengguna akhir menanggung penggunaan; Anda meluncurkan tanpa kunci.

Untuk Gemini sisi server, fine-tuning, alat eksekusi kode, atau konteks penuh 2M-token, API Google AI Studio resmi masih merupakan jawaban yang tepat. Untuk prototipe, pembuatan hackathon, aplikasi publik gratis, dan situs statis, Puter adalah jawabannya.

Buat permintaan sekali di Apidog, bandingkan Puter dengan API resmi, dan pilih jalur yang sesuai dengan bentuk Anda.

tombol

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.