Harga API Gemini 3.0 Tahun 2026: Berapa Biayanya?

Pengembang dan perusahaan semakin mengandalkan model multimodal canggih seperti seri Gemini Google untuk aplikasi produksi. Saat Google meluncurkan model Pratinjau Gemini 3 Pro pada November 2026, memahami biaya API-nya menjadi penting untuk penganggaran dan penskalaan. Versi pratinjau ini, yang dapat diakses melalui Google AI Studio dan Vertex AI, memperkenalkan penalaran yang disempurnakan, jendela konteks yang lebih panjang, dan penggunaan alat bawaan.

💡

Terlebih lagi, pelacakan biaya yang akurat memastikan integrasi yang efisien. Untuk menyederhanakan pengujian dan debug panggilan API Gemini 3, unduh Apidog secara gratis – ia menyediakan validasi permintaan yang canggih, server tiruan, dan estimasi biaya real-time yang disesuaikan untuk API AI.

tombol

Google mengenakan harga API Gemini 3 berdasarkan token pay-as-you-go murni untuk akses pratinjau. Tidak ada kuota harian gratis di luar penggunaan AI Studio yang terbatas, namun model pratinjau sering kali dimulai dengan penagihan yang dikurangi atau dibebaskan selama peluncuran awal. Artikel ini merinci tarif yang dikonfirmasi dari spanduk pratinjau resmi per 18 November 2026.

Kemampuan Utama Pratinjau Gemini 3 Pro

Google melengkapi Gemini 3 Pro dengan peningkatan terobosan dibandingkan Gemini 2.5. Ia unggul dalam penalaran konteks panjang (hingga 1–2 juta token diharapkan dalam rilis stabil), penggunaan alat bawaan, keluaran terstruktur, dan pemahaman multimodal. Pengembang menggunakannya untuk alur kerja agen yang kompleks, analisis video, pembuatan kode dengan umpan balik eksekusi, dan *prompting* *chain-of-thought* tingkat lanjut.

Model ini mendukung respons streaming, panggilan fungsi, dan instruksi sistem secara bawaan. Selain itu, ia menangani input video secara langsung, menjadikannya ideal untuk aplikasi di bidang pendidikan, pembuatan konten, dan penelitian ilmiah.

Fase pratinjau memungkinkan akses awal di Google AI Studio dengan lencana “Baru”. Beban kerja produksi beralih ke API Gemini 3 penuh setelah Google menstabilkan model, biasanya dalam beberapa minggu setelah peluncuran pratinjau.

Rincian Harga API Gemini 3 Pro Resmi (November 2026)

Google mendasarkan harga Pratinjau Gemini 3 Pro murni pada token yang dikonsumsi, dengan titik henti panjang konteks yang jelas:

Panjang Konteks	Input (per 1 Juta token)	Output (per 1 Juta token)
≤ 200.000 token	$2.00	$12.00
> 200.000 token	$4.00	$18.00

Tarif ini berlaku untuk model gemini-3-pro-preview di Gemini API dan AI Studio saat penagihan aktif. Google menghitung token input dari prompt (teks + konten multimodal) dan token output dari teks yang dihasilkan atau data terstruktur. Input video dan audio dikonversi ke jumlah token yang setara berdasarkan durasi dan resolusi.

Google belum menawarkan diskon batch atau diskon caching konteks untuk pratinjau. Namun, grounding dengan Google Search tetap gratis hingga batas harian di AI Studio. Fine-tuning tetap tidak tersedia dalam pratinjau; fitur ini akan hadir dengan rilis stabil.

Penggunaan Google AI Studio tetap gratis untuk eksperimen yang wajar, namun panggilan API bervolume tinggi atau terskrip akan secara otomatis memicu penagihan pay-as-you-go setelah Anda menautkan proyek Cloud.

Cara Kerja Penghitungan Token di Gemini 3 Pro

Google menghitung token menggunakan tokenizer yang sama dengan model Gemini sebelumnya. Teks rata-rata ~4 karakter per token, sedangkan gambar dan video menggunakan ekuivalen tetap (misalnya, video 720p berdurasi 1 menit ≈ 10–15K token, bervariasi berdasarkan kompleksitas konten).

Pengembang memanggil endpoint countTokens sebelumnya untuk melihat pratinjau biaya yang tepat:

from google.generativeai import GenerativeModel, count_tokens

model = GenerativeModel("gemini-3-pro-preview")
tokens = count_tokens(model, contents=["Your prompt here..."])
print(tokens.total_tokens)

Langkah ini mencegah kejutan, terutama dengan prompt konteks panjang yang melebihi 200 ribu token, di mana tarifnya berlipat ganda.

Perhitungan Biaya Nyata untuk API Gemini 3 Pro

Insinyur memperkirakan biaya secara akurat dengan contoh-contoh ini:

Kueri chat standar (5K input + 1K output, <200K konteks)
→ Input: 5K × $2 / 1 Juta = $0,00001
→ Output: 1K × $12 / 1 Juta = $0,000012
→ Total ≈ $0,000022 (kurang dari satu sen)

Analisis dokumen (150K input + 8K output)
→ Input: $0,30
→ Output: $0,096
→ Total ≈ $0,40 per permintaan

Tugas penelitian konteks panjang (350K input + 15K output)
→ Input: 350K × $4 / 1 Juta = $1,40
→ Output: 15K × $18 / 1 Juta = $0,27
→ Total ≈ $1,67 per permintaan

Aplikasi dengan lalu lintas sedang yang memproses 100 permintaan konteks panjang setiap hari akan dikenakan biaya sekitar $50–$70 setiap bulan. Alur kerja agen bervolume tinggi dengan video dapat dengan mudah mencapai ribuan dolar tanpa optimasi.

Akses Gratis dan Batasan Pratinjau

Google menyediakan akses gratis ke Pratinjau Gemini 3 Pro di AI Studio untuk penggunaan interaktif. Batas kecepatan berlaku (biasanya 10–50 RPM tergantung wilayah dan usia akun), tetapi tidak ada biaya yang dikenakan untuk sesi manual.

Akses API yang terskrip memerlukan proyek Google Cloud. Proyek baru dimulai dengan tingkat gratis dengan batas yang besar untuk model pratinjau, tetapi penggunaan berat akan dengan cepat beralih ke penagihan berbayar. Google sering membebaskan biaya sepenuhnya selama minggu-minggu pertama pratinjau — banyak pengembang melaporkan tagihan $0 bahkan setelah ribuan permintaan pada November 2026.

Setelah model menjadi stabil (diperkirakan Desember 2026–Q1 2026), harga penuh berlaku tanpa pengecualian.

Mengintegrasikan dan Memantau API Gemini 3 dengan Apidog

Apidog menyederhanakan pekerjaan dengan API Gemini 3. Impor spesifikasi OpenAPI resmi dari Google, tetapkan kunci API Anda sebagai variabel lingkungan, dan kirim permintaan secara langsung.

Manfaat utama meliputi:

Tampilan jumlah token real-time dalam respons
Estimasi biaya otomatis per permintaan (skrip kustom atau plugin)
Berbagi koleksi untuk kolaborasi tim
Server tiruan untuk menguji logika tanpa menghabiskan token
Log terperinci untuk mengidentifikasi prompt yang mahal

Buat permintaan baru ke https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent, tempel muatan JSON Anda, dan tekan kirim. Apidog mengurai metadata penggunaan (token input/output) secara instan, membantu Anda tetap sesuai anggaran.

Strategi Optimasi Biaya untuk Gemini 3 Pro

Insinyur mengurangi biaya secara signifikan dengan teknik-teknik yang terbukti ini:

Pertahankan prompt di bawah 200 ribu token bila memungkinkan → hindari lonjakan tarif 2x
Gunakan keluaran terstruktur (mode JSON) → respons lebih pendek, dapat diprediksi
Terapkan caching prompt (bila tersedia setelah pratinjau) → gunakan kembali instruksi sistem
Pra-proses video → ekstrak *keyframe* atau transkripsi audio secara terpisah
Pantau melalui peringatan Penagihan Google Cloud dan dasbor Apidog
Mulai dengan konteks yang lebih pendek → tingkatkan hanya bila diperlukan

Menggabungkan praktik-praktik ini secara rutin memangkas biaya hingga 40–70%.

Perbandingan dengan Model Unggulan Lain (November 2026)

Model	Input ≤200K	Output ≤200K	Input >200K	Output >200K	Catatan
Gemini 3 Pro Preview	$2.00	$12.00	$4.00	$18.00	Penalaran tertinggi
Gemini 2.5 Pro	$1.25	$10.00	$2.50	$15.00	Model unggulan sebelumnya
Claude 3.5 Sonnet	$3.00	$15.00	Sama	Sama	Tidak ada premium konteks panjang

Gemini 3 Pro mengenakan harga premium untuk penalaran unggulnya dan konteks 1 Juta+ yang akan datang, namun keluaran tetap kompetitif dengan model unggulan lainnya.

Prospek Harga di Masa Depan

Google biasanya mengurangi tarif 20–50% ketika model pratinjau menjadi stabil dan efisiensi meningkat. Perkirakan harga stabil Gemini 3 Pro pada awal 2026 akan berkisar $1,50/$10 (≤200K) dan $3/$15 (>200K), dengan caching dan diskon batch diperkenalkan secara bersamaan.

Kesimpulan

API Gemini 3 Pro diluncurkan dengan harga bertingkat konteks yang transparan: $2,00/$12,00 per juta token hingga 200 ribu konteks dan $4,00/$18,00 di atasnya. Akses pratinjau pada dasarnya tetap gratis untuk pengujian di AI Studio, sementara penggunaan produksi mengikuti sistem pay-as-you-go.

Manfaatkan alat seperti Apidog untuk memantau setiap token dan mengoptimalkan prompt sejak hari pertama. Pendekatan ini memungkinkan pengembang memanfaatkan model paling cerdas Google tanpa kejutan anggaran. Saat model stabil, harapkan penyempurnaan yang membuatnya semakin hemat biaya untuk beban kerja yang sangat bergantung pada penalaran dan multimodal.

tombol