Pengembang dan perusahaan semakin mengandalkan model multimodal canggih seperti seri Gemini Google untuk aplikasi produksi. Saat Google meluncurkan model Pratinjau Gemini 3 Pro pada November 2026, memahami biaya API-nya menjadi penting untuk penganggaran dan penskalaan. Versi pratinjau ini, yang dapat diakses melalui Google AI Studio dan Vertex AI, memperkenalkan penalaran yang disempurnakan, jendela konteks yang lebih panjang, dan penggunaan alat bawaan.
Google mengenakan harga API Gemini 3 berdasarkan token pay-as-you-go murni untuk akses pratinjau. Tidak ada kuota harian gratis di luar penggunaan AI Studio yang terbatas, namun model pratinjau sering kali dimulai dengan penagihan yang dikurangi atau dibebaskan selama peluncuran awal. Artikel ini merinci tarif yang dikonfirmasi dari spanduk pratinjau resmi per 18 November 2026.
Kemampuan Utama Pratinjau Gemini 3 Pro
Google melengkapi Gemini 3 Pro dengan peningkatan terobosan dibandingkan Gemini 2.5. Ia unggul dalam penalaran konteks panjang (hingga 1ā2 juta token diharapkan dalam rilis stabil), penggunaan alat bawaan, keluaran terstruktur, dan pemahaman multimodal. Pengembang menggunakannya untuk alur kerja agen yang kompleks, analisis video, pembuatan kode dengan umpan balik eksekusi, dan *prompting* *chain-of-thought* tingkat lanjut.

Model ini mendukung respons streaming, panggilan fungsi, dan instruksi sistem secara bawaan. Selain itu, ia menangani input video secara langsung, menjadikannya ideal untuk aplikasi di bidang pendidikan, pembuatan konten, dan penelitian ilmiah.
Fase pratinjau memungkinkan akses awal di Google AI Studio dengan lencana āBaruā. Beban kerja produksi beralih ke API Gemini 3 penuh setelah Google menstabilkan model, biasanya dalam beberapa minggu setelah peluncuran pratinjau.
Rincian Harga API Gemini 3 Pro Resmi (November 2026)
Google mendasarkan harga Pratinjau Gemini 3 Pro murni pada token yang dikonsumsi, dengan titik henti panjang konteks yang jelas:
| Panjang Konteks | Input (per 1 Juta token) | Output (per 1 Juta token) |
|---|---|---|
| ⤠200.000 token | $2.00 | $12.00 |
| > 200.000 token | $4.00 | $18.00 |
Tarif ini berlaku untuk model gemini-3-pro-preview di Gemini API dan AI Studio saat penagihan aktif. Google menghitung token input dari prompt (teks + konten multimodal) dan token output dari teks yang dihasilkan atau data terstruktur. Input video dan audio dikonversi ke jumlah token yang setara berdasarkan durasi dan resolusi.
Google belum menawarkan diskon batch atau diskon caching konteks untuk pratinjau. Namun, grounding dengan Google Search tetap gratis hingga batas harian di AI Studio. Fine-tuning tetap tidak tersedia dalam pratinjau; fitur ini akan hadir dengan rilis stabil.
Penggunaan Google AI Studio tetap gratis untuk eksperimen yang wajar, namun panggilan API bervolume tinggi atau terskrip akan secara otomatis memicu penagihan pay-as-you-go setelah Anda menautkan proyek Cloud.
Cara Kerja Penghitungan Token di Gemini 3 Pro
Google menghitung token menggunakan tokenizer yang sama dengan model Gemini sebelumnya. Teks rata-rata ~4 karakter per token, sedangkan gambar dan video menggunakan ekuivalen tetap (misalnya, video 720p berdurasi 1 menit ā 10ā15K token, bervariasi berdasarkan kompleksitas konten).
Pengembang memanggil endpoint countTokens sebelumnya untuk melihat pratinjau biaya yang tepat:
from google.generativeai import GenerativeModel, count_tokens
model = GenerativeModel("gemini-3-pro-preview")
tokens = count_tokens(model, contents=["Your prompt here..."])
print(tokens.total_tokens)
Langkah ini mencegah kejutan, terutama dengan prompt konteks panjang yang melebihi 200 ribu token, di mana tarifnya berlipat ganda.
Perhitungan Biaya Nyata untuk API Gemini 3 Pro
Insinyur memperkirakan biaya secara akurat dengan contoh-contoh ini:
Kueri chat standar (5K input + 1K output, <200K konteks)
ā Input: 5K Ć $2 / 1 Juta = $0,00001
ā Output: 1K Ć $12 / 1 Juta = $0,000012
ā Total ā $0,000022 (kurang dari satu sen)
Analisis dokumen (150K input + 8K output)
ā Input: $0,30
ā Output: $0,096
ā Total ā $0,40 per permintaan
Tugas penelitian konteks panjang (350K input + 15K output)
ā Input: 350K Ć $4 / 1 Juta = $1,40
ā Output: 15K Ć $18 / 1 Juta = $0,27
ā Total ā $1,67 per permintaan
Aplikasi dengan lalu lintas sedang yang memproses 100 permintaan konteks panjang setiap hari akan dikenakan biaya sekitar $50ā$70 setiap bulan. Alur kerja agen bervolume tinggi dengan video dapat dengan mudah mencapai ribuan dolar tanpa optimasi.
Akses Gratis dan Batasan Pratinjau
Google menyediakan akses gratis ke Pratinjau Gemini 3 Pro di AI Studio untuk penggunaan interaktif. Batas kecepatan berlaku (biasanya 10ā50 RPM tergantung wilayah dan usia akun), tetapi tidak ada biaya yang dikenakan untuk sesi manual.
Akses API yang terskrip memerlukan proyek Google Cloud. Proyek baru dimulai dengan tingkat gratis dengan batas yang besar untuk model pratinjau, tetapi penggunaan berat akan dengan cepat beralih ke penagihan berbayar. Google sering membebaskan biaya sepenuhnya selama minggu-minggu pertama pratinjau ā banyak pengembang melaporkan tagihan $0 bahkan setelah ribuan permintaan pada November 2026.
Setelah model menjadi stabil (diperkirakan Desember 2026āQ1 2026), harga penuh berlaku tanpa pengecualian.
Mengintegrasikan dan Memantau API Gemini 3 dengan Apidog
Apidog menyederhanakan pekerjaan dengan API Gemini 3. Impor spesifikasi OpenAPI resmi dari Google, tetapkan kunci API Anda sebagai variabel lingkungan, dan kirim permintaan secara langsung.
Manfaat utama meliputi:
- Tampilan jumlah token real-time dalam respons
- Estimasi biaya otomatis per permintaan (skrip kustom atau plugin)
- Berbagi koleksi untuk kolaborasi tim
- Server tiruan untuk menguji logika tanpa menghabiskan token
- Log terperinci untuk mengidentifikasi prompt yang mahal
Buat permintaan baru ke https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent, tempel muatan JSON Anda, dan tekan kirim. Apidog mengurai metadata penggunaan (token input/output) secara instan, membantu Anda tetap sesuai anggaran.
Strategi Optimasi Biaya untuk Gemini 3 Pro
Insinyur mengurangi biaya secara signifikan dengan teknik-teknik yang terbukti ini:
- Pertahankan prompt di bawah 200 ribu token bila memungkinkan ā hindari lonjakan tarif 2x
- Gunakan keluaran terstruktur (mode JSON) ā respons lebih pendek, dapat diprediksi
- Terapkan caching prompt (bila tersedia setelah pratinjau) ā gunakan kembali instruksi sistem
- Pra-proses video ā ekstrak *keyframe* atau transkripsi audio secara terpisah
- Pantau melalui peringatan Penagihan Google Cloud dan dasbor Apidog
- Mulai dengan konteks yang lebih pendek ā tingkatkan hanya bila diperlukan
Menggabungkan praktik-praktik ini secara rutin memangkas biaya hingga 40ā70%.
Perbandingan dengan Model Unggulan Lain (November 2026)
| Model | Input ā¤200K | Output ā¤200K | Input >200K | Output >200K | Catatan |
|---|---|---|---|---|---|
| Gemini 3 Pro Preview | $2.00 | $12.00 | $4.00 | $18.00 | Penalaran tertinggi |
| Gemini 2.5 Pro | $1.25 | $10.00 | $2.50 | $15.00 | Model unggulan sebelumnya |
| Claude 3.5 Sonnet | $3.00 | $15.00 | Sama | Sama | Tidak ada premium konteks panjang |
Gemini 3 Pro mengenakan harga premium untuk penalaran unggulnya dan konteks 1 Juta+ yang akan datang, namun keluaran tetap kompetitif dengan model unggulan lainnya.
Prospek Harga di Masa Depan
Google biasanya mengurangi tarif 20ā50% ketika model pratinjau menjadi stabil dan efisiensi meningkat. Perkirakan harga stabil Gemini 3 Pro pada awal 2026 akan berkisar $1,50/$10 (ā¤200K) dan $3/$15 (>200K), dengan caching dan diskon batch diperkenalkan secara bersamaan.
Kesimpulan
API Gemini 3 Pro diluncurkan dengan harga bertingkat konteks yang transparan: $2,00/$12,00 per juta token hingga 200 ribu konteks dan $4,00/$18,00 di atasnya. Akses pratinjau pada dasarnya tetap gratis untuk pengujian di AI Studio, sementara penggunaan produksi mengikuti sistem pay-as-you-go.
Manfaatkan alat seperti Apidog untuk memantau setiap token dan mengoptimalkan prompt sejak hari pertama. Pendekatan ini memungkinkan pengembang memanfaatkan model paling cerdas Google tanpa kejutan anggaran. Saat model stabil, harapkan penyempurnaan yang membuatnya semakin hemat biaya untuk beban kerja yang sangat bergantung pada penalaran dan multimodal.
