Google merilis Gemini 3.1 Pro sebagai modelnya yang paling mumpuni hingga saat ini. Para insinyur mengakses model pratinjau ini melalui Gemini API untuk menangani penalaran kompleks, pemahaman multimodal, dan alur kerja agensi yang kurang efektif ditangani oleh generasi sebelumnya. Pengembang yang mengintegrasikan Gemini 3.1 Pro API mendapatkan kinerja canggih di seluruh 1 juta token masukan dan 64k token keluaran sambil menjaga latensi rendah untuk sistem produksi.
Anda memulai perjalanan Anda dengan pengenal model resmi gemini-3.1-pro-preview. Google menghosting endpoint ini di https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent. API ini mendukung panggilan REST dan SDK resmi yang mengabstraksi kompleksitas sambil mempertahankan kendali penuh.
Memahami Gemini 3.1 Pro: Kemampuan yang Mendefinisikan Ulang Integrasi AI
Gemini 3.1 Pro melampaui model-model sebelumnya melalui pemikiran dinamis asli, penggunaan alat yang ditingkatkan, dan fusi multimodal yang unggul. Model ini memproses teks, gambar resolusi tinggi, bingkai video, PDF hingga 1000 halaman, dan kode secara bersamaan dalam jendela konteks yang sama. Oleh karena itu, para insinyur mencapai penalaran multi-langkah yang lebih koheren tanpa rekayasa prompt yang ekstensif.

Selain itu, model ini memperkenalkan konfigurasi thinking_level. Anda mengatur parameter ini ke high untuk tugas analisis mendalam atau low untuk skenario throughput tinggi. Tingkat high default secara otomatis mengaktifkan mekanisme chain-of-thought internal, sehingga Anda menghabiskan lebih sedikit waktu untuk membuat instruksi penalaran eksplisit.
Selain itu, Gemini 3.1 Pro mendukung tanda tangan pemikiran (thought signatures). String terenkripsi ini mempertahankan status percakapan di seluruh giliran ketika Anda menggabungkan panggilan fungsi dengan pembuatan atau pengeditan gambar. Anda menyertakan nilai thoughtSignature yang tepat dalam permintaan berikutnya; jika tidak, API akan mengembalikan kesalahan 400. Mekanisme ini menjamin perilaku deterministik dalam loop agen yang berjalan lama.
Batas pengetahuan berada pada Januari 2025. Akibatnya, Anda memasangkan model ini dengan alat Google Search bawaan untuk mengambil informasi terbaru. Kombinasi ini menghasilkan respons yang berdasar dan terkini tanpa pipeline generasi-augmented-retrieval manual.
Prasyarat untuk Bekerja dengan Gemini 3.1 Pro API
Anda menyiapkan lingkungan Anda sebelum menulis kode apa pun. Pertama, Anda memerlukan akun Google dengan akses ke Google AI Studio. Kedua, Anda memverifikasi bahwa penagihan diaktifkan pada proyek Google Cloud terkait karena model pratinjau memberlakukan batasan tarif yang ketat pada tingkatan gratis. Ketiga, Anda menginstal Python 3.9+ atau Node.js 18+ tergantung pada tumpukan pilihan Anda.

Selain itu, Anda mengalokasikan penyimpanan untuk payload multimodal besar. File video dan gambar resolusi tinggi dengan cepat mengonsumsi token, jadi Anda memantau penggunaan melalui dasbor AI Studio. Para profesional yang merencanakan ke depan menghindari kesalahan kuota yang tidak terduga selama pengembangan.
Mendapatkan dan Mengamankan Kunci API Gemini Anda
Anda membuka Google AI Studio dan mengeklik “Get API key.” Konsol membuat kunci baru yang terikat dengan proyek Anda. Anda menyalin kunci tersebut segera karena UI hanya menampilkannya sekali.

Anda menyimpan kunci sebagai variabel lingkungan GEMINI_API_KEY. Praktik ini menjaga kredensial dari kode sumber dan memungkinkan inisialisasi SDK yang mulus di seluruh sistem operasi. Di Linux atau macOS Anda menjalankan:
export GEMINI_API_KEY=your_actual_key_here
Di Windows Anda menggunakan:
set GEMINI_API_KEY=your_actual_key_here
Untuk penerapan produksi, Anda merotasi kunci secara teratur dan membatasinya melalui kebijakan IAM Google Cloud. Anda tidak boleh mengekspos kunci di JavaScript sisi klien karena penyerang dapat menyalahgunakannya untuk konsumsi token yang tidak sah.
Menginstal SDK Google GenAI Resmi
SDK mengabstraksi detail HTTP dan menyediakan antarmuka yang aman tipe. Anda menginstal versi terbaru dengan perintah berikut:
Python
pip install -U google-genai
Node.js
npm install @google/genai
Paket ini secara otomatis membaca GEMINI_API_KEY dari lingkungan. Jika Anda lebih suka konfigurasi eksplisit, Anda meneruskan kunci saat instansiasi klien. Fleksibilitas ini mendukung pengembangan lokal dan lingkungan terkonteinerisasi di mana variabel lingkungan tetap tidak berubah.
Melakukan Panggilan Pertama Anda ke Gemini 3.1 Pro API
Anda menginisialisasi klien dan mengirim prompt teks sederhana untuk memverifikasi konektivitas.
Contoh Python
from google import genai
from google.genai import types
client = genai.Client()
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Jelaskan perbedaan antara Gemini 3.1 Pro dan model-model sebelumnya dalam istilah teknis.",
config=types.GenerateContentConfig(
thinking_level="high"
)
)
print(response.text)
Objek respons berisi teks yang dihasilkan ditambah metadata penggunaan. Anda memeriksa response.usage_metadata untuk melacak konsumsi token demi optimasi biaya.
Setara cURL (Berguna untuk Pengujian Apidog)
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.1-pro-preview:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-X POST \
-d '{
"contents": [{
"parts": [{"text": "Jelaskan perbedaan antara Gemini 3.1 Pro dan model-model sebelumnya dalam istilah teknis."}]
}],
"generationConfig": {
"thinking_level": "high"
}
}'
Anda menempelkan permintaan ini langsung ke Apidog. Platform ini mengurai JSON, menyoroti sintaksis, dan memungkinkan Anda beralih antar lingkungan dengan kunci yang berbeda. Akibatnya, Anda memvalidasi header dan payload sebelum melakukan perubahan kode.
Contoh JavaScript
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({});
async function main() {
const response = await ai.models.generateContent({
model: "gemini-3.1-pro-preview",
contents: "Jelaskan perbedaan antara Gemini 3.1 Pro dan model-model sebelumnya dalam istilah teknis.",
config: { thinking_level: "high" }
});
console.log(response.text);
}
main();
Anda menjalankan cuplikan ini dan mengamati jawaban yang koheren dan presisi secara teknis. Model ini mengacu pada peningkatan arsitektur seperti kontrol resolusi media yang ditingkatkan dan orkestrasi alat asli.
Menjelajahi Endpoint Inti dan Anatomi Permintaan
Gemini API berpusat pada tiga metode utama: generateContent, streamGenerateContent, dan countTokens. Anda menggunakan generateContent untuk respons sinkron dan streamGenerateContent saat Anda segera menampilkan keluaran parsial kepada pengguna.
Isi permintaan mengikuti struktur yang konsisten:
contents: Array pesan berbasis peran (pengguna/model/fungsi)tools: Array deklarasi fungsi Google Search, code_execution, atau kustomgenerationConfig: Mengontrol thinking_level, temperature (pertahankan di default 1.0), maxOutputTokens, dll.safetySettings: Penggantian opsional untuk filter konten
Anda mendefinisikan fungsi kustom dengan skema JSON. Model kemudian mengeluarkan bagian functionCall yang Anda jalankan secara lokal dan kembalikan sebagai bagian functionResponse. Loop tertutup ini menggerakkan agen otonom yang berinteraksi dengan API atau database eksternal.
Apidog unggul di sini karena Anda mengimpor spesifikasi OpenAPI atau secara manual membangun skemanya. Alat ini memvalidasi deklarasi fungsi Anda terhadap format yang diharapkan model dan bahkan mensimulasikan respons selama waktu desain.
Mengonfigurasi Parameter Generasi untuk Keandalan Produksi
Anda menyempurnakan perilaku melalui objek generationConfig. Google merekomendasikan untuk membiarkan temperature pada 1.0 karena nilai yang lebih rendah menurunkan kualitas penalaran pada model seri Gemini 3. Sebagai gantinya, Anda menyesuaikan thinking_level untuk menyeimbangkan latensi dan kedalaman.
Parameter kunci meliputi:
thinking_level: "low" | "high" (default high)maxOutputTokens: maksimum 64kstopSequences: Array string yang menghentikan generasiresponseMimeType: "application/json" untuk keluaran terstrukturresponseJsonSchema: Skema Pydantic atau Zod untuk parsing yang aman tipe
Anda menggabungkan keluaran terstruktur dengan alat untuk mengekstrak JSON yang bersih dari pencarian web atau eksekusi kode. Misalnya, Anda meminta daftar opsi penerbangan, menerima objek yang diurai, dan langsung memasukkannya ke logika backend Anda tanpa regex atau penguraian manual.
Memanfaatkan Kemampuan Multimodal
Gemini 3.1 Pro memproses gambar, video, dan dokumen secara native. Anda menyertakan data file baik sebagai base64 inline atau melalui File API untuk unggahan yang lebih besar.
Contoh Multimodal Python
import base64
from google import genai
from google.genai import types
client = genai.Client()
# Baca gambar
with open("diagram.png", "rb") as f:
image_bytes = f.read()
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents=[
types.Content(
role="user",
parts=[
types.Part(text="Analisis diagram arsitektur sistem ini dan sarankan optimasi."),
types.Part(
inline_data=types.Blob(
mime_type="image/png",
data=image_bytes
)
)
]
)
],
config=types.GenerateContentConfig(
media_resolution="media_resolution_high" # v1alpha endpoint if needed
)
)
print(response.text)
Anda mengunggah video dengan mengekstrak bingkai atau mengirim klip pendek secara langsung. Model ini memahami urutan temporal dan menjawab pertanyaan tentang tindakan di seluruh bingkai. Oleh karena itu, para profesional membangun alat analisis video tanpa pipeline visi komputer terpisah.
Apidog menyederhanakan pengujian ini. Anda menyeret dan melepaskan file gambar atau PDF ke dalam badan permintaan, memilih tipe MIME yang benar, dan mengirim permintaan secara instan. Platform ini menampilkan pratinjau yang dirender dan memungkinkan Anda mengulang prompt tanpa menulis ulang kode.
Menerapkan Panggilan Fungsi dan Penggunaan Alat
Anda mendeklarasikan alat dalam konfigurasi untuk mengaktifkan perilaku agensi. Alat bawaan yang didukung meliputi google_search, code_execution, url_context, dan fungsi kustom.
Contoh Alat Terstruktur
from pydantic import BaseModel, Field
from typing import List
class WeatherData(BaseModel):
city: str = Field(description="Nama kota")
temperature: float
condition: str
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Ambil cuaca terkini untuk Tokyo dan kembalikan data terstruktur.",
config={
"tools": [{"google_search": {}}],
"response_mime_type": "application/json",
"response_json_schema": WeatherData.model_json_schema()
}
)
data = WeatherData.model_validate_json(response.text)
print(data)
```Model memanggil alat pencarian secara internal, memproses hasil, dan mengembalikan JSON yang divalidasi. Anda merangkai beberapa alat di seluruh giliran untuk membuat agen canggih yang memesan perjalanan, menganalisis laporan, atau mengendalikan sistem eksternal.
Tanda tangan pemikiran (thought signatures) memastikan kesinambungan. Anda menyalin tanda tangan dari setiap respons model dan menyertakannya dalam pesan pengguna berikutnya saat panggilan fungsi terjadi. Persyaratan ini mencegah penyimpangan konteks dalam percakapan yang panjang.
Menguji dan Melakukan Debugging secara Efisien dengan Apidog
Anda membuka Apidog dan membuat proyek baru bernama “Integrasi Gemini 3.1 Pro.” Anda menambahkan variabel global untuk kunci API Anda dan mengatur URL dasar ke endpoint bahasa generatif.

Selanjutnya, Anda membuat koleksi untuk berbagai skenario: hanya teks, multimodal, panggilan fungsi, dan streaming. Apidog secara otomatis menghasilkan cuplikan cURL, Python, dan JavaScript dari setiap permintaan yang disimpan. Oleh karena itu, Anda mempertahankan set dokumentasi hidup yang dapat direferensikan oleh seluruh tim.
Ketika Anda menerima kesalahan, Apidog menyoroti header atau bidang payload yang tepat yang menyebabkan masalah. Anda membandingkan respons secara berdampingan di seluruh versi model atau tingkat pemikiran. Platform ini juga mencatat riwayat permintaan dengan stempel waktu dan penggunaan token, yang membantu Anda membangun model biaya yang akurat sebelum penerapan produksi.
Para profesional yang mengintegrasikan Apidog melaporkan siklus iterasi 40-60% lebih cepat karena mereka menghilangkan peralihan konteks antara editor kode dan jendela terminal. Tingkat gratis mendukung proyek lokal tak terbatas dan volume permintaan yang cukup untuk sebagian besar alur kerja pengembangan.
Teknik Lanjutan: Streaming, Cache Konteks, dan Pemrosesan Batch
Anda mengaktifkan streaming untuk antarmuka pengguna yang responsif.
Streaming Python
response = client.models.generate_content(
model="gemini-3.1-pro-preview",
contents="Tulis spesifikasi teknis terperinci untuk microservice baru.",
stream=True
)
for chunk in response:
print(chunk.text, end="", flush=True)
SDK menghasilkan respons parsial sehingga Anda menampilkan teks saat tiba.
Anda juga menggunakan caching konteks untuk dokumen panjang yang berulang. Anda mengunggah PDF 500 halaman sekali, menyimpan konteks yang diproses, dan merujuk ID cache dalam panggilan berikutnya. Teknik ini mengurangi biaya token dan latensi secara dramatis untuk aplikasi RAG perusahaan.
Dukungan Batch API memungkinkan Anda memproses beberapa prompt dalam satu permintaan. Oleh karena itu, Anda menganalisis ribuan tiket dukungan semalaman sambil tetap berada dalam batas tarif.
Studi Kasus Dunia Nyata dan Contoh Kode Siap Produksi
Kasus Penggunaan 1: Penganalisis Dokumen CerdasAnda membangun sistem yang memasukkan kontrak, mengekstrak klausa, dan menandai risiko. Kemampuan multimodal mengidentifikasi tabel dan tanda tangan dalam PDF yang dipindai.
Kasus Penggunaan 2: Asisten Pengkodean OtonomAnda menggabungkan alat code_execution dengan Gemini 3.1 Pro untuk melakukan debug, refaktor, dan menguji kode dalam satu loop. Model ini menulis Python, mengeksekusinya, memeriksa gambar atau log keluaran, dan mengulang sampai tugas selesai.
Kasus Penggunaan 3: Agen Dukungan Pelanggan MultimodalPengguna mengunggah tangkapan layar kesalahan. Agen menganalisis gambar, mencari basis pengetahuan, dan mengembalikan perbaikan langkah demi langkah dengan tangkapan layar beranotasi yang dihasilkan melalui model gambar.
Setiap kasus penggunaan mendapat manfaat dari prototipe Apidog. Anda merancang struktur payload yang tepat, menguji kasus-kasus ekstrem dengan file sampel, dan mengekspor kode yang siap digunakan.
Praktik Terbaik untuk Pengendalian Biaya dan Kinerja
Anda memantau penggunaan token setelah setiap panggilan. Anda mengatur maxOutputTokens secara konservatif dan menggunakan endpoint countTokens sebelum operasi yang mahal. Anda lebih memilih gemini-3.1-pro-preview hanya untuk tugas kompleks dan mengarahkan kueri yang lebih sederhana ke varian yang lebih ringan jika tersedia.
Anda menerapkan exponential backoff untuk kesalahan batasan tarif. Anda menyimpan respons yang sering secara lokal atau melalui Redis. Anda selalu memvalidasi keluaran terstruktur dengan Pydantic atau pustaka yang setara untuk menangkap penyimpangan skema sejak dini.
Keamanan tetaplah yang terpenting. Anda membersihkan masukan pengguna sebelum mengirimkannya ke model. Anda menerapkan pengaturan keamanan konten yang sesuai untuk domain Anda. Anda hanya mencatat metrik penggunaan yang dianonimkan.
Pemecahan Masalah Umum
Error 429 (Resource Exhausted) muncul ketika Anda melebihi kuota. Anda memeriksa dasbor penggunaan AI Studio dan meminta batas yang lebih tinggi melalui dukungan Google Cloud.
Error 400 (Invalid Argument) sering kali berasal dari tanda tangan pemikiran yang hilang dalam panggilan fungsi multi-giliran. Anda memverifikasi bahwa setiap tanda tangan respons model kembali dalam permintaan berikutnya.
Permintaan multimodal gagal ketika ukuran file melebihi batas. Anda mengompres gambar atau menggunakan File API untuk penyimpanan persisten.
Apidog membantu mengisolasi masalah ini karena Anda dapat memutar ulang permintaan yang gagal dengan parameter yang dimodifikasi secara instan. Validator bawaan menandai masalah skema bahkan sebelum Anda menjalankan kode.
Membandingkan Gemini API dengan Vertex AI
Gemini Developer API (ai.google.dev) menawarkan orientasi tercepat dan akses tingkatan gratis. Vertex AI menyediakan fitur perusahaan seperti VPC Service Controls, private endpoints, dan integrasi IAM yang lebih ketat. Anda bermigrasi dari satu ke yang lain hanya dengan mengubah inisialisasi klien dan endpoint model. Format permintaan tetap identik.
Sebagian besar tim memulai dengan Developer API selama pembuatan prototipe dan beralih ke Vertex AI sebelum produksi. Transisi ini membutuhkan perubahan kode yang minimal.
Kesimpulan
Anda sekarang memiliki peta jalan teknis lengkap untuk Gemini 3.1 Pro API. Anda memahami kemampuan model, alur autentikasi, integrasi SDK, konfigurasi lanjutan, input multimodal, orkestrasi alat, dan praktik terbaik produksi.
Kombinasi kekuatan penalaran Gemini 3.1 Pro dan lingkungan pengujian visual Apidog memungkinkan Anda menghadirkan fitur AI canggih lebih cepat dari sebelumnya. Anda memulai dari kecil dengan prompt teks, meluas ke agen multimodal, dan menskalakan dengan percaya diri menggunakan strategi pemantauan dan caching.
Bidang ini berkembang pesat. Anda mem-bookmark dokumentasi resmi di ai.google.dev dan mengunjungi kembali proyek Apidog secara teratur untuk memasukkan fitur-fitur baru.
Anda memiliki semua yang diperlukan untuk membangun aplikasi cerdas generasi berikutnya. Mulailah mengode hari ini, uji secara menyeluruh dengan Apidog, dan dorong batas-batas apa yang dapat dicapai AI.
Mulailah membangun dengan Gemini 3.1 Pro API sekarang. Unduh Apidog secara gratis dan ubah cara Anda mengembangkan serta menguji integrasi AI.
tombol
