Cara Menggunakan Google Gemini 3 API: Panduan Pemula untuk Keajaiban AI

Jika Anda memperhatikan perkembangan AI pada tahun 2025, Anda mungkin pernah mendengar banyak sekali desas-desus seputar Google Gemini 3, model AI multimodal generasi berikutnya yang dirancang untuk bersaing dengan (dan terkadang mengungguli) GPT-5. Baik Anda seorang insinyur perangkat lunak, pendiri startup, penghobi AI, atau hanya seseorang yang ingin tahu tentang kemampuan Gemini 3, mempelajari cara bekerja dengan API Google Gemini 3 membuka pintu untuk membangun aplikasi yang jauh lebih cerdas dan dinamis.

Namun, jujur saja; dokumentasi Google bisa sedikit rumit jika Anda baru memulai. Jadi dalam panduan ini, kami akan menjelaskan semuanya dengan cara yang jelas, ramah, dan mudah dipahami oleh pemula.

💡

Jika Anda menginginkan cara yang mudah, visual, dan tanpa kode untuk menguji *endpoint* API REST Gemini 3, gunakan Apidog. Anda bisa mengunduh Apidog secara gratis, dan ini memungkinkan Anda merancang, *debug*, dan menguji panggilan API tanpa menulis seluruh skrip. Karena panduan ini menyertakan contoh API REST, Anda akan merasa Apidog sangat berguna saat bereksperimen.

tombol

Sekarang, mari kita buka kekuatan model AI tercanggih Google!

Apa Itu Google Gemini 3?

Google Gemini 3 adalah model terbaru dalam keluarga AI multimodal Google. Berbeda dengan model sebelumnya, Gemini 3 dioptimalkan untuk:

penalaran dan pemecahan masalah
masukan/keluaran multimodal (teks, gambar, audio, *embedding* video)
penggunaan alat dan alur kerja agenik
inferensi cepat dengan *endpoint* latensi rendah
perpindahan model dinamis tergantung pada tugas Anda

Tapi sorotan terbesarnya adalah ini:

Gemini 3 memperkenalkan dua "mode berpikir" utama:

Parameter thinking_level mengontrol kedalaman maksimal proses penalaran internal model sebelum menghasilkan respons. Gemini 3 memperlakukan level-level ini sebagai tunjangan relatif untuk berpikir daripada jaminan token yang ketat. Jika thinking_level tidak ditentukan, Gemini 3 Pro akan secara *default* ke high.

Berpikir Tinggi/Dinamis: Memaksimalkan kedalaman penalaran. Model mungkin membutuhkan waktu yang jauh lebih lama untuk mencapai token pertama, tetapi keluarannya akan lebih beralasan dengan cermat.
Berpikir Rendah: Meminimalkan latensi dan biaya. Terbaik untuk mengikuti instruksi sederhana, *chat*, atau aplikasi *throughput* tinggi.

Banyak pemula yang belum tahu, tetapi memilih mode yang benar secara drastis meningkatkan kualitas *output* *dan* membantu Anda mengontrol biaya.

Kita akan membahas cara memilih mode menggunakan API sebentar lagi.

Mengapa Menggunakan API Gemini 3 daripada Alat UI?

Tentu, Anda bisa menggunakan Gemini di Google AI Studio. Namun jika Anda ingin:

membangun aplikasi
mengotomatiskan tugas
mengintegrasikan model ke dalam alur kerja
membuat *chatbot*
memproses data
melatih agen
menjalankan tugas multimodal

Anda akan membutuhkan API Gemini 3.

Panduan ini berfokus pada API REST karena:

lebih mudah untuk pemula
tidak diperlukan *library* klien
Anda dapat mengujinya dengan cepat di Apidog atau Postman
ia berfungsi di lingkungan *backend* apa pun

Bagaimana API Gemini 3 Bekerja (Ikhtisar Sederhana)

Meskipun Gemini memiliki kemampuan canggih, API-nya sendiri cukup sederhana.

Anda mengirim permintaan POST ke…

<https://generativelanguage.googleapis.com/v1beta/models/{MODEL_ID}:generateContent?key=YOUR_API_KEY>

Anda menyertakan JSON seperti:

*prompt* teks
daftar pesan (opsional)
pengaturan model
pengaturan keamanan

Anda menerima…

teks *output* model
struktur penalaran (untuk berpikir Tinggi/Dinamis)
kutipan
metadata
objek multimodal (jika berlaku)

Setelah Anda memahami struktur ini, segalanya menjadi lebih mudah.

Memulai: Langkah Pertama Anda dengan API Gemini

Langkah 1: Dapatkan Kunci API Anda

Anggap kunci API Anda sebagai kata sandi khusus yang memberi tahu Google, "Ya, saya diizinkan menggunakan Gemini." Berikut cara mendapatkannya:

Buka Google AI Studio
Masuk dengan akun Google Anda
Klik "Buat Kunci API" di bilah samping kiri
Beri nama kunci Anda dan buat
Salin dan simpan kunci ini di tempat yang aman! Anda tidak akan bisa melihatnya lagi.

Penting: Jangan pernah membagikan kunci API Anda atau mengunggahnya ke repositori kode publik. Perlakukan seperti kata sandi Anda.

Langkah 2: Pilih Pendekatan Anda

Anda dapat berinteraksi dengan Gemini dalam dua cara utama:

API REST: Pendekatan universal. Bekerja dengan bahasa pemrograman apa pun yang dapat membuat permintaan HTTP. Kami akan fokus pada metode ini.
SDK Resmi: Google menyediakan *library* yang nyaman untuk Python, Node.js, dan bahasa lain yang menangani detail HTTP untuk Anda.

Karena kita berfokus pada dasar-dasarnya, kita akan menggunakan pendekatan API REST, yang berfungsi di mana saja dan membantu Anda memahami apa yang terjadi di balik layar.

Memahami Mode Berpikir Gemini

Salah satu fitur paling kuat Gemini adalah kemampuannya untuk beroperasi dalam "mode berpikir" yang berbeda. Ini bukan hanya pemasaran—secara fundamental mengubah cara model memproses permintaan Anda.

Berpikir Rendah (Sang Pemburu Kecepatan)

Kapan menggunakannya: Untuk tugas-tugas sederhana, respons cepat, dan saat Anda mengoptimalkan kecepatan dan biaya.

Kecepatan: Respons sangat cepat
Biaya: Lebih terjangkau
Kasus Penggunaan: Tanya Jawab sederhana, klasifikasi teks, ringkasan dasar, terjemahan langsung

Misalnya:

gemini-3-flash
gemini-3-mini

Bayangkan mode Berpikir Rendah seperti percakapan singkat dengan teman yang berpengetahuan luas yang memberi Anda jawaban instan.

Berpikir Tinggi/Dinamis (Analis yang Penuh Perhatian)

Kapan menggunakannya: Untuk penalaran yang kompleks, masalah multi-langkah, dan tugas yang membutuhkan analisis mendalam.

Kecepatan: Lebih lambat (ia "berpikir" lebih banyak sebelum merespons)
Biaya: Lebih mahal
Kasus Penggunaan: Masalah matematika kompleks, penalaran logis, *debugging* kode, penulisan kreatif, perencanaan strategis

Berpikir Tinggi/Dinamis seperti berkonsultasi dengan seorang ahli yang meluangkan waktu untuk mempertimbangkan semua sudut pandang sebelum memberikan jawaban yang beralasan.

Misalnya:

gemini-3-pro
gemini-3-pro-thinking

Model-model ini menawarkan penalaran yang lebih mendalam, jendela perhatian yang lebih panjang, dan kemampuan perencanaan yang lebih baik.

Keindahannya adalah Anda dapat memilih kedua model: Berpikir Tinggi/Dinamis dan Berpikir Rendah tergantung pada kebutuhan spesifik Anda. Untuk sebagian besar aplikasi sederhana, Berpikir Rendah sangat cocok. Ketika Anda membutuhkan penalaran yang lebih mendalam, beralihlah ke Berpikir Tinggi.

Sebagai aturan umum:

Jenis Tugas	Mode Model
Penelitian	Berpikir Tinggi/Dinamis
Matematika/Logika	Berpikir Tinggi/Dinamis
Generasi Kode	Berpikir Tinggi/Dinamis
Chat Pelanggan	Berpikir Rendah
Generasi Teks Dasar	Berpikir Rendah
Asisten UI	Berpikir Rendah
Aplikasi Waktu Nyata	Berpikir Rendah

Kami akan menunjukkan cara memilih setiap model di API REST.

Buat Panggilan API REST Gemini 3 Pertama Anda

Mari kita mulai dengan contoh sesederhana mungkin.

Endpoint

POST <https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro:generateContent?key=YOUR_API_KEY>

Contoh Badan Permintaan (JSON)

{
  "contents": [
    { "role": "user",
      "parts": [{ "text": "Jelaskan bagaimana pesawat terbang." }]
    }
  ]
}

Contoh Perintah Curl

curl -X POST \\
  -H "Content-Type: application/json" \\
  -d '{
    "contents": [
      {
        "role": "user",
        "parts": [{ "text": "Jelaskan bagaimana pesawat terbang." }]
      }
    ]
  }' \\
"<https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro:generateContent?key=YOUR_API_KEY>"

Menggunakan Mode Berpikir Tinggi/Dinamis

Untuk mengaktifkan mode penalaran, Anda harus menggunakan model yang mendukungnya seperti gemini-3-pro-thinking.

Contoh API REST

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Temukan kondisi balapan dalam cuplikan C++ multi-thread ini: [kode di sini]"}]
    }]
  }'

Saat menggunakan mode Berpikir Tinggi/Dinamis, Anda akan sering menerima:

struktur *chain-of-thought* (tersembunyi kecuali diminta)
jawaban yang lebih koheren
waktu respons yang lebih lambat
biaya inferensi yang lebih mahal

Saya merekomendasikan hanya menggunakan mode ini ketika benar-benar penting seperti penalaran jangka panjang atau perencanaan kode.

Menggunakan Mode Berpikir Rendah

Model Berpikir Rendah dioptimalkan untuk kecepatan dan sempurna untuk:

*autocomplete*
pesan singkat
respons UI
asisten kecil
fitur sampingan *chatbot*

Contoh API REST Menggunakan “Flash”

curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3-pro-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [{"text": "Bagaimana AI bekerja?"}]
    }],
    "generationConfig": {
        thinkingConfig: {
          thinkingLevel: "low"
      }
    }
  }'

Model Berpikir Rendah biayanya jauh lebih murah dan memberikan respons hampir instan.

Menangani Masukan Multimodal (Gambar, PDF, Audio, Video)

Gemini 3 memperkenalkan kontrol granular atas pemrosesan visual multimodal melalui parameter media_resolution. Resolusi yang lebih tinggi meningkatkan kemampuan model untuk membaca teks halus atau mengidentifikasi detail kecil, tetapi meningkatkan penggunaan token dan latensi. Parameter media_resolution menentukan jumlah token maksimum yang dialokasikan per gambar masukan atau *frame* video.

Anda sekarang dapat mengatur resolusi ke media_resolution_low, media_resolution_medium, atau media_resolution_high per bagian media individual atau secara global (melalui generation_config). Jika tidak ditentukan, model menggunakan *default* optimal berdasarkan jenis media.

Gemini 3 mendukung *embedding* multimodal di seluruh:

gambar
audio
*frame* video
dokumen

Visualisasi Embedding Multimodal Gemini 3

Contoh untuk mengunggah gambar (base64):

curl "https://generativelanguage.googleapis.com/v1alpha/models/gemini-3-pro-preview:generateContent" \
  -H "x-goog-api-key: $GEMINI_API_KEY" \
  -H 'Content-Type: application/json' \
  -X POST \
  -d '{
    "contents": [{
      "parts": [
        { "text": "Apa yang ada di gambar ini?" },
        {
          "inlineData": {
            "mimeType": "image/jpeg",
            "data": "..."
          },
          "mediaResolution": {
            "level": "media_resolution_high"
          }
        }
      ]
    }]
  }'

Menguji dan Melakukan Debugging dengan Apidog

Meskipun perintah curl bagus untuk pengujian cepat, perintah tersebut menjadi rumit saat Anda mengembangkan aplikasi nyata. Di sinilah Apidog bersinar.

Dengan Apidog, Anda dapat:

Simpan Konfigurasi API Anda: Siapkan *endpoint* Gemini dan kunci API Anda sekali, lalu gunakan kembali di semua pengujian Anda.
Buat Templat Permintaan: Simpan berbagai jenis *prompt* (pembuka percakapan, permintaan analisis, tulisan kreatif) sebagai templat.
Uji Mode Berpikir Berdampingan: Mudah beralih antara mode Berpikir Rendah dan Tinggi untuk membandingkan respons dan kinerja.
Kelola Riwayat Percakapan: Gunakan variabel lingkungan Apidog untuk mempertahankan konteks percakapan di beberapa permintaan.
Otomatiskan Pengujian: Buat *test suite* yang memverifikasi integrasi Gemini Anda berfungsi dengan benar.

tombol

Berikut cara Anda dapat menyiapkan permintaan Gemini di Apidog:

Buat permintaan POST baru ke: https://generativelanguage.googleapis.com/v1beta/models/gemini-1.5-flash:generateContent?key={{api_key}}
Siapkan variabel lingkungan api_key dengan kunci API Anda yang sebenarnya
Di badan, gunakan JSON:

{
  "contents": [{
    "parts": [{
      "text": "{{prompt}}"
    }]
  }],
  "generationConfig": {
    "temperature": 0.7,
    "maxOutputTokens": 800
  }
}

4. Atur variabel lingkungan lain prompt dengan apa pun yang ingin Anda tanyakan kepada Gemini

Pendekatan ini membuat eksperimen jauh lebih cepat dan terorganisir.

Praktik Terbaik untuk API Gemini

1. Tangani Kesalahan dengan Elegan

Panggilan API dapat gagal karena banyak alasan. Selalu periksa status respons dan tangani kesalahan dengan tepat. Tabel berikut mencantumkan kode kesalahan *backend* umum yang mungkin Anda temui, bersama dengan penjelasan penyebab dan langkah-langkah *troubleshooting*nya:

Tabel kode kesalahan backend dan solusinya.

2. Kelola Biaya Anda

Penggunaan API Gemini diukur dan dikenakan biaya (setelah batas *free tier*). Ingatlah kiat-kiat ini:

Mulai dengan *free tier* untuk bereksperimen
Gunakan mode Berpikir Rendah bila memungkinkan untuk tugas-tugas sederhana
Tetapkan batas maxOutputTokens yang wajar
Pantau penggunaan Anda di Google AI Studio

Token bisa berupa karakter tunggal seperti z atau seluruh kata seperti cat. Kata-kata panjang dipecah menjadi beberapa token. Kumpulan semua token yang digunakan oleh model disebut kosakata, dan proses memisahkan teks menjadi token disebut *tokenization*.

Saat penagihan diaktifkan, biaya panggilan ke API Gemini ditentukan sebagian oleh jumlah token masukan dan keluaran, jadi mengetahui cara menghitung token dapat membantu.

3. Buat Prompt yang Lebih Baik

Kualitas *output* Anda sangat tergantung pada *input* Anda. Berikut adalah beberapa kiat rekayasa *prompt*:

Alih-alih: "Tulis tentang anjing"

Coba: "Tulis postingan blog edukatif 200 kata tentang manfaat mengadopsi anjing penyelamat, ditulis dengan nada ramah dan mendorong bagi calon pemilik hewan peliharaan."

Alih-alih: "Perbaiki kode ini"

Coba: "Tolong *debug* fungsi Python ini yang seharusnya menghitung faktorial tetapi mengembalikan hasil yang salah untuk masukan 5. Jelaskan apa yang salah dan berikan kode yang sudah diperbaiki."

4. Pilih Model yang Tepat

Google menawarkan beberapa model Gemini, masing-masing dengan kekuatan yang berbeda. Verifikasi bahwa parameter model Anda berada dalam nilai-nilai berikut:

Mulailah dengan gemini-1.5-flash dan tingkatkan hanya jika Anda membutuhkan kemampuan penalaran yang lebih. Selain memeriksa nilai parameter, pastikan Anda menggunakan versi API yang benar (misalnya, /v1 atau /v1beta) dan model yang mendukung fitur yang Anda butuhkan. Misalnya, jika sebuah fitur dalam rilis Beta, fitur tersebut hanya akan tersedia dalam versi API /v1beta.

Kesimpulan: Perjalanan AI Anda Dimulai

Anda sekarang memiliki semua yang Anda butuhkan untuk mulai membangun dengan Google Gemini API. Anda telah belajar cara mendapatkan kunci API, membuat permintaan dasar, memahami berbagai mode berpikir, dan bahkan melihat beberapa contoh lanjutan.

Ingatlah bahwa bekerja dengan API AI adalah proses berulang. Anda akan menjadi lebih baik dalam membuat *prompt* dan memilih pengaturan yang tepat dengan latihan. Jangan takut untuk bereksperimen, begitulah cara Anda akan menemukan potensi penuh dari apa yang dapat Anda bangun.

Langkah terpenting berikutnya adalah mulai bereksperimen. Ambil contoh-contoh dalam panduan ini, modifikasi, rusak, dan lihat apa yang terjadi. Cara terbaik untuk belajar adalah dengan melakukan.

Untuk pemula, saya sangat merekomendasikan menggunakan Apidog sebagai alat pengujian API REST Anda. Ini membantu Anda:

melakukan *debug* permintaan
menyimpan variabel lingkungan
menjalankan koleksi
dengan cepat membandingkan *output* model
membagikan kasus uji API Anda dengan rekan satu tim

Dan karena gratis, tidak ada kerugiannya.

tombol

Apa Itu Google Gemini 3?

Gemini 3 memperkenalkan dua "mode berpikir" utama:

Mengapa Menggunakan API Gemini 3 daripada Alat UI?

Bagaimana API Gemini 3 Bekerja (Ikhtisar Sederhana)

Anda mengirim permintaan POST ke…

Anda menyertakan JSON seperti:

Anda menerima…

Memulai: Langkah Pertama Anda dengan API Gemini

Langkah 1: Dapatkan Kunci API Anda

Langkah 2: Pilih Pendekatan Anda

Memahami Mode Berpikir Gemini

Berpikir Rendah (Sang Pemburu Kecepatan)

Berpikir Tinggi/Dinamis (Analis yang Penuh Perhatian)

Buat Panggilan API REST Gemini 3 Pertama Anda

*Endpoint*

Contoh Badan Permintaan (JSON)

Contoh Perintah Curl

Menggunakan Mode Berpikir Tinggi/Dinamis

Contoh API REST

Menggunakan Mode Berpikir Rendah

Contoh API REST Menggunakan “Flash”

Menangani Masukan Multimodal (Gambar, PDF, Audio, Video)

Menguji dan Melakukan Debugging dengan Apidog

Praktik Terbaik untuk API Gemini

1. Tangani Kesalahan dengan Elegan

2. Kelola Biaya Anda

3. Buat *Prompt* yang Lebih Baik

4. Pilih Model yang Tepat

Kesimpulan: Perjalanan AI Anda Dimulai

Endpoint

3. Buat Prompt yang Lebih Baik