Gemini 3.5 Flash: Model Frontier Cepat Terbaru dari Google

Ashley Innocent

Ashley Innocent

20 May 2026

Gemini 3.5 Flash: Model Frontier Cepat Terbaru dari Google

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

Google merilis Gemini 3.5 Flash pada 19 Mei 2026. Ini adalah varian yang cepat dan berbiaya rendah dari keluarga 3.5 yang baru, dan ini adalah satu-satunya model dalam keluarga tersebut yang dapat Anda gunakan hari ini. Gemini 3.5 Pro diumumkan untuk Juni 2026, tetapi Flash-lah yang pertama kali diluncurkan, dan inilah yang penting untuk sebagian besar beban kerja produksi saat ini.

Flash adalah model yang dibangun Google untuk beban kerja yang benar-benar berjalan pada tahun 2026: perulangan agen yang panjang, otomatisasi terminal, pengodean multi-file, analisis dokumen multimodal, dan obrolan streaming. Ini berjalan sekitar 4 kali lebih cepat daripada model mutakhir lainnya dalam token output dan biayanya kurang dari setengah dari biaya per tugas mereka.

Panduan ini menjelaskan apa itu Gemini 3.5 Flash, apa saja yang sebenarnya baru, angka benchmark, cara mengaksesnya, dan bagaimana ia cocok dengan sisa tumpukan Anda termasuk Apidog untuk menguji endpoint AI.

Fakta Singkat tentang Gemini 3.5 Flash

Untuk rincian harga lengkap termasuk batas tingkat gratis dan skenario biaya nyata, lihat panduan harga Gemini 3.5 Flash kami.

Apa yang Baru dengan 3.5 Flash vs 3 dan 3.1

Gemini 3.5 Flash dibangun di atas lini Gemini 3 Flash dan Gemini 3.1 Pro dengan lima peningkatan konkret:

  1. Eksekusi agenik menjadi lebih tajam. Flash menangani rantai tugas yang lebih panjang tanpa kehilangan alur. Panggilan alat dilakukan dalam urutan yang benar. Pengiriman subagen berfungsi sebagai kemampuan kelas satu, bukan solusi sementara.
  2. Output pengodean lebih padat. Refactor multi-file, pekerjaan refactoring berjangka panjang, dan alur kerja berbasis CLI adalah tempat Flash jelas unggul dibandingkan lini 3.x.
  3. Pembuatan grafik menjadi nyata. UI web interaktif, SVG yang kaya, dan diagram inline keluar langsung dari model. Anda tidak lagi merutekan melalui model gambar terpisah untuk grafik in-line.
  4. Kecepatan output melonjak. Google mengklaim sekitar 4 kali token/detik dari model mutakhir lainnya. Itu mengubah cara Anda membangun UX streaming.
  5. Batas pengaman diperluas. Pengamanan siber dan CBRN yang lebih kuat, ditambah alat interpretasi yang menjelaskan mengapa model menolak atau merutekan ulang permintaan.

Polanya konsisten. Google mengoptimalkan Flash untuk beban kerja agen produksi, bukan hanya obrolan. Itu adalah arah yang sama yang diambil OpenAI dan Anthropic dengan GPT-5.5 dan Claude Opus 4.7.

Benchmark Gemini 3.5 Flash

Flash berkinerja jauh di atas tingkatnya. Angka-angka dari tabel yang dipublikasikan Google:

Benchmark Yang diuji Gemini 3.5 Flash
Terminal-Bench 2.1 Alur kerja CLI berjangka panjang 76,2%
MCP Atlas Koordinasi multi-alat 83,6%
CharXiv Reasoning Interpretasi bagan dan diagram 84,2%
GDPval-AA Nilai agenik umum 1656 Elo
MRCR v2 (konteks 1M) Pengambilan konteks panjang Teratas di tabel Google

Di mana Flash terlihat unggul: penalaran grafik, pekerjaan multi-alat agenik, pengambilan konteks panjang.

Di mana ia tidak mendominasi: SWE-Bench Verified murni masih merupakan persaingan ketat antara Opus 4.7 dan GPT-5.5. Jika satu-satunya metrik Anda adalah perbaikan bug sekali tembak, model-model unggulan tersebut masih sedikit lebih unggul. Jika Anda peduli dengan menjalankan agen yang panjang dengan biaya rendah, Flash unggul.

Untuk rincian perbandingan tiga arah yang lebih mendalam, lihat Gemini 3.5 Flash vs GPT-5.5 vs Opus 4.7.

Keluarga Model Gemini 3.5

Gemini 3.5 Flash (tersedia sekarang)

Flash adalah varian pekerja keras. Ini tersedia segera melalui AI Studio, API Gemini, aplikasi Gemini, Mode AI di Search, Antigravity, Android Studio, dan Gemini Enterprise.

Harga yang dilaporkan pada hari peluncuran sekitar $1,50 per 1 juta token input dan $9,00 per 1 juta token output. Itu jauh di atas 3.1 Flash-Lite tahun lalu tetapi masih jauh lebih murah daripada pesaing tingkat Pro. Lihat panduan harga lengkap untuk mode batch, input cache, dan tarif Vertex.

Di mana Flash bersinar:

Gemini 3.5 Pro (diluncurkan Juni 2026)

Pro diumumkan tetapi belum dikirimkan. Google memposisikannya sebagai model unggulan agenik: varian yang Anda jalankan ketika anggaran tugas mencakup pekerjaan otonom multi-jam, penelitian mendalam, atau posisi teratas di papan peringkat. Harapkan harga Pro akan lebih mendekati harga daftar GPT-5.5 dan Opus 4.7.

Sampai Pro dikirimkan, Flash menanggung beban. Berita baiknya: Flash sudah kredibel dalam benchmark agenik, jadi Anda tidak perlu menunggu untuk mulai membangun.

Bagaimana dengan Nano?

Google tidak merilis varian 3.5 Nano. Inferensi di perangkat masih berjalan pada lini 3.1 Flash-Lite. Harapkan pengumuman 3.5 Nano mendekati siklus Pixel berikutnya.

Di mana Anda dapat menggunakan Gemini 3.5 Flash

Enam permukaan dikirimkan pada hari peluncuran:

  1. Aplikasi Gemini: peluncuran global, baik tingkat gratis maupun berbayar
  2. Mode AI di Google Search: jawaban dan tindak lanjut
  3. Google Antigravity: platform agen Google untuk otomatisasi pengguna akhir
  4. API Gemini: titik masuk pengembang melalui AI Studio
  5. Android Studio: bantuan pengodean tingkat IDE untuk pengembang Android
  6. Gemini Enterprise + Agent Platform: runtime agen terkelola untuk penggunaan di seluruh organisasi

Permukaan terbaru adalah Gemini Spark, agen pribadi yang berjalan 24/7 di akun Anda. Spark menggunakan Flash di balik layar dan terhubung ke konteks Gmail, Kalender, dan Drive Anda.

Agen informasi di dalam Search juga baru, pembantu otonom kecil yang mengumpulkan pembaruan tentang topik yang Anda ikuti tanpa Anda perlu menanyakan ulang.

Cara mulai menggunakan Gemini 3.5 Flash

Anda memiliki empat jalur nyata. Masing-masing memetakan ke kasus penggunaan yang berbeda.

1. Aplikasi Gemini (jalur obrolan)

Buka gemini.google.com, pilih “3.5 Flash” dari pemilih model, dan selesai. Antarmuka aplikasi mencakup sebagian besar beban kerja kasual: penelitian, penulisan, sketsa pengodean, analisis gambar.

2. Google AI Studio (jalur pengembang gratis)

Kunjungi ai.google.dev, masuk, dan Anda akan mendapatkan kunci API dengan kuota harian gratis. Flash berada di tingkat gratis dengan sekitar 1.500 permintaan per hari saat peluncuran.

Jika Anda pernah menggunakan API Gemini Google sebelumnya, polanya identik. Atur GEMINI_API_KEY, arahkan SDK ke gemini-3.5-flash, kirim permintaan Anda. Lihat panduan kunci API Gemini gratis kami untuk langkah-langkahnya, atau panduan gratis khusus Flash kami untuk kelima jalur gratis tersebut.

3. API Gemini dalam produksi

Beban kerja produksi dirutekan melalui endpoint yang sama dengan akun berbayar. Harga per token Flash mengikuti model input/output standar dan jauh di bawah pesaing utama. Lihat Cara Menggunakan API Gemini 3.5 Flash untuk contoh kode lengkap dalam Python, Node, dan curl, ditambah streaming, penggunaan alat, dan pola multimodal.

Ketika Anda menghubungkannya ke tumpukan Anda, uji endpoint dengan benar. Apidog menangani siklus permintaan/respons lengkap untuk endpoint REST dan streaming Flash dalam satu ruang kerja, berguna saat Anda perlu memverifikasi panggilan alat atau payload multimodal secara end-to-end.

4. Gemini Enterprise (jalur terkelola)

Untuk organisasi, Gemini Enterprise Agent Platform mengemas Flash dengan log audit, residensi data, dan runtime Agent Platform. Ini adalah jalur yang akan dipilih sebagian besar tim besar setelah mereka membuat prototipe pada API pengembang.

Apa sebenarnya keunggulan Gemini 3.5 Flash

Setelah sehari pengujian publik, polanya jelas:

Perulangan agen yang panjang dengan biaya rendah. Penelitian web multi-langkah dengan panggilan alat berjalan lebih jauh sebelum menyimpang. Skor MCP Atlas 83,6% adalah bukti praktisnya. Flash memilih alat yang tepat lebih sering, pulih dari kesalahan alat lebih baik, dan tidak mengulang langkah yang sama.

Penalaran bagan dan dokumen. CharXiv pada 84,2% berarti laporan dan PDF nyata menjadi dapat ditangani. Jika Anda telah membuat pipeline ekstraksi bagan secara manual, Flash mengumpulkannya menjadi satu panggilan.

Pembuatan UI interaktif. Minta dasbor, dapatkan HTML + widget interaktif yang berfungsi dalam satu kali proses. Lompatan kualitas grafik dibandingkan 3.1 Flash-Lite adalah peningkatan yang paling terlihat.

Beban kerja produksi yang peka biaya. "Kurang dari setengah biaya model mutakhir lainnya" adalah kerangka Google untuk tugas-tugas agenik. Bahkan dengan mempertimbangkan perhitungan pemasaran, biaya per tugas Flash untuk menjalankan agen yang panjang secara material lebih rendah daripada Opus 4.7 atau GPT-5.5. Angka-angkanya ada di rincian harga kami.

Apa yang masih belum unggul dari Flash

Tidak ada model yang merupakan peluru perak. Tiga kelemahan jujur pada hari pertama:

Cara menguji Gemini 3.5 Flash dengan benar

Dua hal penting saat Anda membawa model baru ke dalam tumpukan produksi: stabilitas bentuk respons dan kebenaran panggilan alat.

Bangun kerangka evaluasi kecil:

  1. Sematkan serangkaian prompt yang representatif
  2. Jalankan terhadap gemini-3.5-flash dan model Anda saat ini
  3. Nilai berdasarkan latensi, biaya token, dan keberhasilan tugas hilir
  4. Perhatikan pergeseran skema panggilan alat antar versi minor

Untuk langkah 1 dan 3, Apidog memberi Anda suite pengujian yang direkam untuk endpoint API Flash, termasuk streaming. Anda dapat memutar ulang prompt yang sama di berbagai versi model dan membandingkan keluarannya. Unduh Apidog jika Anda ingin menyiapkannya secara lokal.

Tips migrasi dari Gemini 3.1 ke 3.5 Flash

Jika Anda sudah menggunakan 3.1, migrasinya adalah perubahan string model satu baris di sebagian besar SDK. Beberapa detail yang patut dicatat:

Untuk catatan migrasi yang lebih mendalam, panduan API Google Gemini 3 mencakup pola SDK secara rinci.

FAQ

Kapan Gemini 3.5 Pro tersedia? Google mengumumkan "diluncurkan bulan depan" pada 19 Mei 2026. Harapkan ketersediaan umum pada Juni 2026 di seluruh AI Studio, API Gemini, dan Gemini Enterprise. Sampai saat itu, Flash adalah satu-satunya varian 3.5 yang dapat Anda gunakan.

Apakah Gemini 3.5 Flash gratis digunakan? Ya, dengan kuota harian. Tingkat standar aplikasi Gemini dan AI Studio dengan kunci API keduanya memberi Anda akses Flash tanpa pembayaran. Lihat panduan gratis Flash kami dan Dapatkan API Gemini Tanpa Batas Gratis untuk kelima jalur gratis tersebut.

Apakah Gemini 3.5 Flash mendukung pemanggilan fungsi? Ya. Pemanggilan alat dan pengiriman subagen adalah kelas satu. Skor MCP Atlas 83,6% adalah bukti utama.

Bagaimana Flash dibandingkan dengan Opus 4.7 dan GPT-5.5? Flash unggul dalam biaya, kecepatan output, dan penalaran grafik. Opus 4.7 masih sedikit lebih unggul dalam SWE-Bench Pro dan penulisan bentuk panjang. GPT-5.5 menang dalam efisiensi token. Lihat perbandingan tiga arah untuk rincian beban kerja demi beban kerja.

Bisakah saya menjalankan Gemini 3.5 Flash secara lokal? Tidak. Tidak ada rilis open-weights. Untuk inferensi lokal, lihat LLM lokal terbaik tahun 2026 sebagai gantinya.

Apakah Gemini 3.5 Flash berfungsi dengan Cursor? Ya, melalui API Gemini standar. Polanya sama dengan Gemini 3.0 Pro dengan Cursor.

Apa nama model API untuk Flash? gemini-3.5-flash. Gunakan string ini di SDK atau endpoint REST.

Apa artinya ini untuk tumpukan Anda

Jika Anda menjalankan fitur AI dalam produksi hari ini, berikut versi singkatnya:

Apa pun jalur yang Anda ambil, perlakukan model sebagai satu komponen dalam pipeline yang membutuhkan pengujian end-to-end. Apidog mencakup sisi pengujian khusus untuk API Gemini; sisa dari perulangan, desain prompt, pemasangan alat, skrip evaluasi, ada pada Anda.

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.