Gemini 3 Pro kini tersedia di tingkat gratis Ollama, dan para pengembang segera menyadarinya. Anda tidak lagi memerlukan langganan Cloud Max atau Pro berbayar untuk bereksperimen dengan salah satu model multimodal paling mumpuni yang tersedia. Selain itu, integrasi ini membawa kemampuan penalaran Gemini 3 Pro yang canggih langsung ke alur kerja Ollama yang familiar, yang sudah digunakan oleh jutaan orang untuk model lokal.
Selanjutnya, Anda akan menjelajahi apa yang berubah, cara mengaturnya, dan cara memaksimalkan kinerja pada perangkat keras konsumen.
Apa yang Berubah dengan Gemini 3 Pro di Ollama?
Ollama awalnya membatasi Gemini 3 Pro pada paket Cloud Ollama berbayar. Namun, pada 18 November 2025, akun resmi Ollama mengumumkan bahwa model tersebut sekarang muncul di tingkat gratis bersama dengan tingkat Pro dan Max.
Anda sekarang dapat menjalankan satu perintah:
ollama run gemini-3-pro-preview
Perintah ini menarik dan menjalankan model tanpa gerbang penagihan tambahan. Selain itu, model ini mendukung jendela konteks 1 juta token, input multimodal asli (teks, gambar, audio, video), dan kemampuan agentik yang canggih.

| Tingkat | Akses Gemini 3 Pro | Batas Tingkat (kira-kira) | Biaya |
|---|---|---|---|
| Gratis | Ya (pratinjau) | Sedang | $0 |
| Pro | Ya | Lebih tinggi | Berbayar |
| Max | Ya | Tertinggi | Berbayar lebih tinggi |
Pergeseran ini mendemokratisasi akses. Akibatnya, pengembang independen, peneliti, dan penghobi mendapatkan kemampuan penalaran tingkat terdepan yang sebelumnya membutuhkan langganan perusahaan.
Prasyarat Sebelum Anda Memulai
Anda perlu Menginstal Ollama terbaru — Versi 0.3.12 atau yang lebih baru menangani model yang di-hosting di cloud dengan mulus. Unduh dari https://ollama.com/download.

Langkah demi Langkah: Menjalankan Pratinjau Gemini 3 Pro di Tingkat Gratis
Ikuti langkah-langkah berikut untuk meluncurkan model.
Pertama, buka terminal Anda dan verifikasi bahwa Ollama berjalan:
ollama --version
Anda akan melihat versi 0.3.12 atau lebih tinggi.
Kedua, tarik dan jalankan model secara langsung:
ollama run gemini-3-pro-preview

Ollama secara otomatis mendeteksi kelayakan tingkat gratis Anda dan terhubung ke backend Google melalui kunci API Anda (disimpan dengan aman setelah dijalankan pertama kali). Selain itu, eksekusi pertama akan meminta kunci jika belum ada.
Ketiga, uji interaksi dasar:
>>> Jelaskan keterikatan kuantum secara sederhana tetapi dengan kekakuan matematis.
Model ini merespons dengan penjelasan yang jelas, sering kali menyertakan persamaan berformat LaTeX.

Selanjutnya, Anda dapat mengunggah gambar atau dokumen langsung di alat seperti Open WebUI.
Menguji API Gemini Langsung dengan Apidog
Anda terkadang membutuhkan akses mentah ke endpoint Gemini untuk scripting atau integrasi. Apidog sangat unggul di sini karena mendukung pembuatan permintaan otomatis, variabel lingkungan, dan validasi respons.

Berikut cara menguji model yang sama melalui endpoint resmi:
Buka Apidog dan buat permintaan baru.
Atur metode ke POST dan URL ke:
https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent
Tambahkan parameter query: key=KUNCI_API_ANDA
Di dalam body (JSON), gunakan:
{
"contents": [{
"parts": [{
"text": "Bandingkan Gemini 3 Pro dengan GPT-4o pada benchmark penalaran."
}]
}]
}
Kirim permintaan.
Apidog secara otomatis memformat respons, menyorot penggunaan token, dan memungkinkan Anda menyimpan permintaan sebagai koleksi. Pendekatan ini terbukti sangat berharga ketika Anda merangkai panggilan atau membangun agen.
Kemampuan Multimodal: Visi, Audio, dan Video
Gemini 3 Pro menonjol dengan pemrosesan multimodal asli. Misalnya, Anda memberinya URL gambar atau file lokal:
ollama run gemini-3-pro-preview
>>> (unggah gambar diagram sirkuit)
Jelaskan skema ini dan sarankan peningkatan untuk efisiensi.
Model ini menganalisis diagram, mengidentifikasi komponen, dan mengusulkan optimasi. Demikian pula, Anda dapat memproses bingkai video atau transkrip audio dalam sesi yang sama.
Dalam praktiknya, pengembang melaporkan kinerja yang unggul pada tugas pemahaman dokumen dibandingkan dengan Gemini 1.5 Pro sebelumnya, terutama dengan PDF campuran teks/gambar.
Benchmark Kinerja dan Uji Dunia Nyata
Tes independen yang dilakukan pada 18 November 2025, menunjukkan Gemini 3 Pro mencapai:
- MMLU-Pro: 88,2%
- GPQA Diamond: 82,7%
- LiveCodeBench: 74,1%
- MMMU (multimodal): 78,5%
Selain itu, kecepatan output pada tingkat gratis rata-rata 45-60 token/detik untuk prompt teks saja, yang menyaingi tingkat berbayar model pesaing.
Anda mencapai respons yang lebih cepat dengan menggunakan frontend Open WebUI atau mengintegrasikan melalui endpoint yang kompatibel dengan OpenAI yang diekspos Ollama.
Mengintegrasikan Gemini 3 Pro ke dalam Aplikasi
Ollama mengekspos API yang kompatibel dengan OpenAI di http://localhost:11434/v1. Oleh karena itu, Anda dapat mengarahkan proyek LangChain, LlamaIndex, atau Haystack apa pun ke sana:
from openai import OpenAI
client = OpenAI(
base_url="http://localhost:11434/v1",
api_key="ollama", # kunci dummy
)
response = client.chat.completions.create(
model="gemini-3-pro-preview",
messages=[{"role": "user", "content": "Tulis endpoint FastAPI untuk autentikasi pengguna."}]
)
print(response.choices[0].message.content)
Kompatibilitas ini berarti Anda dapat mengganti Gemini 3 Pro tanpa menulis ulang codebase yang dibuat untuk model GPT.
Batasan Tingkat Gratis yang Harus Anda Ketahui
Akses gratis mencakup batas tingkat yang murah hati tetapi terbatas. Pengguna berat akan mencapai batas sekitar 50-100 permintaan per menit, tergantung pada wilayah dan beban. Selain itu, model tetap di-hosting di cloud, sehingga latensi tergantung pada koneksi Anda (biasanya 800-1500ms TTF).
Untuk penggunaan tak terbatas, tingkatkan ke Ollama Pro atau Max, tetapi sebagian besar pengembang menemukan tingkat gratis cukup untuk pembuatan prototipe dan pekerjaan sehari-hari.

Penggunaan Tingkat Lanjut: Panggilan Fungsi dan Penggunaan Alat
Gemini 3 Pro mendukung panggilan fungsi asli. Definisikan alat di Modelfile Anda atau melalui API:
{
"tools": [{
"type": "function",
"function": {
"name": "get_weather",
"description": "Dapatkan cuaca saat ini",
"parameters": { ... }
}
}]
}
Model kemudian memutuskan kapan akan memanggil fungsi Anda, memungkinkan alur kerja agentik seperti penelusuran web atau kueri basis data.
Memecahkan Masalah Umum
- Kesalahan 401/403: Buat ulang kunci API Gemini Anda dan jalankan
ollama runlagi untuk mengautentikasi ulang. - Model tidak ditemukan: Perbarui Ollama (
ollama update) dan coba lagi. - Respons lambat: Beralih ke koneksi kabel atau gunakan selama jam di luar jam sibuk.
- Multimodal gagal: Pastikan Anda menggunakan versi Ollama terbaru dan mengunggah file melalui klien yang didukung (Open WebUI berfungsi paling baik).
Mengapa Ini Penting bagi Pengembang pada Tahun 2025
Anda sekarang mengakses kecerdasan tingkat terdepan dengan nol biaya infrastruktur. Ini sangat meratakan lapangan bermain. Tim kecil dapat membangun agen canggih, peneliti membandingkan dengan model SOTA terbaru, dan penghobi menjelajahi AI multimodal—semuanya tanpa persetujuan anggaran.
Selain itu, menggabungkan ini dengan alat seperti Apidog untuk manajemen API mempercepat siklus pengembangan dari hitungan hari menjadi jam.
Kesimpulan: Mulai Gunakan Gemini 3 Pro Hari Ini
Jalankan ollama run gemini-3-pro-preview sekarang dan rasakan perbedaannya sendiri. Google dan Ollama baru saja menghilangkan hambatan terbesar untuk eksperimen AI tingkat lanjut.
Unduh Apidog gratis hari ini untuk mempercepat alur kerja pengujian API Anda—baik Anda men-debug permintaan Gemini atau membangun aplikasi full-stack di sekitar Ollama.
Masa depan AI yang terbuka dan dapat diakses telah tiba. Anda hanya perlu satu perintah untuk bergabung dengannya.
