Intisari
Ollama adalah cara termudah untuk menjalankan model AI canggih secara lokal. Dikombinasikan dengan OpenClaw, ia menciptakan asisten AI gratis yang berfokus pada privasi yang menyaingi alternatif berbayar. Panduan ini akan memandu Anda dalam menyiapkan Ollama, memilih model yang tepat, dan mengintegrasikannya dengan OpenClaw untuk asisten AI pribadi Anda.
Pengantar
Menjalankan AI secara lokal dulunya merupakan kegiatan para penghobi, membutuhkan pengaturan yang rumit dan perangkat keras yang mahal. Ollama mengubahnya. Dengan perintah instalasi yang sederhana dan API yang intuitif, Ollama membuat menjalankan model AI secara lokal dapat diakses oleh siapa saja.

Ketika dipasangkan dengan OpenClaw, Anda akan mendapatkan asisten AI yang kuat yang:
- Tidak memerlukan biaya untuk dijalankan (setelah penyiapan awal)
- Menjaga data Anda 100% pribadi
- Bekerja secara offline setelah model diunduh
- Menawarkan kontrol kustomisasi penuh
Panduan ini mencakup semua yang Anda butuhkan untuk memulai.
Mengapa Menggunakan Ollama dengan OpenClaw
Manfaat AI Lokal
- Privasi: Percakapan Anda tidak pernah meninggalkan mesin Anda
- Tanpa biaya API: Bayar sekali untuk perangkat keras, gunakan tanpa batas
- Akses offline: Berfungsi tanpa internet
- Kontrol penuh: Sesuaikan model dan prompt
- Tanpa batas tarif: Gunakan sebanyak yang Anda mau
Mengapa Ollama
Ollama menonjol karena beberapa alasan:
- Instalasi sederhana: Satu perintah untuk memulai
- Pustaka model: 100+ model tersedia
- Lintas platform: Berfungsi di macOS, Linux, Windows
- API-first: Integrasi mudah dengan OpenClaw
- Pengembangan aktif: Pembaruan rutin dan model baru
Prasyarat
Sebelum memulai, pastikan Anda memiliki:
Persyaratan Perangkat Keras
| Ukuran Model | RAM Minimum | RAM yang Disarankan |
|---|---|---|
| 7B params | 8GB | 16GB |
| 14B params | 16GB | 32GB |
| 32B params | 32GB | 64GB |
| 70B params | 64GB | 128GB |
Persyaratan Perangkat Lunak
- macOS 10.15+, Linux, atau Windows 10+
- Akses Administrator/root untuk instalasi
- Koneksi internet untuk unduhan awal
- Keterbiasaan dengan baris perintah
Yang Anda Butuhkan
- Komputer yang memenuhi persyaratan RAM
- Internet untuk mengunduh model
- Waktu untuk unduhan model awal (bervariasi berdasarkan ukuran dan koneksi)
Menginstal Ollama
Instalasi macOS
Metode termudah menggunakan Homebrew:
brew install ollama
Atau gunakan skrip penginstal resmi:
curl -fsSL https://ollama.ai/install.sh | sh
Instalasi Linux
# Menggunakan skrip instalasi (disarankan)
curl -fsSL https://ollama.ai/install.sh | sh
# Atau unduh biner secara langsung
sudo curl -L https://ollama.ai/download/ollama-linux-amd64 -o /usr/bin/ollama
sudo chmod +x /usr/bin/ollama
Instalasi Windows
- Unduh penginstal
- Jalankan penginstal
- Ikuti instruksi di layar

Memverifikasi Instalasi
ollama --version
Anda akan melihat output seperti ollama version 0.15.0 atau yang lebih baru.

Memulai Layanan Ollama
Ollama berjalan sebagai layanan latar belakang:
# Periksa apakah Ollama sedang berjalan
ollama list
# Mulai Ollama jika tidak berjalan
ollama serve

Memilih Model yang Tepat
Ollama mendukung 100+ model. Berikut cara memilihnya:
Berdasarkan Kasus Penggunaan
| Kasus Penggunaan | Model yang Disarankan |
|---|---|
| Percakapan umum | Qwen3.5, Llama 3.2, Mistral |
| Bantuan pengkodean | Qwen3.5-Coder, DeepSeek-Coder |
| Penalaran/matematika | DeepSeek-R1, Qwen3.5 |
| Perangkat keras yang lebih kecil | Phi3.5, Gemma2.2B |
Berdasarkan Perangkat Keras
| RAM Tersedia | Disarankan |
|---|---|
| 8GB | Model 7B (Qwen3.5, Llama3.2, Mistral) |
| 16GB | Model 8-14B |
| 32GB | Model 14-32B |
| 64GB+ | Model 70B+ |
Model Populer di Tahun 2026
Qwen3.5 — Kinerja serbaguna yang sangat baik, penalaran kuat, baik untuk pengkodean. Pilihan paling populer untuk OpenClaw pada tahun 2026.
DeepSeek-R1 — Model penalaran open-source yang menyaingi GPT-4 dalam tugas matematika dan logika. Sangat baik untuk pemecahan masalah kompleks.
Mistral — Ringan tetapi mampu. Sangat baik untuk sistem dengan RAM terbatas.
Menginstal Model
Mengunduh Model
# Instal Qwen3.5 (disarankan untuk sebagian besar pengguna)
ollama pull qwen2.5:7b
# Atau Qwen3 terbaru
ollama pull qwen3:7b
# DeepSeek-R1 untuk tugas penalaran
ollama pull deepseek-r1:7b
# Llama 3.2
ollama pull llama3.2:7b
# Mistral
ollama pull mistral:7b
Tag Model
Model tersedia dalam berbagai ukuran:
# Ukuran parameter yang berbeda
ollama pull qwen2.5:3b # Lebih kecil, lebih cepat
ollama pull qwen2.5:7b # Seimbang
ollama pull qwen2.5:14b # Lebih mampu
Melihat Model yang Terinstal
ollama list
Ini menunjukkan semua model yang diunduh dan ukurannya.
Menjalankan dan Menguji Model
Mode Interaktif
# Berbicara dengan model
ollama run qwen2.5:7b
Ketik pesan Anda dan tekan Enter. Ketik /bye untuk keluar.
Mode API
Ollama menjalankan server API di port 11434 secara default:
# Titik akhir Generate
curl http://localhost:11434/api/generate -d {
"model": "qwen2.5:7b",
"prompt": "Hello, how are you?",
"stream": false
}
Menggunakan Pustaka Python
from ollama import Client
client = Client()
response = client.chat(
model='qwen2.5:7b',
messages=[
{'role': 'user', 'content': 'Hello!'}
]
)
print(response['message']['content'])
Pengujian dengan Apidog
Sebelum terhubung ke OpenClaw, uji pengaturan Ollama Anda menggunakan Apidog:
- Buat permintaan baru di Apidog
- Atur metode menjadi POST
- Masukkan URL:
http://localhost:11434/api/generate - Tambahkan header:
Content-Type: application/json

5. Tambahkan body:
{
"model": "qwen3-coder",
"prompt": "What is 2 + 2?",
"stream": false
}

Ini memverifikasi bahwa pengaturan Ollama Anda berfungsi sebelum berintegrasi dengan OpenClaw.
Mengintegrasikan Ollama dengan OpenClaw
Sekarang mari kita hubungkan Ollama ke OpenClaw.
Metode 1: Konfigurasi Cepat
# Atur OpenClaw untuk menggunakan Ollama dengan model Anda
openclaw models set ollama/qwen2.5:7b
Metode 2: Variabel Lingkungan
# Konfigurasi titik akhir Ollama
export OLLAMA_HOST=http://localhost:11434
# Atur model default
export OLLAMA_MODEL=qwen2.5:7b
Metode 3: File Konfigurasi
Buat atau edit ~/.openclaw/config.yaml:
models:
default: ollama/qwen2.5:7b
ollama:
host: http://localhost:11434
model: qwen2.5:7b
temperature: 0.7
top_p: 0.9
Memverifikasi Integrasi
# Periksa status model OpenClaw
openclaw models status
# Uji dengan pesan
openclaw chat "Hello!"
Anda akan menerima respons dari model lokal Anda.
Opsi Konfigurasi
Sempurnakan pengaturan Ollama + OpenClaw Anda:
Suhu (Temperature)
Mengontrol kreativitas vs presisi:
ollama:
temperature: 0.7 # 0.0 = presisi, 1.0 = kreatif
Top-P dan Top-K
Mengontrol keberagaman respons:
ollama:
top_p: 0.9 # Sampel nukleus
top_k: 40 # Pemilihan token
Panjang Konteks
Untuk percakapan yang lebih panjang:
ollama:
context_size: 4096 # Default seringkali 2048 atau 4096
Prompt Sistem
Sesuaikan perilaku model:
ollama:
system_prompt: |
Anda adalah asisten pengkodean yang membantu.
Berikan contoh kode yang jelas dan ringkas.
Jelaskan konsep-konsep secara sederhana.
Beralih Antar Model
Salah satu keuntungan Ollama adalah kemudahan beralih model:
# Beralih ke DeepSeek-R1 untuk penalaran
openclaw models set ollama/deepseek-r1:7b
# Beralih ke Qwen-Coder untuk tugas pengkodean
openclaw models set ollama/qwen2.5-coder:7b
# Beralih kembali ke model umum
openclaw models set ollama/qwen2.5:7b
Pengaturan Banyak Model
Konfigurasi beberapa model di config.yaml:
models:
default: ollama/qwen2.5:7b
coding: ollama/qwen2.5-coder:7b
reasoning: ollama/deepseek-r1:7b
Kemudian beralih di antaranya:
openclaw models set coding
openclaw models set reasoning
Pemecahan Masalah
Model Tidak Mau Memuat
Masalah: Kesalahan kehabisan memori
Solusi:
- Gunakan model yang lebih kecil (7B daripada 14B)
- Tutup aplikasi lain untuk membebaskan RAM
- Periksa memori yang tersedia dengan
free -h(Linux) atau Activity Monitor (Mac)
Respons Lambat
Masalah: Respons memakan waktu terlalu lama
Solusi:
- Gunakan model yang lebih kecil
- Aktifkan akselerasi GPU (jika tersedia)
- Kurangi ukuran konteks
- Gunakan penyimpanan SSD untuk file model
Koneksi Ditolak
Masalah: OpenClaw tidak dapat terhubung ke Ollama
Solusi:
# Verifikasi Ollama berjalan
ollama serve
# Periksa port
curl http://localhost:11434
Model Tidak Ditemukan
Masalah: Model tidak ada di Ollama
Solusi:
# Unduh model
ollama pull qwen2.5:7b
# Periksa model yang tersedia
ollama list
Kesimpulan
Anda kini memiliki asisten AI yang kuat dan pribadi yang berjalan secara lokal. Ollama + OpenClaw memberikan kemampuan yang akan menelan biaya $20+/bulan dengan alternatif cloud—semuanya berjalan di perangkat keras yang Anda kendalikan.
Apa yang bisa Anda lakukan sekarang:
- Mengobrol dengan AI Anda melalui berbagai platform
- Beralih antar model berdasarkan tugas
- Sesuaikan prompt untuk perilaku khusus
- Jalankan secara offline setelah model diunduh
Satu-satunya batasan adalah perangkat keras Anda.
Langkah selanjutnya:
- Bereksperimen dengan model yang berbeda
- Coba Qwen3.5, DeepSeek-R1, dan lainnya
- Sesuaikan prompt sistem Anda
- Jelajahi keterampilan OpenClaw di ClawHub
Siap membangun aplikasi AI profesional? Unduh Apidog gratis dan uji integrasi AI Anda dengan antarmuka visual yang dirancang untuk pengembang.
FAQ
Model Ollama terbaik untuk OpenClaw apa?
Qwen3.5 saat ini yang paling populer—kinerja seimbang dengan kemampuan penalaran dan pengkodean yang baik. DeepSeek-R1 unggul dalam tugas penalaran jika itu prioritas Anda.
Bisakah saya menjalankan beberapa model Ollama sekaligus?
Ya, tetapi setiap model memerlukan RAM. Pengaturan tipikal menjalankan satu model pada satu waktu, beralih sesuai kebutuhan.
Apakah saya membutuhkan GPU?
Tidak, Ollama bekerja pada CPU. Akselerasi GPU membuatnya lebih cepat tetapi tidak diperlukan. Model yang lebih kecil (7B) berfungsi cukup baik pada CPU.
Bagaimana cara memperbarui model?
ollama pull model-name
Ollama memperbarui secara otomatis jika versi yang lebih baru tersedia.
Bisakah saya menggunakan model yang telah saya sesuaikan sendiri?
Ya, impor model kustom menggunakan fungsionalitas impor Ollama. Periksa dokumentasi Ollama untuk detailnya.
