Anda menghadapi tagihan cloud yang tinggi ketika Anda menjalankan agen AI yang kuat setiap hari. Qwen3.5 memberi Anda penalaran multimodal tingkat terdepan secara lokal. Anda menggabungkannya dengan OpenClaw untuk alur kerja agen yang persisten dan Ollama untuk penyajian lokal yang sederhana. Hasilnya adalah agen AI lengkap yang bekerja 24/7 di mesin Anda tanpa langganan.
Pilihan kecil itu penting. Anda memilih tag model yang tepat. Anda mengatur URL dasar yang benar. Keputusan-keputusan ini menciptakan perbedaan besar dalam kecepatan dan keandalan. Panduan ini menunjukkan langkah-langkah yang tepat sehingga Anda selesai dengan tumpukan siap produksi yang sepenuhnya Anda kendalikan.
Mengapa Qwen3.5 Sempurna untuk Pekerjaan Agen Lokal
Alibaba merilis Qwen3.5 pada awal 2026 sebagai keluarga model bahasa-visi asli pertamanya. Flagship 397B-A17B menggunakan arsitektur hibrida. Ini menggabungkan Gated Delta Networks dengan Mixture-of-Experts yang jarang. Hanya 17 miliar parameter yang aktif per token. Anda mendapatkan kinerja yang kuat dengan memori yang jauh lebih sedikit.

Ollama menghosting tag-tag praktis ini yang dapat Anda tarik hari ini:
- qwen3.5:35b — muat dalam 24 GB VRAM, konteks 256K, dukungan teks dan gambar penuh
- qwen3.5:122b — membutuhkan 81 GB untuk penalaran yang lebih dalam
Anda menjalankan qwen3.5 secara lokal dan menjaga data Anda tetap pribadi. Model ini mencetak skor 86.7 pada TAU2-Bench dan 85.0 pada MMMU. Oleh karena itu, Anda mempercayainya untuk tugas-tugas agen yang mencampur teks, tangkapan layar, dan panggilan alat.
Bagaimana OpenClaw Mengubah Qwen3.5 Menjadi Agen Nyata
OpenClaw berjalan sebagai runtime agen Anda yang selalu aktif. Anda menghubungkannya ke WhatsApp, Telegram, Slack, Discord, atau Signal sekali. Agen mendengarkan terus-menerus. Ketika Anda mengirim pesan, OpenClaw merutekannya ke qwen3.5, memanggil alat, mengontrol browser Anda dengan Playwright, mengedit file, memperbarui kalender, dan menjawab secara proaktif.

Anda menyimpan memori di seluruh sesi. Agen mengingat proyek dan preferensi Anda selamanya. Anda menginstal keterampilan komunitas atau membiarkan qwen3.5 menulis yang baru sesuai permintaan. Oleh karena itu, OpenClaw menjadi asisten digital pribadi Anda yang tidak pernah tidur.
Mengapa Ollama Membuat Integrasi Sederhana
Ollama menyajikan model secara lokal dan mengekspos endpoint yang kompatibel dengan OpenAI pada port 11434. Anda mengarahkan OpenClaw ke http://localhost:11434/v1 dan mengatur model ke qwen3.5:35b. Ollama menangani kuantisasi, offload GPU, dan manajemen konteks secara otomatis.
Anda mencapai generasi token yang cepat pada perangkat keras konsumen. Anda menjaga jendela konteks 256K penuh yang dibutuhkan qwen3.5 untuk percakapan agen yang panjang. Anda menghindari biaya cloud dan kebocoran data pada saat yang bersamaan.
Prasyarat yang Perlu Anda Penuhi
Anda mempersiapkan mesin Anda sebelum memulai. Gunakan macOS 14 atau lebih baru, Ubuntu 22.04/24.04, atau Windows 11 dengan WSL2. Anda membutuhkan setidaknya 24 GB VRAM untuk model 35B atau 32 GB memori terpadu pada Apple Silicon. Sediakan ruang disk kosong 30 GB. Instal Node.js 22 atau lebih tinggi dan Ollama 0.17 atau lebih baru.
Anda memverifikasi GPU Anda nanti dengan satu perintah. Perangkat keras yang memenuhi persyaratan ini memberikan kinerja responsif. Anda dapat beralih ke model terkuantisasi yang lebih kecil jika Anda memiliki memori yang lebih sedikit.
Instal Ollama dan Tarik Qwen3.5
Anda mulai dengan menginstal Ollama. Di macOS Anda menjalankan:
brew install ollama
brew services start ollama
Di Linux Anda menjalankan:
curl -fsSL https://ollama.com/install.sh | sh
systemctl enable --now ollama
Anda mengkonfirmasi layanan berjalan dengan ollama list. Selanjutnya Anda menarik model:
ollama pull qwen3.5:35b
Unduhan selesai dalam 10 hingga 30 menit. Anda menguji inferensi dasar:
ollama run qwen3.5:35b
Anda mengetik perintah di dalam REPL. Qwen3.5 menjawab dengan akurat. Anda keluar dengan /bye.
Anda segera memeriksa endpoint yang kompatibel dengan OpenAI karena OpenClaw membutuhkannya:
curl http://localhost:11434/v1/models
Respons tersebut mencantumkan qwen3.5:35b. Anda tahu jembatan itu berfungsi.
Luncurkan OpenClaw Dengan Qwen3.5
Anda menggunakan satu perintah Ollama untuk menginstal dan memulai semuanya:
ollama launch openclaw --model qwen3.5:35b
Ollama menginstal komponen yang hilang, memulai gateway, dan membuka wizard TUI. Anda menghubungkan saluran pesan Anda, mengkonfirmasi penyedia model, dan menyimpan pengaturan. Gateway berjalan di port 8080.
Anda menguji dengan mengirim pesan kepada bot Anda di Telegram: “Daftarkan file di folder Unduhan saya.” OpenClaw menggunakan qwen3.5 dan mengembalikan hasilnya.
Anda juga dapat mengkonfigurasi secara manual. Anda mengedit ~/.openclaw/openclaw.json dan mengatur URL dasar penyedia Ollama. Anda memulai ulang dengan openclaw start. Kedua metode memberikan hasil yang identik.
Uji Tumpukan Lengkap dengan Apidog
Anda membuka Apidog dan membuat proyek baru bernama “Qwen3.5 OpenClaw Local Stack”. Anda mengatur URL dasar ke http://localhost:11434/v1.

Anda menambahkan permintaan POST ke /chat/completions. Anda menyertakan header ini:
- Content-Type: application/json
- Authorization: Bearer ollama
Anda menggunakan body ini:
{
"model": "qwen3.5:35b",
"messages": [
{"role": "system", "content": "You are a helpful agent."},
{"role": "user", "content": "Plan steps to organize my Downloads folder by file type."}
],
"temperature": 0.7,
"max_tokens": 2048
}
Anda mengirim permintaan. Apidog menampilkan token streaming secara real time. Anda menambahkan pernyataan visual untuk kode status 200. Anda menyimpan permintaan sebagai skenario pengujian. Anda menjalankan skenario lagi setelah Anda mengubah pengaturan. Oleh karena itu, Anda segera menangkap masalah.
Anda membuat koleksi kedua untuk gateway OpenClaw di http://localhost:8080/v1. Anda menguji perutean pesan end-to-end. Validasi skema Apidog mengkonfirmasi format panggilan alat sesuai dengan yang diharapkan OpenClaw.
Desain dan Dokumentasikan Endpoint Anda di Apidog
Anda menggunakan desainer visual Apidog untuk memodelkan skema penyelesaian obrolan. Anda mengimpor spesifikasi OpenAI resmi. Anda menyesuaikannya untuk parameter qwen3.5. Anda membuat dokumentasi interaktif secara otomatis. Anda membagikan dokumen dengan rekan tim melalui ruang kerja Apidog jika Anda bekerja sama.

Anda juga membuat respons tiruan di dalam Apidog. Anda mensimulasikan panggilan alat sebelum Anda menyelesaikan pengaturan OpenClaw lengkap. Oleh karena itu, Anda mengembangkan lebih cepat dan menguji kasus-kasus ekstrem dengan aman.
Konfigurasi Lanjut untuk Kinerja yang Lebih Baik
Anda membuat Modelfile khusus ketika Anda membutuhkan kuantisasi yang lebih ringan:
FROM qwen3.5:35b
PARAMETER num_gpu 999
PARAMETER num_ctx 131072
Anda membangunnya dengan ollama create qwen3.5:35b-q4 -f Modelfile. Anda memperbarui konfigurasi OpenClaw Anda untuk menggunakan tag baru.
Anda mengaktifkan visi dengan mengirimkan gambar base64 dalam pesan obrolan. Qwen3.5 memproses tangkapan layar yang ditangkap OpenClaw selama tugas browser. Oleh karena itu, Anda mengotomatisasi formulir yang membutuhkan pemahaman visual.
Anda menginstal keterampilan tambahan:
openclaw skill install @community/calendar
openclaw skill install @community/github
Setiap skill mendaftarkan skema JSON. Qwen3.5 belajar untuk memanggilnya secara otomatis. Anda memantau penggunaan di dalam dasbor OpenClaw.
Alur Kerja Dunia Nyata yang Anda Jalankan Hari Ini
Anda menggunakan tumpukan ini untuk tinjauan kode. Anda mengirim pesan ke OpenClaw: “Tinjau PR di repo saya dan sarankan refaktor.” Agen mengkloning repositori, menganalisis kode, dan membuat patch.
Anda mengotomatisasi tugas-tugas pribadi. Anda menulis: “Periksa kotak masuk saya untuk konfirmasi penerbangan dan tambahkan ke kalender.” OpenClaw mengurai email dan memperbarui kalender Anda.
Anda membangun asisten penelitian. Anda mengirim tangkapan layar PDF dan meminta ringkasan ditambah pertanyaan lanjutan. Qwen3.5 mengekstrak teks dengan akurat. OpenClaw menjaga konteks selama berhari-hari.
Anda menjalankan beberapa agen. Anda meluncurkan ruang kerja OpenClaw terpisah. Satu menggunakan qwen3.5:35b untuk pekerjaan umum. Yang lain menggunakan model koder khusus. Gateway merutekan pesan dengan benar.
Optimalkan Kecepatan dan Penggunaan Memori
Anda mengatur OLLAMA_NUM_GPU=999 untuk menggunakan semua lapisan GPU. Anda memantau dengan nvidia-smi. Pada Apple Silicon Anda mengaktifkan flash attention.
Anda mengurangi pembengkakan konteks dengan prompt ringkasan berkala yang dijalankan qwen3.5 secara otomatis. Anda membandingkan tingkat token per detik. Model 35B mencapai 45–60 token per detik pada GPU kelas 4090. Anda memilih varian yang sesuai dengan perangkat keras Anda.
Anda menggunakan pengujian kinerja Apidog untuk mengukur latensi di 100 permintaan. Anda menyesuaikan suhu dan max_tokens hingga Anda mencapai waktu respons target Anda.
Selesaikan Masalah Umum dengan Cepat
Anda melihat “model not found.” Anda menjalankan ollama list dan mengoreksi tag di konfigurasi Anda.
Anda mengalami latensi tinggi. Anda memeriksa log dengan journalctl -u ollama dan meningkatkan lapisan GPU. Anda menggunakan Apidog untuk menguji ulang permintaan yang sama dan mengkonfirmasi peningkatan.
Penguraian panggilan alat gagal. Anda mengunci suhu pada 0.7 di dalam skenario pengujian Apidog dan menjalankan ulang.
OpenClaw kehilangan koneksi ke aplikasi pesan. Anda menjalankan openclaw configure --section channels untuk menyegarkan token.
Anda mencapai batas laju di Ollama. Anda meningkatkan pengaturan konkurensi dan menguji lagi di Apidog.
Anda menggunakan panel inspeksi kesalahan Apidog untuk setiap masalah. Jejak tumpukan visual dan perbandingan respons mempercepat perbaikan secara dramatis.
Jaga Pengaturan Anda Tetap Aman
Anda menjalankan OpenClaw di bawah akun pengguna khusus. Anda mengaktifkan sandboxing untuk eksekusi alat. Anda tidak pernah mengekspos port 11434 atau 8080 secara publik. Anda mengaksesnya melalui terowongan SSH atau Tailscale saat Anda bepergian.
Anda meninjau setiap sumber skill sebelum menginstalnya. Anda mengaktifkan enkripsi memori di pengaturan OpenClaw. Anda mencadangkan folder ~/.openclaw secara teratur.
Oleh karena itu, Anda mengoperasikan sistem yang lebih aman daripada sebagian besar layanan cloud karena data Anda tidak pernah meninggalkan jaringan Anda.
Rencanakan Pembaruan di Masa Depan
Alibaba merilis varian Qwen3.5 yang lebih kecil secara teratur. Ollama menambahkannya dengan cepat. Anda menarik pembaruan dengan ollama pull qwen3.5:35b --force.
Pustaka skill OpenClaw bertambah setiap minggu. Anda memeriksa notifikasi GitHub untuk tetap terkini.
Anda mengulangi proses pengujian Apidog setelah setiap pembaruan. Anda menyimpan koleksi pengujian Anda dan cukup mengubah tag model. Oleh karena itu, Anda menjaga keandalan tanpa pekerjaan ekstra.
Kesimpulan
Anda sekarang menjalankan qwen3.5 dengan OpenClaw secara gratis menggunakan Ollama. Anda mengendalikan seluruh tumpukan di perangkat keras Anda. Anda mendapatkan penalaran yang kuat, dukungan visi, memori persisten, dan otomatisasi proaktif.
Anda mengikuti langkah-langkah yang jelas. Anda menguji setiap lapisan dengan Apidog. Anda mengoptimalkan kinerja dan mengamankan lingkungan. Pilihan konfigurasi kecil menghasilkan agen AI pribadi yang mumpuni.
Buka terminal Anda sekarang. Jalankan perintah peluncuran. Hubungkan aplikasi pesan Anda. Kirim tugas pertama Anda. Anda akan melihat betapa kuatnya agen yang sepenuhnya lokal.
Unduh Apidog untuk mengikuti pembaruan di masa mendatang dan terus menguji endpoint Anda secara efisien. Anda sudah memiliki semua yang Anda butuhkan untuk membangun alur kerja yang lebih cerdas hari ini.

