Ingin AI Anda mengambil alih dan menjelajahi web untuk Anda—memesan penerbangan, mengumpulkan data, atau bahkan mengisi formulir? Dengan Browser Use, Ollama, dan DeepSeek, Anda dapat membuat agen AI lokal yang mengendalikan browser Anda seperti seorang profesional. Trio open-source ini menawarkan otomatisasi yang berfokus pada privasi tanpa biaya berlangganan yang mahal. Dalam panduan pemula ini, saya akan memandu Anda cara mengatur Browser Use dengan Ollama dan DeepSeek untuk mengotomatisasi tugas web. Siap menjadikan browser Anda sebagai teman AI yang bertenaga? Mari kita mulai!

Apa itu Browser Use dengan Ollama dan DeepSeek?
Browser Use adalah pustaka Python open-source yang memungkinkan agen AI mengendalikan browser web, mengotomatisasi tugas seperti mencari, mengklik tautan, atau mengirimkan formulir. Dipadukan dengan Ollama, sebuah platform untuk menjalankan model bahasa besar lokal (LLM), dan DeepSeek, model penalaran open-source yang kuat, Anda mendapatkan pengaturan gratis dan privat yang bersaing dengan alat premium seperti ChatGPT Operator. Browser Use menggunakan Playwright untuk berinteraksi dengan browser (Chrome, Firefox, dll.), sementara kecerdasan DeepSeek menangani instruksi kompleks. Mengapa ini luar biasa? Ini lokal, dapat disesuaikan, dan memungkinkan AI Anda menangani tugas seperti mencari penerbangan di Kayak, membuat Google Docs, dan banyak lagi. Mari kita bangun!

Menyiapkan Lingkungan Anda: Dasar-Dasar
Sebelum kita meluncurkan Browser Use, mari kita siapkan sistem Anda dengan alat yang Anda perlukan. Pengaturan ini ramah pemula, dengan setiap langkah dijelaskan agar Anda tahu persis apa yang terjadi.
Langkah 1: Prasyarat
Pastikan Anda telah menginstal yang berikut:
- Python: Versi 3.11 atau lebih tinggi. Jalankan
python --version
di terminal Anda. Jika tidak ada atau kedaluwarsa, unduh dari python.org. Python adalah tulang punggung untuk menjalankan Browser Use dan skripnya. - Ollama: Ini menjalankan DeepSeek secara lokal, menjaga semuanya tetap privat. Anda akan mengunduhnya dari ollama.com di bagian selanjutnya.
- Node.js: Diperlukan untuk ketergantungan otomatisasi browser Playwright. Periksa dengan
node --version
. Jika belum diinstal, ambil dari nodejs.org. - Git: Digunakan untuk mengkloning repositori Browser Use. Instal dari git-scm.com jika Anda belum memilikinya.
- Perangkat Keras: CPU 4+ core, RAM 16GB+, dan 12GB+ ruang penyimpanan gratis untuk model DeepSeek. GPU bersifat opsional tetapi mempercepat inferensi model. Jika ada yang hilang, instal sekarang untuk menghindari masalah nanti.
Langkah 2: Buat Folder Proyek
Ayo kita jaga proyek Anda tetap teratur dengan membuat folder khusus:
mkdir browser-use-agent
cd browser-use-agent
Folder ini akan menampung semua file Browser Use Anda, dan cd memindahkan Anda ke dalamnya sehingga Anda siap untuk langkah-langkah berikutnya.
Langkah 3: Kloning Repositori
Ambil kode sumber Browser Use dari GitHub:
git clone https://github.com/browser-use/browser-use.git
cd browser-use
Perintah git clone mengunduh kode Browser Use terbaru, dan cd browser-use menempatkan Anda di dalam direktori proyek di mana keajaiban terjadi.
Langkah 4: Atur Lingkungan Virtual
Untuk menghindari konflik dengan proyek Python lainnya, buat lingkungan virtual:
python -m venv venv
Aktifkan:
- Mac/Linux: source venv/bin/activate
- Windows: venv\Scripts\activate
Anda akan melihat (venv)
di terminal Anda, yang berarti Anda sekarang berada di lingkungan Python yang bersih. Ini menjaga ketergantungan Browser Use terisolasi, mencegah bentrokan versi.
Langkah 5: Buka di VS Code
Luncurkan proyek Anda di Visual Studio Code untuk kemudahan pengkodean:
code .
VS Code akan membuka folder browser-use, siap untuk Anda membuat dan menjalankan skrip. Jika Anda belum memiliki VS Code, instal dari situs resmi mereka atau gunakan editor lain, tetapi integrasi Python VS Code sangat berguna.
Menginstal Ollama dan DeepSeek
Sekarang, mari kita atur Ollama untuk menjalankan DeepSeek secara lokal, memberikan agen Browser Use Anda otak yang kuat dan privat. Setiap langkah sangat penting, jadi saya akan menjelaskannya dengan jelas.
Langkah 1: Instal Ollama
Arahkan ke ollama.com dan unduh penginstal untuk OS Anda (Mac, Windows, atau Linux). Jalankan penginstal dan ikuti petunjuknya—ini adalah proses cepat “next, next, finish”. Verifikasi bahwa itu berfungsi:
ollama --version
Anda harus melihat nomor versi, seperti 0.1.44 (April 2025). Jika gagal, pastikan Ollama ditambahkan ke PATH sistem Anda (periksa petunjuk penginstal). Ollama bertindak sebagai server yang menghosting DeepSeek, menghubungkannya ke Browser Use.

Langkah 2: Unduh DeepSeek
Kita akan menggunakan model deepseek/seed, sebuah LLM 7B-parameter yang dioptimalkan untuk penalaran dan sempurna untuk kebutuhan kita:
ollama pull deepseek/seed
Ini mengunduh model, yang berukuran sekitar 12GB (jika model terlalu besar atau Anda tidak memiliki GPU di sistem Anda, coba: qwen2.5:14b
yang berukuran sekitar 4GB), jadi mungkin memerlukan beberapa menit tergantung pada kecepatan internet Anda. Setelah selesai, periksa apakah sudah terinstal:
ollama list
Cari deepseek/seed:latest dalam daftar. Model ini akan memberdayakan agen Browser Use Anda, menangani tugas seperti mencari cuaca Boston dengan mudah.

Menginstal Browser Use
Dengan lingkungan Anda siap, mari kita instal Browser Use dan ketergantungannya untuk mengaktifkan otomatisasi browser. Ini adalah saat proyek Anda mulai terwujud!
Langkah 1: Instal Browser Use dan Ketergantungan
Di lingkungan virtual yang telah diaktifkan (di dalam folder browser-use), instal Browser Use beserta ketergantungan pengembangannya:
pip install . ."[dev]"
Perintah ini menginstal Browser Use dari repositori yang dikloning, termasuk alat tambahan untuk pengembangan. Bagian "[dev]" memastikan Anda mendapatkan alat pengujian dan debugging, yang sangat berguna bagi pemula.
Langkah 2: Instal LangChain dan Ollama
Tambahkan paket yang diperlukan untuk menghubungkan Browser Use ke DeepSeek:
pip install langchain langchain-ollama
langchain menyediakan kerangka kerja untuk interaksi LLM, dan langchain-ollama adalah konektor spesifik untuk model-model Ollama, membuatnya mudah untuk mengintegrasikan DeepSeek.
Langkah 3: Instal Playwright
Dapatkan Playwright, mesin yang memungkinkan Browser Use mengendalikan browser:
playwright install
Ini mengunduh biner browser (misalnya, untuk Chrome) yang digunakan Browser Use untuk menjelajahi web. Jika Anda mengalami masalah, pastikan Anda menggunakan Python 3.11+ atau jalankan playwright install-deps untuk ketergantungan sistem tambahan.
Mengonfigurasi Browser Use dengan Ollama dan DeepSeek
Ayo kita siapkan Browser Use untuk bekerja dengan model DeepSeek Ollama dengan memulai server Ollama. Langkah ini singkat dan manis, karena skrip kita akan menangani sisa koneksi!
Mulai Server Ollama: Pastikan Ollama berjalan untuk melayani model DeepSeek. Di terminal terpisah (di luar lingkungan virtual Anda), jalankan:
ollama serve
Ini memulai server Ollama di http://localhost:11434, memungkinkan Browser Use untuk berkomunikasi dengan DeepSeek. Pastikan terminal ini tetap terbuka selama proyek Anda, karena ini adalah jembatan antara agen Anda dan LLM. Jika tidak berjalan, skrip Anda akan gagal, jadi periksa kembali!
Membangun Agen Browser Use Anda
Sekarang bagian yang menyenangkan—membangun agen AI yang mengendalikan browser Anda dengan Browser Use! Kita akan membuat skrip untuk membuat DeepSeek menggunakan Google untuk mencari cuaca di Boston, Massachusetts, dan menjalankannya di VS Code. Setiap langkah dijelaskan secara rinci untuk memastikan Anda berhasil.
1. Buat File Bernama test.py: Di VS Code, dengan proyek browser-use Anda terbuka, buat file baru bernama test.py di dalam folder browser-use. Tempelkan kode ini:
import os
import asyncio
from browser_use import Agent
from langchain_ollama import ChatOllama
# Tugas: Gunakan Google untuk menemukan cuaca di Boston, Massachusetts
async def run_search() -> str:
agent = Agent(
task="Gunakan Google untuk menemukan cuaca di Boston, Massachusetts",
llm=ChatOllama(
model="deepseek/seed",
num_ctx=32000,
),
max_actions_per_step=3,
tool_call_in_content=False,
)
result = await agent.run(max_steps=15)
return result
async def main():
result = await run_search()
print("\n\n", result)
if __name__ == "__main__":
asyncio.run(main())
Skrip ini menyiapkan agen Browser Use yang:
- Menggunakan ChatOllama untuk terhubung ke DeepSeek (deepseek/seed) di http://localhost:11434.
- Melaksanakan tugas untuk mencari cuaca Boston di Google.
- Membatasi tindakan hingga 3 per langkah dan 15 langkah total untuk menjaga efisiensi.
- Mencetak hasil, yang harus mencakup suhu saat ini atau detail cuaca.
2. Pilih Interpreter Python di VS Code: Untuk menjalankan skrip, Anda memerlukan interpreter Python dari lingkungan virtual proyek Anda:
- Di VS Code, tekan
Ctrl + P
(atauCmd + P
di Mac). - Ketik > Pilih Interpreter Python dan tekan Enter.
- Pilih interpreter dari proyek Anda (misalnya,
.venv/bin/python
Mac/Linux atau.\venv\Scripts\python.exe
di Windows). Ini memastikan VS Code menggunakan Python dari lingkungan virtual, yang memiliki semua ketergantungan Browser Use Anda. Jika Anda melewatkan ini, Anda mungkin mendapatkan kesalahan"module not found"
.
3. Jalankan Kode: Dengan test.py terbuka, klik tombol “Run” di VS Code (segitiga di kanan atas) atau gunakan terminal (di dalam folder browser-use dengan lingkungan virtual aktif):
python test.py
Agen Browser Use Anda akan meluncurkan browser, pergi ke Google, mencari “cuaca di Boston, Massachusetts,” dan mengekstrak hasilnya.

Ketika saya menjalankan ini, itu mencetak sesuatu seperti “Suhu saat ini di Boston, MA, adalah 26°F.” Jika tidak berhasil, pastikan server Ollama berjalan (ollama serve) dan port 11434 terbuka. Periksa ~/.ollama/logs
untuk kesalahan jika terhenti.

Rekayasa Prompt untuk Hasil yang Lebih Baik
Untuk mendapatkan yang terbaik dari Browser Use, buatlah prompt yang tepat:
- Jelas: “Kunjungi kayak.com, cari penerbangan dari Zurich ke Beijing, 25.12.2025–02.02.2026, urutkan berdasarkan harga” lebih baik daripada “Temukan penerbangan.”
- Gunakan Langkah: Untuk tugas kompleks, seperti lamaran pekerjaan, coba: “Kunjungi LinkedIn, cari pekerjaan ML, simpan tautan ke file, lamar 3 teratas.”
- Iterasi: Jika hasilnya kurang tepat, sesuaikan prompt atau coba di obrolan Open WebUI terlebih dahulu.
Menambahkan “urutkan berdasarkan harga” ke prompt penerbangan saya menghemat uang—prompt adalah kuncinya!
Mengapa Browser Use, Ollama, dan DeepSeek Menarik
Pengaturan ini bersinar karena:
- Gratis dan Open-Source: Tanpa biaya, tidak seperti alat berbasis cloud.
- Privat: Eksekusi lokal menjaga data Anda aman.
- Pintar: Penalaran DeepSeek menyelesaikan tugas web yang kompleks dengan baik.
Ini adalah alternatif yang ramah anggaran untuk agen AI premium, dengan kontrol penuh.
Tips Pro untuk Sukses Browser Use
- Tingkatkan Kinerja: Gunakan GPU atau model DeepSeek yang lebih besar (misalnya, 14B) jika sistem Anda memungkinkan.
- Debug Logs: Periksa Ollama (
~/.ollama/logs
) atau log Playwright jika Browser Use tidak berfungsi dengan baik. - Coba Tugas Baru: Otomatisasi “Draf Google Doc” atau “Ambil bintang GitHub”.
- Bergabung dengan Komunitas: Bagikan tips di GitHub Browser Use atau Discord Ollama.
Penutup: Petualangan Browser Use Anda Dimulai
Selamat—Anda telah membangun agen AI yang mengendalikan browser Anda dengan Browser Use, Ollama, dan DeepSeek! Dari memesan penerbangan hingga mengotomatisasi tugas web, Anda siap membiarkan AI melakukan pekerjaan berat. Cobalah untuk mengambil daftar pekerjaan atau mengotomatisasi email selanjutnya—langit adalah batasnya. Kunjungi GitHub Browser Use untuk lebih banyak contoh, dan bergabunglah dengan hype AI. Dan jangan lupa untuk mampir ke apidog.com untuk sentuhan API itu.