Apidog

Platform Pengembangan API Kolaboratif All-in-one

Desain API

Dokumentasi API

Debug API

Mocking API

Pengujian Otomatis API

Cara Mengendalikan Browser Anda dengan AI Menggunakan Browser Use, Ollama, dan DeepSeek: Panduan untuk Pemula

Ardianto Nugroho

Ardianto Nugroho

Updated on April 22, 2025

Ingin AI Anda mengambil alih dan menjelajahi web untuk Anda—memesan penerbangan, mengumpulkan data, atau bahkan mengisi formulir? Dengan Browser Use, Ollama, dan DeepSeek, Anda dapat membuat agen AI lokal yang mengendalikan browser Anda seperti seorang profesional. Trio open-source ini menawarkan otomatisasi yang berfokus pada privasi tanpa biaya berlangganan yang mahal. Dalam panduan pemula ini, saya akan memandu Anda cara mengatur Browser Use dengan Ollama dan DeepSeek untuk mengotomatisasi tugas web. Siap menjadikan browser Anda sebagai teman AI yang bertenaga? Mari kita mulai!

💡
Tapi sebelum kita terjun ke Browser Use, sedikit pengantar tentang Apidog—alat luar biasa untuk para pecinta API! Ini menyederhanakan desain, pengujian, dan dokumentasi API, sempurna untuk menyesuaikan integrasi agen AI Anda. Periksa di apidog.com—ini adalah impian seorang coder!
button
gambar ui apidog

Apa itu Browser Use dengan Ollama dan DeepSeek?

Browser Use adalah pustaka Python open-source yang memungkinkan agen AI mengendalikan browser web, mengotomatisasi tugas seperti mencari, mengklik tautan, atau mengirimkan formulir. Dipadukan dengan Ollama, sebuah platform untuk menjalankan model bahasa besar lokal (LLM), dan DeepSeek, model penalaran open-source yang kuat, Anda mendapatkan pengaturan gratis dan privat yang bersaing dengan alat premium seperti ChatGPT Operator. Browser Use menggunakan Playwright untuk berinteraksi dengan browser (Chrome, Firefox, dll.), sementara kecerdasan DeepSeek menangani instruksi kompleks. Mengapa ini luar biasa? Ini lokal, dapat disesuaikan, dan memungkinkan AI Anda menangani tugas seperti mencari penerbangan di Kayak, membuat Google Docs, dan banyak lagi. Mari kita bangun!

gambar browser-use

Menyiapkan Lingkungan Anda: Dasar-Dasar

Sebelum kita meluncurkan Browser Use, mari kita siapkan sistem Anda dengan alat yang Anda perlukan. Pengaturan ini ramah pemula, dengan setiap langkah dijelaskan agar Anda tahu persis apa yang terjadi.

Langkah 1: Prasyarat

Pastikan Anda telah menginstal yang berikut:

  • Python: Versi 3.11 atau lebih tinggi. Jalankan python --version di terminal Anda. Jika tidak ada atau kedaluwarsa, unduh dari python.org. Python adalah tulang punggung untuk menjalankan Browser Use dan skripnya.
  • Ollama: Ini menjalankan DeepSeek secara lokal, menjaga semuanya tetap privat. Anda akan mengunduhnya dari ollama.com di bagian selanjutnya.
  • Node.js: Diperlukan untuk ketergantungan otomatisasi browser Playwright. Periksa dengan node --version. Jika belum diinstal, ambil dari nodejs.org.
  • Git: Digunakan untuk mengkloning repositori Browser Use. Instal dari git-scm.com jika Anda belum memilikinya.
  • Perangkat Keras: CPU 4+ core, RAM 16GB+, dan 12GB+ ruang penyimpanan gratis untuk model DeepSeek. GPU bersifat opsional tetapi mempercepat inferensi model. Jika ada yang hilang, instal sekarang untuk menghindari masalah nanti.

Langkah 2: Buat Folder Proyek

Ayo kita jaga proyek Anda tetap teratur dengan membuat folder khusus:

mkdir browser-use-agent
cd browser-use-agent

Folder ini akan menampung semua file Browser Use Anda, dan cd memindahkan Anda ke dalamnya sehingga Anda siap untuk langkah-langkah berikutnya.

Langkah 3: Kloning Repositori

Ambil kode sumber Browser Use dari GitHub:

git clone https://github.com/browser-use/browser-use.git
cd browser-use

Perintah git clone mengunduh kode Browser Use terbaru, dan cd browser-use menempatkan Anda di dalam direktori proyek di mana keajaiban terjadi.

Langkah 4: Atur Lingkungan Virtual

Untuk menghindari konflik dengan proyek Python lainnya, buat lingkungan virtual:

python -m venv venv

Aktifkan:

  • Mac/Linux: source venv/bin/activate
  • Windows: venv\Scripts\activate

Anda akan melihat (venv) di terminal Anda, yang berarti Anda sekarang berada di lingkungan Python yang bersih. Ini menjaga ketergantungan Browser Use terisolasi, mencegah bentrokan versi.

Langkah 5: Buka di VS Code

Luncurkan proyek Anda di Visual Studio Code untuk kemudahan pengkodean:

code .

VS Code akan membuka folder browser-use, siap untuk Anda membuat dan menjalankan skrip. Jika Anda belum memiliki VS Code, instal dari situs resmi mereka atau gunakan editor lain, tetapi integrasi Python VS Code sangat berguna.

Menginstal Ollama dan DeepSeek

Sekarang, mari kita atur Ollama untuk menjalankan DeepSeek secara lokal, memberikan agen Browser Use Anda otak yang kuat dan privat. Setiap langkah sangat penting, jadi saya akan menjelaskannya dengan jelas.

Langkah 1: Instal Ollama

Arahkan ke ollama.com dan unduh penginstal untuk OS Anda (Mac, Windows, atau Linux). Jalankan penginstal dan ikuti petunjuknya—ini adalah proses cepat “next, next, finish”. Verifikasi bahwa itu berfungsi:

ollama --version

Anda harus melihat nomor versi, seperti 0.1.44 (April 2025). Jika gagal, pastikan Ollama ditambahkan ke PATH sistem Anda (periksa petunjuk penginstal). Ollama bertindak sebagai server yang menghosting DeepSeek, menghubungkannya ke Browser Use.

unduh ollama

Langkah 2: Unduh DeepSeek

Kita akan menggunakan model deepseek/seed, sebuah LLM 7B-parameter yang dioptimalkan untuk penalaran dan sempurna untuk kebutuhan kita:

ollama pull deepseek/seed

Ini mengunduh model, yang berukuran sekitar 12GB (jika model terlalu besar atau Anda tidak memiliki GPU di sistem Anda, coba: qwen2.5:14b yang berukuran sekitar 4GB), jadi mungkin memerlukan beberapa menit tergantung pada kecepatan internet Anda. Setelah selesai, periksa apakah sudah terinstal:

ollama list

Cari deepseek/seed:latest dalam daftar. Model ini akan memberdayakan agen Browser Use Anda, menangani tugas seperti mencari cuaca Boston dengan mudah.

menarik model deepseek

Menginstal Browser Use

Dengan lingkungan Anda siap, mari kita instal Browser Use dan ketergantungannya untuk mengaktifkan otomatisasi browser. Ini adalah saat proyek Anda mulai terwujud!

Langkah 1: Instal Browser Use dan Ketergantungan

Di lingkungan virtual yang telah diaktifkan (di dalam folder browser-use), instal Browser Use beserta ketergantungan pengembangannya:

pip install . ."[dev]"

Perintah ini menginstal Browser Use dari repositori yang dikloning, termasuk alat tambahan untuk pengembangan. Bagian "[dev]" memastikan Anda mendapatkan alat pengujian dan debugging, yang sangat berguna bagi pemula.

Langkah 2: Instal LangChain dan Ollama

Tambahkan paket yang diperlukan untuk menghubungkan Browser Use ke DeepSeek:

pip install langchain langchain-ollama

langchain menyediakan kerangka kerja untuk interaksi LLM, dan langchain-ollama adalah konektor spesifik untuk model-model Ollama, membuatnya mudah untuk mengintegrasikan DeepSeek.

Langkah 3: Instal Playwright

Dapatkan Playwright, mesin yang memungkinkan Browser Use mengendalikan browser:

playwright install

Ini mengunduh biner browser (misalnya, untuk Chrome) yang digunakan Browser Use untuk menjelajahi web. Jika Anda mengalami masalah, pastikan Anda menggunakan Python 3.11+ atau jalankan playwright install-deps untuk ketergantungan sistem tambahan.

Mengonfigurasi Browser Use dengan Ollama dan DeepSeek

Ayo kita siapkan Browser Use untuk bekerja dengan model DeepSeek Ollama dengan memulai server Ollama. Langkah ini singkat dan manis, karena skrip kita akan menangani sisa koneksi!

Mulai Server Ollama: Pastikan Ollama berjalan untuk melayani model DeepSeek. Di terminal terpisah (di luar lingkungan virtual Anda), jalankan:

ollama serve

Ini memulai server Ollama di http://localhost:11434, memungkinkan Browser Use untuk berkomunikasi dengan DeepSeek. Pastikan terminal ini tetap terbuka selama proyek Anda, karena ini adalah jembatan antara agen Anda dan LLM. Jika tidak berjalan, skrip Anda akan gagal, jadi periksa kembali!

Membangun Agen Browser Use Anda

Sekarang bagian yang menyenangkan—membangun agen AI yang mengendalikan browser Anda dengan Browser Use! Kita akan membuat skrip untuk membuat DeepSeek menggunakan Google untuk mencari cuaca di Boston, Massachusetts, dan menjalankannya di VS Code. Setiap langkah dijelaskan secara rinci untuk memastikan Anda berhasil.

1. Buat File Bernama test.py: Di VS Code, dengan proyek browser-use Anda terbuka, buat file baru bernama test.py di dalam folder browser-use. Tempelkan kode ini:

import os
import asyncio
from browser_use import Agent
from langchain_ollama import ChatOllama

# Tugas: Gunakan Google untuk menemukan cuaca di Boston, Massachusetts
async def run_search() -> str:
    agent = Agent(
        task="Gunakan Google untuk menemukan cuaca di Boston, Massachusetts",
        llm=ChatOllama(
            model="deepseek/seed",
            num_ctx=32000,
        ),
        max_actions_per_step=3,
        tool_call_in_content=False,
    )
    result = await agent.run(max_steps=15)
    return result

async def main():
    result = await run_search()
    print("\n\n", result)

if __name__ == "__main__":
    asyncio.run(main())

Skrip ini menyiapkan agen Browser Use yang:

  • Menggunakan ChatOllama untuk terhubung ke DeepSeek (deepseek/seed) di http://localhost:11434.
  • Melaksanakan tugas untuk mencari cuaca Boston di Google.
  • Membatasi tindakan hingga 3 per langkah dan 15 langkah total untuk menjaga efisiensi.
  • Mencetak hasil, yang harus mencakup suhu saat ini atau detail cuaca.

2. Pilih Interpreter Python di VS Code: Untuk menjalankan skrip, Anda memerlukan interpreter Python dari lingkungan virtual proyek Anda:

  • Di VS Code, tekan Ctrl + P (atau Cmd + P di Mac).
  • Ketik > Pilih Interpreter Python dan tekan Enter.
  • Pilih interpreter dari proyek Anda (misalnya, .venv/bin/python Mac/Linux atau .\venv\Scripts\python.exe di Windows). Ini memastikan VS Code menggunakan Python dari lingkungan virtual, yang memiliki semua ketergantungan Browser Use Anda. Jika Anda melewatkan ini, Anda mungkin mendapatkan kesalahan "module not found".

3. Jalankan Kode: Dengan test.py terbuka, klik tombol “Run” di VS Code (segitiga di kanan atas) atau gunakan terminal (di dalam folder browser-use dengan lingkungan virtual aktif):

python test.py

Agen Browser Use Anda akan meluncurkan browser, pergi ke Google, mencari “cuaca di Boston, Massachusetts,” dan mengekstrak hasilnya.

pencarian browser-use

Ketika saya menjalankan ini, itu mencetak sesuatu seperti “Suhu saat ini di Boston, MA, adalah 26°F.” Jika tidak berhasil, pastikan server Ollama berjalan (ollama serve) dan port 11434 terbuka. Periksa ~/.ollama/logs untuk kesalahan jika terhenti.

hasil pencarian browser-use

Rekayasa Prompt untuk Hasil yang Lebih Baik

Untuk mendapatkan yang terbaik dari Browser Use, buatlah prompt yang tepat:

  • Jelas: “Kunjungi kayak.com, cari penerbangan dari Zurich ke Beijing, 25.12.2025–02.02.2026, urutkan berdasarkan harga” lebih baik daripada “Temukan penerbangan.”
  • Gunakan Langkah: Untuk tugas kompleks, seperti lamaran pekerjaan, coba: “Kunjungi LinkedIn, cari pekerjaan ML, simpan tautan ke file, lamar 3 teratas.”
  • Iterasi: Jika hasilnya kurang tepat, sesuaikan prompt atau coba di obrolan Open WebUI terlebih dahulu.

Menambahkan “urutkan berdasarkan harga” ke prompt penerbangan saya menghemat uang—prompt adalah kuncinya!

Mengapa Browser Use, Ollama, dan DeepSeek Menarik

Pengaturan ini bersinar karena:

  • Gratis dan Open-Source: Tanpa biaya, tidak seperti alat berbasis cloud.
  • Privat: Eksekusi lokal menjaga data Anda aman.
  • Pintar: Penalaran DeepSeek menyelesaikan tugas web yang kompleks dengan baik.

Ini adalah alternatif yang ramah anggaran untuk agen AI premium, dengan kontrol penuh.

Tips Pro untuk Sukses Browser Use

  • Tingkatkan Kinerja: Gunakan GPU atau model DeepSeek yang lebih besar (misalnya, 14B) jika sistem Anda memungkinkan.
  • Debug Logs: Periksa Ollama (~/.ollama/logs) atau log Playwright jika Browser Use tidak berfungsi dengan baik.
  • Coba Tugas Baru: Otomatisasi “Draf Google Doc” atau “Ambil bintang GitHub”.
  • Bergabung dengan Komunitas: Bagikan tips di GitHub Browser Use atau Discord Ollama.

Penutup: Petualangan Browser Use Anda Dimulai

Selamat—Anda telah membangun agen AI yang mengendalikan browser Anda dengan Browser Use, Ollama, dan DeepSeek! Dari memesan penerbangan hingga mengotomatisasi tugas web, Anda siap membiarkan AI melakukan pekerjaan berat. Cobalah untuk mengambil daftar pekerjaan atau mengotomatisasi email selanjutnya—langit adalah batasnya. Kunjungi GitHub Browser Use untuk lebih banyak contoh, dan bergabunglah dengan hype AI. Dan jangan lupa untuk mampir ke apidog.com untuk sentuhan API itu.

button