Munculnya model bahasa besar (LLM) sumber terbuka telah mempermudah pembuatan alat berbasis AI yang menyaingi solusi berpemilik seperti ChatGPT Operator dari OpenAI. Di antara model sumber terbuka ini, DeepSeek R1 menonjol karena kemampuan penalaran yang kuat, aksesibilitas gratis, dan kemampuan beradaptasi. Dengan menggabungkan DeepSeek R1 dengan alat seperti Browser Use, Anda dapat membangun alternatif sumber terbuka penuh yang kuat untuk ChatGPT Operator tanpa menghabiskan ratusan dolar untuk langganan premium.
Artikel ini akan memandu Anda melalui proses pengaturan DeepSeek R1 dan Browser Use untuk membuat agen AI yang mampu melakukan tugas-tugas kompleks, termasuk otomatisasi web, penalaran, dan interaksi bahasa alami.
Baik Anda seorang pemula atau pengembang berpengalaman, panduan langkah demi langkah ini akan membantu Anda untuk memulai.
Apa itu ChatGPT Operator dan Mengapa Anda Membutuhkan Alternatif Sumber Terbuka?
ChatGPT Operator adalah fitur premium yang ditawarkan oleh OpenAI yang memungkinkan pengguna untuk membuat agen AI tingkat lanjut yang mampu melakukan tugas-tugas kompleks seperti penalaran, otomatisasi web, dan pemecahan masalah multi-langkah.
ChatGPT Operator berharga $200 per bulan, sehingga kurang dapat diakses oleh individu, usaha kecil, atau organisasi dengan anggaran terbatas.
4. Booking a one-way flight from Zurich to Vienna using the Booking integration
— Rowan Cheung (@rowancheung) January 23, 2025
This one required a bit of back and forth, with ChatGPT Operator pinging me and asking for my flight preference and having me take control of entering payment details pic.twitter.com/XZiqUsQgVh
ChatGPT Operator sedang memesan tiket pesawat dalam video di atas
Mengapa Anda Membutuhkan Alternatif Sumber Terbuka
Meskipun ChatGPT Operator sangat kuat, ia memiliki beberapa keterbatasan yang membuat alternatif sumber terbuka menjadi menarik:
- Biaya: Biaya berlangganan $200/bulan bisa menjadi penghalang bagi banyak pengguna.
- Privasi Data: Menggunakan API berpemilik mengharuskan pengiriman data ke server eksternal, yang mungkin tidak sesuai dengan kebijakan privasi atau persyaratan peraturan.
- Kustomisasi Terbatas: Solusi berpemilik sering kali membatasi penyetelan halus atau optimasi khusus tugas, membatasi kemampuan adaptasinya untuk kasus penggunaan khusus.
Dengan memilih alat sumber terbuka seperti DeepSeek R1 dan Browser Use, Anda dapat mengatasi tantangan ini dan membuka beberapa manfaat:
- Penghematan Biaya: Baik DeepSeek R1 dan Browser Use sepenuhnya gratis dan sumber terbuka, menghilangkan biaya berlangganan.
- Kontrol Penuh: Menjalankan alat secara lokal atau di server Anda sendiri memastikan privasi dan keamanan data yang lengkap
- Kemampuan Kustomisasi: Anda dapat menyetel model dengan baik untuk tugas-tugas tertentu, mengintegrasikannya dengan alat lain, dan memodifikasi sistem untuk memenuhi kebutuhan unik Anda.
Pendekatan sumber terbuka tidak hanya mengurangi ketergantungan pada platform berpemilik tetapi juga memberdayakan Anda untuk membangun solusi yang disesuaikan dengan kebutuhan Anda sambil mempertahankan kendali atas biaya dan data.
Anda harus melihat Apidog, alat Pengujian API All-in-One yang menjalankan Anda melalui seluruh siklus, dari desain API hingga Dokumentasi API, dan meningkatkan produktivitas tim pengembangan Anda!

Komponen Utama: DeepSeek R1 dan Browser Use
DeepSeek R1
DeepSeek R1 adalah LLM sumber terbuka yang dioptimalkan untuk tugas-tugas penalaran. Ia unggul dalam pemecahan masalah rantai-pikiran, bantuan pengkodean, dan pemahaman bahasa alami. Ia tersedia dalam berbagai ukuran (misalnya, parameter 1,5B, 7B), sehingga dapat diadaptasi dengan kemampuan perangkat keras yang berbeda.
Browser Use
Browser Use adalah alat sumber terbuka yang memungkinkan agen AI untuk melakukan tugas berbasis browser seperti pengikisan web, pengisian formulir, dan navigasi otomatis. Ia menyediakan antarmuka yang ramah pengguna dan dapat diintegrasikan dengan LLM seperti DeepSeek R1 untuk fungsionalitas yang ditingkatkan.

Langkah 1: Menyiapkan Lingkungan Anda
Persyaratan Perangkat Keras
- Untuk versi DeepSeek R1 yang lebih kecil (misalnya, parameter 1,5B), CPU atau GPU kelas menengah (VRAM 8GB) sudah cukup.
- Versi yang lebih besar membutuhkan GPU kelas atas (misalnya, NVIDIA A100 atau RTX 4090).
Sistem Operasi
- Linux atau macOS direkomendasikan untuk kemudahan pengaturan. Pengguna Windows dapat menggunakan WSL (Windows Subsystem for Linux).
Lingkungan Python
Buat lingkungan virtual Python untuk mengisolasi dependensi:
python -m venv venv
source venv/bin/activate # Di Linux/macOS
# Di Windows:
# venv\Scripts\activate
Instal pustaka yang diperlukan:
pip install torch torchvision transformers sentencepiece
Langkah 2: Jalankan DeepSeek dengan API atau Secara Lokal dengan Ollama
Penggunaan API DeepSeek
Untuk berinteraksi dengan API DeepSeek, ikuti langkah-langkah yang diperbarui ini:
Dapatkan Kunci API:
- Daftar di platform DeepSeek dan hasilkan kunci API dari bagian "Kunci API". Simpan kunci ini dengan aman karena tidak akan ditampilkan lagi.
Lakukan Panggilan API Pertama Anda:
API DeepSeek kompatibel dengan format API OpenAI, sehingga mudah untuk diintegrasikan dengan SDK atau perangkat lunak OpenAI yang ada. Di bawah ini adalah contoh implementasi Python:
from openai import OpenAI
client = OpenAI(api_key="<Your_DeepSeek_API_Key>", base_url="https://api.deepseek.com")
response = client.chat.completions.create(
model="deepseek-reasoner", # Gunakan 'deepseek-reasoner' untuk DeepSeek-R1
messages=[
{"role": "system", "content": "Anda adalah asisten yang membantu."},
{"role": "user", "content": "Jelaskan keterikatan kuantum."}
],
stream=False # Atur ke True jika Anda menginginkan respons streaming
)
print(response.choices[0].message.content)
Contoh cURL:
Jika Anda lebih suka menggunakan cURL, berikut adalah cara Anda dapat membuat permintaan:
curl https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <Your_DeepSeek_API_Key>" \
-d '{
"model": "deepseek-reasoner",
"messages": [
{"role": "system", "content": "Anda adalah asisten yang membantu."},
{"role": "user", "content": "Apa ibu kota Prancis?"}
],
"stream": false
}'
Pemilihan Model:
- Tentukan
model="deepseek-reasoner"
untuk DeepSeek-R1. - Gunakan
model="deepseek-chat"
untuk tugas obrolan tujuan umum.
base_url
juga dapat diatur ke https://api.deepseek.com/v1
untuk konfigurasi yang kompatibel dengan OpenAI, meskipun jalur /v1
tidak memiliki hubungan dengan versi model.
Menjalankan DeepSeek Secara Lokal dengan Ollama
Ollama menyederhanakan menjalankan model bahasa besar seperti DeepSeek-R1 di mesin lokal Anda. Berikut adalah cara mengatur dan menggunakannya dengan benar:
Instal Ollama:
- Unduh dan instal Ollama dari situs web resminya.
Tarik Model yang Diinginkan:
Gunakan perintah berikut untuk mengunduh versi spesifik DeepSeek-R1:
# Untuk model 7B (default):
ollama pull deepseek-r1:7b
# Untuk model 1,5B yang lebih kecil:
ollama pull deepseek-r1:1.5b
# Untuk model yang lebih besar seperti 70B:
ollama pull deepseek-r1:70b
Jalankan Model Secara Lokal:
Setelah diunduh, jalankan model menggunakan:
ollama run deepseek-r1:7b
Ini akan memulai sesi interaktif di mana Anda dapat berinteraksi dengan model secara langsung.
Varian Model:
DeepSeek menawarkan beberapa versi sulingan berdasarkan arsitektur Qwen dan Llama, yang dioptimalkan untuk kasus penggunaan yang berbeda:
DeepSeek-R1-Distill-Qwen-7B:
ollama run deepseek-r1:7b-qwen-distill
DeepSeek-R1-Distill-Llama-70B:
ollama run deepseek-r1:70b-llama-distill
Pertimbangan Perangkat Keras:
- Model yang lebih kecil seperti 1,5B atau 7B dapat berjalan di GPU kelas konsumen atau bahkan CPU.
- Model yang lebih besar (misalnya, 70B) membutuhkan GPU kelas atas dengan VRAM yang signifikan (misalnya, NVIDIA A100 atau RTX 4090).
Obrolan Interaktif melalui API:
Ollama menyediakan API untuk mengintegrasikan model yang berjalan secara lokal ke dalam aplikasi Anda:
curl http://localhost:11434/api/chat -d '{
"model": "deepseek-r1:7b",
"messages": [
{"role": "user", "content": "Tulis puisi pendek tentang bintang-bintang."}
]
}'
Langkah 3: Menginstal Browser Use

Browser Use memungkinkan agen AI Anda untuk berinteraksi dengan peramban web. Ikuti langkah-langkah berikut:
Instalasi
Klon repositori Browser Use dari GitHub:
git clone https://github.com/browser-use/browser-use.git
cd browser-use
pip install -r requirements.txt
Konfigurasi
Siapkan WebUI Browser Use:
python webui.py
Buka WebUI di peramban Anda untuk mengonfigurasi pengaturan agen. Anda dapat menentukan:
- Model LLM (misalnya, DeepSeek R1)
- Pengaturan peramban (misalnya, ukuran jendela)
Langkah 4: Menggabungkan DeepSeek R1 dan Browser Use
Untuk membuat agen AI fungsional yang mengintegrasikan kedua alat:
Konfigurasi Agen
Modifikasi pengaturan agen di Browser Use untuk menghubungkannya dengan DeepSeek R1:
{
"model": "deepseek-r1",
"base_url": "http://localhost:5000",
"browser_settings": {
"window_height": 1080,
"window_width": 1920,
"keep_browser_open": true
}
}
Menjalankan Agen
Mulai DeepSeek R1 dan Browser Use:
# Mulai server API DeepSeek R1
python -m deepseek.api_server
# Mulai WebUI Browser Use
python webui.py
Setelah kedua layanan berjalan, agen dapat melakukan tugas-tugas seperti mengisi formulir, mengikis data, atau menavigasi situs web secara mandiri.
Langkah 5: Rekayasa Prompt untuk Hasil yang Lebih Baik
Untuk mengoptimalkan kinerja agen AI Anda, gunakan teknik rekayasa prompt. Misalnya:
Templat Prompt Umum
<instructions>
Anda adalah asisten AI yang bertugas mengotomatiskan tugas web menggunakan Browser Use.
Ikuti langkah-langkah ini:
1. Navigasi ke [situs web].
2. Lakukan [tugas spesifik].
3. Kembalikan hasil dalam format terstruktur.
</instructions>
<example>
Navigasi ke https://example.com dan ekstrak semua hyperlink.
</example>
Struktur ini memastikan kejelasan dan meningkatkan akurasi eksekusi tugas.
Berikut adalah beberapa demo yang dapat Anda coba dengan menjalankan:
uv pip install gradio
python examples/gradio_demo.py
Contoh 1.
Prompt: Tulis surat di Google Docs untuk Papa saya, berterima kasih padanya untuk segalanya, dan simpan dokumen sebagai PDF.

Contoh 2.
Prompt: Temukan penerbangan di kayak.com dari Zurich ke Beijing dari 25.12.2024 hingga 02.02.2025.

Contoh 3.
Prompt: Baca CV saya & temukan pekerjaan ML, simpan ke file, lalu mulai melamar di tab baru, jika Anda butuh bantuan, tanyakan pada saya.'
0:00/1×
Kesimpulan
Dengan menggabungkan DeepSeek R1 dengan Browser Use, Anda dapat membangun alternatif ChatGPT Operator yang berfungsi penuh yang gratis, sumber terbuka, dan sangat dapat disesuaikan. Pengaturan ini tidak hanya menghemat biaya tetapi juga memberi Anda kendali penuh atas privasi data dan perilaku sistem.
Baik Anda mengotomatiskan tugas web, membangun agen percakapan, atau bereksperimen dengan fitur AI tingkat lanjut seperti Retrieval-Augmented Generation, panduan ini menyediakan semua yang Anda butuhkan untuk memulai. Rangkul kekuatan sumber terbuka dan buat asisten cerdas Anda sendiri hari ini!
Anda harus melihat Apidog, alat Pengujian API All-in-One yang menjalankan Anda melalui seluruh siklus, dari desain API hingga Dokumentasi API, dan meningkatkan produktivitas tim pengembangan Anda!
