Holo3: Model Penggunaan Komputer Terbaik?

Intinya

H Company meluncurkan Holo3 pada 31 Maret 2026, sebuah model mixture-of-experts yang mencetak 78,85% pada OSWorld-Verified, angka tertinggi yang pernah tercatat pada benchmark penggunaan komputer desktop terkemuka. Ini mengalahkan GPT-5.4 dan Opus 4.6 dengan biaya yang jauh lebih rendah. API sudah tersedia sekarang, dan varian 35B bersifat open-weight di HuggingFace di bawah lisensi Apache 2.0.

Kesenjangan penggunaan komputer yang belum dipecahkan sebagian besar pengembang

Anda telah mengotomatisasi API Anda. Pipeline CI/CD Anda berjalan lancar. Namun, masih ada jenis tugas yang merusak setiap otomatisasi: perangkat lunak perusahaan lama tanpa API, aplikasi desktop yang lebih dulu ada sebelum REST, alur kerja multi-langkah yang melintasi lima UI yang berbeda.

Alat RPA tradisional (UiPath, Automation Anywhere) menanganinya dengan skrip koordinat layar yang rapuh yang rusak setiap kali UI berubah. Alternatifnya adalah pekerjaan manual.

AI penggunaan komputer mengubah persamaan itu. Model yang melihat tangkapan layar dan mengeluarkan tindakan klik, ketik, dan gulir dapat menavigasi GUI apa pun tanpa memerlukan API. Holo3, yang dirilis pada 31 Maret 2026 oleh H Company yang berbasis di Paris, saat ini adalah model yang tersedia secara publik terkuat untuk jenis tugas ini.

💡

Jika Anda membangun alur kerja otomatisasi atau pipeline pengujian yang menyentuh perangkat lunak desktop, API Holo3 patut dipahami sekarang. Dan jika Anda menggunakan Apidog untuk merancang dan menguji API Anda, bagian-bagian di bawah ini menunjukkan dengan tepat cara menyambungkan panggilan Holo3 ke dalam alur kerja Anda.

button

Apa itu Holo3?

Holo3 adalah model penggunaan komputer: Anda memberikannya tangkapan layar desktop atau browser, memberitahukannya tugas apa yang harus diselesaikan, dan ia mengembalikan tindakan (klik, penekanan tombol, perintah gulir) untuk dieksekusi di layar itu. Anda menangkap hasilnya, mengambil tangkapan layar lagi, dan mengulanginya sampai tugas selesai.

H Company menawarkan dua varian:

Holo3-122B-A10B — produk unggulan. Total 122B parameter, 10B aktif (sparse MoE). Hanya API yang di-host di hcompany.ai/holo-models-api. Mencetak rekor benchmark saat ini.
Holo3-35B-A3B — Total 35B, 3B aktif. Open-weight di HuggingFace di bawah Apache 2.0. Tersedia tingkat gratis di API inferensi H Company. Dapat di-host sendiri.

Arsitektur MoE (mixture of experts) berarti hanya sebagian kecil dari parameter yang aktif per token, sehingga model ini secara signifikan lebih murah untuk dijalankan daripada yang disarankan oleh jumlah total parameternya. H Company menyatakan Holo3-122B-A10B biayanya lebih rendah daripada GPT-5.4 dan Opus 4.6 berdasarkan per tugas.

OSWorld-Verified: apa yang sebenarnya diukur oleh benchmark

OSWorld-Verified adalah benchmark terkemuka untuk mengevaluasi penggunaan komputer AI. Berbeda dengan benchmark yang menilai berdasarkan teks keluaran, OSWorld menguji eksekusi: agen harus menyelesaikan tugas nyata di komputer sungguhan, dan keberhasilan diverifikasi dengan memeriksa status sistem yang sebenarnya setelahnya.

Tugas mencakup seluruh rentang kompleksitas:

Tugas satu aplikasi (membuka file, mengisi formulir, menyalin data antar sel)
Alur kerja lintas aplikasi (mengambil nilai dari PDF, memperbarui spreadsheet, mengirim email konfirmasi)
Urutan multi-aplikasi jangka panjang yang membutuhkan penalaran di beberapa sistem tanpa kehilangan konteks

Holo3-122B-A10B mencetak 78,85% pada OSWorld-Verified. Sebagai konteks: skor di atas 40% dianggap sebagai yang terbaik (state-of-the-art) hingga saat ini. Model terkemuka sebelumnya dari Anthropic dan OpenAI berada di kisaran 60-65%.

Kesenjangan ini paling penting pada bagian sulit dari benchmark. Benchmark Internal Perusahaan H dari H Company (486 tugas di seluruh E-commerce, Perangkat Lunak Bisnis, Kolaborasi, dan alur kerja Multi-Aplikasi) menunjukkan Holo3 secara khusus unggul dalam tugas multi-aplikasi — yaitu tugas-tugas yang memerlukan koordinasi data di beberapa aplikasi secara bersamaan.

Bagaimana Holo3 dilatih: Roda Gila Pembelajaran Agentik (Agentic Learning Flywheel)

Sebagian besar model penggunaan komputer dilatih menggunakan demonstrasi statis. H Company membangun lingkaran pelatihan berkelanjutan yang mereka sebut Agentic Learning Flywheel:

Data Navigasi Sintetis — Instruksi manusia dan yang dihasilkan menghasilkan contoh navigasi spesifik skenario.
Augmentasi di Luar Domain — Skenario diperluas secara terprogram untuk mencakup status UI yang tidak terduga dan kasus-kasus batas.
Pembelajaran Penguatan Terkurasi — Setiap sampel data disaring dan digunakan dalam pipeline RL untuk secara langsung memaksimalkan tingkat penyelesaian tugas.

Data pelatihan berasal dari Synthetic Environment Factory — sebuah sistem di mana agen pengkodean membangun aplikasi web perusahaan lengkap dari awal berdasarkan spesifikasi skenario. Lingkungan ini mencakup tugas-tugas yang dapat diverifikasi dengan skrip validasi end-to-end, sehingga model dilatih pada alur kerja bisnis yang realistis daripada contoh mainan.

Hasilnya: Holo3 mengungguli model dasar Qwen3.5 dengan jumlah parameter yang lebih besar pada tugas benchmark yang sama. Arsitektur saja tidak menjelaskan kesenjangan; metodologi pelatihan yang melakukannya.

Cara memanggil API Holo3

API Holo3 mengikuti pola loop tangkapan layar-tindakan standar. Berikut adalah alur dasarnya:

1. Siapkan autentikasi

# URL dasar API Inferensi H Company
https://api.hcompany.ai/v1

# Header
Authorization: Bearer YOUR_API_KEY
Content-Type: application/json

Dapatkan kunci API Anda di hcompany.ai/holo-models-api. Tingkat gratis mencakup Holo3-35B-A3B.

2. Kirim tangkapan layar dengan tugas

import base64
import httpx

# Tangkap layar Anda (contoh menggunakan pyautogui)
import pyautogui
screenshot = pyautogui.screenshot()
screenshot.save("/tmp/screen.png")

with open("/tmp/screen.png", "rb") as f:
    image_b64 = base64.b64encode(f.read()).decode()

response = httpx.post(
    "https://api.hcompany.ai/v1/computer-use",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    json={
        "model": "holo3-122b-a10b",
        "task": "Open the invoice folder and find the most recent PDF",
        "screenshot": image_b64,
        "screen_width": 1920,
        "screen_height": 1080
    }
)

action = response.json()
print(action)

3. Uraikan dan eksekusi tindakan

API mengembalikan tindakan terstruktur yang Anda eksekusi pada mesin host:

{
  "action_type": "click",
  "coordinate": [245, 380],
  "reasoning": "Ikon folder faktur terlihat pada posisi ini"
}

Jenis tindakan meliputi: click, double_click, right_click, type, key, scroll, screenshot_request (ketika model membutuhkan tampilan baru), dan task_complete.

4. Ulangi hingga selesai

def run_computer_use_task(task: str, max_steps: int = 20):
    for step in range(max_steps):
        screenshot = capture_screen()
        response = call_holo3_api(task, screenshot)
        action = response["action"]

        if action["action_type"] == "task_complete":
            print(f"Selesai dalam {step + 1} langkah")
            return response["result"]

        execute_action(action)

    raise TimeoutError("Tugas tidak selesai dalam batas langkah")

Menguji panggilan API Holo3 dengan Apidog

Setelah Anda memanggil API Holo3, Anda perlu memvalidasi bahwa integrasi Anda berfungsi dengan andal, terutama untuk otomatisasi produksi. Apidog menanganinya dengan rapi.

Impor endpoint: Di Apidog, buat permintaan HTTP baru ke https://api.hcompany.ai/v1/computer-use. Tambahkan header Authorization Anda sebagai variabel lingkungan agar Anda tidak melakukan hardcode kunci.

Siapkan validasi permintaan: Aseri pengujian Apidog memungkinkan Anda memeriksa struktur respons secara otomatis:

// Dalam skrip pasca-respons Apidog
pm.test("Jenis tindakan valid", () => {
    const validActions = ["click", "type", "key", "scroll", "task_complete", "screenshot_request"];
    pm.expect(validActions).to.include(pm.response.json().action.action_type);
});

pm.test("Koordinat berada dalam batas layar", () => {
    const action = pm.response.json().action;
    if (action.coordinate) {
        pm.expect(action.coordinate[0]).to.be.within(0, 1920);
        pm.expect(action.coordinate[1]).to.be.within(0, 1080);
    }
});

Mengejek API selama pengembangan: Gunakan Smart Mock Apidog untuk menghasilkan respons Holo3 yang realistis tanpa memanggil API langsung. Ini menghemat kredit selama pengujian integrasi dan memungkinkan lapisan frontend atau orkestrasi Anda berkembang secara paralel.

Jalankan skenario pengujian: Rangkai beberapa permintaan Holo3 dalam Skenario Pengujian Apidog untuk mensimulasikan loop tugas multi-langkah penuh. Anda dapat memvalidasi bahwa urutan tindakan koheren di setiap langkah sebelum menjalankannya di mesin langsung.

Holo3 vs Claude Computer Use vs OpenAI Operator

	Holo3-122B	Holo3-35B	Claude Computer Use	OpenAI Operator
OSWorld-Verified	78.85%	~55% (est.)	~65%	~62%
Akses API	Ya	Ya (tingkat gratis)	Ya	Ya
Bobot terbuka	Tidak	Ya (Apache 2.0)	Tidak	Tidak
Dapat di-host sendiri	Tidak	Ya	Tidak	Tidak
Biaya vs GPT-5.4	Lebih rendah	Jauh lebih rendah	Setara	Harga GPT-5.4
Terbaik untuk	Perusahaan produksi	Dev/pengujian/OSS	Ekosistem Anthropic	Ekosistem OpenAI

Pilihan praktis tergantung pada stack Anda:

Holo3-122B jika Anda membutuhkan akurasi puncak pada alur kerja multi-aplikasi yang kompleks dan biaya menjadi pertimbangan kedua setelah keandalan.
Holo3-35B untuk pengembangan, pengujian, proyek sumber terbuka, atau ketika Anda ingin meng-host sendiri.
Claude Computer Use jika Anda sudah mendalam di ekosistem Anthropic dan menginginkan penagihan API terpadu.
OpenAI Operator jika Anda menggunakan GPT-5.4 di tempat lain dan menginginkan hubungan vendor tunggal.

Kasus penggunaan perusahaan

Holo3 mencakup alur kerja yang tidak memiliki solusi berbasis API yang bersih:

Entri data sistem lama — Sistem ERP dan CRM dari tahun 2000-an tanpa API REST. Holo3 dapat menavigasi UI desktop dan memasukkan atau mengekstrak data tanpa memerlukan proyek modernisasi.

Rekonsiliasi lintas platform — Mengambil angka dari PDF, memeriksanya terhadap spreadsheet internal, memperbarui dasbor pihak ketiga. Holo3 menangani seluruh urutan secara otonom.

Pengujian regresi untuk aplikasi web — Daripada memelihara skrip Selenium rapuh yang terikat pada ID elemen, arahkan Holo3 ke lingkungan staging Anda dengan deskripsi tugas berbahasa sederhana. Ini beradaptasi dengan perubahan UI tanpa pembaruan selector.

Intelijen kompetitif — Menjelajahi dan mengekstrak data terstruktur secara sistematis dari situs web yang memblokir scraping standar.

Benchmark Perusahaan H dari H Company menunjukkan Holo3 mencapai hasil yang kuat di keempat kategori: E-commerce, Perangkat Lunak Bisnis, Kolaborasi, dan Multi-Aplikasi. Alur kerja Multi-Aplikasi menunjukkan kesenjangan kinerja terbesar dibandingkan pesaing — tugas-tugas yang memerlukan penalaran di beberapa aplikasi tanpa kehilangan keadaan adalah tempat metodologi pelatihan paling membuahkan hasil.

Apa selanjutnya: Agensi Adaptif

H Company lugas tentang apa yang akan datang setelah Holo3. Pekerjaan mereka saat ini berpusat pada Agensi Adaptif — model yang tidak hanya menavigasi perangkat lunak yang pernah mereka lihat sebelumnya, tetapi belajar menavigasi perangkat lunak perusahaan yang sama sekali baru dan khusus secara real-time.

Model penggunaan komputer saat ini, termasuk Holo3, masih dilatih pada seperangkat lingkungan perangkat lunak yang terbatas. Agen yang menghadapi alat internal kustom yang belum pernah dilihatnya akan memiliki tingkat keberhasilan yang lebih rendah daripada pada aplikasi standar. Agensi Adaptif bertujuan untuk menutup kesenjangan itu: model akan bernalar tentang struktur perangkat lunak pada kontak pertama, membangun model kerja tentang cara kerjanya, dan mengeksekusi tugas tanpa data pelatihan sebelumnya.

Jika H Company mewujudkan ini, itu akan menghilangkan batasan utama yang tersisa dari AI penggunaan komputer untuk penyebaran perusahaan.

Kesimpulan

Holo3 menetapkan standar baru untuk penggunaan komputer desktop. Dengan 78,85% pada OSWorld-Verified, ini terbukti lebih baik daripada alternatif berbasis Claude dan GPT pada tugas multi-langkah yang kompleks. Tingkat gratis pada Holo3-35B-A3B dan bobot terbuka Apache 2.0 membuatnya dapat diakses oleh pengembang untuk diuji tanpa biaya di muka.

Pola integrasinya lugas: tangkapan layar, POST ke API, eksekusi tindakan yang dikembalikan, ulangi. Di sinilah Apidog membantu dalam membuat integrasi itu andal — memvalidasi struktur respons, melakukan mocking selama pengembangan, dan menjalankan skenario pengujian sebelum Anda menyebarkannya ke sistem langsung.

Jika Anda membangun sesuatu yang menyentuh GUI desktop, coba Apidog secara gratis dan uji integrasi Holo3 Anda sebelum masuk ke produksi.

button

FAQ

Apa itu Holo3?Holo3 adalah model AI penggunaan komputer dari H Company yang mengambil tangkapan layar sebagai masukan dan mengembalikan tindakan (klik, penekanan tombol, gulir) untuk menyelesaikan tugas di desktop atau browser. Ini mencetak 78,85% pada benchmark OSWorld-Verified, hasil tertinggi yang tercatat pada pengujian tersebut.

Apakah Holo3 sumber terbuka?Varian yang lebih kecil, Holo3-35B-A3B, bersifat open-weight di bawah Apache 2.0 dan dapat diunduh dari HuggingFace. Holo3-122B-A10B yang unggulan hanya tersedia melalui API. Keduanya tersedia melalui API inferensi H Company, dengan tingkat gratis untuk model 35B.

Bagaimana cara kerja benchmark OSWorld?OSWorld menguji agen AI pada tugas komputer nyata — navigasi web, manajemen file, alur kerja lintas aplikasi. Keberhasilan diverifikasi dengan memeriksa status sistem yang sebenarnya setelah agen berjalan, bukan dengan mengevaluasi teks keluaran. Tugas-tugas bervariasi dari operasi satu aplikasi hingga urutan multi-aplikasi jangka panjang.

Bagaimana Holo3 dibandingkan dengan Claude Computer Use?Holo3-122B mencetak skor lebih tinggi pada OSWorld-Verified (78,85% vs sekitar 65% untuk Claude). Ini juga lebih murah per tugas. Claude Computer Use tetap menjadi pilihan yang kuat bagi tim yang sudah menggunakan API Anthropic dan menginginkan hubungan penagihan tunggal.

Bisakah saya menjalankan Holo3 secara lokal?Ya, jika Anda menggunakan Holo3-35B-A3B. Bobotnya ada di HuggingFace di bawah Apache 2.0. Model 122B hanya tersedia melalui API inferensi.

Apa saja kasus penggunaan utama untuk API penggunaan komputer?Otomatisasi sistem lama (tidak tersedia API REST), alur kerja data lintas aplikasi, pengujian regresi aplikasi web tanpa selector rapuh, scraping intelijen kompetitif, dan setiap alur kerja desktop yang saat ini memerlukan interaksi manusia manual.

Bagaimana cara menguji integrasi API Holo3 saya?Gunakan Apidog untuk mengimpor endpoint, menyiapkan aseri validasi respons, melakukan mocking API selama pengembangan, dan merangkai permintaan ke dalam skenario pengujian. Ini menangkap masalah integrasi sebelum Anda menjalankan otomatisasi pada mesin langsung.

Apa itu "Agensi Adaptif" dalam peta jalan Holo3?H Company sedang mengerjakan model yang dapat menavigasi perangkat lunak perusahaan yang belum pernah mereka lihat sebelumnya, mempelajari struktur UI secara real-time daripada mengandalkan data pelatihan sebelumnya. Ini akan menghilangkan batasan utama yang tersisa dari AI penggunaan komputer untuk penerapan perusahaan yang sepenuhnya disesuaikan.