Cara Menggunakan Hy3 Preview API Gratis?

Tencent membuka sumber Hy3 Preview pada 22 April 2026, dan dalam sehari OpenRouter mencantumkannya sebagai titik akhir yang sepenuhnya gratis. Tanpa kartu kredit, tanpa penghitungan token, tanpa jendela uji coba. Anda dapat memanggil model Mixture-of-Experts 295B-parameter yang sama yang menggerakkan aplikasi Yuanbao dan asisten CodeBuddy milik Tencent dari kode Anda sendiri, hari ini, tanpa biaya.

Panduan ini menunjukkan cara menggunakan API Hy3 Preview secara gratis melalui OpenRouter, Hugging Face Space, dan repo Hy3 asli. Ini juga mencakup mode penalaran yang membuat Hy3 berbeda dari kebanyakan model terbuka tahun 2026, dan cara menguji API di dalam Apidog tanpa menulis skrip sementara.

button

Jika Anda ingin jalur tercepat untuk respons pertama Anda, lompat ke "Langkah demi langkah: memanggil Hy3 Preview gratis di OpenRouter."

TL;DR

Hy3 Preview gratis di OpenRouter di bawah ID model tencent/hy3-preview:free dengan harga input $0 dan output $0.
Ini adalah model Mixture-of-Experts: total 295B parameter, 21B aktif, 192 ahli dengan perutean top-8, dan jendela konteks 256K-token.
Tiga mode penalaran disertakan: no_think untuk jawaban cepat, low, dan high untuk pemikiran berantai mendalam pada tugas agen dan pengkodean.
Benchmark kuat untuk model open-weights: SWE-bench Verified 74.4, Terminal-Bench 2.0 54.4, GPQA Diamond 87.2, MMLU 87.42.
Anda dapat menjalankannya dengan tiga cara gratis: tingkat gratis OpenRouter, Hy3-preview Space Hugging Face, atau inferensi lokal dengan vLLM dan bobot terbuka.
Apidog cocok dengan titik akhir OpenRouter karena Hy3 menggunakan skema OpenAI Chat Completions; arahkan permintaan ke OpenRouter dan jalankan.

Apa itu Hy3 Preview?

Hy3 Preview adalah rilis flagship pertama dari tim model dasar Hunyuan Tencent yang telah direstrukturisasi, kini dipimpin oleh Yao Shunyu, mantan peneliti OpenAI yang direkrut perusahaan untuk mendorong tumpukan penalarannya. Mari kita gambarkan sebagai model Tencent yang paling mumpuni dan jawaban langsung terhadap rilis open-weights Tiongkok teratas dari DeepSeek, Alibaba, dan Zhipu.

Profil teknis dari kartu model resmi berorientasi agen:

Arsitektur: Mixture-of-Experts, 80 lapisan ditambah satu lapisan MTP, 64 kepala perhatian dengan perhatian berkueri kelompok.
Parameter: Total 295B, 21B aktif per forward pass.
Ahli: 192 spesialis dengan perutean top-8 per token.
Konteks: 256K token (262.144 di daftar OpenRouter).
Tokenizer: Kosakata 120.832 entri dengan presisi BF16.
Lisensi: Lisensi Komunitas Tencent Hy, penggunaan komersial diizinkan dalam syarat lisensi.

Yang membedakannya dari MoE 200B-an umum adalah pelatihan agensi. Tencent membangun kembali infrastruktur RL-nya untuk penggunaan alat multi-giliran, dan skor yang dipublikasikan pada SWE-bench Verified, Terminal-Bench 2.0, dan rangkaian internal WildClawBench menempatkannya dekat dengan model tertutup teratas pada tugas kode dan shell.

Tiga cara gratis menggunakan Hy3 Preview

Anda memiliki tiga jalur tergantung apakah Anda menginginkan UI obrolan, API, atau bobot lokal.

Jalur	Apa itu	Gratis?	Baik untuk
OpenRouter `tencent/hy3-preview:free`	API yang dihosting yang kompatibel dengan OpenAI	Ya, $0 masuk/keluar	Membangun agen, skrip, dan fitur backend
Hugging Face Space	Demo obrolan browser	Ya	Prompt cepat, mencoba, tes asap
Bobot yang di-host sendiri (vLLM / SGLang)	Jalankan bobot terbuka di GPU Anda sendiri	Perangkat lunak gratis, biaya perangkat keras berlaku	Beban kerja yang sensitif privasi, volume tinggi

Kebanyakan pengembang akan menginginkan jalur OpenRouter. Ini adalah jalur terpendek dari pendaftaran hingga panggilan API yang berfungsi, dan batas kecepatan pada tingkat gratis cukup murah hati untuk pembuatan prototipe.

Langkah demi langkah: memanggil Hy3 Preview gratis di OpenRouter

Berikut adalah jalur minimal dari nol hingga respons tencent/hy3-preview:free yang berfungsi.

Buat akun OpenRouter. Daftar di openrouter.ai. Email sudah cukup; tidak diperlukan metode pembayaran untuk model tingkat gratis.
Buat kunci API. Di dasbor OpenRouter, buka “Kunci” dan buat kunci baru. Salin ke variabel lingkungan, misalnya export OPENROUTER_API_KEY=sk-or-....
Buka halaman model. Kunjungi daftar gratis Hy3 Preview dan konfirmasikan bahwa spanduk status bertuliskan “Gratis.” Anda juga akan melihat statistik penggunaan di sana; saat peluncuran, titik akhir ini menangani 6,81 miliar token prompt per hari di antara semua pengguna.

Kirim permintaan pertama Anda. OpenRouter mengekspos skema OpenAI Chat Completions, sehingga setiap OpenAI SDK berfungsi:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Jelaskan keputusan perutean MoE dalam pengaturan top-8 dari 192 dalam 3 kalimat."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'

Aktifkan penalaran saat Anda membutuhkannya. Hy3 menerima parameter reasoning dengan effort diatur ke low atau high. OpenRouter mengembalikan jejak pemikiran dalam array reasoning_details terpisah, ditagih sebagai bucket tokennya sendiri:

{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Rencanakan, lalu tulis skrip Bash yang merotasi file log harian yang lebih tua dari 30 hari ke folder arsip tanggal."}
  ],
  "reasoning": {"effort": "high"}
}

Ulangi. Pertahankan sesi dalam thread yang sama jika Anda ingin model membangun konteks sebelumnya; jendela 256K Hy3 menangani sebagian besar basis kode lengkap secara menyeluruh.

Itu adalah keseluruhan alurnya. Model yang Anda panggil adalah model yang sama yang diterbitkan di Hugging Face; kualitas pada tingkat gratis OpenRouter identik dengan rute berbayar pada penyedia lain.

Gratis, Berbayar, dan di-host sendiri: perbedaan mereka

Gratis bukan satu-satunya jalur, dan ada baiknya melihat perbedaan sebenarnya sebelum Anda berkomitmen pada salah satunya.

Kemampuan	OpenRouter Gratis	OpenRouter Berbayar (titik akhir non-gratis)	Di-host sendiri (vLLM / SGLang)
Biaya per token	$0	Per penyedia	Listrik ditambah amortisasi GPU
Mode penalaran	`no_think`, `low`, `high`	Sama	Sama
Panjang konteks	256K	256K	256K (jika memori memungkinkan)
Throughput di bawah beban	Pool bersama, diprioritaskan lebih rendah saat permintaan tinggi	Dedicated	Apa pun yang disajikan kluster Anda
Batas kecepatan	Batas tingkat gratis OpenRouter (fleksibel)	Spesifik penyedia	Tidak ada
Retensi data	Kebijakan pencatatan OpenRouter	Spesifik penyedia	Tetap di perangkat keras Anda
Visibilitas token penalaran	Ya, via `reasoning_details`	Ya	Ya

Gratis adalah pilihan yang tepat untuk prototipe, proyek sampingan, benchmark evaluasi, dan agen lalu lintas rendah. Berbayar atau di-host sendiri masuk akal saat latensi menjadi penting atau Anda melebihi batas kecepatan.

Tips prompt dan parameter untuk mendapatkan lebih banyak dari Hy3

Hy3 menghargai pengaturan eksplisit lebih dari model yang lebih kecil. Beberapa kebiasaan membantu.

Sesuaikan suhu dengan mode. Kartu model merekomendasikan temperature=0.9 dan top_p=1.0 sebagai default. Turunkan ke 0.3 untuk output terstruktur, tetap di 0.9 untuk pekerjaan kreatif.
Gunakan no_think untuk obrolan sehari-hari. Mode penalaran default dimatikan karena suatu alasan; Anda hanya memerlukan low atau high untuk perencanaan, kode multi-langkah, atau matematika. Menjalankan high pada pertanyaan satu baris akan membuang token penalaran.
Sebutkan alat dalam prompt sistem. Hy3 dilatih untuk penggunaan alat dengan parser khusus (hy_v3). Bahkan di OpenRouter, Anda mendapatkan panggilan yang lebih baik saat prompt sistem menjelaskan tugas setiap alat daripada hanya mengandalkan skema.
Kutip kode, jangan meringkasnya. Jendela 256K memungkinkan Anda menempelkan seluruh file. Tempel file, lalu ajukan pertanyaan; jangan meminta model untuk membayangkan kode tersebut.
Edit multi-file secara batch. Skor SWE-bench Verified Hy3 sebesar 74.4 berasal dari pengeditan beberapa file secara koheren. Berikan seluruh set dalam satu pesan daripada meneteskannya satu per satu.
Minta rencana terlebih dahulu. Untuk tugas agen, pola dua langkah ("buat rencana, tunggu konfirmasi saya, lalu jalankan") secara konsisten menghasilkan hasil yang lebih bersih daripada prompt satu kali.

Batas yang perlu diketahui sebelum Anda menerbitkannya

Beberapa jebakan akan menjegal Anda jika Anda melewatkannya.

Batas kecepatan fleksibel dengan beban. Tingkat gratis OpenRouter berbagi kapasitas di antara semua pengguna gratis. Saat peluncuran, volume prompt harian sudah 6,81 miliar token; panggilan jam sibuk dapat melihat 429-an. Bangun percobaan ulang dengan backoff eksponensial.
Token penalaran dihitung sebagai output. reasoning_details gratis di tingkat gratis OpenRouter, tetapi pada rute berbayar, itu ditagih sebagai output. Jangan mengirimkan default effort: "high" ke produk yang sensitif terhadap pendapatan tanpa mengukur.
Lisensi bukan Apache 2.0. Lisensi Komunitas Tencent Hy mengizinkan penggunaan komersial tetapi membawa klausul kebijakan penggunaan dan atribusi; baca lisensi lengkap di repo GitHub sebelum Anda menyematkan Hy3 dalam suatu produk.
Panggilan alat memerlukan parser yang tepat. Jika Anda meng-host sendiri, jalankan vLLM atau SGLang dengan --tool-call-parser hy_v3 (atau hunyuan untuk SGLang). Tanpa itu, panggilan alat kembali sebagai teks biasa.
Bahasa Inggris dan Mandarin adalah kelas utama; bahasa lain adalah kelas kedua. Skor C-Eval 89.80 dan CMMLU 89.61 menunjukkan Mandarin yang kuat. Bahasa lain didukung melalui MMMLU tetapi kualitasnya menurun.
Ini tertinggal dari flagship AS teratas dalam beberapa benchmark penalaran. HLE berada di 30, dan liputan SCMP mencatat Hy3 setara dengan model Tiongkok teratas tetapi masih di belakang flagship OpenAI dan Google DeepMind saat ini pada suite penalaran yang paling sulit.

Jalur cepat pengembang: Hy3 Preview ditambah Apidog

Curl baris perintah bagus untuk demo. Untuk iterasi nyata, klien API visual menghemat banyak waktu.

Buka Apidog dan buat proyek baru. Impor spesifikasi OpenAPI OpenAI Chat Completions; OpenRouter menggunakan skema yang sama.
Atur URL dasar ke https://openrouter.ai/api/v1 dan tambahkan variabel lingkungan untuk OPENROUTER_API_KEY.
Buat permintaan yang mengenai /chat/completions dengan model diatur ke tencent/hy3-preview:free.
Fork permintaan untuk membandingkan mode penalaran. Apidog memungkinkan Anda menduplikasi permintaan dan mengubah satu parameter, sehingga Anda dapat menjalankan prompt yang sama dengan no_think, low, dan high secara berdampingan dan memeriksa perbedaan latensi dan output.
Simpan template prompt. Prompt agen bisa panjang. Sistem lingkungan dan variabel Apidog menjaga prompt sistem, skema alat, dan giliran pengguna terpisah sehingga Anda dapat menggunakannya kembali di seluruh pengujian.

Jika Anda beralih dari Postman, peralihan ini cepat; panduan pengujian API tanpa Postman di tahun 2026 kami mencakup migrasi. Tim yang selalu berada di editor mereka dapat menjalankan alur kerja yang sama di dalam VS Code dengan Apidog di dalam VS Code, yang menjaga penyetelan prompt di samping kode yang mengonsumsi output.

Alternatif gratis ketika Anda mencapai batas

Jika pool gratis OpenRouter membatasi Anda selama jam sibuk, dua jalur yang patut dicoba terlebih dahulu.

Hugging Face Space. Hy3-preview Space menghosting demo obrolan browser. Ini tidak dapat di-script, tetapi gratis dan berguna untuk perbandingan cepat.
Model open-weights Tiongkok gratis lainnya. Qwen 3.5 Omni dari Alibaba menyediakan tingkat gratis dengan output multimodal yang kuat; lihat pengumuman Qwen 3.5 Omni dan pendamping cara menggunakan untuk penyiapan. Zhipu GLM 5V Turbo adalah pilihan lain dengan tingkat gratis yang murah hati; panduan API GLM 5V Turbo memiliki penjelasan lengkap.

Tidak satu pun dari ini yang cocok dengan angka SWE-bench dan Terminal-Bench Hy3 untuk pengkodean agen, tetapi mereka mencakup kasus penggunaan obrolan, multibahasa, dan multimodal yang tidak diprioritaskan oleh tingkat gratis Hy3. Untuk pembuatan produksi, Unduh Apidog dan siapkan satu koleksi per model; benchmark berdampingan pada prompt aktual Anda mengalahkan membaca papan peringkat apa pun.

button

Menghosting sendiri Hy3 Preview dengan vLLM

Jika Anda memiliki perangkat keras, inferensi lokal adalah jalur gratis keempat. Kartu model merekomendasikan vLLM dengan paralelisme tensor 8 dan prediksi multi-token diaktifkan untuk speculative decoding:

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

Perintah SGLang yang setara menggunakan --tool-call-parser hunyuan dan --reasoning-parser hunyuan. Setelah server aktif di http://localhost:8000/v1, setiap OpenAI SDK menunjuk ke sana dengan cara yang sama seperti menunjuk ke OpenRouter; hanya URL dasar dan kunci yang berubah.

Harapkan delapan GPU kelas H100 pada BF16 untuk model penuh. Build komunitas terkuantisasi akan muncul, tetapi saat peluncuran jalur resminya adalah presisi penuh.

FAQ

Apakah Hy3 Preview gratis?Ya. OpenRouter mencantumkan tencent/hy3-preview:free dengan $0 per juta token input dan $0 per juta token output. Token penalaran pada tingkat gratis juga gratis, meskipun dihitung terhadap batas kecepatan. Konfirmasikan status saat ini di halaman model OpenRouter sebelum bergantung padanya untuk produksi.

Bagaimana perbandingan Hy3 Preview dengan DeepSeek V3 dan Qwen 3?Skor SWE-bench Verified Hy3 Preview sebesar 74.4 dan Terminal-Bench 2.0 sebesar 54.4 menempatkannya dalam tingkatan yang sama dengan model terbuka Tiongkok teratas, dengan kecenderungan agen dan penggunaan alat yang jelas. Untuk obrolan murni, Qwen 3 dan DeepSeek V3 kompetitif; untuk alur kerja agen dan pengkodean, penggunaan alat yang dilatih RL Hy3 adalah pembeda.

Apa saja mode penalaran Hy3?Tiga: no_think (default, jawaban langsung), low, dan high. Ganti mode tersebut melalui parameter reasoning di OpenRouter atau melalui chat_template_kwargs={"reasoning_effort": "high"} saat memanggil model secara langsung. Gunakan high untuk perencanaan, kode multi-langkah, dan matematika; biarkan mati untuk obrolan.

Dapatkah saya menggunakan Hy3 Preview secara komersial?Ya, di bawah Lisensi Komunitas Tencent Hy. Lisensi tersebut mengizinkan penggunaan komersial dengan atribusi dan kepatuhan kebijakan penggunaan. Baca syarat lengkapnya di repo GitHub Hy3 sebelum menyebarkannya dalam produk penghasil pendapatan.

Panjang konteks apa yang didukung tingkat gratis?256K token dari awal hingga akhir. Daftar OpenRouter menunjukkan 262.144 token, cocok dengan kartu model. Anda dapat menempelkan seluruh basis kode ukuran menengah dan masih memiliki ruang untuk skema alat dan riwayat percakapan.

Bagaimana cara menguji Hy3 Preview tanpa menulis kode?Gunakan Hugging Face Space untuk demo obrolan browser, atau arahkan Apidog ke titik akhir OpenRouter. Apidog mengimpor spesifikasi OpenAPI OpenAI, sehingga mengkonfigurasi permintaan hanya membutuhkan tiga bidang: URL dasar, kunci API, dan nama model.