Tencent membuka sumber Hy3 Preview pada 22 April 2026, dan dalam sehari OpenRouter mencantumkannya sebagai titik akhir yang sepenuhnya gratis. Tanpa kartu kredit, tanpa penghitungan token, tanpa jendela uji coba. Anda dapat memanggil model Mixture-of-Experts 295B-parameter yang sama yang menggerakkan aplikasi Yuanbao dan asisten CodeBuddy milik Tencent dari kode Anda sendiri, hari ini, tanpa biaya.
Panduan ini menunjukkan cara menggunakan API Hy3 Preview secara gratis melalui OpenRouter, Hugging Face Space, dan repo Hy3 asli. Ini juga mencakup mode penalaran yang membuat Hy3 berbeda dari kebanyakan model terbuka tahun 2026, dan cara menguji API di dalam Apidog tanpa menulis skrip sementara.
Jika Anda ingin jalur tercepat untuk respons pertama Anda, lompat ke "Langkah demi langkah: memanggil Hy3 Preview gratis di OpenRouter."
TL;DR
- Hy3 Preview gratis di OpenRouter di bawah ID model
tencent/hy3-preview:freedengan harga input $0 dan output $0. - Ini adalah model Mixture-of-Experts: total 295B parameter, 21B aktif, 192 ahli dengan perutean top-8, dan jendela konteks 256K-token.
- Tiga mode penalaran disertakan:
no_thinkuntuk jawaban cepat,low, danhighuntuk pemikiran berantai mendalam pada tugas agen dan pengkodean. - Benchmark kuat untuk model open-weights: SWE-bench Verified 74.4, Terminal-Bench 2.0 54.4, GPQA Diamond 87.2, MMLU 87.42.
- Anda dapat menjalankannya dengan tiga cara gratis: tingkat gratis OpenRouter, Hy3-preview Space Hugging Face, atau inferensi lokal dengan vLLM dan bobot terbuka.
- Apidog cocok dengan titik akhir OpenRouter karena Hy3 menggunakan skema OpenAI Chat Completions; arahkan permintaan ke OpenRouter dan jalankan.
Apa itu Hy3 Preview?
Hy3 Preview adalah rilis flagship pertama dari tim model dasar Hunyuan Tencent yang telah direstrukturisasi, kini dipimpin oleh Yao Shunyu, mantan peneliti OpenAI yang direkrut perusahaan untuk mendorong tumpukan penalarannya. Mari kita gambarkan sebagai model Tencent yang paling mumpuni dan jawaban langsung terhadap rilis open-weights Tiongkok teratas dari DeepSeek, Alibaba, dan Zhipu.

Profil teknis dari kartu model resmi berorientasi agen:
- Arsitektur: Mixture-of-Experts, 80 lapisan ditambah satu lapisan MTP, 64 kepala perhatian dengan perhatian berkueri kelompok.
- Parameter: Total 295B, 21B aktif per forward pass.
- Ahli: 192 spesialis dengan perutean top-8 per token.
- Konteks: 256K token (262.144 di daftar OpenRouter).
- Tokenizer: Kosakata 120.832 entri dengan presisi BF16.
- Lisensi: Lisensi Komunitas Tencent Hy, penggunaan komersial diizinkan dalam syarat lisensi.
Yang membedakannya dari MoE 200B-an umum adalah pelatihan agensi. Tencent membangun kembali infrastruktur RL-nya untuk penggunaan alat multi-giliran, dan skor yang dipublikasikan pada SWE-bench Verified, Terminal-Bench 2.0, dan rangkaian internal WildClawBench menempatkannya dekat dengan model tertutup teratas pada tugas kode dan shell.

Tiga cara gratis menggunakan Hy3 Preview
Anda memiliki tiga jalur tergantung apakah Anda menginginkan UI obrolan, API, atau bobot lokal.
| Jalur | Apa itu | Gratis? | Baik untuk |
|---|---|---|---|
OpenRouter tencent/hy3-preview:free |
API yang dihosting yang kompatibel dengan OpenAI | Ya, $0 masuk/keluar | Membangun agen, skrip, dan fitur backend |
| Hugging Face Space | Demo obrolan browser | Ya | Prompt cepat, mencoba, tes asap |
| Bobot yang di-host sendiri (vLLM / SGLang) | Jalankan bobot terbuka di GPU Anda sendiri | Perangkat lunak gratis, biaya perangkat keras berlaku | Beban kerja yang sensitif privasi, volume tinggi |
Kebanyakan pengembang akan menginginkan jalur OpenRouter. Ini adalah jalur terpendek dari pendaftaran hingga panggilan API yang berfungsi, dan batas kecepatan pada tingkat gratis cukup murah hati untuk pembuatan prototipe.
Langkah demi langkah: memanggil Hy3 Preview gratis di OpenRouter
Berikut adalah jalur minimal dari nol hingga respons tencent/hy3-preview:free yang berfungsi.

- Buat akun OpenRouter. Daftar di openrouter.ai. Email sudah cukup; tidak diperlukan metode pembayaran untuk model tingkat gratis.
- Buat kunci API. Di dasbor OpenRouter, buka “Kunci” dan buat kunci baru. Salin ke variabel lingkungan, misalnya
export OPENROUTER_API_KEY=sk-or-.... - Buka halaman model. Kunjungi daftar gratis Hy3 Preview dan konfirmasikan bahwa spanduk status bertuliskan “Gratis.” Anda juga akan melihat statistik penggunaan di sana; saat peluncuran, titik akhir ini menangani 6,81 miliar token prompt per hari di antara semua pengguna.

Kirim permintaan pertama Anda. OpenRouter mengekspos skema OpenAI Chat Completions, sehingga setiap OpenAI SDK berfungsi:
curl https://openrouter.ai/api/v1/chat/completions \
-H "Authorization: Bearer $OPENROUTER_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "tencent/hy3-preview:free",
"messages": [
{"role": "user", "content": "Jelaskan keputusan perutean MoE dalam pengaturan top-8 dari 192 dalam 3 kalimat."}
],
"temperature": 0.9,
"top_p": 1.0
}'
- Aktifkan penalaran saat Anda membutuhkannya. Hy3 menerima parameter
reasoningdenganeffortdiatur kelowatauhigh. OpenRouter mengembalikan jejak pemikiran dalam arrayreasoning_detailsterpisah, ditagih sebagai bucket tokennya sendiri:
{
"model": "tencent/hy3-preview:free",
"messages": [
{"role": "user", "content": "Rencanakan, lalu tulis skrip Bash yang merotasi file log harian yang lebih tua dari 30 hari ke folder arsip tanggal."}
],
"reasoning": {"effort": "high"}
}
- Ulangi. Pertahankan sesi dalam thread yang sama jika Anda ingin model membangun konteks sebelumnya; jendela 256K Hy3 menangani sebagian besar basis kode lengkap secara menyeluruh.
Itu adalah keseluruhan alurnya. Model yang Anda panggil adalah model yang sama yang diterbitkan di Hugging Face; kualitas pada tingkat gratis OpenRouter identik dengan rute berbayar pada penyedia lain.
Gratis, Berbayar, dan di-host sendiri: perbedaan mereka
Gratis bukan satu-satunya jalur, dan ada baiknya melihat perbedaan sebenarnya sebelum Anda berkomitmen pada salah satunya.
| Kemampuan | OpenRouter Gratis | OpenRouter Berbayar (titik akhir non-gratis) | Di-host sendiri (vLLM / SGLang) |
|---|---|---|---|
| Biaya per token | $0 | Per penyedia | Listrik ditambah amortisasi GPU |
| Mode penalaran | no_think, low, high |
Sama | Sama |
| Panjang konteks | 256K | 256K | 256K (jika memori memungkinkan) |
| Throughput di bawah beban | Pool bersama, diprioritaskan lebih rendah saat permintaan tinggi | Dedicated | Apa pun yang disajikan kluster Anda |
| Batas kecepatan | Batas tingkat gratis OpenRouter (fleksibel) | Spesifik penyedia | Tidak ada |
| Retensi data | Kebijakan pencatatan OpenRouter | Spesifik penyedia | Tetap di perangkat keras Anda |
| Visibilitas token penalaran | Ya, via reasoning_details |
Ya | Ya |
Gratis adalah pilihan yang tepat untuk prototipe, proyek sampingan, benchmark evaluasi, dan agen lalu lintas rendah. Berbayar atau di-host sendiri masuk akal saat latensi menjadi penting atau Anda melebihi batas kecepatan.
Tips prompt dan parameter untuk mendapatkan lebih banyak dari Hy3
Hy3 menghargai pengaturan eksplisit lebih dari model yang lebih kecil. Beberapa kebiasaan membantu.
- Sesuaikan suhu dengan mode. Kartu model merekomendasikan
temperature=0.9dantop_p=1.0sebagai default. Turunkan ke0.3untuk output terstruktur, tetap di0.9untuk pekerjaan kreatif. - Gunakan
no_thinkuntuk obrolan sehari-hari. Mode penalaran default dimatikan karena suatu alasan; Anda hanya memerlukanlowatauhighuntuk perencanaan, kode multi-langkah, atau matematika. Menjalankanhighpada pertanyaan satu baris akan membuang token penalaran. - Sebutkan alat dalam prompt sistem. Hy3 dilatih untuk penggunaan alat dengan parser khusus (
hy_v3). Bahkan di OpenRouter, Anda mendapatkan panggilan yang lebih baik saat prompt sistem menjelaskan tugas setiap alat daripada hanya mengandalkan skema. - Kutip kode, jangan meringkasnya. Jendela 256K memungkinkan Anda menempelkan seluruh file. Tempel file, lalu ajukan pertanyaan; jangan meminta model untuk membayangkan kode tersebut.
- Edit multi-file secara batch. Skor SWE-bench Verified Hy3 sebesar 74.4 berasal dari pengeditan beberapa file secara koheren. Berikan seluruh set dalam satu pesan daripada meneteskannya satu per satu.
- Minta rencana terlebih dahulu. Untuk tugas agen, pola dua langkah ("buat rencana, tunggu konfirmasi saya, lalu jalankan") secara konsisten menghasilkan hasil yang lebih bersih daripada prompt satu kali.
Batas yang perlu diketahui sebelum Anda menerbitkannya
Beberapa jebakan akan menjegal Anda jika Anda melewatkannya.
- Batas kecepatan fleksibel dengan beban. Tingkat gratis OpenRouter berbagi kapasitas di antara semua pengguna gratis. Saat peluncuran, volume prompt harian sudah 6,81 miliar token; panggilan jam sibuk dapat melihat 429-an. Bangun percobaan ulang dengan backoff eksponensial.
- Token penalaran dihitung sebagai output.
reasoning_detailsgratis di tingkat gratis OpenRouter, tetapi pada rute berbayar, itu ditagih sebagai output. Jangan mengirimkan defaulteffort: "high"ke produk yang sensitif terhadap pendapatan tanpa mengukur. - Lisensi bukan Apache 2.0. Lisensi Komunitas Tencent Hy mengizinkan penggunaan komersial tetapi membawa klausul kebijakan penggunaan dan atribusi; baca lisensi lengkap di repo GitHub sebelum Anda menyematkan Hy3 dalam suatu produk.
- Panggilan alat memerlukan parser yang tepat. Jika Anda meng-host sendiri, jalankan vLLM atau SGLang dengan
--tool-call-parser hy_v3(atauhunyuanuntuk SGLang). Tanpa itu, panggilan alat kembali sebagai teks biasa. - Bahasa Inggris dan Mandarin adalah kelas utama; bahasa lain adalah kelas kedua. Skor C-Eval 89.80 dan CMMLU 89.61 menunjukkan Mandarin yang kuat. Bahasa lain didukung melalui MMMLU tetapi kualitasnya menurun.
- Ini tertinggal dari flagship AS teratas dalam beberapa benchmark penalaran. HLE berada di 30, dan liputan SCMP mencatat Hy3 setara dengan model Tiongkok teratas tetapi masih di belakang flagship OpenAI dan Google DeepMind saat ini pada suite penalaran yang paling sulit.
Jalur cepat pengembang: Hy3 Preview ditambah Apidog
Curl baris perintah bagus untuk demo. Untuk iterasi nyata, klien API visual menghemat banyak waktu.
- Buka Apidog dan buat proyek baru. Impor spesifikasi OpenAPI OpenAI Chat Completions; OpenRouter menggunakan skema yang sama.
- Atur URL dasar ke
https://openrouter.ai/api/v1dan tambahkan variabel lingkungan untukOPENROUTER_API_KEY. - Buat permintaan yang mengenai
/chat/completionsdengan model diatur ketencent/hy3-preview:free. - Fork permintaan untuk membandingkan mode penalaran. Apidog memungkinkan Anda menduplikasi permintaan dan mengubah satu parameter, sehingga Anda dapat menjalankan prompt yang sama dengan
no_think,low, danhighsecara berdampingan dan memeriksa perbedaan latensi dan output. - Simpan template prompt. Prompt agen bisa panjang. Sistem lingkungan dan variabel Apidog menjaga prompt sistem, skema alat, dan giliran pengguna terpisah sehingga Anda dapat menggunakannya kembali di seluruh pengujian.
Jika Anda beralih dari Postman, peralihan ini cepat; panduan pengujian API tanpa Postman di tahun 2026 kami mencakup migrasi. Tim yang selalu berada di editor mereka dapat menjalankan alur kerja yang sama di dalam VS Code dengan Apidog di dalam VS Code, yang menjaga penyetelan prompt di samping kode yang mengonsumsi output.
Alternatif gratis ketika Anda mencapai batas
Jika pool gratis OpenRouter membatasi Anda selama jam sibuk, dua jalur yang patut dicoba terlebih dahulu.
- Hugging Face Space. Hy3-preview Space menghosting demo obrolan browser. Ini tidak dapat di-script, tetapi gratis dan berguna untuk perbandingan cepat.
- Model open-weights Tiongkok gratis lainnya. Qwen 3.5 Omni dari Alibaba menyediakan tingkat gratis dengan output multimodal yang kuat; lihat pengumuman Qwen 3.5 Omni dan pendamping cara menggunakan untuk penyiapan. Zhipu GLM 5V Turbo adalah pilihan lain dengan tingkat gratis yang murah hati; panduan API GLM 5V Turbo memiliki penjelasan lengkap.
Tidak satu pun dari ini yang cocok dengan angka SWE-bench dan Terminal-Bench Hy3 untuk pengkodean agen, tetapi mereka mencakup kasus penggunaan obrolan, multibahasa, dan multimodal yang tidak diprioritaskan oleh tingkat gratis Hy3. Untuk pembuatan produksi, Unduh Apidog dan siapkan satu koleksi per model; benchmark berdampingan pada prompt aktual Anda mengalahkan membaca papan peringkat apa pun.
Menghosting sendiri Hy3 Preview dengan vLLM
Jika Anda memiliki perangkat keras, inferensi lokal adalah jalur gratis keempat. Kartu model merekomendasikan vLLM dengan paralelisme tensor 8 dan prediksi multi-token diaktifkan untuk speculative decoding:
vllm serve tencent/Hy3-preview \
--tensor-parallel-size 8 \
--speculative-config.method mtp \
--speculative-config.num_speculative_tokens 1 \
--tool-call-parser hy_v3 \
--reasoning-parser hy_v3 \
--enable-auto-tool-choice \
--served-model-name hy3-preview
Perintah SGLang yang setara menggunakan --tool-call-parser hunyuan dan --reasoning-parser hunyuan. Setelah server aktif di http://localhost:8000/v1, setiap OpenAI SDK menunjuk ke sana dengan cara yang sama seperti menunjuk ke OpenRouter; hanya URL dasar dan kunci yang berubah.
Harapkan delapan GPU kelas H100 pada BF16 untuk model penuh. Build komunitas terkuantisasi akan muncul, tetapi saat peluncuran jalur resminya adalah presisi penuh.
FAQ
Apakah Hy3 Preview gratis?Ya. OpenRouter mencantumkan tencent/hy3-preview:free dengan $0 per juta token input dan $0 per juta token output. Token penalaran pada tingkat gratis juga gratis, meskipun dihitung terhadap batas kecepatan. Konfirmasikan status saat ini di halaman model OpenRouter sebelum bergantung padanya untuk produksi.
Bagaimana perbandingan Hy3 Preview dengan DeepSeek V3 dan Qwen 3?Skor SWE-bench Verified Hy3 Preview sebesar 74.4 dan Terminal-Bench 2.0 sebesar 54.4 menempatkannya dalam tingkatan yang sama dengan model terbuka Tiongkok teratas, dengan kecenderungan agen dan penggunaan alat yang jelas. Untuk obrolan murni, Qwen 3 dan DeepSeek V3 kompetitif; untuk alur kerja agen dan pengkodean, penggunaan alat yang dilatih RL Hy3 adalah pembeda.
Apa saja mode penalaran Hy3?Tiga: no_think (default, jawaban langsung), low, dan high. Ganti mode tersebut melalui parameter reasoning di OpenRouter atau melalui chat_template_kwargs={"reasoning_effort": "high"} saat memanggil model secara langsung. Gunakan high untuk perencanaan, kode multi-langkah, dan matematika; biarkan mati untuk obrolan.
Dapatkah saya menggunakan Hy3 Preview secara komersial?Ya, di bawah Lisensi Komunitas Tencent Hy. Lisensi tersebut mengizinkan penggunaan komersial dengan atribusi dan kepatuhan kebijakan penggunaan. Baca syarat lengkapnya di repo GitHub Hy3 sebelum menyebarkannya dalam produk penghasil pendapatan.
Panjang konteks apa yang didukung tingkat gratis?256K token dari awal hingga akhir. Daftar OpenRouter menunjukkan 262.144 token, cocok dengan kartu model. Anda dapat menempelkan seluruh basis kode ukuran menengah dan masih memiliki ruang untuk skema alat dan riwayat percakapan.
Bagaimana cara menguji Hy3 Preview tanpa menulis kode?Gunakan Hugging Face Space untuk demo obrolan browser, atau arahkan Apidog ke titik akhir OpenRouter. Apidog mengimpor spesifikasi OpenAPI OpenAI, sehingga mengkonfigurasi permintaan hanya membutuhkan tiga bidang: URL dasar, kunci API, dan nama model.
