Cara Menggunakan Hy3 Preview API Gratis?

Ashley Innocent

Ashley Innocent

23 April 2026

Cara Menggunakan Hy3 Preview API Gratis?

Apidog untuk Perusahaan

Penerapan On-Premises

SSO & RBAC

Sesuai SOC 2

Jelajahi Apidog Enterprise

Tencent membuka sumber Hy3 Preview pada 22 April 2026, dan dalam sehari OpenRouter mencantumkannya sebagai titik akhir yang sepenuhnya gratis. Tanpa kartu kredit, tanpa penghitungan token, tanpa jendela uji coba. Anda dapat memanggil model Mixture-of-Experts 295B-parameter yang sama yang menggerakkan aplikasi Yuanbao dan asisten CodeBuddy milik Tencent dari kode Anda sendiri, hari ini, tanpa biaya.

Panduan ini menunjukkan cara menggunakan API Hy3 Preview secara gratis melalui OpenRouter, Hugging Face Space, dan repo Hy3 asli. Ini juga mencakup mode penalaran yang membuat Hy3 berbeda dari kebanyakan model terbuka tahun 2026, dan cara menguji API di dalam Apidog tanpa menulis skrip sementara.

button

Jika Anda ingin jalur tercepat untuk respons pertama Anda, lompat ke "Langkah demi langkah: memanggil Hy3 Preview gratis di OpenRouter."

TL;DR

Apa itu Hy3 Preview?

Hy3 Preview adalah rilis flagship pertama dari tim model dasar Hunyuan Tencent yang telah direstrukturisasi, kini dipimpin oleh Yao Shunyu, mantan peneliti OpenAI yang direkrut perusahaan untuk mendorong tumpukan penalarannya. Mari kita gambarkan sebagai model Tencent yang paling mumpuni dan jawaban langsung terhadap rilis open-weights Tiongkok teratas dari DeepSeek, Alibaba, dan Zhipu.

Profil teknis dari kartu model resmi berorientasi agen:

Yang membedakannya dari MoE 200B-an umum adalah pelatihan agensi. Tencent membangun kembali infrastruktur RL-nya untuk penggunaan alat multi-giliran, dan skor yang dipublikasikan pada SWE-bench Verified, Terminal-Bench 2.0, dan rangkaian internal WildClawBench menempatkannya dekat dengan model tertutup teratas pada tugas kode dan shell.

Tiga cara gratis menggunakan Hy3 Preview

Anda memiliki tiga jalur tergantung apakah Anda menginginkan UI obrolan, API, atau bobot lokal.

Jalur Apa itu Gratis? Baik untuk
OpenRouter tencent/hy3-preview:free API yang dihosting yang kompatibel dengan OpenAI Ya, $0 masuk/keluar Membangun agen, skrip, dan fitur backend
Hugging Face Space Demo obrolan browser Ya Prompt cepat, mencoba, tes asap
Bobot yang di-host sendiri (vLLM / SGLang) Jalankan bobot terbuka di GPU Anda sendiri Perangkat lunak gratis, biaya perangkat keras berlaku Beban kerja yang sensitif privasi, volume tinggi

Kebanyakan pengembang akan menginginkan jalur OpenRouter. Ini adalah jalur terpendek dari pendaftaran hingga panggilan API yang berfungsi, dan batas kecepatan pada tingkat gratis cukup murah hati untuk pembuatan prototipe.

Langkah demi langkah: memanggil Hy3 Preview gratis di OpenRouter

Berikut adalah jalur minimal dari nol hingga respons tencent/hy3-preview:free yang berfungsi.

  1. Buat akun OpenRouter. Daftar di openrouter.ai. Email sudah cukup; tidak diperlukan metode pembayaran untuk model tingkat gratis.
  2. Buat kunci API. Di dasbor OpenRouter, buka “Kunci” dan buat kunci baru. Salin ke variabel lingkungan, misalnya export OPENROUTER_API_KEY=sk-or-....
  3. Buka halaman model. Kunjungi daftar gratis Hy3 Preview dan konfirmasikan bahwa spanduk status bertuliskan “Gratis.” Anda juga akan melihat statistik penggunaan di sana; saat peluncuran, titik akhir ini menangani 6,81 miliar token prompt per hari di antara semua pengguna.

Kirim permintaan pertama Anda. OpenRouter mengekspos skema OpenAI Chat Completions, sehingga setiap OpenAI SDK berfungsi:

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Jelaskan keputusan perutean MoE dalam pengaturan top-8 dari 192 dalam 3 kalimat."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'
  1. Aktifkan penalaran saat Anda membutuhkannya. Hy3 menerima parameter reasoning dengan effort diatur ke low atau high. OpenRouter mengembalikan jejak pemikiran dalam array reasoning_details terpisah, ditagih sebagai bucket tokennya sendiri:
{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Rencanakan, lalu tulis skrip Bash yang merotasi file log harian yang lebih tua dari 30 hari ke folder arsip tanggal."}
  ],
  "reasoning": {"effort": "high"}
}
  1. Ulangi. Pertahankan sesi dalam thread yang sama jika Anda ingin model membangun konteks sebelumnya; jendela 256K Hy3 menangani sebagian besar basis kode lengkap secara menyeluruh.

Itu adalah keseluruhan alurnya. Model yang Anda panggil adalah model yang sama yang diterbitkan di Hugging Face; kualitas pada tingkat gratis OpenRouter identik dengan rute berbayar pada penyedia lain.

Gratis, Berbayar, dan di-host sendiri: perbedaan mereka

Gratis bukan satu-satunya jalur, dan ada baiknya melihat perbedaan sebenarnya sebelum Anda berkomitmen pada salah satunya.

Kemampuan OpenRouter Gratis OpenRouter Berbayar (titik akhir non-gratis) Di-host sendiri (vLLM / SGLang)
Biaya per token $0 Per penyedia Listrik ditambah amortisasi GPU
Mode penalaran no_think, low, high Sama Sama
Panjang konteks 256K 256K 256K (jika memori memungkinkan)
Throughput di bawah beban Pool bersama, diprioritaskan lebih rendah saat permintaan tinggi Dedicated Apa pun yang disajikan kluster Anda
Batas kecepatan Batas tingkat gratis OpenRouter (fleksibel) Spesifik penyedia Tidak ada
Retensi data Kebijakan pencatatan OpenRouter Spesifik penyedia Tetap di perangkat keras Anda
Visibilitas token penalaran Ya, via reasoning_details Ya Ya

Gratis adalah pilihan yang tepat untuk prototipe, proyek sampingan, benchmark evaluasi, dan agen lalu lintas rendah. Berbayar atau di-host sendiri masuk akal saat latensi menjadi penting atau Anda melebihi batas kecepatan.

Tips prompt dan parameter untuk mendapatkan lebih banyak dari Hy3

Hy3 menghargai pengaturan eksplisit lebih dari model yang lebih kecil. Beberapa kebiasaan membantu.

Batas yang perlu diketahui sebelum Anda menerbitkannya

Beberapa jebakan akan menjegal Anda jika Anda melewatkannya.

Jalur cepat pengembang: Hy3 Preview ditambah Apidog

Curl baris perintah bagus untuk demo. Untuk iterasi nyata, klien API visual menghemat banyak waktu.

  1. Buka Apidog dan buat proyek baru. Impor spesifikasi OpenAPI OpenAI Chat Completions; OpenRouter menggunakan skema yang sama.
  2. Atur URL dasar ke https://openrouter.ai/api/v1 dan tambahkan variabel lingkungan untuk OPENROUTER_API_KEY.
  3. Buat permintaan yang mengenai /chat/completions dengan model diatur ke tencent/hy3-preview:free.
  4. Fork permintaan untuk membandingkan mode penalaran. Apidog memungkinkan Anda menduplikasi permintaan dan mengubah satu parameter, sehingga Anda dapat menjalankan prompt yang sama dengan no_think, low, dan high secara berdampingan dan memeriksa perbedaan latensi dan output.
  5. Simpan template prompt. Prompt agen bisa panjang. Sistem lingkungan dan variabel Apidog menjaga prompt sistem, skema alat, dan giliran pengguna terpisah sehingga Anda dapat menggunakannya kembali di seluruh pengujian.

Jika Anda beralih dari Postman, peralihan ini cepat; panduan pengujian API tanpa Postman di tahun 2026 kami mencakup migrasi. Tim yang selalu berada di editor mereka dapat menjalankan alur kerja yang sama di dalam VS Code dengan Apidog di dalam VS Code, yang menjaga penyetelan prompt di samping kode yang mengonsumsi output.

Alternatif gratis ketika Anda mencapai batas

Jika pool gratis OpenRouter membatasi Anda selama jam sibuk, dua jalur yang patut dicoba terlebih dahulu.

Tidak satu pun dari ini yang cocok dengan angka SWE-bench dan Terminal-Bench Hy3 untuk pengkodean agen, tetapi mereka mencakup kasus penggunaan obrolan, multibahasa, dan multimodal yang tidak diprioritaskan oleh tingkat gratis Hy3. Untuk pembuatan produksi, Unduh Apidog dan siapkan satu koleksi per model; benchmark berdampingan pada prompt aktual Anda mengalahkan membaca papan peringkat apa pun.

button

Menghosting sendiri Hy3 Preview dengan vLLM

Jika Anda memiliki perangkat keras, inferensi lokal adalah jalur gratis keempat. Kartu model merekomendasikan vLLM dengan paralelisme tensor 8 dan prediksi multi-token diaktifkan untuk speculative decoding:

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

Perintah SGLang yang setara menggunakan --tool-call-parser hunyuan dan --reasoning-parser hunyuan. Setelah server aktif di http://localhost:8000/v1, setiap OpenAI SDK menunjuk ke sana dengan cara yang sama seperti menunjuk ke OpenRouter; hanya URL dasar dan kunci yang berubah.

Harapkan delapan GPU kelas H100 pada BF16 untuk model penuh. Build komunitas terkuantisasi akan muncul, tetapi saat peluncuran jalur resminya adalah presisi penuh.

FAQ

Apakah Hy3 Preview gratis?Ya. OpenRouter mencantumkan tencent/hy3-preview:free dengan $0 per juta token input dan $0 per juta token output. Token penalaran pada tingkat gratis juga gratis, meskipun dihitung terhadap batas kecepatan. Konfirmasikan status saat ini di halaman model OpenRouter sebelum bergantung padanya untuk produksi.

Bagaimana perbandingan Hy3 Preview dengan DeepSeek V3 dan Qwen 3?Skor SWE-bench Verified Hy3 Preview sebesar 74.4 dan Terminal-Bench 2.0 sebesar 54.4 menempatkannya dalam tingkatan yang sama dengan model terbuka Tiongkok teratas, dengan kecenderungan agen dan penggunaan alat yang jelas. Untuk obrolan murni, Qwen 3 dan DeepSeek V3 kompetitif; untuk alur kerja agen dan pengkodean, penggunaan alat yang dilatih RL Hy3 adalah pembeda.

Apa saja mode penalaran Hy3?Tiga: no_think (default, jawaban langsung), low, dan high. Ganti mode tersebut melalui parameter reasoning di OpenRouter atau melalui chat_template_kwargs={"reasoning_effort": "high"} saat memanggil model secara langsung. Gunakan high untuk perencanaan, kode multi-langkah, dan matematika; biarkan mati untuk obrolan.

Dapatkah saya menggunakan Hy3 Preview secara komersial?Ya, di bawah Lisensi Komunitas Tencent Hy. Lisensi tersebut mengizinkan penggunaan komersial dengan atribusi dan kepatuhan kebijakan penggunaan. Baca syarat lengkapnya di repo GitHub Hy3 sebelum menyebarkannya dalam produk penghasil pendapatan.

Panjang konteks apa yang didukung tingkat gratis?256K token dari awal hingga akhir. Daftar OpenRouter menunjukkan 262.144 token, cocok dengan kartu model. Anda dapat menempelkan seluruh basis kode ukuran menengah dan masih memiliki ruang untuk skema alat dan riwayat percakapan.

Bagaimana cara menguji Hy3 Preview tanpa menulis kode?Gunakan Hugging Face Space untuk demo obrolan browser, atau arahkan Apidog ke titik akhir OpenRouter. Apidog mengimpor spesifikasi OpenAPI OpenAI, sehingga mengkonfigurasi permintaan hanya membutuhkan tiga bidang: URL dasar, kunci API, dan nama model.

Mengembangkan API dengan Apidog

Apidog adalah alat pengembangan API yang membantu Anda mengembangkan API dengan lebih mudah dan efisien.