Hy3プレビューAPIを無料で使う方法

Tencentは2026年4月22日にHy3 Previewをオープンソース化し、その日のうちにOpenRouterはこれを完全無料のエンドポイントとしてリストアップしました。クレジットカード不要、トークン課金なし、試用期間なし。TencentのYuanbaoアプリやCodeBuddyアシスタントを動かす2950億パラメーターのMixture-of-Expertsモデルを、今日から自分のコードから無料で呼び出すことができます。

このガイドでは、OpenRouter、Hugging Face Space、そしてオリジナルのHy3リポジトリを通じて、Hy3 Preview APIを無料で利用する方法を紹介します。また、Hy3を2026年の他のオープンモデルと区別する推論モードや、使い捨てスクリプトを書かずにApidog内でAPIをテストする方法についても解説します。

ボタン

最速で最初の応答を得たい場合は、「ステップバイステップ：OpenRouterでHy3 Previewを無料で呼び出す」にスキップしてください。

TL;DR

Hy3 PreviewはOpenRouterで無料です。モデルID tencent/hy3-preview:free で、入力も出力も0ドルの料金で利用できます。
これはMixture-of-Expertsモデルです。合計2950億パラメーター、アクティブな210億パラメーター、トップ8ルーティングを備えた192のエキスパート、そして256Kトークンのコンテキストウィンドウを持っています。
3つの推論モードが組み込まれています。高速な回答のためのno_think、エージェントおよびコーディングタスクでの深い思考連鎖のためのlowとhighです。
オープンウェイトモデルとしては強力なベンチマーク結果を誇ります。SWE-bench Verified 74.4、Terminal-Bench 2.0 54.4、GPQA Diamond 87.2、MMLU 87.42です。
3つの無料方法で実行できます。OpenRouterの無料ティア、Hugging FaceのHy3-preview Space、またはvLLMとオープンウェイトを使用したローカル推論です。
Hy3はOpenAI Chat Completionsスキーマを使用しているため、ApidogはOpenRouterエンドポイントと相性が良いです。OpenRouterにリクエストを向けて実行するだけです。

Hy3 Previewとは？

Hy3 Previewは、Tencentの再編されたHunyuan基盤モデルチームからの最初の主力リリースであり、現在、元OpenAI研究者で同社が推論スタックを推進するために雇ったYao Shunyu氏が率いています。これはTencentがこれまでに開発した中で最も高性能なモデルであり、DeepSeek、Alibaba、Zhipuからの中国製オープンウェイトモデルのトップリリースに対する直接的な回答として位置付けられます。

公式モデルカードからの技術的プロファイルは、エージェントファーストです。

アーキテクチャ：Mixture-of-Experts、80層と1つのMTP層、グループ化クエリ注意を備えた64の注意ヘッド。
パラメーター：合計2950億、フォワードパスごとにアクティブな210億。
エキスパート：トークンごとにトップ8ルーティングを備えた192の専門家。
コンテキスト：256Kトークン（OpenRouterのリストでは262,144）。
トークナイザー：BF16精度を持つ120,832エントリの語彙。
ライセンス：Tencent Hy Community License、ライセンス条項内で商用利用が許可されています。

2000億規模の一般的なMoEと異なる点は、エージェント学習です。Tencentは複数ターンのツール使用のためにRLインフラストラクチャを再構築し、SWE-bench Verified、Terminal-Bench 2.0、および社内WildClawBenchスイートで公開されたスコアは、コードおよびシェルタスクにおいてクローズドモデルのトップに近い位置にあります。

Hy3 Previewを無料で利用する3つの方法

チャットUI、API、またはローカルウェイトのいずれを希望するかによって、3つのパスがあります。

パス	内容	無料か？	用途
OpenRouter `tencent/hy3-preview:free`	ホストされたOpenAI互換API	はい、$0 入力/出力	エージェント、スクリプト、バックエンド機能の構築
Hugging Face Space	ブラウザチャットデモ	はい	簡単なプロンプト、試用、スモークテスト
セルフホストされたウェイト (vLLM / SGLang)	自身のGPUでオープンウェイトを実行	無料ソフトウェア、ハードウェア費用が発生	プライバシーに敏感なワークロード、大量処理

ほとんどの開発者はOpenRouterのルートを望むでしょう。サインアップから機能するAPI呼び出しまでの最短パスであり、無料ティアのレート制限はプロトタイピングには十分です。

ステップバイステップ：OpenRouterでHy3 Previewを無料で呼び出す

ゼロから機能するtencent/hy3-preview:free応答までの最小限のパスを以下に示します。

OpenRouterアカウントを作成します。 openrouter.aiでサインアップしてください。メールアドレスだけで十分です。無料ティアのモデルには支払い方法は不要です。
APIキーを生成します。 OpenRouterダッシュボードで「Keys」を開き、新しいキーを作成します。これを環境変数にコピーします。例えば export OPENROUTER_API_KEY=sk-or-... のようにします。
モデルページを開きます。 Hy3 Preview無料リストにアクセスし、ステータスバナーが「Free」と表示されていることを確認してください。ここには使用状況の統計も表示されます。ローンチ時、このエンドポイントはすべてのユーザーで1日あたり68.1億プロンプトトークンを処理していました。

最初のリクエストを送信します。 OpenRouterはOpenAI Chat Completionsスキーマを公開しているので、どのOpenAI SDKでも動作します。

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explain the MoE routing decision inside a top-8 of 192 setup in 3 sentences."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'

必要に応じて推論をオンにします。 Hy3は、effortをlowまたはhighに設定したreasoningパラメーターを受け入れます。OpenRouterは、別のトークンバケットとして課金されるreasoning_details配列で思考トレースを返します。

{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Plan, then write a Bash script that rotates daily log files older than 30 days into a dated archive folder."}
  ],
  "reasoning": {"effort": "high"}
}

反復します。 モデルが以前のコンテキストに基づいて構築されることを望むなら、セッションを同じスレッドに保ちます。Hy3の256Kウィンドウは、ほとんどのフルコードベースをエンドツーエンドで処理します。

これが全フローです。呼び出すモデルはHugging Faceで公開されているものと同じです。OpenRouterの無料ティアの品質は、他のプロバイダーの有料ルートと同一です。

無料、プラス、セルフホスト：違いについて

無料だけが唯一の道ではありません。どれかを選ぶ前に実際の違いを見ておくことが役立ちます。

機能	OpenRouter 無料	OpenRouter 有料 (無料以外のエンドポイント)	セルフホスト (vLLM / SGLang)
トークンあたりのコスト	$0	プロバイダーごと	電気代 + GPU減価償却費
推論モード	`no_think`, `low`, `high`	同じ	同じ
コンテキスト長	256K	256K	256K (メモリが許せば)
負荷時のスループット	共有プール、需要に応じて優先順位が下がる	専用	クラスターが提供するスループット
レート制限	OpenRouter 無料ティアの制限 (変動)	プロバイダー固有	なし
データ保持	OpenRouter のロギングポリシー	プロバイダー固有	自身のハードウェアに留まる
推論トークンの可視性	はい、`reasoning_details` 経由	はい	はい

プロトタイプ、サイドプロジェクト、評価ベンチマーク、低トラフィックのエージェントには無料版が適切な選択です。レイテンシーが重要になったり、レートキャップを超過したりする場合は、有料版またはセルフホスト版が意味をなします。

Hy3を最大限に活用するためのプロンプトとパラメーターのヒント

Hy3は、小さなモデルよりも明示的な設定でより良い結果をもたらします。いくつかの習慣が役立ちます。

温度をモードに合わせる。 モデルカードでは、デフォルトとしてtemperature=0.9とtop_p=1.0を推奨しています。構造化された出力には0.3に下げ、クリエイティブな作業には0.9のままにします。
日常のチャットにはno_thinkを使用する。 デフォルトの推論モードがオフであるのは理由があります。プランニング、多段階のコード、または数学の場合にのみlowまたはhighが必要です。一行の質問にhighを実行すると、推論トークンが無駄になります。
システムプロンプトでツール名を指定する。 Hy3は特定のパーサー（hy_v3）を使用してツール使用のために訓練されました。OpenRouter上でも、システムプロンプトがスキーマだけに頼らず各ツールの役割を記述している場合、より良い呼び出しが得られます。
コードを引用し、要約しない。 256Kのウィンドウでは、ファイル全体を貼り付けることができます。ファイルを貼り付けてから質問してください。モデルにコードを想像させないでください。
複数ファイルの編集をバッチ処理する。 Hy3のSWE-bench Verifiedスコア74.4は、複数のファイルを一貫して編集することで達成されます。一度に1つずつではなく、全セットを1つのメッセージで与えてください。
まず計画を立てるように依頼する。 エージェント的なタスクでは、2段階のパターン（「計画をドラフトし、私の確認を待ってから実行する」）が、ワンショットプロンプトよりも一貫してクリーンな結果を生み出します。

リリース前に知っておくべき制限

いくつかの注意点は、見落とすと問題になる可能性があります。

レート制限は負荷に応じて変動します。 OpenRouterの無料ティアは、すべての無料ユーザー間で容量を共有します。ローンチ時、1日のプロンプト量は既に68.1億トークンに達しており、ピーク時間の呼び出しでは429sエラーが発生する可能性があります。指数関数的バックオフを用いたリトライを組み込みましょう。
推論トークンは出力としてカウントされます。 reasoning_detailsはOpenRouterの無料ティアでは無料ですが、有料ルートでは出力として課金されます。収益に敏感な製品にeffort: "high"のデフォルトを計測せずに導入しないでください。
ライセンスはApache 2.0ではありません。 Tencent Hy Community Licenseは商用利用を許可しますが、利用ポリシーと帰属表示の条項があります。製品にHy3を組み込む前に、GitHubリポジトリの完全なライセンスを読んでください。
ツール呼び出しには正しいパーサーが必要です。 セルフホストする場合、vLLMまたはSGLangを--tool-call-parser hy_v3（SGLangの場合はhunyuan）とともに実行してください。これがないと、ツール呼び出しはプレーンテキストとして返されます。
英語と中国語がファーストクラスであり、他の言語はセカンドクラスです。 C-Eval 89.80およびCMMLU 89.61のスコアは強力な中国語対応を示しています。他の言語はMMMLUを介してサポートされていますが、品質は低下します。
一部の推論ベンチマークでは、米国のトップフラッグシップに遅れをとっています。 HLEは30であり、SCMPの報道では、Hy3が中国のトップモデルと同等であるものの、最も難しい推論スイートではOpenAIやGoogle DeepMindの現在のフラッグシップにまだ及ばないと指摘されています。

開発者向けの近道：Hy3 PreviewとApidog

コマンドラインのcurlはデモには十分です。しかし、実際の反復作業には、ビジュアルなAPIクライアントが時間を節約します。

Apidogを開き、新しいプロジェクトを作成します。OpenAI Chat Completions OpenAPI仕様をインポートします。OpenRouterは同じスキーマを使用します。
ベースURLをhttps://openrouter.ai/api/v1に設定し、OPENROUTER_API_KEYの環境変数を追加します。
モデルをtencent/hy3-preview:freeに設定して、/chat/completionsをヒットするリクエストを作成します。
推論モードを比較するためにリクエストをフォークします。Apidogでは、リクエストを複製して1つのパラメーターを微調整できるため、同じプロンプトをno_think、low、highで並行して実行し、レイテンシーと出力の違いを検査できます。
プロンプトテンプレートを保存します。エージェントのプロンプトは長くなることがあります。Apidogの環境と変数システムは、システムプロンプト、ツールスキーマ、ユーザーの会話を分離して保存するため、テスト間で再利用できます。

Postmanから移行する場合、その移行は迅速です。2026年のPostmanなしでのAPIテストガイドでは、移行について説明しています。エディターで作業するチームは、VS Code内のApidogを使用してVS Code内で同じワークフローを実行できます。これにより、プロンプトの調整が出力を消費するコードのすぐ近くで行えます。

上限に達した時の無料代替手段

ピーク時にOpenRouterの無料プールでスロットリングされた場合、最初に試すべき2つの方法があります。

Hugging Face Space。 Hy3-preview Spaceはブラウザチャットデモをホストしています。スクリプトはできませんが、無料で迅速な比較に役立ちます。
その他の無料の中国製オープンウェイトモデル。 AlibabaのQwen 3.5 Omniは、強力なマルチモーダル出力を備えた無料ティアを提供しています。セットアップについては、当社のQwen 3.5 Omni発表および利用方法の補足をご覧ください。Zhipu GLM 5V Turboも、寛大な無料ティアを持つもう一つの選択肢です。GLM 5V Turbo APIガイドに詳細な手順があります。

これらはいずれも、エージェント型コーディングにおけるHy3のSWE-benchおよびTerminal-Benchの数値には匹敵しませんが、Hy3の無料ティアが優先しないチャット、多言語、およびマルチモーダルのユースケースをカバーします。本番環境での構築には、Apidogをダウンロードし、モデルごとにコレクションをセットアップしてください。実際のプロンプトでのサイドバイサイドベンチマークは、どのリーダーボードを読むよりも効果的です。

ボタン

vLLMによるHy3 Previewのセルフホスティング

ハードウェアがあれば、ローカル推論は4つ目の無料パスです。モデルカードは、投機的デコーディングのために、テンソル並列処理8とマルチトークン予測を有効にしたvLLMを推奨しています。

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

同等のSGLangコマンドは、--tool-call-parser hunyuanと--reasoning-parser hunyuanを使用します。サーバーがhttp://localhost:8000/v1で起動すると、任意のOpenAI SDKは、ベースURLとキーを変更するだけで、OpenRouterを指すのと同じ方法でそれを指します。

フルモデルにはBF16で8つのH100クラスのGPUを想定してください。量子化されたコミュニティビルドも登場するでしょうが、ローンチ時点での公式パスはフル精度です。

FAQ

Hy3 Previewは無料ですか？はい、無料です。OpenRouterは、tencent/hy3-preview:freeを100万入力トークンあたり0ドル、100万出力トークンあたり0ドルでリストしています。無料ティアでの推論トークンも無料ですが、レート制限にはカウントされます。本番環境で利用する前に、OpenRouterモデルページで現在のステータスを確認してください。

Hy3 PreviewはDeepSeek V3やQwen 3と比較してどうですか？Hy3 PreviewのSWE-bench Verifiedスコア74.4、Terminal-Bench 2.0スコア54.4は、トップの中国製オープンモデルと同じティアに位置し、明確なエージェントおよびツール使用の傾向があります。純粋なチャットではQwen 3とDeepSeek V3が競合ですが、エージェントおよびコーディングワークフローでは、Hy3のRL学習によるツール使用が差別化要因となります。

Hy3の推論モードとは何ですか？3つあります：no_think（デフォルト、直接回答）、low、およびhighです。OpenRouterではreasoningパラメーターを介して、モデルを直接呼び出す場合はchat_template_kwargs={"reasoning_effort": "high"}を介して切り替えます。プランニング、多段階のコード、数学にはhighを使用し、チャットにはオフのままにします。

Hy3 Previewを商用利用できますか？はい、Tencent Hy Community Licenseのもとで可能です。このライセンスは、帰属表示と利用ポリシーの遵守を条件に商用利用を許可しています。収益を生成する製品に展開する前に、Hy3 GitHubリポジトリで完全な利用規約を読んでください。

無料ティアはどのくらいのコンテキスト長をサポートしていますか？エンドツーエンドで256Kトークンです。OpenRouterのリストでは262,144トークンと表示されており、モデルカードと一致します。中規模のコードベース全体を貼り付けても、ツールスキーマや会話履歴のための余地があります。

コードを書かずにHy3 Previewをテストするにはどうすればいいですか？ブラウザチャットデモにはHugging Face Spaceを使用するか、OpenRouterエンドポイントにApidogを向けます。ApidogはOpenAI OpenAPI仕様をインポートするため、リクエストの設定はベースURL、APIキー、モデル名の3つのフィールドだけで済みます。