Hy3プレビューAPIを無料で使う方法

Ashley Innocent

Ashley Innocent

23 4月 2026

Hy3プレビューAPIを無料で使う方法

Apidog エンタープライズ

オンプレミスデプロイ

SSO & RBAC

SOC 2 準拠

Apidog Enterpriseを見る

Tencentは2026年4月22日にHy3 Previewをオープンソース化し、その日のうちにOpenRouterはこれを完全無料のエンドポイントとしてリストアップしました。クレジットカード不要、トークン課金なし、試用期間なし。TencentのYuanbaoアプリやCodeBuddyアシスタントを動かす2950億パラメーターのMixture-of-Expertsモデルを、今日から自分のコードから無料で呼び出すことができます。

このガイドでは、OpenRouter、Hugging Face Space、そしてオリジナルのHy3リポジトリを通じて、Hy3 Preview APIを無料で利用する方法を紹介します。また、Hy3を2026年の他のオープンモデルと区別する推論モードや、使い捨てスクリプトを書かずにApidog内でAPIをテストする方法についても解説します。

ボタン

最速で最初の応答を得たい場合は、「ステップバイステップ:OpenRouterでHy3 Previewを無料で呼び出す」にスキップしてください。

TL;DR

Hy3 Previewとは?

Hy3 Previewは、Tencentの再編されたHunyuan基盤モデルチームからの最初の主力リリースであり、現在、元OpenAI研究者で同社が推論スタックを推進するために雇ったYao Shunyu氏が率いています。これはTencentがこれまでに開発した中で最も高性能なモデルであり、DeepSeek、Alibaba、Zhipuからの中国製オープンウェイトモデルのトップリリースに対する直接的な回答として位置付けられます。

公式モデルカードからの技術的プロファイルは、エージェントファーストです。

2000億規模の一般的なMoEと異なる点は、エージェント学習です。Tencentは複数ターンのツール使用のためにRLインフラストラクチャを再構築し、SWE-bench Verified、Terminal-Bench 2.0、および社内WildClawBenchスイートで公開されたスコアは、コードおよびシェルタスクにおいてクローズドモデルのトップに近い位置にあります。

Hy3 Previewを無料で利用する3つの方法

チャットUI、API、またはローカルウェイトのいずれを希望するかによって、3つのパスがあります。

パス 内容 無料か? 用途
OpenRouter tencent/hy3-preview:free ホストされたOpenAI互換API はい、$0 入力/出力 エージェント、スクリプト、バックエンド機能の構築
Hugging Face Space ブラウザチャットデモ はい 簡単なプロンプト、試用、スモークテスト
セルフホストされたウェイト (vLLM / SGLang) 自身のGPUでオープンウェイトを実行 無料ソフトウェア、ハードウェア費用が発生 プライバシーに敏感なワークロード、大量処理

ほとんどの開発者はOpenRouterのルートを望むでしょう。サインアップから機能するAPI呼び出しまでの最短パスであり、無料ティアのレート制限はプロトタイピングには十分です。

ステップバイステップ:OpenRouterでHy3 Previewを無料で呼び出す

ゼロから機能するtencent/hy3-preview:free応答までの最小限のパスを以下に示します。

  1. OpenRouterアカウントを作成します。 openrouter.aiでサインアップしてください。メールアドレスだけで十分です。無料ティアのモデルには支払い方法は不要です。
  2. APIキーを生成します。 OpenRouterダッシュボードで「Keys」を開き、新しいキーを作成します。これを環境変数にコピーします。例えば export OPENROUTER_API_KEY=sk-or-... のようにします。
  3. モデルページを開きます。 Hy3 Preview無料リストにアクセスし、ステータスバナーが「Free」と表示されていることを確認してください。ここには使用状況の統計も表示されます。ローンチ時、このエンドポイントはすべてのユーザーで1日あたり68.1億プロンプトトークンを処理していました。

最初のリクエストを送信します。 OpenRouterはOpenAI Chat Completionsスキーマを公開しているので、どのOpenAI SDKでも動作します。

curl https://openrouter.ai/api/v1/chat/completions \
  -H "Authorization: Bearer $OPENROUTER_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "tencent/hy3-preview:free",
    "messages": [
      {"role": "user", "content": "Explain the MoE routing decision inside a top-8 of 192 setup in 3 sentences."}
    ],
    "temperature": 0.9,
    "top_p": 1.0
  }'
  1. 必要に応じて推論をオンにします。 Hy3は、effortlowまたはhighに設定したreasoningパラメーターを受け入れます。OpenRouterは、別のトークンバケットとして課金されるreasoning_details配列で思考トレースを返します。
{
  "model": "tencent/hy3-preview:free",
  "messages": [
    {"role": "user", "content": "Plan, then write a Bash script that rotates daily log files older than 30 days into a dated archive folder."}
  ],
  "reasoning": {"effort": "high"}
}
  1. 反復します。 モデルが以前のコンテキストに基づいて構築されることを望むなら、セッションを同じスレッドに保ちます。Hy3の256Kウィンドウは、ほとんどのフルコードベースをエンドツーエンドで処理します。

これが全フローです。呼び出すモデルはHugging Faceで公開されているものと同じです。OpenRouterの無料ティアの品質は、他のプロバイダーの有料ルートと同一です。

無料、プラス、セルフホスト:違いについて

無料だけが唯一の道ではありません。どれかを選ぶ前に実際の違いを見ておくことが役立ちます。

機能 OpenRouter 無料 OpenRouter 有料 (無料以外のエンドポイント) セルフホスト (vLLM / SGLang)
トークンあたりのコスト $0 プロバイダーごと 電気代 + GPU減価償却費
推論モード no_think, low, high 同じ 同じ
コンテキスト長 256K 256K 256K (メモリが許せば)
負荷時のスループット 共有プール、需要に応じて優先順位が下がる 専用 クラスターが提供するスループット
レート制限 OpenRouter 無料ティアの制限 (変動) プロバイダー固有 なし
データ保持 OpenRouter のロギングポリシー プロバイダー固有 自身のハードウェアに留まる
推論トークンの可視性 はい、reasoning_details 経由 はい はい

プロトタイプ、サイドプロジェクト、評価ベンチマーク、低トラフィックのエージェントには無料版が適切な選択です。レイテンシーが重要になったり、レートキャップを超過したりする場合は、有料版またはセルフホスト版が意味をなします。

Hy3を最大限に活用するためのプロンプトとパラメーターのヒント

Hy3は、小さなモデルよりも明示的な設定でより良い結果をもたらします。いくつかの習慣が役立ちます。

リリース前に知っておくべき制限

いくつかの注意点は、見落とすと問題になる可能性があります。

開発者向けの近道:Hy3 PreviewとApidog

コマンドラインのcurlはデモには十分です。しかし、実際の反復作業には、ビジュアルなAPIクライアントが時間を節約します。

  1. Apidogを開き、新しいプロジェクトを作成します。OpenAI Chat Completions OpenAPI仕様をインポートします。OpenRouterは同じスキーマを使用します。
  2. ベースURLをhttps://openrouter.ai/api/v1に設定し、OPENROUTER_API_KEYの環境変数を追加します。
  3. モデルをtencent/hy3-preview:freeに設定して、/chat/completionsをヒットするリクエストを作成します。
  4. 推論モードを比較するためにリクエストをフォークします。Apidogでは、リクエストを複製して1つのパラメーターを微調整できるため、同じプロンプトをno_thinklowhighで並行して実行し、レイテンシーと出力の違いを検査できます。
  5. プロンプトテンプレートを保存します。エージェントのプロンプトは長くなることがあります。Apidogの環境と変数システムは、システムプロンプト、ツールスキーマ、ユーザーの会話を分離して保存するため、テスト間で再利用できます。

Postmanから移行する場合、その移行は迅速です。2026年のPostmanなしでのAPIテストガイドでは、移行について説明しています。エディターで作業するチームは、VS Code内のApidogを使用してVS Code内で同じワークフローを実行できます。これにより、プロンプトの調整が出力を消費するコードのすぐ近くで行えます。

上限に達した時の無料代替手段

ピーク時にOpenRouterの無料プールでスロットリングされた場合、最初に試すべき2つの方法があります。

これらはいずれも、エージェント型コーディングにおけるHy3のSWE-benchおよびTerminal-Benchの数値には匹敵しませんが、Hy3の無料ティアが優先しないチャット、多言語、およびマルチモーダルのユースケースをカバーします。本番環境での構築には、Apidogをダウンロードし、モデルごとにコレクションをセットアップしてください。実際のプロンプトでのサイドバイサイドベンチマークは、どのリーダーボードを読むよりも効果的です。

ボタン

vLLMによるHy3 Previewのセルフホスティング

ハードウェアがあれば、ローカル推論は4つ目の無料パスです。モデルカードは、投機的デコーディングのために、テンソル並列処理8とマルチトークン予測を有効にしたvLLMを推奨しています。

vllm serve tencent/Hy3-preview \
  --tensor-parallel-size 8 \
  --speculative-config.method mtp \
  --speculative-config.num_speculative_tokens 1 \
  --tool-call-parser hy_v3 \
  --reasoning-parser hy_v3 \
  --enable-auto-tool-choice \
  --served-model-name hy3-preview

同等のSGLangコマンドは、--tool-call-parser hunyuan--reasoning-parser hunyuanを使用します。サーバーがhttp://localhost:8000/v1で起動すると、任意のOpenAI SDKは、ベースURLとキーを変更するだけで、OpenRouterを指すのと同じ方法でそれを指します。

フルモデルにはBF16で8つのH100クラスのGPUを想定してください。量子化されたコミュニティビルドも登場するでしょうが、ローンチ時点での公式パスはフル精度です。

FAQ

Hy3 Previewは無料ですか?はい、無料です。OpenRouterは、tencent/hy3-preview:freeを100万入力トークンあたり0ドル、100万出力トークンあたり0ドルでリストしています。無料ティアでの推論トークンも無料ですが、レート制限にはカウントされます。本番環境で利用する前に、OpenRouterモデルページで現在のステータスを確認してください。

Hy3 PreviewはDeepSeek V3やQwen 3と比較してどうですか?Hy3 PreviewのSWE-bench Verifiedスコア74.4、Terminal-Bench 2.0スコア54.4は、トップの中国製オープンモデルと同じティアに位置し、明確なエージェントおよびツール使用の傾向があります。純粋なチャットではQwen 3とDeepSeek V3が競合ですが、エージェントおよびコーディングワークフローでは、Hy3のRL学習によるツール使用が差別化要因となります。

Hy3の推論モードとは何ですか?3つあります:no_think(デフォルト、直接回答)、low、およびhighです。OpenRouterではreasoningパラメーターを介して、モデルを直接呼び出す場合はchat_template_kwargs={"reasoning_effort": "high"}を介して切り替えます。プランニング、多段階のコード、数学にはhighを使用し、チャットにはオフのままにします。

Hy3 Previewを商用利用できますか?はい、Tencent Hy Community Licenseのもとで可能です。このライセンスは、帰属表示と利用ポリシーの遵守を条件に商用利用を許可しています。収益を生成する製品に展開する前に、Hy3 GitHubリポジトリで完全な利用規約を読んでください。

無料ティアはどのくらいのコンテキスト長をサポートしていますか?エンドツーエンドで256Kトークンです。OpenRouterのリストでは262,144トークンと表示されており、モデルカードと一致します。中規模のコードベース全体を貼り付けても、ツールスキーマや会話履歴のための余地があります。

コードを書かずにHy3 Previewをテストするにはどうすればいいですか?ブラウザチャットデモにはHugging Face Spaceを使用するか、OpenRouterエンドポイントにApidogを向けます。ApidogはOpenAI OpenAPI仕様をインポートするため、リクエストの設定はベースURL、APIキー、モデル名の3つのフィールドだけで済みます。

ApidogでAPIデザイン中心のアプローチを取る

APIの開発と利用をよりシンプルなことにする方法を発見できる