AlibabaのQwenチームは、最新のフラッグシップモデルを出荷し、AIコミュニティは注目しています。Qwen3.7-Maxは、Alibaba外部の誰もその名前を知る前に公開リーダーボードに登場し、数日後に開催された2026年のAlibaba Cloud Summitで正式に発表されました。これはエージェント時代のために構築された推論モデルで、長期間にわたるタスク実行、100万トークンのコンテキストウィンドウ、そして少なくとも1つの主要なインテリジェンスランキングでトップの座を獲得しています。
ソフトウェアを開発する人にとって、新しいフロンティアモデルは抽象的なニュースではありません。最終的には、それを独自のAPIの背後で接続し、その応答を検証し、アプリケーションが完成するまでの間に出力をモックすることになります。その作業のまさにその部分のためにApidogが存在します。この記事ではモデル自体に焦点を当て、Qwen 3.7があなたのスタックに適合するかどうかを判断できるようにします。以下の内容はすべてAlibabaの発表と独立した報道から得られたものであり、数値が未確認の場合はその旨を明記しています。
TL;DR (要約)
Qwen 3.7は、Alibabaの最新フラッグシップAIモデルファミリーで、Qwen3.7-Max-Previewがその筆頭です。これは100万トークンのコンテキストウィンドウと拡張思考モードを備えた独自の推論モデルです。Artificial Analysis Intelligence Indexで57点を獲得し、その公開リーダーボードで1位の結果として報告され、LM Arenaのテキストリーダーボードでは約1,475のEloスコアを記録しました。2026年5月中旬現在、Maxバリアントはプレビュー版のみで、Alibaba CloudでAPIアクセスが順次展開されています。Qwen 3.7のオープンウェイトモデルはまだ出荷されていません。
Qwen 3.7とは?
Qwen 3.7 は、中国のテクノロジー企業AlibabaのAI部門であるQwenの最新世代の大規模言語モデルです。目玉となるリリースはQwen3.7-Max-Previewで、Alibabaはこれを現時点で最も先進的で包括的なエージェントモデルであると説明しています。

「Max」という名前は、トップティアを示します。近年のQwen世代を通じて、Alibabaはより小さく、よりアクセスしやすいバリアントと共にフラッグシップのMaxモデルを出荷してきました。Qwen3.7-Max-Previewは推論モデルであり、単一のパスで応答を生成するのではなく、回答する前に問題を段階的に解決していきます。この拡張思考アプローチは、現在フロンティアモデルでは標準となっており、難しい数学、コーディング、および多段階のロジックにおいて、わずかな速度とトークンコストを犠牲にして、より強力な結果をもたらします。
ここでは2つの日付が重要です。このモデルは、Alibabaが何も公表する前の2026年5月14日頃に、プレビュー名でLM Arenaテキストリーダーボードに初めて登場しました。正式な発表は5月20日に開催された2026年Alibaba Cloud Summitで行われ、モデルは5月19日にAlibabaのAPIプラットフォームに投入されました。そのため、今日ほとんどの人が利用できるバージョンには「-Preview」の接尾辞が付いています。これは初期ビルドであり、安定版がリリースされるまでに詳細が変更される可能性があります。
Alibabaのメッセージ全体でのフレーミングは、エージェント的です。Qwen3.7-Maxはチャットボットというよりも、自律的な作業のためのエンジンとして売り込まれています。具体的には、コードの記述とデバッグ、オフィスワークフローの自動化、最小限の監視による長期間のタスクチェーンの実行などです。それが実際にどのように見えるかについては、さらに下で説明します。
Qwen 3.7のバリアントラインナップ
Qwen 3.7はリリースされて間もないため、インターネット上の情報の多くは推測であるため、ここでは正直さが重要です。
確認済み事項:
- Qwen3.7-Max-Previewは実在し、命名され、アクセス可能です。これはフラッグシップの推論モデルであり、Alibabaの発表の主題となっています。
未確認事項:
- Qwen 3.7 Plusティア。以前のQwen世代では、MaxフラッグシップモデルとPlusモデルがセットでリリースされており、いくつかの情報筋はQwen 3.7もそのパターンを踏襲すると予想しています。2026年5月中旬現在、Qwen3.7-Plusは正式にはリリースされていません。
- オープンウェイトのQwen 3.7モデル。前世代に関する報道では、Alibabaが27Bおよび35BレンジのオープンウェイトQwen 3.6バリアントをリリースしたと述べられており、一部の報道は3.7でも同様のオープンリリースを期待しています。2026年5月中旬現在、QwenLM GitHub組織はまだQwen 3.7のリポジトリをホストしておらず、Hugging FaceでもQwen 3.7のウェイトはダウンロードできませんでした。
以前のリリースパターンは参考になりますが、約束ではありません。Alibabaは、最高のモデルをプロプライエタリ(独占的)に保ちつつ、その下のティアをオープンソース化する方向に動いています。これにより、開発者は強力なモデルに無料でセルフホストでアクセスでき、フラッグシップモデルは有料API収入のために確保されます。Qwen 3.7がそのテンプレートに従う場合、最終的にはオープンのミドルティアのウェイトが期待されますが、Alibabaが確認するまでは、オンラインで見かける特定のサイズや日付は憶測として扱ってください。
確実な結論として:今日「Qwen 3.7」という言葉を聞く場合、それはほぼ間違いなくQwen3.7-Max-Previewを意味しており、そのモデルはクローズドウェイトです。
100万トークンのコンテキストウィンドウ
Artificial Analysisによると、Qwen3.7-Max-Previewは100万トークンのコンテキストウィンドウを備えています。これはモデルが一度にワーキングメモリに保持できるテキストの量で、プロンプト、貼り付けたドキュメント、これまでの会話、そして生成中の応答が含まれます。
100万トークンは、英語でおよそ70万から75万語に相当します。具体的には、これは中規模のコードリポジトリ全体、複数の長いPDFファイル、あるいは数ヶ月分のチャット履歴を単一のリクエストに収めるのに十分な量です。このモデルは、手動で入力をチャンク化したり、検索レイヤーを構築したりすることなく、これらすべてについて推論できます。
2つの注意点があります。第一に、大きなコンテキストウィンドウは上限であり、保証ではありません。ウィンドウが満杯になるにつれて、モデルの検索と推論の信頼性が低下することがよくあり、Qwen 3.7の独立した長コンテキストテストはまだ十分ではありません。第二に、大きなコンテキストはコストがかかります。送信するすべてのトークンが課金されるため、100万トークンのプロンプトは高価になります。タスクが本当に必要とする場合にのみフルウィンドウを使用し、必要ない場合は積極的にトリミングしてください。
1Mコンテキストは、フロンティアモデルではもはや珍しくありません。OpenAI、Google、Anthropicの現在のフラッグシップモデルはすべて、100万トークン前後のコンテキストウィンドウを謳っており、Qwen 3.7はここでは他社をリードするのではなく、追随する形になります。
推論と拡張思考モード
Qwen3.7-Max-Previewは推論モデルであり、それがその使用方法を形作ります。
難しい問題を与えると、モデルはまず思考の連鎖を生成します。これは、最終的な回答を決定する前に、計画し、作業を確認し、修正する内部的な一連のステップです。Qwen Chatのようなインターフェースでは、これはモデルの推論過程を見るためにオンにできる「思考中 (Thinking)」モードとして表示されます。
このコストはデータに現れています。Artificial AnalysisがIntelligence Indexの評価を実行した際、Qwen3.7-Maxは約9700万トークンを生成しました。これは、そのベンチマークにおけるモデルの平均約2400万トークンをはるかに上回ります。推論モデルは設計上冗長であり、声に出して思考するため、すべての思考トークンが支払いと待機が必要なトークンとなります。
そのトレードオフは実用的な形をしています。迅速な分類や短い書き換えの場合、そのすべての熟考は無駄なオーバーヘッドです。しかし、厄介なリファクタリング、多段階の証明、または複数の先手を計画する必要があるエージェントタスクの場合、追加の推論こそがモデルを使用する価値があるものにします。モードを仕事に合わせてください。
これはモデルをテストする際にも重要です。推論の出力は、単純な補完よりも長く、変動が大きいため、アサーションは思考の軌跡の正確な文言ではなく、最終的な回答をターゲットにする必要があります。各モデル呼び出しを検査する方法を含む、そのための実用的なセットアップは、Qwen 3.7 APIの使用方法に関するガイドで説明されています。
Qwen 3.7のベンチマーク:その位置づけ
このような新しいモデルのベンチマーク数値は慎重に読む必要があります。一部は独立した第三者から、一部はAlibaba自身のテストから得られたものであり、プレビュービルドはリリース前に変更される可能性があります。以下は、2026年5月中旬時点での報告と情報源です。
Artificial Analysis Intelligence Index
Artificial Analysis Intelligence Indexは、推論、知識、数学、コーディングの評価を1つの数値に統合した複合スコアです。Artificial Analysisによると、Qwen3.7-Maxはこのインデックスで57点を獲得しました。これは、以前のQwen 3.6 Max Previewの52点から5ポイントのジャンプと報告されており、Artificial Analysisはこれを公開リーダーボード上の218のランク付けされたモデルの中で1位の結果として掲載しました。
これは強力な成果です。ただし、前述の注意点があります。このインデックスは深く思考するモデルを評価するものであり、Qwen 3.7は非常に冗長であり、単一の複合数値は多くの詳細を圧縮しています。
LM Arena テキストEloスコア
LM Arenaは、人間の好みに基づいてモデルをランク付けします。人々は2つの匿名モデルの応答を比較し、より良い方に投票します。これらの投票は、チェスで使用されるのと同じシステムであるEloレーティングを生成します。Qwen3.7-Max-Previewは、リーダーボードの報道によると、約1,475のEloスコアでLM Arenaテキストリーダーボードに登場し、テキストアリーナで全体で約13位に位置しました。数学とコーディングのトップ10を含む特定のカテゴリでは、より上位にランクインしています。
EloとIntelligence Indexは異なるものを測定します。Intelligence Indexはタスク採点された正解度であり、Eloは人間がより好んだ回答を示します。あるモデルが一方のトップに立ち、もう一方では中位に位置することもあり、Qwen 3.7の状況も概ねこれに当たります。リーダーボードを席巻する複合スコアを持ちながらも、人間による好感度ランキングでは高く評価されるものの支配的ではありません。

推論とエージェントに関する主張
Alibaba自身の発表では、エージェント的な結果が強調されました。Qwen3.7-Maxは、最大35時間の自律的なタスク実行を維持し、パフォーマンスを低下させることなく1回の実行で1,000回以上のツール呼び出しを処理しました。前世代に関する独立した報告でも、Qwenの推論能力は大学院レベルの科学問題で分野のトップに近いとされていました。第三者が検証するまでは、当事者のエージェントに関する数値はベンダーの主張として扱ってください。これらは、長期間にわたるツールを多用する作業という、モデルが意図する強みを説明しています。
Qwen 3.7とGPT-5.5、Claude Opus 4.7、Gemini 3.5との比較
以下に、現在のフロンティアモデルの比較表を示します。検証済みの数値が引用されており、未確認または非公開の値は誤解を招かないようにマークされています。
| 仕様 | Qwen3.7-Max-Preview | GPT-5.5 | Claude Opus 4.7 | Gemini 3.5 |
|---|---|---|---|---|
| ベンダー | Alibaba (Qwen) | OpenAI | Anthropic | Google DeepMind |
| タイプ | 推論モデル | 推論モデル | 推論モデル | 推論モデル |
| コンテキストウィンドウ | 1Mトークン | 約1Mトークン | 約1Mトークン (報告範囲) | 約1M+トークン |
| ウェイト | プロプライエタリ | プロプライエタリ | プロプライエタリ | プロプライエタリ |
| AA Intelligence Index | 57 (報告1位) | ここには未記載 | ここには未記載 | ここには未記載 |
| リリース段階 | プレビュー | 安定版 | 安定版 | 安定版 |
| 推論/思考モード | あり | あり | あり | あり |
| 主要な強み | 長期間にわたるエージェントタスク | 自律型エージェント、ツール利用 | 製品品質のコード | 長いコンテキスト、費用対効果 |
この表から読み取れるいくつかの正直な点です。
純粋な複合インテリジェンスに関して、Qwen3.7-MaxがArtificial Analysis Intelligence Indexで報告された57点は、ローンチ時においてその特定のリーダーボードのトップに位置しました。これは真の結果ですが、1つのベンチマークに過ぎず、欧米のフラッグシップモデルはそれぞれ、単一のインデックスではすべて捉えきれない異なる評価でリードしています。
より明確な違いは適合性に関するものです。現世代の独立した比較では、一般的にClaude Opus 4.7が本番コードの出荷に最も強力な選択肢であり、GPT-5.5が自律型エージェントやコンピュータ使用作業のリーダーであり、Gemini 3.5がコストと長コンテキストのオプションであると説明されています。Qwen 3.7の売り込みはエージェントの分野に最も近く、競争力のあるAPI価格設定と、フラッグシップの下のティアをオープンソース化してきたAlibabaの信頼できる実績という追加の側面があります。
ほとんどのチームにとっての決定要因は、リーダーボードではなくアクセス性です。欧米のフラッグシップモデルは安定しており、今日では世界中で利用可能です。Qwen3.7-Maxはプレビュー版のみで、APIアクセスはまだ展開中です。状況が落ち着いた後の、より包括的な数値優先の比較については、Qwen 3.7 vs GPT-5.5 vs Opus 4.7をご覧ください。Googleのラインナップに絞り込んでいる場合は、Gemini 3.5とは何かに関する解説と、Gemini 3.5 vs GPT-5.5 vs Opus 4.7での比較がその側面をカバーしています。より広範な中国モデルの分野に注目している場合は、ERNIE 5.1とは何かの概要でBaiduの競合フラッグシップモデルを知ることができます。
今日、Qwen 3.7にアクセスする方法
2026年5月中旬現在、2つの実用的なアクセス方法と、注目すべき1つの方法があります。
Qwen Chat。モデルを試す最も手軽な方法は、公式チャットインターフェースchat.qwen.aiです。無料アカウントで利用制限付きでアクセスでき、「思考中 (Thinking)」モードをオンにしてモデルの推論過程を観察できます。これは、コードをコミットする前にモデルを試すのに最適な出発点です。
Alibaba Cloud API。Qwen3.7-Maxは2026年5月19日にAlibabaのAPIプラットフォームに登場し、Alibabaはより広範なAPIアクセスが順次展開されていると説明しています。近年のQwenリリースでは、フラッグシップモデルはAlibaba Cloudのモデルプラットフォームを通じて提供されてきました。プレビューモデルの可用性や料金は週ごとに変わる可能性があるため、正確なエンドポイント名と料金についてはAlibaba Cloudの最新のモデルドキュメントを確認してください。呼び出しの接続方法と推論出力の処理に関するステップバイステップの詳細は、Qwen 3.7 APIの使用方法に関する専用ガイドで解説されています。
オープンウェイト。セルフホストを希望している場合、正直な答えは「まだ」です。2026年5月中旬現在、Qwen 3.7のオープンウェイトモデルはまだ出荷されていません。Alibabaがフラッグシップの下のティアをオープンソース化するという最近のパターンに従う場合、後日ダウンロード可能な中規模ウェイトが提供される可能性があります。それまでは、Qwen 3.7へのすべての経路はAlibabaのホスト型サービスを経由します。無料ティアや低価格オプションが登場した際には、Qwen 3.7を無料で使う方法のガイドで追跡されます。
どの経路を選択するにしても、モデルはAPIの背後に存在し、あなたのアプリはそのAPIと通信します。これらのリクエストを設計し、開発中に応答をモックし、リリース前に統合をテストする際に、Apidogのようなプラットフォームが役立ちます。Apidogをダウンロードして、数分でQwen 3.7のリクエストコレクションを設定しましょう。
結論
Qwen 3.7はAIフロンティアにおける重要な参入者であり、急速に登場しました。要するに:
- Qwen3.7-Max-PreviewはAlibabaの最新フラッグシップモデルです。1Mトークンのコンテキストウィンドウと拡張思考モードを備えたプロプライエタリな推論モデルです。
- Artificial Analysis Intelligence Indexで**57点**を獲得し、そのリーダーボードで1位と報告され、LM Arenaテキストでは約**1,475 Elo**を記録し、全体で約13位でした。
- そのセールスポイントは**エージェント的**であり、長期間にわたるタスク実行、重厚なツール使用、そしてリポジトリ全体のコーディングを特徴とします。
- 2026年5月中旬現在、**プレビュー版のみ**であり、クローズドウェイトで、Alibaba Cloud APIアクセスが順次展開中です。Qwen 3.7のオープンウェイトはまだ出荷されていません。
- オンラインで見かける未確認のバリアント、サイズ、または日付は、Alibabaが発表するまでは憶測として扱ってください。
- GPT-5.5、Claude Opus 4.7、Gemini 3.5と比較して、Qwen 3.7は複合スコアで競争力があり、アグレッシブな価格設定です。ほとんどのチームにとっての決定要因は、単一のベンチマークではなく、利用可能性と適合性です。
Qwen 3.7があなたのショートリストに入るなら、次のステップはそれを実際のアプリに組み込み、統合が機能することを証明することです。Apidogを使えば、APIリクエストを設計し、開発中にモデルの応答をモックし、ライブエンドポイントに対して自動テストを実行し、すべての呼び出しを検査できます。Apidogをダウンロードして、ベンチマークの見出しを実際にリリースした何かへと変えましょう。
ボタン

