Moonshot AIは、ソフトウェア開発とコーディングエージェントの実行に特化して構築されたオープンウェイトモデル「Kimi K2.7 Code」を出荷しました。Kimi K2シリーズの1兆パラメータ規模を維持しつつ、ビジョン機能を追加し、以前のエージェント実行を高価にしていた思考トークンのコストを削減しました。Kimi K2.6またはそのAPIを使用したことがあるなら、これはコーディングに特化した後継モデルです。また、Claude CodeやCodexと真っ向から競合するKimi Codeというターミナルエージェントも搭載しています。
ここでは、このモデルが実際に何であるか、何が変わったか、そのスコア、そして今日どこで実行できるかをご紹介します。
要点
- Kimi K2.7 CodeはMixture-of-Expertsモデルです: 合計1兆パラメータ、1トークンあたり320億がアクティブです。
- 256Kトークンコンテキストウィンドウ、ビジョン機能(MoonViTエンコーダを介した画像および動画入力)、およびK2.6と比較して同等の作業で約30%少ない思考トークンを追加しています。
- ウェイトは修正MITライセンスの下で公開されており、vLLM、SGLang、またはKTransformersでセルフホストできます。
- Moonshotが報告したベンチマークでは、コーディングおよびエージェントタスクにおいてGPT-5.5とClaude Opusのすぐ後ろに位置します。その売りは、チャートのトップを狙うことではなく、オープンウェイトとコストです。
- Kimi Code(ターミナルおよびIDEコーディングエージェント)と、Apidogで数分でテストできるOpenAI互換APIを搭載しています。
Kimi K2.7 Codeを一行で説明すると
Kimi K2.7 Codeは、Moonshot AIのK2ファミリーのコーディングに特化したリリースです。最近のKimiモデルと同じスパースなMixture-of-Experts設計を使用しているため、与えられたトークンに対してウェイトの一部のみが活性化します。「Code」という接尾辞がその特徴です。Moonshotは、このチェックポイントを一般的なチャットではなく、ソフトウェア開発、多段階のツール呼び出し、および長期間のエージェントセッション向けにチューニングしました。K2.6からの主要なアップグレードは、ネイティブなマルチモーダル入力、より効率的な推論予算、そしてMoonshot独自のエージェントフレームワークとの緊密な統合です。Kimiウェブアプリ、Kimi Code CLI、ホスト型API、またはHugging Faceからウェイトをダウンロードして利用できます。
Kimi K2.6からの変更点
すでに弊社のKimi K2.6解説記事をお読みになった方なら、3つの最も重要な違いがあります。

コードとエージェントに最適化されています。 K2.6は強力な汎用モデルでした。K2.7 Codeは、コーディングワークフローに焦点を絞っています。具体的には、リファクタリング、デバッグ、コードベースの探索、タスクの途中で見失うことなくツール呼び出しを連鎖させることなどです。
思考コストが安くなりました。 Moonshotは、同等の結果に対してK2.6と比較して思考トークンの使用量が約30%削減されたと報告しています。推論トークンは課金されるトークンであるため、30%の削減はエージェント実行のコストとレイテンシーに直接影響します。何百ものツール呼び出しを伴う長時間のコーディングセッションでは、その差は急速に大きくなります。
ビジョン機能を搭載。 K2.7 Codeには4億パラメータのMoonViTビジョンエンコーダが搭載されており、スクリーンショット、図、ビデオフレームを読み取ることができます。これは、動作する前に失敗したUI、スタックトレースのスクリーンショット、またはデザインモックを見る必要があるエージェントにとって重要です。
アーキテクチャの内部
モデルの構造は、その機能と低いサービスコストの両方を説明しています。
| 仕様 | Kimi K2.7 Code |
|---|---|
| 総パラメータ数 | 1兆 |
| 1トークンあたりのアクティブパラメータ数 | 320億 |
| エキスパート | 合計384、1トークンあたり8つを選択 |
| レイヤー | 61 (1密) |
| アテンション | マルチヘッド潜在アテンション (MLA) |
| コンテキストウィンドウ | 256Kトークン |
| ビジョンエンコーダ | MoonViT、4億パラメータ |
| ライセンス | 修正MIT |
Mixture-of-Expertsのセットアップは、「1兆パラメータ」モデルの実用的な実行を可能にする理由です。ルーターは各トークンに対して384個のエキスパートのうち8個を選択するため、計算コストは全1兆ではなく320億のアクティブパラメータに対して支払われます。これにより、巨大モデルの知識容量を、中規模モデルに近いトークンごとのコストで得ることができます。
マルチヘッド潜在アテンションはキーバリューキャッシュを小さく保ち、これにより256Kのコンテキストウィンドウを低コストで提供できます。開発者が実感するのは、長いコンテキストです。サービス全体、そのテスト、および設定を1つのプロンプトに投入し、それらすべてを尊重する変更を要求できます。
ベンチマーク、正直な見方
Moonshotは、コーディングおよびエージェントスイート全体でGPT-5.5およびClaude Opusとのスコアを公開しました。そのパターンは一貫しており、K2.7 Codeは競争力があり、肉薄していますが、ほとんどのタスクでクローズドフロンティアモデルのトップには立っていません。

コーディング
| ベンチマーク | Kimi K2.7 Code | GPT-5.5 | Claude Opus |
|---|---|---|---|
| Kimi Code Bench v2 | 62.0 | 69.0 | 67.4 |
| Program Bench | 53.6 | 69.1 | 63.8 |
| MLS Bench Lite | 35.1 | 35.5 | 42.8 |
エージェントとツール使用
| ベンチマーク | Kimi K2.7 Code | GPT-5.5 | Claude Opus |
|---|---|---|---|
| Kimi Claw 24/7 | 46.9 | 52.8 | 50.4 |
| MCP Atlas | 76.0 | 79.4 | 81.3 |
| MCP Mark Verified | 81.1 | 92.9 | 76.4 |
これを公平に保つために2つの注意点があります。第一に、これらのスイートのいくつかはMoonshot独自のものであるため、中立的なリーダーボードではなく、ベンダーの枠組みとして扱ってください。第二に、この話は「Kimiが勝利した」というものではありません。「ダウンロードしてセルフホストできるオープンウェイトモデルが、レンタルしかできないモデルの数点以内に収まる」という話です。MCP Mark Verifiedでは、Claude Opusをわずかに上回っています。多くの実作業において、90%の性能であってもオープンで安価なモデルの方が良い取引です。もし純粋なコーディング性能が唯一の指標であるなら、弊社のDeepSeek V4 vs Claude Opus比較記事で、クローズドモデルとオープンモデルのギャップについてさらに詳しく解説しています。
効率性の向上が重要な理由
エージェントによるコーディングは、ファイルの読み込み、推論、ツールの呼び出し、結果の読み込み、再推論といったループでトークンを消費します。その費用のほとんどは出力ではなく推論によるものです。思考トークンを約30%削減すると、2つの効果が同時に得られます。タスクごとの料金が下がり、モデルが行動する前に書く量が減るため、各ステップの実時間が短縮されます。「思考中」にコーディングエージェントが停止するのを見たことがあるなら、それがベンチマークの数値以上の価値がある理由がわかるでしょう。コストを削減するその他の方法については、CLIからエージェントトークンコストを削減する方法に関するガイドをご覧ください。
Kimi Code:モデルに搭載されるエージェント
K2.7 Codeは単なるチェックポイントではありません。Moonshotは、モデルの強みである思考の保持、インターリーブされた推論、多段階のツール呼び出しを中心に設計されたターミナルネイティブのコーディングエージェントKimi Codeを構築しました。これにより、ファイルの書き込みと編集、シェルコマンドの実行、コードベースの検索、ウェブコンテンツの取得、並列作業のためのサブエージェントの生成が可能です。インストールは1つのコマンドで実行できます。
curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash
次に、任意のプロジェクトディレクトリでkimiを実行します。VS Code拡張機能もあり、ACPプロトコルを介してJetBrainsとZedもサポートしています。完全なセットアップ、スラッシュコマンド、初回実行ワークフローについては専用のチュートリアルで解説しています。古いKimi CLIを使用したことがある方なら、新しいエージェントは表面的に改良されたものではなく、ゼロから再構築されたものであることがわかるでしょう。
Kimi K2.7 Codeの利用場所
モデルにアクセスする方法は4つあります。
- KimiウェブアプリとKimiアプリ。 簡単な質問やプロトタイプ作成のためのチャットアクセス。セットアップ不要。
- Kimi Code CLI。 上記のターミナルエージェント。リポジトリ内で実践的なコーディングを行うため。
- API。 Moonshotプラットフォーム上のOpenAI互換エンドポイント。モデルID
kimi-k2.7-codeを使用し、既存のOpenAIクライアントをhttps://api.moonshot.ai/v1に向けます。OpenAI互換であるため、ベースURLを置き換えるだけでClaude Code、Cursor、Clineなどのツールに組み込むことができます。(定額制のKimi Codeサブスクリプションでは、別のIDkimi-for-codingを使用します。) - オープンウェイト。 Hugging Faceからダウンロードしてセルフホストします。Moonshotは、提供にvLLM、SGLang、またはKTransformersを推奨しています。データを自社ハードウェアに留める必要がある場合にこの方法を選択してください。
ApidogでKimi K2.7 Code APIをテストする方法
モデルをエージェントに組み込む前に、生の要求と応答を確認することが役立ちます。Apidogは、クライアントを作成することなくそれを実現できる視覚的なワークスペースを提供します。
- Apidogを開き、新しいHTTPリクエストを作成します。
- メソッドを
POSTに、URLをhttps://api.moonshot.ai/v1/chat/completionsに設定します。 Authorization: Bearer <your-key>ヘッダーを追加します。Kimiプラットフォームコンソールからキーを取得してください。- ボディに、
"model": "kimi-k2.7-code"とmessages配列を含むOpenAIスタイルのペイロードを送信します。 - リクエストを送信し、応答を読み取ります。ApidogはJSONをフォーマットし、トークン使用量を表示し、呼び出しを再利用可能なテストとして保存できます。
そこから、小さなテストシナリオを構築できます。応答ステータスのアサート、usage.completion_tokensが予算内に収まっているかの確認、モデルの更新ごとに実行してリグレッションを検出するなどです。エンドポイントはOpenAI互換であるため、同じセットアップがKimiプラットフォーム上のどのモデルでも機能します。MCPを介したモデルのツール呼び出しをテストしている場合は、弊社のMCPサーバーテストプレイブックが重要なアサーションについて解説しています。Apidogをダウンロードして試してみてください。
Kimi K2.7 Codeを選ぶべきユーザー
以下を構築している場合は選択してください:
- トークンコストとレイテンシーが製品の実現可能性を左右するコーディングエージェント。
- 長大なコンテキストを必要とするツール:リポジトリ全体の編集、大規模なリファクタリング、複数ファイルの推論など。
- ウェイトがオープンであるため、プライバシーまたはコンプライアンスのために自社インフラで実行する必要があるもの。
- スクリーンショット、図、またはビデオを読み取るマルチモーダルなコーディングワークフロー。
以下が必要な場合は、クローズドなフロンティアモデルを使用してください:
- 数点のベンチマークスコアが価格を正当化する、絶対的に最高のシングルショットコーディングスコア。
- セルフホスティングではなく、マネージドSLAとサポート契約。
オープンウェイト分野のより広い視野については、弊社のMiniMax M3 vs DeepSeek V4 vs Qwen 3.7比較記事で、Kimiのライバルを並べて比較しています。
よくある質問
- Kimi K2.7 Codeはオープンソースですか? ウェイトは修正MITライセンスの下で公開されており、ダウンロード、実行、ファインチューニングが可能です。商用利用の前にモデルカードのライセンス条項をお読みください。
- コンテキストウィンドウのサイズは? 256Kトークンです。これは、サービス全体とそのテストを1つのプロンプトで扱うのに十分な量です。
- ローカルで実行できますか? はい。MoonshotはvLLM、SGLang、またはKTransformersを推奨しています。フルウェイトは大規模(1兆パラメータ規模)であるため、十分なGPUメモリまたは量子化されたビルドを計画してください。
- APIのモデルIDは何ですか? Moonshot API(
https://api.moonshot.ai/v1)ではkimi-k2.7-codeを使用します。定額制のKimi Codeサブスクリプションではkimi-for-codingを使用します。エンドポイントはOpenAI互換であるため、ほとんどの既存クライアントはベースURLの変更だけで機能します。 - 通常のKimi K2.6とどう違うのですか? コーディングとエージェントに特化してチューニングされており、ビジョン機能を追加し、同等の結果に対して思考トークンを約30%少なく使用します。
- ツール呼び出しとMCPをサポートしていますか? はい。インターリーブされた推論と多段階のツール呼び出しのために構築されており、Kimi CodeはModel Context Protocolをサポートしています。
- 無料ですか? Kimiアプリでは無料でチャットでき、ウェイトも無料でダウンロードできます。APIおよびKimi Codeエージェントの利用は、クォータ制限のあるサブスクリプションプランで運用されます。
まとめ
Kimi K2.7 Codeは、オープンウェイトと低コストがベンチマークのトップを追いかけることよりも優位であるというMoonshotの賭けです。これは、アクティブな320億パラメータを持つ1兆パラメータMoEモデルで、256Kのコンテキストウィンドウ、ビジョン機能、そしてK2.6よりも約30%軽量な推論予算を備えています。ほとんどのコーディングスイートでGPT-5.5やClaude Opusを上回ることはありませんが、ダウンロード可能で実行コストが安く、有能なターミナルエージェントを搭載しているため、肉薄しています。生の品質と同じくらいコストと制御が重要なコーディングツールを構築している場合、実際にテストする価値があります。Apidogを介してリクエストを送信し、APIの動作を確認することから始め、その後セルフホストするかどうかを決定してください。
