Kimi K2.7 Codeとは

Kimi K2.7 Codeは、Moonshot AIが提供する、コーディングに特化した1兆パラメータのMoEモデルです。アクティブ320億、256Kのコンテキスト長、ビジョン機能を持ち、K2.6に比べて思考トークンが約30%少なく、ウェイトが公開されています。その機能と実行場所についてご紹介します。

Ashley Innocent

Ashley Innocent

15 6月 2026

Kimi K2.7 Codeとは

Apidog エンタープライズ

オンプレミスデプロイ

SSO & RBAC

SOC 2 準拠

Apidog Enterpriseを見る

Moonshot AIは、ソフトウェア開発とコーディングエージェントの実行に特化して構築されたオープンウェイトモデル「Kimi K2.7 Code」を出荷しました。Kimi K2シリーズの1兆パラメータ規模を維持しつつ、ビジョン機能を追加し、以前のエージェント実行を高価にしていた思考トークンのコストを削減しました。Kimi K2.6またはそのAPIを使用したことがあるなら、これはコーディングに特化した後継モデルです。また、Claude CodeやCodexと真っ向から競合するKimi Codeというターミナルエージェントも搭載しています。

ここでは、このモデルが実際に何であるか、何が変わったか、そのスコア、そして今日どこで実行できるかをご紹介します。

要点

Kimi K2.7 Codeを一行で説明すると

Kimi K2.7 Codeは、Moonshot AIのK2ファミリーのコーディングに特化したリリースです。最近のKimiモデルと同じスパースなMixture-of-Experts設計を使用しているため、与えられたトークンに対してウェイトの一部のみが活性化します。「Code」という接尾辞がその特徴です。Moonshotは、このチェックポイントを一般的なチャットではなく、ソフトウェア開発、多段階のツール呼び出し、および長期間のエージェントセッション向けにチューニングしました。K2.6からの主要なアップグレードは、ネイティブなマルチモーダル入力、より効率的な推論予算、そしてMoonshot独自のエージェントフレームワークとの緊密な統合です。Kimiウェブアプリ、Kimi Code CLI、ホスト型API、またはHugging Faceからウェイトをダウンロードして利用できます。

Kimi K2.6からの変更点

すでに弊社のKimi K2.6解説記事をお読みになった方なら、3つの最も重要な違いがあります。

コードとエージェントに最適化されています。 K2.6は強力な汎用モデルでした。K2.7 Codeは、コーディングワークフローに焦点を絞っています。具体的には、リファクタリング、デバッグ、コードベースの探索、タスクの途中で見失うことなくツール呼び出しを連鎖させることなどです。

思考コストが安くなりました。 Moonshotは、同等の結果に対してK2.6と比較して思考トークンの使用量が約30%削減されたと報告しています。推論トークンは課金されるトークンであるため、30%の削減はエージェント実行のコストとレイテンシーに直接影響します。何百ものツール呼び出しを伴う長時間のコーディングセッションでは、その差は急速に大きくなります。

ビジョン機能を搭載。 K2.7 Codeには4億パラメータのMoonViTビジョンエンコーダが搭載されており、スクリーンショット、図、ビデオフレームを読み取ることができます。これは、動作する前に失敗したUI、スタックトレースのスクリーンショット、またはデザインモックを見る必要があるエージェントにとって重要です。

アーキテクチャの内部

モデルの構造は、その機能と低いサービスコストの両方を説明しています。

仕様 Kimi K2.7 Code
総パラメータ数 1兆
1トークンあたりのアクティブパラメータ数 320億
エキスパート 合計384、1トークンあたり8つを選択
レイヤー 61 (1密)
アテンション マルチヘッド潜在アテンション (MLA)
コンテキストウィンドウ 256Kトークン
ビジョンエンコーダ MoonViT、4億パラメータ
ライセンス 修正MIT

Mixture-of-Expertsのセットアップは、「1兆パラメータ」モデルの実用的な実行を可能にする理由です。ルーターは各トークンに対して384個のエキスパートのうち8個を選択するため、計算コストは全1兆ではなく320億のアクティブパラメータに対して支払われます。これにより、巨大モデルの知識容量を、中規模モデルに近いトークンごとのコストで得ることができます。

マルチヘッド潜在アテンションはキーバリューキャッシュを小さく保ち、これにより256Kのコンテキストウィンドウを低コストで提供できます。開発者が実感するのは、長いコンテキストです。サービス全体、そのテスト、および設定を1つのプロンプトに投入し、それらすべてを尊重する変更を要求できます。

ベンチマーク、正直な見方

Moonshotは、コーディングおよびエージェントスイート全体でGPT-5.5およびClaude Opusとのスコアを公開しました。そのパターンは一貫しており、K2.7 Codeは競争力があり、肉薄していますが、ほとんどのタスクでクローズドフロンティアモデルのトップには立っていません。

コーディング

ベンチマーク Kimi K2.7 Code GPT-5.5 Claude Opus
Kimi Code Bench v2 62.0 69.0 67.4
Program Bench 53.6 69.1 63.8
MLS Bench Lite 35.1 35.5 42.8

エージェントとツール使用

ベンチマーク Kimi K2.7 Code GPT-5.5 Claude Opus
Kimi Claw 24/7 46.9 52.8 50.4
MCP Atlas 76.0 79.4 81.3
MCP Mark Verified 81.1 92.9 76.4

これを公平に保つために2つの注意点があります。第一に、これらのスイートのいくつかはMoonshot独自のものであるため、中立的なリーダーボードではなく、ベンダーの枠組みとして扱ってください。第二に、この話は「Kimiが勝利した」というものではありません。「ダウンロードしてセルフホストできるオープンウェイトモデルが、レンタルしかできないモデルの数点以内に収まる」という話です。MCP Mark Verifiedでは、Claude Opusをわずかに上回っています。多くの実作業において、90%の性能であってもオープンで安価なモデルの方が良い取引です。もし純粋なコーディング性能が唯一の指標であるなら、弊社のDeepSeek V4 vs Claude Opus比較記事で、クローズドモデルとオープンモデルのギャップについてさらに詳しく解説しています。

効率性の向上が重要な理由

エージェントによるコーディングは、ファイルの読み込み、推論、ツールの呼び出し、結果の読み込み、再推論といったループでトークンを消費します。その費用のほとんどは出力ではなく推論によるものです。思考トークンを約30%削減すると、2つの効果が同時に得られます。タスクごとの料金が下がり、モデルが行動する前に書く量が減るため、各ステップの実時間が短縮されます。「思考中」にコーディングエージェントが停止するのを見たことがあるなら、それがベンチマークの数値以上の価値がある理由がわかるでしょう。コストを削減するその他の方法については、CLIからエージェントトークンコストを削減する方法に関するガイドをご覧ください。

Kimi Code:モデルに搭載されるエージェント

K2.7 Codeは単なるチェックポイントではありません。Moonshotは、モデルの強みである思考の保持、インターリーブされた推論、多段階のツール呼び出しを中心に設計されたターミナルネイティブのコーディングエージェントKimi Codeを構築しました。これにより、ファイルの書き込みと編集、シェルコマンドの実行、コードベースの検索、ウェブコンテンツの取得、並列作業のためのサブエージェントの生成が可能です。インストールは1つのコマンドで実行できます。

curl -fsSL https://code.kimi.com/kimi-code/install.sh | bash

次に、任意のプロジェクトディレクトリでkimiを実行します。VS Code拡張機能もあり、ACPプロトコルを介してJetBrainsとZedもサポートしています。完全なセットアップ、スラッシュコマンド、初回実行ワークフローについては専用のチュートリアルで解説しています。古いKimi CLIを使用したことがある方なら、新しいエージェントは表面的に改良されたものではなく、ゼロから再構築されたものであることがわかるでしょう。

Kimi K2.7 Codeの利用場所

モデルにアクセスする方法は4つあります。

ApidogでKimi K2.7 Code APIをテストする方法

モデルをエージェントに組み込む前に、生の要求と応答を確認することが役立ちます。Apidogは、クライアントを作成することなくそれを実現できる視覚的なワークスペースを提供します。

  1. Apidogを開き、新しいHTTPリクエストを作成します。
  2. メソッドをPOSTに、URLをhttps://api.moonshot.ai/v1/chat/completionsに設定します。
  3. Authorization: Bearer <your-key>ヘッダーを追加します。Kimiプラットフォームコンソールからキーを取得してください。
  4. ボディに、"model": "kimi-k2.7-code"messages配列を含むOpenAIスタイルのペイロードを送信します。
  5. リクエストを送信し、応答を読み取ります。ApidogはJSONをフォーマットし、トークン使用量を表示し、呼び出しを再利用可能なテストとして保存できます。

そこから、小さなテストシナリオを構築できます。応答ステータスのアサート、usage.completion_tokensが予算内に収まっているかの確認、モデルの更新ごとに実行してリグレッションを検出するなどです。エンドポイントはOpenAI互換であるため、同じセットアップがKimiプラットフォーム上のどのモデルでも機能します。MCPを介したモデルのツール呼び出しをテストしている場合は、弊社のMCPサーバーテストプレイブックが重要なアサーションについて解説しています。Apidogをダウンロードして試してみてください。

Kimi K2.7 Codeを選ぶべきユーザー

以下を構築している場合は選択してください:

以下が必要な場合は、クローズドなフロンティアモデルを使用してください:

オープンウェイト分野のより広い視野については、弊社のMiniMax M3 vs DeepSeek V4 vs Qwen 3.7比較記事で、Kimiのライバルを並べて比較しています。

よくある質問

まとめ

Kimi K2.7 Codeは、オープンウェイトと低コストがベンチマークのトップを追いかけることよりも優位であるというMoonshotの賭けです。これは、アクティブな320億パラメータを持つ1兆パラメータMoEモデルで、256Kのコンテキストウィンドウ、ビジョン機能、そしてK2.6よりも約30%軽量な推論予算を備えています。ほとんどのコーディングスイートでGPT-5.5やClaude Opusを上回ることはありませんが、ダウンロード可能で実行コストが安く、有能なターミナルエージェントを搭載しているため、肉薄しています。生の品質と同じくらいコストと制御が重要なコーディングツールを構築している場合、実際にテストする価値があります。Apidogを介してリクエストを送信し、APIの動作を確認することから始め、その後セルフホストするかどうかを決定してください。

button

ApidogでAPIデザイン中心のアプローチを取る

APIの開発と利用をよりシンプルなことにする方法を発見できる