Kimi K2.7 Code API の使い方

Kimi K2.7 Code APIは、Moonshotのコーディングに特化した兆パラメータモデルをOpenAI互換エンドポイントとして提供します。OpenAI APIを呼び出せるなら、このAPIも呼び出せます。ベースURLを交換し、モデルIDを設定するだけで完了です。Anthropic互換エンドポイントもあり、Claude Codeに直接組み込むこともできます。

このガイドでは、両方のアクセス方法、正確なベースURLとモデルID、curl、Python、Nodeでの動作コード、料金、そしてリリース前にApidogで全体をテストする方法について説明します。

ボタン

要約

ベースURL: https://api.moonshot.ai/v1 (OpenAI互換)。Claude Codeの場合は、https://api.moonshot.ai/anthropic を使用します。
モデルID: トークン課金型Moonshot APIでは kimi-k2.7-code。Kimi Codeサブスクリプションでは kimi-for-coding。
料金: 入力トークン100万個あたり$0.95、出力トークン100万個あたり$4.00、キャッシュヒット100万個あたり$0.19。
Kimiプラットフォームコンソールでキーを取得し、OpenAIエンドポイントと同じように呼び出します。
モデルは常に推論するため（思考が強制的にオンになるため）、すべての応答に推論トークンが含まれることを想定してください。

モデルへの2つのアクセス方法

用途に合った方法を選択してください。

トークン課金型開発者API。 Moonshot APIを通じた標準的な使用量ベースの課金です。モデルIDはkimi-k2.7-code、ベースURLはhttps://api.moonshot.ai/v1です。これは本番トラフィック、スクリプト、プログラムによるあらゆる用途に最適です。

Kimi Codeサブスクリプション。 Kimi Code CLIおよびコンソールに紐付いた定額プランです。Kimi Codeコンソールから発行されたキーは、モデルID kimi-for-coding を使用し、トークンごとではなく7日ごとに更新されるクォータに対して課金されます。トークンごとのコストがかさむような、集中的なインタラクティブコーディングに適しています。

このガイドの残りの部分では、ご自身のコードから呼び出すAPIであるため、トークン課金型APIを使用します。

ステップ1: APIキーを取得する

Kimiプラットフォームコンソールにサインインします。
キーを作成し、コピーします。もう一度表示されることはないので、シークレットマネージャーまたは環境変数に保存してください。
ローカルにエクスポートします:

export MOONSHOT_API_KEY="sk-your-key-here"

キーはパスワードのように扱ってください。コミットしたり、クライアントサイドのコードに貼り付けたりしないでください。

ステップ2: 初めてのリクエストを作成する

このエンドポイントはOpenAIのチャット補完をミラーリングしているため、シンプルなcurl呼び出しで動作します:

curl https://api.moonshot.ai/v1/chat/completions \
  -H "Authorization: Bearer $MOONSHOT_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "kimi-k2.7-code",
    "messages": [
      {"role": "system", "content": "You are a careful senior engineer."},
      {"role": "user", "content": "Write a Python function that validates an email and returns a clear error message."}
    ]
  }'

標準的なOpenAI形式の応答が返されます。これには、メッセージを含むchoices配列と、入力、出力、推論トークン数を表示するusageオブジェクトが含まれます。

ステップ3: Pythonから呼び出す

OpenAI互換であるため、公式のopenai SDKはベースURLを変更するだけで動作します:

from openai import OpenAI

client = OpenAI(
    api_key=os.environ["MOONSHOT_API_KEY"],
    base_url="https://api.moonshot.ai/v1",
)

resp = client.chat.completions.create(
    model="kimi-k2.7-code",
    messages=[
        {"role": "user", "content": "Refactor this loop for readability and explain why."},
    ],
)

print(resp.choices[0].message.content)
print(resp.usage)

新しいクライアントもカスタムHTTPレイヤーも不要です。GPTと通信するのと同じコードが、Kimiとも通信します。

ステップ4: Nodeから呼び出す

import OpenAI from "openai";

const client = new OpenAI({
  apiKey: process.env.MOONSHOT_API_KEY,
  baseURL: "https://api.moonshot.ai/v1",
});

const resp = await client.chat.completions.create({
  model: "kimi-k2.7-code",
  messages: [
    { role: "user", content: "Write a Jest test for an empty-input edge case." },
  ],
});

console.log(resp.choices[0].message.content);

モデルの挙動について知っておくべきこと

いくつかの特異な点が、その呼び出し方に影響を与えます。

思考は常にオンです。 K2.7 Codeは推論を強制し、それをターン間で保持します。すべての応答には推論トークンが含まれ、それらは出力として課金されます。良い点としては、K2.6よりも約30%効率的に推論するため、同じ作業でも以前の世代より費用が安くなります。

ツール呼び出しはOpenAI方式で機能します。 関数スキーマを持つtools配列を渡すと、モデルは実行してフィードバックするツール呼び出しオブジェクトを返します。これは多段階のツール使用に特化しているため、長い連鎖でも追跡を見失うことなく処理します。

マルチモーダルです。 失敗したUIのスクリーンショットや図の読み取りといったタスクのために、messages配列に画像コンテンツを送信できます。

料金とレート制限

トークン課金型料金:

トークンタイプ	100万個あたりの価格
入力	$0.95
出力 (推論含む)	$4.00
キャッシュヒット	$0.19

コストを抑えるには2つの要素があります。キャッシュヒットは入力価格の一部で課金されるため、繰り返されるシステムプロンプトや共有コンテキストは安価になります。また、推論予算の削減により、K2.6よりもタスクあたりの出力トークンが少なくなります。より多くの戦略については、エージェントのトークンコストを削減する方法に関するガイドをご覧ください。比較のために旧世代の数値を知りたい場合は、Kimi K2.6 APIガイドとDeepSeek V4 APIガイドでそれらについて説明しています。

Claude Code、Cline、またはCursor内で使用する

K2.7 Codeをエディタで利用するためにクライアントを記述する必要はありません。

Claude Code。 Anthropic互換エンドポイントを指すように設定します:

export ANTHROPIC_BASE_URL="https://api.moonshot.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="$MOONSHOT_API_KEY"
export ANTHROPIC_MODEL="kimi-k2.7-code"

ClineおよびRooCode。 プロバイダーとしてMoonshotを選択し、api.moonshot.aiエンドポイントを選び、キーを貼り付け、モデルとしてkimi-k2.7-codeを選択します。スムーズな実行のためにブラウザツールを無効にしてください。

Cursor。 同じベースURLとキーを使用して、OpenAI互換のカスタムエンドポイントを介してモデルを追加します。設定はKimi-in-Cursorガイドと同じで、モデルIDのみが異なります。

ApidogでAPIをテストおよびデバッグする

APIをエージェントに組み込む前に、それが正確に何を返すかを確認してください。Apidogは、リクエストの送信、レスポンスの検査、テストの固定を行うためのビジュアルワークスペースを提供します。

https://api.moonshot.ai/v1/chat/completionsへのPOSTリクエストを作成します。
ヘッダーAuthorization: Bearer {{MOONSHOT_API_KEY}}を追加し、キーをApidogの環境変数として保存することで、プレーンテキストで表示されることがないようにします。
"model": "kimi-k2.7-code"とmessagesを含むOpenAIスタイルのボディを送信します。
実行します。ApidogはJSONを整形し、usageトークン数を表示し、呼び出しを保存します。
その呼び出しをテストに変換します: ステータスが200であること、choices[0].message.contentが空でないこと、そしてusage.completion_tokensが設定した予算内に収まっていることをアサートします。

これで、モデルが更新されるたびに再実行できる回帰テストができました。MCPを介してモデルのツール呼び出しをテストしている場合、当社のMCPサーバーテストプレイブックには、破損したツール契約を検出するアサーションが示されています。Apidogをダウンロードして設定してください。

よくある質問

APIのベースURLは何ですか？ OpenAI互換の呼び出しにはhttps://api.moonshot.ai/v1、Claude Codeにはhttps://api.moonshot.ai/anthropicです。

どのモデルIDを使用すればよいですか？ トークン課金型APIではkimi-k2.7-code。Kimi Codeサブスクリプションではkimi-for-codingを使用します。

OpenAI互換ですか？ はい。リクエストとレスポンスの形式はOpenAIのチャット補完と一致するため、既存のSDKはベースURLを変更するだけで動作します。Anthropic互換エンドポイントもあります。

費用はいくらですか？ 入力トークン100万個あたり$0.95、出力100万個あたり$4.00、キャッシュヒット100万個あたり$0.19です。

推論トークンは常に課金されますか？ はい。思考が強制的にオンになるため、すべての応答には出力レートで課金される推論トークンが含まれます。それでもK2.6より約30%少なくなります。

画像を送信できますか？ はい。モデルはマルチモーダルであるため、メッセージ配列内の画像コンテンツがサポートされています。

まとめ

Kimi K2.7 Code APIは、OpenAI互換クライアントからベースURLを交換するだけで利用できます。https://api.moonshot.ai/v1にアクセスし、モデルID kimi-k2.7-codeを使用すると、100万トークンあたり$0.95/$4.00で利用できます。インタラクティブなコーディングの場合、kimi-for-codingを使用する定額制Kimi Codeサブスクリプションの方が費用が安くなる可能性があります。設定変更によりClaude Code、Cline、RooCode、Cursorに接続でき、本番環境で信頼する前にApidogで全体を検証できます。キーを取得し、上記のcurlコマンドを送信して、トークンの使用量を確認し、ワークロードに対する料金を把握してください。

ボタン