Kimi K2.7 Code API는 OpenAI 호환 엔드포인트를 통해 Moonshot의 코딩에 최적화된 조(trillion) 단위 파라미터 모델을 제공합니다. OpenAI API를 호출할 수 있다면 이 API도 호출할 수 있습니다. 기본 URL을 바꾸고 모델 ID를 설정하면 됩니다. Anthropic 호환 엔드포인트도 있어서 Claude Code에 바로 통합할 수 있습니다.
이 가이드는 API에 접근하는 두 가지 방법, 정확한 기본 URL 및 모델 ID, curl, Python, Node에서의 동작 코드, 가격 책정, 그리고 배포 전에 Apidog에서 전체를 테스트하는 방법을 다룹니다.
요약 (TL;DR)
- 기본 URL:
https://api.moonshot.ai/v1(OpenAI 호환). Claude Code의 경우,https://api.moonshot.ai/anthropic를 사용하세요. - 모델 ID: 토큰당 요금 Moonshot API에서는
kimi-k2.7-code; Kimi Code 구독에서는kimi-for-coding. - 가격: 입력 토큰 백만 개당 $0.95, 출력 토큰 백만 개당 $4.00, 캐시 적중 백만 개당 $0.19.
- Kimi 플랫폼 콘솔에서 키를 발급받은 후, 다른 OpenAI 엔드포인트처럼 호출하세요.
- 모델은 항상 추론합니다(사고가 강제됨). 따라서 모든 응답에서 추론 토큰을 예상하세요.

모델에 접근하는 두 가지 방법
사용 방식에 맞는 경로를 선택하세요.
토큰당 지불 개발자 API. Moonshot API를 통한 표준 사용량 기반 청구. 모델 ID는 kimi-k2.7-code, 기본 URL은 https://api.moonshot.ai/v1. 이것은 프로덕션 트래픽, 스크립트 및 모든 프로그래밍 작업에 적합합니다.
Kimi Code 구독. Kimi Code CLI 및 콘솔과 연결된 정액 요금제. Kimi Code 콘솔에서 발급받은 키는 모델 ID kimi-for-coding을 사용하며, 토큰당이 아닌 7일마다 갱신되는 할당량을 기준으로 청구됩니다. 토큰당 비용이 많이 발생할 수 있는 집중적인 인터랙티브 코딩에 더 적합합니다.
이 가이드의 나머지 부분에서는 자체 코드에서 호출하는 토큰당 API를 사용합니다.
1단계: API 키 받기
- Kimi 플랫폼 콘솔에 로그인하세요.
- 키를 생성하고 복사하세요. 다시 볼 수 없으므로 비밀 관리자 또는 환경 변수에 저장하세요.
- 로컬에서 내보내기:
export MOONSHOT_API_KEY="sk-your-key-here"
키를 비밀번호처럼 다루세요. 커밋하지 말고 클라이언트 측 코드에 붙여넣지 마세요.
2단계: 첫 번째 요청하기
엔드포인트는 OpenAI의 채팅 완성 기능을 미러링하므로 일반 curl 호출이 작동합니다.
curl https://api.moonshot.ai/v1/chat/completions \
-H "Authorization: Bearer $MOONSHOT_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "kimi-k2.7-code",
"messages": [
{"role": "system", "content": "You are a careful senior engineer."},
{"role": "user", "content": "Write a Python function that validates an email and returns a clear error message."}
]
}'
메시지를 포함하는 choices 배열과 입력, 출력 및 추론 토큰 수를 보여주는 usage 객체와 같은 표준 OpenAI 형식의 응답을 받게 됩니다.
3단계: Python에서 호출하기
OpenAI 호환이므로, 공식 openai SDK는 기본 URL만 변경하면 작동합니다.
from openai import OpenAI
client = OpenAI(
api_key=os.environ["MOONSHOT_API_KEY"],
base_url="https://api.moonshot.ai/v1",
)
resp = client.chat.completions.create(
model="kimi-k2.7-code",
messages=[
{"role": "user", "content": "Refactor this loop for readability and explain why."},
],
)
print(resp.choices[0].message.content)
print(resp.usage)
새로운 클라이언트도, 사용자 지정 HTTP 계층도 필요 없습니다. GPT와 통신하던 동일한 코드가 이제 Kimi와 통신합니다.
4단계: Node에서 호출하기
import OpenAI from "openai";
const client = new OpenAI({
apiKey: process.env.MOONSHOT_API_KEY,
baseURL: "https://api.moonshot.ai/v1",
});
const resp = await client.chat.completions.create({
model: "kimi-k2.7-code",
messages: [
{ role: "user", content: "Write a Jest test for an empty-input edge case." },
],
});
console.log(resp.choices[0].message.content);
모델의 동작에 대해 알아야 할 사항
몇 가지 특징이 호출 방식에 영향을 미칩니다.
사고는 항상 켜져 있습니다. K2.7 Code는 추론을 강제하고 턴(turn) 전반에 걸쳐 유지합니다. 모든 응답에는 추론 토큰이 포함되며, 이는 출력으로 비용이 청구됩니다. 장점은 K2.6보다 약 30% 더 효율적으로 추론하므로, 동일한 작업에 대해 이전 세대보다 요금이 저렴합니다.
도구 호출은 OpenAI 방식대로 작동합니다. 함수 스키마가 포함된 tools 배열을 전달하면 모델은 실행하고 다시 피드백할 도구 호출 객체를 반환합니다. 다단계 도구 사용에 최적화되어 있어 긴 체인도 놓치지 않고 처리합니다.
다중 모드입니다. 실패한 UI의 스크린샷이나 다이어그램을 읽는 것과 같은 작업에 메시지 배열에 이미지 콘텐츠를 보낼 수 있습니다.
가격 및 속도 제한
토큰당 요금:
| 토큰 유형 | 백만 개당 가격 |
|---|---|
| 입력 | $0.95 |
| 출력 (추론 포함) | $4.00 |
| 캐시 적중 | $0.19 |
두 가지가 비용을 절감합니다. 캐시 적중은 입력 가격의 일부만 청구되므로 반복되는 시스템 프롬프트와 공유 컨텍스트가 저렴해집니다. 그리고 줄어든 추론 예산은 K2.6보다 작업당 더 적은 출력 토큰을 의미합니다. 더 많은 전략은 에이전트 토큰 비용 절감 가이드를 참조하세요. 비교를 위해 이전 세대의 수치가 필요하다면, Kimi K2.6 API 가이드 및 DeepSeek V4 API 가이드에서 확인할 수 있습니다.
Claude Code, Cline 또는 Cursor 내에서 사용하기
편집기에서 K2.7 Code를 사용하기 위해 클라이언트를 작성할 필요가 없습니다.
Claude Code. Anthropic 호환 엔드포인트를 가리키세요:
export ANTHROPIC_BASE_URL="https://api.moonshot.ai/anthropic"
export ANTHROPIC_AUTH_TOKEN="$MOONSHOT_API_KEY"
export ANTHROPIC_MODEL="kimi-k2.7-code"
Cline 및 RooCode. 제공업체로 Moonshot을 선택하고, api.moonshot.ai 엔드포인트를 선택한 다음, 키를 붙여넣고 kimi-k2.7-code를 모델로 선택하세요. 가장 원활한 실행을 위해 브라우저 도구를 비활성화하세요.
Cursor. 동일한 기본 URL과 키를 사용하여 OpenAI 호환 사용자 지정 엔드포인트를 통해 모델을 추가하세요. 설정은 Cursor 내 Kimi 가이드와 동일하며, 모델 ID만 변경됩니다.
Apidog에서 API 테스트 및 디버그
API를 에이전트에 연결하기 전에 정확히 무엇을 반환하는지 확인하세요. Apidog는 요청을 보내고, 응답을 검사하고, 테스트를 고정할 수 있는 시각적 작업 공간을 제공합니다.
https://api.moonshot.ai/v1/chat/completions로 POST 요청을 생성하세요.Authorization: Bearer {{MOONSHOT_API_KEY}}헤더를 추가하고, 키를 일반 텍스트로 노출되지 않도록 Apidog 환경 변수로 저장하세요."model": "kimi-k2.7-code"와 메시지가 포함된 OpenAI 스타일 본문을 전송하세요.- 실행하세요. Apidog는 JSON을 형식화하고, 사용량 토큰 수를 표시하며, 호출을 저장합니다.
- 호출을 테스트로 전환하세요: 상태가
200인지,choices[0].message.content가 비어 있지 않은지, 그리고usage.completion_tokens가 설정한 예산 범위 내에 있는지 확인하세요.
이제 모든 모델 업데이트 시 다시 실행할 수 있는 회귀 테스트가 생겼습니다. MCP를 통해 모델의 도구 호출을 테스트하는 경우, MCP 서버 테스트 플레이북에서 손상된 도구 계약을 찾아내는 어설션을 확인할 수 있습니다. 설정을 위해 Apidog를 다운로드하세요.
자주 묻는 질문 (FAQ)
API 기본 URL은 무엇인가요? OpenAI 호환 호출의 경우 https://api.moonshot.ai/v1, Claude Code의 경우 https://api.moonshot.ai/anthropic입니다.
어떤 모델 ID를 사용해야 하나요? 토큰당 요금 API에서는 kimi-k2.7-code를 사용합니다. Kimi Code 구독은 kimi-for-coding을 사용합니다.
OpenAI와 호환되나요? 네. 요청 및 응답 형식이 OpenAI 채팅 완성 기능과 일치하므로 기존 SDK는 기본 URL 변경만으로 작동합니다. Anthropic 호환 엔드포인트도 있습니다.
비용은 얼마나 드나요? 입력 토큰 백만 개당 $0.95, 출력 토큰 백만 개당 $4.00, 캐시 적중 백만 개당 $0.19입니다.
항상 추론 토큰에 대한 비용을 지불해야 하나요? 네. 사고는 강제되어 있으므로 모든 응답에는 출력 요금으로 청구되는 추론 토큰이 포함됩니다. 그래도 K2.6보다 약 30% 적게 사용합니다.
이미지를 보낼 수 있나요? 네. 모델은 다중 모드이므로 메시지 배열에 이미지 콘텐츠를 지원합니다.
요약
Kimi K2.7 Code API는 모든 OpenAI 호환 클라이언트에서 기본 URL만 바꾸면 됩니다. https://api.moonshot.ai/v1에 접속하고, 모델 ID kimi-k2.7-code를 사용하며, 토큰 백만 개당 $0.95/$4.00를 지불합니다. 인터랙티브 코딩의 경우, kimi-for-coding을 사용하는 정액제 Kimi Code 구독이 비용이 적게 들 수 있습니다. 설정 변경으로 Claude Code, Cline, RooCode 및 Cursor에 연결할 수 있으며, 프로덕션 환경에 투입하기 전에 Apidog에서 전체를 검증할 수 있습니다. 키를 발급받고, 위에 제시된 curl 호출을 전송하고, 토큰 사용량을 확인하여 워크로드에 대한 가격 책정이 어떻게 적용되는지 확인해 보세요.
