Claude Sonnet 5는 2026년 6월 30일에 출시되었으며, Claude Code에서 실행할 수 있는 가장 강력한 기본 모델 중 하나입니다. Anthropic은 이를 "가장 에이전트적인 Sonnet 모델"이라고 부르며, 출시 벤치마크가 이를 뒷받침합니다. 도구 사용 및 에이전트형 코딩 작업에서 Opus 4.8에 비해 가격은 훨씬 저렴하지만 점수는 몇 점 차이밖에 나지 않습니다. 이러한 조합은 모델이 파일을 읽고, 터미널 명령을 실행하며, 반복적으로 리포지토리를 편집하는 Claude Code 내부에서 가장 중요합니다.
이 가이드는 Claude Code에서 Sonnet 5를 선택하는 방법, Sonnet 5의 동작 변경 사항(이제 적응형 사고가 기본으로 설정됨), 실제 워크플로를 실행하는 방법, 그리고 Opus 4.8로 전환해야 하는 경우를 보여줍니다. 또한 모델이 추측하는 대신 API를 빌드하고 실제 엔드포인트를 테스트할 수 있도록 Apidog와 페어링하는 방법도 설명합니다.
Sonnet 5가 Claude Code의 강력한 기본 모델인 이유
Claude Code는 에이전트형 코딩 도구입니다. 모델은 한 번만 응답하는 것이 아닙니다. 계획하고, 명령을 실행하고, 출력을 읽고, 파일을 편집하고, 이 과정을 반복합니다. 이러한 반복 루프는 도구 사용에 능숙한 모델에게 유리하며, Sonnet 5는 바로 이러한 목적에 맞춰 조정되었습니다.

다음은 Anthropic이 보고한 출시 벤치마크 스냅샷입니다. 이는 보고된 수치이며, 저희의 자체 테스트 결과가 아닙니다.
| 벤치마크 | Sonnet 5 | Opus 4.8 | Sonnet 4.6 |
|---|---|---|---|
| SWE-bench Pro (에이전트형 코딩) | 63.2% | 69.2% | 58.1% |
| Terminal-Bench 2.1 | 80.4% | 82.7% | 해당 없음 |
| OSWorld-Verified (컴퓨터 사용) | 81.2% | 83.4% | 78.5% |
이 패턴이 유용한 부분입니다. 도구를 활용할 경우, Sonnet 5는 Opus 4.8과 약 1~3점 차이 내에 있습니다. 순수한 추론 능력에서는 Opus가 약 6점 앞섭니다. Claude Code에서의 코딩은 도구 사용이 많은 작업이므로, 대부분의 경우 Sonnet 5가 Opus와 유사하면서도 훨씬 저렴한 범위에 속합니다.
가격은 이 차이를 더욱 명확하게 보여줍니다. Sonnet 5는 표준 요금으로 입력 토큰 백만 개당 3달러, 출력 백만 개당 15달러이며, 2026년 8월 31일까지는 입력 2달러, 출력 10달러의 출시 기념 요금이 적용됩니다. Opus 4.8은 입력 백만 개당 5달러, 출력 25달러입니다. 에이전트형 코딩으로 바쁜 하루를 보낼 때, 이러한 가격 차이는 상당한 영향을 미 미칩니다. 아래의 토크나이저 예외를 포함한 자세한 수치는 저희의 Claude Sonnet 5 가격 분석에서 확인할 수 있습니다.
Claude Code에서 Sonnet 5 선택하기
Claude Code는 대화형 /model 명령어를 통해 모델 선택 기능을 제공합니다. 세션 내에서 다음을 입력하세요:
/model
사용 가능한 모델 목록이 있는 선택기가 나타납니다. Claude Sonnet 5를 선택하세요. 이 시점부터 해당 세션은 Sonnet 5를 계획 및 편집에 사용합니다.
선택기를 열지 않고 모델을 직접 설정하려면 다음을 전달할 수 있습니다:
/model claude-sonnet-5
claude-sonnet-5 문자열은 날짜 접미사가 없는 정확한 API 모델 ID입니다. Claude Code를 스크립팅하거나 프로젝트 기본값을 설정하는 경우 이 정확한 ID를 사용하십시오.
Sonnet 5는 출시와 동시에 Claude Code에서 사용할 수 있습니다. 또한 무료 및 Pro Claude 앱의 기본 모델이며, Max, Team, Enterprise 사용자도 사용할 수 있습니다. 따라서 유료 사용자든 무료 플랜 사용자든 오늘 Sonnet 5를 실행할 수 있습니다. 자세한 내용은 저희의 Claude Code 가이드를 참조하고, 나머지 슬래시 명령은 Claude Code CLI 명령 참조에서 확인할 수 있습니다.
모델 동작의 변화
Sonnet 5는 Sonnet 4.6의 드롭인 업그레이드이지만, 몇 가지 동작이 다릅니다. 이 중 두 가지는 Claude Code에서 작업하는 동안 나타납니다.
적응형 사고가 기본으로 설정됨
Sonnet 4.6에서는 thinking 필드가 없는 요청은 사고 없이 실행되었습니다. Sonnet 5에서는 적응형 사고가 기본으로 설정됩니다. 모델은 현재 작업에 따라 얼마나 사고할지 결정합니다. 간단한 이름 변경은 거의 사고가 필요 없지만, 여러 파일에 걸친 까다로운 리팩터링은 더 많은 사고를 필요로 합니다.
이것은 일반 API 호출에서처럼 Claude Code에서 직접 구성하는 것이 아닙니다. 도구가 요청을 관리합니다. Sonnet 5는 더 어려운 단계에서는 추론을 위해 잠시 멈추고, 간단한 단계에서는 빠르게 진행하는 것을 볼 수 있습니다. 이것이 의도한 대로 작동하는 적응형 동작입니다. 더 자세한 내용이 궁금하면 Anthropic의 적응형 사고 문서를 참조하세요.
모델은 또한 low, medium, high, xhigh의 네 가지 레벨을 가진 노력(effort) 매개변수를 지원합니다. 노력은 사고의 깊이와 소비되는 토큰 수를 제어합니다. 더 높은 노력은 가장 어려운 문제에 도움이 되지만 비용이 더 많이 듭니다. 에이전트형 루프에서, 이 매개변수는 작업이 진정으로 더 많은 숙고를 필요로 할 때 조절할 수 있는 다이얼입니다.
수동 확장 사고 및 샘플링 매개변수 제거
Claude를 중심으로 커스텀 도구를 구축했다면, 두 가지 제거 사항에 유의하십시오. 수동 확장 사고(thinking: {type: "enabled", budget_tokens: N})는 이제 400 오류를 반환합니다. 대신 적응형 사고와 노력 매개변수를 사용하세요. temperature, top_p 또는 top_k를 기본값이 아닌 값으로 설정하는 것도 400 오류를 반환합니다. 대신 프롬프트 및 시스템 지침을 통해 동작을 조절하십시오. Claude Code는 이를 자동으로 처리하지만, Sonnet 4.6에 대해 작성한 모든 스크립트는 검토해야 합니다. 전체 목록은 저희의 Sonnet 5 대 Sonnet 4.6 비교에 있습니다.
새로운 토크나이저가 컨텍스트와 비용에 미치는 영향
Sonnet 5는 새로운 토크나이저를 사용합니다. 동일한 소스 텍스트는 Sonnet 4.6보다 약 30% 더 많은 토큰, 즉 약 1.3배 많은 토큰을 생성합니다. 요청 및 응답 형태는 변경되지 않으므로 아무것도 깨지지 않지만, 두 가지가 달라집니다.
첫째, 1,000,000 토큰 컨텍스트 창은 각 토큰이 더 적은 내용을 포함하므로 평균적으로 더 적은 텍스트를 저장합니다. 큰 저장소는 원시 문자 수보다 약간 더 빨리 창을 채웁니다. 둘째, 토큰당 가격은 변하지 않았지만, 동일한 텍스트에 대한 요청당 비용이 더 높을 수 있습니다. Sonnet 4.6 토큰 추정치를 재사용하지 마십시오. 워크로드 예산을 책정하는 경우 Anthropic의 토큰 계산 엔드포인트를 사용하여 Sonnet 5에 대해 다시 계산하십시오.
Sonnet 5를 활용한 현실적인 Claude Code 워크플로
Sonnet 5는 편집 전에 계획을 세우도록 할 때 가장 효율적입니다:
- 높은 수준에서 작업을 설명합니다. 관련 파일을 읽고 코드를 건드리기 전에 계획을 제안하도록 요청하십시오.
- 계획을 검토합니다. 잘못된 부분이 있으면 수정합니다. 이것이 나중에 잘못된 편집을 수정하는 것보다 저렴합니다.
- 모델이 터미널 명령을 실행하고 파일을 편집하면서 구현하도록 합니다.
- 테스트를 실행하도록 합니다. 실패하면 출력을 읽고 반복하도록 합니다.
적응형 사고가 켜져 있기 때문에, 계획 단계에서 추론을 수동으로 늘릴 필요가 없습니다. 모델은 작업이 더 어려울 때 더 많은 노력을 기울입니다. 사용자의 역할은 명확한 지침을 제공하고 계획을 검토하는 것입니다.
컨텍스트를 염두에 두십시오. 1M 창이더라도 매번 모델에 전체 리포지토리를 공급하면 토큰과 비용이 낭비됩니다. 중요한 파일에만 모델의 주의를 집중시키세요. Sonnet 5는 범위가 지정된 작업을 잘 따르고 필요할 때만 더 많은 컨텍스트를 가져오는 데 능숙합니다.
API를 빌드한 다음 Sonnet 5가 테스트하도록 합니다.
여기서 워크플로가 구체화됩니다. Claude Code에서 REST API를 구축한다고 가정해 봅시다. 모델은 라우트를 스캐폴드할 수 있지만, 실행 중인 엔드포인트가 실제로 작동하는지 확인할 수는 없습니다. 이것이 Apidog가 채워주는 간극입니다.
Apidog에서 먼저 API를 설계하고 목업합니다. 엔드포인트, 요청 및 응답 스키마, 그리고 실제 데이터를 반환하는 목업 서버를 정의하여 백엔드가 완료되기 전에 프런트엔드와 테스트가 사용할 수 있도록 합니다. 그런 다음 Sonnet 5가 구현을 작성할 때, API 사양을 모델에 노출하는 Apidog MCP 서버를 통해 실제 엔드포인트를 가리키도록 합니다. 모델은 임의로 스키마를 생성하는 대신 실제 스키마를 읽고, 이에 맞는 핸들러를 생성하며, 라이브 서버에 대해 테스트 시나리오를 실행할 수 있습니다.
이러한 루프는 다음과 같습니다:
# Claude Code의 Sonnet 5가 엔드포인트를 구현한 다음,
# CLI를 통해 Apidog 테스트 스위트를 실행합니다:
apidog run --access-token $APIDOG_TOKEN \
--project-id $PROJECT_ID \
--test-scenario "user-signup-flow"
테스트가 실패하면 모델은 어설션 출력을 읽고 핸들러를 수정합니다. 모델이 추측이 아닌 실제 계약에 대해 검증하는 긴밀한 빌드-테스트 루프를 얻게 됩니다. Apidog의 자동화된 테스트와 시각적 어설션이 불일치를 포착하면 Sonnet 5가 수정 작업을 수행합니다. 프로젝트를 로컬에서 먼저 설정하려면 Apidog를 다운로드하세요.
솔직한 연관성은 미미합니다: 모델이 코드를 작성하고, Apidog는 API가 계약에 명시된 대로 작동하는지 확인하는 곳입니다.
Opus 4.8로 전환해야 할 때
Sonnet 5는 대부분의 Claude Code 세션에 적합한 기본 모델이지만, Opus 4.8은 몇 가지 경우에 더 높은 가격을 정당화합니다.
다음과 같은 경우 Opus 4.8을 선택하십시오:
- 작업이 도구 루프 문제가 아닌 어려운 추론 문제인 경우. 순수 알고리즘 설계 또는 미묘한 논리에서 Opus의 약 6점 리드가 나타납니다.
- 작은 오류가 여러 단계에 걸쳐 누적되는 장기적인 자율 작업을 실행하는 경우.
- 특정 중요한 변경에 대해 비용보다 품질이 더 중요한 경우.
다음과 같은 경우 Sonnet 5를 유지하십시오:
- 표준 에이전트형 코딩(파일 읽기, 명령 실행, 편집, 테스트)을 수행하는 경우.
- 작업량이 많고 비용이 중요한 경우.
- 많은 작은 작업에 걸쳐 빠른 반복을 원하는 경우.
전환은 한 가지 명령으로 이루어집니다. 어려운 작업에는 /model claude-opus-4-8을 입력하고, 나머지 세션에는 claude-sonnet-5로 다시 전환하십시오. 모든 작업에 하나의 모델을 고수할 필요는 없습니다. 더 자세한 비교는 저희의 Sonnet 5 대 Opus 4.8 비교를 읽어보십시오. 이전에 Claude Code에서 Sonnet 4.5 또는 Claude Code에서 Fable 5를 사용했다면, 여기의 워크플로는 익숙하게 느껴질 것입니다.
실용적인 팁
- 계획을 세우도록 하십시오. 사소하지 않은 작업에 대해서는 편집 전에 계획을 요청하십시오. 적응형 사고는 추론 깊이를 자동으로 처리합니다.
- 컨텍스트 범위를 지정하십시오. 모델을 관련 파일에만 집중시키십시오. 1M 창은 크지만, 새 토크나이저 때문에 예상보다 빨리 채워집니다.
- 작업량이 많은 날의 비용을 주시하십시오. Sonnet 5는 Opus보다 저렴하지만, 하루 종일 편집하면 비용이 합산됩니다. 2026년 8월 31일까지의 출시 기념 요금이 도움이 됩니다.
- 실제 계약에 대해 테스트하십시오. 코드가 "올바르게 보이는지" 믿는 대신, 모델이 엔드포인트에 대해 Apidog 테스트를 실행하도록 하십시오.
- 어려운 단계에는 노력을 사용하십시오. 작업에 더 많은 숙고가 필요할 때, 수동 사고 예산 대신 노력 매개변수(xhigh까지)가 조절 장치입니다.
자주 묻는 질문
Claude Sonnet 5는 Claude Code에서 사용할 수 있나요?
네. Sonnet 5는 2026년 6월 30일 출시일부터 Claude Code에서 사용할 수 있습니다. /model 명령으로 Claude Sonnet 5를 선택하거나 /model claude-sonnet-5로 모델 ID를 직접 전달할 수 있습니다.
적응형 사고를 위해 설정을 변경해야 하나요?
아니요. Sonnet 5에서는 적응형 사고가 기본으로 설정되어 있으며, Claude Code가 요청을 관리합니다. 모델은 각 작업에 대해 얼마나 사고할지 결정합니다. 이는 thinking 필드가 없는 요청이 사고 없이 실행되었던 Sonnet 4.6과는 다른 변경 사항입니다. 모든 동작 변경 사항 목록은 저희의 Sonnet 5 대 Sonnet 4.6 비교를 참조하십시오.
Sonnet 5는 코딩에 충분한가요, 아니면 Opus 4.8을 사용해야 하나요?
Claude Code의 대부분의 에이전트형 코딩 작업에는 Sonnet 5가 강력한 기본 모델입니다. Anthropic의 출시 벤치마크에 따르면, SWE-bench Pro 및 Terminal-Bench와 같은 도구 사용 작업에서 Opus 4.8과 약 1~3점 차이밖에 나지 않으면서 가격은 더 저렴합니다. 가장 어려운 순수 추론 문제 또는 장기적인 자율 작업에는 Opus 4.8로 전환하십시오.
Claude Code에서 Sonnet 5를 무료로 사용할 수 있나요?
Sonnet 5는 무료 및 Pro Claude 앱의 기본 모델이며 Claude Code에서 사용할 수 있습니다. 무료 사용에는 사용량 및 속도 제한이 있습니다. 정직한 사용 방법과 제한 사항에 대한 자세한 내용은 저희의 Claude Sonnet 5 무료 가이드를 참조하십시오.
새로운 토크나이저가 Claude Code 세션에 어떤 영향을 미치나요?
동일한 텍스트가 Sonnet 4.6보다 약 30% 더 많은 토큰을 생성합니다. 아무것도 깨지지 않지만, 1M 컨텍스트 창은 더 적은 텍스트를 담고 동일한 텍스트의 비용은 더 높아질 수 있습니다. 이전 추정치를 재사용하는 대신 Sonnet 5에 대해 토큰을 다시 계산하십시오.
