클로드 소네트 5란? 특징, 벤치마크, 가격

Claude Sonnet 5는 Anthropic의 최신 미드티어 모델로, 2026년 6월 30일에 출시되었습니다. Anthropic은 이를 “속도와 지능의 최고의 조합”이자 “가장 에이전트 역량이 뛰어난 Sonnet 모델”이라고 부릅니다. 요약하자면, 에이전트 및 도구 사용 작업에서 Opus 4.8에 근접하면서도 비용은 훨씬 저렴합니다. 이 가이드에서는 Sonnet 5가 무엇인지, 전체 사양, 출시 벤치마크, 가격, 가용성 및 누구에게 적합한지 다룹니다. HTTP를 통해 모델을 호출할 계획이라면, 진행하면서 Apidog에서 해당 요청을 테스트할 수 있습니다.

버튼

여기 있는 모든 섹션은 심층 분석 페이지로 연결되므로, 이 페이지를 지도 삼아 API, 가격 또는 Opus 4.8과의 직접 비교에 대한 세부 정보가 필요할 때 링크를 따라가세요.

Claude Sonnet 5란 무엇인가

Claude Sonnet 5는 Claude Sonnet 4.6의 후속 모델입니다. API 모델 ID는 날짜 접미사 없이 정확히 claude-sonnet-5 문자열입니다. 이 모델은 Anthropic이 더 작은 Haiku 모델과 더 큰 Opus 및 Fable 모델 사이에 위치시키는 Sonnet 티어에 속합니다.

가장 중요한 이야기는 가치에 관한 것입니다. 모델이 도구를 사용하거나, 루프에서 실행되거나, 에이전트 역할을 하는 작업에서 Sonnet 5는 Opus 4.8에 몇 점 차이로 근접합니다. 의존할 것이 없는 순수한 추론 능력에서는 Opus가 여전히 앞섭니다. 따라서 Sonnet 5는 Opus 비용을 지불하지 않고도 강력한 에이전트 성능을 원할 때 선택하는 모델입니다.

또한 Sonnet 4.6의 드롭인 업그레이드 모델입니다. 모델 ID를 변경한 다음 세 가지 동작 변경 사항과 한 가지 토크나이저 변경 사항을 검토해야 합니다. 이러한 내용은 아래에서 다루며, 전용 Sonnet 5 vs Sonnet 4.6 비교에서도 확인할 수 있습니다.

전체 사양

claude-sonnet-5에서 얻을 수 있는 내용은 다음과 같습니다.

사양	값
컨텍스트 창	1,000,000 토큰 (1M)
최대 출력	128,000 토큰 (128K)
적응형 사고	기본적으로 활성화
노력 매개변수	low / medium / high / xhigh
비전, 프롬프트 캐싱, 도구 사용, 배치, 구조화된 출력	지원됨
우선순위 티어	제공되지 않음
제로 데이터 보존 (ZDR)	ZDR 계약을 체결한 조직에 한해 지원됨

다음은 이에 대한 몇 가지 참고 사항입니다.

1M 컨텍스트 창은 기본값이자 최대값입니다. 더 작은 컨텍스트 변형은 선택할 수 없습니다.
적응형 사고는 기본적으로 활성화되어 있습니다. 이는 thinking 필드를 보내지 않으면 전혀 사고가 발생하지 않았던 Sonnet 4.6과의 변경 사항입니다.
노력 매개변수는 모델이 얼마나 많이 사고하고 자원을 소모하는지를 제어합니다. 모델이 얼마나 열심히 작업하도록 할지에 따라 low, medium, high, 또는 xhigh로 설정할 수 있습니다.
기능 세트는 Sonnet 4.6과 일치하지만, 한 가지 예외가 있습니다: Sonnet 5에서는 우선순위 티어를 사용할 수 없습니다.

전체 요청 및 응답 형태에 대해서는 단계별 API 가이드와 Anthropic의 모델 개요를 참조하십시오.

세 가지 동작 변경 사항과 새로운 토크나이저

Sonnet 4.6에서 전환하는 경우, API 수준에서 세 가지가 변경되었습니다. 이를 놓치면 요청이 400 오류를 반환하거나 이전과 다르게 동작할 수 있습니다.

**적응형 사고가 기본적으로 활성화됩니다.** thinking 필드가 없는 요청도 이제 적응형 사고로 실행됩니다. 이를 끄려면 thinking: {type: "disabled"}를 전송하십시오. max_tokens는 총 출력(사고 토큰 + 응답 텍스트)을 제한하므로, 이전에는 사고 없이 실행되었던 워크로드에 대해 max_tokens를 다시 검토하십시오.
**수동 확장 사고 기능이 제거되었습니다.** thinking: {type: "enabled", budget_tokens: N}을 전송하면 이제 400 오류가 반환됩니다. 대신 적응형 사고 및 노력 매개변수를 사용하십시오.
**샘플링 매개변수는 허용되지 않습니다.** temperature, top_p, 또는 top_k를 기본값이 아닌 값으로 설정하면 400 오류가 반환됩니다. 마이그레이션 시 이들을 제거하십시오. 대신 시스템 프롬프트 지침을 통해 동작을 제어하십시오.

어시스턴트 메시지 미리 채우기는 Sonnet 4.6과 마찬가지로 여전히 지원되지 않으며 400 오류를 반환합니다. 구조화된 출력 또는 시스템 프롬프트 지침을 사용하여 응답을 형성하십시오.

API 형태에 영향을 미치지 않기 때문에 놓치기 쉬운 한 가지 변경 사항이 더 있습니다. Sonnet 5는 새로운 토크나이저를 사용합니다. 동일한 입력 텍스트는 Sonnet 4.6보다 약 30% 더 많은 토큰, 즉 약 1.3배 많은 토큰을 생성합니다. 요청, 응답 또는 스트리밍 코드에 대한 변경 사항은 없습니다. 그러나 토큰 단위로 측정하거나 예산을 책정하는 모든 것이 변경됩니다.

동일한 텍스트에 대해 usage 필드 및 토큰 계산 결과가 더 높아집니다. 4.6 버전의 숫자를 재사용하지 말고 Sonnet 5를 기준으로 다시 계산하십시오.
각 토큰이 더 적은 텍스트를 커버하므로, 1M 창은 평균적으로 더 적은 텍스트를 담을 수 있습니다.
예상 출력량에 맞춰 설정된 max_tokens 예산이 이제 잘릴 수 있습니다. 다시 검토하십시오.
토큰당 가격은 변동이 없지만, 동일한 텍스트에 대한 요청당 비용은 증가할 수 있습니다.

새로운 기능 페이지에는 이들 각각에 대한 내용이 문서화되어 있으며, 토큰 계산 문서에는 측정 방법이 나와 있습니다.

벤치마크 스냅샷

아래 숫자는 Anthropic이 출시 시점에 보고한 수치입니다. 이들은 출시 당일의 여러 기사에서 확인되었으므로, 독립적인 테스트 결과라기보다는 보고된 결과로 간주하십시오.

벤치마크	Sonnet 5	Opus 4.8	Sonnet 4.6
SWE-bench Pro (에이전트 코딩)	63.2%	69.2%	58.1%
Terminal-Bench 2.1	80.4%	82.7%	보고되지 않음
OSWorld-Verified (컴퓨터 사용)	81.2%	83.4%	78.5%

패턴은 일관적입니다. 루프 내 도구를 사용할 경우, Sonnet 5는 Opus 4.8에 약 1~3점 차이로 근접합니다. 의존할 것이 없는 순수한 추론에서는 Opus가 약 6점 앞섭니다. Sonnet 5는 순수한 추론보다 에이전트 및 도구 작업에서 더 강력합니다.

이전 모델과 비교했을 때, Sonnet 5는 명확하게 개선되었습니다: SWE-bench Pro는 58.1%에서 63.2%로, OSWorld-Verified는 78.5%에서 81.2%로 상승했습니다.

이러한 벤치마크가 놓치는 부분을 포함한 전체 분석은 Sonnet 5 벤치마크 심층 분석에 있습니다. 기초 수치에 대해서는 Anthropic의 투명성 허브에서도 확인할 수 있습니다.

가격

Sonnet 5는 Sonnet 4.6과 동일한 토큰당 요율을 유지하며, 출시 시점에 도입 할인이 적용되었습니다.

가격	입력 (100만 토큰당)	출력 (100만 토큰당)
도입 가격 (2026년 8월 31일까지)	$2	$10
표준 가격 (2026년 9월 1일부터)	$3	$15

백만 입력 토큰당 2달러, 백만 출력 토큰당 10달러의 도입 요율은 2026년 8월 31일까지 적용됩니다. 그 이후에는 Sonnet 4.6과 동일하게 백만 입력 토큰당 3달러, 백만 출력 토큰당 15달러의 표준 요율로 전환됩니다.

한 가지 주의할 점이 있습니다. 새로운 토크나이저가 동일한 텍스트에 대해 약 30% 더 많은 토큰을 생성하기 때문에, 토큰당 요율이 동일하더라도 동등한 요청의 비용이 Sonnet 4.6보다 높을 수 있습니다. 단순한 동등성을 가정하지 마십시오. 예산을 확정하기 전에 토큰 계산을 통해 실제 워크로드를 모델링하십시오.

참고로 Opus 4.8은 백만 입력 토큰당 5달러, 백만 출력 토큰당 25달러이며, Fable 5는 백만 입력 토큰당 10달러, 백만 출력 토큰당 50달러입니다. Sonnet 5는 이들 모델보다 훨씬 저렴합니다. 배치 및 프롬프트 캐싱 요율은 다른 곳에서 인용한 숫자보다는 Anthropic의 가격 페이지를 확인하십시오. 전체 가격 분석은 예시를 통해 상세히 설명합니다.

가용성

Sonnet 5는 Anthropic 자체 제품 및 주요 클라우드 플랫폼에서 사용할 수 있습니다.

**Claude API:** 모든 고객이 사용할 수 있습니다.
**Claude 앱:** Free 및 Pro의 기본 모델이며, Max, Team, Enterprise에서도 사용할 수 있습니다.
**Claude Code:** 사용 가능합니다.
**AWS:** Amazon Bedrock의 Claude 및 AWS의 Claude 플랫폼을 통해 제공됩니다. 기존 Bedrock InvokeModel 또는 Converse 경로에서는 제공되지 않습니다.
**Google Cloud:** Vertex AI에서 사용할 수 있습니다.
**Microsoft Foundry:** 미리 보기 단계입니다.

Sonnet 5는 무료 Claude 플랜의 기본 모델이므로, 대부분의 사람들이 비용을 지불하지 않고도 사용해 볼 수 있습니다. 무료 액세스 가이드는 합리적인 무료 사용 경로와 그 한계를 다룹니다.

안전 요약

Anthropic의 시스템 카드에 따르면 Sonnet 4.6보다 바람직하지 않은 행동의 전반적인 발생률이 낮으며, 에이전트 환경에서 모델이 더 안전합니다. Sonnet 4.6보다 환각 현상(hallucination)과 아첨(sycophancy)이 적으며, 악의적인 요청 거부 및 프롬프트 주입(prompt injection) 방지에 더 뛰어납니다.

Sonnet 5는 또한 실시간 사이버 보안 보호 기능을 갖춘 최초의 Sonnet 티어 모델입니다. 금지되거나 고위험 사이버 주제를 다루는 요청은 거부될 수 있습니다. 거부는 오류가 아닌 stop_reason: "refusal"과 함께 성공적인 HTTP 200으로 반환되므로, 코드에서 해당 중지 이유를 처리해야 합니다.

트레이드오프를 공정하게 살펴보자면: Sonnet 5는 Anthropic의 자동화된 행동 감사에서 Opus 4.8 및 Mythos Preview보다 높은 비정상적인 행동 발생률을 보이며, Opus 모델보다 사이버 기능이 낮습니다. 어떤 Sonnet 모델도 작동하는 익스플로잇을 개발할 수 없었으며, 해당 측정에서 0.0%를 기록했습니다.

Apidog으로 Sonnet 5 API 테스트하기

Sonnet 5를 호출할 때, 인증 헤더, JSON 요청 및 응답 본문, 속도 제한 및 오류가 있는 HTTP API를 사용하게 됩니다. 이것이 바로 Apidog가 처리하도록 만들어진 종류의 일입니다. Apidog은 올인원 API 개발 및 테스트 플랫폼이므로, Sonnet 5 요청을 보내고, 재사용 가능한 컬렉션으로 저장하며, 환경별로 키를 관리할 수 있습니다.

실용적인 설정은 다음과 같습니다.

Anthropic Messages 엔드포인트에 대한 요청을 생성하고, API 키를 요청 본문이 아닌 환경 변수로 저장하십시오.
팀이 재사용할 수 있도록 요청을 컬렉션에 저장하십시오.
응답 형태를 확인하기 위한 어설션을 추가하십시오. 예를 들어, stop_reason이 존재하는지 확인하여 refusal 결과가 눈에 띄지 않게 넘어가지 않도록 할 수 있습니다.
토큰을 소모하지 않고 안정적인 응답을 기반으로 구축하고 싶을 때 엔드포인트를 모의(mock)하십시오.

전송할 Messages API 형태는 다음과 같습니다.

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "이 변경 로그 항목을 한 문장으로 요약해 주세요."}
    ]
  }'

적응형 사고는 기본적으로 활성화되어 있으므로, thinking: {type: "disabled"}를 추가하지 않으면 해당 요청은 사고 과정을 거쳐 실행됩니다. max_tokens는 사고 토큰과 응답 텍스트를 함께 제한하므로, 충분한 여유 공간을 확보하십시오. 요청이 작동하면 저장하고 테스트를 추가하여 나중에 모델을 교체할 때 회귀(regression)를 방지하십시오. 따라하고 싶다면, Apidog를 다운로드하고 요청을 가져오십시오. 전체 API 가이드에는 Python SDK 버전을 포함한 전체 흐름이 설명되어 있습니다.

Sonnet 5는 누구에게 적합한가

Sonnet 5는 여러 상황에서 좋은 기본 모델입니다.

**에이전트 또는 도구 중심 워크플로우를 구축하는 경우.** Sonnet 5가 빛을 발하고 Opus 4.8에 근접하는 부분입니다.
**대량 작업을 실행하고 비용에 신경 쓰는 경우.** Opus와의 가격 차이가 크며, 도입 요율로 인해 8월까지는 그 차이가 더 커집니다.
**Sonnet 4.6에서 드롭인 업그레이드를 원하는 경우.** 모델 ID를 교체하고, 세 가지 동작 변경 사항을 검토하며, 토큰을 다시 측정하십시오.
**Claude Code 또는 편집기에서 코딩하는 경우.** Sonnet 5는 강력한 에이전트 코딩 기본 모델입니다. Claude Code에서 사용하는 방법을 확인하십시오.

가장 어려운 순수 추론, 장기적인 자율성 또는 절대적으로 최고의 품질이 필요하고 추가 비용을 감당할 가치가 있을 때는 대신 Opus 4.8을 선택하십시오. Sonnet 5 vs Opus 4.8 비교에서 해당 결정이 자세히 설명되어 있습니다. Opus 티어 자체에 대한 배경 정보는 Claude Opus 4.8이란 무엇인가를 참조하십시오.

자주 묻는 질문

Claude Sonnet 5가 Opus 4.8보다 더 나은가요? 작업에 따라 다릅니다. 에이전트 및 도구 사용 벤치마크에서는 Sonnet 5가 훨씬 저렴한 가격에 Opus 4.8에 약 1~3점 차이로 근접합니다. 순수 추론에서는 Opus 4.8이 약 6점 앞섭니다. 에이전트 및 대량 작업에는 Sonnet 5를, 가장 어려운 추론에는 Opus 4.8을 선택하십시오. 직접 비교에서 자세히 설명되어 있습니다.

Claude Sonnet 5의 모델 ID는 무엇인가요? API 모델 ID는 날짜 접미사 없이 claude-sonnet-5입니다. 요청에서 해당 문자열을 model 값으로 설정하십시오.

Claude Sonnet 5의 비용은 얼마인가요? 도입 요율은 2026년 8월 31일까지 백만 입력 토큰당 2달러, 백만 출력 토큰당 10달러입니다. 그 이후에는 표준 요율인 백만 입력 토큰당 3달러, 백만 출력 토큰당 15달러로 전환됩니다. 새로운 토크나이저가 동일한 텍스트에 대해 약 30% 더 많은 토큰을 생성하므로, 동일한 토큰당 요율이라도 동등한 요청의 비용이 더 많이 들 수 있다는 점에 유의하십시오.

Claude Sonnet 5를 무료로 사용할 수 있나요? 네. Sonnet 5는 claude.ai의 무료 Claude 플랜과 Claude Code 무료 티어의 기본 모델이며, 사용 제한이 적용됩니다. 합리적인 무료 사용 경로와 그 한계에 대해서는 무료 액세스 가이드를 참조하십시오.

Sonnet 4.6에서 업그레이드하려면 코드를 변경해야 하나요? 대부분은 모델 ID만 변경하면 됩니다. 그런 다음 세 가지 사항을 검토하십시오: 적응형 사고가 기본적으로 활성화되었으므로 max_tokens를 다시 검토하고, budget_tokens 확장 사고 필드가 이제 400 오류를 반환하며, 기본값이 아닌 샘플링 매개변수도 이제 400 오류를 반환합니다. 새로운 토크나이저로 인해 토큰 수를 다시 측정하십시오.

버튼