2026년 6월 12일 미국 수출 통제에 따라 Claude Fable 5가 오프라인 상태가 되었을 때, 여러분의 팀은 다른 모든 팀이 그랬던 것처럼 Claude Opus 4.8 또는 Sonnet 4.6으로 프로덕션을 전환하고, 문제가 발생한 프롬프트를 패치하며 공백을 메웠습니다. 6월 30일에 통제가 해제되었고, Fable 5가 7월 1일부로 다시 서비스됩니다. Claude.ai, API, Claude Code, Cowork 전체에서 이용 가능합니다. Anthropic은 공식 발표를 통해 전면 재배포를 확인했습니다.
솔깃한 방법은 커밋 하나를 되돌리고 하루를 마치는 것입니다. 그러지 마십시오. 여러분이 돌아가려는 서비스는 이전에 사용했던 것과 바이트 단위로 동일하지 않습니다. 서비스 중단 기간 동안 안전 계층이 재학습되었고, 클라우드 플랫폼은 여전히 따라잡는 중이며, 지난 3주간 실행했던 Opus 4.8 기준선은 이제 여러분이 가진 가장 유용한 측정 기준이 되었습니다. 이 런북은 중간에 회귀 테스트를 포함하여 순서대로 전환 과정을 안내하므로, 근육 기억이 아닌 증거를 바탕으로 프로덕션을 다시 활성화할 수 있습니다.
자리를 비운 동안 변경된 사항 파악하기
6월 12일과 7월 1일 사이에 세 가지가 변경되었고, 한 가지는 변경되지 않았습니다.
안전 분류기가 재학습되었습니다. 재배포된 Fable 5는 서비스 중단 기간 동안 보고된 탈옥(jailbreak) 기술을 목표로 재학습된 안전 분류기를 포함하고 있습니다. Anthropic은 해당 기술 시도의 99% 이상을 차단한다고 말합니다. 플래그가 지정된 요청이 실패하지는 않습니다. 대신 Claude Opus 4.8로 자동 경로 재지정되며, 응답에는 해당 사실을 알리는 알림이 포함됩니다. 세션의 95% 이상은 폴백(fallback)을 경험하지 않습니다. 마이그레이션의 경우, 중요한 점은 좁지만 분명합니다. 여러분의 프롬프트는 이제 6월 초에 비해 약간 다른 안전 계층에 대해 실행됩니다. 가정하기보다 재테스트하십시오.
클라우드 플랫폼의 상태를 확인하십시오. Amazon Bedrock은 1차 API와 동일한 날짜인 7월 1일에 Fable 5를 복원했지만, 지역별 추론 프로필은 고르지 않게 배포될 수 있습니다. Google Vertex AI 및 Microsoft Foundry는 여전히 따라잡는 중일 수 있습니다. Anthropic은 아직 보류 중인 플랫폼에 대해 "가능한 한 빨리" 배포할 것이라고 안내했지만, 확정된 날짜는 없습니다. 워크로드가 클라우드 제공업체를 통해 실행되는 경우, 일정을 잡기 전에 Fable 5가 해당 플랫폼 및 지역에서 활성화되었는지 확인하십시오.
구독 요금제는 확인할 날짜가 있습니다. 팀원들이 API 키 대신 구독 요금제로 Claude를 사용하는 경우, 7월 7일부터 요금제 크레딧 변경 사항이 적용됩니다. 이는 API 청구에는 영향을 미치지 않지만, Fable 5 워크플로우를 더 많이 사용하도록 팀을 약정하기 전에 이러한 요금제에서 Claude Code 또는 Cowork 사용에 어떤 영향을 미치는지 확인하십시오.
모델 자체는 변경되지 않았습니다. 동일한 ID인 claude-fable-5를 사용합니다. 동일한 1M 토큰 기본 컨텍스트 창, 동일한 128K 최대 출력, 입력 토큰 백만 개당 $10, 출력 토큰 백만 개당 $50의 가격도 동일합니다. 모델 개요는 6월 초와 동일한 항목을 반영합니다. 서비스 중단 전의 요청 페이로드는 여전히 유효합니다. 다시 검증해야 하는 것은 구문이 아니라 동작입니다.
최소한의 요청으로 접근성 재확인하기
프로덕션 구성을 건드리기 전에 트래픽을 처리할 환경에서 단일 요청을 보냅니다. 동일한 네트워크 경로, 동일한 키, 동일한 SDK 버전으로 말입니다. 두 가지를 확인하는 것입니다. 여러분의 자격 증명이 모델에 도달할 수 있는지, 그리고 응답하는 모델이 요청한 모델인지 확인합니다.
터미널에서 빠른 확인:
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-fable-5",
"max_tokens": 256,
"messages": [{
"role": "user",
"content": "Summarize this changelog entry in one sentence: Added retry logic to the payments webhook."
}]
}'
그리고 프로덕션 실행에 더 가까운 Python SDK를 통한 동일한 프로브:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-fable-5",
max_tokens=256,
messages=[{
"role": "user",
"content": "Summarize this changelog entry in one sentence: "
"Added retry logic to the payments webhook.",
}],
)
print(response.model) # expect "claude-fable-5"
print(response.stop_reason) # expect "end_turn"
print(response.usage) # token counts, for your cost model
가장 중요한 필드는 response.model입니다. 이는 요청을 처리한 모델의 이름을 나타냅니다. 새 안전 계층이 호출을 재라우팅했다면, 이 필드는 대신 claude-opus-4-8로 표시될 것이며, 이는 전환 후 모니터링할 정확한 신호입니다. 지금 이 지루한 요청에서 이를 확인하는 것은 습관을 들이는 것입니다.
이 단계에서 인식할 가치가 있는 두 가지 실패 모드가 있습니다. Bedrock, Vertex AI 또는 Foundry를 통해 호출할 때 모델에서 발생하는 404는 일반적으로 클라우드 재배포가 아직 해당 지역에 도달하지 않았음을 의미합니다. 티켓을 제출하기 전에 기본 API에 대해 확인하십시오. 그리고 명백히 양성인 프로브에서 발생하는 refusal 중지 이유는 규모를 확장하기 전이 아니라 그 후에 요청 형태를 더 자세히 살펴볼 가치가 있음을 의미합니다. 기존 서비스를 복원하는 대신 새 서비스를 연결하는 경우, 전체 설정 가이드는 Claude Fable 5 API 사용 방법에 있습니다.
프로덕션 재지정 전에 회귀 테스트 빌드하기
이것은 팀들이 건너뛰는 단계이며, 깔끔한 화요일 전환과 금요일 밤 롤백을 가르는 단계입니다. 여러분은 6월 중순부터 Opus 4.8에서 트래픽을 처리해왔습니다. 이 우연한 역사는 여러분에게 가치 있는 것, 즉 측정된 라이브 기준선을 제공했습니다. 이를 활용하십시오.
목표는 claude-fable-5에 대해 실행된 실제 프롬프트 모음이며, Opus 4.8 숫자와 나란히 놓을 수 있는 결과를 얻는 것입니다. 다음은 Apidog의 워크플로우입니다.
1. 수익을 창출하는 프롬프트를 수집하십시오. 합성 테스트가 아닙니다. API 테스트 코파일럿을 실행하는 경우, 상위 50개 프로덕션 프롬프트를 가져오십시오. OpenAPI 사양에서 테스트 케이스를 생성하거나, 실패한 어설션을 설명하거나, 엔드포인트에 대한 모의 응답을 작성하는 등입니다. 문서 요약 엔드포인트를 실행하는 경우, 두 단락짜리 릴리스 노트부터 컨텍스트 창에 부담을 주는 400페이지짜리 PDF까지 다양한 크기의 실제 문서를 샘플링하십시오.
2. 이를 테스트 시나리오로 구성하십시오. Apidog에서 각 프롬프트는 model이 claude-fable-5로 설정된 POST /v1/messages에 대한 요청 단계가 됩니다. 환경 변수는 API 키와 기본 URL을 보유하므로, 동일한 시나리오가 편집 없이 스테이징 및 프로덕션 자격 증명에 대해 실행됩니다.
3. 프로덕션이 의존하는 사항에 대해 어설션하십시오. 네 가지 어설션이 대부분의 실패 모드를 다룹니다.
- 상태는
200입니다. - 지연 시간은 SLO 임계값 미만입니다. Fable 5는 응답하기 전에 추론하므로, Opus 4.8의 측정값이 아닌 6월 이전 측정값에서 기준을 설정하십시오.
- 응답 본문의
model필드는claude-fable-5와 같습니다. 이것은 자동 재라우팅을 포착하는 어설션입니다. 내용에서는 통과하지만 Opus 4.8에 의해 처리된 스위트는 여러분의 프롬프트가 새 분류기를 작동시킨다는 것을 알려줍니다. stop_reason은end_turn이고, 파서가 읽는 응답 필드(구조화된 출력의 JSON 형태, 비용 파이프라인이 수집하는usage블록)가 존재합니다.
4. 실행하고 비교하십시오. claude-fable-5에 대해 스위트(suite)를 실행한 다음, 동일한 스위트의 Opus 4.8 실행 결과(통과율, p95 지연 시간, 거부 횟수, 출력 형태 실패)와 비교하십시오. 여기서의 차이점은 저렴합니다. 프로덕션에서 발견되는 동일한 차이점은 그렇지 않습니다.
5. CI/CD에서 전환을 게이트하십시오. Apidog의 CLI는 파이프라인에서 동일한 시나리오를 실행하므로, 모델 문자열을 전환하는 풀 리퀘스트는 회귀 테스트가 녹색일 때만 병합됩니다. 이는 "괜찮다고 생각한다"를 빌드 아티팩트로 전환합니다.
전환 후에도 스위트를 계속 실행하십시오. 분류기 기반의 재라우팅이 50개 프롬프트 실행에서는 나타나지 않더라도 프로덕션 볼륨에서는 여전히 나타날 수 있으므로, 단계적 배포를 통해 매일 실행하도록 예약하십시오. 마이그레이션을 위해 구축한 스위트는 이를 감시하는 카나리(canary) 역할도 합니다.
Opus 4.8로의 재라우팅 주시하기
다음은 운영자 입장에서 폴백이 어떻게 보이는지에 대한 설명입니다. 요청은 성공하고, 완성은 일관되며, HTTP 상태는 200입니다. 그러나 response.model은 claude-opus-4-8로 표시되고 응답에는 요청이 재라우팅되었다는 알림이 포함됩니다. 오류 처리에서 아무것도 발생하지 않습니다. 오류가 없었기 때문입니다. 적절한 필드를 로깅하지 않는 한, 해당 호출에 대한 지연 시간 프로필, 토큰당 비용, 출력 스타일이 조용히 변경되었습니다.
호출당 두 개의 필드면 충분합니다. 서비스 중인 model과 usage 블록입니다. 이를 이미 실행 중인 관측성 스택으로 내보내고, 재라우팅 속도에 대한 경고를 설정하십시오. 세션의 95% 이상이 폴백을 경험하지 않으므로, 몇 퍼센트 이상으로 지속적으로 급증하는 것은 특정 의미를 가집니다. 즉, 제품의 프롬프트 템플릿이 재학습된 분류기가 목표로 하는 패턴과 유사하다는 것입니다. 이는 인시던트가 아니라 프롬프트 엔지니어링 티켓이지만, 고객 이메일 대신 대시보드에서 이를 포착할 때만 해당됩니다.
자동으로 복구하고 싶은 요청의 경우, fallbacks 매개변수(Claude API 및 AWS의 Claude Platform에서 베타로 제공)는 코드에서 두 번째 왕복 없이 동일한 호출 내에서 거부를 재시도하거나 재라우팅합니다. 이는 재시도 로직을 구성하는 방법을 변경하므로, 거부 주변에 자체 재시도 루프를 구축하기 전에 Fable 5 fallbacks 매개변수에 대한 전용 가이드를 읽어볼 가치가 있습니다.
비용 계산 다시 실행하기
3주 동안 여러분의 청구서는 Opus 4.8 요율로 책정되었습니다. Fable 5는 토큰당 약 두 배의 비용이 듭니다. 백만 입력 토큰당 $10, 백만 출력 토큰당 $50이며, 원본 출시 발표의 가격과 변동이 없습니다. 다시 전환하는 것은 의도적인 지출 증가이며, 다른 아무도 눈치채지 못하더라도 재무팀은 눈치챌 것입니다.
전환 전에 폴백 기간 동안의 Opus 4.8 사용량을 가져와 Fable 5 요율로 곱하여 예측하십시오. 그런 다음 캐싱 할인을 적용하십시오. 왜냐하면 여기서 에이전트 워크로드에 대한 계산이 흥미로워지기 때문입니다. Fable 5의 프롬프트 캐싱은 90% 할인이 적용되어 캐시 히트 비용이 백만 토큰당 $1.00입니다. 모든 반복에서 크고 안정적인 시스템 프롬프트 및 도구 정의를 재전송하는 에이전트 루프는 대부분의 입력 토큰을 캐시에서 제공할 수 있습니다. 요청당 고유한 문서를 사용하는 문서 요약 엔드포인트는 그렇지 않습니다. 동일한 모델, 동일한 요율표, 요청당 유효 비용은 다릅니다.
일부 팀은 이 계산을 마치고 트래픽의 일부가 Opus 4.8에 머물러야 한다고 결론 내릴 것입니다. 이는 실패한 마이그레이션이 아니라 정당한 결과입니다. 이 결정의 기능적 측면은 Fable 5 vs Opus 4.8에 설명되어 있습니다. 요약하자면, 장기적인 추론에 프리미엄을 지불하며, 일반적인 완성에는 거의 필요하지 않습니다.
전환 체크리스트
위에서부터 아래로 실행하십시오. 건너뛰면 금요일 배포가 발생합니다.
- 모델 ID를 흩어진 문자열 리터럴이 아닌 구성에서
claude-fable-5로 고정하십시오. - Bedrock, Vertex AI 또는 Foundry를 통해 서비스하는 경우, 일정을 잡기 전에 Fable 5가 해당 플랫폼 및 지역에서 활성화되었는지 확인하십시오.
- Apidog에서 회귀 테스트가 녹색인지, Opus 4.8 기준선 실행 결과와 비교했는지 확인하십시오.
- 단계별 배포를 진행하십시오. 트래픽의 5%, 25%, 그 다음 100% 순으로, 각 단계에서 최소한 1 영업일을 유지하십시오.
- 첫 번째 카나리 요청부터 모든 호출에 대해
response.model및usage를 기록하십시오. - 전환 전에 롤백 트리거를 문서화하십시오. 예를 들어, 재라우팅 비율이 5%를 초과하거나, p95 지연 시간이 SLO를 초과하거나, 파서 오류율이 기준선을 초과하는 경우입니다. 단일 트리거라도 트래픽 분할을 되돌립니다.
- HTTP 오류뿐만 아니라 거부 및 재라우팅 비율에 대한 경고를 설정하십시오. 여기서의 실패 모드는 200을 반환합니다.
- Opus 4.8 경로를 배포 가능한 상태로 유지하십시오. 6월에 압박 속에서 구축했지만, 이제는 롤백 계획입니다.
자주 묻는 질문
재배포된 Fable 5는 6월에 오프라인이 된 것과 동일한 모델인가요? 동일한 모델 ID, 동일한 사양, 동일한 가격입니다. claude-fable-5, 1M 컨텍스트, 128K 최대 출력, 백만 토큰당 $10/$50입니다. 차이점은 그 앞에 있는 재학습된 안전 분류기이며, 이는 플래그가 지정된 요청을 Opus 4.8로 재라우팅합니다. 이것이 이 가이드가 단순한 되돌리기 대신 회귀 테스트를 고집하는 이유입니다.
제 요청 중 하나가 플래그 지정되면 어떻게 되나요? 실패하지 않습니다. 요청은 자동으로 Claude Opus 4.8로 재라우팅되어 거기서 완료되며, 응답에는 알림과 model 필드의 서비스 모델이 포함됩니다. 세션의 95% 이상은 이 상황을 경험하지 않습니다. 워크로드에서 자주 발생한다면, 이를 트리거하는 프롬프트를 검토하고 통제된 처리를 위해 베타 fallbacks 매개변수를 고려하십시오.
서비스 중단 기간 동안 작성한 페일오버 코드를 삭제해야 하나요? 아니요. 서비스 중단은 단일 모델 의존성이 취약하다는 것을 증명했으며, 여러분이 구축한 라우팅 계층은 그 외의 나쁜 달에서 얻은 영구적인 승리입니다. 이를 롤백 경로로 유지하고 공식화하십시오. AI API를 위한 페일오버 설계는 비상 패치를 아키텍처로 전환하는 방법을 다룹니다.
전환 마무리
Fable 5로 돌아가는 것은 모델 ID가 변경되지 않았음에도 불구하고 마이그레이션입니다. 마이그레이션처럼 다루십시오. 단일 요청으로 접근성을 확인하고, 재학습된 안전 계층에 대해 실제 프롬프트를 회귀 테스트 스위트로 실행하고, 6월부터 축적해온 Opus 4.8 기준선과 결과를 비교하고, response.model을 대시보드에 표시하며 단계적으로 배포하십시오. 이 작업을 수행하는 팀은 이번 주말까지 Fable 5로 돌아가고, 안전했음을 증명하는 숫자를 갖게 될 것입니다. 회귀 테스트와 CI/CD 게이트를 하나의 도구로 원한다면, 구성을 건드리기 전에 Apidog를 다운로드하여 시나리오를 구축하십시오.
