Fable 5への切り戻し：APIワークロードを安全に再設定する方法

2026年6月12日、米国輸出管理下でClaude Fable 5がオフラインになった際、あなたのチームは他のどのチームもそうしたように、本番環境をClaude Opus 4.8またはSonnet 4.6に向け直し、壊れたプロンプトを修正し、そのギャップを回避しました。6月30日に規制が解除され、Fable 5は7月1日より Claude.ai、API、Claude Code、Cowork全体で利用が再開されました。Anthropicは、公式発表で完全な再展開を確認しました。

つい一つのコミットを元に戻して終わりにしたくなりますが、そうしないでください。あなたが戻ろうとしているサービスは、以前とはバイト単位で全く同じではありません。停止期間中に安全レイヤーが再トレーニングされ、クラウドプラットフォームはまだ追いついている最中であり、3週間運用してきたOpus 4.8のベースラインは、今や最も役立つ測定基準となります。このランブックは、回帰テストを途中に挟みながら、順序立てて切り替えを行います。これにより、筋肉の記憶ではなく証拠に基づいて本番環境を元に戻すことができます。

ボタン

不在中に何が変わったかを確認する

6月12日から7月1日の間に3つの変更がありました。1つは変更されていません。

安全分類器が再トレーニングされました。再展開されたFable 5には、停止期間中に報告されたジェイルブレイク技術を標的とする、再トレーニングされた安全分類器が搭載されています。Anthropicによると、この技術に対する試みの99%以上をブロックするとのことです。フラグが立てられたリクエストは失敗せず、自動的にClaude Opus 4.8に再ルーティングされ、応答にはその旨の通知が含まれます。95%以上のセッションではフォールバックが発生しません。移行に関して、重要なポイントは狭いですが、あなたのプロンプトは6月初旬とはわずかに異なる安全レイヤーに対して実行されるようになったということです。推測するのではなく、再テストしてください。

クラウドプラットフォームのステータスを確認してください。Amazon Bedrockは、ファーストパーティAPIと同じ7月1日にFable 5を復元しましたが、地域ごとの推論プロファイルの展開は均一ではない可能性があります。Google Vertex AIとMicrosoft Foundryはまだ追いついている最中かもしれません。Anthropicの、保留中のプラットフォームに関するガイダンスは「できるだけ早く」であり、確定した日付はありません。もしあなたのワークロードがクラウドプロバイダー経由で実行される場合、何かをスケジュールする前に、Fable 5があなたのプラットフォームと地域で稼働していることを確認してください。

サブスクリプションプランには注視すべき日付があります。チームメンバーがAPIキーではなくサブスクリプションプランでClaudeを使用している場合、7月7日にプランクレジットの変更が適用されます。これはAPIの課金には影響しませんが、チームがFable 5のより重いワークフローに取り組む前に、これらのプランでのClaude CodeまたはCoworkの使用にどのように影響するかを確認してください。

モデル自体は変更されていません。同じID、claude-fable-5。同じ1Mトークンのデフォルトコンテキストウィンドウ、同じ128Kの最大出力、同じ入力100万トークンあたり10ドル、出力100万トークンあたり50ドル。モデルの概要には、6月初旬と同じエントリが反映されています。停止前のリクエストペイロードは引き続き有効です。再検証が必要なのは構文ではなく、動作です。

最小限のリクエストでアクセスを再検証する

本番環境の設定を変更する前に、トラフィックを処理する環境から単一のリクエストを送信してください。同じネットワークパス、同じキー、同じSDKバージョンを使用します。これにより、2つのことを確認します。あなたの認証情報がモデルに到達できること、そして応答するモデルがあなたが要求したモデルであることです。

ターミナルからの簡単なチェック：

curl https://api.anthropic.com/v1/messages \
  -H "x-api-key: $ANTHROPIC_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -H "content-type: application/json" \
  -d '{
    "model": "claude-fable-5",
    "max_tokens": 256,
    "messages": [{
      "role": "user",
      "content": "Summarize this changelog entry in one sentence: Added retry logic to the payments webhook."
    }]
  }'

そして、本番環境の動作に近いPython SDK経由での同じプローブ：

import anthropic

client = anthropic.Anthropic()

response = client.messages.create(
    model="claude-fable-5",
    max_tokens=256,
    messages=[{
        "role": "user",
        "content": "Summarize this changelog entry in one sentence: "
                   "Added retry logic to the payments webhook.",
    }],
)

print(response.model)        # expect "claude-fable-5"
print(response.stop_reason)  # expect "end_turn"
print(response.usage)        # token counts, for your cost model

最も重要なフィールドはresponse.modelです。これはリクエストを処理したモデルの名前を示します。新しい安全レイヤーがあなたの呼び出しを再ルーティングした場合、このフィールドはclaude-opus-4-8と表示され、これは切り替え後に監視するべき正確なシグナルです。今、一つの簡単なリクエストでこれを確認することで、習慣づけられます。

この段階で認識すべき2つの失敗モードがあります。Bedrock、Vertex AI、またはFoundry経由で呼び出す際にモデルで404が発生する場合、通常、クラウドの再デプロイがまだあなたの地域に到達していないことを意味します。チケットを提出する前にネイティブAPIに対して確認してください。また、明らかに無害なプローブに対してrefusalという停止理由が表示される場合、スケールアップする前に、あなたのリクエストの形式を詳しく確認する価値があります。古いサービスを復元するのではなく、新しいサービスを構築する場合は、完全なセットアップガイドがClaude Fable 5 APIの使用方法にあります。

本番環境を再設定する前に回帰テストを構築する

これはチームがスキップしがちなステップであり、クリーンな火曜日の切り替えと金曜の夜のロールバックを分ける重要なステップです。あなたは6月中旬からOpus 4.8でトラフィックを処理してきました。この歴史的経緯はあなたに貴重なもの、つまり生きた、測定されたベースラインを与えました。これを活用してください。

目標は、あなたの実際のプロンプトをclaude-fable-5に対して実行し、その結果をOpus 4.8の数値と並べて比較できるようなスイートを構築することです。Apidogでのワークフローは以下の通りです。

1. 費用を稼ぎ出すプロンプトを収集します。合成テストではありません。APIテストコパイロットを実行している場合、OpenAPI仕様からテストケースを生成したり、失敗したアサーションを説明したり、エンドポイントのモックレスポンスをドラフトしたりするなど、上位50のプロダクションプロンプトを収集してください。ドキュメント要約エンドポイントを実行している場合、2段落のリリースノートからコンテキストウィンドウに負荷をかける400ページのPDFまで、様々なサイズの実際のドキュメントをサンプリングします。
2. それらをテストシナリオとして組み立てます。Apidogでは、各プロンプトがmodelをclaude-fable-5に設定したPOST /v1/messagesに対するリクエストステップとなります。環境変数がAPIキーとベースURLを保持するため、同じシナリオが編集なしでステージング環境と本番環境のクレデンシャルに対して実行されます。
3. 本番環境が依存する要素をアサートします。4つのアサーションがほとんどの障害モードをカバーします。
- ステータスが200であること。
- レイテンシーがSLOしきい値内であること。Fable 5は応答する前に推論するため、基準は6月以前の測定値から設定し、Opus 4.8のものではありません。
- レスポンスボディのmodelフィールドがclaude-fable-5と等しいこと。これはサイレントな再ルーティングを検出するアサーションです。コンテンツはパスするがOpus 4.8によって処理されたスイートは、あなたのプロンプトが新しい分類器をトリガーしていることを示します。
- stop_reasonがend_turnであること、およびあなたのパーサーが読み取るレスポンスフィールド（構造化出力からのJSON形状、コストパイプラインが取り込むusageブロック）が存在すること。
4. 実行と比較。claude-fable-5に対してスイートを実行し、そのレポートを同じスイートのOpus 4.8の実行結果（パス率、p95レイテンシー、拒否数、出力形式の失敗）と比較します。ここでの違いは安価に修正できますが、本番環境で発見された同じ違いは安価ではありません。
5. CI/CDで切り替えをゲートします。ApidogのCLIは、あなたのパイプラインで全く同じシナリオを実行するため、回帰テストがグリーンになったときにのみ、モデル文字列を切り替えるプルリクエストがマージされます。これにより、「問題ないと思う」がビルド成果物になります。

切り替え後もスイートの実行を継続してください。50個のプロンプトの実行では決して現れない分類器駆動の再ルーティングも、本番環境の量では発生する可能性があるため、段階的な展開を通じて毎日スケジュールしてください。移行のために構築したスイートは、それを監視するカナリアとしても機能します。

Opus 4.8への再ルーティングを監視する

オペレーターの視点から見たフォールバックは次のようになります。リクエストは成功し、完了は一貫しており、HTTPステータスは200です。しかし、response.modelはclaude-opus-4-8と表示され、応答にはリクエストが再ルーティングされた旨の通知が含まれます。エラーは発生していないため、エラーハンドリングは何も作動しません。適切なフィールドをログに記録していない限り、その1回の呼び出しでレイテンシープロファイル、トークンあたりのコスト、出力スタイルが静かに変化します。

呼び出しごとに2つのフィールドがあれば十分です。提供されたmodelとusageブロックです。これらを既存のオブザーバビリティスタックに出力し、再ルーティング率についてアラートを設定してください。95%以上のセッションでフォールバックが発生しないため、数パーセントを超える持続的な急増は、特定の意味を持ちます。つまり、製品内のプロンプトテンプレートが、再トレーニングされた分類器がターゲットとするパターンに似ているということです。これはインシデントではなくプロンプトエンジニアリングのチケットですが、それは顧客からのメールではなくダッシュボードでそれを捕捉した場合に限ります。

自動的に回復させたいリクエストの場合、fallbacksパラメーター（Claude APIおよびAWS上のClaude Platformでベータ版）は、コードからの2回目の往復なしに、同じ呼び出し内で拒否を再試行または再ルーティングします。これはリトライロジックの構造を変更するため、拒否周りの独自のリトライループを構築する前に、Fable 5 fallbacksパラメーター専用のガイドを読む価値があります。

コスト計算を再実行する

3週間にわたり、あなたの請求はOpus 4.8の料金で計算されていました。Fable 5はトークンあたり約2倍のコストがかかります。入力100万トークンあたり10ドル、出力100万トークンあたり50ドルで、当初の発表の料金から変更はありません。元に戻すことは意図的な支出増加であり、他の誰も気づかなくても財務部門は気づくでしょう。

切り替え前に、フォールバック期間のOpus 4.8の使用量を取得し、Fable 5の料金で前方に乗算してください。その後、キャッシュ割引を適用します。なぜなら、エージェントワークロードの場合、そこで計算が興味深いものになるからです。Fable 5のプロンプトキャッシュは90%の割引があり、キャッシュヒットの場合、100万トークンあたり1.00ドルになります。大規模で安定したシステムプロンプトとツール定義を各イテレーションで再送信するエージェントループは、入力トークンのほとんどをキャッシュから提供できます。リクエストごとに固有のドキュメントを持つドキュメント要約エンドポイントはそうはいきません。同じモデル、同じ料金カードでも、リクエストあたりの実効コストは異なります。

一部のチームはこの計算を終え、トラフィックの一部はOpus 4.8に残すべきだと結論付けるでしょう。これは失敗した移行ではなく、正当な結果です。その決定の能力面については、Fable 5 vs Opus 4.8で説明されています。簡単に言えば、長期的な推論にはプレミアムを支払うことになり、ルーチンな補完にはそれがほとんど必要ないということです。

切り替えチェックリスト

上から下まで実行してください。途中の手順を飛ばすと、金曜日のデプロイのような事態が発生します。

モデルIDを散らばった文字列リテラルではなく、設定ファイルでclaude-fable-5に固定する。
Bedrock、Vertex AI、またはFoundry経由でサービスを提供する場合、何かをスケジュールする前に、Fable 5があなたのプラットフォームと地域で稼働していることを確認する。
Apidogでの回帰テストスイートがグリーンであり、結果がOpus 4.8のベースライン実行と比較されていること。
段階的なロールアウトを実施する：トラフィックの5%、次に25%、次に100%とし、各ステップで少なくとも1営業日を設ける。
最初のカナリアリクエスト以降、すべての呼び出しでresponse.modelとusageをログに記録する。
切り替え前にロールバックトリガーを書面で定義する。例えば、再ルーティング率が5%を超える、p95レイテンシーがSLOを超える、またはパーサーのエラー率がベースラインを超える場合など。いずれか1つのトリガーでトラフィックスプリットを元に戻す。
HTTPエラーだけでなく、拒否率と再ルーティング率についてもアラートを設定する。ここでの失敗モードは200を返す。
Opus 4.8のパスをデプロイ可能な状態に保つ。6月に緊急で構築したものだが、今やそれがあなたのロールバック計画である。

よくある質問

再展開されたFable 5は、6月にオフラインになったモデルと同じですか？はい、同じモデルID、同じ仕様、同じ料金です。claude-fable-5、1Mコンテキスト、128K最大出力、100万トークンあたり$10/$50。違いは、その前段に再トレーニングされた安全分類器があることで、これがフラグが立てられたリクエストをOpus 4.8に再ルーティングします。これが、このガイドが単純な元に戻すのではなく、回帰テストを強く推奨する理由です。

私のリクエストのいずれかにフラグが立てられた場合、どうなりますか？失敗することはありません。リクエストは自動的にClaude Opus 4.8に再ルーティングされ、そこで完了し、応答には通知と、modelフィールドで提供されたモデルが含まれます。95%以上のセッションではこれが発生しません。もしあなたのワークロードで頻繁に発生する場合は、それをトリガーするプロンプトを確認し、制御された処理のためにベータ版のfallbacksパラメーターを検討してください。

停止中に書いたフェイルオーバーコードを削除すべきですか？いいえ。今回の停止は、単一モデルへの依存がいかに脆弱であるかを証明しました。そして、あなたが構築したルーティングレイヤーは、それ以外の点では悪い月だった中での永続的な勝利です。それをロールバックパスとして維持し、正式なものにしてください。AI APIのフェイルオーバー設計では、緊急パッチをアーキテクチャに変える方法について説明しています。

切り替えのまとめ

Fable 5への回帰は、モデルIDが変更されていなくても移行です。単一のリクエストでアクセスを検証し、再トレーニングされた安全レイヤーに対して実際のプロンプトを回帰スイートとして実行し、6月から蓄積してきたOpus 4.8のベースラインと比較し、ダッシュボードにresponse.modelを表示しながら段階的に展開するなど、移行として扱ってください。これを行うチームは、週末までにはFable 5に戻り、それが安全であったことを証明する数値を得るでしょう。回帰テストとCI/CDゲートを1つのツールで実現したい場合は、設定を変更する前にApidogをダウンロードしてシナリオを構築してください。

ボタン