Claude Sonnet 5は、Anthropicが2026年6月30日にリリースした最新のミドルティアモデルです。Anthropicはこれを「速度と知能の最高の組み合わせ」であり「これまでのSonnetモデルで最もエージェント的なモデル」と呼んでいます。簡単に言えば、エージェントやツール使用タスクにおいてOpus 4.8に肉薄しつつ、はるかに低コストで利用できます。このガイドでは、Sonnet 5とは何か、その全仕様、発表時のベンチマーク、価格設定、利用可能性、そしてどのようなユーザーに適しているかを説明します。HTTP経由でモデルを呼び出す予定がある場合、Apidogでそれらのリクエストを随時テストできます。
ここでの各セクションは詳細な解説ページにリンクしているため、このページを地図として、API、価格設定、またはOpus 4.8との比較の詳細が必要な場合はリンクをたどってください。
Claude Sonnet 5とは
Claude Sonnet 5 はClaude Sonnet 4.6の後継モデルです。そのAPIモデルIDは、日付サフィックスなしの正確な文字列claude-sonnet-5です。Anthropicがより小規模なHaikuモデルと、より大規模なOpusおよびFableモデルの間に位置づけるSonnet層に属しています。

最大の売りは「価値」です。モデルがツールを使用したり、ループ内で実行されたり、エージェントとして機能するタスクにおいて、Sonnet 5はOpus 4.8に数ポイント差で迫ります。頼るものが何もない純粋な推論においては、Opusが依然として優位に立っています。したがって、Sonnet 5は、Opusの価格を支払うことなく強力なエージェント性能を求める場合に選択すべきモデルです。
また、Sonnet 4.6からのドロップインアップグレードでもあります。モデルIDを変更し、3つの動作変更と1つのトークナイザー変更を確認するだけです。これらについては以下で、また専用のSonnet 5 vs Sonnet 4.6比較記事で詳しく説明します。
全仕様
claude-sonnet-5で得られるものは以下の通りです。
| 仕様 | 値 |
|---|---|
| コンテキストウィンドウ | 1,000,000トークン (1M) |
| 最大出力 | 128,000トークン (128K) |
| 適応的思考 | デフォルトでオン |
| 努力パラメータ | 低 / 中 / 高 / 最高 |
| ビジョン、プロンプトキャッシング、ツール利用、バッチ、構造化出力 | サポート |
| プライオリティティア | 利用不可 |
| ゼロデータ保持 (ZDR) | ZDR契約を結んでいる組織でサポート |
これらに関するいくつかの注意事項です。
- 1Mコンテキストウィンドウはデフォルトであり、最大値でもあります。より小さいコンテキストバリアントを選択することはできません。
- 適応的思考はデフォルトでオンになっています。これはSonnet 4.6からの変更点で、以前は
thinkingフィールドを送信しないと全く思考が行われませんでした。 - 努力パラメータは、モデルがどの程度思考し、リソースを費やすかを制御します。モデルにどれだけ努力させたいかに応じて、
low、medium、high、またはxhighに設定します。 - 機能セットはSonnet 4.6と一致しますが、1つ例外があります。Priority TierはSonnet 5では利用できません。
完全なリクエストとレスポンスの形式については、ステップバイステップのAPIガイドとAnthropicのモデル概要をご覧ください。
3つの動作変更と新しいトークナイザー
Sonnet 4.6から移行する場合、APIレベルで3つの変更点があります。これらを見落とすと、リクエストが400エラーを返したり、以前とは異なる動作をしたりする可能性があります。
- 適応的思考はデフォルトでオンになっています。
thinkingフィールドがないリクエストも、適応的思考で実行されるようになりました。これをオフにするには、thinking: {type: "disabled"}を送信します。max_tokensは合計出力(思考トークンと応答テキスト)を制限するため、以前思考なしで実行されていたワークロードではmax_tokensを見直してください。 - 手動での拡張思考は削除されました。
thinking: {type: "enabled", budget_tokens: N}を送信すると、400エラーが返されるようになりました。代わりに適応的思考と努力パラメータを使用してください。 - サンプリングパラメータは受け入れられません。
temperature、top_p、またはtop_kをデフォルト以外の値に設定すると400エラーが返されます。移行時にこれらを削除してください。代わりにシステムプロンプトの指示を通じて動作を制御してください。
アシスタントメッセージの事前入力は、Sonnet 4.6と同様に、依然としてサポートされておらず400エラーを返します。応答の形式を整えるには、構造化出力またはシステムプロンプトの指示を使用してください。
APIの形状に影響しないため見落としがちな変更点がもう一つあります。Sonnet 5は新しいトークナイザーを使用しています。同じ入力テキストでも、Sonnet 4.6と比較して約30%多くのトークン(約1.3倍)が生成されます。リクエスト、レスポンス、またはストリーミングのコードには何も変更ありません。しかし、トークンで測定したり予算を立てたりするものには変化があります。
- 同じテキストでも
usageフィールドとトークンカウントの結果が高くなります。Sonnet 4.6の数値を再利用せず、Sonnet 5に対して再カウントしてください。 - 各トークンがカバーするテキスト量が減少したため、1Mウィンドウは平均してより少ないテキストを保持します。
- 予想される出力に近い
max_tokensの予算設定では、切り捨てが発生する可能性があります。これらを見直してください。 - トークンあたりの価格が変動していなくても、同等のテキストのリクエストあたりのコストは上昇する可能性があります。
これらの変更点については「新機能ページ」に記載されており、トークンカウントのドキュメントにはその測定方法が示されています。
ベンチマーク概要
以下の数値は、発表時にAnthropicが報告したものです。これらは発表日のレポートで裏付けられているため、独立したテストの結果ではなく、報告された結果として扱ってください。
| ベンチマーク | Sonnet 5 | Opus 4.8 | Sonnet 4.6 |
|---|---|---|---|
| SWE-bench Pro (エージェント的コーディング) | 63.2% | 69.2% | 58.1% |
| Terminal-Bench 2.1 | 80.4% | 82.7% | 未報告 |
| OSWorld-Verified (コンピュータ使用) | 81.2% | 83.4% | 78.5% |
パターンは一貫しています。ツールを組み込んだ場合、Sonnet 5はOpus 4.8に約1〜3ポイント差で迫ります。頼るものが何もない純粋な推論においては、Opusが約6ポイントリードしています。Sonnet 5は純粋な推論よりも、エージェント的タスクやツールタスクにおいて強力です。

前身モデルと比較して、Sonnet 5は明らかに改善されています。SWE-bench Proは58.1%から63.2%に、OSWorld-Verifiedは78.5%から81.2%に上昇しています。
これらのベンチマークが何を網羅していないかを含め、詳細な内訳はSonnet 5ベンチマークの詳細解説にあります。Anthropicの透明性ハブで基礎となる数値を確認することもできます。
価格設定
Sonnet 5はSonnet 4.6と同じトークンあたりの料金を維持しており、導入割引付きでリリースされました。
| 価格設定 | 入力 (100万トークンあたり) | 出力 (100万トークンあたり) |
|---|---|---|
| 導入期間 (2026年8月31日まで) | $2 | $10 |
| 標準 (2026年9月1日から) | $3 | $15 |
100万入力トークンあたり$2、100万出力トークンあたり$10の導入料金は、2026年8月31日まで適用されます。その後、Sonnet 4.6と同じ標準料金である100万入力トークンあたり$3、100万出力トークンあたり$15に移行します。
計画を立てる上で注意すべき点が1つあります。新しいトークナイザーは同じテキストに対して約30%多くのトークンを生成するため、トークンあたりの料金が同じであっても、同等のリクエストのコストはSonnet 4.6よりも高くなる可能性があります。一律の同等性を仮定しないでください。予算を決定する前に、実際のワークロードをトークンカウントでモデル化してください。
参考までに、Opus 4.8は100万入力トークンあたり$5、100万出力トークンあたり$25、Fable 5は100万入力トークンあたり$10、100万出力トークンあたり$50です。Sonnet 5はどちらのモデルよりもはるかに低価格です。バッチおよびプロンプトキャッシングの料金については、二次情報ではなくAnthropicの料金ページをご確認ください。完全な料金内訳では、具体例を挙げて説明しています。
利用可能性
Sonnet 5は、Anthropic自身の製品および主要なクラウドプラットフォームで利用可能です。
- Claude API: すべての顧客が利用可能。
- Claudeアプリ: FreeおよびProのデフォルトモデルであり、Max、Team、Enterpriseでも利用可能。
- Claude Code: 利用可能。
- AWS: Amazon BedrockのClaudeおよびAWS上のClaude Platformを通じて。従来のBedrock InvokeModelまたはConverseパスでは利用不可。
- Google Cloud: Vertex AIで利用可能。
- Microsoft Foundry: プレビュー版。
Sonnet 5は無料のClaudeプランでデフォルトになっているため、ほとんどの人は費用を支払うことなく試すことができます。無料アクセスガイドでは、公正な無料利用方法とその制限について説明しています。
安全性概要
Anthropicのシステムカードによると、Sonnet 4.6よりも望ましくない行動の全体的な発生率が低く、エージェント的なコンテキストにおいてモデルはより安全です。Sonnet 4.6よりも低い幻覚と追従性を示し、悪意のあるリクエストを拒否し、プロンプトインジェクションに耐える能力が向上しています。

Sonnet 5は、リアルタイムのサイバーセキュリティ保護機能を備えた初のSonnetティアモデルでもあります。禁止されている、または高リスクなサイバー関連のトピックに触れるリクエストは拒否される場合があります。拒否された場合、エラーではなくstop_reason: "refusal"を持つHTTP 200成功として返されるため、コードでこの停止理由を処理してください。
トレードオフについて公平に言えば、Anthropicの自動行動監査では、Sonnet 5はOpus 4.8およびMythos Previewよりも高いミスアラインメント行動率を示し、Opusモデルよりもサイバー機能が低いです。どちらのSonnetモデルも動作するエクスプロイトを開発できず、その測定では0.0%でした。
ApidogでSonnet 5 APIをテストする
Sonnet 5を呼び出す際、認証ヘッダー、JSONリクエストおよびレスポンスボディ、レート制限、エラーを含むHTTP APIを呼び出しています。それはまさにApidogが対応するために作られた種類のものです。ApidogはオールインワンのAPI開発・テストプラットフォームなので、Sonnet 5リクエストを送信し、再利用可能なコレクションとして保存し、環境ごとにキーを管理することができます。

実際のセットアップは次のようになります。
- Anthropic Messagesエンドポイントへのリクエストを作成し、APIキーをリクエストボディではなく環境変数として保存します。
- リクエストをコレクションに保存し、チームが再利用できるようにします。
- レスポンスの形状を確認するアサーションを追加します。例えば、
stop_reasonが存在することを確認し、refusalの結果が見過ごされないようにします。 - トークンを消費せずに安定したレスポンスに対して構築したい場合は、エンドポイントをモックします。
送信するMessages APIの形式は次のとおりです。
curl https://api.anthropic.com/v1/messages \
--header "x-api-key: $ANTHROPIC_API_KEY" \
--header "anthropic-version: 2023-06-01" \
--header "content-type: application/json" \
--data '{
"model": "claude-sonnet-5",
"max_tokens": 1024,
"messages": [
{"role": "user", "content": "この変更ログのエントリを1文で要約してください。"}
]
}'
適応的思考はデフォルトでオンになっているため、thinking: {type: "disabled"}を追加しない限り、そのリクエストは思考を伴って実行されます。max_tokensは思考と応答テキストを合わせて制限することを忘れないでください。したがって、十分な余裕を与えてください。リクエストが機能したら、保存してテストを追加し、後でモデルを交換したときにリグレッションを検出できるようにします。追従したい場合は、Apidogをダウンロードしてリクエストをインポートしてください。完全なAPIウォークスルーには、Python SDKバージョンを含む完全なフローが記載されています。
Sonnet 5は誰のためのものか
Sonnet 5は多くの状況で良いデフォルトとなりえます。
- エージェントやツールを多用するワークフローを構築する場合。 Sonnet 5が本領を発揮し、Opus 4.8に肉薄するのはここです。
- 大量の処理を実行し、コストを重視する場合。 Opusとの価格差は大きく、導入料金により8月まではさらにその差が広がります。
- Sonnet 4.6からのドロップインアップグレードを望む場合。 モデルIDを交換し、3つの動作変更を確認し、トークンを再測定してください。
- Claude Codeまたはエディタでコーディングする場合。 Sonnet 5は強力なエージェント的コーディングのデフォルトです。Claude Codeでの使用方法をご覧ください。
最も困難な純粋な推論、長期間にわたる自律性、または絶対的な最高品質が必要で、追加コストを支払う価値がある場合は、代わりにOpus 4.8を選択してください。Sonnet 5 vs Opus 4.8の比較では、その決定について詳細に説明しています。Opusティア自体に関する背景情報については、「Claude Opus 4.8とは」をご覧ください。
よくある質問
Claude Sonnet 5はOpus 4.8よりも優れていますか? タスクによります。エージェントおよびツール使用のベンチマークでは、Sonnet 5ははるかに低価格でOpus 4.8に約1〜3ポイント差で迫ります。純粋な推論においては、Opus 4.8が約6ポイントリードしています。エージェントや大量処理にはSonnet 5を、最も困難な推論にはOpus 4.8を選択してください。詳細な比較でこれを解説しています。
Claude Sonnet 5のモデルIDは何ですか? APIモデルIDはclaude-sonnet-5で、日付サフィックスはありません。リクエストでその文字列をmodel値として設定してください。
Claude Sonnet 5の費用はいくらですか? 導入料金は2026年8月31日まで、100万入力トークンあたり$2、100万出力トークンあたり$10です。その後、標準料金である100万入力トークンあたり$3、100万出力トークンあたり$15に移行します。新しいトークナイザーは同じテキストに対して約30%多くのトークンを生成するため、トークンあたりの料金が同じであっても、同等のリクエストのコストは高くなる可能性があることに注意してください。
Claude Sonnet 5を無料で利用できますか? はい。Sonnet 5はclaude.aiの無料ClaudeプランおよびClaude Codeの無料ティアでデフォルトモデルとして利用可能ですが、使用制限があります。無料アクセスガイドでは、公正な無料利用方法とその上限について説明しています。
Sonnet 4.6からアップグレードするためにコードを変更する必要がありますか? 主にモデルIDを変更します。その後、3つの点を確認してください。適応的思考がデフォルトでオンになったためmax_tokensを見直すこと、拡張思考フィールドのbudget_tokensが400エラーを返すようになったこと、およびデフォルト以外のサンプリングパラメータが400エラーを返すようになったことです。新しいトークナイザーのため、トークン数を再測定してください。
