สรุปโดยย่อ
Claude Sonnet 4.6 มีค่าใช้จ่าย **$3 ต่อโทเค็นอินพุตหนึ่งล้านโทเค็น และ $15 ต่อโทเค็นเอาต์พุตหนึ่งล้านโทเค็น**—ราคาเท่ากับ Sonnet 4.5 แต่ให้ประสิทธิภาพใกล้เคียงกับ Opus ด้วยการแคชข้อความแจ้ง (prompt caching) การอ่านจากแคชจะลดลงเหลือ **$0.30/MTok** (ประหยัด 90%) Batch API ลดค่าใช้จ่ายลงครึ่งหนึ่งเหลือ **$1.50/$7.50 ต่อ MTok** หน้าต่างบริบท 1 ล้านโทเค็น (รุ่นเบต้า) จะคิดราคาบริบทแบบยาวที่ **$6/$22.50 ต่อ MTok** สำหรับคำขอที่เกิน 200K โทเค็น
ราคาพื้นฐานของ Claude Sonnet 4.6
Claude Sonnet 4.6 ยังคงมี ราคาเท่าเดิม กับรุ่นก่อนหน้า ในขณะที่ให้ผลลัพธ์ที่ดีขึ้นอย่างเห็นได้ชัด นี่คือราคาหลักโดยย่อ:
| ส่วนราคา | โทเค็นอินพุต | โทเค็นเอาต์พุต |
|---|---|---|
| มาตรฐาน | $3.00 / MTok | $15.00 / MTok |
| Batch API | $1.50 / MTok | $7.50 / MTok |
| การเขียนแคช (5 นาที) | $3.75 / MTok | — |
| การเขียนแคช (1 ชั่วโมง) | $6.00 / MTok | — |
| การอ่านจากแคช | $0.30 / MTok | — |
| บริบทแบบยาว >200K (มาตรฐาน) | $6.00 / MTok | $22.50 / MTok |
| บริบทแบบยาว >200K (Batch) | $3.00 / MTok | $11.25 / MTok |
MTok = ล้านโทเค็น ราคาทั้งหมดเป็นสกุลเงินดอลลาร์สหรัฐ
เรื่องราวความคุ้มค่านี้ยากที่จะมองข้าม ผู้ทดสอบในช่วงแรกชื่นชอบ Sonnet 4.6 มากกว่ารุ่นพรีเมียมก่อนหน้าอย่าง Opus 4.5 ในการเปรียบเทียบแบบตัวต่อตัวถึง 59%—ด้วยต้นทุนเพียง 60%

สำหรับงานส่วนใหญ่ที่เกี่ยวข้องกับการเขียนโค้ด การวิเคราะห์ และงานที่ใช้เอเจนต์ คุณไม่จำเป็นต้องจ่ายราคา Opus เพื่อให้ได้ผลลัพธ์ระดับ Opus อีกต่อไป
รายละเอียดราคาตามคุณสมบัติ
ราคา API มาตรฐาน
อัตรามาตรฐานใช้กับการเรียกใช้ API แบบซิงโครนัสทั้งหมดที่ทำผ่าน Anthropic API:
import anthropic
client = anthropic.Anthropic()
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
messages=[{"role": "user", "content": "Summarize this document."}]
)
# ตรวจสอบการใช้งานโทเค็นที่ถูกต้อง
print(f"Input tokens: {response.usage.input_tokens}")
print(f"Output tokens: {response.usage.output_tokens}")
# คำนวณค่าใช้จ่าย
input_cost = response.usage.input_tokens / 1_000_000 * 3.00
output_cost = response.usage.output_tokens / 1_000_000 * 15.00
print(f"Request cost: ${input_cost + output_cost:.6f}")
สำหรับการเรียกใช้ API ทั่วไปที่มีอินพุต 500 โทเค็นและเอาต์พุต 300 โทเค็น ค่าใช้จ่ายจะอยู่ที่ประมาณ $0.0060 ซึ่งน้อยกว่าหนึ่งเซ็นต์ต่อคำขอในอัตรามาตรฐาน
ราคาการแคชข้อความแจ้ง
การแคชข้อความแจ้งเป็นปัจจัยสำคัญที่สุดในการลดต้นทุนของ Sonnet 4.6 โดยจะจัดเก็บส่วนหนึ่งของข้อความแจ้งของคุณไว้ที่ฝั่งเซิร์ฟเวอร์ และคิดค่าใช้จ่ายน้อยลงอย่างมากเมื่อมีการเรียกใช้จากแคช
อัตราการเขียนแคช:- **แคช 5 นาที**: $3.75/MTok (1.25 เท่าของราคาอินพุตพื้นฐาน) - **แคช 1 ชั่วโมง**: $6.00/MTok (2 เท่าของราคาอินพุตพื้นฐาน)
อัตราการอ่านจากแคช:- **$0.30/MTok** — หนึ่งในสิบของราคาอินพุตมาตรฐาน
หากข้อความแจ้งของระบบของคุณมี 10,000 โทเค็น และคุณประมวลผล 1,000 คำขอต่อวัน: - ไม่มีแคช: 10,000 × 1,000 × $3/MTok = **$30/วัน**- มีแคช (เขียนครั้งเดียว อ่าน 999 ครั้ง): $3.75 + (999 × 0.30) × 10,000/MTok ≈ **$3.04/วัน**
นั่นคือการ**ลดลง 90%** สำหรับข้อความแจ้งของระบบแบบคงที่เพียงอย่างเดียว
import anthropic
client = anthropic.Anthropic()
# ทำเครื่องหมายเนื้อหาสถิตที่มีค่าใช้จ่ายสูงเพื่อแคช
response = client.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
system=[
{
"type": "text",
"text": "You are a senior code reviewer specializing in Python, FastAPI, and distributed systems. Here are our coding standards and review guidelines: [large block of standards text]...",
"cache_control": {"type": "ephemeral"} # แคชบล็อกนี้
}
],
messages=[{"role": "user", "content": "Review this pull request: [PR content]"}]
)
# ตรวจสอบว่าสิ่งใดมาจากแคชเทียบกับโทเค็นใหม่
usage = response.usage
print(f"Cache write tokens: {usage.cache_creation_input_tokens}")
print(f"Cache read tokens: {usage.cache_read_input_tokens}")
print(f"Uncached tokens: {usage.input_tokens}")
เวลาที่ควรใช้ระยะเวลาแคชใด:- **แคช 5 นาที**: สำหรับการเรียกใช้บ่อยครั้ง, ทราฟฟิกแบบพุ่งสูง, ช่วงการสนทนาสั้นๆ - **แคช 1 ชั่วโมง**: สำหรับไปป์ไลน์ประมวลผลเบื้องหลัง, งาน Batch ที่มีช่วงห่างนานขึ้น, การวนลูปของเอเจนต์
ราคา Batch API
Batch API เสนอส่วนลดคงที่ 50% สำหรับทั้งโทเค็นอินพุตและเอาต์พุต แลกกับการประมวลผลแบบอะซิงโครนัส (ผลลัพธ์จะพร้อมใช้งานภายใน 24 ชั่วโมง โดยปกติแล้วจะเร็วกว่านั้นมาก)
| มาตรฐาน | Batch API | |
|---|---|---|
| อินพุต | $3.00/MTok | $1.50/MTok |
| เอาต์พุต | $15.00/MTok | $7.50/MTok |
กรณีการใช้งานที่ดีที่สุดสำหรับ Batch API:- ไปป์ไลน์การจัดการเนื้อหา - การจัดประเภทเอกสารขนาดใหญ่ - การเพิ่มพูนข้อมูลในตอนกลางคืน - การสร้าง Embeddings หรือสรุปสำหรับชุดข้อมูลขนาดใหญ่ - การประมวลผลที่ไม่ใช่แบบโต้ตอบที่ความหน่วงไม่สำคัญ
ที่ราคา $1.50/$7.50/MTok การประมวลผลเอกสารหนึ่งล้านฉบับ โดยแต่ละฉบับมีอินพุต 500 โทเค็นและเอาต์พุต 100 โทเค็น จะมีค่าใช้จ่ายดังนี้: - อินพุต: 500M โทเค็น × $1.50/MTok = **$750**- เอาต์พุต: 100M โทเค็น × $7.50/MTok = **$750**- **รวม: $1,500 สำหรับเอกสาร 1 ล้านฉบับ** (ประมาณ $0.0015 ต่อเอกสาร)
Batch API: ส่วนลด 50% สำหรับงานที่ไม่ต้องการประมวลผลแบบเรียลไทม์
การประมวลผลแบบ Batch ทำได้ง่ายๆ: ส่งคำขอ รับผลลัพธ์แบบอะซิงโครนัสในราคาครึ่งหนึ่ง ข้อแลกเปลี่ยนคือความหน่วง (latency)—ผลลัพธ์จะมาถึงภายใน 24 ชั่วโมง แม้ว่าโดยปกติจะเร็วกว่านั้นมาก
import anthropic, time
client = anthropic.Anthropic()
def batch_classify(texts: list[str]) -> list[str]:
"""จัดประเภทรายการข้อความในอัตรา Batch API"""
# ส่ง Batch
requests = [
{
"custom_id": f"item-{i}",
"params": {
"model": "claude-sonnet-4-6",
"max_tokens": 20,
"messages": [{
"role": "user",
"content": f"Classify as POSITIVE, NEGATIVE, or NEUTRAL. Reply with one word only.\n\n{text}"
}]
}
}
for i, text in enumerate(texts)
]
batch = client.messages.batches.create(requests=requests)
# ตรวจสอบจนกว่าจะเสร็จสมบูรณ์
while True:
status = client.messages.batches.retrieve(batch.id)
if status.processing_status == "ended":
break
time.sleep(60)
# รวบรวมผลลัพธ์ตามลำดับ
results = {}
for result in client.messages.batches.results(batch.id):
if result.result.type == "succeeded":
results[result.custom_id] = result.result.message.content[0].text.strip()
return [results.get(f"item-{i}", "ERROR") for i in range(len(texts))]
ราคาบริบทแบบยาว (1 ล้านโทเค็น)
เมื่อคุณเปิดใช้งานหน้าต่างบริบท 1 ล้านโทเค็นผ่านเฮดเดอร์เบต้า `context-1m-2025-08-07` คำขอที่เกิน 200K โทเค็นอินพุตจะถูกคิดค่าบริการในอัตราที่สูงขึ้น
ตารางอัตราบริบทแบบยาว
| โทเค็นอินพุต | ราคาอินพุต | ราคาเอาต์พุต |
|---|---|---|
| ≤ 200K | $3.00/MTok | $15.00/MTok |
| > 200K | $6.00/MTok | $22.50/MTok |
เกณฑ์ 200K ขึ้นอยู่กับ**โทเค็นอินพุตรวม** ซึ่งประกอบด้วย: - `input_tokens` (อินพุตมาตรฐาน) - `cache_creation_input_tokens` (หากใช้การแคชข้อความแจ้ง) - `cache_read_input_tokens` (หากใช้การแคชข้อความแจ้ง)
หากยอดรวมเกิน 200K **โทเค็นทั้งหมดในคำขอนั้น** จะถูกคิดค่าบริการในอัตราที่สูงขึ้น
บริบทแบบยาว + Batch API
ส่วนลด 50% ของ Batch API **รวมกับราคาบริบทแบบยาว**:
| สถานการณ์ | อัตราอินพุต | อัตราเอาต์พุต |
|---|---|---|
| มาตรฐาน | $3.00/MTok | $15.00/MTok |
| บริบทแบบยาว (>200K) | $6.00/MTok | $22.50/MTok |
| Batch API | $1.50/MTok | $7.50/MTok |
| บริบทแบบยาว + Batch | $3.00/MTok | $11.25/MTok |
การประมวลผลเอกสารขนาดใหญ่จำนวนมากผ่าน Batch API ช่วยให้ต้นทุนบริบทแบบยาวสามารถจัดการได้
ราคาเครื่องมือและคุณสมบัติ
เครื่องมือบางอย่างมีค่าใช้จ่ายแยกต่างหากนอกเหนือจากค่าโทเค็น
เครื่องมือค้นหาเว็บ
$10.00 ต่อการค้นหา 1,000 ครั้ง
+ ค่าใช้จ่ายโทเค็นมาตรฐานสำหรับเนื้อหาที่สร้างจากการค้นหา
การเรียกใช้การค้นหาเว็บแต่ละครั้งนับเป็นการใช้งานหนึ่งครั้ง โดยไม่คำนึงถึงจำนวนผลลัพธ์ที่ได้รับ จะไม่มีการคิดค่าใช้จ่ายหากการค้นหาเกิดข้อผิดพลาด
import anthropic
client = anthropic.Anthropic()
response = client.beta.messages.create(
model="claude-sonnet-4-6",
max_tokens=1024,
betas=["code-execution-web-tools-2026-02-09"],
tools=[{"type": "web_search_20260209", "name": "web_search"}],
messages=[{"role": "user", "content": "What's the latest LLM benchmark news from this week?"}]
)
usage = response.usage
search_count = getattr(usage, 'server_tool_use', {})
print(f"Web searches used: {search_count.get('web_search_requests', 0)}")
# แต่ละการค้นหา: $0.01
เครื่องมือรันโค้ด
**ฟรีเมื่อรวมกับเครื่องมือค้นหาเว็บหรือดึงข้อมูลเว็บ** (โดยใช้เครื่องมือเวอร์ชัน `web_search_20260209` หรือ `web_fetch_20260209`)
เมื่อใช้แบบเดี่ยว: - **ฟรี 1,550 ชั่วโมง** ต่อองค์กรต่อเดือน - **$0.05 ต่อชั่วโมงต่อคอนเทนเนอร์** นอกเหนือจากระดับฟรี - หน่วยเรียกเก็บเงินขั้นต่ำ: 5 นาที
สำหรับงานพัฒนาและทดสอบส่วนใหญ่ ระดับฟรีก็เพียงพอแล้ว
เครื่องมือดึงข้อมูลเว็บ
**ไม่มีค่าใช้จ่ายเพิ่มเติม** คุณจ่ายเฉพาะค่าโทเค็นมาตรฐานสำหรับเนื้อหาที่เข้าสู่การสนทนาเท่านั้น
| เครื่องมือ | ค่าใช้จ่ายเพิ่มเติม | หมายเหตุ |
|---|---|---|
| การค้นหาเว็บ | $10/1K การค้นหา | ค่าธรรมเนียมต่อการค้นหา |
| การดึงข้อมูลเว็บ | ฟรี | เฉพาะค่าโทเค็น |
| การรันโค้ด (พร้อมเครื่องมือเว็บ) | ฟรี | รวมมาด้วย |
| การรันโค้ด (แบบเดี่ยว) | $0.05/ชม. หลังจากฟรี 1,550 ชม./เดือน | ต่อคอนเทนเนอร์ |
| โอเวอร์เฮดการใช้งานคอมพิวเตอร์ | ~735 โทเค็นอินพุตเพิ่มเติม | ต่อการกำหนดเครื่องมือ |
| โอเวอร์เฮดตัวแก้ไขข้อความ | ~700 โทเค็นอินพุตเพิ่มเติม | ต่อการกำหนดเครื่องมือ |
โอเวอร์เฮดการใช้งานคอมพิวเตอร์
การใช้งานคอมพิวเตอร์เพิ่มโอเวอร์เฮดโทเค็นคงที่: - **การเพิ่มข้อความแจ้งของระบบ**: 466–499 โทเค็น - **โทเค็นการกำหนดเครื่องมือ**: 735 โทเค็นต่อเครื่องมือ (สำหรับรุ่น Claude 4.x)
สำหรับเซสชันการใช้งานคอมพิวเตอร์ที่มี 100 รอบที่ 200 โทเค็น/รอบ พร้อมด้วยภาพหน้าจอ: - โอเวอร์เฮดเครื่องมือ: 735 โทเค็น × $3/MTok = $0.0022 (เล็กน้อยมาก) - โทเค็นภาพหน้าจอขึ้นอยู่กับความละเอียด; วางแผนไว้ที่ประมาณ 2,000–5,000 โทเค็นต่อภาพหน้าจอ
Claude Sonnet 4.6 เทียบกับทุกโมเดล: การเปรียบเทียบฉบับเต็ม
ราคาโมเดลปัจจุบัน
| โมเดล | อินพุต | เอาต์พุต | การอ่านจากแคช | Batch อินพุต | Batch เอาต์พุต |
|---|---|---|---|---|---|
| Claude Sonnet 4.6 | $3.00 | $15.00 | $0.30 | $1.50 | $7.50 |
| Claude Haiku 4.5 | $1.00 | $5.00 | $0.10 | $0.50 | $2.50 |
| Claude Opus 4.6 | $5.00 | $25.00 | $0.50 | $2.50 | $12.50 |
| Claude Opus 4.5 | $5.00 | $25.00 | $0.50 | $2.50 | $12.50 |
| Claude Opus 4.1 | $15.00 | $75.00 | $1.50 | $7.50 | $37.50 |
ราคาทั้งหมดเป็นดอลลาร์สหรัฐต่อหนึ่งล้านโทเค็น
Sonnet 4.6 เทียบกับ Opus 4.6: คำถามด้านความคุ้มค่า
| Claude Sonnet 4.6 | Claude Opus 4.6 | |
|---|---|---|
| ราคาอินพุต | $3/MTok | $5/MTok |
| ราคาเอาต์พุต | $15/MTok | $25/MTok |
| ต้นทุนสัมพัทธ์ | 1× | 1.67× |
| SWE-bench Verified | 79.6% | ~80.8% |
| OSWorld (การใช้งานคอมพิวเตอร์) | 72.5% | 72.7% |
| ความพึงพอใจของผู้ใช้เทียบกับ Sonnet 4.5 | 70% | ไม่มีข้อมูล |
| ความพึงพอใจของผู้ใช้เทียบกับ Opus 4.5 | 59% | ไม่มีข้อมูล |
| หน้าต่างบริบท 1M | มี (เบต้า) | มี (เบต้า) |
| การคิดแบบปรับตัวได้ | มี | มี |
| เอาต์พุตสูงสุด | 64K โทเค็น | 128K โทเค็น |
สำหรับงานส่วนใหญ่ ไม่ว่าจะเป็นการเขียนโค้ด การวิเคราะห์ การประมวลผลเอกสาร หรือเวิร์กโฟลว์แบบเอเจนต์ Sonnet 4.6 ให้ประสิทธิภาพเทียบเท่า Opus ในราคาเพียง 60% Opus 4.6 คุ้มค่ากับราคาที่สูงกว่าเมื่อคุณต้องการเอาต์พุต 128K โทเค็น หรือประสิทธิภาพสูงสุดในการทำงานที่ต้องใช้การให้เหตุผลแบบใหม่
Sonnet 4.6 เทียบกับ Haiku 4.5: ควรใช้เมื่อใด
| กรณีการใช้งาน | Sonnet 4.6 | Haiku 4.5 |
|---|---|---|
| การสร้างโค้ดที่ซับซ้อน | ✅ | ⚠️ |
| การจัดประเภทแบบง่าย | ⚠️ เกินความจำเป็น | ✅ |
| การสรุปเอกสาร | ✅ | ✅ |
| งานเอเจนต์แบบหลายขั้นตอน | ✅ | ❌ |
| ปริมาณมากความซับซ้อนต่ำ | ❌ แพง | ✅ |
| การเรียกใช้เครื่องมือ / ฟังก์ชัน | ✅ | ✅ |
| การให้เหตุผลแบบยาว | ✅ | ❌ |
| แอปที่ไวต่อความหน่วง | ✅ เร็ว | ✅ เร็วที่สุด |
รูปแบบที่ชาญฉลาด: ใช้ Haiku 4.5 สำหรับการกำหนดเส้นทาง การจัดประเภท และการดึงข้อมูลแบบง่าย; ส่งต่องานที่ซับซ้อนไปยัง Sonnet 4.6 วิธีการแบบไฮบริดนี้มักจะมีค่าใช้จ่ายน้อยกว่า Sonnet 4.6 ถึง 60–80% สำหรับทุกอย่าง
การทดสอบต้นทุนด้วย Apidog ก่อนนำไปใช้งานจริง
ก่อนนำไปใช้งานจริง คุณต้องการทราบว่าแต่ละคำขอมีค่าใช้จ่ายเท่าไร ไคลเอนต์ API แบบภาพของ Apidog ช่วยให้คุณทดสอบการเรียกใช้ Claude Sonnet 4.6 ตรวจสอบการตอบกลับทั้งหมดรวมถึงออบเจกต์ `usage` และติดตามจำนวนโทเค็นต่อคำขอได้

การตั้งค่าการมองเห็นต้นทุนใน Apidog
- สร้างคำขอ POST ใหม่ไปยัง `https://api.anthropic.com/v1/messages`
- เพิ่มเฮดเดอร์: `x-api-key`, `anthropic-version: 2023-06-01`, `Content-Type: application/json`
- กำหนดเนื้อหา (body) ด้วยโมเดลและข้อความของคุณ
- เรียกใช้คำขอ — ออบเจกต์ `usage` ในการตอบกลับจะแสดงจำนวนโทเค็นที่ถูกต้อง
{
"usage": {
"input_tokens": 523,
"cache_creation_input_tokens": 5000,
"cache_read_input_tokens": 0,
"output_tokens": 312
}
}
จากตัวเลขเหล่านี้ คำนวณค่าใช้จ่ายจริง: - อินพุต: 523 โทเค็น × $3/MTok = $0.00157 - การเขียนแคช: 5,000 โทเค็น × $3.75/MTok = $0.01875 - เอาต์พุต: 312 โทเค็น × $15/MTok = $0.00468 - **การเรียกใช้ครั้งแรกทั้งหมด: $0.025** (การเรียกใช้ครั้งถัดไปที่มีแคชฮิต: ประมาณ $0.006)
คุณสามารถบันทึกคำขอเหล่านี้เป็นคอลเลกชันใน Apidog แบ่งปันกับทีมของคุณ และเรียกใช้การประมาณการต้นทุนสำหรับรูปแบบข้อความแจ้งต่างๆ ก่อนที่จะสรุปการออกแบบสำหรับงานจริง
พร้อมที่จะเริ่มสร้างแล้วหรือยัง? ดาวน์โหลด Apidog ฟรี เพื่อทดสอบการเรียกใช้ Claude Sonnet 4.6 API ด้วยภาพ ตรวจสอบการใช้งานโทเค็นต่อคำขอ และประเมินต้นทุนของคุณอย่างแม่นยำก่อนนำไปใช้งาน
