Giá Claude Sonnet 5: Toàn bộ chi phí chi tiết (2026)

Claude Sonnet 5 ra mắt vào ngày 30 tháng 6 năm 2026, với mức giá là điểm nhấn chính. Bạn sẽ nhận được hiệu suất gần với Opus 4.8 trong các tác vụ đại lý và sử dụng công cụ với chi phí chỉ bằng một phần nhỏ. Hướng dẫn này cung cấp cho bạn các con số chính xác: mức giá ưu đãi, mức giá tiêu chuẩn, ngày chúng chuyển đổi, và một chi tiết về bộ mã hóa sẽ âm thầm thay đổi hóa đơn thực tế của bạn. Bạn cũng sẽ thấy Sonnet 5 so với Opus 4.8 và Fable 5 như thế nào để bạn có thể chọn mô hình phù hợp dựa trên chi phí, không chỉ dựa trên khả năng. Khi bạn bắt đầu gọi API, Apidog là nơi bạn gửi các yêu cầu đó, lưu chúng và theo dõi chính xác những gì bạn đang chi trả.

Tải ứng dụng

Đây là những gì bạn nhận được: mức giá mỗi token, ví dụ chi phí thực tế, bảng so sánh từng mô hình, và danh sách kiểm tra ngắn gọn để ước tính và giám sát chi tiêu trước khi bạn bất ngờ.

Tổng quan về giá Claude Sonnet 5

Sonnet 5 sử dụng mức giá mỗi token giống như phiên bản tiền nhiệm, Sonnet 4.6. Giá niêm yết không thay đổi. Điều thay đổi là mức giảm giá giới thiệu áp dụng trong hai tháng đầu.

Mức giá	Đầu vào (mỗi 1 triệu token)	Đầu ra (mỗi 1 triệu token)	Có hiệu lực
Giới thiệu	$2	$10	Đến hết ngày 31 tháng 8 năm 2026
Tiêu chuẩn	$3	$15	Từ ngày 1 tháng 9 năm 2026

ID mô hình là claude-sonnet-5 không có hậu tố ngày. Chuỗi ký tự duy nhất đó là những gì bạn gửi trong yêu cầu API và nó sẽ được tính phí theo các mức giá này.

Hai điều đáng lưu ý ngay bây giờ:

Mức giá giới thiệu (đầu vào 2 đô la / đầu ra 10 đô la) có hiệu lực đến hết ngày 31 tháng 8 năm 2026. Sau đó, nó sẽ chuyển sang mức tiêu chuẩn 3 đô la / 15 đô la.
Mức giá tiêu chuẩn giống hệt Sonnet 4.6. Nếu bạn đã sử dụng Sonnet 4.6, giá mỗi token của bạn sẽ không tăng khi bạn chuyển đổi.

Điểm cuối cùng nghe có vẻ là một thắng lợi rõ ràng. Phần lớn là như vậy. Nhưng có một chi tiết về bộ mã hóa làm thay đổi cách tính toán và rất dễ bỏ qua.

Lỗi về bộ mã hóa: cùng mức giá, nhiều token hơn

Sonnet 5 được trang bị bộ mã hóa mới. Cùng một văn bản đầu vào sẽ tạo ra nhiều hơn khoảng 30% token so với trên Sonnet 4.6, tức là khoảng 1.3 lần. Đây không phải là thay đổi API. Cấu trúc yêu cầu, phản hồi và luồng dữ liệu là giống hệt nhau, và bạn không cần viết thêm mã mới. Nhưng bất kỳ thứ gì bạn đo lường hoặc tính toán theo token đều sẽ thay đổi.

Bởi vì bạn trả tiền cho mỗi token, nhiều token hơn cho cùng một văn bản có nghĩa là chi phí cao hơn cho một yêu cầu tương đương, ngay cả khi mức giá mỗi token không thay đổi.

Đây là một ví dụ minh họa. Giả sử một lời nhắc có 10.000 token trên Sonnet 4.6.

Trên Sonnet 4.6 với 3 đô la mỗi triệu đầu vào: 10.000 token có giá khoảng 0.030 đô la.
Trên Sonnet 5, cùng một văn bản tương đương khoảng 13.000 token. Với mức giá giới thiệu 2 đô la mỗi triệu đầu vào: khoảng 0.026 đô la.
Trên Sonnet 5 với mức giá tiêu chuẩn 3 đô la mỗi triệu đầu vào (sau ngày 31 tháng 8): khoảng 0.039 đô la.

Vì vậy, trong thời gian ưu đãi, mức giảm giá gần như bù đắp cho số token bổ sung, và bạn có thể trả mức phí tương đương hoặc thấp hơn một chút. Khi mức giá tiêu chuẩn bắt đầu có hiệu lực, cùng một văn bản với số token gấp 1.3 lần sẽ tốn kém hơn so với trên Sonnet 4.6 ở cùng mức giá mỗi token. Mức giá cố định. Hóa đơn thì không.

Điều này ảnh hưởng đến nhiều hơn là chỉ chi phí:

Các trường usage và kết quả đếm token sẽ cao hơn đối với cùng một văn bản. Hãy đếm lại với Sonnet 5. Đừng tái sử dụng số liệu đếm cũ của Sonnet 4.6.
Cửa sổ ngữ cảnh 1 triệu token sẽ chứa ít văn bản hơn trung bình, vì mỗi token giờ đây bao phủ ít văn bản hơn.
Ngân sách max_tokens mà bạn đã định kích thước gần với đầu ra dự kiến của mình có thể bị cắt bớt. Hãy xem xét lại chúng.

Điểm mấu chốt rất đơn giản: hãy mô hình hóa khối lượng công việc thực tế của bạn bằng cách đếm token trên Sonnet 5 trước khi bạn cho rằng có sự tương đồng tuyệt đối. Tài liệu đếm token của Anthropic chỉ ra cách đo lường một lời nhắc với bộ mã hóa hiện tại. Để biết hướng dẫn chi tiết về lần gọi API đầu tiên và cách đọc khối usage, hãy xem hướng dẫn API Claude Sonnet 5 của chúng tôi.

Sonnet 5 so sánh với Opus 4.8 và Fable 5 như thế nào

Sonnet 5 được định giá để trở thành một "con ngựa kéo" cho khối lượng công việc lớn. Giá trị của nó rõ ràng nhất khi bạn so sánh nó với các mô hình cao cấp hơn. Cả ba đều có cửa sổ ngữ cảnh 1 triệu token và đầu ra tối đa 128K, vì vậy sự khác biệt ở đây là giá cả và nơi mỗi mô hình thể hiện giá trị của mình.

Mô hình	ID mô hình	Đầu vào (mỗi 1 triệu)	Đầu ra (mỗi 1 triệu)
Sonnet 5 (giới thiệu)	`claude-sonnet-5`	$2	$10
Sonnet 5 (tiêu chuẩn)	`claude-sonnet-5`	$3	$15
Sonnet 4.6	`claude-sonnet-4-6`	$3	$15
Opus 4.8	`claude-opus-4-8`	$5	$25
Fable 5	`claude-fable-5`	$10	$50

Hãy đọc bảng đó với các điểm chuẩn trong tâm trí. Trong các tác vụ đại lý và sử dụng công cụ, các số liệu ra mắt của Anthropic cho thấy Sonnet 5 chỉ kém Opus 4.8 khoảng 1 đến 3 điểm. Các con số được báo cáo bao gồm SWE-bench Pro ở mức 63.2% cho Sonnet 5 so với 69.2% cho Opus 4.8, Terminal-Bench 2.1 ở mức 80.4% so với 82.7%, và OSWorld-Verified ở mức 81.2% so với 83.4%. Opus dẫn trước khoảng 6 điểm về khả năng suy luận thuần túy mà không cần dựa vào bất kỳ điều gì.

Vì vậy, quyết định về chi phí tóm lại là:

Với mức giá tiêu chuẩn, Sonnet 5 rẻ hơn 40% cho đầu vào và 40% cho đầu ra so với Opus 4.8, mang lại hiệu suất gần với Opus cho các công việc nặng về công cụ.
Fable 5 có giá 10 đô la / 50 đô la, cao hơn gấp ba lần mức giá đầu vào tiêu chuẩn của Sonnet 5. Bạn sẽ tìm đến nó khi bạn cần mô hình mạnh nhất của Anthropic được phát hành rộng rãi, không phải cho các vòng lặp tác vụ khối lượng lớn.
So với Sonnet 4.6, bạn trả cùng một mức giá mỗi token để có điểm mã hóa và tác vụ đại lý tốt hơn, với lưu ý về bộ mã hóa đã đề cập ở trên.

Nếu bạn đang cân nhắc khả năng so với giá cả cho một công việc cụ thể, bài phân tích Sonnet 5 vs Opus 4.8 của chúng tôi sẽ xem xét từng tác vụ quyết định. Đối với phía Fable 5 của thang, hãy xem hướng dẫn giá Fable 5.

Kiểm tra và theo dõi các yêu cầu bạn đang trả phí với Apidog

Mỗi đô la trên hóa đơn Sonnet 5 của bạn tương ứng với một yêu cầu HTTP: một yêu cầu POST đến API Tin nhắn với nội dung JSON, một khóa API và một phản hồi mà bạn phải trả phí theo token. Nếu bạn đoán mò về các yêu cầu đó, bạn đang đoán mò về chi phí của mình.

Apidog cung cấp cho bạn một nơi để biến các yêu cầu đó thành hiện thực và có thể lặp lại:

Gửi một yêu cầu Sonnet 5 và xem phản hồi chính xác, bao gồm khối usage cho biết số lượng token đầu vào và đầu ra cho mỗi lần gọi. Đó là chi phí của bạn, cho mỗi yêu cầu, trước khi bạn mở rộng quy mô.
Lưu yêu cầu vào một bộ sưu tập để nhóm của bạn chạy cùng một lệnh gọi, không phải các lệnh gọi hơi khác nhau mà lại tính phí khác nhau.
Lưu trữ khóa API của bạn dưới dạng biến môi trường và chuyển đổi giữa khóa thử nghiệm và khóa sản xuất mà không cần chỉnh sửa yêu cầu.
Thêm các xác nhận tự động để một thay đổi lời nhắc làm tăng gấp đôi độ dài đầu ra sẽ được phát hiện trong CI, không phải trên hóa đơn.
Giả lập điểm cuối để bạn có thể xây dựng và kiểm tra tích hợp của mình mà không tốn token thật cho mỗi lần chạy phát triển.

Dưới đây là yêu cầu đầu tiên theo định dạng API Tin nhắn của Anthropic. Gửi nó trong Apidog, đọc các trường usage trong phản hồi, và bạn sẽ có một con số chi phí thực tế cho mỗi lần gọi để nhân lên.

curl https://api.anthropic.com/v1/messages \
  --header "x-api-key: $ANTHROPIC_API_KEY" \
  --header "anthropic-version: 2023-06-01" \
  --header "content-type: application/json" \
  --data '{
    "model": "claude-sonnet-5",
    "max_tokens": 1024,
    "messages": [
      {"role": "user", "content": "Summarize this changelog entry in two sentences."}
    ]
  }'

Phản hồi bao gồm một đối tượng usage với input_tokens và output_tokens. Nhân các giá trị đó với mức giá trong bảng trên và bạn sẽ có chi phí của cuộc gọi chính xác đó. Hãy thực hiện điều đó cho các lời nhắc thực tế của bạn và ước tính của bạn sẽ không còn là một phỏng đoán nữa.

Tải xuống Apidog để gửi các yêu cầu Sonnet 5, kiểm tra việc sử dụng token và sắp xếp các cuộc gọi mà bạn đang tính phí trong một không gian làm việc.

Các câu hỏi thường gặp

API Claude Sonnet 5 có giá bao nhiêu?

Trong thời gian giới thiệu đến hết ngày 31 tháng 8 năm 2026, chi phí là 2 đô la cho mỗi triệu token đầu vào và 10 đô la cho mỗi triệu token đầu ra. Từ ngày 1 tháng 9 năm 2026, nó sẽ chuyển sang mức giá tiêu chuẩn là 3 đô la cho mỗi triệu đầu vào và 15 đô la cho mỗi triệu đầu ra.

Sonnet 5 có rẻ hơn Sonnet 4.6 không?

Mức giá mỗi token giống như Sonnet 4.6 ở mức tiêu chuẩn (3 đô la / 15 đô la), và thấp hơn trong thời gian giới thiệu. Nhưng bộ mã hóa mới của Sonnet 5 tạo ra nhiều hơn khoảng 30% token cho cùng một văn bản, do đó chi phí cho một yêu cầu tương đương có thể cao hơn ở mức giá tiêu chuẩn. Hãy đếm token trên Sonnet 5 để biết con số thực tế của bạn. So sánh Sonnet 5 và Sonnet 4.6 của chúng tôi bao gồm các chi tiết di chuyển.

Tại sao cùng một lời nhắc lại tốn kém hơn trên Sonnet 5 so với Sonnet 4.6?

Mức giá mỗi token không thay đổi, nhưng bộ mã hóa mới chia cùng một văn bản thành số token nhiều hơn khoảng 1.3 lần. Nhiều token hơn ở cùng một mức giá có nghĩa là chi phí cao hơn cho văn bản tương đương, điều này rõ ràng nhất khi thời gian giảm giá giới thiệu kết thúc.

Giá Sonnet 5 so với Opus 4.8 như thế nào?

Opus 4.8 có giá 5 đô la cho mỗi triệu đầu vào và 25 đô la cho mỗi triệu đầu ra, so với mức tiêu chuẩn của Sonnet 5 là 3 đô la / 15 đô la. Sonnet 5 đạt hiệu suất chỉ kém Opus 4.8 khoảng 1 đến 3 điểm trên các điểm chuẩn tác vụ đại lý được Anthropic báo cáo, vì vậy bạn có được hiệu suất gần như tương đương cho các tác vụ nặng về công cụ với mức giá thấp hơn.

Có cách nào rẻ hơn để chạy Sonnet 5 không?

Có. Xử lý hàng loạt và lưu trữ lời nhắc vào bộ nhớ đệm giúp giảm tỷ lệ hiệu quả cho các khối lượng công việc phù hợp. Các mức giá chiết khấu chính xác có trên trang giá của Anthropic. Định kích thước max_tokens chính xác và giữ lời nhắc ngắn gọn cũng giúp giảm chi phí đầu ra, vốn cao gấp 5 lần so với tỷ lệ đầu vào.