Claude Sonnet 5 ra mắt vào ngày 30 tháng 6 năm 2026, và đây là một trong những mô hình mặc định mạnh mẽ nhất mà bạn có thể chạy trong Claude Code. Anthropic gọi nó là “mô hình Sonnet có tính tác nhân nhất từ trước đến nay,” và các điểm chuẩn khi ra mắt đã chứng minh điều đó: trong các tác vụ sử dụng công cụ và lập trình tác nhân, nó chỉ kém Opus 4.8 vài điểm nhưng với chi phí thấp hơn đáng kể. Sự kết hợp này quan trọng nhất trong Claude Code, nơi mô hình dành cả ngày để đọc tệp, chạy lệnh terminal và chỉnh sửa kho mã của bạn theo một vòng lặp.
Hướng dẫn này sẽ chỉ cho bạn cách chọn Sonnet 5 trong Claude Code, những thay đổi về hành vi của nó (tư duy thích ứng hiện được bật theo mặc định), cách chạy một quy trình làm việc thực tế và khi nào nên chuyển sang Opus 4.8. Bạn cũng sẽ thấy cách kết hợp nó với Apidog để mô hình có thể xây dựng API và kiểm tra điểm cuối thực tế thay vì phỏng đoán.
Tại sao Sonnet 5 là một mô hình mặc định mạnh mẽ cho Claude Code
Claude Code là một công cụ lập trình tác nhân. Mô hình không chỉ trả lời một lần. Nó lập kế hoạch, chạy lệnh, đọc kết quả, chỉnh sửa tệp và lặp lại. Vòng lặp đó mang lại lợi ích cho các mô hình giỏi sử dụng công cụ, và Sonnet 5 được tinh chỉnh chính xác cho điều đó.

Đây là ảnh chụp nhanh điểm chuẩn khi ra mắt, được Anthropic báo cáo. Hãy coi đây là những số liệu được báo cáo, không phải kết quả thử nghiệm của chúng tôi.
| Điểm chuẩn | Sonnet 5 | Opus 4.8 | Sonnet 4.6 |
|---|---|---|---|
| SWE-bench Pro (lập trình tác nhân) | 63.2% | 69.2% | 58.1% |
| Terminal-Bench 2.1 | 80.4% | 82.7% | n/a |
| OSWorld-Verified (sử dụng máy tính) | 81.2% | 83.4% | 78.5% |
Mô hình này là phần hữu ích. Với các công cụ trong vòng lặp, Sonnet 5 nằm trong khoảng từ 1 đến 3 điểm so với Opus 4.8. Đối với lý luận thuần túy không có gì hỗ trợ, Opus vượt trội hơn khoảng 6 điểm. Lập trình trong Claude Code là một công việc nặng về công cụ, vì vậy hầu hết thời gian bạn sẽ thấy Sonnet 5 gần bằng Opus mà lại rẻ hơn nhiều.
Giá cả làm cho vấn đề rõ ràng hơn. Sonnet 5 có giá 3 đô la cho mỗi triệu token đầu vào và 15 đô la cho mỗi triệu token đầu ra theo tỷ lệ tiêu chuẩn, với tỷ lệ giới thiệu là 2 đô la đầu vào và 10 đô la đầu ra cho đến ngày 31 tháng 8 năm 2026. Opus 4.8 có giá 5 đô la cho mỗi triệu token đầu vào và 25 đô la đầu ra. Đối với một ngày lập trình tác nhân bận rộn, khoảng cách đó cộng dồn lại. Bài viết phân tích giá Claude Sonnet 5 của chúng tôi sẽ đi sâu vào các con số, bao gồm cả vấn đề tokenizer được đề cập bên dưới.
Chọn Sonnet 5 trong Claude Code
Claude Code cho phép chọn mô hình thông qua lệnh tương tác /model. Trong một phiên, hãy nhập:
/model
Bạn sẽ nhận được một công cụ chọn liệt kê các mô hình có sẵn. Chọn Claude Sonnet 5. Từ thời điểm đó, phiên sẽ sử dụng nó để lập kế hoạch và chỉnh sửa.
Nếu bạn muốn đặt mô hình mà không cần mở công cụ chọn, bạn có thể truyền trực tiếp:
/model claude-sonnet-5
Chuỗi claude-sonnet-5 là ID mô hình API chính xác, không có hậu tố ngày. Nếu bạn đang viết script cho Claude Code hoặc đặt mặc định cho dự án, hãy sử dụng ID chính xác đó.
Sonnet 5 có sẵn trong Claude Code ngay từ khi ra mắt. Nó cũng là mô hình mặc định trên các ứng dụng Claude miễn phí và Pro, đồng thời có sẵn cho các gói Max, Team và Enterprise. Vì vậy, cho dù bạn đang sử dụng gói trả phí hay miễn phí, bạn đều có thể chạy Sonnet 5 ngay hôm nay. Để có hướng dẫn đầy đủ, hãy xem hướng dẫn Claude Code của chúng tôi, và tài liệu tham khảo lệnh CLI của Claude Code bao gồm các lệnh slash còn lại.
Những thay đổi trong hành vi của mô hình
Sonnet 5 là một bản nâng cấp trực tiếp từ Sonnet 4.6, nhưng một vài hành vi có sự khác biệt. Hai trong số đó xuất hiện khi bạn làm việc trong Claude Code.
Tư duy thích ứng được bật theo mặc định
Trên Sonnet 4.6, một yêu cầu không có trường thinking sẽ chạy mà không cần tư duy. Trên Sonnet 5, tư duy thích ứng được bật theo mặc định. Mô hình quyết định mức độ tư duy dựa trên tác vụ trước mắt. Một thao tác đổi tên nhanh sẽ gần như không cần tư duy. Một thao tác tái cấu trúc phức tạp trên nhiều tệp sẽ cần nhiều tư duy hơn.
Bạn không cấu hình điều này trong Claude Code theo cách bạn làm trong một lệnh gọi API thô. Công cụ quản lý yêu cầu cho bạn. Điều bạn sẽ nhận thấy là Sonnet 5 sẽ tạm dừng để lý luận ở những bước khó hơn và di chuyển nhanh ở những bước đơn giản. Đó là hành vi thích ứng hoạt động như dự định. Tài liệu tư duy thích ứng của Anthropic giải thích cơ chế nếu bạn muốn biết chi tiết.
Mô hình cũng hỗ trợ tham số "effort" (nỗ lực) với bốn cấp độ: low (thấp), medium (trung bình), high (cao) và xhigh (rất cao). Nỗ lực kiểm soát mức độ sâu sắc của tư duy và số lượng token mà nó sử dụng. Nỗ lực cao hơn sẽ hữu ích cho những vấn đề khó nhất và tốn kém hơn. Trong một vòng lặp tác nhân, đây là nút điều chỉnh bạn sử dụng khi một tác vụ thực sự cần nhiều sự cân nhắc hơn.
Tính năng tư duy mở rộng thủ công và tham số lấy mẫu đã bị loại bỏ
Nếu bạn đã xây dựng công cụ tùy chỉnh xung quanh Claude, hãy lưu ý hai điểm bị loại bỏ. Tư duy mở rộng thủ công (thinking: {type: "enabled", budget_tokens: N}) hiện trả về lỗi 400. Thay vào đó, hãy sử dụng tư duy thích ứng và tham số nỗ lực. Đặt temperature, top_p hoặc top_k thành một giá trị không mặc định cũng sẽ trả về lỗi 400. Thay vào đó, hãy điều khiển hành vi thông qua lời nhắc và hướng dẫn hệ thống của bạn. Claude Code xử lý điều này cho bạn, nhưng bất kỳ script nào bạn đã viết cho Sonnet 4.6 đều cần được xem xét lại. Danh sách đầy đủ có trong bài viết so sánh Sonnet 5 và Sonnet 4.6 của chúng tôi.
Tokenizer mới ảnh hưởng đến ngữ cảnh và chi phí
Sonnet 5 sử dụng một tokenizer mới. Cùng một văn bản nguồn tạo ra số lượng token nhiều hơn khoảng 30% so với Sonnet 4.6, tức là khoảng 1.3 lần. Các hình dạng yêu cầu và phản hồi không thay đổi, vì vậy không có gì bị hỏng, nhưng có hai điều thay đổi.
Thứ nhất, cửa sổ ngữ cảnh 1.000.000 token chứa ít văn bản hơn trung bình, vì mỗi token bao phủ ít hơn. Một kho mã lớn sẽ lấp đầy cửa sổ nhanh hơn một chút so với số lượng ký tự thô gợi ý. Thứ hai, chi phí trên mỗi yêu cầu của văn bản tương đương có thể cao hơn mặc dù giá mỗi token không thay đổi. Đừng tái sử dụng ước tính token của Sonnet 4.6. Hãy tính toán lại với Sonnet 5 bằng điểm cuối đếm token của Anthropic nếu bạn đang lập ngân sách cho một khối lượng công việc.
Quy trình làm việc thực tế của Claude Code với Sonnet 5
Sonnet 5 hoạt động tốt nhất khi bạn cho phép nó lập kế hoạch trước khi chỉnh sửa:
- Mô tả tác vụ ở cấp độ cao. Yêu cầu nó đọc các tệp liên quan và đề xuất một kế hoạch trước khi động đến mã.
- Xem xét kế hoạch. Sửa bất kỳ lỗi nào. Điều này rẻ hơn so với việc sửa các chỉnh sửa sai sau này.
- Cho phép nó triển khai, chạy các lệnh terminal và chỉnh sửa tệp trong quá trình thực hiện.
- Yêu cầu nó chạy các bài kiểm tra của bạn. Nếu chúng thất bại, hãy để nó đọc kết quả và lặp lại.
Vì tính năng tư duy thích ứng được bật, bạn không cần phải tự tăng cường khả năng lý luận cho bước lập kế hoạch. Mô hình sẽ dành nhiều nỗ lực hơn cho những tác vụ khó hơn. Công việc của bạn là đưa ra hướng dẫn rõ ràng và xem xét kế hoạch.
Hãy nhớ đến ngữ cảnh. Ngay cả với cửa sổ 1M, việc đưa toàn bộ kho mã của bạn cho mô hình ở mỗi lượt sẽ lãng phí token và tiền. Hãy chỉ hướng nó đến các tệp quan trọng. Sonnet 5 rất giỏi trong việc tuân theo một tác vụ có phạm vi và chỉ kéo thêm ngữ cảnh khi cần thiết.
Xây dựng API, sau đó để Sonnet 5 kiểm tra
Đây là lúc quy trình làm việc trở nên cụ thể. Giả sử bạn đang xây dựng một API REST trong Claude Code. Mô hình có thể tạo cấu trúc các tuyến, nhưng nó không thể biết liệu điểm cuối đang chạy có thực sự hoạt động hay không. Đó là khoảng trống mà Apidog lấp đầy.
Hãy thiết kế và mô phỏng API trong Apidog trước. Bạn xác định các điểm cuối, lược đồ yêu cầu và phản hồi, cùng với một máy chủ mô phỏng trả về dữ liệu thực tế, để giao diện người dùng và các bài kiểm tra của bạn có thứ để tương tác trước khi phần phụ trợ hoàn thành. Sau đó, khi Sonnet 5 viết triển khai, bạn hướng nó đến điểm cuối thực tế thông qua máy chủ Apidog MCP, máy chủ này sẽ hiển thị thông số kỹ thuật API của bạn cho mô hình. Mô hình đọc lược đồ thực tế thay vì tự tạo, tạo ra các trình xử lý phù hợp với nó và có thể chạy các kịch bản kiểm tra đối với máy chủ trực tiếp.
Vòng lặp trông như thế này:
# Sonnet 5 trong Claude Code triển khai điểm cuối,
# sau đó chạy bộ kiểm tra Apidog của bạn thông qua CLI:
apidog run --access-token $APIDOG_TOKEN \
--project-id $PROJECT_ID \
--test-scenario "user-signup-flow"
Khi một bài kiểm tra thất bại, mô hình đọc kết quả khẳng định và sửa trình xử lý. Bạn có một vòng lặp xây dựng-kiểm tra chặt chẽ, nơi mô hình xác minh dựa trên một hợp đồng thực tế, không phải là một phỏng đoán. Các bài kiểm tra tự động và khẳng định trực quan của Apidog sẽ phát hiện sự không khớp; Sonnet 5 thực hiện việc sửa lỗi. Tải Apidog để thiết lập dự án cục bộ trước.
Mối liên hệ thực sự là nhỏ: mô hình viết mã, và Apidog là nơi bạn xác nhận rằng API thực sự làm những gì hợp đồng đã nói.
Khi nào nên chuyển sang Opus 4.8
Sonnet 5 là lựa chọn mặc định phù hợp cho hầu hết các phiên Claude Code, nhưng Opus 4.8 xứng đáng với mức giá cao hơn trong một vài trường hợp.
Sử dụng Opus 4.8 khi:
- Tác vụ là một vấn đề lý luận khó, không phải là vấn đề vòng lặp công cụ. Thiết kế thuật toán thuần túy hoặc logic tinh tế là nơi Opus thể hiện ưu thế ~6 điểm của mình.
- Bạn đang thực hiện công việc tự động hóa dài hạn, nơi các lỗi nhỏ tích lũy qua nhiều bước.
- Chất lượng quan trọng hơn chi phí đối với một thay đổi quan trọng cụ thể.
Giữ Sonnet 5 khi:
- Bạn đang thực hiện lập trình tác nhân tiêu chuẩn: đọc tệp, chạy lệnh, chỉnh sửa, kiểm tra.
- Khối lượng công việc cao và chi phí là một yếu tố quan trọng.
- Bạn muốn lặp lại nhanh chóng trên nhiều tác vụ nhỏ.
Việc chuyển đổi chỉ là một lệnh. Nhập /model claude-opus-4-8 cho tác vụ khó, sau đó chuyển lại về claude-sonnet-5 cho phần còn lại của phiên. Bạn không cần phải cam kết với một mô hình cho mọi thứ. Để so sánh sâu hơn, hãy đọc bài viết so sánh Sonnet 5 và Opus 4.8 của chúng tôi. Nếu trước đây bạn đã sử dụng Sonnet 4.5 trong Claude Code hoặc Fable 5 trong Claude Code, quy trình làm việc ở đây sẽ quen thuộc.
Lời khuyên thực tế
- Hãy để nó lập kế hoạch. Yêu cầu một kế hoạch trước khi chỉnh sửa bất kỳ thứ gì không đơn giản. Tư duy thích ứng tự động xử lý độ sâu lý luận.
- Phạm vi hóa ngữ cảnh của bạn. Hướng mô hình đến các tệp quan trọng. Cửa sổ 1M rất lớn, nhưng tokenizer mới có nghĩa là nó sẽ lấp đầy nhanh hơn bạn mong đợi.
- Theo dõi chi phí vào những ngày làm việc nặng. Sonnet 5 rẻ hơn Opus, nhưng một ngày đầy chỉnh sửa sẽ cộng dồn chi phí. Mức giá giới thiệu đến ngày 31 tháng 8 năm 2026 sẽ hữu ích.
- Kiểm tra dựa trên các hợp đồng thực tế. Yêu cầu mô hình chạy các bài kiểm tra Apidog đối với các điểm cuối của bạn thay vì tin rằng mã "trông có vẻ đúng".
- Sử dụng nỗ lực cho các bước khó. Khi một tác vụ cần nhiều cân nhắc hơn, tham số nỗ lực (lên đến xhigh) là công cụ điều chỉnh, chứ không phải là ngân sách tư duy thủ công.
FAQ
Claude Sonnet 5 có khả dụng trong Claude Code không?
Có. Sonnet 5 có sẵn trong Claude Code kể từ khi ra mắt vào ngày 30 tháng 6 năm 2026. Chọn nó bằng lệnh /model và chọn Claude Sonnet 5, hoặc truyền trực tiếp ID mô hình bằng /model claude-sonnet-5.
Tôi có cần thay đổi cài đặt cho tư duy thích ứng không?
Không. Tư duy thích ứng được bật theo mặc định trên Sonnet 5, và Claude Code quản lý yêu cầu cho bạn. Mô hình quyết định mức độ tư duy cho mỗi tác vụ. Đây là một thay đổi so với Sonnet 4.6, nơi một yêu cầu không có trường tư duy sẽ chạy mà không cần bất kỳ suy nghĩ nào. Xem bài so sánh Sonnet 5 và Sonnet 4.6 của chúng tôi để biết danh sách đầy đủ các thay đổi hành vi.
Sonnet 5 có đủ tốt để lập trình không, hay tôi nên dùng Opus 4.8?
Đối với hầu hết các tác vụ lập trình tác nhân trong Claude Code, Sonnet 5 là một mô hình mặc định mạnh mẽ. Các điểm chuẩn khi ra mắt của Anthropic đặt nó trong khoảng 1 đến 3 điểm so với Opus 4.8 trong các tác vụ sử dụng công cụ như SWE-bench Pro và Terminal-Bench, với mức giá thấp hơn. Hãy chuyển sang Opus 4.8 cho những vấn đề lý luận thuần túy khó nhất hoặc công việc tự động hóa dài hạn.
Tôi có thể sử dụng Sonnet 5 trong Claude Code miễn phí không?
Sonnet 5 là mô hình mặc định trên các ứng dụng Claude miễn phí và Pro và có sẵn trong Claude Code. Việc sử dụng miễn phí đi kèm với giới hạn tỷ lệ và sử dụng. Xem hướng dẫn miễn phí Claude Sonnet 5 của chúng tôi để biết các cách tiếp cận trung thực và giới hạn là gì.
Tokenizer mới ảnh hưởng đến các phiên Claude Code của tôi như thế nào?
Cùng một văn bản tạo ra số lượng token nhiều hơn khoảng 30% so với Sonnet 4.6. Không có gì bị hỏng, nhưng cửa sổ ngữ cảnh 1M chứa ít văn bản hơn và chi phí cho văn bản tương đương có thể cao hơn. Hãy đếm lại token dựa trên Sonnet 5 thay vì tái sử dụng các ước tính cũ.
