TL;DR
Claude Opus 4.7 là mô hình có năng lực nhất của Anthropic được phát hành rộng rãi, ra mắt vào ngày 16 tháng 4 năm 2026. Nó giới thiệu tính năng thị giác độ phân giải cao (lên đến 3.75 megapixel), một cấp độ nỗ lực mới `xhigh`, ngân sách tác vụ cho các vòng lặp tác tử, và một công cụ mã hóa mới. Nó vẫn giữ cửa sổ ngữ cảnh 1 triệu token và mức giá $5/$25 cho mỗi triệu token từ Opus 4.6 nhưng đi kèm với một số thay đổi API quan trọng, bao gồm việc loại bỏ ngân sách tư duy mở rộng và các tham số lấy mẫu.
Giới thiệu
Anthropic đã phát hành Claude Opus 4.7 vào ngày 16 tháng 4 năm 2026. Nó thay thế Opus 4.6 trở thành mô hình hàng đầu trong dòng sản phẩm Claude và nhắm đến các nhà phát triển xây dựng tác tử tự trị, trợ lý công việc tri thức và các ứng dụng nặng về thị giác.
Bản phát hành này quan trọng vì ba lý do. Thứ nhất, đây là mô hình Claude đầu tiên hỗ trợ hình ảnh độ phân giải cao, tăng ngân sách pixel từ 1.15 MP lên hơn gấp ba lần thành 3.75 MP. Thứ hai, nó giới thiệu ngân sách tác vụ, một cách để cấp cho mô hình một lượng token cho toàn bộ một vòng lặp tác tử thay vì chỉ một lượt. Thứ ba, nó đi kèm với những thay đổi quan trọng yêu cầu cập nhật mã nếu bạn đang di chuyển từ Opus 4.6.
Thông số kỹ thuật cốt lõi
| Thông số | Giá trị |
|---|---|
| ID mô hình API | claude-opus-4-7 |
| Cửa sổ ngữ cảnh | 1,000,000 token |
| Số token đầu ra tối đa | 128,000 token |
| Giá đầu vào | $5 cho mỗi triệu token |
| Giá đầu ra | $25 cho mỗi triệu token |
| Giá đầu vào hàng loạt | $2.50 cho mỗi triệu token |
| Giá đầu ra hàng loạt | $12.50 cho mỗi triệu token |
| Giá đọc bộ nhớ đệm | $0.50 cho mỗi triệu token |
| Ghi bộ nhớ đệm 5 phút | $6.25 cho mỗi triệu token |
| Ghi bộ nhớ đệm 1 giờ | $10 cho mỗi triệu token |
| Ngày phát hành | 16 tháng 4 năm 2026 |
| Khả dụng trên | Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry |
Opus 4.7 sử dụng một công cụ mã hóa token mới có thể tạo ra nhiều hơn tới 35% token cho cùng một văn bản so với Opus 4.6. Giá mỗi token không thay đổi, nhưng chi phí thực tế của bạn cho mỗi yêu cầu có thể tăng lên tùy thuộc vào nội dung.

Có gì mới trong Claude Opus 4.7
Hỗ trợ hình ảnh độ phân giải cao
Đây là điểm bổ sung nổi bật. Các mô hình Claude trước đây giới hạn đầu vào hình ảnh ở 1,568 pixel ở cạnh dài (khoảng 1.15 megapixel). Opus 4.7 nâng mức này lên 2,576 pixel ở cạnh dài (khoảng 3.75 megapixel).
Tác động thực tế: ảnh chụp màn hình, bản phác thảo thiết kế, tài liệu và ảnh chụp hiển thị với độ chân thực cao hơn nhiều. Ánh xạ tọa độ hiện là 1:1 với các pixel thực tế, loại bỏ phép toán hệ số tỷ lệ mà các quy trình làm việc sử dụng máy tính trước đây yêu cầu.
Opus 4.7 cũng cải thiện các tác vụ phụ về thị giác cụ thể:
- Nhận thức cấp thấp: các tác vụ chỉ, đo lường và đếm chính xác hơn
- Định vị hình ảnh: phát hiện hộp giới hạn và định vị hình ảnh tự nhiên cho thấy những cải thiện rõ rệt
Độ phân giải cao hơn có nghĩa là nhiều token hơn cho mỗi hình ảnh. Nếu trường hợp sử dụng của bạn không cần độ chân thực bổ sung, hãy giảm mẫu hình ảnh trước khi gửi để tiết kiệm chi phí.
Cấp độ nỗ lực xhigh mới
Tham số nỗ lực kiểm soát mức độ suy luận mà Claude đầu tư vào một phản hồi. Opus 4.7 bổ sung `xhigh` trên các cấp độ `high`, `medium` và `low` hiện có.
Sử dụng `xhigh` cho các tác vụ mã hóa và tác tử mà chất lượng quan trọng hơn độ trễ. Ở cấp độ này, mô hình dành nhiều token hơn đáng kể cho suy luận nội bộ, dẫn đến đầu ra tốt hơn cho các vấn đề phức tạp. Sử dụng `high` làm mức tối thiểu cho các công việc nhạy cảm về trí tuệ. Các cấp độ thấp hơn đánh đổi độ chính xác để lấy tốc độ và tiết kiệm chi phí.
Ngân sách tác vụ (Beta)
Ngân sách tác vụ giải quyết một vấn đề mà bất kỳ ai xây dựng tác tử đều gặp phải: làm thế nào để ngăn một vòng lặp tác tử nhiều lượt tiêu thụ một số lượng token không giới hạn?
Với ngân sách tác vụ, bạn cung cấp cho Claude một mục tiêu token gần đúng cho toàn bộ vòng lặp, bao gồm suy nghĩ, gọi công cụ, kết quả công cụ và đầu ra cuối cùng. Mô hình sẽ thấy một bộ đếm ngược đang chạy và sử dụng nó để ưu tiên công việc, bỏ qua các bước ít giá trị và kết thúc một cách hợp lý khi ngân sách cạn kiệt.
Các chi tiết chính:
- Ngân sách tác vụ tối thiểu là 20,000 token
- Đây là khuyến nghị, không phải giới hạn cứng. Claude cố gắng tuân thủ nhưng có thể vượt quá
- Nó khác với
max_tokens, vốn là một giới hạn cứng cho mỗi yêu cầu mà mô hình không thấy - Yêu cầu tiêu đề beta
task-budgets-2026-03-13
Đối với các tác vụ tác tử mở mà chất lượng là quan trọng nhất, hãy bỏ qua ngân sách tác vụ và để mô hình chạy. Chỉ dành ngân sách tác vụ cho các khối lượng công việc mà bạn cần kiểm soát tổng chi tiêu.
Tư duy thích ứng là chế độ tư duy duy nhất
Chế độ tư duy mở rộng (nơi bạn đặt `budget_tokens` cố định) đã bị loại bỏ. Cố gắng đặt `thinking: {"type": "enabled", "budget_tokens": N}` sẽ trả về lỗi 400.
Tư duy thích ứng là chế độ tư duy duy nhất. Trong các đánh giá nội bộ của Anthropic, nó liên tục vượt trội hơn phương pháp ngân sách cố định vì mô hình phân bổ token suy luận một cách linh hoạt dựa trên độ khó của tác vụ.
Quan trọng: tư duy thích ứng **mặc định bị tắt**. Bạn phải đặt rõ ràng `thinking: {"type": "adaptive"}` để bật nó.
Theo mặc định, nội dung suy nghĩ cũng bị bỏ qua khỏi các phản hồi. Nếu bạn cần xem quá trình suy luận của mô hình (ví dụ: để truyền tải tiến độ cho người dùng), hãy đặt `display: "summarized"` trong cấu hình tư duy.
Cải thiện bộ nhớ
Opus 4.7 tốt hơn trong việc ghi và đọc từ bộ nhớ dựa trên hệ thống tệp. Nếu tác tử của bạn duy trì một bảng nháp, tệp ghi chú hoặc kho lưu trữ bộ nhớ có cấu trúc qua các lượt, nó sẽ thực hiện tốt hơn việc cập nhật và tham chiếu các ghi chú đó.
Điều này quan trọng đối với các tác tử mã hóa chạy dài, trợ lý nghiên cứu và bất kỳ quy trình làm việc nào mà ngữ cảnh được duy trì qua các phiên.
Cải thiện công việc tri thức
Những cải thiện cụ thể đối với các tác vụ tri thức thực tế:
- Chỉnh sửa tài liệu: tốt hơn trong việc tạo và tự kiểm tra các thay đổi được theo dõi trong tệp .docx
- Chỉnh sửa slide: độ chính xác được cải thiện khi tạo và xác thực bố cục .pptx
- Phân tích biểu đồ: tốt hơn trong việc sử dụng các thư viện xử lý hình ảnh (như PIL) để phân tích biểu đồ ở cấp độ pixel và chuyển đổi dữ liệu từ hình ảnh

Những thay đổi so với Opus 4.6
Những thay đổi API quan trọng
Những thay đổi này áp dụng cho API Tin nhắn. Nếu bạn sử dụng Claude Managed Agents, không có thay đổi quan trọng nào.
| Thay đổi | Trước đây (Opus 4.6) | Sau này (Opus 4.7) |
|---|---|---|
| Tư duy mở rộng | thinking: {"type": "enabled", "budget_tokens": 32000} |
Phải sử dụng thinking: {"type": "adaptive"} |
| Tham số lấy mẫu | temperature, top_p, top_k được chấp nhận |
Các giá trị không phải mặc định trả về lỗi 400 |
| Hiển thị tư duy | Nội dung tư duy được bao gồm theo mặc định | Bị bỏ qua theo mặc định; chọn tham gia với display: "summarized" |
| Bộ mã hóa token | Bộ mã hóa token tiêu chuẩn | Bộ mã hóa token mới (tối đa 35% nhiều token hơn cho cùng một văn bản) |
Thay đổi hành vi
Những thay đổi này không làm hỏng API nhưng có thể ảnh hưởng đến các lời nhắc của bạn:
- Tuân thủ hướng dẫn theo nghĩa đen hơn. Mô hình sẽ không tự động khái quát hóa hướng dẫn từ mục này sang mục khác
- Độ dài phản hồi tương ứng với độ phức tạp của tác vụ thay vì mặc định một độ dài cố định
- Ít lời gọi công cụ hơn theo mặc định, ưu tiên suy luận hơn hành động. Nâng cao nỗ lực để tăng cường sử dụng công cụ
- Giọng điệu trực tiếp, quyết đoán hơn với ít biểu tượng cảm xúc và ít cách diễn đạt theo kiểu xác nhận
- Ít tác tử phụ được tạo ra theo mặc định trong các quy trình làm việc tác tử
Nếu bạn đã xây dựng khung lời nhắc để buộc Claude thực hiện các hành vi cụ thể (như “kiểm tra lại bố cục slide” hoặc “cung cấp cập nhật trạng thái”), hãy thử loại bỏ nó. Opus 4.7 xử lý nhiều mẫu này một cách tự nhiên.
Chi tiết giá
Opus 4.7 duy trì mức giá mỗi token tương tự như Opus 4.6 và 4.5:
| Loại sử dụng | Chi phí |
|---|---|
| Đầu vào tiêu chuẩn | $5 / MTok |
| Đầu ra tiêu chuẩn | $25 / MTok |
| Đầu vào hàng loạt | $2.50 / MTok |
| Đầu ra hàng loạt | $12.50 / MTok |
| Đọc bộ nhớ đệm | $0.50 / MTok |
| Ghi bộ nhớ đệm 5 phút | $6.25 / MTok |
| Ghi bộ nhớ đệm 1 giờ | $10 / MTok |
| Đầu vào chế độ nhanh (chỉ Opus 4.6) | $30 / MTok |
| Lưu trữ dữ liệu tại Hoa Kỳ | Hệ số nhân 1.1x |
Bộ mã hóa token mới là biến số chi phí cần theo dõi. Bởi vì nó có thể tạo ra nhiều hơn tới 35% token cho cùng một văn bản đầu vào, chi phí thực tế của bạn cho mỗi yêu cầu có thể tăng lên mặc dù giá mỗi token không thay đổi. Hãy kiểm tra bằng điểm cuối `/v1/messages/count_tokens` để đo lường tác động đến các lời nhắc cụ thể của bạn.
Cửa sổ ngữ cảnh 1M không có phí cao cấp cho ngữ cảnh dài. Một yêu cầu 900K-token có chi phí mỗi token tương đương với một yêu cầu 9K-token.
Nơi sử dụng Opus 4.7
Các trường hợp sử dụng mạnh mẽ
- Tác tử mã hóa tự trị: cấp độ nỗ lực
xhigh+ ngân sách tác vụ mang lại cho bạn khả năng kiểm soát chi tiết hành vi và chi phí của tác tử - Sử dụng máy tính: ánh xạ tọa độ pixel 1:1 và khả năng thị giác 3.75 MP giúp tương tác màn hình đáng tin cậy hơn đáng kể
- Xử lý tài liệu: phân tích .docx, .pptx và biểu đồ được cải thiện cho tự động hóa công việc tri thức
- Truy xuất ngữ cảnh dài: cửa sổ 1M token với giá tiêu chuẩn cho các cơ sở mã lớn, tài liệu pháp lý hoặc bài nghiên cứu
- Tác tử đa phiên: bộ nhớ dựa trên tệp tốt hơn cho các quy trình làm việc trải rộng nhiều cuộc hội thoại
Khi nào Opus 4.7 có thể quá mức cần thiết
- Các tác vụ hỏi đáp hoặc phân loại đơn giản: Haiku 4.5 ($1/$5 mỗi MTok) hoặc Sonnet 4.6 ($3/$15 mỗi MTok) mang lại kết quả tốt với chi phí chỉ bằng một phần nhỏ
- Các luồng chatbot độ trễ thấp: chi phí bổ sung của tư duy thích ứng và cấp độ nỗ lực cao làm tăng độ trễ
- Phân tích hàng loạt trên dữ liệu có cấu trúc: Batch API với Sonnet thường hiệu quả hơn về chi phí
Cách kiểm tra tích hợp Claude Opus 4.7 của bạn với Apidog
Việc chuyển đổi ID mô hình của bạn từ claude-opus-4-6 sang claude-opus-4-7 là phần dễ dàng. Phần khó hơn là xác thực rằng các lời nhắc, định nghĩa công cụ và xử lý lỗi hiện có của bạn vẫn hoạt động chính xác sau những thay đổi quan trọng.

Apidog giúp việc này trở nên đơn giản:
- Nhập lược đồ API của bạn. Đưa vào đặc tả OpenAPI của bạn hoặc tự định nghĩa các điểm cuối API Claude của bạn. Apidog tự động tạo các mẫu yêu cầu cho API Tin nhắn.
- Tạo các kịch bản kiểm thử. Thiết lập các cuộc hội thoại nhiều lượt để kiểm tra các mẫu sử dụng công cụ cụ thể của bạn. Apidog cho phép bạn nối tiếp các yêu cầu, truyền ngữ cảnh giữa các lượt và xác thực lược đồ phản hồi.
- So sánh các phiên bản mô hình. Chạy cùng các kịch bản kiểm thử với
claude-opus-4-6vàclaude-opus-4-7song song. Kiểm tra sự khác biệt về số lượng token, cấu trúc phản hồi và chất lượng đầu ra. - Xác thực các thay đổi quan trọng. Xác nhận rằng cấu hình
thinkingđã cập nhật của bạn hoạt động, rằng các tham số lấy mẫu đã bị loại bỏ không xuất hiện trở lại, và rằng bộ mã hóa token mới không vượt quá giới hạnmax_tokenscủa bạn. - Gỡ lỗi tải trọng sử dụng công cụ. Kiểm tra toàn bộ nội dung yêu cầu và phản hồi cho các cuộc hội thoại sử dụng công cụ nhiều lượt. Giao diện trực quan của Apidog giúp dễ dàng phát hiện kết quả công cụ bị lỗi hoặc tham chiếu
tool_use_idbị thiếu.
Danh sách kiểm tra di chuyển
Nếu bạn đang nâng cấp từ Opus 4.6:
- [ ] Cập nhật ID mô hình của bạn thành
claude-opus-4-7 - [ ] Thay thế
thinking: {"type": "enabled", "budget_tokens": N}bằngthinking: {"type": "adaptive"} - [ ] Xóa các tham số
temperature,top_pvàtop_k(hoặc đặt về mặc định) - [ ] Nếu truyền tải suy nghĩ cho người dùng, hãy thêm
display: "summarized"vào cấu hình tư duy của bạn - [ ] Tăng giới hạn
max_tokensđể tính đến bộ mã hóa token mới (tối đa 35% nhiều token hơn) - [ ] Kiểm tra bộ nhớ đệm lời nhắc — số lượng token sẽ khác
- [ ] Xóa khung lời nhắc cho các hành vi mà Opus 4.7 xử lý tự nhiên (cập nhật trạng thái, tự kiểm tra)
- [ ] Chạy bộ kiểm thử của bạn với Apidog để xác thực hành vi đầu cuối
Kết luận
Claude Opus 4.7 là mô hình mạnh nhất của Anthropic được phát hành rộng rãi. Khả năng thị giác độ phân giải cao, ngân sách tác vụ và cấp độ nỗ lực `xhigh` đẩy nó xa hơn vào lãnh thổ tác tử tự trị. Những thay đổi quan trọng (không còn ngân sách tư duy mở rộng, không có tham số lấy mẫu) yêu cầu cập nhật mã, nhưng lộ trình di chuyển đã rõ ràng.
Bộ mã hóa token mới là yếu tố chi phí chính cần cân nhắc. Giá mỗi token không đổi, nhưng cùng một lời nhắc có thể tốn kém hơn do số lượng token cao hơn. Hãy kiểm tra khối lượng công việc của bạn trước khi chuyển sang lưu lượng truy cập sản xuất.
Đối với các nhà phát triển xây dựng tích hợp API, Apidog cung cấp môi trường kiểm thử và gỡ lỗi mà bạn cần để xác thực việc di chuyển và so sánh hiệu suất mô hình giữa các phiên bản.
