Claude Opus 4.7 Là Gì? Tính Năng, Đánh Giá, Giá Cả & Mọi Điều Bạn Cần Biết

TL;DR

Claude Opus 4.7 là mô hình có năng lực nhất của Anthropic được phát hành rộng rãi, ra mắt vào ngày 16 tháng 4 năm 2026. Nó giới thiệu tính năng thị giác độ phân giải cao (lên đến 3.75 megapixel), một cấp độ nỗ lực mới `xhigh`, ngân sách tác vụ cho các vòng lặp tác tử, và một công cụ mã hóa mới. Nó vẫn giữ cửa sổ ngữ cảnh 1 triệu token và mức giá $5/$25 cho mỗi triệu token từ Opus 4.6 nhưng đi kèm với một số thay đổi API quan trọng, bao gồm việc loại bỏ ngân sách tư duy mở rộng và các tham số lấy mẫu.

Giới thiệu

Anthropic đã phát hành Claude Opus 4.7 vào ngày 16 tháng 4 năm 2026. Nó thay thế Opus 4.6 trở thành mô hình hàng đầu trong dòng sản phẩm Claude và nhắm đến các nhà phát triển xây dựng tác tử tự trị, trợ lý công việc tri thức và các ứng dụng nặng về thị giác.

Bản phát hành này quan trọng vì ba lý do. Thứ nhất, đây là mô hình Claude đầu tiên hỗ trợ hình ảnh độ phân giải cao, tăng ngân sách pixel từ 1.15 MP lên hơn gấp ba lần thành 3.75 MP. Thứ hai, nó giới thiệu ngân sách tác vụ, một cách để cấp cho mô hình một lượng token cho toàn bộ một vòng lặp tác tử thay vì chỉ một lượt. Thứ ba, nó đi kèm với những thay đổi quan trọng yêu cầu cập nhật mã nếu bạn đang di chuyển từ Opus 4.6.

💡

Hướng dẫn này trình bày những gì Opus 4.7 có thể làm, cách nó so sánh với phiên bản tiền nhiệm, chi phí của nó và những gì bạn cần thay đổi nếu đang nâng cấp. Bạn cũng sẽ thấy cách kiểm tra tích hợp API Claude của mình với Apidog, công cụ xử lý định dạng hội thoại nhiều lượt và các tải trọng sử dụng công cụ mà Opus 4.7 vượt trội.

button

Thông số kỹ thuật cốt lõi

Thông số	Giá trị
ID mô hình API	`claude-opus-4-7`
Cửa sổ ngữ cảnh	1,000,000 token
Số token đầu ra tối đa	128,000 token
Giá đầu vào	$5 cho mỗi triệu token
Giá đầu ra	$25 cho mỗi triệu token
Giá đầu vào hàng loạt	$2.50 cho mỗi triệu token
Giá đầu ra hàng loạt	$12.50 cho mỗi triệu token
Giá đọc bộ nhớ đệm	$0.50 cho mỗi triệu token
Ghi bộ nhớ đệm 5 phút	$6.25 cho mỗi triệu token
Ghi bộ nhớ đệm 1 giờ	$10 cho mỗi triệu token
Ngày phát hành	16 tháng 4 năm 2026
Khả dụng trên	Claude API, Amazon Bedrock, Google Vertex AI, Microsoft Foundry

Opus 4.7 sử dụng một công cụ mã hóa token mới có thể tạo ra nhiều hơn tới 35% token cho cùng một văn bản so với Opus 4.6. Giá mỗi token không thay đổi, nhưng chi phí thực tế của bạn cho mỗi yêu cầu có thể tăng lên tùy thuộc vào nội dung.

Có gì mới trong Claude Opus 4.7

Hỗ trợ hình ảnh độ phân giải cao

Đây là điểm bổ sung nổi bật. Các mô hình Claude trước đây giới hạn đầu vào hình ảnh ở 1,568 pixel ở cạnh dài (khoảng 1.15 megapixel). Opus 4.7 nâng mức này lên 2,576 pixel ở cạnh dài (khoảng 3.75 megapixel).

Tác động thực tế: ảnh chụp màn hình, bản phác thảo thiết kế, tài liệu và ảnh chụp hiển thị với độ chân thực cao hơn nhiều. Ánh xạ tọa độ hiện là 1:1 với các pixel thực tế, loại bỏ phép toán hệ số tỷ lệ mà các quy trình làm việc sử dụng máy tính trước đây yêu cầu.

Opus 4.7 cũng cải thiện các tác vụ phụ về thị giác cụ thể:

Nhận thức cấp thấp: các tác vụ chỉ, đo lường và đếm chính xác hơn
Định vị hình ảnh: phát hiện hộp giới hạn và định vị hình ảnh tự nhiên cho thấy những cải thiện rõ rệt

Độ phân giải cao hơn có nghĩa là nhiều token hơn cho mỗi hình ảnh. Nếu trường hợp sử dụng của bạn không cần độ chân thực bổ sung, hãy giảm mẫu hình ảnh trước khi gửi để tiết kiệm chi phí.

Cấp độ nỗ lực `xhigh` mới

Tham số nỗ lực kiểm soát mức độ suy luận mà Claude đầu tư vào một phản hồi. Opus 4.7 bổ sung `xhigh` trên các cấp độ `high`, `medium` và `low` hiện có.

Sử dụng `xhigh` cho các tác vụ mã hóa và tác tử mà chất lượng quan trọng hơn độ trễ. Ở cấp độ này, mô hình dành nhiều token hơn đáng kể cho suy luận nội bộ, dẫn đến đầu ra tốt hơn cho các vấn đề phức tạp. Sử dụng `high` làm mức tối thiểu cho các công việc nhạy cảm về trí tuệ. Các cấp độ thấp hơn đánh đổi độ chính xác để lấy tốc độ và tiết kiệm chi phí.

Ngân sách tác vụ (Beta)

Ngân sách tác vụ giải quyết một vấn đề mà bất kỳ ai xây dựng tác tử đều gặp phải: làm thế nào để ngăn một vòng lặp tác tử nhiều lượt tiêu thụ một số lượng token không giới hạn?

Với ngân sách tác vụ, bạn cung cấp cho Claude một mục tiêu token gần đúng cho toàn bộ vòng lặp, bao gồm suy nghĩ, gọi công cụ, kết quả công cụ và đầu ra cuối cùng. Mô hình sẽ thấy một bộ đếm ngược đang chạy và sử dụng nó để ưu tiên công việc, bỏ qua các bước ít giá trị và kết thúc một cách hợp lý khi ngân sách cạn kiệt.

Các chi tiết chính:

Ngân sách tác vụ tối thiểu là 20,000 token
Đây là khuyến nghị, không phải giới hạn cứng. Claude cố gắng tuân thủ nhưng có thể vượt quá
Nó khác với max_tokens, vốn là một giới hạn cứng cho mỗi yêu cầu mà mô hình không thấy
Yêu cầu tiêu đề beta task-budgets-2026-03-13

Đối với các tác vụ tác tử mở mà chất lượng là quan trọng nhất, hãy bỏ qua ngân sách tác vụ và để mô hình chạy. Chỉ dành ngân sách tác vụ cho các khối lượng công việc mà bạn cần kiểm soát tổng chi tiêu.

Tư duy thích ứng là chế độ tư duy duy nhất

Chế độ tư duy mở rộng (nơi bạn đặt `budget_tokens` cố định) đã bị loại bỏ. Cố gắng đặt `thinking: {"type": "enabled", "budget_tokens": N}` sẽ trả về lỗi 400.

Tư duy thích ứng là chế độ tư duy duy nhất. Trong các đánh giá nội bộ của Anthropic, nó liên tục vượt trội hơn phương pháp ngân sách cố định vì mô hình phân bổ token suy luận một cách linh hoạt dựa trên độ khó của tác vụ.

Quan trọng: tư duy thích ứng **mặc định bị tắt**. Bạn phải đặt rõ ràng `thinking: {"type": "adaptive"}` để bật nó.

Theo mặc định, nội dung suy nghĩ cũng bị bỏ qua khỏi các phản hồi. Nếu bạn cần xem quá trình suy luận của mô hình (ví dụ: để truyền tải tiến độ cho người dùng), hãy đặt `display: "summarized"` trong cấu hình tư duy.

Cải thiện bộ nhớ

Opus 4.7 tốt hơn trong việc ghi và đọc từ bộ nhớ dựa trên hệ thống tệp. Nếu tác tử của bạn duy trì một bảng nháp, tệp ghi chú hoặc kho lưu trữ bộ nhớ có cấu trúc qua các lượt, nó sẽ thực hiện tốt hơn việc cập nhật và tham chiếu các ghi chú đó.

Điều này quan trọng đối với các tác tử mã hóa chạy dài, trợ lý nghiên cứu và bất kỳ quy trình làm việc nào mà ngữ cảnh được duy trì qua các phiên.

Cải thiện công việc tri thức

Những cải thiện cụ thể đối với các tác vụ tri thức thực tế:

Chỉnh sửa tài liệu: tốt hơn trong việc tạo và tự kiểm tra các thay đổi được theo dõi trong tệp .docx
Chỉnh sửa slide: độ chính xác được cải thiện khi tạo và xác thực bố cục .pptx
Phân tích biểu đồ: tốt hơn trong việc sử dụng các thư viện xử lý hình ảnh (như PIL) để phân tích biểu đồ ở cấp độ pixel và chuyển đổi dữ liệu từ hình ảnh

Những thay đổi so với Opus 4.6

Những thay đổi API quan trọng

Những thay đổi này áp dụng cho API Tin nhắn. Nếu bạn sử dụng Claude Managed Agents, không có thay đổi quan trọng nào.

Thay đổi	Trước đây (Opus 4.6)	Sau này (Opus 4.7)
Tư duy mở rộng	`thinking: {"type": "enabled", "budget_tokens": 32000}`	Phải sử dụng `thinking: {"type": "adaptive"}`
Tham số lấy mẫu	`temperature`, `top_p`, `top_k` được chấp nhận	Các giá trị không phải mặc định trả về lỗi 400
Hiển thị tư duy	Nội dung tư duy được bao gồm theo mặc định	Bị bỏ qua theo mặc định; chọn tham gia với `display: "summarized"`
Bộ mã hóa token	Bộ mã hóa token tiêu chuẩn	Bộ mã hóa token mới (tối đa 35% nhiều token hơn cho cùng một văn bản)

Thay đổi hành vi

Những thay đổi này không làm hỏng API nhưng có thể ảnh hưởng đến các lời nhắc của bạn:

Tuân thủ hướng dẫn theo nghĩa đen hơn. Mô hình sẽ không tự động khái quát hóa hướng dẫn từ mục này sang mục khác
Độ dài phản hồi tương ứng với độ phức tạp của tác vụ thay vì mặc định một độ dài cố định
Ít lời gọi công cụ hơn theo mặc định, ưu tiên suy luận hơn hành động. Nâng cao nỗ lực để tăng cường sử dụng công cụ
Giọng điệu trực tiếp, quyết đoán hơn với ít biểu tượng cảm xúc và ít cách diễn đạt theo kiểu xác nhận
Ít tác tử phụ được tạo ra theo mặc định trong các quy trình làm việc tác tử

Nếu bạn đã xây dựng khung lời nhắc để buộc Claude thực hiện các hành vi cụ thể (như “kiểm tra lại bố cục slide” hoặc “cung cấp cập nhật trạng thái”), hãy thử loại bỏ nó. Opus 4.7 xử lý nhiều mẫu này một cách tự nhiên.

Chi tiết giá

Opus 4.7 duy trì mức giá mỗi token tương tự như Opus 4.6 và 4.5:

Loại sử dụng	Chi phí
Đầu vào tiêu chuẩn	$5 / MTok
Đầu ra tiêu chuẩn	$25 / MTok
Đầu vào hàng loạt	$2.50 / MTok
Đầu ra hàng loạt	$12.50 / MTok
Đọc bộ nhớ đệm	$0.50 / MTok
Ghi bộ nhớ đệm 5 phút	$6.25 / MTok
Ghi bộ nhớ đệm 1 giờ	$10 / MTok
Đầu vào chế độ nhanh (chỉ Opus 4.6)	$30 / MTok
Lưu trữ dữ liệu tại Hoa Kỳ	Hệ số nhân 1.1x

Bộ mã hóa token mới là biến số chi phí cần theo dõi. Bởi vì nó có thể tạo ra nhiều hơn tới 35% token cho cùng một văn bản đầu vào, chi phí thực tế của bạn cho mỗi yêu cầu có thể tăng lên mặc dù giá mỗi token không thay đổi. Hãy kiểm tra bằng điểm cuối `/v1/messages/count_tokens` để đo lường tác động đến các lời nhắc cụ thể của bạn.

Cửa sổ ngữ cảnh 1M không có phí cao cấp cho ngữ cảnh dài. Một yêu cầu 900K-token có chi phí mỗi token tương đương với một yêu cầu 9K-token.

Nơi sử dụng Opus 4.7

Các trường hợp sử dụng mạnh mẽ

Tác tử mã hóa tự trị: cấp độ nỗ lực xhigh + ngân sách tác vụ mang lại cho bạn khả năng kiểm soát chi tiết hành vi và chi phí của tác tử
Sử dụng máy tính: ánh xạ tọa độ pixel 1:1 và khả năng thị giác 3.75 MP giúp tương tác màn hình đáng tin cậy hơn đáng kể
Xử lý tài liệu: phân tích .docx, .pptx và biểu đồ được cải thiện cho tự động hóa công việc tri thức
Truy xuất ngữ cảnh dài: cửa sổ 1M token với giá tiêu chuẩn cho các cơ sở mã lớn, tài liệu pháp lý hoặc bài nghiên cứu
Tác tử đa phiên: bộ nhớ dựa trên tệp tốt hơn cho các quy trình làm việc trải rộng nhiều cuộc hội thoại

Khi nào Opus 4.7 có thể quá mức cần thiết

Các tác vụ hỏi đáp hoặc phân loại đơn giản: Haiku 4.5 ($1/$5 mỗi MTok) hoặc Sonnet 4.6 ($3/$15 mỗi MTok) mang lại kết quả tốt với chi phí chỉ bằng một phần nhỏ
Các luồng chatbot độ trễ thấp: chi phí bổ sung của tư duy thích ứng và cấp độ nỗ lực cao làm tăng độ trễ
Phân tích hàng loạt trên dữ liệu có cấu trúc: Batch API với Sonnet thường hiệu quả hơn về chi phí

Cách kiểm tra tích hợp Claude Opus 4.7 của bạn với Apidog

Việc chuyển đổi ID mô hình của bạn từ claude-opus-4-6 sang claude-opus-4-7 là phần dễ dàng. Phần khó hơn là xác thực rằng các lời nhắc, định nghĩa công cụ và xử lý lỗi hiện có của bạn vẫn hoạt động chính xác sau những thay đổi quan trọng.

Apidog giúp việc này trở nên đơn giản:

Nhập lược đồ API của bạn. Đưa vào đặc tả OpenAPI của bạn hoặc tự định nghĩa các điểm cuối API Claude của bạn. Apidog tự động tạo các mẫu yêu cầu cho API Tin nhắn.
Tạo các kịch bản kiểm thử. Thiết lập các cuộc hội thoại nhiều lượt để kiểm tra các mẫu sử dụng công cụ cụ thể của bạn. Apidog cho phép bạn nối tiếp các yêu cầu, truyền ngữ cảnh giữa các lượt và xác thực lược đồ phản hồi.
So sánh các phiên bản mô hình. Chạy cùng các kịch bản kiểm thử với claude-opus-4-6 và claude-opus-4-7 song song. Kiểm tra sự khác biệt về số lượng token, cấu trúc phản hồi và chất lượng đầu ra.
Xác thực các thay đổi quan trọng. Xác nhận rằng cấu hình thinking đã cập nhật của bạn hoạt động, rằng các tham số lấy mẫu đã bị loại bỏ không xuất hiện trở lại, và rằng bộ mã hóa token mới không vượt quá giới hạn max_tokens của bạn.
Gỡ lỗi tải trọng sử dụng công cụ. Kiểm tra toàn bộ nội dung yêu cầu và phản hồi cho các cuộc hội thoại sử dụng công cụ nhiều lượt. Giao diện trực quan của Apidog giúp dễ dàng phát hiện kết quả công cụ bị lỗi hoặc tham chiếu tool_use_id bị thiếu.

Danh sách kiểm tra di chuyển

Nếu bạn đang nâng cấp từ Opus 4.6:

[ ] Cập nhật ID mô hình của bạn thành claude-opus-4-7
[ ] Thay thế thinking: {"type": "enabled", "budget_tokens": N} bằng thinking: {"type": "adaptive"}
[ ] Xóa các tham số temperature, top_p và top_k (hoặc đặt về mặc định)
[ ] Nếu truyền tải suy nghĩ cho người dùng, hãy thêm display: "summarized" vào cấu hình tư duy của bạn
[ ] Tăng giới hạn max_tokens để tính đến bộ mã hóa token mới (tối đa 35% nhiều token hơn)
[ ] Kiểm tra bộ nhớ đệm lời nhắc — số lượng token sẽ khác
[ ] Xóa khung lời nhắc cho các hành vi mà Opus 4.7 xử lý tự nhiên (cập nhật trạng thái, tự kiểm tra)
[ ] Chạy bộ kiểm thử của bạn với Apidog để xác thực hành vi đầu cuối

Kết luận

Claude Opus 4.7 là mô hình mạnh nhất của Anthropic được phát hành rộng rãi. Khả năng thị giác độ phân giải cao, ngân sách tác vụ và cấp độ nỗ lực `xhigh` đẩy nó xa hơn vào lãnh thổ tác tử tự trị. Những thay đổi quan trọng (không còn ngân sách tư duy mở rộng, không có tham số lấy mẫu) yêu cầu cập nhật mã, nhưng lộ trình di chuyển đã rõ ràng.

Bộ mã hóa token mới là yếu tố chi phí chính cần cân nhắc. Giá mỗi token không đổi, nhưng cùng một lời nhắc có thể tốn kém hơn do số lượng token cao hơn. Hãy kiểm tra khối lượng công việc của bạn trước khi chuyển sang lưu lượng truy cập sản xuất.

Đối với các nhà phát triển xây dựng tích hợp API, Apidog cung cấp môi trường kiểm thử và gỡ lỗi mà bạn cần để xác thực việc di chuyển và so sánh hiệu suất mô hình giữa các phiên bản.