Trong thời đại bùng nổ thông tin, khả năng thực hiện nghiên cứu nhanh chóng, chính xác và toàn diện là một siêu năng lực. Các nhà phát triển, nhà phân tích và nhà chiến lược dành vô số giờ để sàng lọc tài liệu, xác minh nguồn và tổng hợp các phát hiện. Điều gì sẽ xảy ra nếu bạn có thể tự động hóa toàn bộ quy trình làm việc này? API Nghiên cứu Chuyên sâu của OpenAI là một bước tiến đáng kể theo hướng đó, cung cấp một công cụ mạnh mẽ để biến các câu hỏi cấp cao thành các báo cáo có cấu trúc, giàu trích dẫn.
API Nghiên cứu Chuyên sâu không chỉ là một mô hình ngôn ngữ lớn khác. Đây là một hệ thống tác nhân được thiết kế để xử lý các tác vụ nghiên cứu phức tạp. Nó có thể tự động phân tích một truy vấn, thực hiện tìm kiếm trên web, thực thi mã để phân tích dữ liệu và tổng hợp kết quả thành một báo cáo mạch lạc, có thể kiểm chứng. Nó được xây dựng để có chiều sâu, sự tinh tế và độ tin cậy, cung cấp không chỉ câu trả lời mà còn cả bằng chứng đằng sau chúng.
Hướng dẫn này sẽ cung cấp một hướng dẫn chuyên sâu dành cho nhà phát triển về API Nghiên cứu Chuyên sâu. Chúng tôi sẽ đề cập đến mọi thứ từ việc thực hiện lệnh gọi API đầu tiên của bạn đến các kỹ thuật nhắc nâng cao. Chúng tôi sẽ chủ yếu tập trung vào hai mô hình có sẵn thông qua API:
o3-deep-research-2025-06-26
: Mô hình chủ lực, được tối ưu hóa để tổng hợp chất lượng cao nhất và phân tích chuyên sâu.o4-mini-deep-research-2025-06-26
: Một mô hình nhẹ hơn, nhanh hơn, hoàn hảo cho các ứng dụng nhạy cảm về độ trễ.
Đến cuối bài viết này, bạn sẽ có hiểu biết vững chắc về cách tích hợp tác nhân nghiên cứu mạnh mẽ này vào các ứng dụng của riêng bạn.
Bạn muốn một nền tảng tích hợp, tất cả trong một để Nhóm phát triển của bạn làm việc cùng nhau với năng suất tối đa?
Apidog đáp ứng mọi yêu cầu của bạn và thay thế Postman với mức giá phải chăng hơn nhiều!
button
Giá API Nghiên cứu Chuyên sâu của OpenAI, Giới hạn Tốc độ

Việc chọn mô hình phù hợp và hiểu rõ chi phí là rất quan trọng đối với các ứng dụng sản xuất.
Chọn Mô hình của Bạn
o3-deep-research
: Đây là lựa chọn hàng đầu của bạn cho các tác vụ phức tạp đòi hỏi mức độ suy luận và tổng hợp cao nhất. Nó chậm hơn nhưng mang lại chất lượng vượt trội.o4-mini-deep-research
: Sử dụng mô hình này khi tốc độ là ưu tiên hàng đầu. Nó lý tưởng cho các tác vụ nghiên cứu đơn giản hơn hoặc các ứng dụng tương tác mà độ trễ thấp là yếu tố then chốt.
Tìm hiểu về Chi phí
Tính đến cuối năm 2024, giá của mô hình `o3-deep-research` mạnh mẽ dựa trên token:
- Đầu vào: 10,00 USD cho mỗi 1 triệu token
- Đầu ra: 40,00 USD cho mỗi 1 triệu token
Chi phí cao hơn cho các token đầu ra phản ánh công việc tổng hợp và tạo ra dữ liệu chuyên sâu mà mô hình thực hiện.
Thông số kỹ thuật chính (o3-deep-research
)
- Cửa sổ ngữ cảnh: 200.000 token khổng lồ.
- Token đầu ra tối đa: 100.000 token hào phóng, cho phép tạo các báo cáo rất dài.
- Thời điểm cắt kiến thức: Ngày 01 tháng 6 năm 2024. Kiến thức nội bộ của mô hình được cập nhật đến ngày này, nhưng công cụ `web_search_preview` cung cấp cho nó quyền truy cập thông tin thời gian thực.
Thực hiện Lệnh gọi API Nghiên cứu Chuyên sâu của OpenAI Đầu tiên của Bạn
Hãy bắt đầu ngay. Trước khi có thể sử dụng API, bạn sẽ cần SDK Python của OpenAI.
Thiết lập
Nếu bạn chưa cài đặt, hãy cài đặt phiên bản mới nhất của thư viện:
pip install --upgrade openai
Tiếp theo, bạn sẽ cần xác thực. Nhập client `OpenAI` và khởi tạo nó bằng khóa API của bạn.
from openai import OpenAI
import os
# It's best practice to use an environment variable for your API key
client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))
Thực hiện Yêu cầu
Một tác vụ Nghiên cứu Chuyên sâu có thể mất vài phút để hoàn thành, đặc biệt đối với các truy vấn phức tạp. Để tránh hết thời gian chờ, bạn nên chạy các yêu cầu ở chế độ nền. API giúp việc này trở nên dễ dàng.
Hãy tưởng tượng chúng ta đang xây dựng một công cụ cho một công ty dịch vụ tài chính chăm sóc sức khỏe. Nhiệm vụ là tạo ra một báo cáo về tác động kinh tế của các loại thuốc trị tiểu đường và béo phì mới. Đây là cách bạn sẽ cấu trúc yêu cầu đó:
system_message = """
You are a professional researcher preparing a structured, data-driven report on behalf of a global health economics team. Your task is to analyze the health question the user poses.
Do:
- Focus on data-rich insights: include specific figures, trends, statistics, and measurable outcomes.
- When appropriate, summarize data in a way that could be turned into charts or tables.
- Prioritize reliable, up-to-date sources: peer-reviewed research, health organizations (e.g., WHO, CDC), etc.
- Include inline citations and return all source metadata.
Be analytical, avoid generalities, and ensure that each section supports data-backed reasoning.
"""
user_query = "Research the economic impact of semaglutide on global healthcare systems."
response = client.responses.create(
model="o3-deep-research", # Or "o3-deep-research-2025-06-26"
input=[
{
"role": "developer",
"content": [
{
"type": "input_text",
"text": system_message,
}
]
},
{
"role": "user",
"content": [
{
"type": "input_text",
"text": user_query,
}
]
}
],
reasoning={
"summary": "auto"
},
tools=[
{
"type": "web_search_preview"
},
{
"type": "code_interpreter"
}
]
)
Hãy cùng phân tích lệnh gọi này:
- `model`: Chúng tôi chỉ định `o3-deep-research` cho một báo cáo chất lượng cao.
- `input`: Đây là nơi chúng tôi cung cấp các lời nhắc của mình. `system_message` thiết lập tính cách và mục tiêu tổng thể cho tác nhân. `user_query` là tác vụ nghiên cứu cụ thể.
- `reasoning`: Đặt `summary` thành `"auto"` cho phép mô hình tạo ra bản tóm tắt tốt nhất có thể cho báo cáo. Đối với các báo cáo chi tiết hơn, bạn có thể đặt thành `"detailed"`.
- `tools`: Mảng này cho tác nhân biết nó có những công cụ nào theo ý mình. `web_search_preview` là bắt buộc để nó duyệt web. `code_interpreter` là tùy chọn nhưng cho phép tác nhân chạy mã Python để phân tích và trực quan hóa dữ liệu.
Sức mạnh thực sự của API Nghiên cứu Chuyên sâu nằm ở đối tượng phản hồi có cấu trúc, chi tiết mà nó trả về. Nó không chỉ là một khối văn bản; nó là một bản ghi minh bạch về quá trình nghiên cứu.
Báo cáo Cuối cùng
Đầu ra chính, tất nhiên, là báo cáo cuối cùng. Bạn có thể truy cập nó từ mục cuối cùng trong mảng `output`:
# Access the final report from the response object
print(response.output[-1].content[0].text)
Điều này sẽ cung cấp cho bạn văn bản hoàn chỉnh, được tổng hợp do mô hình tạo ra.
Trích dẫn và Nguồn
Một trong những tính năng quan trọng nhất đối với bất kỳ nghiên cứu nghiêm túc nào là trích dẫn. API Nghiên cứu Chuyên sâu nhúng siêu dữ liệu trích dẫn trực tiếp vào phản hồi. Mỗi trích dẫn được liên kết với một phần cụ thể của văn bản, cho phép dễ dàng xác minh.
Dưới đây là cách bạn có thể trích xuất và hiển thị các trích dẫn:
annotations = response.output[-1].content[0].annotations
for i, citation in enumerate(annotations):
print(f"Citation {i+1}:")
print(f" Title: {citation.title}")
print(f" URL: {citation.url}")
print(f" Location: chars {citation.start_index}–{citation.end_index}")
Cấu trúc này vô cùng giá trị để xây dựng các ứng dụng yêu cầu mức độ tin cậy và minh bạch cao. Bạn có thể sử dụng nó để tạo chú thích có thể nhấp, xây dựng thư mục tham khảo hoặc truy xuất nguồn gốc các tuyên bố về nguồn gốc của chúng một cách có lập trình.
Nhìn sâu vào bên trong: Các bước trung gian
API cũng tiết lộ toàn bộ quá trình tư duy của tác nhân. `response.output` chứa nhật ký tất cả các bước trung gian được thực hiện để đi đến câu trả lời cuối cùng. Điều này cực kỳ hữu ích để gỡ lỗi, phân tích hoặc đơn giản là hiểu cách tác nhân hoạt động.
- Các bước suy luận: Đây là các kế hoạch và tóm tắt nội bộ của mô hình khi nó phân tích vấn đề.
reasoning = next(item for item in response.output if item.type == "reasoning")
for s in reasoning.summary:
print(s.text)
- Lệnh gọi tìm kiếm trên web: Bạn có thể xem các truy vấn tìm kiếm chính xác mà tác nhân đã sử dụng.
search = next(item for item in response.output if item.type == "web_search_call")
print("Query:", search.action["query"])
- Thực thi mã: Nếu công cụ `code_interpreter` được sử dụng, bạn có thể kiểm tra mã nó đã chạy và kết quả đầu ra.
code_step = next((item for item in response.output if item.type == "code_interpreter_call"), None)
if code_step:
print("Code Input:", code_step.input)
print("Code Output:", code_step.output)
Sử dụng Nghiên cứu Chuyên sâu của OpenAI với Máy chủ MCP
Nghiên cứu nâng cao với Máy chủ MCP
Trong khi tìm kiếm trên web cung cấp cho tác nhân Nghiên cứu Chuyên sâu quyền truy cập vào một kho lưu trữ thông tin công cộng rộng lớn, sức mạnh thực sự của nó được mở khóa khi bạn kết nối nó với dữ liệu riêng tư của mình.
Đây là lúc Giao thức Ngữ cảnh Mô hình (MCP) phát huy tác dụng. MCP cho phép bạn xây dựng các công cụ tùy chỉnh mở rộng khả năng của tác nhân, cho phép nó truy vấn các cơ sở kiến thức nội bộ, cơ sở dữ liệu hoặc các dịch vụ độc quyền khác của bạn.
Một trong những Máy chủ MCP phổ biến hiện nay là Máy chủ MCP của Apidog, cho phép bạn kết nối với Tài liệu API của mình trong Cursor và các công cụ Mã hóa AI khác, đồng thời giảm đáng kể ảo giác AI bằng cách lấy dữ liệu từ Thông số kỹ thuật API thực tế.
button
Kết luận: Tương lai của Nghiên cứu Tự động
API Nghiên cứu Chuyên sâu của OpenAI không chỉ là một cải tiến nhỏ. Nó đại diện cho một sự thay đổi cơ bản trong cách chúng ta có thể tận dụng AI cho công việc tri thức. Bằng cách cung cấp một tác nhân có thể suy luận, lập kế hoạch, thực thi công cụ và tạo ra kết quả có thể kiểm chứng, OpenAI đã tạo ra một khối xây dựng cho một thế hệ ứng dụng nghiên cứu mới.
Cho dù bạn đang xây dựng bảng điều khiển tình báo cạnh tranh, tự động hóa các đánh giá tài liệu hay tạo các báo cáo phân tích thị trường tinh vi, API Nghiên cứu Chuyên sâu cung cấp sức mạnh, sự minh bạch và độ tin cậy cần thiết cho các trường hợp sử dụng nghiêm túc, thực tế. Như cuốn sách hướng dẫn gợi ý, bước tiếp theo có thể là "Tác nhân nghiên cứu chuyên sâu" hoàn chỉnh, cho thấy một tương lai tự chủ và có khả năng hơn nữa. Hiện tại, API mang đến cho các nhà phát triển một công cụ mới đáng kinh ngạc để khám phá. Hãy bắt đầu xây dựng với nó ngay hôm nay.