GPT-5.5 của OpenAI đi kèm với API trả phí: 5 đô la cho mỗi triệu token đầu vào, 30 đô la cho mỗi triệu token đầu ra. Đối với một dự án phụ, một bản dựng hackathon hoặc một ứng dụng công cộng miễn phí, hóa đơn đó sẽ chặn công việc trước khi nó bắt đầu. Có một giải pháp thay thế về cấu trúc: Puter.js cung cấp toàn bộ danh mục OpenAI (GPT-5.5, GPT-5.5 Pro, mọi biến thể GPT-5.x, GPT-Image-2, DALL-E, OpenAI TTS) mà không cần khóa OpenAI, và tính phí người dùng cuối thay vì bạn. Đối với nhà phát triển, giao diện này miễn phí và không giới hạn.
TÓM TẮT
- Puter.js cung cấp cho nhà phát triển quyền truy cập miễn phí, không giới hạn vào toàn bộ danh mục mô hình OpenAI mà không cần khóa API, không cần tài khoản OpenAI, không cần máy chủ.
- Các mô hình văn bản được hỗ trợ bao gồm gpt-5.5, gpt-5.5-pro, gpt-5.4, gpt-5, gpt-5-mini, o1, o3, gpt-4.1, gpt-4o, cùng với mọi biến thể trò chuyện và codex.
- Hình ảnh: gpt-image-2, gpt-image-1.5, dall-e-3. TTS (Chuyển văn bản thành giọng nói): gpt-4o-mini-tts, tts-1, tts-1-hd.
- Một thẻ
<script>, một lệnh gọi hàm (puter.ai.chat), và bạn đã có thể trò chuyện với GPT-5.5. - Phát trực tuyến, gọi hàm, đầu vào thị giác, tạo hình ảnh và chuyển văn bản thành giọng nói đều hoạt động trong trình duyệt.
- Người dùng cuối thanh toán chi phí sử dụng của họ từ tài khoản Puter; bạn không phải trả gì, mãi mãi.
- Sử dụng Apidog để đánh giá cùng một lời nhắc giữa Puter và API OpenAI chính thức cho việc lập kế hoạch di chuyển.
Cách thức hoạt động của “miễn phí không giới hạn”
Puter.js thay đổi mô hình thanh toán LLM. Thay vì bạn nắm giữ khóa OpenAI và chịu mọi chi phí token, người dùng cuối của bạn đăng nhập vào Puter (tài khoản miễn phí) và lệnh gọi sẽ được tính vào số dư của họ. Tài khoản Puter mới nhận được tín dụng khởi đầu; người dùng nạp thêm nếu muốn.
Đối với nhà phát triển, có ba điều sau đây:
- Không cần tài khoản OpenAI, không có khóa trong kho lưu trữ của bạn. Không rủi ro rò rỉ, không xoay vòng, không quản lý khóa theo phạm vi dự án.
- Không có giới hạn sử dụng từ phía bạn. Mọi người dùng đều sử dụng tài khoản của riêng họ, vì vậy "giới hạn" của bạn mở rộng tuyến tính với cơ sở người dùng của bạn.
- Không lộ thông tin thanh toán. Bạn sẽ không bao giờ nhận được hóa đơn Stripe từ OpenAI; bạn không cần đàm phán các điều khoản doanh nghiệp.
Sự đánh đổi: đây là trình duyệt đầu tiên. Một script Node backend không thể sử dụng Puter nếu không có phiên người dùng đã đăng nhập. Đối với việc sử dụng backend, API OpenAI chính thức vẫn là lựa chọn đúng đắn.
Bước 1: Cài đặt
Một thẻ CDN, không cần bước xây dựng:
<script src="https://js.puter.com/v2/"></script>
Đó là toàn bộ quá trình cài đặt. Hoặc đối với một ứng dụng đóng gói:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
Phiên bản CDN hoạt động trong bất kỳ tệp HTML, bản mẫu hackathon, trang web tĩnh hoặc tiện ích mở rộng trình duyệt nào. Phiên bản NPM cung cấp cho bạn tính năng loại bỏ mã chết (tree-shaking) và các kiểu TypeScript.
Bước 2: Chọn một mô hình
Puter cung cấp toàn bộ dòng sản phẩm GPT-5.x cùng với các phiên bản cũ hơn. Danh sách rút gọn:
| ID mô hình | Khi nào nên dùng |
|---|---|
gpt-5.5-pro |
Suy luận sâu sắc nhất; các tác nhân lập trình, phân tích phức tạp |
gpt-5.5 |
Trình điều khiển hàng ngày mặc định; cân bằng tốt giữa chi phí/chất lượng |
gpt-5.4-nano |
Văn bản rẻ nhất, nhanh nhất; phân loại khối lượng lớn |
gpt-5.4-mini |
Trung cấp; tốt cho giao diện trò chuyện |
gpt-5.3-codex |
Các tác vụ cụ thể về mã |
o3 |
Chuỗi suy luận phức tạp |
o1-pro |
Lập kế hoạch nhiều bước tự động |
gpt-4.1, gpt-4o, gpt-4o-mini |
Ổn định, cơ sở được hiểu rõ |
Tạo hình ảnh:
gpt-image-2: mới nhất, đầu ra sắc nét, nhanh.gpt-image-1.5/gpt-image-1/dall-e-3/dall-e-2: cũ hơn nhưng ổn định.
Chuyển văn bản thành giọng nói:
gpt-4o-mini-tts: mới nhất, âm thanh tự nhiên nhất.tts-1,tts-1-hd: TTS cổ điển, độ trễ thấp hơn.
Bước 3: Làm cho GPT-5.5 nói chuyện
Lệnh gọi trò chuyện tối thiểu khả thi:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain WebSockets in three sentences",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
Mở trong trình duyệt. Puter xử lý cuộc gọi, người dùng đăng nhập (hoặc tạo tài khoản Puter miễn phí khi chạy lần đầu), và phản hồi sẽ được in ra trang. Không cần khóa API, không cần biến môi trường, không cần máy chủ.
Bước 4: Phát trực tuyến phản hồi
Đối với giao diện trò chuyện và các câu trả lời dài, phát trực tuyến là mặc định đúng đắn. Truyền stream: true và sử dụng iterator:
const response = await puter.ai.chat(
"Explain the theory of relativity in detail",
{ model: "gpt-5.5", stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
Mỗi part.text là một đoạn token. Thêm vào bong bóng UI của bạn; người dùng sẽ thấy văn bản xuất hiện từng chữ một.
Bước 5: Thị giác (đầu vào hình ảnh)
Truyền URL hình ảnh làm đối số thứ hai; mô hình đọc hình ảnh và trả lời lời nhắc về nó:
puter.ai.chat(
"What do you see in this image? Describe colors, objects, and mood.",
"https://assets.puter.site/doge.jpeg",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
Điều này hoạt động trên mọi mô hình GPT-5.x và các biến thể GPT-4o. Các trường hợp sử dụng: tạo văn bản thay thế (alt-text), QA hình ảnh, phân tích ảnh chụp màn hình, OCR, công cụ hỗ trợ tiếp cận.
Bước 6: Tạo hình ảnh
Hàm txt2img của Puter trả về một phần tử <img> với hình ảnh đã tạo được tải sẵn:
puter.ai.txt2img(
"A futuristic cityscape at night, cinematic, neon, rain",
{ model: "gpt-image-2" }
).then(imageElement => {
document.body.appendChild(imageElement);
});
Người dùng thanh toán chi phí tạo hình ảnh từ tài khoản Puter của họ (thường là vài xu cho mỗi hình ảnh). Đối với một trình tạo hình ảnh công khai miễn phí, đây là thiết lập sạch nhất hiện có.
Bước 7: Chuyển văn bản thành giọng nói
Dòng TTS của OpenAI được cung cấp thông qua txt2speech. Hàm này trả về một phần tử <audio> với giọng nói đã tạo:
puter.ai.txt2speech(
"Welcome back. Your account balance is $1,247.50.",
{ provider: "openai", model: "gpt-4o-mini-tts" }
).then(audio => {
audio.setAttribute("controls", "");
document.body.appendChild(audio);
});
Sử dụng nó cho các lời nhắc bằng giọng nói, lồng tiếng ứng dụng, lời giới thiệu podcast hoặc tường thuật hỗ trợ tiếp cận.
Bước 8: Gọi hàm
Định dạng OpenAI tiêu chuẩn. Khai báo các công cụ, mô hình phát ra một mảng tool_calls, bạn thực thi, bạn trả lời:
const tools = [{
type: "function",
function: {
name: "get_weather",
description: "Get the current weather for a city.",
parameters: {
type: "object",
properties: { city: { type: "string" } },
required: ["city"],
},
},
}];
const response = await puter.ai.chat(
"What's the weather in Tokyo right now?",
{ model: "gpt-5.5", tools }
);
const toolCalls = response.message.tool_calls;
if (toolCalls?.length) {
// Execute the function on your side, then reply with the result
console.log(toolCalls[0].function.name, toolCalls[0].function.arguments);
}
Cấu trúc gọi hàm giống như của OpenAI, vì vậy bất kỳ định nghĩa công cụ nào bạn có hiện nay đều có thể chuyển đổi trực tiếp. Để kiểm tra các luồng dựa trên công cụ trong môi trường cấp độ sản xuất, hãy xem kiểm thử máy chủ MCP trong Apidog.
Bước 9: Điều chỉnh nhiệt độ (temperature) và số token tối đa (max_tokens)
Truyền các tham số OpenAI tiêu chuẩn trong đối tượng tùy chọn:
const response = await puter.ai.chat(
"Tell me about Mars",
{
model: "gpt-5.5",
temperature: 0.2,
max_tokens: 200,
}
);
Nhiệt độ thấp hơn (0.0–0.3) cho các câu trả lời thực tế, cao hơn (0.7–1.0) cho văn bản sáng tạo. max_tokens giới hạn chi phí từ phía người dùng; hữu ích để giữ cho chi phí mỗi cuộc gọi có thể dự đoán được khi bạn phát hành một ứng dụng công khai.
Những gì bạn nhận được và những gì bạn không nhận được
Quyền truy cập GPT-5.5 miễn phí không giới hạn của Puter là thật, nhưng nó là một tập hợp con của giao diện API OpenAI chính thức. Sự phân chia rõ ràng:
Bạn nhận được:
- Toàn bộ danh mục GPT-5.x bao gồm 5.5, 5.5 Pro, 5.4 (mini, nano, pro), và mọi biến thể codex
- Tất cả các mô hình OpenAI cũ hơn (GPT-4.1, GPT-4o, o1, o3)
- GPT-Image-2 và DALL-E để tạo hình ảnh miễn phí
- Dòng TTS của OpenAI bao gồm gpt-4o-mini-tts
- Phát trực tuyến, thị giác, gọi hàm, kiểm soát nhiệt độ, max_tokens
Bạn có thể không nhận được:
- API Phản hồi (Puter sử dụng định dạng Chat Completions)
- Giảm chi phí bộ nhớ đệm lời nhắc
- API Tệp (ngữ cảnh tài liệu đã tải lên)
- Sử dụng phía máy chủ mà không có ngữ cảnh trình duyệt
- Tiêu đề giới hạn tốc độ trực tiếp từ OpenAI
- Chế độ đầu ra có cấu trúc và thực thi lược đồ JSON của OpenAI
Đối với các luồng cấp độ sản xuất chuyên sâu, API OpenAI chính thức là câu trả lời đúng. Đối với các ứng dụng trình duyệt, dự án phụ và công cụ công cộng, Puter là đủ.
Khi nào nên dùng Puter so với OpenAI chính thức
Sự phân chia:
Sử dụng Puter khi:
- Bạn đang phát hành một ứng dụng công khai miễn phí và không muốn lộ thông tin thanh toán.
- Bạn đang tạo bản mẫu và không muốn thiết lập quan hệ thanh toán với OpenAI.
- Bạn muốn truy cập OpenAI trong một trang web tĩnh, dự án hackathon hoặc tiện ích mở rộng trình duyệt mà không cần backend.
- Người dùng của bạn sẵn lòng đăng nhập vào Puter (hoặc đã sử dụng nó).
Sử dụng API OpenAI chính thức khi:
- Bạn cần các lệnh gọi phía máy chủ (cron jobs, xử lý webhook, xử lý hàng loạt).
- Bạn cần bộ nhớ đệm lời nhắc để tiết kiệm chi phí cho các lời nhắc hệ thống ổn định.
- Bạn cần API Phản hồi, Tệp hoặc đầu ra có cấu trúc đầy đủ.
- Bạn cần một mối quan hệ hợp đồng để tuân thủ (BAA, SOC 2, cư trú dữ liệu).
- Người dùng của bạn sẽ không chấp nhận bước đăng nhập Puter.
Hầu hết các dự án bắt đầu với Puter để tạo bản mẫu và di chuyển sang API chính thức khi họ đạt đến một trong các giới hạn trên. Việc di chuyển rất đơn giản; định dạng thông báo là như nhau.
Để thiết lập sản xuất trả phí, hãy xem Cách sử dụng API GPT-5.5.
Kiểm tra tích hợp trong Apidog
Các lệnh gọi của Puter xảy ra trong trình duyệt, vì vậy bạn không thể lập trình chúng từ một trình chạy thử nghiệm backend trực tiếp. Mô hình hoạt động như sau:
- Xây dựng một trang tĩnh nhỏ với script Puter và một tham số truy vấn cho lời nhắc.
- Sử dụng Apidog để xác thực giao diện API OpenAI thượng nguồn (khi bạn cuối cùng di chuyển).
- Giữ cả hai dưới dạng các môi trường riêng biệt trong cùng một bộ sưu tập Apidog để bạn có thể hoán đổi chỉ bằng một cú nhấp chuột.

Tải Apidog và thiết lập hai môi trường: puter-prototype (một URL localhost chứa trang Puter của bạn) và openai-prod (https://api.openai.com/v1). Bộ sưu tập sẽ được chuyển đổi một cách gọn gàng khi bạn hoàn thành. Để biết các mẫu kiểm thử API rộng hơn, hãy xem công cụ kiểm thử API dành cho kỹ sư QA.
CÁC CÂU HỎI THƯỜNG GẶP
Đây có thực sự không giới hạn, hay có giới hạn ẩn nào không?Không giới hạn từ phía nhà phát triển, vâng. Người dùng cuối có số dư trong tài khoản Puter của họ; tài khoản mới nhận được tín dụng khởi đầu và người dùng nạp thêm nếu muốn. Không có giới hạn cho mỗi nhà phát triển.
Tôi có cần tài khoản OpenAI không?Không. Puter xử lý mối quan hệ với OpenAI. Bạn sẽ không bao giờ thấy khóa OpenAI.
Tôi có thể sử dụng cái này trong môi trường sản xuất không?Có, đối với các ứng dụng dựa trên trình duyệt. Puter vận hành cơ sở hạ tầng sản xuất. Câu hỏi đúng đắn là liệu người dùng của bạn có sẵn lòng đăng nhập vào Puter hay không; nếu có, hãy triển khai nó.
GPT-5.5 thông qua Puter có hoạt động giống hệt với API chính thức không?Đầu ra của mô hình là như nhau; Puter gọi API OpenAI chính thức thay mặt người dùng. Độ trễ có thể cao hơn một chút do có thêm một bước trung gian, nhưng hành vi của mô hình không thay đổi.
Còn việc tiết kiệm từ bộ nhớ đệm lời nhắc thì sao?Puter hiện không cung cấp các điều khiển giá cho bộ nhớ đệm lời nhắc của OpenAI. Nếu bạn có một lời nhắc hệ thống ổn định 50k token và cần chiết khấu bộ nhớ đệm, hãy sử dụng API chính thức.
Tôi có thể sử dụng cái này trong dịch vụ backend không?Không thuận tiện. Puter ưu tiên trình duyệt và giả định có một phiên người dùng. Các dịch vụ backend nên sử dụng API OpenAI chính thức. Đối với các tùy chọn phía máy chủ miễn phí, hãy xem Cách sử dụng API GPT-5.5 miễn phí.
Tôi nên sử dụng mô hình nào làm mặc định?gpt-5.5 cho suy luận hàng ngày. gpt-5.4-nano cho phân loại khối lượng lớn. gpt-5.5-pro cho các tác vụ suy luận khó. o3 khi bạn cần chuỗi suy luận dài.
Người dùng của tôi có bị tính phí nhiều không?Hầu hết việc sử dụng theo kiểu trò chuyện chỉ tốn vài xu mỗi phiên theo tỷ giá của OpenAI. Một người dùng thông thường có thể thực hiện hàng chục cuộc trò chuyện với tín dụng khởi đầu của Puter trước khi họ cần nạp tiền. Tạo hình ảnh đắt hơn; hãy giới hạn max_tokens và tránh các lệnh gọi tạo không cần thiết.
Tôi có thể tạo hình ảnh miễn phí với Puter không?Có, thông qua txt2img với gpt-image-2 hoặc DALL-E. Người dùng thanh toán chi phí tạo hình ảnh từ số dư Puter của họ. Để biết hướng dẫn API trả phí chính thức, hãy xem Cách sử dụng API GPT-Image-2.
Tổng kết
Quyền truy cập GPT-5.5 miễn phí không giới hạn thông qua Puter.js là con đường sạch nhất cho bất kỳ ứng dụng dựa trên trình duyệt nào muốn có đầu ra chất lượng OpenAI mà không phải chịu chi phí thanh toán của OpenAI. Chỉ cần thêm script, chọn một mô hình, viết lời nhắc. Người dùng cuối thanh toán chi phí sử dụng; bạn triển khai mà không cần khóa.
Đối với các tác vụ phía máy chủ, bộ nhớ đệm lời nhắc, API Phản hồi hoặc đầu ra có cấu trúc đầy đủ, API OpenAI chính thức vẫn là câu trả lời đúng. Đối với các bản mẫu, bản dựng hackathon, ứng dụng công khai miễn phí và trang web tĩnh, Puter là câu trả lời.
Xây dựng yêu cầu một lần trong Apidog, đánh giá Puter so với API chính thức và chọn con đường phù hợp với hình thức của bạn.
