OpenAIs GPT-5.5 wird mit einer kostenpflichtigen API ausgeliefert: 5 US-Dollar pro Million Input-Tokens, 30 US-Dollar pro Million Output-Tokens. Für ein Nebenprojekt, einen Hackathon-Build oder eine kostenlose öffentliche App stoppt diese Rechnung die Arbeit, bevor sie überhaupt beginnt. Es gibt einen strukturellen Workaround: Puter.js stellt den gesamten OpenAI-Katalog (GPT-5.5, GPT-5.5 Pro, jede GPT-5.x-Variante, GPT-Image-2, DALL-E, OpenAI TTS) ohne OpenAI-Schlüssel zur Verfügung und berechnet stattdessen dem Endnutzer die Kosten. Für den Entwickler ist die Nutzung kostenlos und unbegrenzt.
TL;DR
- Puter.js bietet Entwicklern kostenlosen, unbegrenzten Zugriff auf den gesamten OpenAI-Modellkatalog ohne API-Schlüssel, ohne OpenAI-Konto, ohne Server.
- Unterstützte Textmodelle umfassen gpt-5.5, gpt-5.5-pro, gpt-5.4, gpt-5, gpt-5-mini, o1, o3, gpt-4.1, gpt-4o, sowie jede Chat- und Codex-Variante.
- Bild: gpt-image-2, gpt-image-1.5, dall-e-3. TTS: gpt-4o-mini-tts, tts-1, tts-1-hd.
- Ein
<script>-Tag, ein Funktionsaufruf (puter.ai.chat), und Sie sprechen mit GPT-5.5. - Streaming, Funktionsaufrufe, Vision-Eingabe, Bildgenerierung und Text-zu-Sprache funktionieren alle im Browser.
- Der Endnutzer deckt seine Nutzung über ein Puter-Konto; Sie zahlen null, für immer.
- Nutzen Sie Apidog, um denselben Prompt gegen Puter und die offizielle OpenAI API zu benchmarken für die Migrationsplanung.
Wie „kostenlos unbegrenzt“ funktioniert
Puter.js dreht das LLM-Abrechnungsmodell um. Anstatt dass Sie den OpenAI-Schlüssel besitzen und jede Token-Kosten tragen, meldet sich Ihr Endnutzer bei Puter an (kostenloses Konto) und der Aufruf wird von dessen Guthaben abgebucht. Neue Puter-Konten erhalten Startguthaben; Nutzer laden bei Bedarf mehr auf.
Für den Entwickler folgen daraus drei Dinge:
- Kein OpenAI-Konto, kein Schlüssel in Ihrem Repo. Kein Leckagerisiko, keine Rotation, keine projektbezogene Schlüsselverwaltung.
- Keine Nutzungsobergrenze auf Ihrer Seite. Jeder Benutzer läuft über sein eigenes Konto, sodass Ihr „Limit“ linear mit Ihrer Benutzerbasis skaliert.
- Keine Kostenrisiken. Sie sehen niemals eine Stripe-Rechnung von OpenAI; Sie müssen keine Unternehmensbedingungen aushandeln.
Der Kompromiss: Dies ist browserzentriert. Ein Backend-Node-Skript kann Puter nicht ohne eine angemeldete Benutzersitzung nutzen. Für die Backend-Nutzung ist die offizielle OpenAI API weiterhin der richtige Weg.
Schritt 1: Installation
Ein CDN-Tag, kein Build-Schritt:
<script src="https://js.puter.com/v2/"></script>
Das ist die gesamte Installation. Oder für eine gebündelte App:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
Die CDN-Version funktioniert in jeder HTML-Datei, Hackathon-Prototyp, statischen Website oder Browser-Erweiterung. Die NPM-Version bietet Ihnen Tree-Shaking und TypeScript-Typen.
Schritt 2: Modell auswählen
Puter bietet die vollständige GPT-5.x-Reihe sowie alle älteren Modelle. Die Kurzliste:
| Modell-ID | Wann zu verwenden |
|---|---|
gpt-5.5-pro |
Tiefste Argumentation; Code-Agenten, komplexe Analyse |
gpt-5.5 |
Standard für den täglichen Gebrauch; gutes Kosten-/Qualitätsverhältnis |
gpt-5.4-nano |
Günstigster, schnellster Text; hochvolumige Klassifizierung |
gpt-5.4-mini |
Mittelklasse; gut für Chat-UIs |
gpt-5.3-codex |
Codespezifische Aufgaben |
o3 |
Komplexe Argumentationsketten |
o1-pro |
Agentenbasierte mehrstufige Planung |
gpt-4.1, gpt-4o, gpt-4o-mini |
Stabile, gut verstandene Basis |
Bildgenerierung:
gpt-image-2: neueste, scharfe Ausgabe, schnell.gpt-image-1.5/gpt-image-1/dall-e-3/dall-e-2: älter, aber stabil.
Text-zu-Sprache:
gpt-4o-mini-tts: neueste, klingt am natürlichsten.tts-1,tts-1-hd: klassische TTS, geringere Latenz.
Schritt 3: GPT-5.5 zum Sprechen bringen
Der minimal funktionsfähige Chat-Aufruf:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Explain WebSockets in three sentences",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
</script>
</body>
</html>
Im Browser öffnen. Puter übernimmt den Aufruf, der Benutzer meldet sich an (oder erstellt bei der ersten Ausführung ein kostenloses Puter-Konto), und die Antwort wird auf der Seite ausgegeben. Kein API-Schlüssel, keine Umgebungsvariable, kein Server.
Schritt 4: Die Antwort streamen
Für Chat-UIs und lange Antworten ist Streaming die richtige Standardeinstellung. Übergeben Sie stream: true und nutzen Sie den Iterator:
const response = await puter.ai.chat(
"Explain the theory of relativity in detail",
{ model: "gpt-5.5", stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
Jeder part.text ist ein Token-Chunk. Fügen Sie ihn Ihrer UI-Sprechblase hinzu; der Benutzer sieht den Text Wort für Wort erscheinen.
Schritt 5: Vision (Bildeingabe)
Übergeben Sie eine Bild-URL als zweites Argument; das Modell liest das Bild und beantwortet den Prompt dazu:
puter.ai.chat(
"What do you see in this image? Describe colors, objects, and mood.",
"https://assets.puter.site/doge.jpeg",
{ model: "gpt-5.5" }
).then(response => {
puter.print(response);
});
Dies funktioniert bei jedem GPT-5.x-Modell und den GPT-4o-Varianten. Anwendungsfälle: Alt-Text-Generierung, visuelle QA, Screenshot-Analyse, OCR, Barrierefreiheitstools.
Schritt 6: Bilder generieren
Puter’s txt2img gibt ein <img>-Element mit dem bereits geladenen generierten Bild zurück:
puter.ai.txt2img(
"A futuristic cityscape at night, cinematic, neon, rain",
{ model: "gpt-image-2" }
).then(imageElement => {
document.body.appendChild(imageElement);
});
Der Benutzer zahlt die Kosten für die Bildgenerierung von seinem Puter-Konto (typischerweise ein paar Cent pro Bild). Für einen kostenlosen öffentlichen Bildgenerator ist dies das sauberste Setup, das es heute gibt.
Schritt 7: Text-zu-Sprache
Die TTS-Linie von OpenAI wird über `txt2speech` bereitgestellt. Die Funktion gibt ein `<audio>`-Element mit der generierten Stimme zurück:
puter.ai.txt2speech(
"Welcome back. Your account balance is $1,247.50.",
{ provider: "openai", model: "gpt-4o-mini-tts" }
).then(audio => {
audio.setAttribute("controls", "");
document.body.appendChild(audio);
});
Verwenden Sie es für Sprachansagen, App-Voiceovers, Podcast-Intros oder Barrierefreiheits-Narrationen.
Schritt 8: Funktionsaufrufe
Standard OpenAI-Struktur. Deklarieren Sie Tools, das Modell gibt ein `tool_calls`-Array aus, Sie führen aus, Sie antworten:
const tools = [{
type: "function",
function: {
name: "get_weather",
description: "Get the current weather for a city.",
parameters: {
type: "object",
properties: { city: { type: "string" } },
required: ["city"],
},
},
}];
const response = await puter.ai.chat(
"What's the weather in Tokyo right now?",
{ model: "gpt-5.5", tools }
);
const toolCalls = response.message.tool_calls;
if (toolCalls?.length) {
// Execute the function on your side, then reply with the result
console.log(toolCalls[0].function.name, toolCalls[0].function.arguments);
}
Die Struktur für Funktionsaufrufe spiegelt die von OpenAI wider, sodass alle heutigen Tool-Definitionen direkt portiert werden können. Für das Testen von Tool-gesteuerten Abläufen in produktionsreifen Umgebungen, siehe MCP-Servertests in Apidog.
Schritt 9: Temperatur und `max_tokens` anpassen
Übergeben Sie Standard-OpenAI-Parameter im Options-Objekt:
const response = await puter.ai.chat(
"Tell me about Mars",
{
model: "gpt-5.5",
temperature: 0.2,
max_tokens: 200,
}
);
Niedrigere Temperatur (0,0–0,3) für faktische Antworten, höhere (0,7–1,0) für kreatives Schreiben. `max_tokens` begrenzt die Kosten auf der Benutzerseite; nützlich, um die Kosten pro Aufruf vorhersehbar zu halten, wenn Sie eine öffentliche App veröffentlichen.
Was Sie erhalten und was nicht
Puter’s kostenloser, unbegrenzter GPT-5.5-Zugriff ist real, aber er ist eine Untermenge der offiziellen OpenAI API-Oberfläche. Die ehrliche Aufteilung:
Sie erhalten:
- Vollständiger GPT-5.x-Katalog, einschließlich 5.5, 5.5 Pro, 5.4 (mini, nano, pro) und jeder Codex-Variante
- Alle älteren OpenAI-Modelle (GPT-4.1, GPT-4o, o1, o3)
- GPT-Image-2 und DALL-E für die kostenlose Bildgenerierung
- OpenAI TTS-Linie, einschließlich gpt-4o-mini-tts
- Streaming, Vision, Funktionsaufrufe, Temperaturkontrolle, max_tokens
Was Sie möglicherweise nicht erhalten:
- Die Responses API (Puter verwendet die Chat Completions-Struktur)
- Kostenreduzierung durch Prompt-Caching
- Die Files API (Kontext hochgeladener Dokumente)
- Serverseitige Nutzung ohne Browserkontext
- Direkte Ratenbegrenzungs-Header von OpenAI
- OpenAIs strukturierter Ausgabemodus und JSON-Schema-Erzwingung
Für tiefgreifende produktionsreife Abläufe ist die offizielle OpenAI API die richtige Antwort. Für Browser-Apps, Seitenprojekte und öffentliche Tools ist Puter ausreichend.
Wann Puter vs. offizielle OpenAI API verwenden
Die Aufteilung:
Puter verwenden, wenn:
- Sie eine kostenlose öffentliche App veröffentlichen und keine Kostenrisiken eingehen möchten.
- Sie Prototypen entwickeln und keine OpenAI-Abrechnungsbeziehung einrichten möchten.
- Sie OpenAI-Zugriff auf einer statischen Website, einem Hackathon-Projekt oder einer Browser-Erweiterung ohne Backend benötigen.
- Ihre Benutzer sich gerne bei Puter anmelden (oder es bereits nutzen).
Die offizielle OpenAI API verwenden, wenn:
- Sie serverseitige Aufrufe benötigen (Cron-Jobs, Webhook-Handler, Stapelverarbeitung).
- Sie Prompt-Caching zur Kosteneinsparung bei stabilen System-Prompts benötigen.
- Sie die Responses API, Files oder vollständige strukturierte Ausgaben benötigen.
- Sie eine vertragliche Beziehung für Compliance benötigen (BAAs, SOC 2, Residenz).
- Ihre Benutzer einen Puter-Anmeldeschritt nicht tolerieren.
Die meisten Projekte beginnen mit Puter für die Prototypenentwicklung und migrieren zur offiziellen API, wenn sie auf eine der oben genannten Grenzen stoßen. Die Migration ist unkompliziert; die Nachrichtenstruktur ist dieselbe.
Für ein kostenpflichtiges Produktions-Setup siehe Wie man die GPT-5.5 API verwendet.
Integration in Apidog testen
Puter-Aufrufe erfolgen im Browser, daher können Sie sie nicht direkt über einen Backend-Test-Runner skripten. Das funktionierende Muster:
- Erstellen Sie eine kleine statische Seite mit dem Puter-Skript und einem Abfrageparameter für den Prompt.
- Verwenden Sie Apidog, um die vorgelagerte OpenAI API-Oberfläche zu validieren (wenn Sie schließlich migrieren).
- Halten Sie beide als separate Umgebungen in derselben Apidog-Sammlung, damit Sie mit einem Klick wechseln können.

Laden Sie Apidog herunter und richten Sie zwei Umgebungen ein: `puter-prototype` (eine localhost-URL, die Ihre Puter-Seite hostet) und `openai-prod` (`https://api.openai.com/v1`). Die Sammlung lässt sich sauber portieren, wenn Sie aufsteigen. Für breitere API-Testmuster siehe API-Testtool für QA-Ingenieure.
FAQ
Ist dies wirklich unbegrenzt, oder gibt es eine versteckte Obergrenze?Ja, aus Sicht des Entwicklers unbegrenzt. Der Endnutzer verfügt über das Guthaben auf seinem Puter-Konto; neue Konten erhalten Startguthaben, und Benutzer laden bei Bedarf mehr auf. Es gibt keine Obergrenze pro Entwickler.
Brauche ich ein OpenAI-Konto?Nein. Puter wickelt die OpenAI-Beziehung ab. Sie sehen niemals einen OpenAI-Schlüssel.
Kann ich dies in der Produktion verwenden?Ja, für browserbasierte Apps. Puter betreibt Produktionsinfrastruktur. Die entscheidende Frage ist, ob Ihre Benutzer bereit sind, sich bei Puter anzumelden; wenn ja, veröffentlichen Sie es.
Verhält sich GPT-5.5 über Puter identisch zur offiziellen API?Die Modellausgabe ist dieselbe; Puter ruft die offizielle OpenAI API im Namen des Benutzers auf. Die Latenz kann aufgrund des zusätzlichen Hops geringfügig höher sein, aber das Modellverhalten ist unverändert.
Wie sieht es mit den Einsparungen durch Prompt-Caching aus?Puter bietet derzeit keine Preissteuerung für OpenAI-Prompt-Caching. Wenn Sie einen stabilen 50.000-Token-System-Prompt haben und den Cache-Rabatt benötigen, verwenden Sie die offizielle API.
Kann ich dies in einem Backend-Dienst verwenden?Nicht sauber. Puter ist browserzentriert und setzt eine Benutzersitzung voraus. Backend-Dienste sollten die offizielle OpenAI API verwenden. Für kostenlose serverseitige Optionen siehe Wie man die GPT-5.5 API kostenlos verwendet.
Welches Modell sollte ich standardmäßig verwenden?`gpt-5.5` für tägliche Schlussfolgerungen. `gpt-5.4-nano` für hochvolumige Klassifizierungen. `gpt-5.5-pro` für komplexe Denkaufgaben. `o3`, wenn Sie lange Schlussfolgerungsketten benötigen.
Werden meine Benutzer viel bezahlen müssen?Die meisten Chat-ähnlichen Nutzungen kosten pro Sitzung nur Centbeträge zu OpenAIs Tarifen. Ein Gelegenheitsnutzer kann Dutzende von Gesprächen mit dem Startguthaben von Puter führen, bevor er aufladen muss. Bildgenerierung ist teurer; begrenzen Sie `max_tokens` und vermeiden Sie unnötige Generierungsaufrufe.
Kann ich Bilder mit Puter kostenlos generieren?Ja, über `txt2img` mit `gpt-image-2` oder DALL-E. Der Nutzer zahlt die Bildgenerierungskosten von seinem Puter-Guthaben. Eine Anleitung zur offiziellen kostenpflichtigen API finden Sie unter Wie man die GPT-Image-2 API verwendet.
Zusammenfassung
Kostenloser, unbegrenzter GPT-5.5-Zugriff über Puter.js ist der sauberste Weg für jede browserbasierte App, die OpenAI-Qualität in der Ausgabe ohne OpenAI-Qualität in der Abrechnung wünscht. Fügen Sie das Skript ein, wählen Sie ein Modell, schreiben Sie den Prompt. Der Endnutzer übernimmt die Kosten; Sie veröffentlichen ohne Schlüssel.
Für serverseitige Workloads, Prompt-Caching, die Responses API oder vollständige strukturierte Ausgaben ist die offizielle OpenAI API weiterhin die richtige Antwort. Für Prototypen, Hackathon-Builds, kostenlose öffentliche Apps und statische Websites ist Puter die Antwort.
Erstellen Sie die Anfrage einmal in Apidog, benchmarken Sie Puter gegen die offizielle API und wählen Sie den Pfad, der zu Ihrer Struktur passt.
