Die Claude-Familie von Anthropic ist die leistungsfähigste Closed-Source-Modellreihe für ernsthafte Programmierung, autonome Aufgaben und Argumentation mit langem Kontext, und der API-Preis spiegelt dies wider: Sonnet kostet 3 $ / 15 $ pro Million Tokens, Opus ist teurer. Diese Kosten stoppen die meisten Seitenprojekte, bevor sie überhaupt beginnen. Es gibt einen Weg, der das Abrechnungsmodell auf den Kopf stellt: Puter.js macht die gesamte Claude-Produktreihe (Opus 4.7, Sonnet 4.6, Haiku 4.5 und sieben weitere Varianten) ohne einen Anthropic-Schlüssel zugänglich und rechnet stattdessen mit dem Endbenutzer ab, nicht mit dem Entwickler. Für Sie als Entwickler ist es strukturell kostenlos und unbegrenzt.
Dieser Leitfaden führt Sie Schritt für Schritt durch die Einrichtung: die Modell-IDs, den funktionierenden Code, Streaming und die Kompromisse, die Sie kennen müssen, bevor Sie Ihre Anwendung veröffentlichen.
TL;DR
- Puter.js bietet Entwicklern kostenlosen, unbegrenzten Zugriff auf die gesamte Claude-Familie ohne API-Schlüssel, Anthropic-Abrechnung und Server.
- Der Endbenutzer deckt seine eigene Nutzung von einem Puter-Konto ab; Sie zahlen nichts.
- Unterstützte Modelle: Opus 4.7, Opus 4.6, Opus 4.6 Fast, Opus 4.5, Opus 4.1, Opus 4, Sonnet 4.6, Sonnet 4.5, Sonnet 4, Haiku 4.5.
- Ein
<script>-Tag, ein Funktionsaufruf (puter.ai.chat), und Sie sprechen mit Claude. - Streaming, System-Prompts, mehrstufige Unterhaltungen funktionieren alle; Puter spiegelt die Nachrichtenstruktur von Anthropic wider.
- Verwenden Sie Apidog, um denselben Prompt über Puter an Claude und an die offizielle Anthropic API für Benchmarking zu skripten.
Wie „kostenlos unbegrenzt“ unter der Haube funktioniert
Puter.js ist eine serverlose Cloud- und KI-Bibliothek, die im Browser bereitgestellt wird. Die Architekturwende: Anstatt dass Sie den Anthropic API-Schlüssel halten und die Rechnung zahlen, meldet sich Ihr Endbenutzer bei Puter an (kostenloses Konto) und die Anrufkosten werden seinem Guthaben belastet. Neue Puter-Konten werden mit Startguthaben geliefert; Benutzer laden bei Bedarf auf.
Für den Entwickler bedeutet dies drei Dinge:
- Kein API-Schlüssel in Ihrem Repo. Kein Leckagerisiko, keine Rotation, keine projektspezifischen Schlüssel zu verwalten.
- Keine Nutzungsbegrenzung auf Ihrer Seite. Jeder Benutzer läuft über sein eigenes Konto, sodass Ihr „Limit“ linear mit Ihrer Benutzerbasis skaliert.
- Keine Anthropic-Beziehung erforderlich. Sie unterzeichnen nie einen Vertrag mit Anthropic; Puter ist der Vermittler.
Der Kompromiss: Dies ist browserzentriert. Ein Backend-Python-Skript kann Puter ohne eine angemeldete Benutzersitzung nicht verwenden. Für die Backend-Nutzung siehe den Abschnitt Alternativen unten.
Schritt 1: Skript einfügen
Ein Tag in Ihrem HTML, kein Build-Schritt:
<script src="https://js.puter.com/v2/"></script>
Das ist die gesamte Installation. Es gibt kein npm install, keine Schlüsselkonfiguration, keine DNS-Einrichtung. Wenn Sie NPM für eine gebündelte App bevorzugen:
npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';
Das CDN-Tag ist der Weg des geringsten Widerstands für eine statische Website oder einen schnellen Prototyp. Der NPM-Import bietet Ihnen Tree-Shaking und TypeScript-Typen in einem Vite- oder Webpack-Build.
Schritt 2: Ein Claude-Modell auswählen
Puter stellt den vollständigen Anthropic-Katalog bereit. Die Modell-IDs folgen der Anthropic-Benennung mit Bindestrich-Trennung:
| Modell-ID | Wann zu verwenden |
|---|---|
claude-opus-4-7 |
Neuestes Flaggschiff; tiefste Argumentation, beste autonome Aufgaben |
claude-opus-4-6 |
Früheres Flaggschiff; starke Code-Erstellung, etwas günstiger |
claude-opus-4.6-fast |
Opus-Variante mit geringerer Latenz |
claude-opus-4-5 |
Stabile Wahl für Produktionsagenten |
claude-opus-4-1 |
Stabiles Altmodell; gut verstandenes Verhalten |
claude-opus-4 |
Ursprüngliche Opus 4 Basislinie |
claude-sonnet-4-6 |
Standard für den täglichen Gebrauch; starkes Kosten-Leistungs-Verhältnis |
claude-sonnet-4-5 |
Früheres Sonnet; günstiger, immer noch exzellent für die meisten Aufgaben |
claude-sonnet-4 |
Sonnet 4 Basislinie |
claude-haiku-4-5 |
Schnellster, günstigster; gut für Klassifizierungen mit hohem Volumen |
Die beiden, zu denen Sie zuerst greifen sollten: claude-sonnet-4-6 für die tägliche Argumentation und claude-haiku-4-5 für schnelle Klassifizierungen. Verwenden Sie claude-opus-4-7, wenn Sie echte Tiefe benötigen (ausführliche Argumentation, komplexe Code-Überprüfung, autonome Mehrschrittplanung).
Schritt 3: Claude zum Sprechen bringen
Der minimale funktionsfähige Aufruf:
<!DOCTYPE html>
<html>
<body>
<script src="https://js.puter.com/v2/"></script>
<script>
puter.ai.chat(
"Erklären Sie Quantencomputing in einfachen Worten",
{ model: 'claude-sonnet-4-6' }
).then(response => {
puter.print(response.message.content[0].text);
});
</script>
</body>
</html>
Öffnen Sie die Datei in einem Browser. Puter handhabt den API-Aufruf, der Benutzer meldet sich an (oder erstellt beim ersten Start ein kostenloses Puter-Konto), und die Antwort wird auf der Seite ausgegeben.
Die Antwortstruktur spiegelt die Nachrichten-API von Anthropic wider. response.message.content ist ein Array von Inhaltsblöcken; für Antworten in reinem Text lesen Sie [0].text. Für mehrteilige Antworten (Text + Tool-Aufrufe) durchlaufen Sie das Array.
Schritt 4: Die Antwort streamen
Lange Antworten fühlen sich ohne Streaming träge an. Übergeben Sie stream: true und konsumieren Sie den Iterator:
const response = await puter.ai.chat(
"Schreiben Sie einen detaillierten Aufsatz über die Auswirkungen künstlicher Intelligenz auf die Gesellschaft",
{ model: 'claude-sonnet-4-6', stream: true }
);
for await (const part of response) {
puter.print(part?.text);
}
Das for await-Muster liest Chunks, sobald sie eintreffen. Für eine Chat-Benutzeroberfläche hängen Sie jeden part.text an Ihre Sprechblase an; der Benutzer sieht den Text Wort für Wort erscheinen.
Schritt 5: Mehrstufige Unterhaltungen
Übergeben Sie ein Array von Nachrichten anstelle eines einzelnen Strings. Jede Nachricht hat eine role und content:
const messages = [
{ role: 'user', content: 'Ich entwickle eine Next.js-App mit Postgres.' },
{ role: 'assistant', content: 'Verstanden. Wobei benötigen Sie Hilfe?' },
{ role: 'user', content: 'Wie soll ich den Migrationsordner strukturieren?' },
];
const response = await puter.ai.chat(messages, {
model: 'claude-opus-4-7',
});
console.log(response.message.content[0].text);
Um den Zustand über mehrere Schritte hinweg beizubehalten, fügen Sie jede Benutzernachricht und jede Assistentenantwort in das Array ein, bevor Sie den nächsten Aufruf tätigen. Claude liest das gesamte Transkript und bleibt konsistent.
Schritt 6: System-Prompts
Legen Sie Persona, Einschränkungen und Ausgabeformat mit einer Systemnachricht am Anfang fest:
const messages = [
{ role: 'system', content: 'Sie sind ein erfahrener Backend-Ingenieur. Antworten Sie in nummerierten Aufzählungspunkten, nie mehr als fünf.' },
{ role: 'user', content: 'Wie verhindere ich SQL-Injection in einer Node-App?' },
];
const response = await puter.ai.chat(messages, { model: 'claude-sonnet-4-6' });
System-Prompts gelten für die gesamte Unterhaltung und sind der richtige Ort für Ton, Ausgabeformat und Verhaltensrichtlinien.
Modelle mit demselben Prompt vergleichen
Der schnellste Weg, das richtige Claude-Modell für Ihren Anwendungsfall zu finden, besteht darin, denselben Prompt über alle Modelle hinweg zu skripten und zu vergleichen. Eine kleine Benchmark-Schleife:
const models = ['claude-haiku-4-5', 'claude-sonnet-4-6', 'claude-opus-4-7'];
const prompt = "Refaktorisieren Sie diese React-Komponente, um Hooks zu verwenden: ...";
for (const model of models) {
const start = performance.now();
const response = await puter.ai.chat(prompt, { model });
const elapsed = performance.now() - start;
console.log(`${model}: ${elapsed.toFixed(0)}ms`);
console.log(response.message.content[0].text);
console.log('---');
}
Führen Sie es einmal aus, und Sie werden das Kompromissmuster erkennen: Haiku ist 5-10x schneller als Opus, Sonnet liegt dazwischen, Opus liefert bei schwierigen Prompts merklich bessere Antworten. Für die meisten Apps ist Sonnet 4.6 der richtige Standard.
Um Puter’s kostenlosen Pfad mit der offiziellen Anthropic API in Apidog zu vergleichen, behalten Sie beide Anbieter in derselben Sammlung und schalten Sie die Umgebung um.
Was Sie bekommen und was nicht
Kostenloses unbegrenztes Claude über Puter ist real, aber die Oberfläche ist eine Untermenge der offiziellen API. Die ehrliche Liste:
Sie erhalten:
- Vollständigen Claude-Modellkatalog (Opus, Sonnet, Haiku, alle aktuellen Versionen)
- Mehrstufige Unterhaltungen
- System-Prompts
- Streaming-Antworten
- Produktionsreife Skalierung (Puter handhabt die Infrastruktur)
- Keine Abrechnungsrisiken für Sie als Entwickler
Sie erhalten möglicherweise nicht (abhängig von der Puter-Version):
- Native Tool-Nutzung / Funktionsaufrufe (prüfen Sie die aktuelle Puter-Dokumentation)
- Vision-Eingabe (Bildanhänge)
- Kostenreduzierung durch Prompt-Caching von Anthropic
- Serverseitige Nutzung ohne Browserkontext
- Direkte Sichtbarkeit des Ratenlimits (Sie sehen die Header von Anthropic nicht)
Für komplexe Tool-Nutzungs-Workflows bietet die offizielle Anthropic API oder das MCP-Server-Testing in Apidog mehr Kontrolle. Für einen typischen Chatbot, eine F&A-App oder einen Inhaltsgenerator ist die Oberfläche von Puter ausreichend.
Wann Puter gegenüber der offiziellen Anthropic API zu verwenden ist
Die Aufteilung:
Verwenden Sie Puter, wenn:
- Sie eine kostenlose öffentliche App veröffentlichen und keine Abrechnungsrisiken wünschen.
- Sie Prototypen erstellen und noch keine Abrechnungsbeziehung mit Anthropic einrichten möchten.
- Sie Claude in einer statischen Website, einem Hackathon-Projekt oder einer Browsererweiterung ohne Backend unterstützen möchten.
- Ihre Benutzer bereit sind, sich bei Puter anzumelden (oder es bereits nutzen).
Verwenden Sie die offizielle Anthropic API, wenn:
- Sie serverseitige Aufrufe benötigen (Cron-Jobs, API-Endpunkte, Stapelverarbeitung).
- Sie Prompt-Caching zur Kostenersparnis bei stabilen System-Prompts benötigen.
- Sie feingranulare Tool-Nutzung, Vision-Eingabe oder die Files API benötigen.
- Sie eine Vertragsbeziehung für Compliance benötigen (BAAs, SOC 2, regionale Präsenz).
- Ihre Benutzer einen Puter-Anmeldeschritt nicht tolerieren werden.
Die meisten Projekte beginnen mit Puter für das Prototyping und migrieren zur offiziellen API, wenn sie auf eine der oben genannten Grenzen stoßen. Die Migration ist unkompliziert; die Nachrichtenstruktur ist dieselbe.
Für das GPT-Äquivalent siehe Wie man die GPT-5.5 API verwendet.
Die Integration in Apidog testen
Puter-Aufrufe finden im Browser statt, daher können Sie sie nicht direkt von einem Backend-Test-Runner skripten. Das funktionierende Muster:
- Erstellen Sie eine kleine statische Seite mit dem Puter-Skript und einem Abfrageparameter für den Prompt.
- Verwenden Sie Apidog, um die Upstream-Anthropic-API-Oberfläche zu validieren (wenn Sie schließlich migrieren).
- Behalten Sie beide als separate Umgebungen in derselben Apidog-Sammlung bei, damit Sie mit einem Klick wechseln können.

Laden Sie Apidog herunter und richten Sie zwei Umgebungen ein: puter-prototype (eine localhost-URL, die Ihre Puter-Seite hostet) und anthropic-prod (https://api.anthropic.com/v1). Die Sammlung lässt sich sauber übertragen, wenn Sie von Puter zur offiziellen API übergehen.
FAQ
Ist das wirklich unbegrenzt, oder gibt es eine versteckte Grenze?Aus Sicht des Entwicklers ja, unbegrenzt. Der Endbenutzer hat das Guthaben, das sich in seinem Puter-Konto befindet; neue Konten erhalten Startguthaben, und Benutzer laden bei Bedarf auf. Es gibt keine pro-Entwickler-Grenze.
Muss ich mich bei Anthropic anmelden?Nein. Puter regelt die Beziehung zu Anthropic. Sie sehen nie einen Anthropic-Schlüssel.
Kann ich dies in der Produktion verwenden?Ja, für browserbasierte Apps. Puter betreibt die Produktionsinfrastruktur. Die richtige Frage ist, ob Ihre Benutzer bereit sind, sich bei Puter anzumelden; wenn ja, dann veröffentlichen Sie es.
Arbeitet Claude über Puter identisch zur offiziellen API?Die Modellausgabe ist dieselbe; Puter ruft die offizielle Anthropic API im Namen des Benutzers auf. Die Latenz kann aufgrund des zusätzlichen Hops geringfügig höher sein, aber das Modellverhalten ist unverändert.
Was ist mit den Einsparungen durch Claude's Prompt-Caching?Puter bietet heute keine Preissteuerung für das Prompt-Caching von Anthropic. Wenn Sie einen stabilen 50k-Token-System-Prompt haben und den Cache-Rabatt benötigen, verwenden Sie die offizielle API.
Kann ich Claude über Puter in einem Discord-Bot oder Backend-Dienst verwenden?Nicht sauber. Puter ist browserzentriert und setzt eine Benutzersitzung voraus. Backend-Dienste sollten die offizielle Anthropic API verwenden.
Welches Modell sollte ich standardmäßig verwenden?claude-sonnet-4-6. Es bietet die richtige Balance aus Kosten, Geschwindigkeit und Qualität für die meisten Prompts. Wechseln Sie zu claude-opus-4-7, wenn Sie tiefere Argumentation benötigen, und claude-haiku-4-5, wenn Sie Massenklassifizierung benötigen.
Werden meine Benutzer viel bezahlen?Die meisten Chat-Nutzungen kosten nach Anthropic-Tarifen Cent pro Sitzung. Ein Gelegenheitsnutzer kann Dutzende von Unterhaltungen mit Puter's Startguthaben führen, bevor er aufladen muss.
Zusammenfassung
Kostenloses unbegrenztes Claude über Puter.js ist der sauberste Weg für jede browserbasierte App, die Anthropic-Qualität ohne Anthropic-Abrechnung wünscht. Fügen Sie das Skript ein, wählen Sie ein Modell, schreiben Sie den Prompt. Der Endbenutzer deckt die Nutzung ab; Sie veröffentlichen ohne Schlüssel.
Für serverseitige Workloads, Prompt-Caching oder vollständige Tool-Nutzungs-Workflows ist die offizielle Anthropic API immer noch die richtige Antwort. Aber für Prototypen, kostenlose öffentliche Apps, Hackathon-Projekte, Seitenprojekte und statische Websites ist Puter die Antwort.
Erstellen Sie die Anfrage einmal in Apidog, vergleichen Sie Puter mit der offiziellen API und wählen Sie den Pfad, der zu Ihrer Form passt.
