Kostenlose Unbegrenzte Claude Opus 4.7 API

Ashley Innocent

Ashley Innocent

9 May 2026

Kostenlose Unbegrenzte Claude Opus 4.7 API

enterprise.banner.title

enterprise.banner.feature1

enterprise.banner.feature2

enterprise.banner.feature3

enterprise.banner.ctaB

Die Claude-Familie von Anthropic ist die leistungsfähigste Closed-Source-Modellreihe für ernsthafte Programmierung, autonome Aufgaben und Argumentation mit langem Kontext, und der API-Preis spiegelt dies wider: Sonnet kostet 3 $ / 15 $ pro Million Tokens, Opus ist teurer. Diese Kosten stoppen die meisten Seitenprojekte, bevor sie überhaupt beginnen. Es gibt einen Weg, der das Abrechnungsmodell auf den Kopf stellt: Puter.js macht die gesamte Claude-Produktreihe (Opus 4.7, Sonnet 4.6, Haiku 4.5 und sieben weitere Varianten) ohne einen Anthropic-Schlüssel zugänglich und rechnet stattdessen mit dem Endbenutzer ab, nicht mit dem Entwickler. Für Sie als Entwickler ist es strukturell kostenlos und unbegrenzt.

Dieser Leitfaden führt Sie Schritt für Schritt durch die Einrichtung: die Modell-IDs, den funktionierenden Code, Streaming und die Kompromisse, die Sie kennen müssen, bevor Sie Ihre Anwendung veröffentlichen.

button

TL;DR

Wie „kostenlos unbegrenzt“ unter der Haube funktioniert

Puter.js ist eine serverlose Cloud- und KI-Bibliothek, die im Browser bereitgestellt wird. Die Architekturwende: Anstatt dass Sie den Anthropic API-Schlüssel halten und die Rechnung zahlen, meldet sich Ihr Endbenutzer bei Puter an (kostenloses Konto) und die Anrufkosten werden seinem Guthaben belastet. Neue Puter-Konten werden mit Startguthaben geliefert; Benutzer laden bei Bedarf auf.

Für den Entwickler bedeutet dies drei Dinge:

Der Kompromiss: Dies ist browserzentriert. Ein Backend-Python-Skript kann Puter ohne eine angemeldete Benutzersitzung nicht verwenden. Für die Backend-Nutzung siehe den Abschnitt Alternativen unten.

Schritt 1: Skript einfügen

Ein Tag in Ihrem HTML, kein Build-Schritt:

<script src="https://js.puter.com/v2/"></script>

Das ist die gesamte Installation. Es gibt kein npm install, keine Schlüsselkonfiguration, keine DNS-Einrichtung. Wenn Sie NPM für eine gebündelte App bevorzugen:

npm install @heyputer/puter.js
import { puter } from '@heyputer/puter.js';

Das CDN-Tag ist der Weg des geringsten Widerstands für eine statische Website oder einen schnellen Prototyp. Der NPM-Import bietet Ihnen Tree-Shaking und TypeScript-Typen in einem Vite- oder Webpack-Build.

Schritt 2: Ein Claude-Modell auswählen

Puter stellt den vollständigen Anthropic-Katalog bereit. Die Modell-IDs folgen der Anthropic-Benennung mit Bindestrich-Trennung:

Modell-ID Wann zu verwenden
claude-opus-4-7 Neuestes Flaggschiff; tiefste Argumentation, beste autonome Aufgaben
claude-opus-4-6 Früheres Flaggschiff; starke Code-Erstellung, etwas günstiger
claude-opus-4.6-fast Opus-Variante mit geringerer Latenz
claude-opus-4-5 Stabile Wahl für Produktionsagenten
claude-opus-4-1 Stabiles Altmodell; gut verstandenes Verhalten
claude-opus-4 Ursprüngliche Opus 4 Basislinie
claude-sonnet-4-6 Standard für den täglichen Gebrauch; starkes Kosten-Leistungs-Verhältnis
claude-sonnet-4-5 Früheres Sonnet; günstiger, immer noch exzellent für die meisten Aufgaben
claude-sonnet-4 Sonnet 4 Basislinie
claude-haiku-4-5 Schnellster, günstigster; gut für Klassifizierungen mit hohem Volumen

Die beiden, zu denen Sie zuerst greifen sollten: claude-sonnet-4-6 für die tägliche Argumentation und claude-haiku-4-5 für schnelle Klassifizierungen. Verwenden Sie claude-opus-4-7, wenn Sie echte Tiefe benötigen (ausführliche Argumentation, komplexe Code-Überprüfung, autonome Mehrschrittplanung).

Schritt 3: Claude zum Sprechen bringen

Der minimale funktionsfähige Aufruf:

<!DOCTYPE html>
<html>
<body>
  <script src="https://js.puter.com/v2/"></script>
  <script>
    puter.ai.chat(
      "Erklären Sie Quantencomputing in einfachen Worten",
      { model: 'claude-sonnet-4-6' }
    ).then(response => {
      puter.print(response.message.content[0].text);
    });
  </script>
</body>
</html>

Öffnen Sie die Datei in einem Browser. Puter handhabt den API-Aufruf, der Benutzer meldet sich an (oder erstellt beim ersten Start ein kostenloses Puter-Konto), und die Antwort wird auf der Seite ausgegeben.

Die Antwortstruktur spiegelt die Nachrichten-API von Anthropic wider. response.message.content ist ein Array von Inhaltsblöcken; für Antworten in reinem Text lesen Sie [0].text. Für mehrteilige Antworten (Text + Tool-Aufrufe) durchlaufen Sie das Array.

Schritt 4: Die Antwort streamen

Lange Antworten fühlen sich ohne Streaming träge an. Übergeben Sie stream: true und konsumieren Sie den Iterator:

const response = await puter.ai.chat(
  "Schreiben Sie einen detaillierten Aufsatz über die Auswirkungen künstlicher Intelligenz auf die Gesellschaft",
  { model: 'claude-sonnet-4-6', stream: true }
);

for await (const part of response) {
  puter.print(part?.text);
}

Das for await-Muster liest Chunks, sobald sie eintreffen. Für eine Chat-Benutzeroberfläche hängen Sie jeden part.text an Ihre Sprechblase an; der Benutzer sieht den Text Wort für Wort erscheinen.

Schritt 5: Mehrstufige Unterhaltungen

Übergeben Sie ein Array von Nachrichten anstelle eines einzelnen Strings. Jede Nachricht hat eine role und content:

const messages = [
  { role: 'user', content: 'Ich entwickle eine Next.js-App mit Postgres.' },
  { role: 'assistant', content: 'Verstanden. Wobei benötigen Sie Hilfe?' },
  { role: 'user', content: 'Wie soll ich den Migrationsordner strukturieren?' },
];

const response = await puter.ai.chat(messages, {
  model: 'claude-opus-4-7',
});

console.log(response.message.content[0].text);

Um den Zustand über mehrere Schritte hinweg beizubehalten, fügen Sie jede Benutzernachricht und jede Assistentenantwort in das Array ein, bevor Sie den nächsten Aufruf tätigen. Claude liest das gesamte Transkript und bleibt konsistent.

Schritt 6: System-Prompts

Legen Sie Persona, Einschränkungen und Ausgabeformat mit einer Systemnachricht am Anfang fest:

const messages = [
  { role: 'system', content: 'Sie sind ein erfahrener Backend-Ingenieur. Antworten Sie in nummerierten Aufzählungspunkten, nie mehr als fünf.' },
  { role: 'user', content: 'Wie verhindere ich SQL-Injection in einer Node-App?' },
];

const response = await puter.ai.chat(messages, { model: 'claude-sonnet-4-6' });

System-Prompts gelten für die gesamte Unterhaltung und sind der richtige Ort für Ton, Ausgabeformat und Verhaltensrichtlinien.

Modelle mit demselben Prompt vergleichen

Der schnellste Weg, das richtige Claude-Modell für Ihren Anwendungsfall zu finden, besteht darin, denselben Prompt über alle Modelle hinweg zu skripten und zu vergleichen. Eine kleine Benchmark-Schleife:

const models = ['claude-haiku-4-5', 'claude-sonnet-4-6', 'claude-opus-4-7'];
const prompt = "Refaktorisieren Sie diese React-Komponente, um Hooks zu verwenden: ...";

for (const model of models) {
  const start = performance.now();
  const response = await puter.ai.chat(prompt, { model });
  const elapsed = performance.now() - start;
  console.log(`${model}: ${elapsed.toFixed(0)}ms`);
  console.log(response.message.content[0].text);
  console.log('---');
}

Führen Sie es einmal aus, und Sie werden das Kompromissmuster erkennen: Haiku ist 5-10x schneller als Opus, Sonnet liegt dazwischen, Opus liefert bei schwierigen Prompts merklich bessere Antworten. Für die meisten Apps ist Sonnet 4.6 der richtige Standard.

Um Puter’s kostenlosen Pfad mit der offiziellen Anthropic API in Apidog zu vergleichen, behalten Sie beide Anbieter in derselben Sammlung und schalten Sie die Umgebung um.

Was Sie bekommen und was nicht

Kostenloses unbegrenztes Claude über Puter ist real, aber die Oberfläche ist eine Untermenge der offiziellen API. Die ehrliche Liste:

Sie erhalten:

Sie erhalten möglicherweise nicht (abhängig von der Puter-Version):

Für komplexe Tool-Nutzungs-Workflows bietet die offizielle Anthropic API oder das MCP-Server-Testing in Apidog mehr Kontrolle. Für einen typischen Chatbot, eine F&A-App oder einen Inhaltsgenerator ist die Oberfläche von Puter ausreichend.

Wann Puter gegenüber der offiziellen Anthropic API zu verwenden ist

Die Aufteilung:

Verwenden Sie Puter, wenn:

Verwenden Sie die offizielle Anthropic API, wenn:

Die meisten Projekte beginnen mit Puter für das Prototyping und migrieren zur offiziellen API, wenn sie auf eine der oben genannten Grenzen stoßen. Die Migration ist unkompliziert; die Nachrichtenstruktur ist dieselbe.

Für das GPT-Äquivalent siehe Wie man die GPT-5.5 API verwendet.

Die Integration in Apidog testen

Puter-Aufrufe finden im Browser statt, daher können Sie sie nicht direkt von einem Backend-Test-Runner skripten. Das funktionierende Muster:

  1. Erstellen Sie eine kleine statische Seite mit dem Puter-Skript und einem Abfrageparameter für den Prompt.
  2. Verwenden Sie Apidog, um die Upstream-Anthropic-API-Oberfläche zu validieren (wenn Sie schließlich migrieren).
  3. Behalten Sie beide als separate Umgebungen in derselben Apidog-Sammlung bei, damit Sie mit einem Klick wechseln können.

Laden Sie Apidog herunter und richten Sie zwei Umgebungen ein: puter-prototype (eine localhost-URL, die Ihre Puter-Seite hostet) und anthropic-prod (https://api.anthropic.com/v1). Die Sammlung lässt sich sauber übertragen, wenn Sie von Puter zur offiziellen API übergehen.

FAQ

Ist das wirklich unbegrenzt, oder gibt es eine versteckte Grenze?Aus Sicht des Entwicklers ja, unbegrenzt. Der Endbenutzer hat das Guthaben, das sich in seinem Puter-Konto befindet; neue Konten erhalten Startguthaben, und Benutzer laden bei Bedarf auf. Es gibt keine pro-Entwickler-Grenze.

Muss ich mich bei Anthropic anmelden?Nein. Puter regelt die Beziehung zu Anthropic. Sie sehen nie einen Anthropic-Schlüssel.

Kann ich dies in der Produktion verwenden?Ja, für browserbasierte Apps. Puter betreibt die Produktionsinfrastruktur. Die richtige Frage ist, ob Ihre Benutzer bereit sind, sich bei Puter anzumelden; wenn ja, dann veröffentlichen Sie es.

Arbeitet Claude über Puter identisch zur offiziellen API?Die Modellausgabe ist dieselbe; Puter ruft die offizielle Anthropic API im Namen des Benutzers auf. Die Latenz kann aufgrund des zusätzlichen Hops geringfügig höher sein, aber das Modellverhalten ist unverändert.

Was ist mit den Einsparungen durch Claude's Prompt-Caching?Puter bietet heute keine Preissteuerung für das Prompt-Caching von Anthropic. Wenn Sie einen stabilen 50k-Token-System-Prompt haben und den Cache-Rabatt benötigen, verwenden Sie die offizielle API.

Kann ich Claude über Puter in einem Discord-Bot oder Backend-Dienst verwenden?Nicht sauber. Puter ist browserzentriert und setzt eine Benutzersitzung voraus. Backend-Dienste sollten die offizielle Anthropic API verwenden.

Welches Modell sollte ich standardmäßig verwenden?claude-sonnet-4-6. Es bietet die richtige Balance aus Kosten, Geschwindigkeit und Qualität für die meisten Prompts. Wechseln Sie zu claude-opus-4-7, wenn Sie tiefere Argumentation benötigen, und claude-haiku-4-5, wenn Sie Massenklassifizierung benötigen.

Werden meine Benutzer viel bezahlen?Die meisten Chat-Nutzungen kosten nach Anthropic-Tarifen Cent pro Sitzung. Ein Gelegenheitsnutzer kann Dutzende von Unterhaltungen mit Puter's Startguthaben führen, bevor er aufladen muss.

Zusammenfassung

Kostenloses unbegrenztes Claude über Puter.js ist der sauberste Weg für jede browserbasierte App, die Anthropic-Qualität ohne Anthropic-Abrechnung wünscht. Fügen Sie das Skript ein, wählen Sie ein Modell, schreiben Sie den Prompt. Der Endbenutzer deckt die Nutzung ab; Sie veröffentlichen ohne Schlüssel.

Für serverseitige Workloads, Prompt-Caching oder vollständige Tool-Nutzungs-Workflows ist die offizielle Anthropic API immer noch die richtige Antwort. Aber für Prototypen, kostenlose öffentliche Apps, Hackathon-Projekte, Seitenprojekte und statische Websites ist Puter die Antwort.

Erstellen Sie die Anfrage einmal in Apidog, vergleichen Sie Puter mit der offiziellen API und wählen Sie den Pfad, der zu Ihrer Form passt.

button

Praktizieren Sie API Design-First in Apidog

Entdecken Sie eine einfachere Möglichkeit, APIs zu erstellen und zu nutzen