Gemini 3.5 Flash wurde am 19. Mai 2026 gestartet, und Google behielt die kostenlose Zugangsstufe bei. Flash ist heute mit einem kostenlosen API-Schlüssel aufrufbar; Pro kommt im Juni. Wenn Sie Flash nutzen möchten, ohne einen Cent zu bezahlen, sind hier die fünf Wege, die tatsächlich funktionieren.
Dieser Leitfaden konzentriert sich speziell auf die praktische Einrichtung von Flash. Am Ende haben Sie einen kostenlosen Schlüssel, funktionierende Codebeispiele und ein klares Verständnis dafür, wo die Grenzen liegen.

Kurz zusammengefasst
| Weg | Was Sie bekommen | Limit |
|---|---|---|
| Gemini App | Voller Chat + Bildeingabe mit Flash | Tägliches Nachrichtenlimit im kostenlosen Tarif |
| Google AI Studio Playground | Web-UI zum Testen von Flash mit detaillierter Parametersteuerung | Keine feste Quote in der Benutzeroberfläche |
| AI Studio API-Schlüssel | REST/SDK-Zugriff auf gemini-3.5-flash |
~1.500 Anfragen/Tag |
| Vertex AI Neukunden-Guthaben | Produktionsreifer Flash-Zugriff | 300 $ Guthaben, 90 Tage |
| Gemini CLI | Terminalzugriff auf Flash mit Google-Login | 1.000 tägliche Anfragen |
Jeder Weg hat seine Kompromisse. Der richtige hängt davon ab, ob Sie Flash entwickeln, automatisieren oder einfach nur ausprobieren möchten.
Weg 1: Gemini App (der Weg ohne Einrichtung)
Wenn Sie einfach nur mit Gemini 3.5 Flash sprechen möchten, ist dies der schnellste Weg.
- Gehen Sie zu gemini.google.com
- Melden Sie sich mit einem Google-Konto an
- Wählen Sie im Modellauswähler 3.5 Flash
- Beginnen Sie mit dem Chatten

Die App unterstützt Texteingabe, Bildeingabe, Dateiuploads und die Bearbeitung von Dokumenten im Canvas-Stil. Benutzer der kostenlosen Stufe erhalten ein tägliches Nachrichtenlimit, das jeden Tag zurückgesetzt wird. Wenn Sie es erreichen, warten Sie oder führen ein Upgrade durch.
Wo die App glänzt:
- Recherche und Schreiben, wo Sie nichts skripten müssen
- Bildanalyse ohne API-Einrichtung
- Direkter Vergleich mit anderen kostenlosen Chat-Modellen
Wo sie nicht hilft:
- Softwareentwicklung mit Flash im Kreislauf
- Stapelverarbeitung
- Alles, was eine programmierbare Antwort erfordert
Weg 2: Google AI Studio (Browser-Spielplatz)
Google AI Studio ist der Entwickler-Spielplatz. Er ist kostenlos, webbasiert und bietet Ihnen die volle Kontrolle über jeden Flash-Parameter.
- Öffnen Sie aistudio.google.com
- Melden Sie sich an
- Klicken Sie auf Neuen Prompt erstellen oder wählen Sie einen Starter aus
- Wählen Sie im Modell-Dropdown
gemini-3.5-flash - Geben Sie Ihren Prompt ein und klicken Sie auf Ausführen

Dinge, die Sie hier tun können, die die Gemini App nicht kann:
- Temperatur, Top-K, Top-P einstellen
- Systemanweisungen festlegen
- Strukturierte JSON-Modus-Ausgabe testen
- Multimodale Prompts mit mehreren Bildern ausführen
- Den entsprechenden Python/Node-Code für Ihren Prompt erhalten
- Den Prompt in einen Flash API-Aufruf exportieren
AI Studio berechnet keine Kosten für die browserbasierte Nutzung. Es ist der beste kostenlose Weg für Prompt-Engineering, bevor Sie sich für die Entwicklung entscheiden.
Weg 3: Kostenloser Gemini 3.5 Flash API-Schlüssel (der Entwicklungsweg)
Das ist der, den die meisten Entwickler wünschen. Das gleiche AI Studio-Konto, das den Spielplatz antreibt, stellt auch einen kostenlosen API-Schlüssel aus, der für gemini-3.5-flash funktioniert.
Den Schlüssel erhalten
- Klicken Sie in AI Studio im linken Navigationsbereich auf API-Schlüssel erhalten
- Wählen oder erstellen Sie ein Projekt
- Klicken Sie auf API-Schlüssel erstellen
- Kopieren Sie ihn und speichern Sie ihn an einem sicheren Ort

Das war’s. Keine Kreditkarte. Keine Verifizierungsanrufe. Der Schlüssel funktioniert sofort für Flash. Eine vollständige Schritt-für-Schritt-Anleitung finden Sie in unserem kostenlosen Gemini API-Schlüssel-Leitfaden.
Kostenlose Stufen-Quoten für Flash
Ab Mai 2026 liegt Googles kostenlose Stufe für gemini-3.5-flash ungefähr bei:
- 1.500 Anfragen pro Tag
- 1 Mio. Token pro Minute
- 15 Anfragen pro Minute
Die Zahlen können sich ändern; überprüfen Sie die Google-Preisseite für die aktuelle Obergrenze, bevor Sie Produktionscode darauf aufbauen. Für die vollständige Preisberechnung, wenn Sie die kostenlose Stufe überschreiten, siehe unsere Flash-Preisübersicht.
Den Flash-Schlüssel verwenden
Drei kurze Beispiele, um zu bestätigen, dass es funktioniert.
Python:
import os
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Give me three startup ideas for API tooling in 2026."
)
print(response.text)
Node.js:
import { GoogleGenAI } from "@google/genai";
const ai = new GoogleGenAI({ apiKey: process.env.GEMINI_API_KEY });
const response = await ai.models.generateContent({
model: "gemini-3.5-flash",
contents: "Give me three startup ideas for API tooling in 2026.",
});
console.log(response.text);
curl:
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
-H "x-goog-api-key: $GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{"contents":[{"parts":[{"text":"Hello Gemini 3.5 Flash"}]}]}'
Für die vollständige Einrichtung einschließlich Streaming und Tool-Aufrufen, siehe unseren Gemini 3.5 Flash API-Leitfaden.
Flash-Anfragen der kostenlosen Stufe in Apidog testen
Wenn Sie 1.500 Flash-Anfragen pro Tag verbrauchen wollen, möchten Sie sicherstellen, dass jede davon nützliche Arbeit leistet. Apidog bietet Ihnen einen Arbeitsbereich, in dem Sie den Flash-Endpunkt speichern, Ihren kostenlosen Schlüssel als Umgebungsvariable ablegen und Anfragen wiederholen können, ohne jedes Mal curl neu schreiben zu müssen.

Der Ablauf:
- Apidog herunterladen
- Neue Anfrage erstellen, den obigen curl-Befehl einfügen
- Den API-Schlüssel in Apidogs Umgebungsvariablen verschieben
- Die Anfrage speichern, Antwort-Assertions hinzufügen
- Als Teil eines Testszenarios ausführen, wenn Sie Prompts ändern
Der Vorteil: Sie verbrauchen nicht versehentlich Ihr tägliches Flash-Kontingent, indem Sie dieselbe fehlerhafte Anfrage fünfmal debuggen. Apidog speichert den Antwortverlauf für Sie.
Weg 4: Vertex AI Neukunden-Guthaben
Wenn Sie ein brandneues Google Cloud-Konto erstellen, erhalten Sie ein Guthaben von 300 $, das 90 Tage lang gültig ist. Dieses Guthaben deckt den gehosteten Gemini 3.5 Flash-Endpunkt von Vertex AI ab, der dasselbe Modell ist, aber mit organisationsgerechten Kontrollen.
So verwenden Sie es:
- Melden Sie sich unter cloud.google.com an und bestätigen Sie das 300 $-Guthaben
- Aktivieren Sie die Vertex AI API
- Erstellen Sie ein Dienstkonto, geben Sie ihm
aiplatform.user - Laden Sie die JSON-Anmeldeinformationen herunter
- Rufen Sie Flash über das Vertex AI SDK auf
import vertexai
from vertexai.generative_models import GenerativeModel
vertexai.init(project="your-project-id", location="us-central1")
model = GenerativeModel("gemini-3.5-flash")
response = model.generate_content("Explain CAP theorem.")
print(response.text)
Vertex hat nicht dasselbe tägliche Anfragelimit wie die kostenlose Stufe von AI Studio. Sie sind stattdessen durch das Dollarguthaben begrenzt. Bei Flashs Preisen von ca. 1,50 $ / 9 $ pro 1 Mio. Token reicht 300 $ weit, möglicherweise für Wochen mäßiger Nutzung.
Worauf Sie achten sollten:
- Das Guthaben läuft nach 90 Tagen ab; ungenutztes Guthaben verfällt
- Die automatische Umstellung auf kostenpflichtig erfolgt beim Ablauf, deaktivieren Sie diese, wenn Sie keine Überraschungen wünschen
- Vertex erfordert mehr Einrichtung als AI Studio, berücksichtigen Sie dies bei Ihrer Zeitplanung
Weg 5: Gemini CLI (der Terminal-Weg)
Die Gemini CLI ist Googles Open-Source-Terminal-Client. Sie authentifiziert sich mit Ihrem Google-Konto und gewährt Ihnen ein tägliches Kontingent von 1.000 Anfragen für Geminis kostenlose Stufe, ohne dass ein API-Schlüssel erforderlich ist.
Installieren und ausführen:
# Installieren
npm install -g @google/gemini-cli
# Ausführen
gemini
# Innerhalb der CLI gemini-3.5-flash auswählen
Dies ist der einfachste Weg für Ad-hoc-Flash-Skripte von Ihrem Terminal aus. Es dient auch als kostenlose Claude Code-Alternative für Programmierarbeiten, da es Dateien lesen und Tools ausführen kann.
Wo die CLI glänzt:
- Schnelle Skripte, bei denen Sie sonst in eine Chat-Benutzeroberfläche einfügen würden
- Codebasis durchsuchen + zusammenfassen Workflows
- Tägliches Kontingent, das von Ihrem API-Schlüssel-Kontingent getrennt ist
Wo sie nicht hilft:
- Produktionsintegrationen (verwenden Sie stattdessen den API-Schlüssel-Weg)
- Workloads, die eine rohe HTTP-Streaming-Kontrolle benötigen
Weg 6 (Bonus): OpenRouter und unbegrenzte Gateways
Mehrere Drittanbieter-Gateways aggregieren den Zugriff auf KI-Modelle und leiten kostenlose oder nahezu kostenlose Flash-Aufrufe über ihren Dienst weiter. Das Muster wird in unserem Beitrag Kostenlose unbegrenzte Gemini API erhalten behandelt.
Kurze Hinweise:
- Die Qualität variiert; einige Gateways drosseln aggressiv
- Ihre Prompts gehen über einen Drittanbieter, senden Sie keine sensiblen Daten
- Einige akzeptieren Zahlungen in Krypto oder andere Workarounds
Betrachten Sie dies als Backup, nicht als primären Stack. Für echte Entwicklungen bleiben Sie bei AI Studio oder Vertex.
Welchen kostenlosen Flash-Weg sollten Sie wählen?
Ein einfacher Entscheidungsbaum:
- Möchten Sie nur chatten? Gemini App
- Prompts entwickeln? AI Studio Playground
- Software entwickeln? AI Studio API-Schlüssel
- Benötigen Sie ein höheres Kontingent und haben Sie ein neues GCP-Konto? Vertex AI-Guthaben
- Skripte vom Terminal aus? Gemini CLI
- Möchten Sie rohe Skalierung und haben nichts gegen Drittanbieter? OpenRouter und Ähnliche
Die meisten Entwickler verwenden zwei zusammen: den AI Studio-Schlüssel für die Hauptentwicklung und Vertex-Guthaben für Stresstests.
Kostenloses vs. kostenpflichtiges Flash: Wann ein Upgrade sinnvoll ist
Die kostenlose Stufe ist großzügig. Die meisten Nebenprojekte wachsen nie darüber hinaus. Drei Anzeichen, wann es Zeit ist, auf kostenpflichtiges Flash umzusteigen:
- Sie erreichen das Limit von 1.500 Anfragen/Tag an mehreren Tagen hintereinander. Führen Sie ein Upgrade durch. Kostenpflichtiges Flash ist günstig genug, dass die Entwicklungszeit, die Sie mit dem Umgehen von Quoten verbringen, teurer ist.
- Sie benötigen einen höheren Durchsatz pro Minute. Die kostenlose Stufe ist auf 15 RPM begrenzt; kostenpflichtige Stufen sind viel höher.
- Sie benötigen Datenresidenz oder Audit-Logs. Wechseln Sie zu Vertex AI mit einem kostenpflichtigen Konto.
Für die Preisberechnung der kostenpflichtigen Version (Token-Raten, Stapelrabatt, reale Kostenszenarien) siehe unseren Gemini 3.5 Flash-Preisleitfaden.
Vergleichen Sie die Upgrade-Mathematik auch mit benachbarten Modellen. GPT-5.5 und Claude Opus 4.7 haben beide eigene kostenlose Wege mit unterschiedlichen Limits; manchmal ist die günstigste Lösung, verschiedene Anbieter für unterschiedliche Workloads zu mischen. Der Dreier-Vergleich zeigt auf, wo jeder gewinnt.
Tipps, um die kostenlose Flash-Stufe optimal zu nutzen
Fünf kleine Gewohnheiten, die 1.500 Anfragen/Tag länger halten lassen:
- Aggressiv cachen. Idempotente Abfragen sollten Ihren Cache treffen, nicht die API.
- Batch-Modus für Massenarbeiten verwenden. Der Gemini API-Batch-Modus bietet Ihnen einen Rabatt von 50 % auf Nicht-Echtzeit-Jobs; er zählt auch gegen ein separates Kontingent.
- Strukturierte Ausgabe verwenden. Ein JSON-Schema-Prompt erledigt in einem Aufruf, was Regex-Parsing bei Freitext in drei Aufrufen tut.
- Eingaben in Apidog vorvalidieren. Apidogs Assertions fangen fehlerhafte Anfragen ab, bevor sie Kontingent verbrauchen.
- Standardmäßig Flash statt Pro wählen. Wenn Pro erscheint, wird es engere Kontingente haben. Bleiben Sie für Routinearbeiten bei Flash.
FAQ
Ist Gemini 3.5 Flash wirklich kostenlos? Ja, mit Einschränkungen. Die Gemini App, AI Studio und der AI Studio API-Schlüssel bieten alle Flash-Zugriff kostenlos mit täglichen Kontingenten. Für höheren Durchsatz gibt es kostenpflichtige Tarife.
Benötige ich eine Kreditkarte, um einen kostenlosen Flash-Schlüssel zu erhalten? Nein. Die kostenlose Stufe von AI Studio erfordert keine Karte. Vertex AI benötigt eine Karte für das 300 $-Guthaben, aber Sie werden erst belastet, wenn Sie ein Upgrade durchführen.
Kann ich den kostenlosen Flash-Schlüssel in der Produktion verwenden? Technisch ja, aber das Limit von 1.500 Anfragen/Tag wird schnell erreicht sein. Für die Produktion wechseln Sie zu einem kostenpflichtigen Konto oder Vertex AI.
Wird Gemini 3.5 Pro auch kostenlos sein? Google hat den Zugang zu Pro-Modellen in der GA (General Availability) historisch auf die kostenlose Stufe erweitert. Erwarten Sie Pro in AI Studio kostenlos mit engeren Kontingenten im nächsten Monat.
Kann ich kostenloses Flash in Cursor oder VS Code verwenden? Ja, beide unterstützen benutzerdefinierte API-Schlüssel. Das Muster ist dasselbe wie in unserem Gemini 3.0 Pro mit Cursor-Leitfaden, tauschen Sie einfach den Modell-String zu gemini-3.5-flash aus.
Gibt es Nutzungs-Logs in der kostenlosen Stufe? Ja. Öffnen Sie AI Studio, klicken Sie auf Ihr Projekt und sehen Sie sich den Tab "Aktivität" an.
Was ist der Haken? Zwei Dinge. Erstens kann die kostenlose Stufe Ihre Prompts nutzen, um Googles Modelle zu verbessern (Opt-out in den AI Studio-Einstellungen). Zweitens können sich die Ratenlimits der kostenlosen Stufe ohne Vorankündigung ändern, verlassen Sie sich bei einer Startfrist nicht darauf.
Ein Starterprojekt zum Testen der kostenlosen Flash-Stufe
Wählen Sie etwas Konkretes. Erstellen Sie eine kleine API, die eine URL nimmt, die Seite abruft und Flash verwendet, um sie zusammenzufassen.
import os, requests
from google import genai
client = genai.Client(api_key=os.environ["GEMINI_API_KEY"])
def summarize_url(url):
html = requests.get(url).text
response = client.models.generate_content(
model="gemini-3.5-flash",
contents=f"Summarize this webpage in 3 bullets:\n\n{html[:50000]}"
)
return response.text
print(summarize_url("https://blog.google/"))
Verbinden Sie es in Apidog, um die vollständige Anfrage/Antwort zu testen, und stellen Sie es dann in Cloud Run oder Ihrem bevorzugten Hosting bereit. Wenn Sie das versenden können, verstehen Sie den kostenlosen Flash-Weg von Anfang bis Ende.
