Quanto Custa a API Gemini 3.0 em 2025: Preços e Custos

Ashley Innocent

Ashley Innocent

18 novembro 2025

Quanto Custa a API Gemini 3.0 em 2025: Preços e Custos

Desenvolvedores e empresas dependem cada vez mais de modelos multimodais avançados, como a série Gemini do Google, para aplicações de produção. À medida que o Google lança o modelo Gemini 3 Pro Preview em novembro de 2025, entender os custos de sua API torna-se essencial para o orçamento e escalonamento. Esta versão de pré-visualização, acessível via Google AI Studio e Vertex AI, introduz raciocínio aprimorado, janelas de contexto mais longas e uso nativo de ferramentas.

💡
Além disso, o rastreamento preciso de custos garante uma integração eficiente. Para simplificar o teste e a depuração das chamadas da API Gemini 3, baixe o Apidog gratuitamente – ele oferece validação poderosa de solicitações, servidores de mock e estimativa de custos em tempo real adaptados para APIs de IA.
button

O Google precifica a API Gemini 3 em um modelo de pagamento por uso de token para acesso de pré-visualização. Não há cota diária gratuita além do uso limitado do AI Studio, mas os modelos de pré-visualização geralmente começam com faturamento reduzido ou isento durante o lançamento inicial. Este artigo detalha as taxas confirmadas do banner oficial de pré-visualização em 18 de novembro de 2025.

Principais Capacidades do Gemini 3 Pro Preview

O Google equipa o Gemini 3 Pro com melhorias revolucionárias em relação ao Gemini 2.5. Ele se destaca no raciocínio de longo contexto (até 1-2 milhões de tokens esperados na versão estável), uso nativo de ferramentas, saída estruturada e compreensão multimodal. Os desenvolvedores o utilizam para fluxos de trabalho de agentes complexos, análise de vídeo, geração de código com feedback de execução e prompting avançado de cadeia de pensamento.

Custos da API Gemini 3 Pro Preview

O modelo suporta respostas de streaming, chamada de função e instruções de sistema nativamente. Além disso, ele lida com entradas de vídeo diretamente, tornando-o ideal para aplicações em educação, criação de conteúdo e pesquisa científica.

A fase de pré-visualização permite acesso antecipado no Google AI Studio com um selo “Novo”. As cargas de trabalho de produção fazem a transição para a API Gemini 3 completa assim que o Google estabiliza o modelo, tipicamente dentro de semanas após o lançamento da pré-visualização.

Detalhes Oficiais de Preços da API Gemini 3 Pro (Novembro de 2025)

O Google baseia os preços do Gemini 3 Pro Preview estritamente nos tokens consumidos, com um ponto de interrupção claro para o comprimento do contexto:

Comprimento do Contexto Entrada (por 1M tokens) Saída (por 1M tokens)
≤ 200.000 tokens $2.00 $12.00
> 200.000 tokens $4.00 $18.00

Essas taxas se aplicam ao modelo gemini-3-pro-preview na API Gemini e no AI Studio quando o faturamento é ativado. O Google conta os tokens de entrada do prompt (texto + conteúdo multimodal) e os tokens de saída do texto gerado ou dados estruturados. Entradas de vídeo e áudio são convertidas para contagens de tokens equivalentes com base na duração e resolução.

O Google ainda não oferece desconto por lote ou desconto de cache de contexto para a pré-visualização. No entanto, o grounding com a Pesquisa Google permanece gratuito até os limites diários no AI Studio. O ajuste fino (fine-tuning) não está disponível na pré-visualização; ele chega com o lançamento estável.

O uso do Google AI Studio permanece gratuito para experimentação razoável, mas chamadas de API de alto volume ou roteirizadas acionam o faturamento de pagamento por uso automaticamente assim que você vincula um projeto do Cloud.

Como Funciona a Contagem de Tokens no Gemini 3 Pro

O Google conta os tokens usando o mesmo tokenizador dos modelos Gemini anteriores. O texto tem em média ~4 caracteres por token, enquanto imagens e vídeos usam equivalentes fixos (por exemplo, um vídeo de 1 minuto em 720p ≈ 10-15K tokens, variando pela complexidade do conteúdo).

Os desenvolvedores podem chamar o endpoint countTokens antecipadamente para pré-visualizar os custos exatos:

from google.generativeai import GenerativeModel, count_tokens

model = GenerativeModel("gemini-3-pro-preview")
tokens = count_tokens(model, contents=["Your prompt here..."])
print(tokens.total_tokens)

Esta etapa evita surpresas, especialmente com prompts de longo contexto que excedem 200K tokens, onde as taxas dobram.

Cálculos de Custo Reais para a API Gemini 3 Pro

Engenheiros estimam despesas com precisão com estes exemplos:

Consulta de chat padrão (5K entrada + 1K saída, <200K contexto)
→ Entrada: 5K × $2 / 1M = $0.00001
→ Saída: 1K × $12 / 1M = $0.000012
→ Total ≈ $0.000022 (sub-centavo)

Análise de documento (150K entrada + 8K saída)
→ Entrada: $0.30
→ Saída: $0.096
→ Total ≈ $0.40 por solicitação

Tarefa de pesquisa de longo contexto (350K entrada + 15K saída)
→ Entrada: 350K × $4 / 1M = $1.40
→ Saída: 15K × $18 / 1M = $0.27
→ Total ≈ $1.67 por solicitação

Uma aplicação de tráfego moderado processando 100 solicitações de longo contexto diariamente incorre em ~$50–$70 mensalmente. Fluxos de trabalho de agente de alto volume com vídeo podem facilmente atingir milhares de dólares sem otimização.

Acesso Gratuito e Limitações da Pré-visualização

O Google oferece acesso gratuito ao Gemini 3 Pro Preview no AI Studio para uso interativo. Limites de taxa se aplicam (tipicamente 10-50 RPM dependendo da região e idade da conta), mas não há cobranças para sessões manuais.

O acesso à API roteirizada requer um projeto do Google Cloud. Novos projetos começam na camada gratuita com limites generosos para modelos de pré-visualização, mas o uso intenso rapidamente passa para o faturamento pago. O Google frequentemente isenta as cobranças inteiramente durante as primeiras semanas de uma pré-visualização — muitos desenvolvedores relatam contas de $0 mesmo após milhares de solicitações em novembro de 2025.

Assim que o modelo se tornar estável (esperado para dezembro de 2025–Q1 2026), o preço total se aplica sem exceção.

Integrando e Monitorando a API Gemini 3 com Apidog

O Apidog simplifica o trabalho com a API Gemini 3. Importe a especificação oficial OpenAPI do Google, defina sua chave de API como uma variável de ambiente e envie solicitações diretamente.

Os principais benefícios incluem:

Crie uma nova solicitação para https://generativelanguage.googleapis.com/v1/models/gemini-3-pro-preview:generateContent, cole seu payload JSON e clique em enviar. O Apidog analisa os metadados de uso (tokens de entrada/saída) instantaneamente, ajudando você a se manter dentro do orçamento.

Estratégias de Otimização de Custos para o Gemini 3 Pro

Engenheiros reduzem as despesas significativamente com estas técnicas comprovadas:

A combinação dessas práticas rotineiramente reduz as contas em 40-70%.

Comparação com Outros Modelos Principais (Novembro de 2025)

Modelo Entrada ≤200K Saída ≤200K Entrada >200K Saída >200K Notas
Gemini 3 Pro Preview $2.00 $12.00 $4.00 $18.00 Maior capacidade de raciocínio
Gemini 2.5 Pro $1.25 $10.00 $2.50 $15.00 Modelo principal anterior
Claude 3.5 Sonnet $3.00 $15.00 Mesmo Mesmo Sem premium para longo contexto

O Gemini 3 Pro exige um prêmio por seu raciocínio superior e futuro contexto de 1M+, mas a saída permanece competitiva com outros modelos principais.

Perspectiva Futura de Preços

O Google tipicamente reduz as taxas em 20-50% quando um modelo de pré-visualização se torna estável e a eficiência melhora. Espere que os preços estáveis do Gemini 3 Pro no início de 2026 se estabeleçam em torno de $1.50/$10 (≤200K) e $3/$15 (>200K), com descontos de cache e lote introduzidos simultaneamente.

Conclusão

A API Gemini 3 Pro é lançada com preços transparentes e em camadas de contexto: $2.00/$12.00 por milhão de tokens até 200K de contexto e $4.00/$18.00 além disso. O acesso de pré-visualização permanece essencialmente gratuito para testes no AI Studio, enquanto o uso em produção segue o modelo de pagamento por uso.

Aproveite ferramentas como o Apidog para monitorar cada token e otimizar os prompts desde o primeiro dia. Essa abordagem permite que os desenvolvedores utilizem o modelo mais inteligente do Google sem surpresas orçamentárias. À medida que o modelo se estabiliza, espere refinamentos que o tornarão ainda mais econômico para cargas de trabalho multimodais e com raciocínio intensivo.

button

Pratique o design de API no Apidog

Descubra uma forma mais fácil de construir e usar APIs