Resumo
O GPT-5.4 mini custa $0,75 por 1M de tokens de entrada e $4,50 por 1M de tokens de saída, com uma janela de contexto de 400k e 2x a velocidade do GPT-5 mini. Você pode chamar a API do GPT-5.4 mini usando o ID do modelo gpt-5.4-mini através da API da OpenAI e testá-lo visualmente com o Apidog ou programaticamente com Python, incluindo a escrita de um teste unitário para validar as respostas.
Introdução
A OpenAI anunciou o GPT-5.4 mini em março de 2026 como seu modelo pequeno mais capaz até o momento, oferecendo inteligência quase de ponta a uma fração do custo. Se você está avaliando a precificação do GPT-5.4 mini para uma carga de trabalho de produção, ou procurando integrar a API do GPT-5.4 mini em seu aplicativo, este guia cobre tudo o que você precisa. Abordaremos o detalhamento completo da precificação, as capacidades da API e duas formas práticas de integração: um fluxo de trabalho baseado em GUI usando o Apidog, e uma abordagem de código Python completa com um teste unitário para validar sua integração.
Detalhamento da Precificação do GPT-5.4 mini
A precificação do GPT-5.4 mini é projetada para tornar a IA de alta capacidade acessível para uso em produção de alto volume. Aqui está o que você precisa saber antes de começar a chamar a API do GPT-5.4 mini.
Custos de Tokens de Entrada e Saída do GPT-5.4 mini
A precificação principal do GPT-5.4 mini é direta:
- Tokens de entrada: $0,75 por 1M de tokens
- Tokens de saída: $4,50 por 1M de tokens
- Janela de contexto: 400.000 tokens
Para processamento regional (endpoints de residência de dados), a OpenAI aplica um aumento de preço de 10% sobre a precificação padrão do GPT-5.4 mini. Isso significa que os tokens de entrada custam $0,825/1M e os tokens de saída custam $4,95/1M ao usar endpoints regionais.
Comparação de Precificação GPT-5.4 mini vs GPT-5.4 nano
Para contextualizar a precificação do GPT-5.4 mini, veja como ela se compara ao restante da família GPT-5.4:
| Modelo | Entrada (por 1M de tokens) | Saída (por 1M de tokens) | Janela de Contexto |
|---|---|---|---|
| GPT-5.4 | ~$5,00 | ~$20,00 | 400k |
| GPT-5.4 mini | $0,75 | $4,50 | 400k |
| GPT-5.4 nano | $0,20 | $1,25 | 400k |
O GPT-5.4 nano é a opção mais barata, mas o GPT-5.4 mini atinge o ponto ideal entre custo e capacidade, especialmente para tarefas de codificação, raciocínio e multimodais onde o nano fica aquém.
Precificação do GPT-5.4 mini no Codex
Ao usar a API do GPT-5.4 mini dentro do ambiente Codex da OpenAI, o modelo consome apenas 30% da cota do GPT-5.4. Isso o torna ideal para configurações de multiagentes no Codex, onde um modelo maior como o GPT-5.4 lida com o planejamento e a coordenação, enquanto os subagentes do GPT-5.4 mini lidam com subtarefas paralelas a aproximadamente um terço do custo.
Capacidades da API do GPT-5.4 mini
A API do GPT-5.4 mini não é apenas um modelo mais barato, é um modelo genuinamente capaz. Aqui está o que ele suporta:
- Entradas de texto e imagem — multimodal por padrão
- Uso de ferramentas e chamada de função — saídas estruturadas para fluxos de trabalho agenticos
- Pesquisa na web — fundamentação embutida em dados da web em tempo real
- Pesquisa de arquivos — consulta em documentos carregados
- Uso de computador — interage com ambientes de desktop programaticamente
- Habilidades — módulos de tarefas combináveis
A API do GPT-5.4 mini é mais de 2x mais rápida que o GPT-5 mini e se aproxima do desempenho do GPT-5.4 em benchmarks importantes, incluindo o SWE-Bench Pro (engenharia de software) e o OSWorld-Verified (uso de computador). Está disponível via API da OpenAI, Codex e ChatGPT.
O ID do modelo a ser usado em suas chamadas da API do GPT-5.4 mini é:
gpt-5.4-mini
Como Usar a API do GPT-5.4 mini com Apidog
O Apidog é uma plataforma de desenvolvimento de API tudo-em-um que permite projetar, depurar, testar e documentar APIs sem escrever uma única linha de código. É a maneira mais rápida de fazer sua primeira chamada da API do GPT-5.4 mini e executar um teste unitário contra a resposta, tudo a partir de uma GUI limpa.
Baixe o Apidog gratuitamente e siga os passos abaixo.
Configurando a Requisição da API do GPT-5.4 mini no Apidog
- Abra o Apidog e crie um novo projeto (ex:
Teste da API do GPT-5.4 mini).
2. Crie uma nova requisição HTTP:
- Método:
POST - URL:
https://api.openai.com/v1/chat/completions
3. Adicione cabeçalhos na aba Headers:
| Chave | Valor |
|---|---|
Authorization | Bearer SUA_OPENAI_API_KEY |
Content-Type | application/json |
4. Defina o corpo da requisição (Corpo → JSON):
{
"model": "gpt-5.4-mini",
"messages": [
{
"role": "user",
"content": "Explique o que é um teste unitário em uma frase."
}
],
"temperature": 0.7,
"max_tokens": 200
}5. Clique em Enviar. O Apidog exibe a resposta completa, incluindo o uso de tokens que se relaciona diretamente com a precificação do GPT-5.4 mini para que você possa estimar os custos em tempo real.
Uma resposta bem-sucedida se parece com:
{
"id": "chatcmpl-abc123",
"object": "chat.completion",
"model": "gpt-5.4-mini",
"choices": [
{
"message": {
"role": "assistant",
"content": "Um teste unitário é uma verificação automatizada que valida se uma única função ou componente se comporta como esperado de forma isolada."
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 18,
"completion_tokens": 28,
"total_tokens": 46
}
}Escrevendo Testes Unitários para a API do GPT-5.4 mini no Apidog
O Apidog possui um motor de script de teste integrado. Após enviar sua requisição, vá para a aba Tests e adicione asserções para criar um teste unitário para a resposta da API do GPT-5.4 mini:
// Teste unitário 1: Verifica se o status HTTP é 200
pm.test("O código de status é 200", function () {
pm.response.to.have.status(200);
});
// Teste unitário 2: Confirma que o modelo correto foi usado
pm.test("O modelo da API GPT-5.4 mini está correto", function () {
const json = pm.response.json();
pm.expect(json.model).to.include("gpt-5.4-mini");
});
// Teste unitário 3: A resposta contém uma mensagem
pm.test("A resposta possui mensagem do assistente", function () {
const json = pm.response.json();
pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});
// Teste unitário 4: O uso de tokens é reportado (para rastreamento da precificação do GPT-5.4 mini)
pm.test("O uso de tokens está presente", function () {
const json = pm.response.json();
pm.expect(json.usage.total_tokens).to.be.above(0);
});
Essas quatro asserções de teste unitário cobrem os aspectos mais críticos de uma integração da API do GPT-5.4 mini: status, identidade do modelo, conteúdo da resposta e uso de tokens. O Apidog executa todas elas automaticamente cada vez que você clica em Enviar, facilitando a identificação de regressões à medida que você itera.
Você também pode salvar esta requisição como parte de um conjunto de testes do Apidog e executá-la em pipelines de CI/CD usando o executor CLI do Apidog.
Como Usar a API do GPT-5.4 mini com Python
Para integrações de produção, aqui está um exemplo completo em Python chamando a API do GPT-5.4 mini com um teste unitário usando pytest.
Instalação
pip install openai pytest
Chamada Básica da API do GPT-5.4 mini
# gpt54mini_client.py
from openai import OpenAI
client = OpenAI() # lê OPENAI_API_KEY do ambiente
def ask_gpt54_mini(prompt: str) -> dict:
"""Chama a API do GPT-5.4 mini e retorna a resposta completa."""
response = client.chat.completions.create(
model="gpt-5.4-mini", # ID do modelo da API do GPT-5.4 mini
messages=[
{"role": "user", "content": prompt}
],
temperature=0.7,
max_tokens=500
)
return {
"content": response.choices[0].message.content,
"model": response.model,
"total_tokens": response.usage.total_tokens,
"prompt_tokens": response.usage.prompt_tokens,
"completion_tokens": response.usage.completion_tokens,
}
if __name__ == "__main__":
result = ask_gpt54_mini("O que é um teste unitário?")
print(result["content"])
# Estima o custo com base na Precificação do GPT-5.4 mini
input_cost = (result["prompt_tokens"] / 1_000_000) * 0.75
output_cost = (result["completion_tokens"] / 1_000_000) * 4.50
print(f"Custo estimado: ${input_cost + output_cost:.6f}")
Teste Unitário para a API do GPT-5.4 mini
# test_gpt54mini_client.py
import pytest
from unittest.mock import patch, MagicMock
from gpt54mini_client import ask_gpt54_mini
@pytest.fixture
def mock_openai_response():
"""Simula a resposta da API do GPT-5.4 mini para teste unitário."""
mock_response = MagicMock()
mock_response.choices[0].message.content = (
"Um teste unitário verifica uma única função de forma isolada."
)
mock_response.model = "gpt-5.4-mini"
mock_response.usage.total_tokens = 46
mock_response.usage.prompt_tokens = 18
mock_response.usage.completion_tokens = 28
return mock_response
@patch("gpt54mini_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_openai_response):
"""Teste unitário: a API do GPT-5.4 mini retorna conteúdo não vazio."""
mock_create.return_value = mock_openai_response
result = ask_gpt54_mini("O que é um teste unitário?")
assert isinstance(result["content"], str)
assert len(result["content"]) > 0
@patch("gpt54mini_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_openai_response):
"""Teste unitário: confirma que o ID do modelo gpt-5.4-mini é usado."""
mock_create.return_value = mock_openai_response
result = ask_gpt54_mini("Olá")
assert result["model"] == "gpt-5.4-mini"
@patch("gpt54mini_client.client.chat.completions.create")
def test_token_usage_reported(mock_create, mock_openai_response):
"""Teste unitário: o uso de tokens está presente para o rastreamento da precificação do GPT-5.4 mini."""
mock_create.return_value = mock_openai_response
result = ask_gpt54_mini("Olá")
assert result["total_tokens"] > 0
assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]
Execute os testes unitários:
pytest test_gpt54mini_client.py -v
Saída esperada:
test_gpt54mini_client.py::test_returns_content APROVADO
test_gpt54mini_client.py::test_correct_model APROVADO
test_gpt54mini_client.py::test_token_usage_reported APROVADO
3 aprovados em 0.31s
Simular a API do GPT-5.4 mini em seu conjunto de testes unitários significa que você não queima tokens durante as execuções de CI, o que é crucial para manter os custos de precificação do GPT-5.4 mini sob controle em pipelines automatizados.
Melhores Práticas da API do GPT-5.4 mini
Tirar o máximo proveito da API do GPT-5.4 mini significa ser deliberado sobre como você a usa. Aqui estão as principais práticas:
1. Sempre rastreie o uso de tokens para controle da precificação do GPT-5.4 mini Registre prompt_tokens e completion_tokens por requisição. A $0,75/1M de entrada e $4,50/1M de saída, os custos aumentam rapidamente com prompts verbosos. Mantenha os prompts de sistema concisos.
2. Use o Apidog para testes exploratórios antes de escrever código Antes de construir uma integração completa, use o Apidog para prototipar seus prompts e validar o formato da resposta da API do GPT-5.4 mini. Isso economiza tempo e evita tokens desperdiçados durante o desenvolvimento.
3. Escreva testes unitários cedo Adicione um teste unitário para cada função que chama a API do GPT-5.4 mini. Simule a resposta da API para que seu conjunto de testes execute rápido e gratuitamente. Use os scripts de teste do Apidog para cobertura de testes unitários baseados em GUI e pytest com unittest.mock para cobertura em nível de código.
4. Use a janela de contexto de 400k estrategicamente A API do GPT-5.4 mini suporta 400k tokens de contexto, mas você paga por cada token. Para pipelines RAG, recupere apenas os trechos mais relevantes em vez de preencher a janela de contexto completa.
5. Evite endpoints regionais, a menos que seja necessário O processamento regional adiciona um aumento de 10% à precificação do GPT-5.4 mini. Use endpoints de residência de dados apenas se seus requisitos de conformidade exigirem.
6. Delegue ao GPT-5.4 mini em sistemas multiagentes Em pipelines Codex ou agenticos, use o GPT-5.4 para planejamento e o GPT-5.4 mini para subtarefas paralelas. A 30% da cota do GPT-5.4, a API do GPT-5.4 mini é a ferramenta certa para tarefas de alta frequência e escopo restrito.
Conclusão
A precificação do GPT-5.4 mini de $0,75/1M de entrada e $4,50/1M de saída o torna uma das maneiras mais econômicas de acessar capacidades de IA quase de ponta. A API do GPT-5.4 mini suporta entradas multimodais, chamada de função, pesquisa na web e muito mais, tudo com o dobro da velocidade de seu antecessor.
Quer você esteja prototipando com a GUI do Apidog, escrevendo código Python de produção ou configurando um conjunto de testes unitários para validar sua integração, a API do GPT-5.4 mini se encaixa perfeitamente nos fluxos de trabalho de desenvolvimento modernos. Comece com o Apidog para explorar a API visualmente e, em seguida, avance para o código com confiança.
Experimente o Apidog gratuitamente, sem necessidade de cartão de crédito.
Perguntas Frequentes
Qual é a Precificação do GPT-5.4 mini? O GPT-5.4 mini custa $0,75 por 1M de tokens de entrada e $4,50 por 1M de tokens de saída. Os endpoints de processamento regional adicionam um aumento de 10% à precificação padrão do GPT-5.4 mini.
Qual é o ID do modelo da API do GPT-5.4 mini? Use gpt-5.4-mini como parâmetro de modelo em suas chamadas da API do GPT-5.4 mini.
Como testar a API do GPT-5.4 mini sem escrever código? Use o Apidog. Crie uma requisição POST para https://api.openai.com/v1/chat/completions com sua chave de API e o ID do modelo gpt-5.4-mini. O Apidog também permite escrever asserções de teste unitário diretamente na interface do usuário.
Como escrever um teste unitário para a API do GPT-5.4 mini? Simule o cliente da API usando unittest.mock em Python e faça asserções sobre a estrutura da resposta. No Apidog, use a aba Tests para adicionar asserções de teste unitário baseadas em JavaScript após cada requisição.
Como a precificação do GPT-5.4 mini se compara ao GPT-5.4 nano? O GPT-5.4 nano é mais barato, a $0,20/1M de entrada e $1,25/1M de saída, mas o GPT-5.4 mini oferece um desempenho significativamente melhor em benchmarks de codificação e raciocínio como o SWE-Bench Pro.
Posso usar a API do GPT-5.4 mini no Codex? Sim. A API do GPT-5.4 mini está disponível no Codex e consome apenas 30% da cota do GPT-5.4, tornando-a ideal para tarefas de subagente paralelas.
O GPT-5.4 mini está disponível no ChatGPT? Sim. O GPT-5.4 mini está disponível via API da OpenAI, Codex e ChatGPT.
