GPT-5.4 mini Preço e Como Usar a API GPT-5.4 mini

Herve Kom

Herve Kom

20 março 2026

GPT-5.4 mini Preço e Como Usar a API GPT-5.4 mini

Apidog para empresas

Implantação local

SSO & RBAC

Conforme SOC 2

Explorar Apidog Enterprise

Resumo

O GPT-5.4 mini custa $0,75 por 1M de tokens de entrada e $4,50 por 1M de tokens de saída, com uma janela de contexto de 400k e 2x a velocidade do GPT-5 mini. Você pode chamar a API do GPT-5.4 mini usando o ID do modelo gpt-5.4-mini através da API da OpenAI e testá-lo visualmente com o Apidog ou programaticamente com Python, incluindo a escrita de um teste unitário para validar as respostas.

Introdução

A OpenAI anunciou o GPT-5.4 mini em março de 2026 como seu modelo pequeno mais capaz até o momento, oferecendo inteligência quase de ponta a uma fração do custo. Se você está avaliando a precificação do GPT-5.4 mini para uma carga de trabalho de produção, ou procurando integrar a API do GPT-5.4 mini em seu aplicativo, este guia cobre tudo o que você precisa. Abordaremos o detalhamento completo da precificação, as capacidades da API e duas formas práticas de integração: um fluxo de trabalho baseado em GUI usando o Apidog, e uma abordagem de código Python completa com um teste unitário para validar sua integração.

💡
Antes de chamar a API do GPT-5.4 mini, baixe o Apidog gratuitamente. Você pode testar prompts, inspecionar respostas, adicionar asserções de teste unitário e rastrear o uso de tokens visualmente, tudo sem gastar um único token ou escrever qualquer código.
Baixar aplicativo

Detalhamento da Precificação do GPT-5.4 mini

A precificação do GPT-5.4 mini é projetada para tornar a IA de alta capacidade acessível para uso em produção de alto volume. Aqui está o que você precisa saber antes de começar a chamar a API do GPT-5.4 mini.

Custos de Tokens de Entrada e Saída do GPT-5.4 mini

A precificação principal do GPT-5.4 mini é direta:

Para processamento regional (endpoints de residência de dados), a OpenAI aplica um aumento de preço de 10% sobre a precificação padrão do GPT-5.4 mini. Isso significa que os tokens de entrada custam $0,825/1M e os tokens de saída custam $4,95/1M ao usar endpoints regionais.

Comparação de Precificação GPT-5.4 mini vs GPT-5.4 nano

Para contextualizar a precificação do GPT-5.4 mini, veja como ela se compara ao restante da família GPT-5.4:

ModeloEntrada (por 1M de tokens)Saída (por 1M de tokens)Janela de Contexto
GPT-5.4~$5,00~$20,00400k
GPT-5.4 mini$0,75$4,50400k
GPT-5.4 nano$0,20$1,25400k

O GPT-5.4 nano é a opção mais barata, mas o GPT-5.4 mini atinge o ponto ideal entre custo e capacidade, especialmente para tarefas de codificação, raciocínio e multimodais onde o nano fica aquém.

Precificação do GPT-5.4 mini no Codex

Ao usar a API do GPT-5.4 mini dentro do ambiente Codex da OpenAI, o modelo consome apenas 30% da cota do GPT-5.4. Isso o torna ideal para configurações de multiagentes no Codex, onde um modelo maior como o GPT-5.4 lida com o planejamento e a coordenação, enquanto os subagentes do GPT-5.4 mini lidam com subtarefas paralelas a aproximadamente um terço do custo.

Capacidades da API do GPT-5.4 mini

A API do GPT-5.4 mini não é apenas um modelo mais barato, é um modelo genuinamente capaz. Aqui está o que ele suporta:

A API do GPT-5.4 mini é mais de 2x mais rápida que o GPT-5 mini e se aproxima do desempenho do GPT-5.4 em benchmarks importantes, incluindo o SWE-Bench Pro (engenharia de software) e o OSWorld-Verified (uso de computador). Está disponível via API da OpenAI, Codex e ChatGPT.

O ID do modelo a ser usado em suas chamadas da API do GPT-5.4 mini é:

gpt-5.4-mini

Como Usar a API do GPT-5.4 mini com Apidog

O Apidog é uma plataforma de desenvolvimento de API tudo-em-um que permite projetar, depurar, testar e documentar APIs sem escrever uma única linha de código. É a maneira mais rápida de fazer sua primeira chamada da API do GPT-5.4 mini e executar um teste unitário contra a resposta, tudo a partir de uma GUI limpa.

Baixe o Apidog gratuitamente e siga os passos abaixo.

Baixar aplicativo

Configurando a Requisição da API do GPT-5.4 mini no Apidog

  1. Abra o Apidog e crie um novo projeto (ex: Teste da API do GPT-5.4 mini).

2. Crie uma nova requisição HTTP:

3. Adicione cabeçalhos na aba Headers:

ChaveValor
AuthorizationBearer SUA_OPENAI_API_KEY
Content-Typeapplication/json

4. Defina o corpo da requisição (Corpo → JSON):

{
  "model": "gpt-5.4-mini",
  "messages": [
    {
      "role": "user",
      "content": "Explique o que é um teste unitário em uma frase."
    }
  ],
  "temperature": 0.7,
  "max_tokens": 200
}

5. Clique em Enviar. O Apidog exibe a resposta completa, incluindo o uso de tokens que se relaciona diretamente com a precificação do GPT-5.4 mini para que você possa estimar os custos em tempo real.

Uma resposta bem-sucedida se parece com:

{
  "id": "chatcmpl-abc123",
  "object": "chat.completion",
  "model": "gpt-5.4-mini",
  "choices": [
    {
      "message": {
        "role": "assistant",
        "content": "Um teste unitário é uma verificação automatizada que valida se uma única função ou componente se comporta como esperado de forma isolada."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 18,
    "completion_tokens": 28,
    "total_tokens": 46
  }
}

Escrevendo Testes Unitários para a API do GPT-5.4 mini no Apidog

O Apidog possui um motor de script de teste integrado. Após enviar sua requisição, vá para a aba Tests e adicione asserções para criar um teste unitário para a resposta da API do GPT-5.4 mini:

// Teste unitário 1: Verifica se o status HTTP é 200
pm.test("O código de status é 200", function () {
  pm.response.to.have.status(200);
});

// Teste unitário 2: Confirma que o modelo correto foi usado
pm.test("O modelo da API GPT-5.4 mini está correto", function () {
  const json = pm.response.json();
  pm.expect(json.model).to.include("gpt-5.4-mini");
});

// Teste unitário 3: A resposta contém uma mensagem
pm.test("A resposta possui mensagem do assistente", function () {
  const json = pm.response.json();
  pm.expect(json.choices[0].message.content).to.be.a("string").and.not.empty;
});

// Teste unitário 4: O uso de tokens é reportado (para rastreamento da precificação do GPT-5.4 mini)
pm.test("O uso de tokens está presente", function () {
  const json = pm.response.json();
  pm.expect(json.usage.total_tokens).to.be.above(0);
});

Essas quatro asserções de teste unitário cobrem os aspectos mais críticos de uma integração da API do GPT-5.4 mini: status, identidade do modelo, conteúdo da resposta e uso de tokens. O Apidog executa todas elas automaticamente cada vez que você clica em Enviar, facilitando a identificação de regressões à medida que você itera.

Você também pode salvar esta requisição como parte de um conjunto de testes do Apidog e executá-la em pipelines de CI/CD usando o executor CLI do Apidog.

Como Usar a API do GPT-5.4 mini com Python

Para integrações de produção, aqui está um exemplo completo em Python chamando a API do GPT-5.4 mini com um teste unitário usando pytest.

Instalação

pip install openai pytest

Chamada Básica da API do GPT-5.4 mini

# gpt54mini_client.py
from openai import OpenAI

client = OpenAI()  # lê OPENAI_API_KEY do ambiente

def ask_gpt54_mini(prompt: str) -> dict:
    """Chama a API do GPT-5.4 mini e retorna a resposta completa."""
    response = client.chat.completions.create(
        model="gpt-5.4-mini",  # ID do modelo da API do GPT-5.4 mini
        messages=[
            {"role": "user", "content": prompt}
        ],
        temperature=0.7,
        max_tokens=500
    )
    return {
        "content": response.choices[0].message.content,
        "model": response.model,
        "total_tokens": response.usage.total_tokens,
        "prompt_tokens": response.usage.prompt_tokens,
        "completion_tokens": response.usage.completion_tokens,
    }


if __name__ == "__main__":
    result = ask_gpt54_mini("O que é um teste unitário?")
    print(result["content"])
    # Estima o custo com base na Precificação do GPT-5.4 mini
    input_cost = (result["prompt_tokens"] / 1_000_000) * 0.75
    output_cost = (result["completion_tokens"] / 1_000_000) * 4.50
    print(f"Custo estimado: ${input_cost + output_cost:.6f}")

Teste Unitário para a API do GPT-5.4 mini

# test_gpt54mini_client.py
import pytest
from unittest.mock import patch, MagicMock
from gpt54mini_client import ask_gpt54_mini


@pytest.fixture
def mock_openai_response():
    """Simula a resposta da API do GPT-5.4 mini para teste unitário."""
    mock_response = MagicMock()
    mock_response.choices[0].message.content = (
        "Um teste unitário verifica uma única função de forma isolada."
    )
    mock_response.model = "gpt-5.4-mini"
    mock_response.usage.total_tokens = 46
    mock_response.usage.prompt_tokens = 18
    mock_response.usage.completion_tokens = 28
    return mock_response


@patch("gpt54mini_client.client.chat.completions.create")
def test_returns_content(mock_create, mock_openai_response):
    """Teste unitário: a API do GPT-5.4 mini retorna conteúdo não vazio."""
    mock_create.return_value = mock_openai_response
    result = ask_gpt54_mini("O que é um teste unitário?")
    assert isinstance(result["content"], str)
    assert len(result["content"]) > 0


@patch("gpt54mini_client.client.chat.completions.create")
def test_correct_model(mock_create, mock_openai_response):
    """Teste unitário: confirma que o ID do modelo gpt-5.4-mini é usado."""
    mock_create.return_value = mock_openai_response
    result = ask_gpt54_mini("Olá")
    assert result["model"] == "gpt-5.4-mini"


@patch("gpt54mini_client.client.chat.completions.create")
def test_token_usage_reported(mock_create, mock_openai_response):
    """Teste unitário: o uso de tokens está presente para o rastreamento da precificação do GPT-5.4 mini."""
    mock_create.return_value = mock_openai_response
    result = ask_gpt54_mini("Olá")
    assert result["total_tokens"] > 0
    assert result["prompt_tokens"] + result["completion_tokens"] == result["total_tokens"]

Execute os testes unitários:

pytest test_gpt54mini_client.py -v

Saída esperada:

test_gpt54mini_client.py::test_returns_content     APROVADO
test_gpt54mini_client.py::test_correct_model       APROVADO
test_gpt54mini_client.py::test_token_usage_reported APROVADO

3 aprovados em 0.31s

Simular a API do GPT-5.4 mini em seu conjunto de testes unitários significa que você não queima tokens durante as execuções de CI, o que é crucial para manter os custos de precificação do GPT-5.4 mini sob controle em pipelines automatizados.

Melhores Práticas da API do GPT-5.4 mini

Tirar o máximo proveito da API do GPT-5.4 mini significa ser deliberado sobre como você a usa. Aqui estão as principais práticas:

1. Sempre rastreie o uso de tokens para controle da precificação do GPT-5.4 mini Registre prompt_tokens e completion_tokens por requisição. A $0,75/1M de entrada e $4,50/1M de saída, os custos aumentam rapidamente com prompts verbosos. Mantenha os prompts de sistema concisos.

2. Use o Apidog para testes exploratórios antes de escrever código Antes de construir uma integração completa, use o Apidog para prototipar seus prompts e validar o formato da resposta da API do GPT-5.4 mini. Isso economiza tempo e evita tokens desperdiçados durante o desenvolvimento.

3. Escreva testes unitários cedo Adicione um teste unitário para cada função que chama a API do GPT-5.4 mini. Simule a resposta da API para que seu conjunto de testes execute rápido e gratuitamente. Use os scripts de teste do Apidog para cobertura de testes unitários baseados em GUI e pytest com unittest.mock para cobertura em nível de código.

4. Use a janela de contexto de 400k estrategicamente A API do GPT-5.4 mini suporta 400k tokens de contexto, mas você paga por cada token. Para pipelines RAG, recupere apenas os trechos mais relevantes em vez de preencher a janela de contexto completa.

5. Evite endpoints regionais, a menos que seja necessário O processamento regional adiciona um aumento de 10% à precificação do GPT-5.4 mini. Use endpoints de residência de dados apenas se seus requisitos de conformidade exigirem.

6. Delegue ao GPT-5.4 mini em sistemas multiagentes Em pipelines Codex ou agenticos, use o GPT-5.4 para planejamento e o GPT-5.4 mini para subtarefas paralelas. A 30% da cota do GPT-5.4, a API do GPT-5.4 mini é a ferramenta certa para tarefas de alta frequência e escopo restrito.

Conclusão

A precificação do GPT-5.4 mini de $0,75/1M de entrada e $4,50/1M de saída o torna uma das maneiras mais econômicas de acessar capacidades de IA quase de ponta. A API do GPT-5.4 mini suporta entradas multimodais, chamada de função, pesquisa na web e muito mais, tudo com o dobro da velocidade de seu antecessor.

Quer você esteja prototipando com a GUI do Apidog, escrevendo código Python de produção ou configurando um conjunto de testes unitários para validar sua integração, a API do GPT-5.4 mini se encaixa perfeitamente nos fluxos de trabalho de desenvolvimento modernos. Comece com o Apidog para explorar a API visualmente e, em seguida, avance para o código com confiança.

Experimente o Apidog gratuitamente, sem necessidade de cartão de crédito.

Baixar aplicativo

Perguntas Frequentes

Qual é a Precificação do GPT-5.4 mini? O GPT-5.4 mini custa $0,75 por 1M de tokens de entrada e $4,50 por 1M de tokens de saída. Os endpoints de processamento regional adicionam um aumento de 10% à precificação padrão do GPT-5.4 mini.

Qual é o ID do modelo da API do GPT-5.4 mini? Use gpt-5.4-mini como parâmetro de modelo em suas chamadas da API do GPT-5.4 mini.

Como testar a API do GPT-5.4 mini sem escrever código? Use o Apidog. Crie uma requisição POST para https://api.openai.com/v1/chat/completions com sua chave de API e o ID do modelo gpt-5.4-mini. O Apidog também permite escrever asserções de teste unitário diretamente na interface do usuário.

Como escrever um teste unitário para a API do GPT-5.4 mini? Simule o cliente da API usando unittest.mock em Python e faça asserções sobre a estrutura da resposta. No Apidog, use a aba Tests para adicionar asserções de teste unitário baseadas em JavaScript após cada requisição.

Como a precificação do GPT-5.4 mini se compara ao GPT-5.4 nano? O GPT-5.4 nano é mais barato, a $0,20/1M de entrada e $1,25/1M de saída, mas o GPT-5.4 mini oferece um desempenho significativamente melhor em benchmarks de codificação e raciocínio como o SWE-Bench Pro.

Posso usar a API do GPT-5.4 mini no Codex? Sim. A API do GPT-5.4 mini está disponível no Codex e consome apenas 30% da cota do GPT-5.4, tornando-a ideal para tarefas de subagente paralelas.

O GPT-5.4 mini está disponível no ChatGPT? Sim. O GPT-5.4 mini está disponível via API da OpenAI, Codex e ChatGPT.

Pratique o design de API no Apidog

Descubra uma forma mais fácil de construir e usar APIs