No dia 13 de maio, um novo modelo ChatGPT chamado GPT-4o foi anunciado. Comparado aos modelos anteriores, o GPT-4o tem um tempo de resposta duas vezes mais rápido do que os modelos anteriores e pode entender texto, imagens, áudio e vídeo. Neste artigo, forneceremos uma explicação abrangente das informações básicas sobre o mais recente modelo GPT-4o da OpenAI e apresentaremos como integrar a API do GPT-4o em seus próprios serviços.
O Apidog também é uma ferramenta completamente gratuita, então comece clicando no botão abaixo! 👇👇👇
O que é o GPT-4o?
O GPT-4o é o mais recente modelo de IA anunciado pela OpenAI no dia 13 de maio. O "o" em "4o" significa "omni," que significa "abrangente." Ao contrário das interações anteriores baseadas em texto e imagem com o ChatGPT, o GPT-4o permite que você interaja com ele usando uma combinação de texto, áudio, imagens e vídeo.

Para mais detalhes, visite o site oficial: https://openai.com/index/hello-gpt-4o/
Principais Recursos do GPT-4o
Então, quais recursos o mais recente modelo da OpenAI, o GPT-4o, possui em comparação com os modelos anteriores?
Tempo de Resposta 2X Mais Rápido
De acordo com a OpenAI, há três etapas necessárias para que o GPT-4 tenha uma conversa com humanos:
- Converter fala em texto
- Gerar texto de resposta
- Converter texto em fala
Nos modelos anteriores, o atraso médio nesse processo era de 2,8 segundos para o GPT-3.5 e 5,4 segundos para o GPT-4. No entanto, o atual GPT-4o pode responder em apenas 232 milissegundos, com um tempo de resposta médio de 320 milissegundos, que é quase a mesma velocidade de reação de um humano. Em outras palavras, usar o mais recente modelo GPT-4o pode permitir uma interação quase em tempo real com a IA.
Entende o Tom do Áudio
Os modelos anteriores do GPT não conseguiam reconhecer o tom da voz do falante ou o ruído de fundo, causando a perda de algumas informações nas conversas. No entanto, com a introdução do GPT-4o, agora ele pode entender os tokens de áudio do falante, ou emoções, tornando-o mais humano.

Redução de Tokens para Muitas Línguas
Além disso, o GPT-4o comprimiu o número de tokens usados para 20 idiomas, como o japonês. Usando o japonês como exemplo, significa que ao usar o ChatGPT em japonês, serão usados menos tokens.
- Para a interação "Olá, meu nome é GPT-4o. Eu sou um novo tipo de modelo de linguagem. Prazer em conhecê-lo," o número de tokens usados foi reduzido de 37 para 26, uma redução de 1,4 vezes.


Outras Informações Importantes do Anúncio do GPT-4o
Além dos recursos do próprio modelo GPT-4o, as seguintes informações também foram destacadas no anúncio do GPT-4o:
Quase Todos os Serviços são Gratuitos
Serviços anteriormente pagos como GPTs, GPT Store e GPT-4 serão disponibilizados gratuitamente após o anúncio do GPT-4o.
Aplicativo de Desktop Disponível
Enquanto o ChatGPT só estava disponível online até agora, um novo aplicativo de desktop para macOS foi anunciado no anúncio do modelo GPT-4o. Um aplicativo para Windows também deve ser lançado na segunda metade deste ano.
Entendendo os Detalhes do GPT-4o
Se você deseja saber as informações detalhadas sobre o novo modelo de IA da OpenAI - GPT-4o, aqui você pode conferir a gravação em vídeo da sua coletiva de imprensa.
Como Acessar a API do GPT-4o?
Ao desenvolver aplicativos web, é muito conveniente usar APIs para integrar funcionalidades de IA em seus próprios serviços. Com o anúncio do modelo GPT-4o, você precisará usar a API do GPT-4o para introduzir as capacidades excepcionais do modelo GPT-4o em seus próprios serviços. Então, a API do GPT-4o é utilizável? Quanto custa? Vamos dar uma olhada mais de perto nessas perguntas.
A API do GPT-4o Está Disponível para Uso?
De acordo com as informações mais recentes da OpenAI, a API do modelo GPT-4o já está disponível como um modelo de texto e visão nas APIs de Chat Completions, Assistants e Batch.

Atualizações da API do GPT-4o
Comparado às APIs do modelo ChatGPT anterior, a API do GPT-4o é considerada melhor nas seguintes áreas:
- Inteligência mais alta: Proporciona desempenho de nível Turbo do GPT-4 em texto, raciocínio e habilidades de codificação, e estabelece novos padrões altos em capacidades multilíngues, de áudio e visuais.
- Velocidade de resposta 2x mais rápida: A velocidade de geração de tokens é dobrada em comparação com o GPT-4 Turbo.
- Preço 50% mais barato: 50% mais barato que o GPT-4 Turbo para tokens de entrada e saída.
- Limite de taxa 5x maior: O limite de taxa é 5 vezes maior do que o do GPT-4 Turbo, até 10 milhões de tokens por minuto.
- Capacidades visuais melhoradas: As capacidades visuais foram aprimoradas para a maioria das tarefas.
- Capacidades de idiomas não ingleses melhoradas: Processamento melhorado de idiomas não ingleses e utiliza um novo tokenizador para tokenizar texto não inglês de forma mais eficiente.
Preços da API do GPT-4o
Então, quanto custa usar este mais recente modelo da API do GPT-4o? De acordo com o site oficial de preços da API da OpenAI, o GPT-4o é mais rápido e mais econômico do que o GPT-4 Turbo, enquanto oferece capacidades visuais mais poderosas. Este modelo possui um contexto de 128K e cobre conhecimentos até outubro de 2023. Além disso, é 50% mais barato que o GPT-4 Turbo. O plano de preços específico é o seguinte:
De acordo com a página de preços da API da OpenAI, o custo/preço para o GPT-4o é o seguinte:
- Entrada de texto: $5/ 1M tokens
- Saída de texto: $15/ 1M tokens
E o custo para processamento visual (geração de imagem) é calculado com base na largura e altura da imagem. Por exemplo, o custo para processar uma imagem de 150px de altura e 150px de largura é $0.001275. Os usuários podem ajustar livremente a resolução da imagem, e o preço é baseado no número de pixels.

Então, seja para entrada, saída ou geração de imagens, o custo de usar a API do GPT-4o é metade do custo do GPT-4 Turbo.
Notas Importantes ao Usar a API do GPT-4o
Ao usar a API do GPT-4o ou tentar mudar de outros modelos para a API do GPT-4o, você precisa prestar atenção aos seguintes pontos:
- A API do GPT-4o pode entender vídeo sem áudio por meio da habilidade de percepção. Especificamente, você precisa converter o vídeo em quadros (2-4 quadros por segundo, amostrados uniformemente ou usando um algoritmo de seleção de quadro-chave), e então inserir esses quadros no modelo.
- A partir de 14 de maio de 2024, a API do GPT-4o ainda não suporta modalidade de áudio. No entanto, a OpenAI espera fornecer a modalidade de áudio a testadores confiáveis nas próximas semanas.
- A partir de 14 de maio de 2024, a API do GPT-4o não suporta geração de imagens por enquanto, então se você precisar de geração de imagens, é recomendado usar a API do DALL-E 3.
- A OpenAI recomenda que todos os usuários que estão atualmente usando o GPT-4 ou o GPT-4 Turbo considerem mudar para o GPT-4o. O GPT-4o não é necessariamente mais capaz do que o GPT-4 ou o GPT-4 Turbo em todos os casos, então a OpenAI sugere comparar as saídas e experimentar o GPT-4o para avaliar suas capacidades antes de considerar a mudança.
Teste e Gerencie Facilmente a API do GPT-4o com o Apidog
Ao usar a API do GPT-4o, tarefas como testes e gerenciamento de API se tornam essenciais.
Usando a ferramenta de gerenciamento de API mais conveniente - Apidog, você pode lidar com qualquer API de forma mais conveniente e eficiente. Como a API do GPT-4o já está disponível, você pode acessar o API Hub no Apidog e acessar facilmente o projeto API da OpenAI. Em seguida, você pode clonar o projeto da API do GPT-4o para seu projeto, usar e testar a API do GPT-4o, e gerenciá-la convenientemente com o Apidog.

Além disso, o Apidog suporta Eventos Enviados pelo Servidor (SSE), facilitando a transmissão da API do GPT-4o! Para mais detalhes, confira este artigo:

Pré-requisitos para Usar a API do GPT-4o: Chave da API da OpenAI
Para começar a usar a API do GPT-4o, você primeiro precisa obter um token da API da OpenAI. Vamos seguir o tutorial abaixo para obter sua chave da API da OpenAI.
1. Crie uma conta na OpenAI
Para começar a usar a API do GPT-4o, você primeiro precisa criar uma conta na OpenAI. Acesse o site oficial da OpenAI e clique no botão "Começar" no canto superior direito para criar uma conta.

2. Obtenha a chave da API da OpenAI
Após criar sua conta na OpenAI, você precisará obter uma chave da API para autenticação, que é um requisito para usar a API do GPT-4o. Siga estes passos para obter sua chave da API do ChatGPT:
Passo 1: Acesse a página de Chaves da API na OpenAI e faça login na sua conta (ou crie uma nova conta se você não tiver uma).
Passo 2: Clique no botão "Criar nova chave secreta" para gerar uma nova chave da API.

Após gerar a chave da API, ela será exibida imediatamente na tela. No entanto, você não poderá visualizar a chave da API novamente, então é recomendado anotá-la e armazená-la com segurança.
Teste e Gerencie a API do GPT-4o com Apidog
O Apidog é uma ferramenta incrivelmente conveniente para usar a API do GPT-4o. Apidog tem um projeto de API da OpenAI que cobre todas as APIs fornecidas pela OpenAI. Se você deseja verificar as APIs fornecidas pela OpenAI, acesse a seguinte página:

Atualmente, a API do GPT-4o está disponível apenas nas APIs de Chat Completions, Assistants, e Batch, portanto, selecione cada uma no menu à esquerda do projeto da API da OpenAI para começar a usar a API do GPT-4o.

Passo a passo: Usando a API do GPT-4o com Apidog
Ao acessar o projeto da API da OpenAI no Apidog, você pode facilmente testar as APIs da OpenAI seguindo estas etapas. Vamos passar por como usar o GPT-4o com a API de Chat Completions.
Passo 1: Acesse o projeto da API da OpenAI no Apidog, selecione o endpoint da API de Chat Completions no menu à esquerda, e na tela nova de solicitação, insira o método HTTP e a URL do endpoint de acordo com a especificação do ChatGPT. Em seguida, na aba "Body", escreva a mensagem que você deseja enviar ao ChatGPT em formato JSON.
Nota: Para usar o GPT-4o, especifique o modelo como "gpt-4o" incluindo "model":"gpt-4o"
.

Passo 2: Mude para a aba "Header", adicione o parâmetro Authorization para autenticar-se com a API do ChatGPT, insira a chave da API do ChatGPT que você obteve e clique no botão "Enviar".

Nota: No Apidog, você pode armazenar sua chave da API da OpenAI como uma variável de ambiente. Armazenar a chave da API da OpenAI como uma variável de ambiente significa que você pode referenciar diretamente a variável de ambiente mais tarde sem precisar inserir a chave da API repetidamente, o que é conveniente.

Resumo
Neste artigo, fornecemos uma explicação detalhada sobre o mais recente modelo da OpenAI, GPT-4o. O GPT-4o tem o dobro do tempo de resposta em comparação com os modelos anteriores e pode entender texto, imagens, áudio e vídeo. Além disso, o número de tokens usados para japonês foi reduzido, melhorando a performance de custo.
A API do GPT-4o está disponível nas APIs de Chat Completions, Assistants e Batch, com recursos como maior inteligência, velocidade de resposta 2x mais rápida, preços 50% mais baratos, limite de taxa 5x maior, capacidades visuais melhoradas e capacidades em idiomas não ingleses aprimoradas em comparação com as APIs do modelo ChatGPT anterior.
Para usar a API do GPT-4o, você primeiro precisa criar uma conta na OpenAI e obter uma chave da API. Em seguida, com o Apidog, você pode facilmente testar e gerenciar a API do GPT-4o. O Apidog possui um projeto da API da OpenAI que abrange as especificações da API do GPT-4o, e você pode armazenar sua chave da API como uma variável de ambiente para evitar reintroduzi-la.
No futuro, o suporte a áudio será adicionado à API do GPT-4o. Ao aproveitar os excelentes recursos do GPT-4o e incorporá-los aos seus serviços, você pode proporcionar uma experiência de IA ainda melhor.