Introdução
Hoje, no mundo dos LLMs (Grandes Modelos de Linguagem) e Agentes de IA, os formatos que usamos para enviar dados estruturados importam mais do que nunca. Apresentamos o TOON (Token-Oriented Object Notation), um formato de serialização emergente que promete reduzir o uso de tokens enquanto preserva estrutura, legibilidade e reconhecimento de esquema. Mas o que exatamente é o TOON, e ele poderia realmente substituir o JSON em fluxos de trabalho baseados em LLMs? Neste artigo, exploramos o design do TOON, como ele se compara ao JSON (e outros formatos como YAML e JSON compactado), e se é uma alternativa prática para agentes de IA do mundo real.
Quer uma plataforma integrada, All-in-One para sua Equipe de Desenvolvedores trabalharem juntos com máxima produtividade?
Apidog atende a todas as suas demandas e substitui o Postman por um preço muito mais acessível!
O que é TOON?
TOON, abreviação de Token-Oriented Object Notation, é um formato de serialização legível por humanos, com reconhecimento de esquema, especificamente ajustado para entradas de LLMs. De acordo com seus criadores, ele preserva o mesmo modelo de dados do JSON — objetos, arrays, primitivos — mas usa uma sintaxe mais compacta projetada para minimizar o número de tokens quando inserido nos modelos.
As principais características do TOON incluem:
- Eficiência de Tokens: O TOON frequentemente usa 30-60% menos tokens em comparação com o JSON formatado para arrays grandes e uniformes.
- Definições com Reconhecimento de Esquema: Ele define explicitamente os tamanhos de array (por exemplo,
users[3]) e cabeçalhos de campo ({id,name}), o que ajuda os LLMs a validar e interpretar a estrutura de forma confiável. - Sintaxe Mínima: O TOON remove grande parte da pontuação associada ao JSON (chaves, colchetes, a maioria das aspas) e depende da indentação e vírgulas, similar a YAML e CSV.

- Formato Tabular para Arrays Uniformes: Quando você tem múltiplos objetos com as mesmas chaves, o TOON usa um layout compacto, baseado em linhas (estilo CSV) que declara os campos uma vez e depois lista os valores em linhas.
Em essência, conforme declarado no GitHub, o TOON não é um novo modelo de dados — é uma camada de tradução: você escreve seus dados em JSON ou estruturas de dados nativas e os converte para TOON ao enviá-los para LLMs para economizar tokens.

Comparando TOON com JSON, YAML e JSON Compactado
Para entender se o TOON pode substituir o JSON para LLMs e Agentes de IA, é útil compará-lo com outros formatos de serialização comuns, incluindo YAML e JSON compactado.
JSON
- Familiaridade: O JSON é ubíquo e suportado por quase todas as linguagens de programação, bibliotecas e APIs.
- Verbosidade: O JSON inclui muitos caracteres estruturais — aspas, chaves, colchetes — o que aumenta a contagem de tokens quando usado em prompts de LLM.
- Falta de Reconhecimento de Esquema: O JSON padrão não comunica explicitamente os tamanhos de array ou cabeçalhos de campo, potencialmente levando à ambiguidade quando um LLM reconstrói dados estruturados.
[
{
"id": 1,
"name": "Alice",
"age": 30
},
{
"id": 2,
"name": "Bob",
"age": 25
},
{
"id": 3,
"name": "Charlie",
"age": 35
}
]JSON Compactado (ou JSON Minificado)
- Compactação: Ao remover espaços em branco, quebras de linha e indentação, o JSON minificado reduz o tamanho em comparação com o JSON formatado.
- Ainda Caro em Termos de Tokens: Mesmo o JSON compactado retém todos os caracteres estruturais (chaves, aspas, vírgulas), o que aumenta o uso de tokens em contextos de LLM.
- Sem Guardas Estruturais: Ele não possui os marcadores de esquema explícitos que o TOON oferece, então os LLMs podem ser mais propensos a erros ao reconstruir dados.
[{"id":1,"name":"Alice","age":30},
{"id":2,"name":"Bob","age":25},
{"id":3,"name":"Charlie","age":35}]YAML
- Legível: O YAML usa indentação em vez de chaves, o que pode tornar os dados aninhados mais amigáveis para humanos.
- Menos Verboso que JSON: Por evitar muitas chaves e aspas, o YAML pode economizar alguns tokens em comparação com o JSON.
- Ambiguidade: Sem tamanhos de array ou cabeçalhos de campo explícitos (a menos que adicionados manualmente), os LLMs podem interpretar mal a estrutura ou perder precisão.
- id: 1
name: Alice
age: 30
- id: 2
name: Bob
age: 25
- id: 3
name: Charlie
age: 35TOON
- Economia de Tokens: O TOON oferece reduções drásticas de tokens, especialmente para arrays uniformes, devido à sua notação em estilo de tabela e pontuação mínima. (Aitoolnet)
- Guardas de Esquema: Marcadores explícitos (como
[N]e{fields}) fornecem sinais de validação para LLMs, melhorando a fidelidade da estrutura. - Legível por Humanos: A combinação de indentação e linhas estilo CSV o torna bastante legível, especialmente para desenvolvedores familiarizados com YAML ou dados tabulares. (Toonkit | Ultimate TOON Format Toolkit)
- Compromissos Token-Modelo: Em dados não uniformes ou profundamente aninhados, o JSON pode ser mais eficiente; os benefícios do TOON brilham mais quando os dados são tabulares e uniformes.
[3]{id,name,age}:
1,Alice,30
2,Bob,25
3,Charlie,35
TOON no Contexto de Agentes de IA e LLMs
Por que os desenvolvedores estão explorando o TOON em contextos de LLM e Agentes de IA? Aqui estão alguns dos principais motivadores:
- Eficiência de Custo: APIs de LLM geralmente cobram por token. Ao reduzir o uso de tokens, o TOON pode diminuir significativamente os custos de entrada.
- Otimização da Janela de Contexto: Dados serializados menores significam mais espaço na janela de contexto do modelo para outros conteúdos (instruções, exemplos, cadeia de pensamento).
- Confiabilidade Aprimorada: A estrutura explícita (tamanho do array, nomes de campo) ajuda os LLMs a validar o formato de entrada e reduz alucinações ou dados mal colocados.
- Fluxos de Trabalho Agentivos: Para agentes de IA que realizam chamadas de ferramentas ou raciocínio multi-etapas, o TOON ajuda a manter a consistência e clareza nos dados estruturados entre as etapas.
- Conversão Transparente: Você pode manter seu backend em JSON, converter para TOON antes de enviar para o LLM e analisá-lo de volta mais tarde — sem uma revisão do seu modelo de dados.

Limitações e Quando o TOON Pode Não Ser Ideal
Apesar de suas vantagens, o TOON não é uma panaceia. Existem vários cenários em que o JSON (ou outros formatos) ainda pode ser superior:
- Dados Profundamente Aninhados ou Não Uniformes: Se seus dados possuem muitos níveis ou formatos de objeto inconsistentes, a abordagem tabular do TOON pode não se aplicar, e o JSON pode ser mais compacto ou claro.
- Incompatibilidade de Treinamento: Muitos LLMs foram treinados principalmente em JSON, não em TOON. Existe o risco de que os LLMs interpretem mal o conteúdo TOON se não forem instruídos corretamente. Como alguns usuários notam no Reddit, ensinar ao modelo um novo formato pode introduzir erros de parsing.
- Expectativas de Intercâmbio: Se seus dados devem ser consumidos por sistemas tradicionais, APIs ou armazenamento que esperam JSON, o TOON pode não ser diretamente aceito.
- Maturidade das Ferramentas: Embora existam SDKs em TypeScript, Python e outros, o TOON ainda é mais novo e menos universalmente suportado que JSON ou YAML.
Perguntas Frequentes (FAQ)
P1. O que significa TOON?
Resp: TOON significa Token-Oriented Object Notation, um formato projetado para codificar dados estruturados em menos tokens especificamente para entrada de LLM.
P2. O TOON pode representar todos os dados JSON?
Resp: Sim — De acordo com ToonParse, o TOON é sem perdas em relação ao modelo de dados JSON. Ele suporta os mesmos tipos primitivos, objetos e arrays que o JSON.
P3. Quanta economia de tokens o TOON proporciona?
Resp: Benchmarks em ToonParse e GitHub sugerem que o TOON pode reduzir os tokens em 30-60% em comparação com o JSON formatado para arrays uniformes. A precisão típica para recuperação estruturada permanece alta, graças aos marcadores de esquema explícitos do TOON.
P4. Os LLMs entenderão o formato TOON "de fábrica"?
Resp: Muitos LLMs podem entender o TOON quando instruídos corretamente (por exemplo, mostrando exemplos com users[2]{...}:). O reconhecimento de esquema no TOON ajuda os modelos a validar a estrutura de forma mais confiável. No entanto, pode exigir algum ajuste de prompt ao trabalhar com modelos não pré-treinados em TOON.
P5. O TOON é um substituto para o JSON em APIs e armazenamento?
Resp: Não necessariamente. De acordo com o GitHub, o TOON é otimizado para entrada de LLM. Para APIs, armazenamento ou intercâmbio onde o JSON é o padrão, o JSON ou outros formatos podem ainda ser mais apropriados. O TOON é melhor usado como uma camada de tradução em seu pipeline de LLM.
Veredito: O TOON substituirá o JSON em LLMs e Agentes de IA?
Em resumo: O TOON é um complemento poderoso e inteligente ao JSON — especialmente para fluxos de trabalho impulsionados por LLMs — mas é improvável que substitua completamente o JSON de forma geral.
Aqui está como eu vejo:
- Para prompts de LLM, Agentes de IA e orquestração de ferramentas multi-etapas, o TOON oferece valor real. A economia de tokens, a clareza e os guardas de esquema o tornam uma escolha atraente quando custo, tamanho do contexto e confiabilidade importam.
- Para APIs de uso geral, persistência de dados ou interoperabilidade, o JSON tradicional (ou mesmo JSON compactado/minificado) continuará dominante. O JSON está profundamente enraizado em quase todo ecossistema de programação, e muitos sistemas esperam esse formato.
- Para equipes que já trabalham com dados estruturados tabulares ou uniformes, o TOON pode ser uma situação vantajosa: converta para TOON antes de enviar para LLMs, e então converta de volta para JSON para consumo posterior.
Em última análise, o TOON não é um substituto completo na maioria das pilhas — é uma ferramenta altamente eficiente em sua caixa de ferramentas de LLM. Use-o onde você mais ganha: em prompts estruturados para agentes, pipelines RAG e uso de LLM sensível ao custo.
Conclusão
O TOON representa uma evolução ponderada em como serializamos dados estruturados para LLMs e Agentes de IA. Ao combinar sintaxe mínima, reconhecimento de esquema e legibilidade humana, ele permite um design de prompt mais eficiente, econômico e preciso. Embora o JSON continue sendo o padrão de intercâmbio de dados, o lugar do TOON como uma camada especializada para entrada de LLM parece firmemente justificado.
Se seu caso de uso envolve o envio de grandes quantidades de dados estruturados para um LLM — especialmente se for uniforme ou tabular — o TOON é uma ferramenta que vale a pena explorar. Apenas esteja atento aos cenários em que ele pode não brilhar e continue usando JSON ou outros formatos quando esses contextos surgirem.
Quer uma plataforma integrada, All-in-One para sua Equipe de Desenvolvedores trabalharem juntos com máxima produtividade?
Apidog atende a todas as suas demandas e substitui o Postman por um preço muito mais acessível!
