3

Já ouvi falar de uma estrutura que é otimizado pra ser enviado para LLMs: o TOON.

Tão falando que é bem lento pra ser serializado, mas tem uma economia boa em tokens.

Inclusive esse "TOON" é fortemente baseado em CSV. É uma mistura de CSV com YAML.

Carregando publicação patrocinada...
2

Pesquisei a respeito do TOON e ele tem essa sessão When Not to Use TOON onde é explicado alguns casos onde não faz sentido usar o TOON e um dos itens da lista é esse:

When Not to Use TOON
Pure tabular data: CSV is smaller than TOON for flat tables. TOON adds minimal overhead (~5–10%) to provide structure (array length declarations, field headers, delimiter scoping) that improves LLM reliability.

Logo o TOON é muito bom para dados mais complexos, porém em grande parte das vezes em que o dado é simples e comportado no formato de uma tabela, como no exemplo do post acima, o CSV vai ser menor que o TOON reduzindo ainda mais o numero de tokens. Mas em estruturas mais complexas o TOON é um pouco melhor que o JSON na relação acurácia/tokens como desmosntrado nessa sessão

Eu não conhecia o formato, obrigado por compatilhar :)