Assim como as outras pessoas já manifestaram, o argumento dos "tokens ilimita... · janiosarmento

Assim como as outras pessoas já manifestaram, o argumento dos "tokens ilimitados" soa bom demais para ser verdade. Claro, em algum momento deveria aparecer alguém com uma "tarifa plana" para consumo de IA, mas me parece que o público que está lendo esse post seja um tanto cético ainda.

Uma coisa de que senti falta foi um ambiente de test-drive: no mínimo um lugar para fazer um POST de um prompt e receber a resposta, para avaliar minimamente a qualidade das respostas.

Uma maior disponibilidade de modelos também cairia bem.

Fora isso, vou testar teu serviço hoje à noite, substituindo o Cerebras por ele para comparar.

Atualização

Testei o teu serviço e tenho algumas considerações a fazer:

Não dá para listar os modelos disponíveis (até mesmo para saber a string exata para usar na chamada da API).
Configurei timeout de dois minutos e foi insuficiente para o teu sistema enviar uma resposta.
Muitos links de ajuda (guias, referência de API) estão linkando para #: não dá para se virar sem o mínimo de documentação.

No fim das contas, por que eu pagaria 129 Dólares a você se eu posso pagar "apenas" 100 no Claude e ter respostas instantâneas, e o próprio ambiente do Code disponível?

Enfim, só estou comentando porque você pediu feedback. Aliás, criei conta aqui só para comentar e te dar feedback. Espero ter sido útil.