Eu gastei menos de 4$(dolares) nessas indas e vindas utilizando o Vast.ai, uma plataforma de aluguel de GPU descentralizado.
Os custos de uso desse modelo, é quase irrelevante, tendo em vista que ele roda em qualquer maquina de 4gb ram, sem GPU, apenas CPU. Mas ele foi um projeto que fiz em 3 dias, 2 foi corrigindo erros, apenas quis testar uma idéia que tive sobre pensamento vetorial, em vez de via output token.
Apenas quis testar um idéia mesmo. Já está disponivel a nova versão dele caso queira:
https://huggingface.co/spaces/CromIA/think-vetor-1b-hybrid-chat
https://huggingface.co/CromIA/think-vetor-1b-hybrid-lora
Esse é:


Por enquanto os modelos que crio é visando estudo, tendo em vista que não tenho money para torrar em pesquisas que levasse a algo em produção. Mas viso sim desevolver um LLM do zero com esas novas arquiteturas que venho explorando, resumidamente, não use o modelo em produção se não tiver os conhecimentos técnicos necessários para usa-lo de forma avançada, pois ele é apenas um estudo, e não um produto final de fato.
+3
Obrigado pelas perguntas.