[Engenharia de ia/dados] Construindo um corpus PT-BR de 8,4M documentos com C4/FineWeb2, filtragem via SBERT e geração sintética via LLMs3 tabcoins · 4 comentários · MadrasLe · 3 dias atrás
Meu Modelo de 102k parâmetros derrotando grande LLMs( Llama 3 70B, Kimi k2 (~1T), Gemini) em Damas4 tabcoins · 4 comentários · MadrasLe · 3 meses atrás