Meus 2 cents,
Fiquei com algumas duvidas quanto a tech/stack - caso nao seja segredo, se puder esclarecer agradeco.
-
Treinamento de IA: Voce cita "..dedicada pra treinar e executar os modelos localmente..." e "...desenvolvendo modelos privados...".
No caso, voces estao de fato treinando modelos (seja do zero ou via finetunning) ou estao usando apenas RAG/CAG ?
Minha questao eh que vejo poucas pessoas (principalmente Brasil) investindo em treinamento de IA por conta do custo e tempo (exceto em situacoes bem especificas), sendo que o RAG/CAG geralmente resolve da mesma forma (e com uma fracao do custo).
-
RTX Dedicada: Voce esta usando uma VPS com GPU ou GPU de um servidor local ? Pergunto por conta das particularidades de cada opcao.
A VPS com GPU eh mais eficiente - mas tem um custo fixo que geralmente so eh coberto em casos que a demanda justifique (ou que a privacidade de dados exija).
Ja a GPU local tem a questao de desempenho - os tokens/seg podem ser um limitador quando a demanda aumenta.
Existem opcoes como o Wool Ball - com processamento distribuido (e como voce fala em "...doar capacidade ociosa..." me pareceu que seguiu este caminho.
Parabens pelo projeto !
Obrigado por compartilhar - e esperando ter mais noticias positivias sobre o andamento dele ! Saude e Sucesso !