Open Source AI Definition (OSAID 1.0): o que muda de verdade no “open source” de IA?
A Open Source Initiative (OSI) publicou a Open Source AI Definition 1.0 (OSAID) e deixou algo bem claro:
liberar pesos não torna uma LLM open source.
Para deixar todo mundo numa mesma página, oque acontece regularmente é que modelos liberados por empresas privadas (as llama da meta), liberam como open source os modelos, mas, na verdade eles liberam apenas os pesos, bias, esses valores que eles usaram após o treinamento.
Oque acontece é que no final do dia, para uma coisa ser realmente Open Source existe uma série de coisas que devem ser seguidas.
O que essa OSAID considera Open Source AI?
Para uma IA ser open source de verdade, ela precisa garantir as mesmas liberdades do software livre, tipo:
- usar para qualquer finalidade
- estudar como funciona
- modificar
- redistribuir
Mas isso só é possível se o sistema for distribuído na sua forma preferida para modificação.

Nas LLMs, isso vai significar três cositas obrigatórias
-
Dados (ou informação suficiente sobre eles)
Proveniência, critérios de coleta, filtragem, rotulagem e como reproduzir algo equivalente.
-
Código completo
Pipeline de treino, arquitetura, hiperparâmetros, tokenizers, filtros, validação e inferência.
-
Pesos / parâmetros
Checkpoints e estado final do modelo.
Sem esse conjunto todo ai, não tem como dizer que é Open Source AI.

Exemplos práticos
| Modelo (Empresa) | Status | Detalhes de Acessibilidade | Classificação Real |
|---|---|---|---|
| LLaMA (Meta) | ❌ | • Pesos disponíveis • Dados de treino não reproduzíveis • Código de treino incompleto | Open Weights (Não é Open Source AI) |
| GPT (OpenAI) | ❌ | • Pesos fechados • Dados fechados • Código fechado | Modelo Proprietário (Sem discussão) |
| Mistral / Mixtral | ⚠️ | • Pesos abertos • Código de inferência aberto • Informações de dados limitadas | Parcialmente Aberto (Não cumpre totalmente a OSAID) |
| OLMo (Ai2) | ✅ | • Pesos + Dados + Código de Treino + Logs (Totalmente auditável) | Verdadeiramente Open Source |
Por que isso importa de verdade?
Porque “open source AI” virou buzzword de marketing.
A OSAID tenta puxar o freio e lembrar algo básico:
open source é sobre autonomia, não sobre boa vontade corporativa.
Se você não consegue auditar, reproduzir ou evoluir o modelo do zero, você depende de quem publicou os pesos.

No final do dia
Se amanhã o mantenedor sumir, você vai conseguir:
- recriar o modelo?
- corrigir vieses?
- auditar decisões?
- continuar evoluindo o sistema?
Se a resposta for não, isso não é Open Source AI.