1 min de leitura ·

🚀 Mini LLM (SLM) — Treina a sua própria LLM (SLM) - Um projeto open-source que acabei de lançar!

Mini LLM (SLM) - um projeto open-source que acabei de lançar!

Você não precisa de milhões de parâmetros para fazer algo útil com IA. Às vezes, um modelo pequeno, treinado com dados bem definidos, resolve muito mais.

Criei o Mini LLM como uma base simples para quem quer experimentar e entender como funciona um modelo de linguagem leve, sem depender de servidores potentes ou GPUs caras.

O que ele faz:

Gera texto com base em um prompt
Permite treinar com dados próprios
Usa tokenizer do GPT-2
Roda localmente com Python 3.9+

Super leve, fácil de entender e ideal para aprender na prática sobre IA e SLMs.

Quer testar? Siga os passos:

Clone o projeto:
git clone https://github.com/paulocoutinhox/mini-llm
Instale as dependências:
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt
Baixe os dados de teste ou use seus próprios dados:
curl -o data.txt https://paulo-storage.s3.us-east-1.amazonaws.com/ai/slm/data.txt
Treine e gere textos:
python3 main.py "seu prompt aqui" --train

Depois de treinar, execute:
python3 main.py "seu prompt aqui"

Pequeno, mas funcional. Esse é o espírito do SLM.

Vamos democratizar a IA com soluções acessíveis!

#SLM #IA #LLM #Python #Transformers #OpenSource #DevTools #DeepLearning #MiniLLM

Fonte: https://github.com/paulocoutinhox/mini-llm

valterpatrick

1 ano atrás

Dá para rodar ele com o CPU ou somente com GPU?
Achei bem interessante a ideia.

paulocoutinho

Autor

1 ano atrás

Roda com CPU, mas demora uma eternidade e meia.

No meu M1 usando a GPU dele, durou horas.

Quem puder, deixe uma estrela/star no projeto do GitHub, só pra ele ir crescendo.

Vlw.

samukarb

1 ano atrás

gostei do projeto e muito bem documentado 👏
salvando para utilizar qualquer hora!

paulocoutinho

Autor

1 ano atrás

Obrigado.

Quem puder, deixe uma estrela/star no projeto do GitHub, só pra ele ir crescendo.

Vlw.

paulocoutinho

Autor

1 ano atrás

Adicionei várias melhorias, de organização, arquitetura e treinamento.

Agora fica mais fácil usar qualquer modelo, inclusive dá pra treinar e rodar em smartphones tranquilamente.

Coloquei uma série de modelos no README que podem ser usados.

Coloquei uma categoria apenas com modelos de CPU.

Quem puder, deixe uma estrela/star no projeto do GitHub, só pra ele ir crescendo.

Vlw.

Andreldev

1 ano atrás

Sensacional, estou mesmo precisando aprender a treinar um modelo pra o meu serviço. Talvez Mini LLM resolva. Obrigado pela contribuição.

Mas de todo modo eu preciso de algum modelo inicial certo?

paulocoutinho

Autor

1 ano atrás

Sim.

Treinar uma LLM do zero, exigiria um esforço ainda maior e muita coisa detalhada pra treinar, além de muito hardware e uma pequena fortuna em $$.

O que fazemos na verdade é um "fine-tunning", que é pegar um modelo já treinado e continuar a partir dele, gerando um novo.

Quem puder, deixe uma estrela/star no projeto do GitHub, só pra ele ir crescendo.

Vlw.

hbm

1 ano atrás

Projeto mesmo interessante, pequenos modelos mas grandes proezas. https://github.com/paulocoutinhox/mini-llm