Executando verificação de segurança...
22

🚀 Mini LLM (SLM) — Treina a sua própria LLM (SLM) - Um projeto open-source que acabei de lançar!

Mini LLM (SLM) - um projeto open-source que acabei de lançar!

Você não precisa de milhões de parâmetros para fazer algo útil com IA. Às vezes, um modelo pequeno, treinado com dados bem definidos, resolve muito mais.

Criei o Mini LLM como uma base simples para quem quer experimentar e entender como funciona um modelo de linguagem leve, sem depender de servidores potentes ou GPUs caras.

O que ele faz:

  • Gera texto com base em um prompt
  • Permite treinar com dados próprios
  • Usa tokenizer do GPT-2
  • Roda localmente com Python 3.9+

Super leve, fácil de entender e ideal para aprender na prática sobre IA e SLMs.

Quer testar? Siga os passos:

  1. Clone o projeto:
    git clone https://github.com/paulocoutinhox/mini-llm

  2. Instale as dependências:
    python3 -m venv .venv
    source .venv/bin/activate
    pip install -r requirements.txt

  3. Baixe os dados de teste ou use seus próprios dados:
    curl -o data.txt https://paulo-storage.s3.us-east-1.amazonaws.com/ai/slm/data.txt

  4. Treine e gere textos:
    python3 main.py "seu prompt aqui" --train

Depois de treinar, execute:
python3 main.py "seu prompt aqui"

Pequeno, mas funcional. Esse é o espírito do SLM.

Vamos democratizar a IA com soluções acessíveis!

#SLM #IA #LLM #Python #Transformers #OpenSource #DevTools #DeepLearning #MiniLLM

Carregando publicação patrocinada...
1
1
2

Roda com CPU, mas demora uma eternidade e meia.

No meu M1 usando a GPU dele, durou horas.

Quem puder, deixe uma estrela/star no projeto do GitHub, só pra ele ir crescendo.

Vlw.

1
2
1

Adicionei várias melhorias, de organização, arquitetura e treinamento.

Agora fica mais fácil usar qualquer modelo, inclusive dá pra treinar e rodar em smartphones tranquilamente.

Coloquei uma série de modelos no README que podem ser usados.

Coloquei uma categoria apenas com modelos de CPU.

Quem puder, deixe uma estrela/star no projeto do GitHub, só pra ele ir crescendo.

Vlw.

1

Sensacional, estou mesmo precisando aprender a treinar um modelo pra o meu serviço. Talvez Mini LLM resolva. Obrigado pela contribuição.

Mas de todo modo eu preciso de algum modelo inicial certo?

2

Sim.

Treinar uma LLM do zero, exigiria um esforço ainda maior e muita coisa detalhada pra treinar, além de muito hardware e uma pequena fortuna em $$.

O que fazemos na verdade é um "fine-tunning", que é pegar um modelo já treinado e continuar a partir dele, gerando um novo.

Quem puder, deixe uma estrela/star no projeto do GitHub, só pra ele ir crescendo.

Vlw.