🚀 Mini LLM (SLM) — um projeto open-source que acabei de lançar!
Mini LLM (SLM) - um projeto open-source que acabei de lançar!
Você não precisa de milhões de parâmetros para fazer algo útil com IA. Às vezes, um modelo pequeno, treinado com dados bem definidos, resolve muito mais.
Criei o Mini LLM como uma base simples para quem quer experimentar e entender como funciona um modelo de linguagem leve, sem depender de servidores potentes ou GPUs caras.
O que ele faz:
- Gera texto com base em um prompt
- Permite treinar com dados próprios
- Usa tokenizer do GPT-2
- Roda localmente com Python 3.9+
Super leve, fácil de entender e ideal para aprender na prática sobre IA e SLMs.
Quer testar? Siga os passos:
-
Clone o projeto:
git clone https://github.com/paulocoutinhox/mini-llm -
Instale as dependências:
python3 -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt -
Baixe os dados de teste ou use seus próprios dados:
curl -o data.txt https://paulo-storage.s3.us-east-1.amazonaws.com/ai/slm/data.txt -
Treine e gere textos:
python3 main.py "seu prompt aqui" --train
Depois de treinar, execute:
python3 main.py "seu prompt aqui"
Pequeno, mas funcional. Esse é o espÃrito do SLM.
Vamos democratizar a IA com soluções acessÃveis!
#SLM #IA #LLM #Python #Transformers #OpenSource #DevTools #DeepLearning #MiniLLM