Executando verificação de segurança...
2

Cara, isso me chamou muito a atenção, porque o futuro é bem por ai...

Parece que esses "small language models (SLMs)" são implementados com frameworks mais brandos como o TensorFlow Lite, programado majoritariamente com C++. Isso permite a execução nos smartphones, e até conseguem fazer uso de qualquer GPU que o smartphone tenha.

Acho que o repo do app é esse aqui:
https://github.com/a-ghorbani/pocketpal-ai

Muito fascinante! Valeu pela dica.

Carregando publicação patrocinada...
1
1

Dá sim, usando o ollama, consegue rodar varios modelos do hugging face e muito bem, recomendo modelos como o gemma do google ou o Llama da meta. Apenas temque ter uma noção sobre a quantidade de paramentros a a quantizaçâo do modelo para não baixar um modelo que não