Ponto super válido sobre a explicação da rotação. Antes era vago demais.
Respondendo a "Texto full gpt, sem nenhuma explicação, so joga..." dentro da publicação TurboQuant: 7,9× Menos RAM em Embeddings — Roda 8× Mais Docs na Mesma GPU
1
Ponto super válido sobre a explicação da rotação. Antes era vago demais.