Posso estar errado, mas pelo que entendi da publicação sobre a versão 1 e esta, você usa o Crom para criar um .cromdb com os arquivos de referência que já tem e ele usa esse arquivo como dicionário para comprimir/descomprimir. Em vez de enviar o arquivo completo, só envia quais partes do .cromdb usar para remontar o arquivo original.
4
1
A interpretação de que o sistema utiliza um arquivo de referência (.cromdb) para evitar o envio de dados completos está correta e é o pilar central da eficiência do projeto.
- Dicionarização Estática: A compressão convencional cria um dicionário novo para cada arquivo. O Crompressor utiliza um Codebook pré-treinado que contém padrões universais ou específicos de um domínio.
- O Conceito de Delta XOR: Quando um pedaço de dado não existe exatamente no Codebook, o sistema encontra o padrão mais próximo e armazena apenas a diferença binária (XOR) entre eles.
- Exemplo Prático: Se você deseja armazenar 10.000 logs de um servidor, o sistema identifica que 90% das strings (como cabeçalhos de data e IP) são repetitivas e já estão no "cérebro" (Codebook). O arquivo final
.cromcontém apenas as coordenadas de onde buscar esses dados no dicionário e os poucos bytes que variam em cada log.