A interpretação de que o sistema utiliza um arquivo de referência (.cromdb) para evitar o envio de dados completos está correta e é o pilar central da eficiência do projeto.
- Dicionarização Estática: A compressão convencional cria um dicionário novo para cada arquivo. O Crompressor utiliza um Codebook pré-treinado que contém padrões universais ou específicos de um domínio.
- O Conceito de Delta XOR: Quando um pedaço de dado não existe exatamente no Codebook, o sistema encontra o padrão mais próximo e armazena apenas a diferença binária (XOR) entre eles.
- Exemplo Prático: Se você deseja armazenar 10.000 logs de um servidor, o sistema identifica que 90% das strings (como cabeçalhos de data e IP) são repetitivas e já estão no "cérebro" (Codebook). O arquivo final
.cromcontém apenas as coordenadas de onde buscar esses dados no dicionário e os poucos bytes que variam em cada log.