Executando verificação de segurança...
4

Deixa eu ver se eu entendi.

É como se o 7z ao invés de criar um arquivo compactado ele cria um "dispositivo" VHD um disco virtual, e nesse disco virtual os meus dados já vivem compactados dentro?

Desculpa posso estar sendo tolo, só estou tentando entender como essa estrutura realmente funciona.


E acho que o downvot do pessoal foi por conta das imagens e alguns emojs, ai o pessoa sente que é um conteúdo gerado 100% com IA.

Carregando publicação patrocinada...
4

Posso estar errado, mas pelo que entendi da publicação sobre a versão 1 e esta, você usa o Crom para criar um .cromdb com os arquivos de referência que já tem e ele usa esse arquivo como dicionário para comprimir/descomprimir. Em vez de enviar o arquivo completo, só envia quais partes do .cromdb usar para remontar o arquivo original.

1

A interpretação de que o sistema utiliza um arquivo de referência (.cromdb) para evitar o envio de dados completos está correta e é o pilar central da eficiência do projeto.

  • Dicionarização Estática: A compressão convencional cria um dicionário novo para cada arquivo. O Crompressor utiliza um Codebook pré-treinado que contém padrões universais ou específicos de um domínio.
  • O Conceito de Delta XOR: Quando um pedaço de dado não existe exatamente no Codebook, o sistema encontra o padrão mais próximo e armazena apenas a diferença binária (XOR) entre eles.
  • Exemplo Prático: Se você deseja armazenar 10.000 logs de um servidor, o sistema identifica que 90% das strings (como cabeçalhos de data e IP) são repetitivas e já estão no "cérebro" (Codebook). O arquivo final .crom contém apenas as coordenadas de onde buscar esses dados no dicionário e os poucos bytes que variam em cada log.
2

A percepção de que o sistema se assemelha a um VHD (Virtual Hard Disk) onde os dados já vivem compactados está parcialmente correta no que diz respeito à interface de uso, mas difere radicalmente na implementação interna.

  • Interface FUSE (Virtual Filesystem): O Crompressor utiliza o kernel do sistema operacional para projetar um ponto de montagem virtual. Para o usuário, ele aparece como uma unidade de disco normal, permitindo abrir arquivos nativamente.
  • Acesso Aleatório O(1): Diferente de um arquivo .7z ou .zip, que geralmente exige a descompressão total ou de grandes blocos sequenciais para acessar um arquivo específico, o Crompressor utiliza uma BlockTable. Isso permite que o sistema localize e descompacte apenas os bytes exatos solicitados pelo software, resultando em latências de acesso aleatório na casa de microssegundos.
  • Diferença do VHD: Enquanto um VHD armazena blocos brutos de disco, o Crompressor armazena um "mapa de referências". O dado não está apenas "guardado"; ele foi "compilado" contra um dicionário.