README.md 1.2 KB

packer

Упаковщик данных.

Игрушечный упаковщик для проверки идеи.

Схема

flowchart TD
    TapeIn-->Compressor
    Compressor-->Sequencer
    Sequencer --> Compressor
    Compressor-->TapeOut

Входная лента передаёт данные частотному анализатору с размером слова 8 бит.

Частотный анализатор говорит компрессору какую наиболее частотную комбинацию символов заменить на подстановочный символ и так по кругу, пока не окажется, что заменять больше нечего (меньше 4х замён -- это минимальное значение для выйгрыша по месту).

Далее, полученная комбинация отправляется на выходную ленту с новым архивным размером слова (с высокой вероятностью заметно больше 8 бит).

Образец для сжатия

В папке util лежит HTML-файл "Война и мир" размером 5.7 МБ.