GZIP vs. BZIP2
GNU zip (známy tiež ako GZIP) je softvérová aplikácia, ktorá slúži na komprimáciu súborov. Pôvodne bolo zamýšľané nahradiť komprimačný program používaný v raných systémoch Unix - na použitie v projekte GNU (projekt slobodného softvéru)..
BZIP2 je algoritmus kompresie bezstratových údajov s otvoreným zdrojovým kódom - v podstate trieda algoritmov kompresie údajov, ktorá umožňuje úplné obnovenie pôvodných údajov komprimovaného súboru z komprimovaných údajov..
GZIP je založený na algoritme známom ako DEFLATE. Toto je tiež bezstratový algoritmus kompresie údajov. Používa algoritmus LZ77 aj Huffmanovo kódovanie. GZIP sa v podstate týka formátu súboru s rovnakým názvom. Tento formát je 10-bajtová hlavička, ktorá obsahuje magické číslo (čo znamená číselnú alebo textovú hodnotu, ktorá sa nikdy nemení a používa sa na označenie formátu súboru alebo protokolu, nemenovanú číselnú hodnotu, ktorá sa nikdy nemení, alebo odlišné hodnoty, ktoré nemožno zameniť). pre čokoľvek iné), nadbytočné hlavičky, ktoré môžu alebo nemusia byť v skutočnosti potrebné (napríklad pôvodný názov súboru), telo, ktoré obsahuje užitočné zaťaženie komprimované DEFLATE (čo sú údaje, ktoré hlavičky nesú) a pätica 8 bajtov ktorý obsahuje kontrolný súčet CRC-32, ako aj skutočnú dĺžku pôvodných nekomprimovaných údajov.
Existuje celý rad kompresných techník, ktoré používa formát BZIP2, ktoré sú naskladané na seba vo viacerých vrstvách. Vyskytujú sa vo veľmi rozlišovacom poradí: kódovanie run-length (čo je sekvencia štyroch až 255 duplikovaných symbolov, ktoré sú nahradené prvými štyrmi symbolmi, a dĺžka kódovania, ktorá sa opakuje medzi 0 a 251), Burrows-Wheelerova transformácia ( čo je reverzibilné usporiadanie blokov, ktoré tvorí samotné jadro BZIP2), presunúť sa dopredu (ponechá veľkosť spracovaného bloku nezmenenú), kódovanie run-length (ktoré sa skladá z dlhých reťazcov symbolov - zvyčajne núl), ktoré neustále vo výstupe sa opakujú a sú nahradené symbolom a sekvenciou dvoch kódov), Huffmanovo kódovanie (čo je proces, ktorý nahrádza 8-bitové bajty s pevnou dĺžkou kódmi so zmenenou dĺžkou), viacnásobné Hoffmanovo kódovanie (ktoré sa skladá z viac Hoffmanových tabuliek rovnakej veľkosti), kódovanie Unary bázy 1, kódovanie Delta a riedke bitové pole.
Zhrnutie:
1. GZIP je bezplatná aplikácia používaná na kompresiu súborov; BZIP2 je algoritmus bezstratovej kompresie údajov s otvoreným zdrojom, ktorý umožňuje načítať pôvodné údaje komprimovaného súboru.
2. GZIP pozostáva z 10-bajtovej hlavičky, voliteľných hlavičiek, tela a 8-bajtovej päty; BZIP2 pozostáva najmenej z deviatich vrstiev kompresných techník.