Dosya Sıkıştırma ve Veriler
4 GB 1 MB ye sıkıştırılabilir mi sıkıştırılamaz mı?
Bir ceketi kutuya koyduğunuzu düşünün, üzerinde zıplasanız da, üstünden arabayla da geçseniz, kutuyu belirli bir oranda küçültürsünüz, eninde sonunda bir poşete koyup öyle taşırsınız. Şimdi ceketi çıkartın kutunun içinden, kutuyu istediğiniz gibi katlayıp, ceketinizin cebine bile koyabilirsiniz.
Bilgisayarda da aynı şekilde, dosya içinde veri yoksa istediğiniz kadar sıkıştırırsınız. Veri bulunan bir dosyayı ancak belirli bir oranda sıkıştırabilirsiniz.
Pek dikkat etmememize rağmen, Gif, JPEG, MP3, DivX, MPEG gibi dosyalar da bir tür sıkıştırılmış dosyalardır. Bir DVD 4,7 GB iken DivX ile sıkıştırılmış film 700 MB ye kadar indirgenebilmektedir.
Hex Editörümüzle 4 GB bir dosya oluşturalım.
Gördüğünüz gibi dosyanın tamamı 00 00 verisi ile doldurulmuş durumda!
Ve bu dosyayı sıkıştıralım, toplam: 19,4 KB lık bir dosya!
Çünkü içinde bir şey yok, ceketi çıkarılmış kutu gibi.
Aynı Hex Editörümüzle FireFox dosyasını açalım. Gördüğünüz gibi 00 00 dışında bir çok veri de mevcut. Ceket kutunun içinde!
Sıkıştırdığımızda, 7,29 MB lik bir dosya, 3,02 MB olmuş durumda!
Veri varsa sıkıştırma oranı o kadar düşük olamaz!
Dosyalar Nasıl Sıkıştırılır?
Elimizdeki WinRAR, WinUHA vs gibi arşivleme amaçlı sıkıştırma programları belli başlı algoritmaları izleyerek dosyaları kayıpsız sıkıştırır. Peki bu algoritmalar akıllı mıdır? Hayır değildir. Herkes evinde kendi sıkıştırma algoritmasını yapabilir. Bir miktar un, iki yumurta, biraz su yeter. Bununla ortaya çıkaracağınız yiyeceği yer ve konu üzerine tok karınla düşünürseniz sonuca ulaşacağınızdan eminim. Örneğin az evvel aklıma gelen sıkıştırma algoritmasını paylaşmak istiyorum. Bir cümleyi size ileteceğim ve bunun yanına bir işaret bırakarak nasıl bir sıkıştırma yaptığımı belirteceğim. Cümlemiz şöyle olsun: “Bu gün pazara giderek bir kilo elma, bir kilo patates, bir kilo armut, bir kilo soğan, bir kilo domates aldım ve eve geldim.” Bu cümlede çok sık tekrar eden “bir kilo” kelimesine ilaveten çok az tekrar eden “ve” kelimesi göze çarpıyor. Hatta basit bir sıkıştırma yapmamız için yeterli malzemeleri oluşturdu bile. Şimdi 124 harften oluşan cümlemizi şu şekilde yazalım: “Bu gün pazara giderek ve elma, ve patates, ve armut, ve soğan, ve domates aldım bir kilo eve geldim.#ve=bir kilo#” şeklinde 113 harfe indirmiş olduk. Siz de bu cümleyi aldıktan sonra iki adet “#” işaretinin arasında belirtildiği üzere “ve” yazan yere “bir kilo”, “bir kilo” yazan yere de “ve” koyarsanız asıl cümleye ulaşmış olursunuz. Evet çok büyük bir başarı değil belki ama işin mantığını kavrama açısından örnek verilebilir. Konunun bu kısmıyla ilgilenenler için güzel bir anahtar kelime: "Huffman Algoritması"
Şıkıştırma Programları Karşılaştırması:
Tablo yaklaşık değerleri vermektedir. Yüzde oranı, sıkıştırılmamış dosyaya oranı göstermektedir. Ne kadar düşükse o kadar iyi sıkıştırılmış demektir.
Adı 7-zip Metin %19 Çalıştırılabilir Dosyalar %27 Saf İmgeler %50
Adı bzip2 Metin %20 Çalıştırılabilir Dosyalar %37 Saf İmgeler %51
Adı Rar Metin %23 Çalıştırılabilir Dosyalar %36 Saf İmgeler %58
Adı advzip Metin %24 Çalıştırılabilir Dosyalar %37 Saf İmgeler %57
Adı Gzip Metin %25 Çalıştırılabilir Dosyalar %39 Saf İmgeler %60
Adı Zip Metin %25 Çalıştırılabilir Dosyalar %39 Saf İmgeler %60
Adı Lha Metin %27 Çalıştırılabilir Dosyalar %40 Saf İmgeler %61
4 GB 1 MB ye sıkıştırılabilir mi sıkıştırılamaz mı?
Bir ceketi kutuya koyduğunuzu düşünün, üzerinde zıplasanız da, üstünden arabayla da geçseniz, kutuyu belirli bir oranda küçültürsünüz, eninde sonunda bir poşete koyup öyle taşırsınız. Şimdi ceketi çıkartın kutunun içinden, kutuyu istediğiniz gibi katlayıp, ceketinizin cebine bile koyabilirsiniz.
Bilgisayarda da aynı şekilde, dosya içinde veri yoksa istediğiniz kadar sıkıştırırsınız. Veri bulunan bir dosyayı ancak belirli bir oranda sıkıştırabilirsiniz.
Pek dikkat etmememize rağmen, Gif, JPEG, MP3, DivX, MPEG gibi dosyalar da bir tür sıkıştırılmış dosyalardır. Bir DVD 4,7 GB iken DivX ile sıkıştırılmış film 700 MB ye kadar indirgenebilmektedir.
Hex Editörümüzle 4 GB bir dosya oluşturalım.
Gördüğünüz gibi dosyanın tamamı 00 00 verisi ile doldurulmuş durumda!
Ve bu dosyayı sıkıştıralım, toplam: 19,4 KB lık bir dosya!
Çünkü içinde bir şey yok, ceketi çıkarılmış kutu gibi.
Aynı Hex Editörümüzle FireFox dosyasını açalım. Gördüğünüz gibi 00 00 dışında bir çok veri de mevcut. Ceket kutunun içinde!
Sıkıştırdığımızda, 7,29 MB lik bir dosya, 3,02 MB olmuş durumda!
Veri varsa sıkıştırma oranı o kadar düşük olamaz!
Dosyalar Nasıl Sıkıştırılır?
Elimizdeki WinRAR, WinUHA vs gibi arşivleme amaçlı sıkıştırma programları belli başlı algoritmaları izleyerek dosyaları kayıpsız sıkıştırır. Peki bu algoritmalar akıllı mıdır? Hayır değildir. Herkes evinde kendi sıkıştırma algoritmasını yapabilir. Bir miktar un, iki yumurta, biraz su yeter. Bununla ortaya çıkaracağınız yiyeceği yer ve konu üzerine tok karınla düşünürseniz sonuca ulaşacağınızdan eminim. Örneğin az evvel aklıma gelen sıkıştırma algoritmasını paylaşmak istiyorum. Bir cümleyi size ileteceğim ve bunun yanına bir işaret bırakarak nasıl bir sıkıştırma yaptığımı belirteceğim. Cümlemiz şöyle olsun: “Bu gün pazara giderek bir kilo elma, bir kilo patates, bir kilo armut, bir kilo soğan, bir kilo domates aldım ve eve geldim.” Bu cümlede çok sık tekrar eden “bir kilo” kelimesine ilaveten çok az tekrar eden “ve” kelimesi göze çarpıyor. Hatta basit bir sıkıştırma yapmamız için yeterli malzemeleri oluşturdu bile. Şimdi 124 harften oluşan cümlemizi şu şekilde yazalım: “Bu gün pazara giderek ve elma, ve patates, ve armut, ve soğan, ve domates aldım bir kilo eve geldim.#ve=bir kilo#” şeklinde 113 harfe indirmiş olduk. Siz de bu cümleyi aldıktan sonra iki adet “#” işaretinin arasında belirtildiği üzere “ve” yazan yere “bir kilo”, “bir kilo” yazan yere de “ve” koyarsanız asıl cümleye ulaşmış olursunuz. Evet çok büyük bir başarı değil belki ama işin mantığını kavrama açısından örnek verilebilir. Konunun bu kısmıyla ilgilenenler için güzel bir anahtar kelime: "Huffman Algoritması"
Şıkıştırma Programları Karşılaştırması:
Tablo yaklaşık değerleri vermektedir. Yüzde oranı, sıkıştırılmamış dosyaya oranı göstermektedir. Ne kadar düşükse o kadar iyi sıkıştırılmış demektir.
Adı 7-zip Metin %19 Çalıştırılabilir Dosyalar %27 Saf İmgeler %50
Adı bzip2 Metin %20 Çalıştırılabilir Dosyalar %37 Saf İmgeler %51
Adı Rar Metin %23 Çalıştırılabilir Dosyalar %36 Saf İmgeler %58
Adı advzip Metin %24 Çalıştırılabilir Dosyalar %37 Saf İmgeler %57
Adı Gzip Metin %25 Çalıştırılabilir Dosyalar %39 Saf İmgeler %60
Adı Zip Metin %25 Çalıştırılabilir Dosyalar %39 Saf İmgeler %60
Adı Lha Metin %27 Çalıştırılabilir Dosyalar %40 Saf İmgeler %61
Alıntıdır...
Moderatör tarafında düzenlendi: