16
OLEH KELOMPOK : 1.Romanda Jamal Saosao 2.Basri Yasin 3.Novian Hanif 4.Roland 5.Jecky Tandean 6. William Philips EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL- ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

Embed Size (px)

Citation preview

Page 1: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

OLEH KELOMPOK :

1.Romanda Jamal Saosao2.Basri Yasin3.Novian Hanif4.Roland5.Jecky Tandean6. William Philips

EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN

DENGAN ALGORITMA BURROWS-WHEELER

Page 2: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

PENDAHULUAN

• Seiring dengan perkembangan teknologi membuat media komputer dijadikan sebagai media penyimpanan dan pengiriman data. Data yang disimpan di media komputer disebut dengan data digital. Dalam data komputer dikenal istilah pemampatan data atau lebih dikenal dengan kompresi data, dimana kompresi data merupan suatu metode untuk memperkecil ukuran data dari ukuran aslinya. Dengan adanya kompresi data ini kebutuhan media penyimpanan menjadi lebih efisien.

• Salah satu metode kompresi yang sudah banyak dikenal dan terkenal baru adalah Lempel-Ziv-Markov Chain-Algorithm (LZMA) yang merupakan pengembangan dari algoritma LZ77, metode ini mempunyai kemampuan menghasilkan rasio kompresi yang sangat tinggi dan proses dekompresi yang sangat cepat, dengan kemampuan tersebut metode LZMA sering digunakan untuk pengiriman teks pada suatu jaringan. Algoritma Brurrows-Wheeler Transform memiliki sifat reversible. Yaitu dapat mengembalikan blok data teks yang telah di transformasi ke bentuk yang sama persis dengan data asalnya.

Page 3: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

TINJAUAN PUSTAKA

• Teori Kompresi DataTeori Kompresi Data

Menurut [1] “Kompresi data adalah proses mengubah aliran data input (aliran sumber atau data mentah asli) ke dalam aliran data yang lain (output, atau aliran terkompresi) yang memiliki ukuran yang lebih kecil. Sebuah stream adalah baik file atau buffer dalam memori”.Sedangkan menurut kami pemampatan atau kompresi data adalah teknik/cara untuk memperkecil ukuran data sehingga hanya memerlukan ruang penyimpanan yang lebih kecil dibanding data asalnya.

Terdapat dua jenis teknik kompresi data, yaitu lossy dan lossless.

lossless data compression (pemampatan tanpa kehilangan), adalah data yang sudah dikompresi, dapat dikembalikan kebentuk data aslinya. Sedangkan Lossy data compression (pemampatan berkehilangan), kebalikan dari kompresi Lossless, dimana data yang sudah di kompresi 100% tidak dapat di kembalikan ke bentuk data data aslinya.

Page 4: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

• Pekerjaan TerkaitPekerjaan Terkait

Sudah ada beberapa riset yang telah di kerjakan berkaitan dengan topik dalam paper ini dan menjadi tolak ukur dalam penulisan, diantaranya yaitu:

•LZMA (Lempel-Ziv-Markov Chain Algorthm)

[7] “Menganalisis skema Lempel–Ziv dengan mengurai partisi urutan menjadi frase sehingga frase baru yaitu kalimat terpendek tidak melihat di masa lalu”, [8] “menjelaskan Skema Parsing Lempel-Ziv M untuk markov source” [9] meningkatkan kompleksitas waktu dengan menerapkan dalam mode paralel pada menggunakan algoritma LZMA .

•BWT (Burrows-Wheeler Transform)

[15] “Menjelaskan tentang prinsip kerja Burrows-Wheeler Transform” [18] “Menjelaskan tahapan cara kerja algorithm BWT”.

Page 5: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

PEMBAHASAN

• Lempel-Ziv Markov Chain Algorthm(LZMA)Lempel-Ziv Markov Chain Algorthm(LZMA)

LZMA pertama kali digunakan dalam mencapai software kompresi.LZMA menggabungkan dasar-dasar algoritma kompresi LZ77 bersama-sama dengan rantai Markov dan varian aritmatika coding yang disebut rentang encoder. LZMA juga diimplementasikan dalam program 7-Zip, dan menyediakan rasio kompresi yang tinggi dan dekompresi sangat cepat dengan kebutuhan memori yang kecil.

Page 6: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

• Burrows-wheeler TransformBurrows-wheeler Transform

[15] Burrows dan Wheeler memperkenalkan Algoritma Kompresi Data Blok-menyortir Lossless pada tahun 1994 [16] sebagai kombinasi dari tiga tahapan proses berturut-turut yaitu.

• 1. Tahap awal daari Burrows-Wheeler Transform(BWT), adalah yang melakukan permutasi tergantung pada konteks dari semua simbol dari data input (atau blok padanya untuk les besar). Karena konteks yang serupa biasanya berdampingan set yang sama dari beberapa simbol , data permutasi memiliki pengelompokan luas simbol-simbol yang sama dan terutama berjalan simbol tunggal (cf simbol dalam konteks PPM).

• 2. Suatu tahap pengodean ulang berikut ini, biasanya Pengembangan Move-To-Front [17] (MTF) , mengubah output dipermutasi menjadi distribusi sangat simetris/miring dengan bilangan bulat kecil, dan dominan nol (sekitar 60%).

• 3. Statistik akhir dari dari kerja coding lebih efisien yaitu second-stage output(tahapan kedua untuk keluaran). Tahapan ini biasanya menggunakan teknik code Hufman atau code aritmatika

Page 7: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

EVALUASIPada tahap Evaluasi ini kami akan menguji jenis file Document,image,audio, dan video dengan ukuran file yang berbeda-beda serta ekstesi file beragam dimana kami menggunakan ukuran data bytes.

•1.File Document

Pada tabel 1 dan 2 merupakan file yang telah di uji menggunakan algoritma LZMA pada tabel 1 dan BWT pada tabel 2 dengan tipe file document. Disini kami memilih data dengan ekstensi file yang berbeda antaranya file document pdf, ppt, docx dan doc.

No. Nama File Ukuran DataSetelah

kompresiRasio

Waktu(Detik)

1BWreflections.pd

f 369.627 bytes 323.768 bytes 87% 0,38 detik

2Lap. MUX

danDEX.docx 488.191 bytes 439.601 bytes 90% 0,35 detik

3 Roman2.ppt 2.664.960 bytes

794.285 bytes 29% 0,81 detik

4WIRELESS

LAN.doc 96.768 bytes 42.464 bytes 43% 0,54 detik

No. Nama File Ukuran DataSetelah

kompresiRasio

Waktu(Detik)

1 BWreflections.pdf 369.627 bytes 326.300bytes 88% 0,41 detik

2Lap. MUX

danDEX.docx 488.191 bytes 451.639bytes 92% 0,55 detik

3 Roman2.ppt 2.664.960 bytes 2.149.123bytes 80% 0,74 detik

4WIRELESS

LAN.doc 96.768 bytes 52.594bytes 54% 0, 83 detik

Page 8: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER
Page 9: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

• 2.File Audio

Sama hal nya dengan tabel 1 dan 2, Pada tabel 3 dan 4, di bawah ini merupakan file yang telah kami uji menggunakan algoritma LZMA dan BWT dengan tipe file Audio. Untuk file Audio ini kami menggunakan ekstensi file MP3.

AUDIO

No Nama File Ukuran Data Setelah Kompresi Rasio Waktu

(Detik)

101 What Makes You

Beautiful.mp36.508.753

bytes 6.504.756 bytes 99% 0,96

2Jason mraz_feat_colbie

caillat.mp34.578.217

bytes 4.527.113 bytes 98% 0,83

3Wake me up when

september ends.mp37.935.979

bytes 7.950.569 bytes 100% 1,07

4 preview.mp3 6.932.521 bytes 6.921.221 bytes 99% 1,05

AUDIO

No Nama File Ukuran Data Setelah Kompresi Rasio Waktu

(Detik)

101 What Makes You

Beautiful.mp36.508.753

bytes 6.489.612 bytes 99% 0,80

2Jason mraz_feat_colbie

caillat.mp34.578.217

bytes 4.512.305 bytes 98% 1,11

3Wake me up when

september ends.mp37.935.979

bytes 7.917.867 bytes 99% 1,30

4 preview.mp3 6.932.521 bytes 6.906.108 bytes 99% 1,07

Page 10: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER
Page 11: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

• 3.File Video

Pada tabel 5 dan 6, di bawah ini merupakan file Audio yang telah kami uji dengan algoritma LZMA dan BWT dengan ekstensi file AVI,MKV,3GP,FLV.

Video

No Nama File Ukuran Data Setelah Kompresi Rasio Waktu

(Detik)

152009020 Ho Tyson

[ooo].avi175.764.864

bytes8.5204.447

bytes 48% 7,47

2Alibabasubs Log

Horizon 13720p.mkv89.780.788

bytes90.393.454

bytes 100% 7,57

3 Andika ft Rama.3GP 3.505.174 bytes 3.487.241 bytes 99% 0,85

4 crayonshinchan-44.flv 35.857.086 bytes

34.271.705 bytes 95% 3,24

Video

No Nama File Ukuran Data Setelah Kompresi Rasio Waktu

(Detik)

152009020 Ho Tyson

[ooo].avi175.764.864

bytes107.466.055

bytes 61% 7,40

2Alibabasubs Log

Horizon 13720p.mkv89.780.788

bytes89.845.198

bytes 100% 6,87

3 Andika ft Rama.3GP 3.505.174 bytes 3.360.856 bytes 98% 0,96

4 crayonshinchan-44.flv 35.857.086 bytes

34.345.389 bytes 95% 3,18

Page 12: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER
Page 13: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

• 4.File Image

Pada tabel 7 dan 8 di bawah ini merupakan file Image yang kami uji menggunakan algoritma LZMA dan BWT dengan ekstensi file JPG,.

Image

No Nama File Ukuran Data Setelah Kompresi Rasio Waktu

(Detik)

1 DSC_0893.JPG 7.353.824 bytes 7.353.824 bytes 100% 1,03

2 ds.jpg 27.037 bytes 23.505 bytes 86% 0,51

3 DSC_0644.JPG 7.298.506 bytes 7.314.826 bytes 100% 1,05

4 ubuntu.jpg 136.561 bytes 137.656 bytes 100% 0,41

Image

No Nama File Ukuran Data Setelah Kompresi Rasio Waktu (Detik)

1 DSC_0893.JPG 7.353.824 bytes 7.290.003 bytes 99% 1,12

2 ds.jpg 27.037 bytes 24.531 bytes 90% 0,65

3 DSC_0644.JPG 7.298.506 bytes 7.243.327 bytes 99% 0,49

4 ubuntu.jpg 136.561 bytes 136.877 bytes 100% 0,49

Page 14: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER
Page 15: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

KESIMPULAN• Dari tahap evaluasi di atas kami menyimpulkan Baik algoritma LZMA maupun BWT tidak smuannya

baik dalam mengkompresi data. Dari ke 4 tipe file evaluasi diatas yang terbaik dalam mengkompres dengan menggunakan algoritma LZMA dan BWT adalah tipe file DOCUMENT. Untuk tipe file document kami menyarankan untuk menggunakan algoritma LZMA karena dari perbandingan diatas LZMA memiliki rasio kompresi lebih baik dibanding BWT. Tetapi keduanya sama-sama baik dalam mengkompres tipe data file document. Untuk tipe file Audio kedua algoritma baik LZMA maupun BWT sama sama kurang baik dalam mengkompres data, tapi kami lebih menyarankan untuk mengunakan algoritma BWT untuk mengkompres tipe file Audio karena pada evaluasi diatas untuk algoritma LZMA masih ada file yang memiliki rasio 100% atau hasil kompres dari algoritma LZMA melebihi ukuran data aslinya.Sedangkan untuk tipe file Video untuk rasio kompresi kediannya hampir sama. untuk ekstensi file AVI sangat cocok dikompres dengan menggunakan algoritma LZMA dan BWT tetapi untuk ukuran rasio kompresi LZMA lebih unggul di banding BWT. Sedangkan untuk ekstensi file MKV baik mnenggunakan algoritma LZMA maupun BWT rasio kompresinya 100%, dengan kata lain kompresi dengan ekstensi file MKV untuk tipe file Video tidak cocok dalam mengkompers menggunakan ke2 algoritma ini.Dan untuk tipe file image Algoritma LZMA tidak cocok digunakan karena resio kompresinya bisa menjadi 100% untuk ukuran diatas 100 KB. Kami lebih menyarankan untuk menggunakan Algoritma BWT dalam mengkompres data tipe file Image.

Page 16: EVALUASI KOMPRESI DATA MENGGUNAKAN ALGORITMA LEMPEL-ZIV-MARKOV CHAIN DENGAN ALGORITMA BURROWS-WHEELER

• [1] David solomon “The Complete reference”, Chapter 3 Data Compression, PP.1.

• [2] F. Peter, “Burrows Wheeler Compression: Principles and Reflections,” Phil. Trans. Roy. Soc. London, vol. A247, pp. 529-551, April 1955. (references)

• [3] Le. Wang,“ Evaluation of Compression for Energy-aware Communication in Wireless Networks”, Chapter 5 Compression Impact.

• [4] Igor Pavlov, “7z format”,tersedia di http://www.7-zip.org/7z.html.

• [5] Ranganathan, N and Henriques, S. “High-speed VLSI designs for Lempel-Ziv-based data compression”. Circuits and Systems II: Analog and Digital Signal Processing, 40,2,(1993) 96–106.

• [6] Zongjie Tu and Shiyong Zhang. “A Novel Implementation of JPEG 2000 Lossless Coding Based on LZMA”.

• [7] Ashwini M. Deshpande, Mangesh S. Deshpande and Devendra N. Kayatanavar. “FPGA Implementation of AES encryption and decryption. Proceedings” of International Conference on Control, Automation, Communication And Energy Conservation (2009).

• [8] J. Philippe, S. Wojciech, and T. Jing , “Average Profile of the Lempel-Ziv Parsing Scheme for Markovian Source,” IEEE Transl. J. Magn. Japan, vol. 2, pp. 740-741, August 1987 [Digests 9th Annual Conf. Magnetics Japan, p. 301, 1982].

• [9] “PARALLEL DATA COMPRESSION USING LZMA”

• [10] “A Novel Implementation of Wavelet Transform and Lzma for Compression and Decompression of Document Images”

• [11] “Improving compression ratio in backup”,pp.7.

• [12] M. Young, The Technical Writer’s Handbook. Mill Valley, CA: University Science, 1989.

• [13] J. Philippe, S. Wojciech, and T. Jing , “Average Profile of the Lempel-Ziv Parsing Scheme for Markovian Source,”. Pardue University, September 1987, pp. 1.

• [14] E.J. Leavline, D.A.A.G Singh, “Hardware Implementation of LZMA Data Compression Algorithm,”. IJAIS, vol 5, 2013.

• [15] F . Peter, “Burrows Wheeler Compression: Principles and Reflections,” Phil. Trans. Roy. Soc. London, vol. A247, pp. 529-551, April 1955. (references).

• [16] Burrows M., Wheeler, D.J. (1994) \A Block-sorting Lossless Data Compression Algorithm", SRC Research Report 124, Digital Systems Research Center, Palo Alto

• [17] J.L. Bentley, D.D. Sleator, R.E. Tarjan, and V.K. Wei. “A locally adaptive data compression algorithm", Communications of the ACM, Vol. 29, No. 4, April 1986, pp. 320-330.

• [18] M. Burrows, D.J. Wheeler “A Block-sorting Lossless Data Compression Algorithm”, 10,may 1994.

DAFTAR PUSTAKA