TEKNIK KOMPRESI LOSSLESS TEXT

dokumen-dokumen yang mirip
KOMPRESI DATA DAN TEKS. By : Nurul Adhayanti

>>> Kompresi Data dan Teks <<<

KOMPRESI DATA. Multimedia Jurusan Teknik Informatika. Riki Ruli S -

Kompresi. Definisi Kompresi

PROGRAM STUDI S1 SISTEM KOMPUTER UNIVERSITAS DIPONEGORO. Oky Dwi Nurhayati, ST, MT.

KOMPRESI DAN TEKS. = 4800 karakter. 8 x 8 Kebutuhan tempat penyimpanan per halaman = byte = byte = Kbyte

Bab 6. Kompresi Data dan Teks. Pokok Bahasan : Tujuan Belajar : Sekilas Kompresi Data

TEKNIK KOMPRESI LOSSLESS

~ By : Aprilia Sulistyohati, S.Kom ~

KOMPRESI DAN TEKS M U L T I M E D I A KOMPRESI DATA

KOMPRESI DAN TEKS. Pemrograman Multimedia KOMPRESI DATA. Diktat Kuliah

KONSEP. Tujuan Kompresi:

KOMPRESI DAN TEKS. By Aullya Rachmawati,

Semester Ganjil 2012/2013 Program Studi Multimedia - Politeknik Negeri Media Kreatif KOMPRESI DAN TEKS

PROGRAM STUDI S1 SISTEM KOMPUTER UNIVERSITAS DIPONEGORO MULTIMEDIA. Kompresi. Oky Dwi Nurhayati, ST, MT

FAKULTAS TEKNIK UNIVERSITAS NEGERI YOGYAKARTA LAB SHEET KOMUNIKASI DATA

FAKULTAS TEKNIK UNIVERSITAS NEGERI YOGYAKARTA LAB SHEET (KOMUNIKASI DATA)

A Sanserif A Agyptian A DEKORATIF

Informasi dan Coding

Kompresi. Pengertian dan Jenis-Jenis Kompresi

BAB 2 TINJAUAN PUSTAKA

MULTIMEDIA system. Roni Andarsyah, ST., M.Kom Lecture Series

REPRESENTASI DATA MULTIMEDIA

BAB II LANDASAN TEORI. Kompresi data atau pemampatan data adalah suatu proses pengubahan

KOMPRESI STRING MENGGUNAKAN ALGORITMA LZW DAN HUFFMAN

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

1. PENDAHULUAN 1.1. Latar Belakang Masalah

Image Compression. Kompresi untuk apa?

HUFFMAN CODING. Huffman Coding

PEMAMPATAN CITRA (IMA

Pemampatan Data dengan Kode Huffman pada Perangkat Lunak WinZip

Penerapan Pohon Biner Huffman Pada Kompresi Citra

PERBANDINGAN ALGORITMA HUFFMAN DAN ALGORITMA SHANNON-FANO PADA PROSES KOMPRESI BERBAGAI TIPE FILE. Irwan Munandar

Contoh kebutuhan data selama 1 detik pada layar resolusi 640 x 480 : 640 x 480 = 4800 karakter 8 x 8

Penggunaan Kode Huffman dan Kode Aritmatik pada Entropy Coding

BAB III METODE KOMPRESI HUFFMAN DAN DYNAMIC MARKOV COMPRESSION. Kompresi ialah proses pengubahan sekumpulan data menjadi suatu bentuk kode

BAB 2 TINJAUAN PUSTAKA

Perbandingan Algoritma Kompresi Terhadap Objek Citra Menggunakan JAVA

REPRESENTASI DATA MULTIMEDIA

Image Compression. Tujuan Kompresi Image. Teknik kompresi yang diharapkan. Image Compression. Kompresi untuk apa?

BAB 2 TINJAUAN PUSTAKA

Kata kunci: pohon biner, metode Huffman, metode Kanonik Huffman, encoding, decoding.

BAB 2 LANDASAN TEORI

BAB 1 PENDAHULUAN Latar Belakang

Teknik Kompresi Citra Menggunakan Metode Huffman

[TTG4J3] KODING DAN KOMPRESI. Oleh : Ledya Novamizanti Astri Novianty. Prodi S1 Teknik Telekomunikasi Fakultas Teknik Elektro Universitas Telkom

Image Compression. Tujuan Kompresi Image. Teknik kompresi yang diharapkan. Image Compression. Kompresi untuk apa?

BAB 2 Tinjauan Teoritis

BAB 2 TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

SISTEM ANALISA PERBANDINGAN UKURAN HASIL KOMPRESI WINZIP DENGAN 7-ZIP MENGGUNAKAN METODE TEMPLATE MATCHING

BAB 2 TINJAUAN PUSTAKA

BAB II DASAR TEORI. 2.1 Pendahuluan

BAB 2 TINJAUAN PUSTAKA

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2010/2011

Penerapan Algoritma Huffman dalam Kompresi Gambar Digital

DATA COMPRESSION CODING USING STATIC AND DYNAMIC METHOD OF SHANNON-FANO ALGORITHM

IMPLEMENTASI DAN ANALISIS KINERJA ALGORITMA SHANNON- FANO UNTUK KOMPRESI FILE TEXT

1. Pendahuluan. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 2 LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN 1-1

KOMPRESI FILE MENGGUNAKAN ALGORITMA HUFFMAN KANONIK

KOMPRESI TEKS MENGGUNAKAN ALGORITMA DAN POHON HUFFMAN. Nama : Irfan Hanif NIM :

BAB I PENDAHULUAN. Dalam dunia modern sekarang ini kebanyakan aktivitas manusia selalu

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Penerapan Pengkodean Huffman dalam Pemampatan Data

BAB I PENDAHULUAN. Dalam bidang teknologi informasi, komunikasi data sangat sering

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Perbandingan Kompresi Data Menggunakan Algoritma Huffman dan Algoritma DMC

PERBANDINGAN ALGORITMA HUFFMAN DENGAN ALGORITMA SHANNON-FANO

BAB 1 PENDAHULUAN 1-1

PEMAMPATAN DATA DIGITAL MENGGUNAKAN METODA RUN-LENGTH

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

PENGANTAR KOMPRESI DATA

PEMAMPATAN TATA TEKS BERBAHASA INDONESIA DENGAN METODE HUFFMAN MENGGUNAKAN PANJANG SIMBOL BERVARIASI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Kompresi Data dengan Kode Huffman dan Variasinya

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Entropy Naskah Bahasa Sunda Dan Bahasa Jawa Untuk Kompresi Teks Menggunakan Algoritma Binary Huffman Code

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

DIGITAL IMAGE CODING. Go green Aldi Burhan H Chandra Mula Fitradi Mardiyah

TUGAS AKHIR IMPLEMENTASI ALGORITMA METODE HUFFMAN PADA KOMPRESI CITRA

BAB 2 TINJAUAN PUSTAKA

APLIKASI KOMPRESI TEKS SMS PADA MOBILE DEVICE DENGAN MENGGUNAKAN ALGORITMA HUFFMAN KANONIK

BAB I PENDAHULUAN. halaman khusus untuk pengaksesan dari handphone. Semakin baik informasi akan

BAB 1 PENDAHULUAN. tertulis, audio dan video. Objek-objek tersebut yang sebelumnya hanya bisa

TEKNIK PENGOLAHAN CITRA. Kuliah 13 Kompresi Citra. Indah Susilawati, S.T., M.Eng.

Oleh : Page 1

Algoritma Huffman dan Kompresi Data

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

KOMPRESI FILE CITRA BITMAP MENGGUNAKAN ALGORITMA RLE DAN LZ78. Iwan Fitrianto Rahmad 1, Helmi Kurniawan 2 ABSTRACT

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

KOMPRESI CITRA. lain. Proses mengubah citra ke bentuk digital bisa dilakukan dengan beberapa perangkat,

IMPLEMENTASI ALGORITMA RUN LENGTH, HALF BYTE DAN HUFFMAN UNTUK KOMPRESI FILE

BAB I PENDAHULUAN. pesat, populasi penggunanya pun semakin meningkat, sehingga data atau informasi

BAB I PENDAHULUAN. Saat ini perkembangan teknologi berkembang sangat cepat. Penyimpanan

Transkripsi:

TEKNIK KOMPRESI LOSSLESS TEXT Teknik Elektro Unibraw

Kompresi Memampatkan / mengecilkan raw data Kompresi Multimedia: memampatan raw data multimedia Kompresi multimedia adalah mutlak mengingat ukuran raw data media yang sangat besar: sinyal suara, image maupun video

Tujuan Kompresi Memperkecil ukuran file / data -> penyimpanan maupun transmisi

Kompresi Berdasarkan Penerimaan 1. Dialoque Mode: proses penerimaan data secara real time, mis: video conference. Kompresi data harus berada dalam batas penglihatan dan pendengaran manusia. 2. Retrieval Mode: proses penerimaan data tidak real time. Dapat dilakukan fast forward dan fast rewind di client. Dapat dilakukan random access terhadap data dan dapat bersifat interaktif

Kompresi Berdasarkan Output 1. Kompresi Lossless (Non-Lossy) Hasil dekompres dari data terkompresi akan tepat sama persis dengan data sebelum dikompres 2. Kompresi Lossy Hasil dekompres dari data terkompresi tidak tepat sama persis, tetapi persepsi terhadap semantik data tetap sama

Kriteria Algoritma & Aplikasi Kompresi Kualitas data hasil enkoding: ukuran lebih kecil, data tidak rusak (untuk kompresi lossy) Ketepatan proses dekompresi data: data hasil dekompresi tetap sama dengan data sebelum dikompres (kompresi loseless) Kecepatan, ratio, dan efisiensi proses kompresi & dekompresi

Klasifikasi Teknik Kompresi Entropy Encoding Source Coding Hybrid Coding

Entropy Encoding Bersifat lossless Tekniknya tidak berdasarkan media dengan spesifikasi dan karakteristik tertentu namun berdasarkan urutan data. Statistical encoding, tidak memperhatikan semantik data. Misalnya: Run-length coding, Huffman coding, Arithmetic coding

Source Coding Bersifat lossy Berkaitan dengan data semantik (arti data) dan media. Misalnya: Prediction (DPCM, DM), Transformation (FFT, DCT), Layered Coding (Bit position, sub-sampling, subband coding), Vector quantization

Hybrid Coding Gabungan antara lossy + lossless Misalnya: JPEG, MPEG, H.261, DVI

Algoritma Kompresi Loseless Run Length Encoding (RLE) Huffman Coding Algoritma Shannon-Fano Adaptive Huffman Coding Arithmatic Coding Dictionary Based Encoding

RLE Run Length Encoding Kompresi data teks dilakukan jika ada beberapa huruf yang sama yang ditampilkan berturut-turut: contoh data : ABCCCCCCCCDEFGGGG = 17 karakter RLE tipe 1 (min 4 huruf sama) ABC!8DEFG!4 = 11 karakter

RLE #2 RLE ada yang menggunakan suatu karakter yang tdk digunakan dalam teks, seperti! untuk menandai.

RLE #3 Kelemahan, jika ada karakter angka, mana tanda mulai dan akhirnya? data: ABCCCCCCCCDEFGGGG = 17 karakter RLE tipe 2 : -2AB8C-3DEF4G = 12 karakter data: AB12CCCCDEEEF = 13 karakter RLE tipe 2 : -4AB124CD3EF = 12 karakter

RLE #4 RLE ada yang menggunakan flag bilangan negatif untuk menandai batas sebanyak jumlah karakter tersebut

Huffman Coding Optimal code pertama dikembangkan oleh David Huffman Utk sumber S = {x 1,, x n }; Probabilitas P = {p 1,.., p n }; Codewords {c 1,.., c n }; dan Panjang {l 1,.., l n }. Terdapat optimal binary prefix code dengan karakteristik: Teorema: (a) Jika p j > p i, maka l j l i (b) Dua codeword dari dua simbol dg probabilitas terendah mempunyai panjang yg sama (c) Dua codeword terpanjang identik kecuali pada digit terakhir

Pengkodean Huffman Pengkodean Huffman bertujuan untuk mengkodekan setiap simbol dengan panjang kode berbeda, simbol yg paling sering muncul akan memiliki kode lebih pendek Algoritma Enkoding Huffman 1. Simbol diurutkan berdasarkan probabliti kemunculan. Dua simbol terbawah diberi assign 0 dan 1. -> Splitting stage 2. Dua simbol terbawah tadi dijumlahkan dan menjadi kode sumber baru dan probabilitasnya dijumlahkan. Diurutkan menjadi stage 2 3. Proses tersebut diurutkan sehingga urutannya hanya tinggal 2 baris dengan assign 0 dan 1. 4. Kode word untuk simbol tersebut adalah kombinasi biner yg terjadi, dilihat dari belakang

Huffman Coding Contoh: x i p i -------------------------- A --- 0,35 B 0,17 C 0,17 D 0,16 E 0,15

Huffman Coding Dari Huffman tree dapat dibuat tabel codeword: A 1 B 011 C 010 D 001 E 000 L Huff = 0,35*1 + 0,17*3 + 0,17*3 + 0,16*3 + 0,15*3 = 2,3 H(S) = 2,23284 Efisiensi = (2,23284/2,3) x 100 % = 97,08%

Huffman Coding Tergantung pada bagaimana memilih probabilitas terendah saat membangun Huffman tree Huffman tree tidak unik Namun, panjang rata-rata codeword selalu sama utk tree yang berbeda

Konstruksi Kode Huffman Aturan penyusunan kode Huffman: y 0 y 1 y 2 y 3 y 4 y 5 y 6 y 7 0.51 0.51(0) 0.20 0.20(1) 0.49(1) 0.14 0.14(1) 0.29(0) 0.08 0.08(0) 0.15(0) 0.04 0.04(0) 0.07(1) 0.02 0.02(0) 0.03(1) 0.005(0) 0.01(1) 0.005(1) 0 11 101 1000 10010 100110 1001110 1001111

Keterbatasan Pengkodean Huffman Rate selalu lebih besar dari 1.0 bit/sample Predesain kode Tabel kode tetap Jika probabilitas berbeda dengan yang digunakan dalam desain, ekspansi data dapat terjadi Versi praktek: - Implementasi two-pass - Blok adaptif (tabel kode per blok data) - Huffman rekursif (perubahan tabel kode secara kontinyu)

Shannon-Fano Coding Suboptimal code Shannon code Shannon-Fano code Optimal code Huffman code Arithmetic coding Efisiensi macam-macam code diukur dengan: effisiensi H( S).100% L avg

Shannon-Fano Coding Contoh S = {A, B, C, D, E} P = {0.35, 0.17, 0.17, 0.16, 0.15} Pengkodean Shannon-Fano: Bagi S kedalam s 1 dan s 2 (pilih yang memberikan perbedaan p(s 1 ) dan p(s 2 ) terkecil s 1 = (A,B) p(s 1 ) = p(a) + p(b) = 0,52 s 2 = (C,D,E) p(s 2 ) = p(c) + p(d) + p(e) = 0,48 Panggil ShannonFano()

Shannon-Fano Coding Panjang code rata-rata: L sh = 0,35*2 + 0,17*2 + 0,17*2 + 0,16*3+0,15*3 = 2,31 Efisiensi = (2,23284/2,31)*100 = 96,66 %

Shannon-Fano Algorithm Dikembangkan oleh Shannon (Bell Labs) dan Robert Fano (MIT). Algoritma : 1. Urutkan simbol berdasarkan frekuensi kemunculannya 2. Bagi simbol menjadi 2 bagian secara rekursif, dengan jumlah yang kira-kira sama pada kedua bagian, sampai tiap bagian hanya terdiri dari 1 simbol. Cara yang paling tepat untuk mengimplementasikan adalah dengan membuat binary tree.

Contoh Shannon-Fano

Aplikasi Kompresi Loseless ZIP File Format RAR File

ZIP File Format Ditemukan oleh Phil Katz untuk program PKZIP kemudian dikembangkan untuk WinZip, WinRAR, 7-Zip. Berekstensi *.zip dan MIME application/zip Dapat menggabungkan dan mengkompresi beberapa file sekaligus menggunakan bermacam-macam algoritma, namun paling umum menggunakan Katz s Deflate Algorithm.

Metode ZIP Beberapa method Zip: Shrinking : merupakan metode variasi dari LZW Reducing : merupakan metode yang mengkombinasikan metode same byte sequence based dan probability based encoding. Imploding : menggunakan metode byte sequence based dan Shannon-Fano encoding. Deflate : menggunakan LZW Aplikasi: WinZip oleh Nico-Mak Computing

RAR File Ditemukan oleh Eugene Roshal, sehingga RAR merupakan singkatan dari Roshal Archive pada 10 Maret 1972 di Rusia. Berekstensi.rar dan MIME application/x-rarcompressed. Proses kompresi lebih lambat dari ZIP tapi ukuran file hasil kompresi lebih kecil. Aplikasi: WinRAR yang mampu menangani RAR dan ZIP, mendukung volume split, enkripsi AES.