BAB II STUDI PUSTAKA

dokumen-dokumen yang mirip
ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

Metode klasifikasi Naïve Bayes. Team teaching

Pengenalan Pola. Klasifikasi Naïve Bayes

Pohon Keputusan. 6.1 Inductive Learning

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Algoritma Dasar. 4.1 Naive Bayes

ID3 : Induksi Decision Tree

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

Manfaat Pohon Keputusan

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

PENGUBAHAN SINGKATAN PADA PESAN SINGKAT TELEPON SELULER DENGAN MEMANFAATKAN POHON KEPUTUSAN C4.5

Persyaratan Produk. I.1 Pendahuluan. I.1.1 Tujuan. I.1.2 Ruang Lingkup

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. dari isinya, informasi dapat berupa penting atau tidak penting. Bila dilihat dari sifat

BAB I PENDAHULUAN. Setelah mengalami beberapa tahap perkembangan teknologi dalam

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

TUGAS AKHIR APLIKASI PENGIRIM PESAN SINGKAT TERJADWAL BERBASIS J2ME

Kode Huffman dan Penggunaannya dalam Kompresi SMS

1. REGISTER BERANDA REGISTRASI RINGKASAN REGISTRASI ACTIVATION ACCOUNT... 9

BAB I PENDAHULUAN. telah diperkenalkan pada tahun 1992 di Eropa oleh ETSI (European Telecommunikation

BAB 1 PENDAHULUAN. mempunyai potensi yang sangat besar untuk menentukan kemajuan teknologi informasi

BAB I PENDAHULUAN. 1.1 Latar Belakang

data dengan menggunakan konektivitas tersebut terbatas jangkauan area koneksinya, meskipun pengguna tidak perlu mengeluarkan biaya.

BAB I PENDAHULUAN wisatawan mengunjungi lokawisata Baturaden. Sedangkan untuk. banyak wisata alam yang ada dibanyumas.

BAB I PENDAHULUAN. Administrator jaringan atau sering disebut admin jaringan adalah

BAB V KESIMPULAN DAN SARAN

Algoritma Data Mining (2) Tugas Klasifikasi

APLIKASI SHORT MESSAGE SERVICE DENGAN ENKRIPSI TEKS MENGGUNAKAN ALGORITMA ADVANCED ENCRYPTION STANDARD BERBASIS MOBILE PADA PLATFORM ANDROID

BAB I PENDAHULUAN. media penyimpanan data yang memiliki ukuran hingga ratusan gigabyte bahkan

BAB I PENDAHULUAN. dapat digunakan seperti SMS (Short Message Service), MMS. (Multimedia Messaging Service), WAP (Wireless Application Protocol),

SISTEM INFORMASI RENTAL PC GAME ONLINE PADA RENTAL PC GAME SPYRO BERBASIS WEB DAN PEMESANAN CD VIA SMS

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

BAB I PENDAHULUAN I.1. Latar Belakang

BAB I PENDAHULUAN Latar Belakang Masalah

RULE MINING UNTUK KLASIFIKASI DATA MENGGUNAKAN SEARCH TREE

BAB VI PENGUJIAN. Pada bab ini akan dijelaskan proses serta hasil pengujian yang dilakukan terhadap


BAB IV HASIL DAN UJI COBA

BAB I PENDAHULUAN. pesatnya sehingga kita dengan mudah bisa menikmatinya. Perkembangan. saja seolah-olah tanpa mengenal batasan ruang dan waktu.

BAB I PENDAHULUAN. dikendalikan secara manual dengan menekan tombol on/off. Perkembangan gaya

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III ANALISIS PENYELESAIAN MASALAH

BAB III LANDASAN TEORI. Menurut Wahana Komputer (2005 : 7) Short Message Service yang lebih

BAB 1 PENDAHULUAN. orang saat ini sudah memanfaatkan teknologi seluler. SMS (Short Messages

BAB I. PERSYARATAN PRODUK

PERANCANGAN ENKRIPSI DAN DESKRIPSI DENGAN METODE ALPHA-QWERTY REVERSE PADA APLIKASI SHORT MESSAGE SERVICE BERBASIS ANDROID

Subrutin atau Fungsi. Praktikum 9 A. T U J U A N B. DASAR TEORI

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PERSYARATAN PRODUK

BAB 1 PENDAHULUAN Latar Belakang

DAN ENKRIPSI BERBASIS AES PADA PENGIRIMAN SMS

BAB I PENDAHULUAN. sebuah teknologi yang berbasis mobile atau perangkat bergerak. Saat ini mobile

BAB I PENDAHULUAN. 1.1 Latar Belakang

Diktat Kuliah Data Mining - Institut Informatika Indonesia Semester Genap 2006/ Maret 2007 Sub Materi: ID3: Induksi Decision Tree

BAB IV HASIL DAN UJI COBA

BAB I PENDAHULUAN. yang beragam dan salah satu di antaranya adalah media SMS (Short Message

BAB III PERENCANAAN KEBUTUHAN DAN PERANCANGAN

PENERAPAN PROTOCOL DATA UNIT PADA SHORT MESSAGE SERVICE HASIL STUDI MAHASISWA (STUDI KASUS : STMIK BUDI DARMA MEDAN) Abstrak

BAB I PERSYARATAN PRODUK

BAB IV IMPLEMENTASI DAN EVALUASI SISTEM

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III ANALISIS DAN DESAIN SISTEM

PERAN SMS GATEWAY DALAM PENYEBARAN INFORMASI

IMPLEMENTASI ALGORITMA CAESAR, CIPHER DISK, DAN SCYTALE PADA APLIKASI ENKRIPSI DAN DEKRIPSI PESAN SINGKAT, LumaSMS

BAB II INDUCT/RIPPLE-DOWN RULE (RDR)

BAB I PENDAHULUAN 1.1 Latar Belakang

MENGGUNAKAN APLIKASI TELEGRAM DI BERBAGAI PERANGKAT

Metode C45 Untuk Mengklarifikasi Pelanggan Perusahaan Telekomunikasi Seluler

PENERAPAN ALGORITMA C4.5 DALAM PENERIMAAN CALON KARYAWAN PT. TELKOM AKSES AREA LAMPUNG BERBASIS WEBSITE

Latar belakang proyek ini adalah adanya kebutuhan perusahaan X yang bergerak sebagai distributor dalam bidang penyediaan kebutuhan bahan pokok untuk

BAB III METODE PENELITIAN. Langkah penelitian yang digunakan disajikan pada Gambar 4.

Classification (1) Classification (3) Classification (2) Contoh Classification. Classification (4)

Manual Penggunaan dan Instalasi Software

PAPAN INFORMASI AKADEMIK DENGAN LED DOT MATRIKS 50X7 BERBASIS MIKROKONTROLLER AT 89S52

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. MMS (Multimedia Messaging Service) adalah puncak dari evolusi SMS

BAB 1 PENDAHULUAN Pengantar

BAB 1 PENDAHULUAN. suatu keperluan yang penting maka keberadaan koneksi jaringan menjadi sesuatu yang

BAB I PENDAHULUAN. sangat cepat, yang tanpa disadari telah menjadi suatu kebutuhan primer di

BAB 1 PENDAHULUAN 1-1

Panduan Penggunaan Aplikasi incloud Bahasa Indonesia

BAB I PENDAHULUAN. yang beragam dan salah satu diantaranya adalah media SMS ( Short Message

Desain Sistem Informasi Equipment Stop Alert Menggunakan SMS Gateway

BAB 4 IMPLEMENTASI DAN EVALUASI. pendukung, seperti perangkat keras dan piranti lunak. Berikut ini akan diuraikan

BAB II LANDASAN TEORI. - Jalan Umum adalah : jalan yang diperuntukkan bagi lalu lintas umum

RANCANG BANGUN SISTEM INFORMASI AKADEMIK SEKOLAH (SISWA) BERBASIS WEB DAN SMS GATEWAY DENGAN PHP DAN GAMMU (Studi Kasus di SMP Negeri 1 Pakis)

SMS Gateway. oleh: Kaka E. Prakasa Nanang Syaifudin

Membangun Aplikasi Layanan Pengiriman to SMS dan. SMS to berbasis SMS Gateway TUGAS AKHIR. Disusun Oleh : SYAIFUL ALAM NPM.

RANCANG BANGUN PAPAN IKLAN DOT MATRIX MENGGUNAKAN SMS BERBASIS MIKROKONTROLER

II. TINJAUAN PUSTAKA. elemen yang saling berinteraksi untuk mencapai suatu tujuan. Sedangkan

Transkripsi:

BAB II STUDI PUSTAKA Bab ini berisi penjelasan mengenai studi pustaka yang dilakukan berkaitan dengan pelaksanaan tugas akhir, antara lain mengenai Short Messaging Service (SMS), bahasa SMS, pohon keputusan dan pohon keputusan dengan menggunakan perangkat lunak C4.5. 2.1 Pengertian Short Message Service (SMS) Short Messaging Service atau lebih dikenal dengan SMS adalah suatu layanan yang ada dalam jaringan GSM (Global System for Mobile) yang memungkinkan pengguna layanan untuk mengirimkan dan menerima pesan pendek sepanjang 160 karakter melalui telepon seluler atau melalui internet menggunakan situs yang memiliki SMS Gateway [TON07]. SMS merupakan salah satu fitur dari GSM yang dikembangkan dan distandardisasi oleh ETSI. 2.2 Bahasa SMS Bahasa SMS atau dikenal dengan Texting Language adalah suatu jenis bahasa yang merupakan modifikasi dari bahasa standar yang ada, sehingga akhirnya memiliki format yang berbeda. Jenis modfikasi yang dilakukan pun bermacam-macam, yang paling umum dikenal yaitu menyingkat suatu kata dengan menghilangkan beberapa huruf dari kata tersebut, misalnya pesan disingkat menjadi psn. Munculnya bahasa SMS ini tidak lepas dari dua faktor penting, yaitu: 1. Keterbatasan panjang pesan pendek yang dapat dikirimkan melalui SMS Panjang pesan pendek yang dapat dikirimkan oleh sebuah SMS hanya berjumlah 160 karakter. Untuk beberapa telepon seluler yang baru saat ini, mampu mengirimkan 500 karakter SMS sekali kirim, atau setara dengan tiga SMS biasa. Namun, tentunya biaya yang harus dikeluarkan juga sejumlah tiga kali lipat. 2. Kerumitan menggunakan keyboard numerik pada telepon seluler Keyboard telepon seluler adalah keyboard numerik, yang terdiri dari 12 tombol utama, yang kegunaan utamanya adalah untuk menuliskan karakter angka, karakter bintang (*) II-1

II-2 dan karakter pagar (#). Karakter huruf diwakili oleh tombol angka. Setiap tombol angka, mulai dari tombol 2 sampai dengan 9 mewakili lebih dari satu karakter huruf, misalnya tombol angka 2 mewakili karakter huruf A, B dan C, baik huruf kapital ataupun huruf kecil. Untuk menuliskan huruf A, tombol angka 2 harus ditekan satu kali. Dan untuk menuliskan huruf B dan C masing-masing harus menekan tombol 2 sebanyak dua kali dan tiga kali. Jika akan mengganti penulisan menjadi huruf kecil atau huruf besar, diharuskan untuk menekan tombol karakter (*) atau tombol karakter pagar (#), hal ini tergantung merek telepon selulernya. 2.3 Pohon Keputusan Pembelajaran pohon keputusan adalah metode untuk mengaproksimasi fungsi target yang bernilai diskrit, yang mana fungsi pembelajaran yang dihasilkan direpresentasikan dalam pohon keputusan[mit97]. Fungsi pembelajaran ini juga dapat di representasikan dalam sekumpulan aturan if-then-else untuk memudahkan pembacaan oleh manusia. Metode ini adalah algoritma inferensi induktif paling popular. 2.3.1 Representasi Pohon Keputusan Pohon keputusan mengklasifikasikan instans dengan cara mengurutkan instans tersebut ke bawah pohon keputusan dari akar sampai daun, setiap daun mewakili klasifikasi dari instans tersebut. Setiap simpul pada pohon melakukan tes dari beberapa atribut yang dimiliki oleh instans, dan setiap cabang yang turun dari simpul tersebut berhubungan dengan sebuah nilai yang mungkin dari atribut tersebut. Sebuah instans diklasifikasikan dengan memulai dari simpul akar dari pohon, mengetes atribut yang dispesifikasikan oleh simpul tersebut, dan kemudian bergerak ke bawah cabang pohon yang berhubungan dengan nilai dari atribut yang diberikan di contoh. Proses ini kemudian diulangi di setiap simpul. Pembelajaran pohon keputusan secara umum sangat cocok untuk permasalahan yang memiliki karakteristik berikut ini[mit97]: Instans direpresentasikan oleh pasangan-pasangan atribut dan nilai atributnya Fungsi target memiliki keluaran yangdiskrit

II-3 Data pelatihan boleh mengandung data yang error Data pelatihan boleh mengandung atribut yang nilainya tidak ada 2.3.2 Inferensi Pohon Keputusan Dengan data pelatihan weather yang digunakan pada lampiran C, didapatkan sebuah pohon keputusan yang dapat dilihat pada gambar II-1. Gambar II-1 Pohon Keputusan Weather[MIT97] Proses inferensi/penelusuran pohon keputusan dimulai dari simpul akar yang berupa evaluasi nilai outlook. Jika nilai atribut outlook bernilai overcast, maka instans tersebut akan digolongkan sebagai kelas yes. Jika nilai overcast bernilai sunny, evaluasi akan diteruskan ke simpul sebelah kiri, yang akan mengevaluasi nilai atribut humidity, selanjutnya jika nilai atribut humidity bernilai high, maka instans akan digolongkan sebagai kelas no, sedangkan jika nilai atribut humidity bernilai normal, maka instans akan digolongkan sebagai kelas yes. Sebaliknya jika nilai overcast bernilai rain, evaluasi akan diteruskan ke simpul sebelah kanan, yang akan mengevaluasi nilai atribut wind, selanjutnya jika nilai atribut wind bernilai strong, maka instans akan digolongkan sebagai kelas no, sedangkan jika nilai atribut wind bernilai weak, maka instans akan digolongkan sebagai kelas yes.

II-4 2.4 Pohon Keputusan di C4.5 Subbab ini akan membahas mengenai salah satu perangkat lunak yang telah mengimplementasikan algoritma pohon keputusan C4.5. C4.5 adalah algoritma yang dikembangkan dari algoritma ID3, yang menghilangkan beberapa kelemahan ID3. Keunggulan C4.5 dibandingkan ID3 adalah: Mampu menangani data yang bersifat kontinu ataupun diskrit Mampu menangani data yang kehilangan nilai atributnya Mampu melakukan pruning pohon secara langsung 2.4.1 Deklarasi Kelas dan Atribut Data Untuk menggunakan perangkat lunak C4.5, perlu dilakukan beberapa hal terlebih dahulu, yaitu: Deklarasi kelas data. Hal ini sangat penting, mengingat fungsi pohon keputusan adalah untuk mengklasifikasikan data. Deklarasi atribut data. Hal ini diperlukan untuk menentukan apa saja atribut data yang digunakan, dan nilai-nilai yang mungkin dari atribut tersebut. Deklarasi kelas dan atribut data ini dilakukan dalam suatu file berekstensi *.names. Format penulisan deklarasi kelas dan atribut data dapat dilihat pada contoh di gambar di bawah ini: Yes, No. Outlook: Sunny, Overcast, Rain. Temperature: Hot, Mild, Cool. Humidity: High, Normal. Wind: Weak, Strong. Gambar II-2 Representasi deklarasi kelas dan atribut data Contoh diatas merupakan deklarasi kelas dan atribut data untuk data Play Tennis. Terdapat dua kelas untuk data Play Tennis yaitu yes dan no. Atribut-atribut untuk data Play Tennis adalah Outlook, dengan kemungkinan nilai-nilainya yaitu Sunny, Overcast, Rain. Kemudian Temperature, dengan kemungkinan nilai-nilainya yaitu Hot, Mild, Cool.

II-5 Lalu ada Humidity dengan kemungkinan nilai-nilainya High dan Normal. Dan terakhir Wind, dengan kemungkinan nilai-nilainya Weak dan Strong. 2.4.2 Data Pelatihan Untuk dapat membentuk pohon keputusan, selain deklarasi kelas dan atribut data, diperlukan juga data pelatihan. Dengan perangkat lunak C4.5 ini, data-data pelatihan disimpan di dalam file berekstensi *.data. Format penulisan data dapat dilihat pada contoh di gambar berikut ini: Sunny,Hot,High,Weak,No Sunny,Hot,High,Strong,No Overcast,Hot,High,Weak,Yes Rain,Mild,High,Weak,Yes Rain,Cool,Normal,Weak,Yes Rain,Cool,Normal,Strong,No Overcast,Cool,Normal,Strong,Yes Sunny,Mild,High,Weak,No Sunny,Cool,Normal,Weak,Yes Rain,Mild,Normal,Weak,Yes Sunny,Mild,Normal,Strong,Yes Overcast,Mild,High,Strong,Yes Overcast,Hot,Normal,Weak,Yes Rain,Mild,High,Strong,No Gambar II-3 Representasi data pelatihan Data pelatihan tersebut terdiri dari 14 instans dan kelas dari masing-masing instans tersebut. Penulisan nilai atribut posisinya harus bersesuaian dengan posisi atribut ketika dideklarasikan. Sebagai contoh, instans {Sunny, Hot, High, Weak}. Sunny adalah nilai untuk atribut Outlook, Hot adalah nilai untuk atribut Temperature, High adalah nilai untuk atribut Humidity, dan Weak adalah nilai untuk atribut Wind. 2.4.3 Pembentukan Pohon Keputusan Pembentukan pohon keputusan dilakukan dengan mengeksekusi program C4.5. Untuk dapat menggunakan program ini, digunakan command prompt atau DOS di Windows, dan pindahkan area kerja ke direktori tempat program berada. Data pelatihan harus berada di direktori yang sama dengan direktori program. Untuk pembentukan pohon

II-6 keputusan dengan program ini, panggil program c4.5 dengan menggunakan argumen f dan identifier data pelatihan. Sebagai contohnya, dapat dilihat di bawah: >> C4.5 f tennis Command tersebut menandakan bahwa data pelatihan dispesifikasikan oleh tennis.data dan tennis.names. Keluaran program dapat dilihat pada lampiran B. Keluaran program memperlihatkan hirarki pohon keputusan yang dibentuk dari data pelatihan. Selain itu, keluaran program juga memperlihatkan jumlah data yang error atau tidak konsisten dengan data yang lain sebelum dan sesudah pruning pohon. 2.4.4 Pembentukan Aturan Produksi Pembentukan aturan produksi dari pohon keputusan dilakukan dengan mengeksekusi program C4.5rules. Untuk dapat menggunakan program ini, digunakan command prompt atau DOS di Windows, dan pindahkan area kerja ke direktori tempat program berada. Data pelatihan harus berada di direktori yang sama dengan direktori program. Untuk mengeksekusi program C4.5rules, sebelumnya telah dibentuk pohon keputusan dengan mengeksekusi program C4.5 terlebih dahulu. Selanjutnya panggil program c4.5rules dengan menggunakan argumen f dan identifier data pelatihan yang telah dibentuk pohon keputusannya. Contohnya dapat dilihat sebagai berikut: >> C4.5rules -f tennis Command tersebut menandakan bahwa pohon keputusan yang akan dibuat aturan produksinya adalah pohon keputusan yang data pelatihannya dispesifikasikan oleh tennis.data dan tennis.names. Keluaran program dapat dilihat pada lampiran B. Keluaran program memperlihatkan aturan produksi yang dibangkitkan dari pohon keputusan, beserta perhitungan nilai kebenaran aturan tersebut secara statistik. Selain itu, keluaran program tersebut memperlihatkan hasil evaluasi dari masing-masing aturan produksi yang dibentuk.