KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER

dokumen-dokumen yang mirip
KLASIFIKASI TEKS BAHASA BALI DENGAN METODE SUPERVISED LEARNING NAIVE BAYES CLASSIFIER

PENGENALAN AKSARA BALI MENGGUNAKAN METODE ZONING DAN KNN

RANCANG BANGUN SISTEM OPINION MINING DENGAN METODE POS TAGGING

OPTIMASI JUMLAH HIDDEN NODES EXTREME LEARNING MACHINE MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION UNTUK PERAMALAN JUMLAH PENJUALAN BARANG

DAMPAK KEGIATAN PERTANIAN TERHADAP TINGKAT EUTROFIKASI DAN JENIS JENIS FITOPLANKTON DI DANAU BUYAN KABUPATEN BULELENG PROVINSI BALI

LUH MIRA AMBARASARI SAKA

PENERAPAN ANALISIS KONTRASTIF DALAM PENGAJARAN PAST TENSE SISWA KELAS X IPA 3 SMAN 2 DENPASAR

MANAJEMEN RISIKO DALAM PROSES ESTIMASI BIAYA PADA PROYEK KONSTRUKSI GEDUNG BERTINGKAT DI KOTA DENPASAR

PERENCANAAN STRATEGIS SISTEM INFORMASI PROMOSI PADA UPBJJ-UT DENPASAR

TESIS EVALUASI LAYANAN BROADBAND CAMPUS DENGAN MENGGUNAKAN FRAMEWORK COBIT 4.1 DAN ITIL 3.0 FAJAR TRI PRABOWO

TESIS PENINGKATAN PEMAHAMAN AFIKS PADA KOSAKATA BAHASA INGGRIS MELALUI PENERAPAN METODE INTENSIF PADA PESERTA DIDIK KELAS VIIIA SMP PGRI 7 DENPASAR

EFEKTIVITAS PENERAPAN AMDAL DALAM PENGELOLAAN LINGKUNGAN HIDUP PADA PEMBANGKIT LISTRIK DI BALI STUDI KASUS PLTD/G PESANGGARAN

Tesis untuk Memeroleh Gelar Magister Pada Program Magister, Program Studi Linguistik, Program Pascasarjana Universitas Udayana

MORALITAS INDIVIDU, MANAJEMEN LABA, SALAH SAJI, PENGUNGKAPAN, BIAYA DAN MANFAAT, SERTA TANGGUNG JAWAB DALAM ETIKA PENYUSUNAN LAPORAN KEUANGAN

Lembar Pengesahan TESIS INI TELAH DISETUJUI PADA TANGGAL 28 DESEMBER 2016 NIP NIP

PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2016 UJIAN TESIS

UCAPAN TERIMAKASIH. Denpasar, Agustus Penulis

REKAYASA SISTEM PENGELOMPOKAN MUSIK TERHADAP SUASANA HATI DENGAN MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOR DAN K-MEANS

Lembar Pengesahan TESIS INI TELAH DISETUJUI PADA TANGGAL 13 DESEMBER 2016

PRA PENGOLAHAN CITRA X-RAY THORAX PADA SEGMENTASI PARU-PARU DAN JANTUNG MENGGUNAKAN ANISOTROPIC DIFFUSION DAN GUIDED IMAGE FILTER

PENGARUH FRAMING DAN KEMAMPUAN NUMERIK TERHADAP KEPUTUSAN INVESTASI

STRUKTUR MIKRO DAN SIFAT MEKANIK PADUAN ALUMINIUM AA5154 UNTUK APLIKASI TEKNOLOGI SEMI SOLID CASTING

PENGARUH PENGAWASAN PIMPINAN,DISIPLIN DAN KOMPETENSI PEGAWAI PADA KINERJA PEGAWAI INSPEKTORAT KABUPATEN TABANAN

Lembar Persetujuan TESIS INI TELAH DISETUJUI TANGGAL 16 DESEMBER 2016

DETERMINAN DISHARMONI KUA-PPAS TERHADAP APBD DI KABUPATEN TABANAN

PERILAKU OPORTUNISTIK PENYUSUN ANGGARAN DI KABUPATEN/KOTA SE-BALI

RANCANG BANGUN APLIKASI TEXT TO SING PUPUH PUCUNG

ANALISIS JUMLAH, BIAYA DAN FAKTOR PENENTU TERJADINYA SISA MAKANAN PASIEN RAWAT INAP DI RUMAH SAKIT UMUM PUSAT SANGLAH DENPASAR

KINERJA DAN STRATEGI PENGELOLAAN LIMBAH HOTEL BERBINTANG DI KAWASAN PARIWISATA UBUD BALI

STUDI KOMPARATIF KINERJA PORTOFOLIO SAHAM SMALL MEDIUM ENTERPRISE (SME) DI PASAR MODAL INDONESIA, CHINA, DAN INDIA

PENGARUH REPUTASI, ETIKA, SELF ESTEEM DAN PREFERENSI RISIKO PIMPINAN PADA BUDGETARY SLACK BANK PERKREDITAN RAKYAT DI PROVINSI BALI

PENGARUH LOCUS OF CONTROL

DEGRADASI LIMBAH TEKSTIL MENGGUNAKAN JAMUR LAPUK PUTIH Daedaleopsis eff. confragosa

KUALITAS PELAYANAN DAN TINGKAT KEPUASAN ANGGOTA KOPERASI UNIT DESA SURABERATA KECAMATAN SELEMADEG BARAT

TESIS IMPLEMENTASI ALGORITMA GENETIK DAN METODE FUZZY C-MEANS DALAM PENENTUAN KOMPETENSI MAHASISWA OLEH: ROSALIA HADI

TESIS PERENCANAAN PENEMPATAN E-NODE B 4G LTE 1800 MHZ PADA BTS EXISTING DI KOTA DENPASAR MENGGUNAKAN METODE FUZZY C-MEANS DAN HARMONY SEARCH

ANALISIS DAMPAK PERKEMBANGAN PARIWISATA TERHADAP ASPEK EKONOMI MASYARAKAT LOKAL DI DESA SANUR KOTA DENPASAR GDE BAGUS BRAHMA PUTRA

MENINGKATKAN KEMAMPUAN MENULIS REPORT TEXT MELALUI MIND MAPPING PADA KELAS XI IPA 7 DI SMAN 8 DENPASAR TAHUN PELAJARAN 2014/2015

Tesis untuk memperoleh Gelar Magister pada Program Magister, Program Studi Akuntansi, Program Pascasarjana Universitas Udayana

ANALISIS FAKTOR - FAKTOR YANG MEMPENGARUHI KEPATUHAN WAJIB PAJAK HOTEL DI KABUPATEN GIANYAR

PENGARUH ADVERSE SELECTION DAN NEGATIVE FRAMING PADA KECENDERUNGAN ESKALASI KOMITMEN

TESIS PENERAPAN KOMBINASI FUZZY C-MEANS

TESIS PERAN MEDIASI KEPUASAN KERJA PADA KEPEMIMPINAN TRANSFORMASIONAL DAN BUDAYA PATIENT SAFETY TENAGA KESEHATAN

DETERMINASI KEPUTUSAN HEDGING PADA PERUSAHAAN MANUFAKTUR DI BURSA EFEK INDONESIA

PENGARUH PENGETAHUAN AKUNTANSI DAN JIWA KEWIRAUSAHAAN PADA PENGGUNAAN INFORMASI AKUNTANSI DALAM PEMBUATAN KEPUTUSAN INVESTASI

PENGARUH KECERDASAN INTELEKTUAL, EMOSIONAL DAN SPIRITUAL TERHADAP KINERJA KARYAWAN PADA HOTEL CATTLEYA SUITE BALI

ALGORITMA APRIORI MODIFIKASI DENGAN TEKNIK COMBINATION REDUCTION DAN ITERATION LIMITATION PADA KERANJANG BELANJA

KEBIJAKAN DIVIDEN SEBAGAI VARIABEL MODERASI PENGARUH PAJAK PENGHASILAN, LEVERAGE DAN UKURAN PERUSAHAAN PADA MANAJEMEN LABA

ANALISA PERAWATAN PADA KOMPONEN KRITIS MESIN PEMBERSIH BOTOL 5 GALLON PT. X DENGAN MENGGUNAKAN METODE RCM ( RELIABILITY CENTERED MAINTENANCE )

ANAK AGUNG GEDE ANOM NIM:

PENERAPAN MODEL MESIN BELAJAR SUPPORT VECTOR MACHINES PADA AUTOMATIC SCORING UNTUK JAWABAN SINGKAT

TESIS ANALISIS OVERREACTION PASAR PADA SAHAM WINNER DAN LOSER DI BURSA EFEK INDONESIA

LEMBAR PERSETUJUAN PEMBIMBING. Tesis Ini Telah Disetujui. Pada Tanggal 27 Desember 2016

PENGARUH SUMBER PENDANAAN DAN KEPUTUSAN INVESTASI PADA NILAI PERUSAHAAN SEKTOR PROPERTI YANG TERDAFTAR PADA BURSA EFEK INDONESIA PADA TAHUN

TESIS EFEK KEADILAN REMUNERASI, KOMPETENSI ATASAN DAN KOHESIVITAS KELOMPOK TERHADAP WITHHOLDING EFFORT

PENGARUH PENDIDIKAN PADA KINERJA BENDAHARA SATUAN KERJA PERANGKAT DAERAH KABUPATEN TABANAN DENGAN PELATIHAN DAN MOTIVASI SEBAGAI VARIABEL MODERASI

ESTIMASI BIAYA KONSTRUKSI GEDUNG DENGAN METODE COST SIGNIFICANT MODEL (STUDI KASUS PROYEK KONSTRUKSI GEDUNG PEMERINTAH DI KABUPATEN JEMBRANA)

SI MADE AYU SRI WARDANI YASA NIM

LEMBAR PENGESAHAN TESIS INI TELAH DISETUJUI TANGGAL 18 JULI 2016

DETERMINAN LOSS TO FOLLOW UP

PENGARUH TEKANAN ANGGARAN WAKTU, LOCUS OF CONTROL, DAN KOMITMEN PROFESIONAL PADA PERILAKU PENURUNAN KUALITAS AUDIT

TESIS PENGARUH CONCERN TO ORDER DAN CUSTOMER ORIENTATION TERHADAP DISIPLIN KERJA PEGAWAI KANTOR REKTORAT UNIVERSITAS UDAYANA

PELATIHAN LARI SAMBUNG BACK TO BACK

PENERAPAN METODE MIND MAPPING PADA KETERAMPILAN MENULIS KARANGAN NARASI

PENGARUH DUKUNGAN ORGANISASIONAL TERHADAP KEPUASAN KERJA DAN KOMITMEN ORGANISASIONAL

BAB I. Pendahuluan. 1. Latar Belakang Masalah

PERBANDINGAN SINO-NASAL OUTCOME TEST 22 (SNOT-22) PENDERITA RINOSINUSITIS KRONIK SEBELUM DAN SESUDAH PEMBEDAHAN DI RSUP SANGLAH TAHUN 2017

PENGARUH TINGKAT SUKU BUNGA, RISIKO PASAR, DEBT TO EQUITY RATIO

PENGARUH KEBIJAKAN DIVIDEN PADA RETURN SAHAM PADA EX-DIVIDEND DAY DI BURSA EFEK INDONESIA

RESPON AYAM LOKAL DI BALI DAN LOHMAN BROWN TERHADAP INFEKSI Ascaridia galli

PENGARUH CASH RATIO, DEBT TO EQUITY RATIO, DAN RETURN ON ASSET TERHADAP KEBIJAKAN DIVIDEN PADA PERUSAHAAN MANUFAKTUR DI BURSA EFEK INDONESIA

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

TESIS HUBUNGAN ANTARA JIWA KEWIRAUSAHAAN DAN MANAJEMEN AGRIBISNIS TERHADAP KEBERHASILAN USAHA JAMUR TIRAM DI KOTA DENPASAR

Lembar Pengesahan TESIS INI TELAH DISETUJUI TANGGAL... AGUSTUS 2017

TESIS ANALISIS KINERJA PROYEK TERHADAP KEPUASAN STAKEHOLDERS

KANDUNGAN CADMIUM DAN TIMBAL BUAH MANGROVE

TESIS PENGARUH KUALITAS SISTEM INFORMASI, KUALITAS INFORMASI DAN PERCEIVED USEFULNESS

KOMANG AYU RUSTINI NIM NIM. 1NI PROGRAM MAGISTER PROGRAM STUDI AKUNTANSI PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR

PERBANDINGAN PEMILIHAN KEPALA DAERAH SECARA LANGSUNG DAN MELALUI SISTEM PERWAKILAN

KEKUATAN HUKUM AKTA NOTARIS BERKENAAN DENGAN PENANDATANGANAN RAPAT UMUM PEMEGANG SAHAM (RUPS) PERSEROAN TERBATAS MELALUI MEDIA TELEKONFERENSI

Tesis untuk Memperoleh Gelar Magister pada Program Magister, Program Studi Linguistik, Program Pascasarjana, Universitas Udayana

TEKNOLOGI ELEKTRO MAJALAH ILMIAH. Vol. 13 No. 2 Juli - Desember 2014 ISSN:

PROGRAM MAGISTER PROGRAM STUDI MANAJEMEN PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR

INTEGRASI PEMBOBOTAN TF IDF PADA METODE K-MEANS UNTUK CLUSTERING DOKUMEN TEKS

TESIS PENGARUH IKLIM ORGANISASI TERHADAP KEPUASAN KERJA DAN KOMITMEN ORGANISASIONAL PADA PT SUKA PANDAWA I MADE WIJAYA KESAWA

TESIS PENGARUH PENGALAMAN MEMBELI PRODUK FASHION

KEMAMPUAN MENULIS RECOUNT TEXT MELALUI METODE PEMBELAJARAN PPP (PRESENTATION, PRACTICE, AND PRODUCTION) SISWA KELAS VIII SMP PGRI 4 DENPASAR

KEWENANGAN BADAN LAYANAN UMUM DAERAH(BLUD) DALAM HAL PENGAWASAN PERTANGGUNGJAWABAN PENGELOLAAN KEUANGAN

PENGARUH KOMPETENSI PADA AKUNTABILITAS KINERJA INSTANSI PEMERINTAH DENGAN KOMITMEN ORGANISASI SEBAGAI VARIABEL MODERASI

UCAPAN TERIMA KASIH. Perbandingan Metode SOM/Kohonen Dengan Adaptive Resonance Theory 2

KINERJA SKPD YANG BELUM DAN SUDAH MELAKUKAN PENILAIAN RISIKO (Studi Kasus pada Dinas Kesehatan Kabupaten Gianyar)

PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR

DWI ANGGRENI SUKARMA NIM

Lembar Pengesahan TESIS INI TELAH DISETUJUI PADA TANGGAL 23 JANUARI 2017

PENGARUH LINGKUNGAN KERJA DAN PENGHARGAAN TERHADAP KREATIVITAS DAN KINERJA PEGAWAI DI UNIVERSITAS PENDIDIKAN GANESHA

TESIS. (Studi Pada Kantor Pusat Universitas Udayana)

Lembar Pengesahan. TESIS INI TELAH DISETUJUI TANGGAL 16 Januari 2017

PELATIHAN METODE BOBATH LEBIH BAIK DARIPADA METODE FELDENKRAIS TERHADAP PENINGKATAN KESEIMBANGAN PADA PASIEN PASCA STROKE

MANAJEMEN CHANGE ORDER PADA PROYEK KONSTRUKSI DI KABUPATEN BADUNG

Tesis untuk Memperoleh Gelar Magister Pada Program Magister, Program Studi Akuntansi, Program Pascasarjana Universitas Udayana

Transkripsi:

TESIS KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER IDA BAGUS GEDE WIDNYANA PUTRA NIM 1491761007 PROGRAM MAGISTER PROGRAM STUDI TEKNIK ELEKTRO PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2016

KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER Tesis untuk Memperoleh Gelar Magister pada Program Magister, Program Studi Teknik Elektro, Program Pascasarjana Universitas Udayana IDA BAGUS GEDE WIDNYANA PUTRA NIM 1491761007 PROGRAM MAGISTER PROGRAM STUDI TEKNIK ELEKTRO PROGRAM PASCASARJANA UNIVERSITAS UDAYANA DENPASAR 2016 ii

iii

Tesis Ini Telah Diuji Pada Tanggal 15 Juli 2016 Panitia Penguji Tesis Berdasarkan SK Rektor Universitas Udayana, Nomor : 3241/UN14.4/HK/2016, Tanggal 14 Juli 2016 Ketua : Dr. Ir. Made Sudarma, M.A.Sc Anggota : 1. I Nyoman Satya Kumara, ST., M.Sc, PhD 2. Prof. Ir. Rukmi Sari Hartati, MT., PhD 3. NMAE Dewi Wirastuti, ST., MSc., PhD 4. Prof. Ir. Ida Ayu Dwi Girintari, MengSc., PhD iv

SURAT PERNYATAAN BEBAS PLAGIAT Nama : Ida Bagus Gede Widnyana Putra NIM : 1491761007 Program Studi : Magister Teknik Elektro Judul : KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DANNAIVE BAYES CLASSIFIER Dengan ini menyatakan bahwa karya tulis ilmiah Tesis ini bebas plagiat. Apabila dikemudian hari terbukti terdapat plagiat dalam karya ilmiah ini, maka saya bersedia menerima sanksi sesuai peraturan Mendiknas RI No. 17 Tahun 2010 dan Peraturan Perundang-undangan yang berlaku. Denpasar, 15 Juli 2015 Yang Membuat Pernyataan Ida Bagus Gede Widnyana Putra v

UCAPAN TERIMAKASIH Puji dan syukur penulis panjatkan kehadapan Ida Sang Hyang Widhi Wasa atas asung kerta waranugraha-nya, penulis dapat menyelesaikan tesis yang berjudul KLASIFIKASI SUPERVISED LEARNING PADA TEKS BAHASA BALI DENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER. Dalam menyelesaikan tesis ini, penulis mendapatkan banyak bantuan, bimbingan dan dorongan dari berbagai pihak. Maka dari itu pada kesempatan ini penulis ingin mengucapkan terimakasih kepada : Bapak Gubernur Bali dan Kepala BKD Provinsi Bali atas beasiswa dan kesempatan yang diberikan untuk melanjutkan pendidikan di Program Pasca Sarjana Universitas Udayana serta Bapak Kalaksa BPBD Provinsi Bali dan Kepala UPT. Pusdalops PB BPBD Provinsi Bali selaku pimpinan tempat penulis bekerja atas ijin yang diberikan untuk mengikuti pendidikan di Program Magister Teknik Elektro, program studi Manajemen Sistem Informasi dan Komputer, Pascasarjana Universitas Udayana. Prof. Dr. dr. Ketut Suastika SpPD KEMD selaku Rektor Universitas Udayana dan Prof. Dr. dr. A.A. Raka Sudewi, Sp.S(K) selaku Direktur Program Pascasarjana Universitas Udayana atas kesempatan dan fasilitas yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan pada Program Magister di UniversitasUdayana. Prof. Ir. Ida Ayu Dwi Girintari, MengSc., PhD selaku Ketua Program Magister Program Studi Teknik Elektro Pascasarjana Universitas Udayana dan dosen penguji tesis atas kesempatan dan masukan yang diberikan kepada penulis untuk mengikuti dan menyelesaikan pendidikan pada Program Magister Teknik Elektro Universitas Udayana. Dr.Ir. Made Sudarma, M.A.Sc selaku dosen pembimbing I dan I Nyoman Satya Kumara, ST.,MSc.,PhD selaku dosen pembimbing II atas bimbingan, arahan, saran, dan dukungan selama penyusunan tesis ini serta para dosen penguji Prof. Ir. Rukmi Sari Hartati, MT., PhD, NMAE Dewi Wirastuti, ST., MSc., PhD,Wayan vi

Gede Ariastina, ST.,MengSc.,PhD, yang telah memberikan saran, sanggahan dan koreksi sehingga tesis ini menjadi lebih baik serta seluruh dosen Program Magister Teknik Elektro Universitas Udayana atas ilmu yang telah diberikan. Orang tua terbaik Drs. Ida Bagus Antara dan Ida Ayu Gde Suwardani, S.Pd serta istri tercinta Anak Agung Diah Pratiwi, S.Pd. yang tiada hentinya berdoa, memberi semangat dan dukungan yang sangat besar sehingga penulis bisa menyelesaikan pendidikan tepat waktu. Teman-teman Magister Teknik Elektro program studi Manajemen Sistem Informasi dan Komputer Angkatan 2014 atas kerjasama dan dukungannya serta semua pihak yang telah membantu dalam penyusunan laporan tesis ini yang tidak dapat disebutkan satu per satu. Penulis menyadari bahwa penulisan tesis yang telah dibuat masih jauh dari kesempurnaan. Oleh karena itu, penulis sangat mengharapkan kritik dan saran yang membangun dari pembaca dan mohon maaf apabila ada kesalahan dalam penulisan dan penyusunan tesis ini. Penulis vii

ABSTRAK KLASIFIKASI SUPERVISED LEARNINGPADA TEKS BAHASA BALIDENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER Ketersediaan dokumen teks bahasa Bali yang meningkat jumlahnya membuat proses pencarian informasi pada dokumen teks berbahasa Bali menjadi semakin sulit. Mengklasifikasikanya secara manual menjadi tidak efisien mengingat peningkatan jumlah dokumen yang semakin banyak. Pada penelitian ini dikembangkan sebuah aplikasi yang dapat mengklasifikasikan teks bahasa Bali ke dalam kategori yang ditentukan. Aplikasi ini menggunakan metode klasifikasi Naive Bayes Classifier (NBC) dan metode Information Gain (IG) untuk seleksi fitur. Aplikasi ini diuji dengan teknik cross validation. Hasilnya adalah nilai ratarata akurasi dari 10 fold cross validation sebesar 95,22%. Keywords : information gain, naive bayes classifier, text mining, cross validation viii

ABSTRACT KLASIFIKASI SUPERVISED LEARNINGPADA TEKS BAHASA BALIDENGAN METODE INFORMATION GAIN DAN NAIVE BAYES CLASSIFIER Increasing availability of Balinese language text documents making the process of finding or classifying information in Balinese text documents is becoming increasingly difficult. Manual classification is inefficient in view of the increase in the number of Balinese written documents. On this paper, application that can classify Balinese text into various document class is presented. The application is developed using Naive Bayes classifier (NBC) method and feature selection using Information Gain (IG) technique. Application is tested using cross validation method. The resultsshows that average accuracy of 10 fold cross validation is 95.22%. Keywords : information gain, naive bayes classifier, text mining, cross validation ix

DAFTAR ISI HALAMAN JUDUL... i PERSYARATAN GELAR... ii LEMBAR PERSETUJUAN... iii PENETAPAN PANITIA PENGUJI... iv SURAT PERNYATAAN BEBAS PLAGIAT... v UCAPAN TERIMA KASIH... vi ABSTRAK... viii ABSTRACT... ix DAFTAR ISI... x DAFTAR TABEL... xii DAFTAR GAMBAR... xiii DAFTAR ISTILAH DAN SINGKATAN... xiv I PENDAHULUAN... 1 1.1 LatarBelakang... 1 1.2 RumusanMasalah... 5 1.3 TujuanPenelitian... 6 1.4 ManfaatPenelitian... 6 1.5 RuangLingkupPenelitian... 6 1.6 KeaslianPenelitian... 7 II KAJIAN PUSTAKA... 10 2.1 State Of The Art Review... 10 2.2 Klasifikasi Dokumen... 13 2.3 Morfologi Bahasa Bali... 15 2.4 Text Mining... 18 2.5 Information Retrieval... 20 x

2.6 Natural Langguage Processing... 24 2.7 Naive Bayes Classifier... 28 2.8 Term Weighting... 30 2.9 Information Gain... 32 2.10 Cross Validation... 32 III METODELOGI PENELITIAN... 35 3.1 GambaranUmumSistem... 35 3.2 RancanganAlurPenelitian... 36 3.3 AlatdanBahanPenelitian... 45 3.4 JadwalPenelitian... 45 IV HASIL DAN PEMBAHASAN... 47 4.1 Antar MukaSistem... 47 4.2 Tahap Preprocessing... 48 4.3 Tahap Seleksi Fitur... 54 4.4 Tahap Pelatihan... 57 4.5 Tahap Klasifikasi... 61 4.6 Hasil Validasi dan Evaluasi dengan K-Fold Cross Validation... 63 4.7 Waktu Proses Sistem... 64 V KESIMPULAN DAN SARAN... 66 5.1 Kesimpulan... 66 5.2 Saran... 67 DAFTAR PUSTAKA... 68 xi

DAFTAR TABEL Tabel 2.1 Pemetaan Keaslian Penelitian... 12 Tabel 2.2 Kemungkinan Hasil Test IR... 23 Tabel 3.1 Ilustrasi Eksperimen 10 Fold Validation... 44 Tabel 3.2 JadwalPenelitian... 46 Tabel4.1 Tahapan Proses Stemming... 53 Tabel4.2 Hasil Seleksi Fitur... 55 Tabel4.3 Hasil Perbandingan Klasifikasi dengan TFIDF dan IG... 57 Tabel4.4 Hasil Percobaan Untuk Menentukan Jumlah Fitur... 58 Tabel4.5 Hasil Tahap Pelatihan... 59 Tabel4.6 Hasil 10 Fold Cross Validation... 63 Tabel4.7 Lama Waktu Proses Setiap Tahap... 65 xii

DAFTAR GAMBAR Gambar 1.1 DiagramFishbonePenelitian... 9 Gambar 2.1 High-level text mining functional architecture... 20 Gambar 2.2 Arsitektur Dasar Sistem IR... 21 Gambar 2.3 Flowchart 10 Fold Cross Validation... 34 Gambar3.1 Gambaran Umum Sistem... 35 Gambar3.2 Alur Penelitian... 36 Gambar3.3 Alur Proses Processing... 38 Gambar 3.4 Alur Proses Pelatihan dengan Algoritma NBC... 41 Gambar 3.5 Alur Proses Klasifikasi dengan Algoritma NBC... 42 Gambar 3.6 Penggunaan Rumus pada Tahap Pelatihan dan Klasifikasi... 42 Gambar 3.7 Alur Proses 10 Fold Cross Validation... 44 Gambar4.1 Antar Muka Sistem... 47 Gambar4.2 Dokumen Asli... 48 Gambar4.3 Hasil Transform Case... 49 Gambar4.4 Hasil Tokenization... 50 Gambar4.5 Hasil Filter Token (by Length)... 51 Gambar4.6 Hasil Filter Stopwords... 52 Gambar4.7 Form Input Seleksi Fitur... 54 Gambar4.8 Hasil Seleksi Fitur... 55 Gambar4.9 Grafik Hasil Perbandingan Klasifikasi dengan TFIDF dan IG... 57 Gambar4.10 Form Input Tahap Pelatihan... 58 Gambar4.11 Grafik Perbandingan Berdasarkan Jumlah Fitur... 59 Gambar4.12 Form Input Tahap Klasifikasi... 61 Gambar4.13 Hasil Tahap Klasifikasi... 62 Gambar4.14 Hasil Tidak Terklasifikasi... 62 Gambar4.15 Grafik Tingkat Precision, Recal dan Akurasi pada setiap fold... 64 xiii

DAFTAR ISTILAH DAN SINGKATAN CV : Cross Validation IDF : Inverse Document Frequency IG : Information Gain IR : Information Retrieval NBC : Naive Bayes Classifier NLP : Natural Language Processing TF : Term Frequency xiv