KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR Persyaratan Guna Meraih Gelar Sarjana Strata I Teknik Informatika Universitas Muhammadiyah Malang Nama : Ayu Puji Lestari NIM : 201310370311163 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2017
KATA PENGANTAR Segala puji bagi Allah SWT, yang telah memberikan Rahmat dan Karunianya, sehingga penulis dapat menyelesaikan skripsi yang berjudul: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA Skripsi ini merupakan salah satu syarat studi yang harus ditempuh oleh seluruh mahasiswa Universitas Muhammadiyah Malang, guna menyelesaikan akhir studi pada jenjang program Strata 1. Peneliti menyadari masih banyak kekurangan dan keterbatasan dalam penulisan tugas akhir ini. Untuk itu, penulis sangat mengharapkan saran yang membangun agar tulisan ini dapat berguna untuk perkembangan ilmu pengetahuan kedepan. Malang, 17 Oktober 2017 Penulis
DAFTAR ISI LEMBAR PERSETUJUAN... II LEMBAR PENGESAHAN.. III LEMBAR PERNYATAAN.. IV ABSTRAK. V ABSTRACT. VI LEMBAR PERSEMBAHAN... VII KATA PENGANTAR.. IX DAFTAR ISI.. X DAFTAR GAMBAR... XIII DAFTAR TABEL. XIV BAB I PENDAHULUAN. 1 1.1 Latar Belakang 1 1.2 Rumusan Masalah... 3 1.3 Batasan Masalah.. 3 1.4 Tujuan... 3 1.5 Metodologi.. 3 1.5.1 Studi Pustaka... 4 1.5.2 Analisa Data dan Desain Sistem. 4 1.5.3 Implementasi Sistem... 4 1.5.4 Pengujian dan Evaluasi... 4 1.5.5 Penyusunan Laporan... 4 1.6 Sistematika Penulisan.. 5 BAB II LANDASAN TEORI 6 2.1 Literatur Review.. 6 2.2 Klasifikasi Dokumen... 9 2.3 Ontologi... 9
2.3.1 Komponen Ontologi.. 10 2.4 RDF... 11 2.5 SPARQL... 11 2.6 Term frequency- Inversed document frequency (TF-IDF)... 12 2.7 Metode Dao... 13 2.8 Pengantar Preprocessing Data... 14 2.8.1 Case Folding.. 14 2.8.2 Stopwords Removal.. 14 2.9 Metode Pengujian.. 15 2.9.1 Akurasi.. 15 BAB III ANALISA DAN PERANCANGAN SISTEM.. 16 3.1 Analisa Masalah... 16 3.2 Data Penelitian.. 16 3.3 Analisa Sistem... 18 3.3.1 Usecase Diagram... 18 3.3.2 Flowchart... 19 3.4 Perancangan Fitur.. 20 3.4.1 Preprocessing Data 20 3.4.2 Pembobotan TF-IDF. 23 3.4.3 Permutasi Data Uji... 24 3.4.4 Desain Ontologi... 25 3.4.5 Desain Sparql... 28 3.4.6 Pencarian Kata Dalam Ontologi 29 3.4.7 Perhitungan Jarak Dengan Metode Dao 30 3.5 Skenario Pengujian 31 BAB IV IMPLEMENTASI DAN PENGUJIAN.. 33 4.1 Implementasi Perangkat Lunak. 33 4.2 Implezmentasi Desain Antarmuka 33 4.3 Pengujian Sistem... 35 4.3.1 Nilai Threshold.. 35 4.3.2 Pengujian Akurasi. 36
BAB V.. 41 KESIMPULAN DAN SARAN 41 5.1 Kesimpulan... 41 5.2 Saran. 41 DAFTAR PUSTAKA... 43 LAMPIRAN
DAFTAR GAMBAR Gambar 2.1 Panjang Jarak antar 2 Node 13 Gambar 2.2 Case Folding. 14 Gambar 2.3 Stopword Removal 14 Gambar 3.1 Usecase Diagram... 19 Gambar 3.2 Flowchart Sistem Klasifikasi. 19 Gambar 3.3 Rancangan Ontologi Main Class 26 Gambar 3.4 Rancangan Ontologi Bidang Minat Informatika 27 Gambar 4.1 Halaman Utama. 34 Gambar 4.2 Halaman Klasifikasi.. 34 Gambar 4.3 Halaman Hasil Klasifikasi. 35 Gambar 4.4 Hasil Pengujian Sistem.. 39
DAFTAR TABEL Tabel 2.1 Hasil Penelitian Sebelumnya... 7 Tabel 3.1 Sample Data Tugas Akhir 16 Tabel 3.2 Sample Data ACM... 17 Tabel 3.3 Sample Data Kurikulum... 18 Tabel 3.4 Data yang belum dilakukan preprocessing... 20 Tabel 3.5 Hasil Case Folding 21 Tabel 3.6 Daftar Stopword 22 Tabel 3.7 Hasil Stopword Removal... 22 Tabel 3.8 Pembobotan TF-IDF.. 23 Tabel 3.9 Permutasi Kata.. 24 Tabel 3.10 Pencarian Current Class... 28 Tabel 3.11 Pencarian Parrent Class... 28 Tabel 3.12 Pencarian Child Class.. 29 Tabel 3.13 Pencarian Dalam Ontologi... 29 Tabel 3.14 Pencarian Jarak Dalam Ontologi. 30 Tabel 3.15 Hasil Metode Dao 31 Tabel 4.1 Hasil Pengujian Iterasi-1 36
DAFTAR PUSTAKA [1] P. Wira, D. Indra, F. I. Komputer, and U. Indonesia, ARTIKEL BERITA BERBAHASA INDONESIA, vol. 14, no. 1, pp. 29 35, 2010. [2] R. B. Riwanto, Klasifikasi Judul Tugas akhir Teknik Informatika Berdasarkan Bidang Minat Menggunakan Algoritma Naive Bayes Classifier(Studi Kasus : Ruang Baca Fakultas Teknik UMM), Universitas Muhammadiyah Malang, 2010. [3] I. Destuardi and S. Sumpeno, Klasifikasi Emosi Untuk Teks Bahasa Indonesia Menggunakan Metode Naive Bayes, 2009. [4] J. Samodra, S. Sumpeno, and M. Hariadi, Klasifikasi Dokumen Teks Berbahasa Indonesia dengan Menggunakan Naïve Bayes, Seminar, pp. 1 4, 2009. [5] N. Cahyono, E. Utami, and A. Amborowati, Konseptualisasi Ontologi Iklan Website, pp. 275 282, 2016. [6] P. Widodo, J. A. Putra, S. Afiadi, A. Z. Arifin, and D. Herumurti, KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA INDONESIA DENGAN METODE KATEGORISASI MULTI- LABEL BERBASIS DOMAIN SPECIFIC ONTOLOGY, vol. II, no. 2, 2016. [7] F. R. Andriansyah, IMPLEMENTASI WEB SEMANTIK UNTUK APLIKASI PENCARIAN, vol. 2, no. 1, pp. 11 18, 2015. [8] M. B. Septian, Implementasi model ontologi untuk pencarian informasi berita berbasis semantik, Universitas Muhammadiyah Malang, 2012. [9] A. N. Cahyana, RELEVANSI HASIL PENCARIAN PADA MESIN MENGGUNAKAN SEMANTIK WEB.pdf, Universitas Muhammdiyah Malang, 2014. [10] A. Achmad and A. A. Ilham, Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Text Mining B. Term frequency Inversed frequency Algoritm ( TF-IDF ) document Nilai N adalah jumlah dokumen yang terdap, vol. 257, pp. 88 92. [11] A. Maedche and S. Staab, Measuring similarity between ontologies, Proc Ekaw, pp. 15--21, 2002.