KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR

dokumen-dokumen yang mirip
BAB II LANDASAN TEORI

BAB III ANALISA DAN PERANCANGAN SISTEM

ANALISIS SENTIMEN DATA KRITIK DAN SARAN PELATIHAN APLIKASI TEKNOLOGI INFORMASI (PATI) MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

IMPLEMENTASI MODEL ONTOLOGY UNTUK PENCARIAN INFORMASI BERITA BERBASIS SEMANTIK TUGAS AKHIR

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERDASARKAN PREFERENSI DAN KEAHLIAN DOSEN MENGGUNAKAN EUCLIDIEN DISTANCE TUGAS AKHIR

Oleh: ARIF DARMAWAN NIM

BAB I PENDAHULUAN Latar Belakang

DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR

BAB II LANDASAN TEORI

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat

KLASIFIKASI PADA TWEET BERBAHASA INDONESIA MENGGUNAKAN METODE GRAVITASI DATA TUGAS AKHIR. Disusun Oleh : Mufida Lutfiah Ulfa

1.5 Metode Penelitian

PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIV. MUHAMMADIYAH MALANG) TUGAS AKHIR

BAB I PENDAHULUAN 1.1 Latar Belakang

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

PEMBUATAN AGEN UNTUK CUSTOMER SERVICE DI WEBSITE UMM BERBASIS PENGETAHUAN TUGAS AKHIR

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB 1 PENDAHULUAN Latar Belakang

IMPLEMENTASI ALGORITMA NEURAL NETWORK DENGAN METODE PRUNE UNTUK KLASIFIKASI PENENTUAN DOSEN PEMBIMBING TUGAS AKHIR TUGAS AKHIR

BAB III METODOLOGI PENELITIAN

BAB III ANALISIS DAN PERANCANGAN SISTEM

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

BAB I PENDAHULUAN 1.1 Latar Belakang

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENCARIAN BUKU PERPUSTAKAAN MENGGUNAKAN METODE VECTOR SPACE MODEL

BAB I PENDAHULUAN 1.1 Latar Belakang

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

IMPLEMENTASI ALGORITMA SUPPORT VECTOR MACHINE (SVM) UNTUK ANALISA SENTIMEN PADA KALIMAT OPINI BERBAHASA INDONESIA TUGAS AKHIR

BAB 3 PERANCANGAN. Tabel 3.1 Daftar Kategori dan Jumlah Dokumen Teks. Dokumen Bulutangkis 155 Basket 59 Otomotif 160 Sepakbola 767 Tenis 159

BERBASIS DOMAIN-SPECIFIC ONTOLOGY

KLASIFIKASI DOKUMEN NASKAH DINAS MENGGUNAKAN ALGORITMA TERM FREQUENCY INVERSED DOCUMENT FREQUENCY DAN VECTOR SPACE MODEL

IMPLEMENTASI METODE SIMPLE ADDITIVE WEIGHTING (SAW) UNTUK PENENTUAN KELAS AIK UNIVERSITAS MUHAMMADIYAH MALANG TUGAS AKHIR

PERINGKASAN TEKS OTOMATIS BERBASIS WEB MENGGUNAKAN ALGORITMA HILL CLIMBING ANIESMA SULTHAN MAUDUDI

BAB II TINJAUAN PUSTAKA

RANCANG BANGUN PENCARIAN TUGAS AKHIR DENGAN METODE HILL CLIMBING AUTOMATIC CLUSTER TUGAS AKHIR

BAB I PENDAHULUAN. ilmu tertentu dengan menggunakan kaidah-kaidah yang berlaku dalam bidang

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

BAB I PENDAHULUAN I-1

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB V EKSPERIMEN TEXT CLASSIFICATION

KLASTERISASI DOKUMEN ARTIKEL ILMIAH MENGGUNAKAN ALGORITMA SINGLE PASS CLUSTERING DENGAN DETEKSI KESAMAAN KATA TUGAS AKHIR

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB III ANALISA DAN PERANCANGAN SISTEM

1BAB I PENDAHULUAN 1.1 Latar Belakang

Implementasi Algoritma Naïve Bayes untuk Sistem Klasifikasi Emosi Musik Otomatis TUGAS AKHIR

BAB I PENDAHULUAN Latar Belakang

ANALISA KOMPETENSI DOSEN DALAM PENENTUAN MATAKULIAH YANG DIAMPU MENGGUNAKAN METODE CF-IDF A B S T R A K

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.

DAFTAR ISI. PERNYATAAN... Error! Bookmark not defined. KATA PENGANTAR... Error! Bookmark not defined.

PEMBANGUNAN APLIKASI REKOMENDASI BERITA BERBASIS PREFERENSI PENGGUNA TWITTER

TUGAS AKHIR. Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang. Oleh :

BAB I PENDAHULUAN. 1.1 Latar Belakang

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

BAB III ANALISIS DAN PERANCANGAN

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

PEMANFAATAN ALGORITMA TF/IDF UNTUK SISTEM INFORMASI e-complaint HANDLING

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

BAB I PENDAHULUAN 1.1. Latar Belakang

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

BAB III METODOLOGI PENELITIAN

POLA KEMAMPUAN ANAK BERDASARKAN RAPOR MENGGUNAKAN TEXT MINING DAN KLASIFIKASI NEAREST NEIGHBOR

IMPLEMENTASI ALGORITMA BOYER MOORE DAN METODE N-GRAM UNTUK APLIKASI AUTOCOMPLETE DAN AUTOCORRECT

SISTEM PERINGKASAN E-BOOK DENGAN METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF - IDF)

Online News Classification Using Multinomial Naive Bayes

KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA INDONESIA DENGAN METODE KATEGORISASI MULTI- LABEL BERBASIS DOMAIN SPECIFIC ONTOLOGY

Pembangunan Aplikasi Mobile Rekomendasi Informasi Berdasarkan Status Twitter Menggunakan Algoritma Latent Semantic Analysis SKRIPSI

BAB III METODOLOGI PENELITIAN

RANCANG BANGUN GAME THE ALPIN CARD TUGAS AKHIR

ANALISA KECENDERUNGAN KARAKTER BERDASARKAN KEYWORD DALAM SHORT MESSAGE SERVICE BERBASIS PROTOTYPE ANDROID SOFTWARE APPLICATION

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

PEMBANGUNAN APLIKASI ANALISIS SENTIMEN BERITA MENGGUNAKAN METODE NAIVE BAYES

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

RANCANG BANGUN SIMULATOR UJIAN AKHIR SEKOLAH UNTUK ANAK INKLUSI SEKOLAH DASAR TUGAS AKHIR

ANALISA PERBANDINGAN METODE DISCRETE COSINE TRANSFORM (DCT) DAN SINGULAR VALUE DECOMPOSITION (SVD) PADA IMAGE WATERMARKING

Transkripsi:

KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR Persyaratan Guna Meraih Gelar Sarjana Strata I Teknik Informatika Universitas Muhammadiyah Malang Nama : Ayu Puji Lestari NIM : 201310370311163 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH MALANG 2017

KATA PENGANTAR Segala puji bagi Allah SWT, yang telah memberikan Rahmat dan Karunianya, sehingga penulis dapat menyelesaikan skripsi yang berjudul: KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA Skripsi ini merupakan salah satu syarat studi yang harus ditempuh oleh seluruh mahasiswa Universitas Muhammadiyah Malang, guna menyelesaikan akhir studi pada jenjang program Strata 1. Peneliti menyadari masih banyak kekurangan dan keterbatasan dalam penulisan tugas akhir ini. Untuk itu, penulis sangat mengharapkan saran yang membangun agar tulisan ini dapat berguna untuk perkembangan ilmu pengetahuan kedepan. Malang, 17 Oktober 2017 Penulis

DAFTAR ISI LEMBAR PERSETUJUAN... II LEMBAR PENGESAHAN.. III LEMBAR PERNYATAAN.. IV ABSTRAK. V ABSTRACT. VI LEMBAR PERSEMBAHAN... VII KATA PENGANTAR.. IX DAFTAR ISI.. X DAFTAR GAMBAR... XIII DAFTAR TABEL. XIV BAB I PENDAHULUAN. 1 1.1 Latar Belakang 1 1.2 Rumusan Masalah... 3 1.3 Batasan Masalah.. 3 1.4 Tujuan... 3 1.5 Metodologi.. 3 1.5.1 Studi Pustaka... 4 1.5.2 Analisa Data dan Desain Sistem. 4 1.5.3 Implementasi Sistem... 4 1.5.4 Pengujian dan Evaluasi... 4 1.5.5 Penyusunan Laporan... 4 1.6 Sistematika Penulisan.. 5 BAB II LANDASAN TEORI 6 2.1 Literatur Review.. 6 2.2 Klasifikasi Dokumen... 9 2.3 Ontologi... 9

2.3.1 Komponen Ontologi.. 10 2.4 RDF... 11 2.5 SPARQL... 11 2.6 Term frequency- Inversed document frequency (TF-IDF)... 12 2.7 Metode Dao... 13 2.8 Pengantar Preprocessing Data... 14 2.8.1 Case Folding.. 14 2.8.2 Stopwords Removal.. 14 2.9 Metode Pengujian.. 15 2.9.1 Akurasi.. 15 BAB III ANALISA DAN PERANCANGAN SISTEM.. 16 3.1 Analisa Masalah... 16 3.2 Data Penelitian.. 16 3.3 Analisa Sistem... 18 3.3.1 Usecase Diagram... 18 3.3.2 Flowchart... 19 3.4 Perancangan Fitur.. 20 3.4.1 Preprocessing Data 20 3.4.2 Pembobotan TF-IDF. 23 3.4.3 Permutasi Data Uji... 24 3.4.4 Desain Ontologi... 25 3.4.5 Desain Sparql... 28 3.4.6 Pencarian Kata Dalam Ontologi 29 3.4.7 Perhitungan Jarak Dengan Metode Dao 30 3.5 Skenario Pengujian 31 BAB IV IMPLEMENTASI DAN PENGUJIAN.. 33 4.1 Implementasi Perangkat Lunak. 33 4.2 Implezmentasi Desain Antarmuka 33 4.3 Pengujian Sistem... 35 4.3.1 Nilai Threshold.. 35 4.3.2 Pengujian Akurasi. 36

BAB V.. 41 KESIMPULAN DAN SARAN 41 5.1 Kesimpulan... 41 5.2 Saran. 41 DAFTAR PUSTAKA... 43 LAMPIRAN

DAFTAR GAMBAR Gambar 2.1 Panjang Jarak antar 2 Node 13 Gambar 2.2 Case Folding. 14 Gambar 2.3 Stopword Removal 14 Gambar 3.1 Usecase Diagram... 19 Gambar 3.2 Flowchart Sistem Klasifikasi. 19 Gambar 3.3 Rancangan Ontologi Main Class 26 Gambar 3.4 Rancangan Ontologi Bidang Minat Informatika 27 Gambar 4.1 Halaman Utama. 34 Gambar 4.2 Halaman Klasifikasi.. 34 Gambar 4.3 Halaman Hasil Klasifikasi. 35 Gambar 4.4 Hasil Pengujian Sistem.. 39

DAFTAR TABEL Tabel 2.1 Hasil Penelitian Sebelumnya... 7 Tabel 3.1 Sample Data Tugas Akhir 16 Tabel 3.2 Sample Data ACM... 17 Tabel 3.3 Sample Data Kurikulum... 18 Tabel 3.4 Data yang belum dilakukan preprocessing... 20 Tabel 3.5 Hasil Case Folding 21 Tabel 3.6 Daftar Stopword 22 Tabel 3.7 Hasil Stopword Removal... 22 Tabel 3.8 Pembobotan TF-IDF.. 23 Tabel 3.9 Permutasi Kata.. 24 Tabel 3.10 Pencarian Current Class... 28 Tabel 3.11 Pencarian Parrent Class... 28 Tabel 3.12 Pencarian Child Class.. 29 Tabel 3.13 Pencarian Dalam Ontologi... 29 Tabel 3.14 Pencarian Jarak Dalam Ontologi. 30 Tabel 3.15 Hasil Metode Dao 31 Tabel 4.1 Hasil Pengujian Iterasi-1 36

DAFTAR PUSTAKA [1] P. Wira, D. Indra, F. I. Komputer, and U. Indonesia, ARTIKEL BERITA BERBAHASA INDONESIA, vol. 14, no. 1, pp. 29 35, 2010. [2] R. B. Riwanto, Klasifikasi Judul Tugas akhir Teknik Informatika Berdasarkan Bidang Minat Menggunakan Algoritma Naive Bayes Classifier(Studi Kasus : Ruang Baca Fakultas Teknik UMM), Universitas Muhammadiyah Malang, 2010. [3] I. Destuardi and S. Sumpeno, Klasifikasi Emosi Untuk Teks Bahasa Indonesia Menggunakan Metode Naive Bayes, 2009. [4] J. Samodra, S. Sumpeno, and M. Hariadi, Klasifikasi Dokumen Teks Berbahasa Indonesia dengan Menggunakan Naïve Bayes, Seminar, pp. 1 4, 2009. [5] N. Cahyono, E. Utami, and A. Amborowati, Konseptualisasi Ontologi Iklan Website, pp. 275 282, 2016. [6] P. Widodo, J. A. Putra, S. Afiadi, A. Z. Arifin, and D. Herumurti, KLASIFIKASI KATEGORI DOKUMEN BERITA BERBAHASA INDONESIA DENGAN METODE KATEGORISASI MULTI- LABEL BERBASIS DOMAIN SPECIFIC ONTOLOGY, vol. II, no. 2, 2016. [7] F. R. Andriansyah, IMPLEMENTASI WEB SEMANTIK UNTUK APLIKASI PENCARIAN, vol. 2, no. 1, pp. 11 18, 2015. [8] M. B. Septian, Implementasi model ontologi untuk pencarian informasi berita berbasis semantik, Universitas Muhammadiyah Malang, 2012. [9] A. N. Cahyana, RELEVANSI HASIL PENCARIAN PADA MESIN MENGGUNAKAN SEMANTIK WEB.pdf, Universitas Muhammdiyah Malang, 2014. [10] A. Achmad and A. A. Ilham, Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Text Mining B. Term frequency Inversed frequency Algoritm ( TF-IDF ) document Nilai N adalah jumlah dokumen yang terdap, vol. 257, pp. 88 92. [11] A. Maedche and S. Staab, Measuring similarity between ontologies, Proc Ekaw, pp. 15--21, 2002.