EFEKTIVITAS ALGORITMA SIMILARITAS SEMANTIK BERBASIS JEJARING KATA UNTUK MENGUKUR KEMIRIPAN KALIMAT BAHASA INDONESIA

dokumen-dokumen yang mirip
BAB 2. TINJAUAN PUSTAKA

khazanah Efektivitas Algoritma Semantik dengan Keterkaitan Kata dalam Mengukur Kemiripan Teks Bahasa Indonesia informatika

Fauzan Natsir NIM : L

WEBSITE KAMUS BAHASA INDONESIA MENGGUNAKAN JQUERY MELALUI WEB SERVICE

IMPLEMENTASI WEB SERVICE PADA APLIKASI KAMUS BAHASA INDONESIA

LAPORAN AKHIR RISET UNGGULAN PERGURUAN TINGGI

WEBSITE KAMUS BAHASA INDONESIA MENGGUNAKAN JQUERY MELALUI WEB SERVICE

MEMBANGUN KONSEP MODAL MANUSIA YANG BERPERAN BAGI KINERJA USAHA

MEMBANGUNN KONSEP MODAL MANUSIAA YANG BERPERAN BAGI KINERJA USAHAA

PENINGKATAN KUALITAS PRODUK PLASTIK DENGAN CETAKAN BERSALURAN PENDINGIN CONFORMAL

PROGRAM STUDI INFORMATIKA FAKULTAS KOMUNIKASI DAN INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA

BAB I PENDAHULUAN 1.1 Latar Belakang

PROGRAM PENELUSURAN LOKASI PENCURIAN DAYA LISTRIK DENGAN MENGGUNAKAN ALGORITMA GENETIKA

PANDUAN PROGRAM HIBAH PEMANFAATAN IPTEKS BAGI MASYARAKAT. Oleh: TIM LPPM

LAPORAN PENELITIAN HIBAH BERSAING

LAPORAN HASIL PENELITIAN

PENGEMBANGAN SISTEM PENILAIAN OTOMATIS TERHADAP JAWABAN SOAL PENDEK DAN TERBUKA DALAM EVALUASI BELAJAR ONLINE BERBAHASA INDONESIA.

APLIKASI PENCARIAN GEDUNG SERBAGUNA DI JAKARTA BERBASIS WEB

Bab III. Metodologi Penelitian. digunakan dalam penyelesaian masalah pada PT. Calvin Metal Products.

PENINGKATAN EFISIENSI SISTEM PEMANAS AIR KAMAR MANDI MENGGUNAKAN INJEKSI GELEMBUNG UDARA

SISTEM PAKAR PEMILIHAN SEPEDA MOTOR DENGAN METODE SIMPLE ADDITIVE WEIGHTING

Sistem Penjaminan Mutu

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

PROGRAM PENELUSURAN LOKASI PENCURIAN DAYA LISTRIK DENGAN MENGGUNAKAN ALGORITMA GENETIKA

BAB I PENDAHULUAN. banyak bahasa salah satunya adalah bahasa Indonesia, bahasa ibu di negeri ini

SISTEM INFORMASI ALUMNI TEKNIK INFORMATIKA UNIVERSITAS MUHAMMADIYAH SURAKARTA BERBASIS WEB

PANDUAN PENGGUNAAN BSLN SIM-LITABMAS UNTUK PENGUSUL PROPOSAL BANTUAN SEMINAR LUAR NEGERI

PERBANDINGAN HASIL DETEKSI KEMIRIPAN TOPIK SKRIPSI DENGAN MENGGUNAKAN METODE N-GRAM DAN EKSPANSI KUERI SKRIPSI

Daftar Isi. Klasifikasi dan Klastering Penjurusan Siswa SMA Negeri 3 Boyolali

SISTEM INFORMASI BIAYA TAGIHAN AIR PELANGGAN PDAM KOTA SURAKARTA BERBASIS MOBILE

PENGEMBANGAN APLIKASI PENDUKUNG KEPUTUSAN UNTUK MEMBANTU MAHASISWA TEKNIK INFORMATIKA DALAM MEMILIH KONSENTRASI BERBASIS WEB

Efek Penggunaan Keterkaitan Kata pada Algoritma Similaritas Semantik Terhadap Kinerja Proses Klasifikasi Teks dengan K-Nearest Neighbour

TRANSLATOR NOTASI ALGORITMIK UNTUK PENGAJARAN PEMROGRAMAN DASAR

BAB 1 PENDAHULUAN Pengantar

LAPORAN TAHUNAN PENELITIAN HIBAH BERSAING

EVALUASI DISTRIBUSI HASIL SELEKSI PPDB SMA NEGERI DI KOTA SURAKARTA MENGGUNAKAN METODE DECISION TREE SKRIPSI. Oleh : AZIZ RIDHA UTAMA

LAPORAN AKHIR PENELITIAN UNGGULAN PERGURUAN TINGGI

KAIDAH PERGESERAN TERJEMAHAN KATEGORI AJEKTIVA DAN ADVERBIA BAHASA INGGRIS KE BAHASA INDONESIA

LAPORAN TAHUNAN PENELITIAN HIBAH BERSAING MODEL PENDIDIKAN TOLERANSI KEHIDUPAN BERAGAMA MELALUI APRESIASI BIOGRAFI TOKOH

APLIKASI SISTEM INFORMASI MANAJEMEN LOGISTIK BERBASIS WEB PADA PT ARINDO PRATAMA CABANG SOLO

PANDUAN PROGRAM HIBAH PENERAPAN TEKNOLOGI BAGI MASYARAKAT

LAPORAN TAHUNAN PENELITIAN HIBAH BERSAING

LAPORAN PENELITIAN FUNDAMENTAL PENGEMBANGAN REAKSI ESTERIFIKASI ASAM OLEAT DAN METANOL DENGAN METODE REAKTIF DISTILASI

BAB 2 TINJAUAN PUSTAKA

DESAIN MESIN PRESENSI BERBASIS IDENTIFIKASI SUARA PENUTUR

SISTEM INFORMASI INTERNET SERVICE PROVIDER PRIMANET SRAGEN BERBASIS WEB

BAB 1 PENDAHULUAN. Latar Belakang

PEMBUATAN APLIKASI E-OFFICE DI PT. ALMEGA SEJAHTERA UNTUK MENDUKUNG KEGIATAN PERKANTORAN BERBASIS WEB MENGGUNAKAN FI FRAMEWORK

BAB I PENDAHULUAN Latar Belakang

RENCANA STRATEGIS (RENSTRA) PENELITIAN LEMBAGA PENELITIAN DAN PENGABDIAN KEPADA MASYARAKAT (LPPM)

LAPORAN PENELITIAN KLASTERING DOKUMEN BERITA DARI WEB MENGGUNAKAN ALGORITMA SINGLE PASS CLUSTERING

Rancang Bangun Aplikasi Penjualan Online Pada PT. Jumbo Power International

CHOIRUL AZIZ L

PENGEMBANGAN SISTEM INFORMASI PARIWISATA DAERAH DENGAN APLIKASI WEB

APLIKASI SISTEM INFORMASI PERKUMPULAN KEPALA KELUARGA BERBASIS SMS GATEWAY. (Studi Kasus: Wilayah RW-IV Kelurahan Kratonan)

PERANCANGAN APLIKASI ONLINE PENJUALAN AKSESORIS MOTOR SPORT AUTOSPEED BERBASIS WEB TUGAS AKHIR DIMAS NUGRAHA A.P

Yogyakarta, 22 Agustus Wahyu Kurniawan

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Psikotest adalah tes yang dilakukan untuk mengukur aspek individu secara psikis. Tes

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

ANALISIS DAN PERANCANGAN PORTAL UNTUK USAHA KECIL DAN MENENGAH (UKM) DI INDONESIA

PENERAPAN APLIKASI KOMPUTER UNTUK PENJUALAN PRODUK INDUSTRI KREATIF PADA TOKO BATIK KUNTO WIBISONO

UKDW. Bab 1 PENDAHULUAN

MEDIA PEMBELAJARAN INTERAKTIF MATA PELAJARAN ILMU PENGETAHUAN ALAM UNTUK SISWA KELAS 3 SEKOLAH DASAR

HALAMAN PERNYATAAN. Yogyakarta, Yang menyatakan, Fiddin Yusfida A la

PEDOMAN PENGUSULAN PROGRAM KREATIVITAS MAHASISWA (PKM) SECARA ONLINE

BAB I PENDAHULUAN. internet yang kini menjadi peranan penting. Kebutuhan user yang semakin

LAPORAN PENELITIAN HIBAH BERSAING PERGURUAN TINGGI TAHUN ANGGARAN 2010 (TAHUN PERTAMA)

LAPORAN AKHIR IPTEKS TEPAT GUNA BAGI MASYARAKAT (ITGbM)

Laporan Akhir Hasil Penelitian Hibah Bersaing

APLIKASI PENDAFTARAN DAN PEMILIHAN PENGURUS OSIS SMK SUDIRMAN 1 WONOGIRI BERBASIS WEBSITE

PANDUAN KOMPETISI PENULISAN BUKU REFERENSI BAGI DOSEN UNNES TAHUN 2018

LAPORAN AKHIR PENELITIAN HIBAH BERSAING

PANDUAN PENELITIAN PEMULA TAHUN 2017/2018

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA

APLIKASI INFORMASI GEOGRAFIS PENYEBARAN DAN PENCARIAN LOKASI KLINIK BPJS DI JAKARTA BERBASIS WEB (STUDI KASUS KANTOR PUSAT BPJS KESEHATAN)

PEDOMAN PROGRAM MAHASISWA WIRAUSAHA

BAB I PENDAHULUAN. banyak bahasa salah satunya adalah Bahasa Indonesia. Tetapi dalam. pengetaahuan kosakata, yang digunakan untuk berkomunikasi hanya

LAPORAN PENELITIAN HIBAH BERSAING

Nomor : 336/E5.3/PB/II/2018 Jakarta, 15 Februari 2018 Lampiran : Panduan pengajuan usulan Hal : Insentif Buku Ajar Terbit Tahun 2018

PERANCANGAN SISTEM WATERMARKING PADA CITRA DIGITAL MENGGUNAKAN METODE DCT DAN LSB

BUKU PANDUAN PENELITIAN MANDIRI DANA DIPA FILKOM

PERANCANGAN APLIKASI E-COMMERCE TOKO ALAT MUSIK ONLINE TUGAS AKHIR

BORANG PENILAIAN NASKAH TESIS PPSUB-2013

LAPORAN PENELITIAN HIBAH BERSAING

LAPORAN TAHUNAN/AKHIR *.. ** Logo Perguruan Tinggi JUDUL. Ketua/Anggota Tim (Nama lengkap dan NIDN) PERGURUAN TINGGI.

Kamus Indonesia - Jawa Berbasis Sinonim

BAB I PENDAHULUAN. 1.1 Latar Belakang

PANDUAN PENGAJUAN USULAN PROGRAM INSENTIF BUKU AJAR TERBIT TAHUN 2018

APLIKASI PADA PONSEL ANDROID UNTUK ADMINISTRASI USER JARINGAN MELALUI SHORT MESSAGE SERVICE

PEDOMAN PENELITIAN DAN PENGABDIAN KEPADA MASYARAKAT PENGEMBANGAN INDIVIDUAL DOSEN (PID)

SISTEM MONITORING DAN MAINTENANCE SYSTEM E-TICKETING BUS BATIK SOLO TRANS BERBASIS FRAMEWORK CODEIGNITER

PENINGKATAN PEMASARAN USAHA AYAM BAKAR DENGAN METODE SWOT

PANDUAN PENGGUNAAN SIM-LITABMAS UNTUK PENGUSUL PROPOSAL PENELITIAN/PENGABDIAN

LAPORAN PENELITIAN TINDAKAN SEKOLAH

Binus University. Program Ganda Sistem Informasi - Manajemen Skripsi Sarjana Program Ganda Semester Ganjil 2007/2008. Ferdinand Aloysius

SISTEM INFORMASI PEMESANAN TIKET ONLINE DI PT SWADHARMA TRAVEL TUGAS AKHIR HENI MARDIANA HSB

Transkripsi:

LAPORAN TAHUNAN PENELITIAN FUNDAMENTAL EFEKTIVITAS ALGORITMA SIMILARITAS SEMANTIK BERBASIS JEJARING KATA UNTUK MENGUKUR KEMIRIPAN KALIMAT BAHASA INDONESIA Tahun ke-1 dari rencana 2 tahun Husni Thamrin, MT, Ph.D (0618077001) Dra. Atiqa Sabardila, M.Hum (0621066401) UNIVERSITAS MUHAMMADIYAH SURAKARTA OKTOBER 2014

RINGKASAN Algoritma similaritas semantik adalah urutan langkah untuk menghitung kemiripan kalimat atas dasar makna/konsep kata yang menyusun kalimat. Algoritma similaritas banyak diterapkan misalnya untuk software deteksi plagiasi, pengelompokan dokumen, dan software penerjemah. Penerapan algoritma similaritas semantik pada teks bahasa Indonesia belum banyak menunjukkan hasil antara lain karena belum adanya jejaring kata bahasa Indonesia. Penelitian ini mengupayakan penyusunan jejaring kata bahasa Indonesia dan melakukan studi Efektivitas Algoritma Similaritas Semantik Berbasis Jejaring Kata dalam Mengukur Kemiripan Kalimat Bahasa Indonesia. Tujuan dari program penelitian ini pada tahun pertama ada dua. Pertama adalah membuat sistem basis data kamus bahasa Indonesia yang menyediakan informasi tentang kata termasuk dalam konteks jejaring kata melalui web service. Kedua adalah membuat aplikasi yang menerapkan algoritma similaritas semantik berbasis jejaring kata atau kamus untuk mengukur similaritas kata, frase atau kalimat dalam sebuah kalimat bahasa Indonesia. Penelitian pada tahun pertama menghasilkan kamus online bahasa Indonesia yang dapat memberi informasi tentang kata, definisi kata, dan sinonim. Kamus online semacam ini sudah tersedia. Kamus yang dihasilkan dalam penelitian ini memberikan informasi tambahan yang tidak ada pada kamus lain yaitu informasi tentang hiponim dan meronim. Informasi tentang sinonim dan hiponim merupakan dasar pembentukan jejaring kata. Pengetahuan tentang kata, sinonim dan hiponim digunakan dalam penelitian ini sebagai ukuran keterkaitan antar kata. Keterkaitan antar kata digunakan dalam algoritma similaritas untuk mengukur kemiripan antar kalimat. Penggunaan pengetahuan tentang sinonim dan hiponim terbukti meningkatkan skor kemiripan antara kalimat yang mengandung kata berbeda namun mempunyai keterkaitan sebagai sinonim atau hiponim. Pengujian algoritma dilakukan lebih lanjut dengan menerapkan algoritman pada proses pengelompokan teks (text clustering). Objek pengelompokan teks diambil dari ratusan kalimat pendek yang diperoleh dari analisis SWOT (strength weakness opportunity threat) sebuah lembaga. Pengujian menunjukkan bahwa klustering berdasarkan kemiripan kalimat yang memanfaatkan pengetahuan sinonim dan hiponim tidak lebih baik dibanding klustering dengan perhitungan kemiripan kosinus biasa. Kesimpulan penelitian ini adalah bahwa skor kemiripan kalimat dapat diperbaiki jika algoritma memperhatikan keterkaitan makna antar kata. Pemanfaatan algoritma dalam proses klustering tidak memperbaiki hasil pengelompokan kalimat. Tahap berikutnya yang perlu dilakukan adalah membuat kumpulan dokumen (korpus) sebagai alat uji standar dari observasi tentang similaritas, menguji algoritma pada proses klasifikasi dokumen, dan menguji proses klustering pada dokumen dengan jumlah kata yang bervariasi. Kata kunci: similaritas, similaritas semantik, sinonim, hiponim, bahasa Indonesia

PRAKATA Puji Syukur kami panjatkan kehadirat Allah Subhanahu wa Ta'ala dengan selesainya penelitian tahun pertama hibah fundamental berjudul: EFEKTIVITAS ALGORITMA SIMILARITAS SEMANTIK BERBASIS JEJARING KATA UNTUK MENGUKUR KEMIRIPAN KALIMAT BAHASA INDONESIA. Hingga tahap ini proses penelitian tidak akan berlangsung lancar tanpa bantuan berbagai pihak. Oleh karena itu penulis hendak mengucapkan terima kasih yang besar kepada: 1. Saudara Fauzan Natsir yang banyak membantu dalam proses penghimpunan data kamus dan entri data kamus hiponim dan meronim. 2. Bapak Dr. Nurgiyatna, M.Sc yang mengijinkan penulis menggunakan kalimatkalimat dalam analisis SWOT di lembaga yang dipimpinnya sebagai bahan analisis similaritas. 3. Tim pengembang website kateglo.com yang menjadikan data kamus besar bahasa Indonesia tersedia secara online sehingga dapat digunakan dalam penelitian terkait kata-kata bahasa Indonesia. 4. Direktorat Jenderal Pendidikan Tinggi, Kemdiknas yang melalui Lembaga Penelitian dan Pengabdian kepada Masyarakat (LPPM) Universitas Muhammadiyah Surakarta yang telah menyediakan dana dalam skema penelitian hibah fundamental sehingga penelitian ini dapat berjalan. Kami telah berusaha melaksanakan kegiatan penelitian ini sebaik mungkin, namun kami menyadari bahwa tidak ada yang sempurna dari hasil karya manusia. Kritik dan saran sangat kami butuhkan untuk kebaikan dan penyempurnaan pelaksanaan penelitian ini selanjutnya. Surakarta, 6 Nopember 2014 Peneliti

DAFTAR ISI HALAMAN SAMPUL...i HALAMAN PENGESAHAN...ii RINGKASAN...iii PRAKATA...iv DAFTAR ISI...v DAFTAR GAMBAR...vi DAFTAR LAMPIRAN...vii BAB 1. PENDAHULUAN...1 BAB 2. TINJAUAN PUSTAKA...3 2.1. Penelitian yang Mendahului...3 2.2. Peta Jalan Penelitian...5 BAB 3. TUJUAN DAN MANFAAT PENELITIAN...8 3.1. Tujuan Penelitian...8 3.2. Manfaat Penelitian...8 BAB 4. METODE PENELITIAN...10 4.1. Perhitungan similaritas...13 4.2. Data uji...15 4.3. Penilaian Kinerja...16 BAB 5. HASIL PENELITIAN...17 5.1 Website Kamus...17 5.2. Konsep basis data kamus...19 5.3. Implementasi Jejaring Kata dalam Program Komputer...19 5.4. Data pengujian...23 5.5. Kinerja algoritma berbasis elemen jejaring kata...24 BAB 6. RENCANA TAHAPAN BERIKUTNYA...27 BAB 7. KESIMPULAN DAN SARAN...28 7.1. Kesimpulan...28 7.2. Saran...28 DAFTAR PUSTAKA...29

DAFTAR GAMBAR Gambar 1. Peta jalan penelitian yang mengawali penelitian yang sedang diusulkan...7 Gambar 2. Rangkaian Kegiatan Penelitian "Efektivitas Algoritma Similaritas Semantik Berbasis Jejaring Kata untuk Mengukur Kemiripan Kalimat Bahasa Indonesia". 12 Gambar 3. Tampilan kamus online untuk kata "rumah". Pada kamus terdapat informasi tentang hiponim dan meronim dari kata yang dicari...17 Gambar 4. Data dalam format JSON yang menyajikan informasi tentang kata bunga sebagaimana ditampilkan melalui sebuah web browser...18 Gambar 5. Class diagram dari basis data kamus...19

DAFTAR LAMPIRAN Lampiran 1. Instrumen penelitian...32 Lampiran 2. Personalia Tenaga Peneliti...32 Lampiran 3. Publikasi...32 Lampiran 4. Kluster dengan similaritas kosinus murni...45 Lampiran 5. Kluster dengan metode similaritas kosinus yang dimodifikasi...50 Lampiran 6. Produk Penelitian Lainnya...55