BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan internet itu sendiri berkembang sangat pesat. Ditemukannya media sosial seperti Facebook (2004) dan Twitter (2006) telah mendorong kegiatan seperti review, forum diskusi,blog, micro-blog, komentar, dan posting yang melipatgandakan keberadaan dokumen teks di internet. Opini adalah salah satu bagian dalam pengambilan keputusan. Keputusan yang tepat dipengaruhi oleh analisis opini dari berbagai sumber yang berhubungan dengan pengambilan keputusan. Opini dapat muncul melalui permintaan saran dalam aktivitas kuesioner, atau muncul dari suatu forum on line yang disediakan oleh situs resmi perguruan tinggi. Banyaknya opini online yang berupa teks ini semakin hari semakin banyak dan umumnya tidak sepenuhnya dimanfaatkan karena bentuknya tidak terstruktur. Meskipun memiliki informasi berharga, opini ini juga sering menggunakan bahasa informal. Kuesioner adalah suatu teknik pengumpulan informasi yang memungkinkan analis untuk mempelajari sikap-sikap,keyakinan,perilaku dan karakteristik beberapa orang utama didalam organisasi yang bisa terpengaruh oleh system yang diajukan atau oleh system yang sudah ada,dalam pengendalian mutu suatu organisasi kuesioner memiliki pengaruh yang cukup besar (Pengertian Kuesioner, 2008). Text mining adalah salah satu cara dalam mengatasi permasalahan diatas. Text mining merupakan proses pengambilan data berupa teks dari sebuah sumber dalam hal ini sumbernya adalah media kuesioner. Dengan Sentiment Analysis dapat dicari kata-kata kunci yang dapat mewakili isi dari suatu kata yaitu kata positif, negatif, netral lalu dianalisa dan dilakukan pencocokan antara kalimat dengan database kata kunci yang telah dibuat untuk menentukan atau memilah kategori suatu jawaban. 1.2 Rumusan Masalah Berdasarkan uraian latar belakang masalah yang dijelaskan, terdapat beberapa perumusan masalah sebagai berikut : I-1
1. Bagaimana implementasi Sentiment Analysis yang terdapat pada jawaban dari kuesioner online mengenai fasilitas yang ada untuk pengendalian mutu di Universitas Widyatama. 2. Bagaimana pengklasifikasian data hasil jawaban kuesioner apakah bersentimen negatif atau sentimen positif. 1.3 Tujuan Penelitian Tujuan yang dapat diambil dari penelitian ini adalah sebagai berikut : 1. Mengimplementasikan data input teks jawaban dari kuesioner mengenai fasilitas di Universitas Widyatama dengan menggunakan metode algoritma Naïve Bayes Classifier. 2. Menganalisis hasil klasifikasi dari metode algoritma Naïve Bayes yang diterapkan ke dalam penelitian mengenai fasilitas di Universitas Widyatama. 1.4 Batasan Masalah Adapun batasan masalah dalam pembuatan perangkat lunak ini adalah sebagai berikut : 1. Teks yang digunakan adalah jawaban dari kuisioner yang telah dibagi yang membahas mengenai fasilitas di universitas widyatama. 2. Kalimat yang terdapat pada jawaban kuisioner hanya menggunakan bahasa Indonesia. 3. Kalimat berbahasa inggris masuk kedalam noise. 4. Format untuk dokumen adalah csv. 5. Algoritma yang digunakan Naive Bayes Classifier 1.5 Metode Penelitian Bahan Penelitian berupa koleksi data test-collection dokumen teks yang terdiri dari koleksi saran dan komentar pada kuesioner mahasiswa Universitas Widyatama sebanyak kurang lebih 1000 hasil jawaban I-2
Gambar 1.1 Langkah Penelitian Pengklasifikasian Opini Hasil Jawaban Kuesioner Adapun langkah-langkah penelitian dapat disajikan seperti dalam Gambar 1. Secara ringkas dapat diuraikan langkah-langkah seperti berikut ini : Langkah tokenisasi adalah langkah memecah string menjadi token-token dengan cara menguraikan string yang terdiri dari kalimat komentar atau saran. Pada langkah tokenisasi ini dilakukan upayaupaya pembersihan kata dari tanda-tanda baca yang tidak berguna sehingga kata menjadi unik, misalnya kata parah!, atau parah? atau kata parah...!? menjadi parah saja. Langkah indexing adalah mencari kata unik yang dapat mewakili pengertian tertentu dari suatu opini. Langkah ini ditempuh dengan melakukan filter kata-kata yang merupakan STOP WORD seperti dan, yang, atau, dari dan lain-lain. Langkah weighting adalah langkah memberikan bobot pada masing-masing kata unik yang ada dalam koleksi. Pembobotan dilakukan dengan menghitung frekuensi kemunculan kata pada tiap kategori opini dan mencari probabilitas P(wk Di), yaitu probabilitas kemunculan kata ke-k (wk) dalam dokumen ke-i (Di). Langkah klasifikasi adalah langkah mencari nilai maksimum probabilitas dari perkalian probabilitas kata-kata yang menyusun dokumen pada seluruh kategori yang ada. Algoritma dalam penelitian ini terdari diri dua tahap, yaitu algoritma pelatihan dan klasifikasi. Adapun uraian masing-masing algoritma adalah sebagai berikut : Algoritma Pelatihan (dokumen adalah komentar atau pesan yang akan diklasifikasi) I-3
1. jumlah semua token jumlah semua kata yang unik dari dokumen 2. Untuk setiap kelas sentimen lakukan : a. Jumlah record pada kelas j jumlah record yang berada pada kelas j b. Hitung P (sentimentj) dengan persamaan c. Untuk setiap kata wk pada daftar semua token lakukan : 3. Hitung P(katak sentimentj) dengan persamaan Algoritma Klasifikasi NBC 1. Input pesan (dokumen) yang akan diketahui sentimen (klasifikasi) nya 2. Hasilkan probabilitas untuk masing- masing kelas sesuai dengan persamaan sebelumnya menggunakan P(sentimentj) dan P(katak sentimentj) yang telah diperoleh dari pelatihan. 3. Probabilitas kelas maksimum adalah kelas sentiment terpilih hasil klasifikasi 1.6 Sistematika Penulisan Agar penulisan karya tulis ini dapat tersusun secara teratur, maka diperlukan sistematika. Berikut ini merupakan sistematika penulisan dari tugas akhir: Bab I Pendahuluan, dalam bab ini menjelaskan mengenai latar belakang masalah, identifikasi masalah, perumusan masalah, batasan masalah, tujuan, metode penelitian dan sistematika penulisan. Bab II Landasan Teori, dalam bab ini menjelaskan tentang teori yang digunakan penulis unuk membangun sistem dan membahas secara singkat mengenai bahasa pemrograman yang digunakan dalam mengimplementasikan sistem yang telah dibangun. Bab III Analisis Sistem, dalam bab ini menjelaskan tentang penganalisaan sistem aplikasi yang akan dibangun meliputi identifikasi masalah, hasil analisis, perhitungan manual dengan metode yang digunakan, kebutuhan perangkat yang akan digunakan hingga permodelan sistem yang akan dibangun. Bab IV Perancangan Sistem, dalam bab ini menjelaskan tentang tahapan perancangan pembangunan sistem informasi pendataan perangkat komputer. I-4
Bab V Implementasi dan Pengujian Sistem, dalam bab ini menjelaskan tentang tahapan rancangan yang akan dibuat menjadi kode program serta petunjuk penggunaan program aplikasi. Bab VI Penutup, dalam bab ini merupakan bab yang menguraikan tentang kesimpulan dan saran dari laporan tugas akhir. I-5