BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan merupakan salah satu aspek penting di dalam kehidupan. Oleh karena itu, pendidikan mendapat perhatian besar dalam kehidupan masyarakat dan negara. Pendidikan di perguruan tinggi merupakan salah satu jenjang pendidikan formal. Menurut Djamarah dan Zain (2006), bahwa keberhasilan proses belajar mengajar dalam dunia pendidikan dipengaruhi oleh beberapa faktor yaitu tujuan pembelajaran, bahan ajar yang digunakan, kegiatan belajar mengajar, metode, alat, sumber dan evaluasi proses belajar mengajar. Sedangkan menurut Margono (2003) faktor-faktor tersebut adalah mahasiswa, dosen, tujuan belajar, materi pelajaran, sarana belajar, interaksi antara mahasiswa dan materi, interaksi antara dosen dan mahasiswa, interaksi antara mahasiswa dan mahasiswa dan lingkungan belajar. Tingkat kesuksesan pembelajaran pada perguruan tinggi dapat diukur dari opini mahasiswa tentang proses pembelajaran. Opini atau komentar mahasiswa mengenai proses pembelajaran biasanya disimpan pada sistem evaluasi pembelajaran, yaitu dimana mahasiswa memberikan penilaian kepada dosen matakuliah sesuai dengan kinerja dosen saat mengajar. Pada umumnya, sistem evaluasi pembelajaran hanya memberikan beberapa pertanyaan dan menyediakan jawaban berupa pilihan ganda. Tapi pada kenyataannya pertanyaan yang tersedia belum mewakili beberapa keluhan mahasiswa mengenai dosen dan proses perkuliahan. Komentar mahasiswa biasanya berisi saran dan kritik mengenai dosen dan proses perkuliahan. Dalam komentar tersebut mengandung nilai sentimen positif dan negatif yang dapat dijadikan pelengkap penilaian kinerja dosen. Klasifikasi data menjadi salah satu permasalahan yang sering diangkat dalam data mining. Text mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks. Dalam klasifikasi teks ada beberapa metode yang sering digunakan, metode Cosine Similarity, Naïve Bayes Classifier (NBC) dan 1
2 Support Vector Machine (SVM). Metode Cosine Similarity merupakan salah satu metode untuk menghitung similaritas dokumen. Kelebihan utama dari metode Cosine Similarity adalah tidak terpengaruh pada panjang pendeknya suatu dokumen (Rozas dan Sarno, 2011). Selain itu Cosine Similarity memiliki akurasi yang tinggi ketika dihadapkan pada klasifikasi dengan kelas yang banyak jenisnya (Bhattacharjee dkk. 2015). Sedangkan algoritma Naive Bayes Classifier (NBC) Sederhana namun memiliki kecepatan dan akurasi yang tinggi (Rish, 2001). Pada penelitian yang dilakukan Oleh Domingos dan Pazzani (1997) Naïve Bayes dapat bekerja dengan baik bahkan dengan adanya kehadiran dari fitur yang memiliki dependensi yang kuat pada dataset. Dengan permasalahan ini, metode klasifikasi Naïve Bayes sangat sesuai apabila digunakan, sebab Naïve Bayes Classifier (NBC) masih mampu bekerja dengan baik dengan ukuran data training yang kecil (Kohavi, 1996) (Domingos dan Pazzani, 1997). Selain itu, algoritma Naïve Bayes Classifier (NBC) yang sederhana dan kecepatannya yang tinggi dalam proses pelatihan dan klasifikasi (Kotsiantis, 2007) membuat algoritma ini menarik untuk digunakan sebagai salah satu metode klasifikasi. Dengan karakteristik tersebut di atas, maka metode klasifikasi Naïve Bayes sesuai jika digunakan pada penelitian ini. Sebagai pembanding akan digunakan metode Support Vector Machine (SVM). Kotsiantis (2007) memperlihatkan pada penelitiannya bahwa akurasi dari metode SVM lebih besar jika dibandingkan dengan metode klasifikasi yang lainnya, memiliki kecepatan klasifikasi yang tinggi, dan toleransi yang tinggi terhadap attribut yang tidak relevan. Dalam proses penyelesaian analisis sentimen dan klasifikasi biasanya menggunakan satu metode saja, namun dalam penielitian ini menggunakan kombinasi dari algoritme atau metode untuk mendapatkan kemampuan yang lebih dalam penyelesaian masalah. Penelitian ini mencoba melakukan klasifikasi dan analisis sentimen pada komentar mahasiswa dalam bahasa indonesia. Metode K-NN berbasis Cosine Similarity digunakan untuk proses klasifikasi komentar. Kombinasi melalui metode Supervised (Machine Learning), digunakan untuk proses analisis sentimen. metode Supervised (Machine Learning) yang digunakan
3 adalah metode Naïve Bayes Classifier (NBC) dan Support Vector Machine (SVM). 1.2 Rumusan Masalah Berdasarkan latar belakang masalah di atas maka rumusan masalah dalam penelitian ini adalah bagaimana membangun model klasifikasi komentar mahasiswa? 1.3 Batasan Masalah Batasan dalam penelitian ini diantaranya: 1. Penelitian ini hanya melakukan analisis terhadap komentar dalam bahasa Indonesia 2. Data yang digunakan dalam penelitian ini adalah data komentar pada Sistem Evaluasi Pembelajaran Universitas Islam Negeri (UIN) Sunan Kalijaga Yogyakarta. 3. Penelitian ini melakukan klasifikasi komentar dengan menggunakan metode K-NN berbasis Cosine Similarity ke dalam empat kelas kategori diantaranya cara mengajar, cara penilaian, ketepatan waktu, dan pemberian tugas (Pedoman kegiatan akademik UIN Sunan Kalijaga, 2013). 4. Metode Supervised (machine learning) yang digunakan untuk mengklasifikasikan polaritas sentimen positif dan negatif adalah Naïve Bayes Classifier (NBC) dan sebagai pembanding digunakan metode Support Vector Machine (SVM). 1.4 Tujuan Penelitian Tujuan yang ingin dicapai dalam penelitian ini adalah melakukan analisis sentimen dan klasifikasi komentar mahasiswa berbahasa Indonesia menggunakan metode K-NN berbasis Cosine Similarity dikombinasikan dengan Supervised Model.
4 1.5 Manfaat Penelitian Manfaat dalam penelitian ini adalah untuk membantu pihak universitas mengetahui tanggapan terhadap dosen matakuliah melalui kritik dan saran yang diambil dari komentar mahasiswa. Selain itu, penelitian ini dapat digunakan oleh pihak universitas dalam mengambil kebijakan dalam pemberian beban mengajar terhadap dosen sesuai dengan hasil klasifikasi. 1.6 Keaslian Penelitian Penelitian yang dilakukan terkait permasalahan analisis sentimen dan klasifikasi komentar hingga saat ini telah banyak dilakukan oleh peneliti sebelumnya. Namun, Berdasarkan pada referensi dan tinjauan pustaka, penelitian yang diajukan sebagai Tesis S2 Ilmu Komputer Universitas Gadjah mada Yogyakarta mengenai kombinasi metode Cosine Similarity dengan metode Supervised (machine learning) untuk menyelesaikan permasalahan analisis sentimen dan klasifikasi komentar mahasiswa pada sistem evaluasi pembelajaran, belum pernah dilakukan. 1.7 Metode penelitian Berikut ini adalah tahapan-tahapan dan metode yang dilakukan dalam penelitian ini: 1. Studi Pustaka Studi pustaka dilakukan dengan mengumpulkan kebutuhan berupa referensi yang terkait dengan penelitian diantaranya jurnal penelitian, tesis terdahulu, prosiding, buku-buku, dan artikel-artikel dari internet. 2. Pengumpulan data Pengumpulan data dilakukan dengan mengumpulkan data komentar yang terdapat pada sistem evaluasi pembelajaran UIN Sunan Kalijaga Yogyakarta. 3. Perancangan Sistem Pada tahap ini, dirancang alur sistem yang dibangun seperti yang dijelaskan secara lebih mendetail di BAB 4. Tampilan antar muka keseluruhan system juga dirancang pada tahap ini.
5 4. Implementasi Pada tahap ini, hasil rancangan system dikembangkan menjadi perangkat lunak menggunakan bahasa pemrogaman python serta beberapa tools bantuan 5. Pengujian dan Evaluasi Pengujian sistem dilakukan setelah proses pelatihan kemudian dilanjutkan dengan proses evaluasi dengan pengecekan akurasi hasil pengujian. 1.8 Sistematika Penulisan Penelitian ini disusun berdasarkan sistematika penulisan sebagai berikut: BAB I PENDAHULUAN Pendahuluan berisi uraian singkat mengenai latar belakang, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, keaslian penelitian dan sistematika penulisan tesis. BAB II TINJAUAN PUSTAKA Tinjauan pustaka membahas tentang penelitian-penelitian terdahulu yang terkait dengan penelitian ini. Selain itu, pada bab ini juga diuraikan tentang perbandingan metode antara penelitian ini dengan penelitian yang telah ada sebelumnya. BAB III LANDASAN TEORI Landasan teori memuat tentang teori-teori dasar terkait dengan penelitian yang dilakukan dan menjadi dasar dalam memecahkan masalah dalam penelitian ini. BAB IV ANALISIS DAN PERANCANGAN SISTEM Bab ini membahas analisis dan perancangan sistem yang akan dibangun. Uraian pada bab ini mencakup rancangan arsitektur tipe, dan rancangan interface system. BAB V IMPLEMENTASI Bab ini berisi potongan kode program (sourcecode) dan interface system dari implementasi system yang telah dihasilkan.
6 BAB VI BAB VII HASIL DAN PEMBAHASAN Hasil dan pembahasan berisi tentang hasil dari implementasi sistem dan hasil penelitian berupa hasil analisis sentiment serta klasifikasi sentimen. Selanjutnya hasil tersebut dibahas apakah sudah menjawab rumusan masalah dan mencapai tujuan penelitian. KESIMPULAN DAN SARAN Kesimpulan dan saran berisi kesimpulan dari hasil penelitian yang telah dilakukan. Kesimpulan diambil berdasarkan hasil dan pembahasan pada bab sebelumnya. Selanjutnya, kekurangan yang ada pada sistem dimasukkan ke dalam saran untuk pengembangan penelitian di masa yang akan datang.