Pengaruh Proses Stemming Pada Kinerja Analisa Sentimen Pada Review Buku

Jurnal Hasil Penelitian LPPM Untag Surabaya Januari 2018, Vol. 03, No. 01, hal 55-59 jurnal.untag-sby.ac.id/index.php/jhp17 E-ISSN : 2502-8308 P-ISSN : 2579-7980 Pengaruh Proses Stemming Pada Kinerja Analisa Sentimen Pada Review Buu Luvia Frisa Narulita Program Studi Teni Informatia, Universitas 17 Agustus 1945 Surabaya Email : luvianarulita@gmail.com Abstra Analisa sentimen dapat dilauan pada doumen tes yang tida terstrutur termasu pada doumen tinjauan buu. Tahapan pra pemrosesan menjadi tahapan yang penting untu dilauan sebelum analisa sentimen dilauan. Tahapan pra pemrosesan yang meliputi proses stemming menjadi penting diarenaan proses tersebut dapat meningatan etepatan analisa sentimen pada doumen tes.. Kata Kunci: stemming, analisa sentimen, nearest neighbor, review buu. Pendahuluan Internet saat ini banya digunaan untu pencarian informasi. Banya seali informasi yang disediaan di berbagai situs web, bai informasi mengenai politi, informasi mengenai produ maupun situs web yang menyediaan tempat untu penjualan berbagai produ. Informasi mengenai produ, film atau buu dapat dijumpai di situs situs yang menjual produ atau tiet pertunjuan film tersebut. Informasi yang didapatan diantaranya adalah nama, harga dan penjelasan singat mengenai produ tersebut. Saat ini banya situs web yang menyertaan review atau tinjauan dari pengguna produ yang ditampilan pada situs tersebut. Hal tersebut diarenaan menurut penelitian dari ( Maslowsa, Malthouse, & Viswanathan, 2017) menunjuan bahwa adanya tinjauan terhadap barang dan buu mempengaruhi eputusan seseorang untu melauan pembelian barang. Tinjauan yang ditulis oleh pengguna di internet, termasu tinjauan yang ditulis oleh pembeli produ, penonton film atau pembaca buu termasu e dalam data tida terstrutur. Pengolahan data tida terstrutur untu memperoleh informasi dari susunan data tersebut dapat dilauan dengan menggunaan tenologi tes mining. Pada pengolahan informasi dengan tes mining diperluan tahapan preprocessing yang berfungsi untu mempersiapan data sebelum data tersebut siap untu diolah. (Vijayarani, Ilamathi, & Nithya) telah melauan penelitian dengan membagi tahap preprocessingmenjadi tiga tahapan unci, yaitu penghapusan stop word, stemming dan algoritma TF/IDF. Setiap tahapan dalam tahap preprocessing memilii pengaruh masing masing pada hasil pengolahan data. Pengaruh tahapan tersebut menjadi dasar peneliti untu melauan penelitian mengenai pengaruh tahapan stemming pada analisa sentimen pada tinjauan buu. Data yang digunaan pada penelitian ini adalah data tinjauan buu yang didapatan melalui situs goodreads.com untu buu berbahasa Indonesia. Kategori buu yang digunaan sebagai data penelitian adalah novel remaja. Tes tinjauan buu yang diambil untu pengolahan data adalah tes berbahasa Indonesia sejumlah 72 data dengan 36 data tinjauan positif dan 36 data tinjauan negatif. Kajian Literatur Stemming digunaan untu menghilangan imbuhan imbuhan yang ada dalam ata ata sehingga didapatan ata dasar. Algoritma yang digunaan untu proses stemming dapat berbeda jia digunaan untu bahasa yang berbeda. Diantara algoritma yang telah diembangan untu proses stemming doumen berbahasa Indonesia adalah aloritma Nazief & Adriani dan Algoritma Porter (Wahyudi, Susyanto, & Nugroho). 55

Pengaruh Proses Stemming Pada Kinerja Analisa Sentimen Pada Review Buu Algoritma Nazief & Adriani diembangan pada tahun 1996 dan dipubliasian secara internal pada faultas Teni Komputer, Universitas Indonesia. Algoritma Nazief & Adriani ditulis oleh B.A.A Nazief dan M. Adriani. Jelita Asian B.Comp. Sc. (Hons) menulis tentang tehni tehni yang efetif untu text retrieval dalam Bahasa Indonesia. Dalam doumen tesis tersebut juga ditulisan mengenai langah langah algoritma stemming Nazief & Adriani (Asian, 2007) yang meliputi: a. Langah awal yang dilauan adalah dengan menyiapan daftar ata ata dasar dalam Bahasa Indonesia yang bisa disimpan dalam format amus ata dasar Bahasa Indonesia. b. Setelah amus ata dasar Bahasa Indonesia tersedia, maa pada langah selanjutnya yang dilauan oleh algoritma ini adalah membandingan ata yang diinputan dengan setiap ata yang ada pada amus ata dasar, jia ata yang diinputan terdapat pada amus, maa ata yang diinputan tersebut dianggap sebagai ata dasar dan proses pencarian berhenti. c. Langah beriutnya adalah dengan menghapus inflectional suffixes atau imbuhan yang tida mempengaruhi cara pembacaan ata dasar yang diberian imbuhan tersebut. Inflectional suffixes terdiri dari dua macam, yaitu inflectional particle suffixes dan possessive pronoun suffixes. Contoh imbuhan partiel atau particle suffixes atersebut adalah -lah, -ah, -tah atau -pun. Sedangan contoh penggunaan imbuhan tersebut adalah maanlah. Kata dasar maan tida berubah cara pembacaannya etia diberian imbuhan -lah. Contoh imbuhan possessive pronoun suffixes atau imbuhan yang menyataan epemilian adalah -u, -mu atau -nya. Kedua imbuhan tersebut harus dihilangan untu mendapatan ata dasar. Setelah proses penghilangan imbuhan dan didapatan ata dasar, maa langah selanjutnya adalah membandingan ata dasar tersebut. Jia ata dasar tersebut terdapat pada amus ata dasar, maa algoritma berhenti. d. Langah beriutnya adalah menghilangan imbuhan derivatif seperti -i, -an, dan -an. Imbuhan tersebut biasanya diletaan pada ahir ata dan membentu ata erja dari ata dasar yang telah diberi imbuhan. Contoh pulangan memilii ata dasar pulang dengan imbuhan -an. Setelah dihilangan imbuhan yang menyertai ata tersebut, maa langah selanjutnya adalah membandingan ata yang didapatan dengan amus ata dasar yang ada. Jia ata tersebut ditemuan, maa algoritma berhenti. Jia ata tersebut tida ditemuan, maa algoritma melangah e langah selanjutnya. e. Menghilangan awalan merupaan langah beriutnya pada algoritma ini. Awalan yang dihilangan adalah be-, di-, e-, me-, pe-, se-, dan te-. Langah ini dihentian jia: a. Ditemuan pasangan awalan dan ahiran yang telah ditemuan sebelumnya merupaan pasangan yang tida diperbolehan. Seperti pasangan awalan ber dan ahiran i pada sebuah ata. b. Awalan yang ditemuan sama persis dengan awalan yang telah ditemuan sebelumnya c. Tiga awalan telah dihilangan. f. Langah beriutnya adalah dengan mengidentifiasi tipe awalan dan menghilangan ambiguitas. g. Proses penghilangan awalan merupaan proses berulang, jia sampai proses penghilangan awalan berahir tetapi ata dasar tida ditemuan, maa algoritma berhenti. h. Jia semua langah telah dilauan namun tida berhasil, maa ata diembalian seperti pada awal sebelum ata tersebut dilauan proses stemming. 56

Luvia Frisa Narulita Analisa Sentimen atau disebut juga sebagai opinion mining merupaan bidang yang mempelajari dan menganalisa opini publi, sentimen, evaluasi, penilaian, siap dan emosi terhadap suatu produ, pelayanan, organisasi, individu, isu, ejadian, topi dan atribut atribut yang menyertai (Liu, 2012) Analisa sentimen pada doumen tes merupaan proses untu menganalisa ecenderungan suatu tes terhadap sentimen positif atau negatif. Contoh sentimen positif pada suatu ata adalah ata bagus, bai atau canti. Sedangan contoh sentimen negatif adalah jele atau buru. Metode Terdapat empat cara untu menguur Metode yang digunaan pada penelitian ini adalah sebagai beriut: a. Pengumpulan data Data yang digunaan diambil dari situs goodreads.com secara aca dengan mengambil data tinjauan pada novel berbahasa Indonesia dan tinjauan dengan bahasa Indonesia. Pengguna atau pemberi tinjauan pada situs tersebut dapat memberian nilai berupa bintang dengan rentang nilai satu bintang sampai dengan lima bintang. b. Tahap Preprocessing Tahap preprocessing terdiri dari tahap penghapusan stopword dan tahap stemming. Untu membandingan hasil analisa sentimen dilauan pembedaan pada tahap preprocessing, yaitu dengan menyertaan tahap stemming dan dengan tida menyertaan tahap stemming. Algoritma yang digunaan pada proses stemming adalah algoritma Nazief & Ardani. Langah langah algoritma tersebut telah dijelasan pada bab Tinjauan Pustaa. c. Pembobotan istilah (term) Pembobotan istilah digunaan untu memberian nilai pada setiap istilah atau ata yang telah dipisahan. d. Penghitungan tingat emiripan. Penghitungan tingat emiripan dari setiap ata berfungsi untu menghitung emiripan ata dalam alimat dengan umpulan alimat pada data latih. Pada proses ini dihitung tingat emiripan data sehingga dapat dietahui tingat emiripan alimat terhadap umpulan data positif dan data negatif. e. Klasifiasi Proses lasifiasi dilauan dengan menggunaan apliasi Wea 3.8 dengan algoritma Naïve Bayes dan K Nearest Algorithm f. Pengujian Pengujian dilauan dengan membandingan data uji terhadap data latih dan membandingan secara langsung hasil yang didapatan dengan nilai atual. Hasil dan Pembahasan Hasil yang didapatan untu proses analisa sentimen dengan menyertaan tahapan stemming setelah dilauan proses lasifiasi dengan menggunaan apliasi Wea 3.8 ditunjuan pada grafi beriut Gambar 4.1: Tingat Aurasi dengan algoritma KNN dengan = 1 Gambar 4.2: Tingat Aurasi dengan algoritma KNN dengan = 5 57

Pengaruh Proses Stemming Pada Kinerja Analisa Sentimen Pada Review Buu Gambar 4.3: Tingat Aurasi dengan algoritma KNN dengan = 10 Gambar 4.1, 4.2 dan 4.3 menunjuan tingat aurasi yang diperoleh. Dalam gambar tersebut ditunjuan bahwa tingat aurasi dengan menggunaan proses stemming lebih tinggi jia dibandingan dengan analisa sentimen tanpa proses stemming. Dalam gambar tersebut ditunjuan hasil yang diperoleh dengan percentage split 70%, 75% dan 80%. Tabel 4.1. Tabel Aurasi Tanpa Stemming Gambar 4.4: Tingat precision dengan = 1 Gambar 4.5: Tingat precision dengan = 5 1 45,45 44,44 50,00 5 59,00 50,00 57,14 10 68,18 61,11 64,28 Tabel 4.2. Tabel Aurasi Dengan Stemming 1 77,27 77,77 78,57 5 68,18 77,77 71,42 10 77,27 77,77 78,51 Tabel 4.1 dan Tabel 4.2 menunjuan perbedaan tingat aurasi yang diperoleh dari analisa sentimen dengan menggunaan proses stemming dan tanpa menggunaan proses stemming. Dengan menggunaan classifier ibk dengan = 1, = 5, = 10 menunjuan nilai aurasi dengan proses stemming lebih tinggi dibandingan dengan tanpa proses stemming. Gambar 4.4 menunjuan tingat precision yang diperoleh. Gambar 4.6: Tingat precision dengan =10 Tingat precision yang ditunjuan pada gambar 4.4, gambar 4.5 dan gambar 4.6 adalah tingat etepatan sistem dalam melauan predisi. Nilai precision yang lebih jelas ditunjuan pada tabel 4.3 dan tabel 4.4. Tabel 4.3. Tabel nilai precision untu analisa sentimen tanpa proses stemming. 1 0,455 0,442 0,576 5 0,618 0,5 0,786 10 0,701 0,781 0,805 58

Luvia Frisa Narulita Tabel 4.4. Tabel nilai precision untu analisa sentimen dengan proses stemming. 1 0,771 0,792 0,857 5 0,751 0,792 0,829 10 0,784 0,846 0,857 Dari tabel 4.3 dan tabel 4.4 terlihat bahwa nilai precision untu proses analisa sentimen dengan menggunaan proses stemming lebih tinggi jia dibandingan dengan analisa sentimen tanpa proses stemming. Vijayarani, D., Ilamathi, M., & Nithya, M. (n.d.). Preprocessing Techniques for Text Mining - An Overview. International Journal of Computer Science & Communcation Networs vol 5 no 1, 7-16. Wahyudi, D., Susyanto, T., & Nugroho, D. (n.d.). Implementasi dan Analisis Algoritma Stemming Nazief & Adriani dan Porter pada Doumen Berbahasa Indonesia. Jurnal Ilmiah SINUS, 49-56. Kesimpulan Kesimpulan yang didapatan dari penelitian yang telah dilauan adalah bahwa proses stemming memberian peranan penting untu meningatan aurasi analisa sentimen untu doumen tes. Pada penelitian selanjutnya diharapan dapat dilauan penelitian dengan menggunaan algoritma stemming serta algoritma lasifiasi yang lain sehingga dapat diperoleh perbandingan inerja di antara beberapa algoritma. Selain itu, data yang digunaan juga dapat diperbanya sehingga hasil penelitian lebih aurat. Referensi Maslowsa, E., Malthouse, E., & Viswanathan, V. (2017). Do Customer Reviews Drive Purchase Decisions? The Moderating Roles of Review Exposure and Price. Decission Support System. Asian, J. (2007). Effective Techniques for Indonesian Text Retrieval. Thesis of Doctoral. Melbourne: RMIT University. Liu, B. (2012). Sentiment Analysis and Opinion Mining. Morgan & Claypool Publishers. 59