ANALISIS SENTIMEN PENGGUNA JEJARING SOSIAL MENGGUNAKAN METODE SUPPORT VECTOR MACHINE M. Fachrurroz, M.T. 1, Nov Yuslan, M.T. 2 1,2 Jurusan Teknk Informatka Fakultas Ilmu Komputer, Unverstas Srwjaya 1 obetsobets@gmal.com, 2 nov.yuslan@gmal.com Abstrak Jejarng sosal membantu pengguna Internet dalam berkomunkas. Hal n dkarenakan pengguna jejarng sosal dapat menyampakan pesan dengan memanfaatkan fasltas yang dsedakan oleh setap jejarng sosal. Pesan yang akan dsampakan melalu jejarng sosal dapat d-post melalu antarmuka stus web jejarng sosal, pesan sngkat (SMS), atau melalu berbaga aplkas untuk perangkat seluler. Pesan-pesan para pengguna jejarng sosal dapat dmanfaatkan untuk berbaga hal, sepert melakukan revew terhadap suatu produk atau melakukan revew terhadap suatu masalah bak poltk maupun masalah sosal terkn. Hal n dapat dlakukan dengan menganalss sentmen para pengguna yang dsampakan melalu pesan-pesan dalam stus jejarng sosal. Metode Support Vector Machne merupakan salah satu metode yang dapat dmanfaatkan untuk menganalss sentmen. Analss sentmen dengan menggunakan metode Support Vector Machne dlakukan dengan cara mengklasfkaskan sentmen ke dalam kelas postf atau kelas negatf. Tngkat akuras sstem analss sentmen pengguna jejarng sosal dengan menggunakan metode Support Vector Machne adalah 81 % atau sebanyak 243 kcauan yang terkelompok secara tepat dar jumlah keseluruhan kcauan sebanyak 300 kcauan. Kata kunc : analss sentmen, jejarng sosal, support vector machne 1. Pendahuluan Jejarng sosal saat n telah menguasa kehdupan para pengguna Internet. Layanan yang dberkan oleh setap stus jejarng sosal berbeda-beda. Hal n menandakan bahwa setap stus jejarng sosal memlk cr khas dan keunggulan tersendr. Pada umumnya, layanan yang ada pada jejarng sosal adalah chattng, e-mal, berbag pesan, berbag vdeo atau foto, forum dskus, blog, dan lan-lan. Pemanfaatan stus jejarng sosal telah menjad trend atau gaya hdup sebagan masyarakat. Jejarng sosal membantu pengguna Internet dalam berkomunkas. Hal n dkarenakan pengguna jejarng sosal dapat menyampakan pesan dengan memanfaatkan fasltas yang dsedakan oleh setap jejarng sosal. Pesan yang akan dsampakan melalu jejarng sosal dapat d-post melalu antarmuka stus web jejarng sosal, pesan sngkat (SMS), atau melalu berbaga aplkas untuk perangkat seluler. Dengan demkan, pesan-pesan para pengguna jejarng sosal dapat dmanfaatkan untuk berbaga hal, sepert melakukan revew terhadap suatu produk atau melakukan revew terhadap suatu masalah bak poltk maupun masalah sosal terkn. Hal n dapat dlakukan dengan menganalss sentmen para pengguna yang dsampakan melalu pesan-pesan dalam stus jejarng sosal. Analss sentmen merupakan proses memaham, mengekstrak, dan mengolah data tekstual secara otomats untuk mendapatkan nformas (Bo Pang dan Lllan, 2008) [1]. Hal n menandakan bahwa analss sentmen dapat dgunakan untuk mendapatkan nformas yang ada d dalam pesan para pengguna jejarng sosal terhadap topk yang dbahas. Analss sentmen dapat dlakukan dengan mengklasfkas nformas yang ada ke dalam kelas sentmen postf dan ke dalam kelas sentmen negatf. Informas akan dklasfkaskan ke dalam kelas postf apabla nformas yang dsampakan bernla bak atau setuju terhadap sesuatu. Sebalknya, nformas akan dklasfkaskan ke dalam kelas negatf apabla nformas yang dsampakan bernla tdak bak atau tdak setuju. Peneltan n bertujuan untuk menganalss sentmen pengguna jejarng sosal terhadap suatu topk bahasan yang ada dengan memanfaatkan pesan para pengguna jejarng sosal.
2. Dasar Teor A. Support Vector Machne Support Vector Machne (SVM) adalah sstem pembelajaran mesn yang menggunakan ruang hpotess berupa fungs-fungs lner dalam sebuah ruang ftur (feature space) berdmens tnggg, dlath dengan algortma pembelajaran yang ddasarkan pada teor optmas dengan mengmplementaskan learnng bas yang berasal dar teor pembelajaran statstk (Chrstann, et.al., 2000) [2]. Menurut (yuharz, 2013)[3] SVM adalah sstem pembelajaran mesn yang bekerja atas prnsp Structural Rsk Mnmzaton (SRM). SRM bertujuan untuk menemukan hyperplane terbak yang memsahkan dua buah kelas pada nput space. Hyperplane terbak antara dua kelas dapat dtemukan dengan mengukur margn hyperplane dan mencar ttk maksmalnya. Margn adalah jarak antara hyperplane dengan pattern terdekat dar masng-masng kelas. Pattern yang palng dekat dsebut sebaga support vector. Tahapan pembelajaran dalam SVM adalah : 1. Mencar Lagrange Multplers (α) Keterangan: y : kelas data lath (+1/-1). y j : kelas data lath (+1/-1). x : vektor bobot kalmat komentar. x j : vektor bobot kalmat komentar. 2. Mencar Nla Bobot (w) w : vektor bobot. y : kelas data lath (+1/-1). x : vektor bobot kalmat komentar yang menjad vektor pendukung. 3. Mencar Nla Bas (b) (1) (2) NSV : jumlah vektor pendukung. w : vektor bobot y : kelas data lath (+1/-1). x : vektor bobot kalmat komentar yang menjad vektor pendukung. Proses pengklasfkasan (pengujan) dalam SVM menggunakan persamaan 4. f ( t ) sgn t : vektor bobot data uj x : vektor pendukung b : nla bas n 1, x SV y t x b y : kelas atau label dar vektor pendukung (+1/-1) (4) B. Analss Sentmen Analss sentmen merupakan salah satu cabang peneltan d doman Text Mnng. Secara umum, analss sentmen berkatan dengan rset komputasonal dar opn, sentmen, dan emos yang dekspreskan secara tekstual. Analss sentmen bertujuan untuk mengekstrak atrbut dar sebuah komentar (opn, sentmen, dan emos) yang dekspreskan secara tekstual. Setelah tu, akan dberkan penlaan terhadap komentar tersebut, yatu postf atau negatf (Bo Pang dan Lllan, 2008) [1]. Secara umum, analss sentmen dbag menjad dua kategor, yatu: a. Coarse-graned sentment analyss b. Fned-graned sentment analyss Coarse-graned sentment analyss melakukan proses analss pada level dokumen. Pengklasfkasan berorentas pada sebuah dokumen secara keseluruhan, yatu postf, netral, dan negatf. Sedangkan fned-graned sentment analyss melakukan proses analss sebuah kalmat. Tabel 1 menunjukkan contoh fned-graned sentment analyss. Tabel 1. Contoh Fned-Graned Sentment Analyss Kalmat Klasfkas Saya tdak suka programmng Negatf Hotel tu sangat ndah sekal Postf (3) 3. Sstem Analss Sentmen menggunakan metode Support Vector Machne Sstem analss sentmen adalah sstem yang berfungs untuk menganalss sentmen para pengguna jejarng sosal. Analss sentmen dapat
dlakukan dengan mengklasfkas nformas yang ada d dalam komentar atau kcauan para pengguna jejarng sosal ke dalam kelas sentmen postf dan ke dalam kelas sentmen negatf. Informas akan dklasfkaskan ke dalam kelas postf apabla nformas yang dsampakan bernla bak atau setuju terhadap sesuatu. Sebalknya, nformas akan dklasfkaskan ke dalam kelas negatf apabla nformas yang dsampakan bernla tdak bak atau tdak setuju. Pelathan Sentmen Preprocessng Case Foldng Tokensas Stopword Removal Pengujan yang, ke. Daftar stopwords dsesuakan dengan kebutuhan atau kasus. Tabel 2 menunjukkan contoh proses-proses dalam pre-processng. Tabel 2. Contoh Proses-Proses dalam Pre- Processng Kalmat Pre-Processng Kalmat Tut membel sepeda d Palembang Casefoldng tut membel sepeda d Tokenzng palembang tut membel sepeda d palembang Stopwords removal tut membel sepeda palembang Pelathan menggunakan metode Support Vector Machne (SVM) Model SVM / Hasl Pelathan Klasfkas menggunakan metode Support Vector Machne Hasl Klasfkas Gambar 1. Dagram Proses Sstem Analss Sentmen Gambar 1 menggambarkan dagram proses dar sstem analss sentmen menggunakan metode Support Vector Machne. Sstem n terdr tga proses utama yatu Pre-processng, Pelathan, dan Pengujan. A. Pre-Processng Pre-processng (pemrosesan awal dokumen) merupakan tahapan yang berfungs untuk mentransformaskan dokumen ke dalam bentuk representas yang lan. Tujuan dar tahap n adalah untuk mempercepat pemrosesan terhadap dokumen, mempermudah proses pencaran query ke dalam dokumen, dan mempermudah proses pengurutan dokumen-dokumen yang terambl (retreved) (yuslan, 2010). Proses-proses yang dlakukan dalam pre-processng yatu casefoldng, stopword removal, dan tokensas. Casefoldng adalah proses penyeragaman bentuk huruf dalam sebuah dokumen, yatu menjadkan semua huruf ke dalam bentuk huruf kecl. Hanya huruf a sampa dengan z yang dterma. Karakter selan huruf danggap delmter. Tokensas adalah proses memecah kalmat menjad kumpulan kata. Pemecahan dlakukan berdasarkan spas. Stopwords removal adalah kata-kata yang muncul dalam jumlah besar dan danggap tdak memlk makna. Contoh stopwords dalam bahasa Indonesa dantaranya B. Pelathan Pelathan adalah proses yang dlakukan untuk mendapatkan pola sentmen dar setap kelas yatu kelas postf dan kelas negatf. Support Vector Machne adalah salah satu metode yang membutuhkan pelathan sebelum dlakukan proses pengklasfkasan (pengujan). C. Pengujan 4. Pengujan Pengujan dlakukan dengan menggunakan kcauan pengguna d salah satu jejarng sosal. Pengelompokan dlakukan dengan memlh topk yang ngn dkelompokkan. Jumlah kcauan yang dujkan berjumlah 300 sampel kcauan yang dujkan kepada 7 mahasswa. Hasl pengelompokan kcauan n akan dbandngkan dengan plhan responden untuk mengetahu press hasl klasfkas dengan pkran manusa untuk menentukan kcauan postf dan negatf. Respoden akan memlh benar atau salah dalam menentukan hasl dar pengujan n setelah ddapat hasl dar 7 respoden maka akan dhtung mana yang palng banyak apakah satu kcauan tersebut lebh banyak benarnya atau salahnya apabla lebh banyak benarnya maka kcauan tersebut danggap benar masuk dalam kelompoknya apabla salah maka kcauan tersebut danggap salah. Akuras sstem ddapat dengan menggunakan persamaan 5. Jumlah Klasfkas Benar Jumlah Seluruh Data Uj x 100% (5) Hasl pengujan tngkat akuras sstem memberkan hasl yang optmal, jka dhtung secara keseluruhan, hanya sektar 81 % atau sebanyak 243
kcauan yang terkelompok secara tepat dar jumlah keseluruhan kcauan sebanyak 300 kcauan. Data pembandng merupakan data yang dperoleh dar responden dengan memberkan mereka kusoner untuk ds. Persentase akuras sebesar 81% ddapatkan dar kusoner yang dlakukan kepada 7 mahasswa, dengan jumlah pengelompokan yang benar ddapatkan dar jumlah terbanyak yang sama dengan hasl pengelompokan perangkat lunak. Kusoner dlakukan dengan cara membandngkan hasl yang dkelompokan oleh perangkat lunak dengan opn seseorang terhadap kcauan tersebut. Data lath yang dgunakan pada pengujan datas sebanyak masng-masng 120 kcauan, bak untuk kcauan postf maupun kcauan negatf. Dengan 120 kcauan data lath ddapatkanlah hasl yang optmal dalam akuras sstem. Pemlhan data lath dapat mempengaruh hasl dar akuras sstem yang dbangun. Data lath yang dplh dengan bak akan menngkatkan akuras sstem. Kcauan yang danggap tepat sebaga data lath haruslah duj terlebh dahulu. Pengujan kcauan yang dgunakan dalam data lath berupa menanyakan secara langsung kepada ahl bahasa apakah kcauan tersebut tepat dkatakan postf atau negatf. Pada pengujan n juga dhtung waktu yang dbutuhkan perangkat lunak untuk memberkan revew terhadap suatu topk tersebut. Waktu yang dbutuhkan untuk menangkap satu kcauan kurang lebh 1 detk maka apabla kcauan yang ngn dambl berjumlah 300 maka waktu yang dbutuhkan adalah 300 detk atau sektar 5 ment dengan kecepatan nternet 0.82 Mbps. Kecepatan nternet mempengaruh hasl dar kecepatan proses pada perangkat lunak karena perangkat lunak bekerja secara onlne. Apabla kecepatan nternet lebh cepat maka waktu yang dbutuhkan akan cepat pula. menuls kcauan yang tdak sesua dengan tata bahasa Bahasa Indonesa yang bak. Daftar Pustaka: [1] [2] [3] Pang, B., & Lee, L. (2008). Opnon mnng and sentment analyss. Foundatons and trends n nformaton retreval, 2(1-2), 1-135. Chrstann, N., & Shawe-Taylor, J. (2000). Support vector machnes. Cambrdge, UK: Cambrdge Unversty Press, 93(443), 935-948. Aldyan Y. (2013) Analss perseps dan sentmen berta melalu komentar pada artkel berta onlne dengan pendekatan Support Vector Machne (SVM). 5. Kesmpulan Sstem analss sentmen pengguna jejarng sosal dengan menggunakan metode Support Vector Machne menghaslkan tngkat akuras sebesar 81%. Akuras sstem salah satunya dpengaruh oleh jumlah Data Lath yang dgunakan dalam proses pelathan. Kesalahan klasfkas serng terjad pada kcauan yang memlk makna ganda atau ambgu. Kcauan yang memlk makna ganda atau ambgu dapat dpandang sebaga komentar postf dan dapat pula dpandang sebaga komentar negatf oleh responden, sehngga sstem juga terkadang bsa salah klasfkas. Penngkatan akuras sstem dapat dlakukan dengan memlh data lath yang benar secara telt. Selan tu, sebaknya kcauan atau komentar para pengguna jejarng sosal dcek terlebh dahulu. Hal n dkarenakan serng kal pengguna jejarng sosal