Analisis Sentimen Menggunakan Lexicalized-Hidden Markov Model(L-HMM) Virani Kartika Satrioputri 1, Warih Maharani 2, Jondri 3 Abstrak Saat ini semakin banyak produsen yang menawarkan produknya melalui internet. Mayoritas produsen meminta pelanggan untuk memberikan review atas produk yang dibelinya. Banyaknya jumlah review membuat para calon pembeli kesulitan dalam membaca satu persatu review yang ada. Oleh sebab itu, dibangunlah sebuah sistem yang dapat melakukan suatu mining dalam review yang ada tersebut yang lebih dikenal dengan istilah opinion mining atau analisis sentimen. Hasil yang diharapkan dari sistem ini adalah mengetahui apakah suatu kalimat tersebut merupakan kalimat opini positif atau negatif. Penelitian ini lebih berorientasi pada feature-based opinion. Proses pertama yang dilakukan adalah mengekstrak fitur beserta opini yang mengikutinya, kemudian mengekstrak kalimat opini, dan menentukan orientasi opini (positif atau negatif). Metode yang digunakan dalam sistem ini adalah Lexicalized Hidden Markov Model (L-HMM) yang mengintegrasikan fitur linguistik, yaitu part-of-speech, menjadi sebuah mesin pembelajaran otomatis. Sistem ini diharapkan mampu mengenali kosakata baru yang belum muncul pada data latih, yang akan diterapkan bersama dengan teknik smoothing. Dalam memperoleh data train beserta fitur, opini dan orientasinya dalam jumlah banyak, dilakukan teknik bootstrapping. Hasil pengujian menunjukkan bahwa teknik bootstrapping dapat digunakan untuk memperkaya data latih yang digunakan. Selain itu, penggunaan L-HMM mampu mengekstraksi dengan baik fitur beserta orientasi opini dalam suatu kalimat. Kata kunci: data mining, sentiment analysis, feature-based opinion, part-of-speech, lexicalized hidden markov models (L-HMM) Abstract Currently, many manufacturers are offering their products through the internet. The majority of sellers asking customers to provide a review of the products they purchase. A large number of the reviews make the prospective buyers one by one difficulty in reading the existing reviews. Therefore, built a system that can perform the review mining is known as opinion mining or sentiment analysis. The expected result of this system was to determine whether a sentence is a sentence positive or negative opinions. This research focuses on feature-based opinion. Feature extraction is carried out with their opinions, and then extract subjective sentences, and determine the orientation of opinion (positive or negative). The method used in this system is Lexicalized Hidden Markov Model (L-HMM) that integrates linguistic features, namely part-of-speech, into an automated machine learning. The system is expected to be able to recognize new vocabulary, to be applied in conjunction with smoothing techniques. In obtaining the data train and its features, opinion and orientation in large quantities, do bootstrapping techniques. The test results show that the bootstrapping technique can be used to enrich the data train. In addition, the use of L-HMM capable of extracting good features and its orientation with subjective sentences. Keywords: data mining, sentiment analysis, feature-based opinion, part-of-speech, lexicalized hidden markov models (L-HMM) 1. Pendahuluan
a. Kumpulan Tag Kumpulan tag Definisi entitas dan contoh 2. Perancangan Sistem
b. Pre-Processing c. Lexicalized Hidden Markov Model (L- HMM)
3.1. Desain Training d. Teknik Smoothing 3.2. Proses Bootstrapping e. Post Processing 3.3. Hasil Pengujian Sistem 3. Pengujian 3.3.1. Pengaruh Proses Bootstrapping terhadap Ekstraksi Entitas Fitur dan Opini
3.3.2. Pengaruh Smoothing L-HMM terhadap Ekstraksi Entitas Fitur dan Opini 3.3.3. Pengaruh koefisien interpolasi pada Teknik Smoothing L-HMM
Acknowledgements Daftar Pustaka 4. Kesimpulan