KLASIFIKASI SMS PADA SISTEM SUPPORT TICKET PENGADUAN PELANGGAN DENGAN MENGGUNAKAN METODE NAÏVE BAYES
|
|
- Iwan Ridwan Widjaja
- 7 tahun lalu
- Tontonan:
Transkripsi
1 KLASIFIKASI SMS PADA SISTEM SUPPORT TICKET PENGADUAN PELANGGAN DENGAN MENGGUNAKAN METODE NAÏVE BAYES Rizki Adipratama 1, Rully A Hendrawan 2, Renny P Kusumawardani 3 1,2,3 Jurusan Sistem Informasi, Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember (ITS) Surabaya, 60111, Indonesia Telp: (031) , Fax : (031) rizki.adipratama@gmail.com 1, eraha_id@yahoo.com 2, renny.pradina@gmail.com 3 Abstrak Salah satu teknologi telekomunikasi yang populer adalah SMS (Short Message Service).. Salah satu alternatif pemanfaatan SMS adalah untuk pengaduan pelanggan. Dengan adanya fasilitas tersebut, diharapkan pelanggan bisa menyampaikan keluhan, pertanyaan, dan saran untuk perusahaan Untuk memberikan layanan yang lebih baik kepada pelanggan, dalam pengerjaan tugas akhir ini akan dibuat aplikasi layanan berbasis ticketing. Setiap pengaduan yang masuk akan diberi nomor yang unik yang biasa dikenal dengan tiket sebagai identitas, dan dapat digunakan untuk menelusuri tindak lanjut dan kemajuan pengaduan. Pengaduan dikirim oleh pelanggan melalui media SMS ke pihak SMS center PT PLN Persero Wilayah Sulsel, Sultra dan Sulbar yang selanjutnya disingkat menjadi sultanbatara. Pengaduan yang masuk diklasifikasikan berdasarkan jenis pengaduan, dan dikirimkan ke divisi terkait oleh pihak SMS center secara manual, sehingga cenderung lambat, dan sering kali terabaikan. Dengan memanfaatkan teknologi internet dan mobile phone, pengaduan pelanggan akan diolah dan diklasifikasikan secara otomatis berdasarkan label jenis pengaduan dan akan dikirimkan ke divisi terkait di PT PLN Persero Wilayah Sultanbatara dengan menggunakan algoritma Naive Bayes classifier yang didukung dengan fasilitas SMS Gateway. Hasil penelitian dilakukan oleh penulis yaitu pengklasifikasian dokumen SMS dengan menggunakan Naïve Bayes classifier, dan menggunakan metode pengolahan tambahan, yaitu feature weighting, dan String Matching menggunakan Levenhstein Distance, menghasilkan rata- rata akurasi yang tinggi, yaitu recall 94%, precision 90% dan f-measure 93,61%.. Key Words: penggalian opini, ekstraksi fitur review, association rule mining, NLP 1. Pendahuluan SMS pengaduan pelanggan, dibuat oleh PT PLN Persero Wilayah Sultanbatara supaya para pelanggan dari PLN bisa mengadukan keluhan dan gangguan yang diterima selama mendapatkan pelayanan dari PT PLN Persero Wilayah Sultanbatara. Pelanggan bisa menyampaikan pengaduan dengan bebas, tanpa format penulisan yang baku, kemudian mengirimkan ke pihak SMS center PT PLN Persero Wilayah Sultanbatara. Pada penelitian ini penulis menggunakan sistem ticketing untuk menangani pengaduan tersebut. Didalam sistem ticketing setiap pengaduan yang masuk akan diberi nomor yang unik yang biasa dikenal dengan tiket sebagai identitas, dan dapat digunakan untuk menelusuri tindak lanjut dan kemajuan pengaduan Permasalahan yang dialami oleh pihak SMS center adalah, Mereka merasa kesulitan jika harus memeriksa dan mengelola SMS dalam jumlah besar, dan format yang tidak terstandarisasi. Hal ini disebabkan oleh kurangnya ketelitian dari manusia, atau yang biasa disebut sebagai human error. Pemeriksaan sms tersebut bisa menjadi bahan analysis yang menentukan keputusan yang akan diambil oleh PT PLN Persero Wilayah Sultanbatara. Ada sebuah cara yang cukup membantu untuk mengklasifikasikan SMS tanpa memerlukan pembacaan satu persatu oleh manusia. Dalam penelitian ini digunakan teorema Naïve Bayes. Teorema Naïve Bayes yang digunakan dalam pengerjaan aplikasi ini, memecah SMS menjadi beberapa kata, kemudian mendapatkan informasi dari kata tersebut, sehingga dapat diklasifikasikan jenis dari SMS tersebut. PT PLN Persero Wilayah Sultanbatara telah menetapkan aturan-aturan tertentu dalam pengklasifikasian pengaduan pelanggan. Pengklasifikasian pengaduan pelanggan dibedakan menjadi dua jenis, yaitu:klasifikasi SMS berdasarkan kategori, dan klasifikasi SMS berdasarkan departemen. Pengaduan pelanggan diklasifikasikan menjadi tiga kategori, yaitu: keluhan, saran, dan pertanyaan. Selain itu pengaduan dibagi menjadi empat departemen, yaitu: niaga, cater, APP, niaga
2 2. Data Preprocessing Perlakuan proses sebelum klasifikasi menjadi sangat penting supaya data yang akan diolah benar-benar mewakili maksud dari dokumen yang ditulis maka kita akan melakukan preprocessing terhadap data yang kita dapatkan dari PT PLN Wilayah Sultanbatara. Pengolahan data ini dilakukan untuk membuat data mentah, menjadi data yang siap untuk diolah ke dalam aplikasi.proses preprocessing pertama yang akan dilakukan adalah Case folding, case folding adalah mengubah semua huruf dalam dokumen menjadi huruf kecil. Hanya huruf a sampai dengan z yang diterima. Karakter selain huruf dihilangkan dan dianggap delimiter. Tahap selanjutnya adalah Tokenizing, tokenizing adalah tahap pemotongan string input berdasarkan tiap kata yang menyusunnya. Tahap berikutnya adalah Filtering, filtering adalah penyaringan kata hasil dari proses tokenizing. Proses ini menggunakan pendekatan Stopword removal, dan Wordlist. Stopwords removal adalah sebuah proses untuk menghilangkan kata yang tidak relevan pada hasil parsing sebuah dokumen teks dengan cara membandingkannya dengan Stoplist yang ada, sedangkan wordlist adalah sekumpulan kata penting yang sering muncul di dalam dokumen. Case folding Tokenizing Filtering Gambar 1 Tahapan data preprocessing 3. Pembuatan metode klasifikasi Stopword removal Pada tahap ini dilakukan pembuatan metode klasifikasi terhadap data SMS pengaduan pelanggan dengan menggunakan algoritma naive bayes. Data yang digunakan dalam proses ini adalah data output dari tahap preprocessing. Metode ini terbagi menjadi dua tahap,yaitu tahap pengklasifikasian berdasarkan kategori dan tahap pengklasifikasian berdasarkan departemen 3.1 Klasifikasi Naive Bayes untuk SMS Pada Naïve Bayes Classifier, setiap sms direpresentasikan dalam pasangan atribut <a1,a2. an di mana a1 adalah kata pertama, a2 kata kedua dan seterusnya. Sedangkan V adalah himpunan kategori unit wilayah yang terdapat pada PT PLN Persero Wilayah Sultanbatara.P(vj) dan probabilitas kata ai untuk setiap kategori P(ai vj ) dihitung pada saat pelatihan. (2.1) (2.2) pendekatan Bayes akan menghasilkan label kategori yang paling tinggi probabilitasnya (vmap) (2.3) Kategori :Banyaknya jumlah kategori dalam pelatihan. ak :jumlah kemunculan kata ak pada kategori vj n :jumlah semua kata pada kategori vj kosakata :jumlah kata yang unik (distinc) pada semua data latihan. V MAP : Kategori yang paling tinggi probabilitasnya 3.2 Proses Training Proses Training dilakukan untuk memperoleh nilai-nilai probabalistik, yaitu P(vj)dan P(ak vj), dimana P(ak vj) merupakan probabilitas kemunculan kata ak di dalam kategori vj. Pertama program membuka setiap dokumen, kemudian akan mengambil kata-kata dari setiap dokumen dan menyimpan ke dalam array.program akan melakukan data preprocessing. Setelah pembacaan dokumen dalam 1 kategori telah dilakukan, maka program akan melakukan penyimpanan ke dalam database. Jika telah dilakukan pembacaan dan pendataan, maka program akan menghitung probabilitas setiap kata dalam semua kategori, menggunakan persamaan 2.2. Perhitungan probabilitas kata-kata yang ditemukan kemudian dimasukkan ke dalam database. 3.3 Proses Testing Pada saat proses testing program membaca data SMS, kemudian diambil kata-kata yang terdapat dalam data testing tersebut, kemudian akan menyimpan kata tersebut kedalam array. Selanjutnya program akan melakukan data preprocessing. Setelah melalui tahap preprocessing maka kata-kata tersebut akan dimasukkan kedalam database. Kemudian akan dihitung frekuensi kemunculan kata tersebut pada dokumen SMS, frekuensi setiap kata dijadikan pangkat untuk probabilitas yang diambil dari data training. Jika kata dalam data testing tidak ditemukan dalam vocabulary kategori manapun, maka dilakukan perhitungan menggunakan persamaan 2.2. Jika kata tersebut ditemukan di salah satu kategori saja, maka
3 probabilitas dalam kategori tersebut akan digunakan dalam perhitungan. Setelah mengetahui hasil pangkat setiap probabilitas kata dalam setiap kategori target, kemudian probabilitas tersebut dikalikan untuk semua probabilitas setiap kategori. Hasil perkalian tersebut, kemudian dikalikan dengan probabilitas kategori. Nilai akhir atau V MAP yang paling besar menunjukkan kategori dari dokumen tersebut. 4. Metode pengolahan tambahan Didalam pengerjaan tugas akhir ini,dilakukan beberapa percobaan metode pengolahan tambahan, yang diharapkan bisa mengoptimalkan hasil dari klasifikasi, beberapa metode pengolahan tambahan yang dipkai adalah: feature & feature weighting, one against all, stemmer berbahasa Indonesia dan String matching menggunakan Levenhstein distance. 4.1 Feature & feature weighting Pada tahapan feature ini ditentukan feature atau kata mana yang akan digunakan untuk merepresentasikan dokumen sehingga dapat mendeskripsikan isi dokumen dan membedakan dokumen tersebut dari dokumen lain di dalam koleksi. Feature weighting dilakukan dengan menghitung frekuensi kemunculan term dalam dokumen karena dipercaya bahwa frekuensi kemunculan term merupakan petunjuk sejauh mana term tersebut mewakili isi dokumen. Percobaan yang dilakukan adalah,pertama kita akan merekap kata atau feature apa saja yang sering muncul di tiap kategori kedalam daftar cue word, disini kata yang bisa masuk daftar adalah, kata-kata yang memiliki kemunculan lebih dari tiga kali, dan kata tersebut tidak termasuk didalam Stoplist. Jika saat testing ditemukan kata-kata yang ada di dalam cue word, maka frekwensi dari kata tersebut akan dikalikan dua. Di dalam gambar 3.4 akan dijelaskan proses training, dari klasifikasi naïve bayes yang mengalami feature, dan feature weighting. 4.2 One against all Tujuan dari metode ini adalah agar metode pembelajaran yang dirancang untuk permasalahan biner, bisa menyelesaikan permasalahan multi class. Selain itu ada anggapan bahwa klasifikasi biner dapat meningkatkan kinerja klasifikasi multi class. Ada beberapa alas an mengapa pendekatan tersebut dapat bekerja. Pertama masalah biner biasanya kurang kompleks, dan memiliki batas keputusan sederhana. Alasan selanjutnya adalah untuk Naive Bayes pada khususnya, yang dikenal memberikan prediksi yang bagus, namun mempunya nilai probabilitas yang tidak terkalibrasi, kelas biner sangat penting karena sebagian besar teknik kalibrasi bekerja di dalam permasalahan dua kelas.percobaan yang dilakukan pada metode klasifikasi ini adalah, membagi semua kategori training, menjadi dua yaitu, kategori x, dan bukan x, Kata-kata yang ada di dalam kategori bukan x berisi semua data training, kecuali kategori x. Hal ini dilakukan terhadap semua kategori training. 4.3 Stemming Stemming adalah salah satu cara yang digunakan untuk meningkatkan performa sebuah sistem pengklasifikasian, dengan cara mentransformasi kata-kata dalam sebuah dokumen teks ke bentuk kata dasarnya. Tidak banyak algoritma yang dikhususkan untuk stemming bahasa Indonesia dengan berbagai keterbatasan didalamnya. Algoritma Nazief & Adriani salah satunya, Algoritma ini membutuhkan waktu yang lebih lama dibandingkan dengan stemming menggunakan Algoritmaporter, namun proses stemming menggunakan Algoritma Porter memiliki prosentase keakuratan (presisi) lebih kecil dibandingkan dengan stemming menggunakan Algoritma Nazief & Adriani. Algoritma Nazief & Adriani sebagai algoritma stemming untuk teks berbahasa Indonesia yang memiliki kemampuan prosentase keakuratan (presisi) lebih baik dari algoritma lainnya. Algoritma ini sangat dibutuhkan dan menentukan dalam proses pengklasifikasian dalam dokumen Indonesia. 4.4 Levenhstein distance Jarak d(si, s2) didefinisikan sebagai sebuah kombinasi operasi penjumlahan dari penambahan sebuah huruf, penghilangan sebuah huruf, penggantian sebuah huruf atau penukaran sebuah huruf dari huruf lainnya dalam satu lokasi. Itu memungkinkan beberapa kombinasi yang dapat mentransformasikan string s1 ke s2, tapi panjang terpendek urutan adalah jarak antara dua strings. Metode pembandingan yang digunakan dalam memeriksa ejaan dengan menggunakan Table Look-up. Metode ini membandingkan kata yang sedang diuji terhadap kata dalam data training. Jika kata tersebut ada di dalam data training, dan sama persis,atau dengan kata lain d = 0, maka kata tersebut tidak perlu diubah. Jika tidak ada di dalam data training maka kata tersebut dianggap salah. Ketidaksesuaian dari string dapat dibandingkan dengan kata pada data training yang secara langsung menggunakan penyesuaian karakter demi karakter secara iteratif, dengan menentukan jumlah minimum jarak d. Dalam penelitian ini, dientukan bahwa jarak Levenhstein minimal untuk melakukan proses transformasi adalah 1. Sedangkan batasan kata tersebut ditransformasi adalah 8, jadi jika sebuah kata setelah dibandingkan dengan kata yang terdapat di dalam data training, dan kata tersebut memiliki jarak levenhstein diatas 8, maka kata tersebut dianggap kata baru, dan kata tersebut tidak perlu ditransformasi.
4 5. Pembuatan sistem Ticketing Dengan menggunakan ticketing sistem yang tersedia,akan dibuat sebuah sistem ticketing.dalam pengerjaan tugas akhir ini Sistem ticketing bertujuan untuk mempermudah penanganan dan pengaturan pengaduan pelanggan.sistem ticketing yang akan dibuat adalah sistem yang dapat mengklasifikasikan pengaduan pelanggan melalui SMS secara otomatis, dengan menerapkan naive bayes classifier. Adapun desain sistem bisa dilihat di gambar 2. Gambar 2 menunjukkan bagaimana sistem ticketing bekerja, awalnya pelanggan mengirim SMS ke PT PLN Persero Wilayah Sultanbatara. SMS pelanggan berupa teks yang tidak tentu formatnya, dan kemungkinan isi SMS tersebut bisa bermacam-macam mulai dari keluhan, saran sampai pertanyaan yang berkaitan dengan PT PLN Persero Wilayah Sultanbatara. SMS pelanggan tersebut langsung diterima oleh GSM modem yang kemudian diproses oleh sistem untuk dilakukan klasifikasi. Pengaduan pelanggan yang masuk akan dianggap sebagai sebuah tiket.tiket tersebut diklasifikasikan menjadi tiga berdasarkan kategorinya, yaitu keluhan, saran, dan pertanyaan. Dalam pengklasifikasian tersebut, sistem menerapkan naive bayes classifier. Selanjutnya, tiket yang telah diklasifikasikan kategorinya akan diberi label oleh sistem. Pengaduan pelanggan tersebut perlu diklasifikasi lagi oleh sistem untuk menentukan departemen yang dituju. Sistem akan menggunakan naive bayes classifier dalam melakukan proses pengklasifikasian pengaduan pelanggan. Setelah melalui proses klasifikasi maka Sistem akan memberi label departemen, dimana tiket tersebut akan dikirim. Pada tahap ini, status tiket adalah incoming. Sebelum tiket tersebut akan dikirm ke departemen yang dituju, maka pihak SMS Center akan memverikasi kembali kebenaran informasi dari tiket tersebut. Setelah tiket diverivikasi, maka tiket tersebut akan dibuka. Tiket tersebut berstatus open. Setelah Tiket tersampaikan ke departemen yang tepat, dan pengaduan telah terselesaikan dengan baik, maka tiket tersebut akan ditutup, dan berstatus close, maka informasi yang di dapat dari tiket tersebut akan masuk ke dalam data training. Sehingga akan menambah pengetahuan dari sistem, untuk mengenali kata-kata yang baru. 6. Uji performa Gambar 2 Sistem ticketing Dalam penelitian ini,untuk mengukur performa dari sistem klasifikasi yang dibuat, digunakan tiga pengujian, yaitu: Uji akurasi, precision & recall dan f-measure. Terdapat 4 kategori, yaitu APP, Cater, Distribusi, Niaga. Jumlah data training adalah 160.Sedangkan data testing yang telah dipersiapkan adalah sebanyak 30 dokumen.setiap dokumen training dan testing melewati proses text preprocessing terlebih dahulu, yaitu case folding,tokenizing,filtering,dan stopwords removal. Setelah melewati proses text preprocessing, terbentuk 1218 kata yang unik. Uji akurasi dilakukan untuk membuktikan keakuratan algoritma naïve bayes dalam pengklasifikasian pengaduan pelanggan. Rancangan pengujian sistem klasifikasi akan difokuskan terhadap beberapa pilihan metode yang diambil,beberapa pilihan metode yang akan dianalisis yaitu: NB-1: Pengujian dilakukan dengan menggunakan metode naïve bayes NB-2: Pengujian dilakukan dengan menggunakan metode naïve bayes,dengan adanya feature selection. tambahan adanya list kata-kata penting (cue word).jika didalam dokumen tersebut ada kata-kata yang ada di dalam list kata-kata penting,maka frekwensi dari kata tersebut akan dikalikan 2. NB-3: Pengujian dilakukan dengan menggunakan metode naïve bayes dengan kategori dari data training hanya 2,yaitu kategori x,dan bukan x.contoh, kategori APP dan bukan APP. Warna biru adalah kategori x, sedangkan warna merah adalah kategori bukan x. NB-4:Pengujian dilakukan dengan menggunakan stemming bahasa Indonesia NB-5:Pengujian dilakukan dengan menggunakan metode String matching, yaitu Levenhstein distance. Ditambah dengan adanya feature selection Pada tabel 1, dan tabel 2 akan disajikan hasil uji akurasi dengan dokumen pengujian yang telah diklasifikasikan sebelumnya baik kategori, maupun kategori departemennya.
5 Tabel 1 hasil uji akurasi menurut departemen Tabel 3 nilai recall & precision berdasarkan departemen Tabel 4.nilai recall & precision berdasarkan kategori Tabel 2 hasil uji akurasi menurut kategori Berdasarkan hasil pengujian yang ada di tabel 1 dan 2, dapat dilihat metode yang menghasilkan akurasi paling tinggi adalah metode NB-3. Namun metode NB-3 hanya bisa mengklasifikasikan dokumen kategori yang bukan x dengan tepat,namun sulit untuk mengklasifikasikan dokumen dengan kategori x. Lalu pada metode NB-2 berupa metode tanpa stemming, dibandingkan dengan metode NB-4 yang menggunakan stemming bahasa Indonesia, mempunyai hasil akurasi yang sama, hal ini membuktikan bahwa stemming berbahasa Indonesia belum bisa bekerja efektif terhadap dokumen SMS yang berformat singkatan yang tidak beraturan. Pada kedua pengujian Pada kedua table terlihat bahwa Metode NB-5 memiliki hasil akurasi paling tinggi.metode NB-5 juga memiliki tingkat kesalahan paling kecil dibandingkan metode lainnya. Pengujian dokumen sesuai dengan kategori, memiliki tingkat akurasi lebih rendah daripada pengujian dokumen sesuai departemen. Hal ini dikarenakan banyak kesamaan kata-kata unik di dalam data training kategori keluhan, dan pertanyaan. Contohnya adalah kata kenapa, kata ini banyak terdapat di dalam kategori keluhan, dan saran dengan jumlah yang hampir sama. Semakin unik dan semakin akurat data training yang digunakan, maka hasil pengklasifikasian akan semakin akurat (Krisma, 2008). Karena adanya duplikasi kata unik yang terdapat di dua kategori tersebut, maka hal ini akan menurunkan tingkat akurasi dari hasil klasifikasi. 6.1 Perhitungan recall & precision berdasarkan departemen Metode NB-1, Meskipun menggunakan metode naïve bayes murni, tanpa mengunakan metode pengolahan tambahan apapun,mendapatkan nilai recall yang paling tinggi di departemen APP, yaitu sebesar 67%. Hal ini disebabkan oleh dokumen testing yang sedikit, yaitu sebanyak 3 buah, dan sistem menebak benar sebanyak 2 kali, hal ini menyebabkan nilai recall menjadi tinggi. Namun selain departemen APP, metode NB-1 memiliki nilai recall dan precision paling kecil dibanding metode lain. Departemen cater memiliki nilai 0% baik itu nilai recall maupun precision-nya. Hal ini disebabkan karena tidak satupun dokumen pengujian yang berlabel departemen cater yang bisa ditebak dengan benar oleh sistem, di metode manapun. Metode NB-4 memiliki ratarata nilai recall dan precision paling tinggi di department distribusi, dan niaga dibandingkan dengan metode lain, namun di departemen APP metode ini tidak bisa menebak satupun dokumen testing dengan benar. Hal ini membuktikan bahwa proses stemming yang dilakukan terhadap dokumen testing, tidak efektif. Sebuah metode dikatakan baik, jika diapat menghasilkan nilai precision diatas 60%. Selain itu hasil yang diperoleh memuaskan jika nilai precision tinggi walaupun recall rendah (Rowley & Hartley, 1992). Pada metode NB-2, meskipun memiliki nilai recall dan precision dibawah metode NB-5, tetapi NB-2 memilki nilai precision di atas 60% di semua departemen, kecuali departemen cater. Selain itu pada departemen APP didapatkan nilai precision yang tinggi meskipun dengan nilai recall yang rendah. Jadi berdasarkan pengujian recall and precision, metode yang paling baik adalah metode NB-2.
6 6.2 Perhitungan recall & precision berdasarkan kategori Perolehan rata-rata nilai recall dan precision yang didapat dari pengujian berdasarkan kategori SMS lebih kecil dari pengujian berdasarkan departemen. Hal ini disebabkan oleh duplikasi kata-kata unik di antara dua kategori, yaitu kategori keluhan dan kategori pertanyaan. Kategori saran memiliki nilai 0 % baik itu nilai recall maupun precisionnya. Hal ini disebabkan karena tidak satu pun dokumen pengujian yang berlabel kategori saran yang bisa ditebak dengan benar oleh sistem di metode manapun. Selain itu hal tersebut disebabkan kurangnya jumlah data yang berlabel kategori saran, baik di dalam data testing maupun data training. Rata-rata perolehan precision kategori pertanyaan memiliki nilai kurang dari 60 %, kecuali metode NB-5. Metode NB-5 memiliki nilai precision pertanyaan paling bagus yaitu, 60%. Selain itu, nilai precision kategori keluhan juga bernilai diatas 60 %, yaitu 75 %. Meskipun nilai precision kategori keluhan berada di bawah metode NB-2, dan NB-4, namun nilai precision kategori pertanyaan kedua kategori tersebut kurang dari 60%. Jadi berdasarkan pengujian recall and precision, ditemukan metode yang paling baik adalah metode NB-5. Tabel 5 hasil f-measure klasifikasi berdasarkan departemen ini dikarenakan adanya penurunan nilai di departemen niaga, bahkan mendapatkan nilai 0% di departemen cater dan APP. Metode NB-4 yang menerapkan metode stemming, juga terbukti kurang efektif, hal ini terbukti karena adanya penurunan di kategori niaga, dan nilai f- measure untuk kategori APP dan cater adalah 0%. Metode NB-5 dirasa metode klasifikasi paling baik, karena mendapatkan nilai f-measure yang tinggi, dan cukup stabil di kategori distribusi dan niaga, dengan nilai f- measure diatas 90%, meskipun dengan nilai f-measure yang kecil di departemen APP. 6.4 Penghitungan f-measure klasifikasi berdasarkan kategori Sesuai dengan hasil pengujian yang disajikan tabel diatas, terbukti bahwa metode NB-2, atau penambahan metode feature selection dan feature weighting bisa meningkatkan nilai f-measure. Nilai f-measure di kategori pertanyaan meningkat sebesar 20%, sedangkan nilai f-measure di kategori keluhan meningkat sebesar 12,4%. Metode NB-4 yang menerapkan metode stemming, juga terbukti kurang efektif, hal ini terbukti karena adanya penurunan di kategori pertanyaan sebesar 9.9%. Nilai F-measure tertinggi untuk kategori keluhan terdapat pada metode NB-5, dengan nilai 79,68%. Sedangkan nilai f-measure tertinggi untuk kategori pertanyaan terdapat pada metode NB-2, dengan nilai 57,02%. 7. Kesimpulan Tabel 6 hasil f-measure klasifikasi berdasarkan kategori 6.3 Penghitungan f-measure klasifikasi berdasarkan departemen Sesuai dengan hasil pengujian yang ada di tabel 5, terbukti bahwa penambahan metode feature weighting bisa meningkatkan nilai f-measure, kecuali departemen APP, mengalami sedikit penuruna sebesar 7,64%. Metode NB-3 yang menerapkan metode one-against all terbukti kurang efektif untuk meningkatkan hasil f-measure, hal Setelah melakukan perancangan sistem dan pembuatan aplikasi klasifikasi SMS berbasis sistem ticketing dengan menggunakan metode naïve bayes, maka dapat diambil kesimpulan sebagai berikut : Pengklasifikasian naive bayes dengan menggunakan metode pengolahan tambahan, yaitu feature weighting, feature selection, stemming, one against all dan String Matching terbukti lebih baik daripada pengklasifikasian naive bayes murni. Hal ini terbukti dengan nilai f-measure metode NB-1 yang memperoleh nilai terendah dibandingkan dengan metode lain. Stemming berbahasa Indonesia (NB-4) dinilai kurang efektif, ketika diterapkan dalam dokumen SMS. Hal ini terbukti dari tidak terdapat perubahan nilai akurasi dari metode NB-2. bahkan terjadi penurunan nilai f-measure. Metode one against all (NB-3) dinilai kurang efektif ketika diterapkan dalam klasifikasi naive bayes yang memiliki lebih dari dua kelas, hal ini terjadi karena ketidakseimbangan hasil akurasi yang diperoleh oleh metode ini. Dari hasil akurasi terlihat bahwa hasil yang didapat kategori bukan x mendapat nilai
7 akurasi yang tinggi, namun kategori x mendapatkan nilai yang kecil, bahkan mencapai 0%. Dari hasil ini terbukti bahwa metode ini hanya bisa mengklasifikasikan dokumen kategori yang bukan x dengan tepat,namun sulit untuk mengklasifikasikan dokumen dengan kategori x. Metode NB-2, yang menggunakan feature weighting dan feature selection dinilai efektif ketika diterapkan untuk mengklasifikasikan dokumen SMS sesuai dengan departemen, hal ini terbukti dengan nilai precision yang mendapatkan nilai diatas 60%. Metode NB-5, yang menggunakan feature weighting dan feature selection, ditambah dengan metode string matching dengan menggunakan levenshtein distance, dinilai efektif ketika diterapkan untuk mengklasifikasikan dokumen SMS sesuai dengan kategori, hal ini terbukti dengan nilai precision yang mendapatkan nilai diatas 60%. Jumlah minimum data training yang dibutuhkan supaya hasil f-measure suatu kategori mendapatkan nilai lebih dari 0% adalah kurang lebih 60 dokumen sms, dan mengandung 120 kata unik. Nilai ini didapat dari rata-rata jumlah dokumen, dan kata unik yang terdapat di kategori departemen niaga dan distribusi, yang selalu mendapatkan nilai f-measure diatas 0% 8. Saran Saran yang dapat dipertimbangkan untuk pengembangan tugas akhir ini adalah: Penambahan antarmuka untuk memudahkan pengguna agar dapat menambah kategori atau departemen baru. Penambahan kategori bukan pengaduan, untuk mempermudah pihak SMS center dalam memvalidasi SMS pengaduan yang masuk. Pengefektifan sistem, update autotraining hanya dilakukan terhadap departemen atau kategori tempat dimana data ticket ditambahkan. Penggunaan struktur data trie untuk mempercepat waktu komputasi levenhstein. Trie adalah struktur data berupa pohon terurut untuk menyimpan suatu himpunan string dimana setiap node pada pohon tersebut mengandung awalan (prefix) yang sama. Jadi tidak perlu untuk mengulang proses pada baris levenhstein dengan awalan yang sama. 9. Daftar Pustaka Coussement, K., & Poel, D. V. (2007). Improving customer complaint management by automatic . sciencedirect. Han, J., & Kamber, M. (2006). Data Mining:concepts and technique. I.Destuardi, & Sumpeno, S. (2009). Klasifikasi Emosi untukteks Bahasa Indonesia Menggunakan Metode Naive Bayes. 3. Jian Sheu, j. (2008). An Efficient Two-phase Spam Filtering Method. Science Direct. Lu, S.-H., Chiang, D.-A., Keh, H.-C., & Huang, H.- H. (2009). Chinese text classification by the Naïve Bayes Classifier and the associative. sciencedirect. Luis, S., Pedro, C., & Paulo, S. (1998). NetTrouble: A TTS for Network Management. CiteSeer. M.Mitchell, T. (1997). Machine learning. MCGrawhill. Medem, A., Ismael, M., & Teixeira, R. (2006). TroubleMiner: Mining network trouble tickets. citeseer. Miller, T. (2005). Data and Text mining A business application Approach. new jersey: prentice hall. Rijsbergen, C. V. (1979). Information Retrieval. Glasgow: Information Retrieval Group, University of Glasgow. schutze, H. (2008). Information Retrieval and Text Mining. Cambridge university press. Sentosa, B. (2007). Data mining:teknik pemanfaatan Data untuk Keperluan Bisnis. Yogyakarta: Graha Ilmu. tan, p. n., steinbach, m., & kumar, v. (2006). Introduction to data mining. pearson addison weasley. Triawati, C. (2009). Metode Pembobotan Statistical Concept Based untuk Klastering dan Kategorisasi Dokumen Berbahasa Indonesia.
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciBAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
Lebih terperinciNur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
Lebih terperinciText Pre-Processing. M. Ali Fauzi
Text Pre-Processing M. Ali Fauzi Latar Belakang Latar Belakang Dokumen-dokumen yang ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.
Lebih terperinciKLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO
F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan
Lebih terperinciAnalisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk
Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma
Lebih terperincidimana P(A B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan 2.1 didapatkan persamaan 2.2.
1.1 Naive Bayes Classifier Naive bayes classifier merupakan salah satu metode machine learning yang dapat digunakan untuk klasifikasi suatu dokumen. Teorema bayes berawal dari persamaan 2.1, yaitu: (2.1)
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua
BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciBAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciProsiding SENTIA 2015 Politeknik Negeri Malang Volume 7 ISSN:
KLASIFIKASI TUGAS AKHIR UNTUK MENENTUKAN DOSEN PEMBIMBING MENGGUNAKAN NAÏVE BAYES CLASSIFIER (NBC) Putri Elfa Mas`udia 1 Politeknik Negeri Malang E-mail : putri.elfa@polinema.ac.id Abstrak Pemilihan dosen
Lebih terperinciStemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Lebih terperinciGambar 1.1 Proses Text Mining [7]
1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat
Lebih terperinciKLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER
1 KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER Amalia Anjani A. 1, Arif Djunaidy 2, Renny P. Kusumawardani 3 Jurusan Sistem Informasi,
Lebih terperinciBandung, Indonesia Bandung, Indonesia
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciBAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah
BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu
Lebih terperinciBAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Lebih terperinciKlasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram
Jurnal Ilmiah Teknologi dan Informasia ASIA (JITIKA) Vol.10, No.1, Februari 2016 ISSN: 0852-730X Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram Denny Nathaniel
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Weblog, atau yang sering disebut sebagai Blog, merupakan bagian tak terpisahkan dalam perkembangan dunia teknologi informasi berbasis Web. Berbagai jenis informasi
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciJurnal Politeknik Caltex Riau
1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id IMPLEMENTASI TEXT MINING DALAM KLASIFIKASI JUDUL BUKU PERPUSTAKAAN MENGGUNAKAN METODE NAIVE BAYES Siti Amelia Apriyanti 1), Kartina Diah Kesuma Wardhani
Lebih terperinciOleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak
TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media
Lebih terperinciUKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN
BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam
Lebih terperinciPERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak
ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama
Lebih terperinciBAB II TINJAUAN PUSTAKA
digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa
Lebih terperinciPEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :
PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1. Brand Berdasarkan American Marketing Association, brand didefinisikan sebagai nama, istilah, desain, simbol atau ciri lain yang dapat mengidentifikasi produk atau jasa penjual
Lebih terperinciBAB III METODOLOGI PENELITIAN
28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian
Lebih terperinciBAB III ANALISA DAN PERANCANGAN SISTEM
3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal
Lebih terperinciUKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah
1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja
Lebih terperinciJurnal Informatika Mulawarman Vol. 10 No. 1 Februari
Jurnal Informatika Mulawarman Vol. 10 No. 1 Februari 2015 1 KLASIFIKASI DAN PENCARIAN BUKU REFERENSI AKADEMIK MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC) (STUDI KASUS: PERPUSTAKAAN DAERAH PROVINSI
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review
Lebih terperinciPengklasifikasian Pengaduan Masyarakat pada Laman Kantor Pertanahan Kota Surabaya I dengan Metode Pohon Keputusan
Pengklasifikasian Pengaduan Masyarakat pada Laman Kantor Pertanahan Kota Surabaya I dengan Metode Pohon Keputusan Penyusun Tugas Akhir : Yulia Sulistyaningsih 5208 100 113 Dosen Pembimbing : Prof. Ir.
Lebih terperinciImplementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier
Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier Wachid Daga Suryono 1, Ristu Saptono 2, Wiranto 3 Program Studi Informatika, Fakultas Matematika dan
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan
Lebih terperinciBAB I PENDAHULUAN.
BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciJURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER
JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER Oleh: AGUNG PRAMONO PUTRO 12.1.03.03.0276 Dibimbing oleh : 1. NURSALIM, S.Pd,. MH 2. ARIE NUGROHO, S.Kom.,
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang
9 BAB 1 PENDAHULUAN Latar Belakang Short Message Service (SMS) merupakan salah satu media komunikasi yang banyak digunakan saat ini karena praktis untuk digunakan dan biaya pengirimannya murah. Namun,
Lebih terperinciPENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA
PENERAPAN VECTOR SPACE MODEL UNTUK PERINGKASAN KOMENTAR ANGKET MAHASISWA Suprianto 1), Sunardi 2), Abdul Fadlil 3) 1 Sistem Informasi STMIK PPKIA Tarakanita Rahmawati 2,3 Magister Teknik Informatika Universitas
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap
Lebih terperinciBAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine
BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan
Lebih terperinciBAB I PENDAHULUAN I - 1
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dunia pendidikan merupakan dunia yang memerlukan perhatian khusus karena pendidikan merupakan faktor yang sangat mempengaruhi kualitas para calon penerus bangsa
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN Bab ini berisikan tentang alasan peneliti mengambil permasalahan ini. Pada bab ini poin-poin yang akan dipaparkan antara lain Latar Belakang, Perumusan Masalah, Batasan Masalah, Tujuan
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Sistem Analisis sistem bertujuan untuk mengidentifikasi permasalahanpermasalahan yang ada pada sistem yang meliputi perangkat lunak (software), pengguna
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan
Lebih terperinciHERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.
HERU SUSANTO 2209 105 030 Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. LATAR BELAKANG Peran media jejaring sosial pada perkembangan teknologi komunikasi dan informasi;
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI Pada bab ini berisi tentang data dan informasi yang berkaitan dengan pokok permasalahan yang akan diuji, yaitu dengan mendalami tentang klasifikasi teks. Selain itu juga membahas
Lebih terperinciBAB III METODE PENELITIAN
BAB III BAB 3 METODE PENELITIAN 3.1. Tahap pengumpulan data Data awal dalam penelitian ini adalah dokumen berupa artikel teks berita online dalam bahasa Indonesia yang dikumpulkan secara acak dari portal
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education
Lebih terperinciIMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir
IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah
Lebih terperinciSMS Filtering Menggunakan Naive Bayes Classifier dan FP-Growth Algorithm Frequent Itemset
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6124 SMS Filtering Menggunakan Naive Bayes Classifier dan FP-Growth Algorithm Frequent Itemset Dea Delvia Arifin 1, Shaufiah,
Lebih terperinciAkurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa
Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :
Lebih terperinciBAB V EKSPERIMEN TEXT CLASSIFICATION
BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan
Lebih terperinciBAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada sekarang ini ketersediaan informasi berbentuk dokumen teks sebagian besar sudah berbentuk elektronik (softcopy). Kemungkinan penyimpanan media teks ke
Lebih terperinciKATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP
KATA PENGANTAR Syukur Alhamdulillah, puji dan syukur kami panjatkan kehadirat Allah SWT, karena dengan limpah dan rahmat dan karunia-nya penulis dapat menyelesaikan penyusunan laporan tugas akhir APLIKASI
Lebih terperinciANALISIS SPAM DENGAN MENGGUNAKAN NAÏVE BAYES
ANALISIS SPAM DENGAN MENGGUNAKAN NAÏVE BAYES Darma Juang 1 * 1 Magister Teknik Informatika, Univertas Sumatera Utara Jl. Almamater Kampus USU, Medan 20155,Telp 061-8219005, Fax 061-8213250 *Email : juanglp3i@gmail.com
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi
Lebih terperinciImplementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110
19 Implementasi Algoritma Naive Bayes Classifier dalam Pengklasifikasian Teks Otomatis Pengaduan dan Pelaporan Masyarakat melalui Layanan Call Center 110 Fitri Handayani dan Feddy Setio Pribadi Jurusan
Lebih terperinciOleh: ARIF DARMAWAN NIM
APLIKASI PENGKLASIFIKASIAN DOKUMEN INFO PADA TWITTER MENGGUNAKAN ALGORITMA NAIVE BAYES TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo
Lebih terperinciPERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN
PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem
Lebih terperinciKata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.
PENGGUNAAN METODE NAÏVE BAYES CLASSIFIER PADA APLIKASI PERPUSTAKAAN Selvia Lorena Br Ginting,S.Si., MT 1, Reggy Pasya Trinanda 2 1,2 Jurusan Teknik Komputer Unikom, Bandung 1 selvialorena@yahoo.com, 2
Lebih terperinciKlasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest Neighbor dan Features Selection Berbasis Categorical Proportional Difference
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 8, Agustus 2018, hlm. 2449-2454 http://j-ptiik.ub.ac.id Klasifikasi Dokumen Sambat Online Menggunakan Metode K-Nearest
Lebih terperinciBAB 1 PENDAHULUAN 1.1. Latar belakang
BAB 1 PENDAHULUAN 1.1. Latar belakang Dengan adanya perkembangan dan pertumbuhan yang secara cepat dalam hal informasi elektronik sangat diperlukan suatu proses untuk menyelesaikan suatu permasalahan itu
Lebih terperinciAPLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP
APLIKASI PENDETEKSI KEMIRIPANPADA DOKUMEN MENGGUNAKAN ALGORITMA RABIN KARP Inta Widiastuti 1, Cahya Rahmad 2, Yuri Ariyanto 3 1,2 Jurusan Elektro, Program Studi Teknik Informatika, Politeknik Negeri Malang
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada zaman seperti sekarang ini, jurnal atau berita elektronik merupakan suatu bentuk hasil karya dari seseorang yang sudah familiar. Di dalam karyakarya tersebut
Lebih terperinciSISTEM PENILAIAN ESAI OTOMATIS PADA E-LEARNING DENGAN METODE COSINE SIMILARITY
SEMINAR PROGRES TUGAS AKHIR CF 1380 SISTEM PENILAIAN ESAI OTOMATIS PADA E-LEARNING DENGAN METODE COSINE SIMILARITY Penyusun: Rohmawati Fuat 5206 100 014 Pembimbing: Rully Agus Hendrawan, S.Kom, M.Eng LABORATORIUM
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining
Lebih terperincicommit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari
Lebih terperinciKLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR
KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL
Lebih terperinciARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI)
ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI) Oleh: Enggal Suci Febriani 3..3..35 Dibimbing oleh :. Irwan
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciPerbandingan Algoritma Pendeteksian Spam
Perbandingan Algoritma Pendeteksian Spam Andros, Dimas Prawita, Juan Karsten, Maldy Vinandar Fakultas Ilmu Komputer, Universitas Indonesia Depok, Jawa Barat, Indonesia andros@ui.ac.id, dimas.prawita@ui.ac.id,
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES
F.4 ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES Raflialdy Raksanagara*, Yulison Herry Chrisnanto, Asep Id Hadiana Jurusan Informatika, Fakultas Matematika dan Ilmu Pengetahuan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA Short Message Service (SMS) Short Message Service (SMS) adalah sebuah layanan dasar yang membolehkan pertukaran pesan teks singkat antarpelanggan. Pesan ini dapat dikirim dari perangkat
Lebih terperinciSENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER
SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER Agung Pramono 1, Rini Indriati 2, Arie Nugroho 3, 1,2,3 Sistem Informasi, Fakultas Teknik, Universitas Nusantara PGRI Kediri E-mail: 1 pramonoagung0741@gmail.com,
Lebih terperinci