KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE DCS-LA DENGAN INVERSE DISTANCE WEIGHTING RONI NOVETTIO CHAIRULLAH

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE DCS-LA DENGAN INVERSE DISTANCE WEIGHTING RONI NOVETTIO CHAIRULLAH"

Transkripsi

1 1 KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE DCS-LA DENGAN INVERSE DISTANCE WEIGHTING RONI NOVETTIO CHAIRULLAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

2 3 ABSTRACT Roni Novettio Chairullah. Classification of Documents in Bahasa Indonesia using DCS-LA with Inverse Distance Weighting. Supervised by AHMAD RIDHA. Dynamic Classifier Selection with Local Accuracy (DCS-LA) is a document classification method that combines several classification methods and k-nn. In this study, we implemented the DCS-LA with Inverse Distance Weighting for documents writen in Bahasa Indonesia as well as comparing between the DCS-LA with Inverse Distance Weighting and DCS-LA without Inverse Distance Weighting. We used four classifiers: Rocchio, Naïve Bayes, Bernoulli, and Poisson Naïve Bayes as classifiers in the DCS-LA. For the data, we used agriculture documents consisting of 174 training documents and 75 test documents, and news documents consisting of 500 training documents and 250 test documents. This method can yield an accuracy of 66% and 96% for agriculture documents and news documents, respectively. Without Inverse Distance Weighting, DCS-LA only yields an accuracy of 56% and 86% for agriculture documents and news documents, respectively. Therefore, Inverse Distance Weighting can improve the accuracy of the DCS-LA in classifying text documents in Bahasa Indonesia. Keywords: Document classification, DCS-LA, Rocchio, Naïve Bayes, Bernoulli, Poisson Naïve Bayes, Inverse Distance Weighting.

3 2 KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE DCS-LA DENGAN INVERSE DISTANCE WEIGHTING RONI NOVETTIO CHAIRULLAH Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011

4 4 Judul Penelitian : Klasifikasi Dokumen Bahasa Indonesia Menggunakan Metode DCS-LA dengan Inverse Distance Weighting Nama : Roni Novettio Chairullah NRP : G Menyetujui: Pembimbing, Ahmad Ridha, S.Kom. M.S. NIP Mengetahui: Ketua Departemen Ilmu Komputer, Dr. Ir. Sri Nurdiati, M.Sc. NIP Tanggal Lulus:

5 5 KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Allah atas segala curahan rahmat dan karunia-nya sehingga skripsi ini dapat diselesaikan. Skripsi ini merupakan hasil penelitian yang dilakukan dari Desember 2010 sampai Juni 2011 dengan bidang kajian Klasifikasi Dokumen Bahasa Indonesia Menggunakan Metode Dynamic Classifier Selection with Local Accuracies (DCS-LA) dengan Inverse Distance Weighting. Penulis mengucapkan terima kasih kepada Bapak Ahmad Ridha, S.Kom. M.S. selaku pembimbing yang telah memberi saran, masukan, dan ide-ide kepada penulis dalam menyusun skripsi ini. Penulis juga mengucapkan terima kasih kepada: 1 Papa, Mama serta Adik yang selalu memberikan doa, nasihat, dukungan, semangat, dan kasih sayang yang luar biasa kepada penulis sehingga dapat menyelesaikan tugas akhir ini. 2 Syamsul Bachri, M Farhad Idris, Rangga AP, Wildan Rachman, Haryadi, M Awet Samana, dan Kartina yang telah banyak membantu penulis dalam menyelesaikan tugas akhir ini serta temanteman satu bimbingan lainnya Rio Ramadhan, Andi Rusmia, Jafar, Rendy Rivaldi, dan Windu Purnomo yang selalu memberi semangat dan motivasi. 3 Wahyu Setyowidodo, Mikolehi Firdaus, Mukhlis Wahyudi, dan Nurwan Wahyudi yang memberikan motivasi kepada Penulis. 4 Teman-teman Ilkom angkatan 43 yang telah banyak membantu penulis. 5 Departemen Ilmu Komputer, tenaga kependidikan, serta dosen yang telah banyak membantu baik selama penelitian maupun pada masa perkuliahan. 6 Teman-teman Himalkom dan LDK DKM Al Hurriyyah IPB yang memberikan dukungan dan motivasi. Kepada semua pihak lainnya yang telah memberikan kontribusi yang besar selama pengerjaan penelitian ini yang tidak dapat disebutkan satu per satu, penulis ucapkan terima kasih banyak. Semoga penelitian ini dapat memberikan manfaat. Bogor, 3 Agustus 2011 Roni Novettio Chairullah

6 6 RIWAYAT HIDUP Penulis dilahirkan di Kotamobagu pada tanggal 2 November 1988 dari ayah Rofik dan ibu Sri Nunik Wagiati. Penulis merupakan putra pertama dari dua bersaudara, kakak dari Figia Putri Rahmadita. Tahun 2006 penulis lulus dari SMA Negeri 1 Cikampek dan pada tahun yang sama lulus seleksi masuk IPB melalui jalur Undangan Seleksi Masuk IPB (USMI). Tahun 2007 penulis diterima di Departemen Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama mengikuti perkuliahan, penulis juga aktif pada LDK DKM Al Huriyyah IPB serta Himpunan Mahasiswa Ilmu Komputer (Himalkom) IPB, dan pada tahun 2009 diangkat sebagai Ketua Himalkom. Penulis melakukan Praktik Kerja Lapangan di Direktorat Kerjasama dan Program Internasional IPB dengan bidang kajian Pembuatan Web Direktorat Kerjasama dan Program Internasional IPB. Penulis menjadi asisten praktikum mata kuliah Pendidikan Agama Islam di IPB pada tahun , serta menjadi staf pengajar pada Nurul Ilmi Center (NIC) pada tahun

7 iv DAFTAR ISI Halaman DAFTAR TABEL... v DAFTAR GAMBAR... v DAFTAR LAMPIRAN... v PENDAHULUAN... 1 Latar Belakang... 1 Tujuan... 1 Ruang Lingkup... 1 Manfaat... 1 TINJAUAN PUSTAKA... 1 Klasifikasi... 1 Metode Rocchio... 1 Metode Naïve Bayes... 2 Metode Bernoulli... 2 Metode Poisson Naїve Bayes... 2 Metode k-nearest Neighbor... 3 Metode Dynamic Classifier Selection with Local Accuracies... 3 Inverse Distance Weighting (IDW)... 3 Confusion Matrix... 3 METODE PENELITIAN... 3 Pengumpulan Dokumen... 4 Implementasi Sistem... 4 Klasifikasi DCS-LA dengan Inverse Distance Weighting... 4 Evaluasi Klasifikasi... 4 Perbandingan Sistem... 4 Lingkungan Implementasi... 4 HASIL DAN PEMBAHASAN... 5 Praproses... 5 Pelatihan... 5 Akurasi Classifier Tunggal... 5 Klasifikasi DCS-LA... 7 Perbandingan Klasifikasi... 8 KESIMPULAN DAN SARAN... 9 DAFTAR PUSTAKA... 9 LAMPIRAN... 11

8 v DAFTAR TABEL Halaman 1 Confusion matrix Confusion matrix metode Rocchio dengan dokumen pertanian Confusion matrix metode Rocchio dengan dokumen berita Confusion matrix metode Naїve Bayes dengan dokumen pertanian Confusion matrix metode Naїve Bayes dengan dokumen berita Confusion matrix metode Bernoulli dengan dokumen pertanian Confusion matrix metode Bernoulli dengan dokumen berita Confusion matrix metode Poisson Naïve Bayes dengan dokumen pertanian Confusion matrix metode Poisson Naïve Bayes dengan dokumen berita... 7 DAFTAR GAMBAR Halaman 1 Metode penelitian Format XML Grafik hasil klasifikasi DCS-LA Diagram perbandingan classifier Perbandingan akurasi DCS-LA DAFTAR LAMPIRAN Halaman 1 Contoh dokumen pertanian dalam format XML Contoh dokumen berita dalam format XML Perbandingan akurasi setiap classifier dan DCS-LA untuk dokumen pertanian...14

9 1 PENDAHULUAN Latar Belakang Klasifikasi dikembangkan untuk memfokuskan pencarian pengguna pada informasi yang ingin dicari, sehingga hasil akan menjadi lebih baik dan usaha yang dilakukan sistem lebih efektif dan efisien. Banyak metode yang bisa digunakan untuk klasifikasi teks, seperti Naïve Bayes, k-nearest Neighbor (k-nn), Support Vector Machine (SVM), Bernoulli, Rocchio, dan Minor Component Analysis (MCA). Beberapa peneliti telah menunjukkan bahwa mengombinasikan metode klasifikasi yang berbeda dapat menambah akurasi klasifikasi (Xu et al. 1992). Simple voting, Dynamic Classifier Selection (DCS), dan Adaptive Classifier Combination (AAC) adalah contoh metode yang menggabungkan beberapa metode klasifikasi. DCS pertama kali diperkenalkan oleh Ho et al. (1994). Pada penelitian tersebut, DCS diterapkan pada sistem klasifikasi teks dan gambar, sehingga dapat dibuktikan bahwa dengan mengombinasikan beberapa metode klasifikasi yang berbeda dapat menambah akurasi sistem klasifikasi. DCS dikembangkan menjadi Dynamic Classifier Selection with Local Accuracies (DCS-LA), yaitu dengan menambahkan konsep k-nn dalam pemilihan akurasi lokal. Dalam pengujian metode klasifikasi DCS-LA menggunakan dokumen berbahasa Inggris, metode DCS-LA ini menghasilkan akurasi ratarata 80% (Woods et al. 1997). Kemudian DCS-LA dikembangkan lagi dengan menambahkan pembobotan dalam proses k-nn untuk pemilihan akurasi dari setiap classifier tunggal. Teknik tersebut dapat menambah akurasi dari DCS-LA hingga mencapai 90% (Morales et al. 2008). Pada pengujian menggunakan dokumen berbahasa Indonesia, metode DCS-LA menghasilkan akurasi 56% untuk dokumen pertanian dan 86% untuk dokumen berita (Ramadhan 2010). Pada penelitian tersebut digunakan tiga classifier tunggal serta belum menambahkan pembobotan dalam proses DCS- LA. Dalam penelitian ini, akan ditambahkan Inverse Distance Weighting (IDW) dalam teknik DCS-LA yang digunakan pada dokumen berbahasa Indonesia, serta menggunakan empat classifier tunggal pada proses klasifikasinya. Tujuan Tujuan penelitian ini adalah: 1 Mengimplementasikan DCS-LA dengan IDW untuk klasifikasi dokumen berbahasa Indonesia. 2 Membandingkan akurasi klasifikasi DCS-LA yang menggunakan IDW dengan yang tidak menggunakan IDW. 3 Membandingkan DCS-LA dengan empat classifier dan DCS-LA dengan tiga classifier. Ruang Lingkup Ruang lingkup penelitian ini difokuskan kepada klasifikasi dokumen dengan menggunakan DCS-LA pada dokumen pertanian dan berita berbahasa Indonesia serta menentukan metode yang memiliki akurasi tinggi. Manfaat Manfaat dari penelitian ini adalah menentukan metode yang memiliki akurasi tinggi dalam proses klasifikasi dokumen sehingga dapat meningkatkan akurasi klasifikasi dokumen berbahasa Indonesia. Klasifikasi TINJAUAN PUSTAKA Klasifikasi adalah proses untuk menemukan sebuah model yang menggambarkan dan membedakan kelas-kelas data, dengan tujuan untuk memprediksikan kelas dari objek yang belum diketahui kelasnya. Model dari setiap kelas dibuat berdasarkan data latih (training data) melalui berbagai cara, di antaranya adalah rules, decision tree, formula matematika, atau neural network (Han & Kamber 2006). Selanjutnya digunakan sekumpulan data uji yang sudah diketahui kelasnya untuk menghitung akurasi dari model yang sudah didapatkan. Jika akurasinya mencukupi, maka model tersebut dapat digunakan untuk prediksi kelas dari data yang belum diketahui kelasnya. Metode Rocchio Rocchio merupakan metode klasifikasi berdasarkan ruang vektor. Metode Rocchio membagi ruang vektor berdasarkan nilai centroid pada setiap kelas (Manning et al. 2008). Centroid sebuah kelas c dihitung dengan ratarata vektor dari semua dokumen pada kelas c:

10 2 μ c = 1 D c v (d) d D c D c adalah jumlah dokumen di kelas c. Nilai v (d) adalah vektor kata pada kelas c dan μ(c) adalah centroid masing-masing kelas. Setelah μ(c) diketahui, dihitung jarak centroid setiap kelas dengan dokumen uji. Perhitungan jarak menggunakan metode Euclidean Distance yang didapatkan dari persamaan berikut: Jarak = arg c min μ c v(d) Metode Naïve Bayes Naïve Bayes merupakan metode klasifikasi berdasarkan perhitungan peluang. Misalkan C = (c 1,...,c m ), nilai m adalah jumlah kelas yang digunakan. Untuk sebuah dokumen baru D yang belum diklasifikasikan, dokumen tersebut terdiri dari W =(w 1,.,w d ) dengan W adalah daftar term yang menyusun dokumen D. Peluang dokumen D pada kelas c adalah: P c j D = P c j P w i c j ) d i=1 Nilai P(c j ) adalah peluang prior dari dokumen c j yang dihitung dengan cara: P(c j ) = N c N Nilai N c adalah banyak dokumen yang berada dalam kelas c, N adalah total seluruh dokumen yang ada, (w 1,w 2,w 3,...,w d ) adalah kata unik pada dokumen D, dan d adalah jumlah kata unik. P (w i c j ) adalah peluang kata w i yang berada dalam dokumen di kelas c j. P(w i c j ) diartikan sebagai ukuran seberapa banyak term w i menyumbang untuk menunjukkan c j merupakan kelas yang tepat untuk setiap dokumen uji (Li & Jain 1998). Nilai P(w i c j ) didapatkan dari: P(w i c j ) = n ij + 1 n j + k j Nilai n ij adalah jumlah kemunculan kata w j dalam dokumen latih di kelas c. Nilai n j adalah jumlah seluruh kata pada dokumen latih yang ada di kelas c, termasuk kemunculan term ganda, dan k j adalah jumlah kata dalam vocabulary (kata unik) seluruh dokumen. Metode Bernoulli Bernoulli merupakan metode klasifikasi berdasarkan perhitungan peluang. Perhitungannya mirip dengan metode Naïve Bayes. Perbedaannya adalah P (c j D) merupakan rasio dokumen dari kelas c yang mengandung kata w dan adanya indikator kata, jika kata d berada di kelas c maka diberikan nilai 1, selainnya 0 (Manning et al. 2008). Metode Poisson Naїve Bayes Metode ini merupakan pengembangan dari metode Naїve Bayes, dengan mengibaratkan setiap dokumen uji sebagai selang kejadian serta term yang sesuai dengan dokumen latih sebagai kejadian yang diinginkan (Kim 2001). Oleh karena itu, dapat digunakan sebaran Poisson untuk mendapatkan peluang kejadian tersebut. Persamaan yang digunakan untuk mendapatkan peluang Poisson Naїve Bayes adalah sebagai berikut: P(c d j ) = e z jc. P(c) e z jc. P c + P(c ) Nilai P(c) merupakan banyaknya dokumen pada kelas c pada dokumen latih, sedangkan P(c ) adalah banyaknya dokumen pada kelas bukan c pada dokumen latih. Nilai e merupakan bilangan natural, dan z jc didapatkan dengan persamaan berikut: w ic = z jc = (B c + zjc ) 1 d lj B c = V i=1 V w ic. log λ i μ i zjc = w ic. x ij log λ i μ i i=1 d lj = d lj + θ V λ i = 1 D c μ i = 1 D c d j D c d j D c f ij f ij (ad bc) 2 a + b a + c b + d (c + d) Nilai V merupakan jumlah kata unik pada setiap dokumen uji, nilai d lj merupakan panjang dokumen uji, D c merupakan jumlah dokumen latih pada kelas c, sedangkan D c merupakan jumlah dokumen latih pada kelas bukan c. Nilai x ij merupakan normalisasi dari setiap term pada dokumen uji, dan f ij adalah nilai normalisasi setiap term pada dokumen latih dengan persamaan sebagai berikut: f ij = f ij + θ d lj + θ V

11 3 Nilai θ merupakan Laplace smoothing, d lj merupakan jumlah seluruh kata pada setiap dokumen, dan V merupakan jumlah kata unik pada dokumen latih. Nilai w ic merupakan nilai pembobotan fitur. Nilai a pada persamaan w ic adalah banyaknya term i pada kelas c, sedangkan variabel b adalah banyaknya term selain i pada kelas c. Variabel c merupakan banyaknya term i pada kelas selain c, sedangkan d merupakan banyaknya term selain i pada kelas selain c. Metode k-nn Metode k-nn merupakan teknik klasifikasi yang memasukkan dokumen ke dalam mayoritas kelas dari k tetangga terdekatnya dengan k adalah sebuah parameter (Manning et al. 2008). Parameter k dalam k-nn seringkali dipilih berdasarkan pada pengalaman atau pengetahuan tentang masalah klasifikasi. Metode Dynamic Classifier Selection with Local Accuracies Dynamic Classifier Selection with Local Accuracies (DCS-LA) merupakan metode klasifikasi yang menggabungkan beberapa classifier dan metode k-nn (Morales et al. 2008). Ilustrasi algoritme dari DCS-LA sebagai berikut: 1 Rancang classifier individu D 1,...,D L, dan pilih parameter k. 2 Setelah dapatkan nilai x yang dilabelkan oleh D 1,...,D L. Jika semua classifier sepakat pada label x, maka diberikan label x. 3 Jika classifier tidak sepakat maka dilakukan perhitungan akurasi lokal dari setiap D i, i=1...l. Pilih k dokumen terbaik dari setiap classifier. Lakukan pembobotan terhadap setiap dokumen, sehingga didapatkan bobot dari classifier. Pilih classifier dengan bobot paling besar. 4 Jika hasil perhitungan akurasinya sama maka pilih salah satu saja, karena dianggap menghasilkan hasil yang sama saja. w j = 1 d j if dj 0 dengan w j adalah Inverse Distance Weighting dari setiap k-top dokumen yang terpilih. Nilai d j adalah distance (jarak) yang dihitung dengan metode Euclidean Distance. Confusion Matrix Confusion matrix merupakan tabel yang digunakan untuk menentukan kinerja suatu model klasifikasi (Hamel 2008). Contoh tabel confusion matrix dapat dilihat pada Tabel 1. Perhitungan akurasi dengan menggunakan tabel confusion matrix adalah: Akurasi = Tabel 1 Confusion matrix Kelas yang Sebenarnya F 11 +F 00 F 11 +F 10 +F 01 +F 00 Kelas Prediksi Class = 1 Class = 0 Class = 1 F 11 F 10 Class = 0 F 01 F 00 METODE PENELITIAN Penelitian ini dilaksanakan dalam beberapa tahap yaitu pengumpulan data, pengolahan data, implementasi sistem, klasifikasi DCS-LA dengan Inverse Distance Weighting (IDW), evaluasi klasifikasi dan melakukan perbandingan sistem. Tahap-tahap yang dilakukan dalam penelitian ini diilustrasikan pada Gambar 1. Inverse Distance Weighting (IDW) Inverse Distance Weighting merupakan salah satu teknik pemilihan dalam k-nn. Teknik ini memberikan bobot terhadap masing-masing komponen k-top dokumen yang terpilih dengan inverse jarak (distance) terhadap dokumen latih (Morales et al. 2008). Persamaan Inverse Distance Weighting didapat dari: Gambar 1 Metode penelitian.

12 4 Pengumpulan Dokumen Dokumen yang digunakan dalam penelitian ini sama dengan dokumen yang digunakan dalam penelitian Ramadhan (2010). Dokumen ini merupakan dokumen data publikasi hasil penelitian hortikultura dari badan penelitian dan pengembangan pertanian (Litbang) dan dokumen berita digital yang bersumber dari Media Indonesia. Klasifikasi dokumen pertanian menggunakan klasifikasi manual oleh Litbang dan Media Indonesia. Dokumen pertanian diklasifikasikan menjadi tiga kelas yaitu: 1 Kelas Ekofisiologi dan Argonomi (EA). 2 Kelas Pemuliaan dan Teknologi Benih (PTB). 3 Kelas Proteksi (P). Dokumen berita diklasifikasikan menjadi lima kelas yaitu: 1 Kelas Bulutangkis. 2 Kelas Ekonomi. 3 Kelas Kriminal. 4 Kelas Lingkungan. 5 Kelas Pendidikan. Pada dokumen pertanian setiap kelas memiliki 83 dokumen. Dokumen tersebut dibagi lagi menjadi data latih dan data uji dengan proposisi dokumen latih 70% dan dokumen uji 30% sehingga jumlah dokumen latih setiap kelas adalah 58 dan jumlah dokumen uji adalah 25. Pada dokumen berita setiap kelas berjumlah 150 dokumen. Jumlah dokumen latih setiap kelas 100 dan jumlah dokumen uji 50. Gambar 2 Format XML. Keseluruhan abstrak dari dokumen pertanian telah diubah dalam format XML oleh Ramadhan (2010), sedangkan untuk dokumen berita diubah dalam format XML oleh Juniawan (2009) seperti pada Gambar 2. Contoh dokumen pertanian dalam format XML dapat dilihat pada Lampiran 1 dan dokumen berita pada Lampiran 2. Implementasi Sistem Implementasi sistem menggunakan bahasa pemrograman PHP dan MySQL sebagai tempat penyimpanan data. Klasifikasi DCS-LA dengan Inverse Distance Weighting Dalam metode DCS-LA dilakukan proses pengolahan data yaitu pengindeksan dokumen, klasifikasi dengan classifier, dan klasifikasi DCS-LA. Pengolahan data dilakukan dengan sistem yang digunakan oleh Cidhy (2009), yaitu dengan menghilangkan stopword, serta proses indexing yaitu membagi setiap dokumen kedalam term-term kata berdasarkan dokumen dan kelas asal dokumen. Stopword yang digunakan dalam penelitian ini adalah stopword yang dibuat oleh Ridha (2002). Klasifikasi dilakukan dengan empat classifier yaitu Rocchio, Naїve Bayes, Bernoulli, dan Poisson Naїve Bayes. Hasil dari keempat classifier ini disimpan dalam MySQL untuk digunakan dalam proses klasifikasi dengan DCS- LA. Dalam proses DCS-LA digunakan IDW dalam pembobotan k-nn untuk menentukan hasil klasifikasi. Evaluasi Klasifikasi Evaluasi dilakukan dengan cara membandingkan antara hasil DCS-LA dan hasil klasifikasi manual oleh Litbang dan Media Indonesia serta dihitung akurasinya dengan menggunakan confusion matrix. Perbandingan Sistem Perbandingan dilakukan antara sistem DCS- LA dengan IDW dan DCS-LA tanpa IDW. Perbandingan ini digunakan dokumen yang sama dan jumlah yang sama. Perbandingan juga dilakukan terhadap DCS-LA dengan menggunakan tiga classifier dan DCS-LA dengan empat classifier. Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut: Perangkat lunak: 1 Windows 7 Home Premium sebagai sistem operasi. 2 XAMPP sebagai server. 3 Notepad++ sebagai code editor.

13 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk 450 GB. Praproses HASIL DAN PEMBAHASAN Dokumen dalam format XML terdiri atas data latih dan data uji serta dilakukan proses indexing menggunakan sistem dari Cidhy (2009). Pada dokumen latih pertanian yang berjumlah 174 dihasilkan 2868 kata unik atau term sedangkan pada dokumen latih berita yang berjumlah 500 dihasilkan kata unik. Pelatihan Pada tahap pelatihan ini keempat metode atau classifier memiliki cara yang berbeda dalam perhitungannya. Pada metode Rocchio kata unik atau term dihitung bobotnya dengan metode sublinear tf scaling. Setelah itu term atau kata unik dianggap sebuah vektor dan setiap kelas dihitung vektor centroid-nya masing-masing. Nilai vektor centroid disimpan dalam database untuk digunakan dalam perhitungan klasifikasi berikutnya. Pada metode Naїve Bayes, dihitung peluang dari setiap term atau kata unik dan peluang prior dari setiap dokumen latih. Nilai peluang dari setiap term atau kata disimpan dalam database. Pada metode Bernoulli, dihitung juga peluang dari setiap term atau kata unik dan peluang prior dari setiap dokumen latih. Nilai peluang dari setiap term atau kata juga disimpan dalam database seperti pada metode Naїve Bayes. Pada metode Poisson Naїve Bayes dihitung peluang dari setiap term, nilai rata-rata dari distribusi poisson terhadap masing-masing kelas, dan bobot dari setiap term menggunakan pembobotan rasio peluang. Nilai peluang, bobot, dan nilai rata-rata distribusi poisson setiap term disimpan dalam database. Akurasi Classifier Tunggal Pada metode Rocchio dokumen uji dihitung bobotnya dengan metode Sublinear tf scaling. Setelah itu dihitung jarak centroid kelas dengan dokumen uji mengunakan metode Euclidean distance. Dokumen uji akan diklasifikasikan ke- dalam kelas yang memiliki jarak terdekat dengan dokumen uji. Akurasi klasifikasi dari setiap metode yang ada dapat dihitung dengan bantuan tabel confusion matrix. Pada dokumen pertanian akurasi metode rocchio dihitung dengan tabel confusion matrix yang dapat dilihat pada Tabel 2. Demikian juga akurasi untuk dokumen berita dapat dilihat pada Tabel 3. Dari Tabel 2 dan Tabel 3 dapat dilihat bahwa pada dokumen pertanian banyak terjadi kesalahan pengklasifikasian sedangkan pada dokumen berita sedikit. Akurasi pada dokumen pertanian dengan metode Rocchio ini adalah 61.23%, dan untuk dokumen berita menghasilkan akurasi 97.2%. Akurasi pada dokumen pertanian lebih rendah dibandingkan dengan dokumen berita. Hal ini karena pada dokumen pertanian setiap kelasnya masih memiliki hubungan atau keterkaitan, sehingga setiap centroid kelas memiliki jarak yang sama. Akibat centorid jarak yang sama ini banyak terjadi kesalahan pengklasifikasian. Pada dokumen berita hasil akurasinya tinggi karena tidak ada keterkaitan setiap kelas, sehingga jarak antara centroid setiap kelas berbeda. Akibatnya sedikit terjadi kesalahan pengklasifikasian. Hasil klasifikasi dengan metode ini sangat dipengaruhi oleh nilai centroid setiap kelas. Tabel 2 Confusion matrix metode Rocchio dengan dokumen pertanian Kelas yang sebenarnya Kelas Prediksi EA PTB P Akurasi EA PTB P Tabel 3 Confusion matrix metode Rocchio dengan dokumen berita Kelas yang sebenarnya Kelas Prediksi B E K L P Akurasi B E K L P

14 6 Pada metode Naїve Bayes, peluang setiap term pada dokumen uji akan dihitung. Setelah itu dihitung peluang dokumen uji terhadap kelas yang ada. Dokumen uji akan dimasukkan pada kelas yang memiliki peluang terbesar. Akurasi pada dokumen pertanian dengan metode Naїve Bayes dihitung dengan menggunakan bantuan tabel confusion matrix pada Tabel 4. Hal serupa dilakukan pada dokumen berita, hasil akurasinya dapat dilihat pada Tabel 5. Tabel 4 Confusion matrix metode Naїve Bayes dengan dokumen pertanian Kelas yang sebenarnya Kelas Prediksi EA PTB P Akurasi EA PTB P Tabel 5 Confusion matrix metode Naїve Bayes dengan dokumen berita Kelas yang sebenarnya Kelas Prediksi B E K L P Akurasi B E K L P Dari Tabel 4 dan Tabel 5 dapat dilihat pada dokumen pertanian terjadi banyak kesalahan pengklasifikasian sedangkan pada dokumen berita sedikit. Akurasi pada dokumen pertanian dengan metode Naїve Bayes ini adalah 65.33%, dan untuk dokumen berita menghasilkan 76.8%. Akurasi dokumen berita lebih tinggi dibandingkan dokumen pertanian. Hal ini karena pada dokumen berita setiap kelasnya saling bebas atau tidak ada keterkaitan antara kelasnya. Akibatnya setiap kelas memiliki penciri kata atau term yang berbeda, sehingga terjadi sedikit kesalahan pengklasifikasian. Pada dokumen pertanian hasil akurasinya rendah karena setiap kelas memiliki keterkaitan. Akibatnya kata atau term dari masing-masing kelas sama, sehingga banyak terjadi kesalahan pengklasifikasian. Pada metode Bernoulli peluang kata atau term dari dokumen uji akan dihitung. Setelah itu dihitung peluang dokumen uji masuk ke dalam kelas yang ada. Perhitungan ini mirip dengan metode Naїve Bayes, perbedaannya adalah metode Bernoulli hanya memperhitungkan rasio dokumen dari setiap kelas yang mengandung kata atau term. Akurasi pada dokumen pertanian dengan metode Bernoulli dihitung dengan menggunakan bantuan tabel confusion matrix pada Tabel 6. Demikian juga hasil akurasi untuk dokumen berita dapat dilihat pada Tabel 7. Dari Tabel 6 dan Tabel 7 dapat dilihat pada dokumen berita terjadi sedikit kesalahan pengklasifikasian sedangkan pada dokumen pertanian banyak kesalahan pengklasifikasian. Akurasi pada dokumen pertanian dengan metode Bernoulli ini adalah 61.33%, dan untuk dokumen berita menghasilkan 76.8%. Akurasi dari dokumen berita lebih tinggi dari dokumen pertanian karena pada dokumen pertanian setiap kelasnya memiliki keterkaitan sehingga kata atau term dari setiap kelas sama. Akibatnya banyak terjadi kesalahan pengklasifikasian. Pada dokumen berita akurasinya tinggi karena setiap kelasnya tidak ada keterkaitan sehingga kata atau term dari setiap kelas berbeda. Akibatnya terjadi sedikit kesalahan pengklasifikasian. Tabel 6 Confusion matrix metode Bernoulli dengan dokumen pertanian Kelas yang sebenarnya Kelas Prediksi EA PTB P Akurasi EA PTB P Tabel 7 Confusion matrix metode Bernoulli dengan dokumen berita Kelas yang sebenarnya Kelas Prediksi B E K L P Akurasi B E K L P Pada metode Poisson Naїve Bayes dokumen uji dihitung bobot setiap term (w ic ), serta nilai rata-rata kemunculan kata setiap dokumen pada kelas c dan kelas bukan c (λ dan μ). Setelah itu, dihitung peluang dokumen uji terhadap kelas

15 7 yang ada. Dokumen uji akan dimasukkan pada kelas yang memiliki peluang terbesar. Akurasi pada dokumen pertanian dengan metode Poisson Naїve Bayes dihitung dengan menggunakan bantuan tabel confusion matrix pada Tabel 8. Hal serupa dilakukan pada dokumen berita, sehingga hasil akurasinya dapat dilihat pada Tabel 9. Tabel 8 Confusion matrix metode Poisson Naïve Bayes dengan dokumen pertanian Kelas yang sebenarnya Kelas Prediksi EA PTB P Akurasi EA PTB P Tabel 9 Confusion matrix metode Poisson Naïve Bayes dengan dokumen berita Kelas yang sebenarnya Kelas Prediksi B E K L P Akurasi B E K L P Dari Tabel 8 dan Tabel 9 dapat dilihat pada dokumen berita terjadi sedikit kesalahan pengklasifikasian sedangkan pada dokumen pertanian banyak kesalahan pengklasifikasian. Akurasi pada dokumen pertanian dengan metode Poisson Naїve Bayes ini adalah %, dan untuk dokumen berita menghasilkan akurasi 96.8%. Akurasi dari dokumen berita lebih tinggi dari dokumen pertanian karena pada dokumen pertanian setiap kelasnya memiliki keterkaitan atau tidak saling bebas sehingga kata atau term dari setiap kelas sama. Akibatnya banyak terjadi kesalahan pengklasifikasian. Pada dokumen berita akurasinya tinggi karena setiap kelasnya tidak ada keterkaitan atau saling bebas sehingga kata atau term dari setiap kelas berbeda. Akibatnya terjadi sedikit kesalahan pengklasifikasian. Klasifikasi DCS-LA Hasil klasifikasi dari empat classifier dihitung dengan metode DCS-LA. Pada perhitungan pertama dilakukan simple voting. Jika semua classifier ini menghasilkan kelas yang sama atau setuju maka langsung dilabelkan kelas tersebut. Jika hasil klasifikasi masingmasing classifier berbeda maka dilakukan proses k-nn. Pada perhitungan k-nn, digunakan IDW sebagai pembobotan untuk menentukan hasil klasifikasi yang terpilih. Pada dokumen pertanian dan berita dilakukan beberapa percobaan dengan nilai k = 1 sampai k = 30. Pada dokumen pertanian akurasi tertinggi terdapat pada nilai k sama dengan 24 dan 25 sebesar 66.67%. Akurasi terendah pada klasifikasi DCS-LA ini adalah ketika k bernilai 6 sampai 30 sebesar 57.33%. Pada dokumen berita akurasi tertinggi terdapat pada k = 1 sebesar 97.6% dan terendah ketika k bernilai 3 sampai 30 sebesar 96.4%. Hasil akurasi klasifikasi DCS-LA dapat dilihat pada Gambar % 100% 80% 60% 40% 20% 0% Dokumen Pertanian Dokumen Berita Parameter- k Gambar 3 Grafik hasil klasifikasi DCS-LA menggunakan IDW. Dari Gambar 3 dapat dilihat bahwa akurasi dari dokumen berita lebih tinggi dari dokumen pertanian. Hasil ini dipengaruhi oleh akurasi dari setiap classifier. Semakin tinggi akurasi dari setiap classifier maka semakin tinggi pula akurasi dari DCS-LA begitu pula sebaliknya. Pada dokumen pertanian parameter-k mempengaruhi akurasi klasifikasi, terlihat bahwa rentang akurasi dari dokumen pertanian mencapai 9.34%. Pada dokumen berita parameter-k tidak berpengaruh secara signifikan, terlihat bahwa rentang akurasinya hanya 1.2%. Perbandingan akurasi ini dapat dilihat pada Gambar 3. Hasil akurasi pada dokumen pertanian dengan metode DCS-LA adalah 66.67%, sedangkan pada dokumen berita sebesar 96.4% Pada penelitian ini, tinggi rendahnya akurasi yang dimiliki oleh DCS-LA dipengaruhi oleh ke-

16 8 empat classifier yaitu: Rocchio, Naїve Bayes, Bernoulli dan Poisson Naїve Bayes. Dari Gambar 3 akurasi DCS-LA pada dokumen pertanian lebih rendah dibandingan dokumen berita. Hal ini disebabkan pada dokumen berita setiap kelasnya tidak berhubungan atau saling bebas, sedangkan pada dokumen pertanian setiap kelasnya berkaitan. Keterkaitan antarkelas pada dokumen pertanian dan berita masing-masing 48% dan 10% (Ramadhan 2010), keterkaitan yang kecil pada dokumen berita mempengaruhi akurasi klasifikasi Jika dihitung akurasi rata-rata dari classifier pada dokumen pertanian sebesar 61% dan dokumen berita sebesar 91.6%. Jika dibandingkan akurasi rata-rata dengan akurasi DCS-LA, maka metode DCS-LA memiliki akurasi yang lebih tinggi dari akurasi rata-rata classifier. Akurasi dapat ditingkatkan dengan penambahan classifier. Perbandingan akurasi setiap classifier dengan DCS-LA dapat dilihat pada Gambar % 100% 80% 60% 40% 20% 0% 97% 95% 61% 65% 61% 58% Dokumen pertanian Gambar 4 Diagram perbandingan classifier dengan DCS-LA. Perbandingan Klasifikasi 76% 96% 96% 66% Dokumen berita Perbandingan dilakukan dengan cara membandingkan DCS-LA yang menggunakan IDW dengan DCS-LA tanpa IDW dari Ramadhan (2010). Hasil akurasi DCS-LA dengan IDW lebih baik dibandingkan DCS-LA tanpa IDW. Perbandingan akurasi ini dapat dilihat pada Gambar 5. Penambahan satu classifier yaitu Poisson Naїve Bayes dapat menambah akurasi dari DCS- LA. Pada Gambar 5 dapat dilihat bahwa DCS- LA dengan empat classifier memiliki akurasi yang lebih tinggi dibandingkan dengan DCS-LA dengan tiga classifier. DCS-LA tanpa IDW dengan tiga classifier menghasilkan akurasi 56% untuk dokumen pertanian dan 86% untuk dokumen berita, dan pada DCS-LA tanpa IDW dengan empat classifier menghasilkan akurasi 61.33% untuk dokumen pertanian dan 91.6% untuk dokumen berita. 120% 100% 80% 60% 40% 20% 0% 56% 84% 61% 91.60% 94% 96.40% 64% 66.67% a b c d Dokumen pertanian Dokumen berita Gambar 5 Perbandingan akurasi DCS-LA: a = klasifikasi DCS-LA tanpa IDW dengan tiga classifier, b = klasifikasi DCS-LA tanpa IDW dan empat classifier, c = klasifikasi DCS-LA dengan IDW dan tiga classifier, d = klasifikasi DCS-LA dengan IDW dan empat classifier. Pengaruh penambahan Poisson Naїve Bayes pada dokumen pertanian dapat dilihat pada Lampiran 3. Pada Lampiran 3 terdapat dua kasus (dokumen nomor 25 dan 67) yang menunjukkan bahwa tiga classifier Rocchio, Naїve Bayes dan Bernoulli menghasilkan kelas prediksi yang salah sedangkan Poisson Naїve Bayes menghasilkan kelas prediksi yang benar, sehingga menghasilkan kelas prediksi dari DCS- LA yang benar. Penambahan pembobotan IDW juga dapat meningkatkan akurasi dari DCS-LA. Pada Gambar 5 dapat dilihat untuk DCS-LA dengan tiga classifier bahwa penambahan IDW pada metode tersebut dapat meningkatkan akurasi sampai 64% untuk dokumen pertanian dan 94 % untuk dokumen berita. Begitu pula dengan DCS-LA dengan empat classifier yang akurasinya meningkat menjadi 66.67% untuk dokumen pertanian dan 96.4% untuk dokumen berita setelah penambahan IDW.

17 9 Pengaruh penambahan pembobotan IDW pada dokumen pertanian dapat dilihat pada Lampiran 3. Pada Lampiran 3 terdapat tiga kasus (dokumen nomor 27, 58, dan 66) yang menunjukkan bahwa DCS-LA dengan penambahan IDW memiliki kelas prediksi yang benar sedangkan pada DCS-LA yang hanya menambahkan satu classifier menghasilkan kelas prediksi yang salah. Pada Gambar 5 dapat dilihat pula bahwa penambahan IDW dapat meningkatkan akurasi lebih tinggi dibandingkan dengan hanya menambahkan satu classifier. Selain itu, penambahan IDW dan satu classifier sekaligus, memiliki akurasi yang lebih tinggi dibandingkan dengan hanya menambahkan satu classifier atau IDW saja. KESIMPULAN DAN SARAN Dari penelitian dalam menerapkan algoritme DCS-LA dengan IDW untuk klasifikasi dokumen pertanian dan dokumen berita dalam bahasa Indonesia, didapatkan kesimpulan sebagai berikut: 1 Penerapan klasifikasi DCS-LA dengan IDW untuk dokumen teks bahasa Indonesia berhasil dilakukan. 2 Akurasi dari metode DCS-LA ini sebesar 66.67% pada dokumen pertanian dan dokumen berita 96.4%. 3 Akurasi metode DCS-LA dengan IDW lebih tinggi dibandingkan dengan DCS-LA tanpa IDW. 4 Akurasi DCS-LA dengan empat classifier lebih tinggi dibandingkan dengan tiga classifier. 5 Metode DCS-LA menghasilkan akurasi lebih tinggi dari akurasi rata-rata classifier. 6 Kelas yang saling berhubungan atau terkait dapat memberikan hasil akurasi yang rendah. Saran yang diberikan untuk pengembangan lebih lanjut pada penelitian ini adalah sebagai berikut: 1 Mencoba menggunakan komponen classifier lainnya misalkan MCA atau SVM untuk dibandingkan. 2 Menambahkan atau mengganti komponen classifier pada sistem DCS-LA ini. 3 Membandingkan akurasi DCS-LA dengan AAC untuk dokumen berbahasa Indonesia. DAFTAR PUSTAKA Cidhy DATK Implementasi Question Answering System dengan Pembobotan Heuristic [Skripsi]. Bogor: Departemen Ilmu Komputer, IPB. Hamel L The Encyclopedia of Data Warehousing and Mining. Ed. ke-2. Rhode Island: Idea Group Publisher. Han J, Kamber M Data Mining: Concept and Techniques. Ed. ke-2. San Francisco: Morgan Kaufmann Publishers. Ho TK, Hull JJ, Srihari SN Desicion Combination in Multiple Classifier Systems. IEEE Transactions on Analisys and Machine Intelegence 16(1): Juniawan I Klasifikasi Dokumen Teks Berbahasa Indonesia Menggunakan Minor Component Analysis [Skripsi]. Bogor: Departemen Ilmu Komputer, IPB. Kim SB Poisson Naive Bayes for Text Classification with Feature Weighting. Di dalam: Adachi J, editor. Proceedings of the 6th International Workshop on Information Retrieval with Asian Languange; Sappro, 7 Juli Stroudsburg: Association for Computational Linguistics. hlm Li YH, Jain AK Classification of Text Document. The Computer Journal 41(8): Manning CD, Raghavan P, Schutze H Introduction to Information Retrieval. Cambridge: Cambridge University Press. Morales AI, Valdovinos RM, Sanchez JS On the Weighted Dynamic Classifier Selection with Local Accuracies. Di dalam: Grigoriadis K, editor. Proceedings of the 11th IASTED International Conference; Orlando, November Anaheim: ACTA Press. hlm Ramadhan R Klasifikasi Dokumen Berbahasa Indonesia Menggunakan Dinamic Classifier Selection with Local Accuracies (DCS-LA) [Skripsi]. Bogor: Departemen Ilmu Komputer, IPB. Ridha A Pengindeksan Otomatis Dengan Istilah Tunggal Untuk Dokumen Berbahasa Indonesia [Skripsi]. Bogor: Departemen Ilmu Komputer, IPB.

18 10 Woods K, Kegelmeyer WP, Bowyer K Combination of Multiple Classifiers Using Local Accuracy Estimates. IEEE Transactions on Pattern Analysis and Machine Intelligence 19(4): Xu L, Krzyzak A, Suen CY Methods of Combining Multiple Classifiers and Their Applications to Handwriting Recognition. IEEE Transactions on System, Man and Cybernetics 22(3):

19 LAMPIRAN 11

20 12 Lampiran 1 Contoh dokumen pertanian dalam format XML <DOC> <DOCNO>5</DOCNO> <TITLE>Studi Bedengan Kompos Permanen untuk Budidaya Kentang di Pekarangan</TITLE> <AUTHOR>Etty Sumiati dan Achmad Hidayat</AUTHOR> <TEXT> <P> Kebutuhan pupuk buatan/kimia untuk meningkatkan pertumbuhan dan hasil umbi kentang, sebagian dapat disubstitusi melalui pemanfaatan bahan limbah organik. Penelitian ini bertujuan untuk mengetahui teknik pengomposan dan efektivitas bedengan kompos untuk budidaya tanaman kentang di lahan kering. Penelitian dilakukan di dataran tinggi Samarang, Garut, Jawa Barat. Percobaan menggunakan Rancangan Acak Kelompok dengan enam ulangan. Perlakuan pada bedengan permanen terdiri atas empat macam formula, yaitu berbagai campuran limbah organik, serta pupuk kandang sapi sebagai kontrol. Hasil penelitian menunjukkan bahwa bedengan permanen yang digarit dan diisi limbah organik pupuk kandang sapi 20 t/ha ditambah pupuk NPK ( ),memberikan pertumbuhan serta hasil dan kualitas umbi kentang kultivar Granola yang tertinggi. Selain itu, proses dekomposisi limbah organik pupuk kandang sapi sangat cepat, hal ini tercermin dari nilai C/N yang terendah setelah satu bulan terjadi proses pengomposan. </P> </TEXT> </DOC>

21 13 Lampiran 2 Contoh dokumen berita dalam format XML <DOC> <DOCNO>Bulu_tangkis_April_15</DOCNO> <TITLE>Target Satu Poin kian Terbuka</TITLE> <AUTHOR>Iwan Kurniawan</AUTHOR> <DATE>Senin, 13 April 2009</DATE> <TEXT> <P> KEBERHASILAN pebulu tangkis Markis Kido/Hendra Setiawan dalam menyabet juara di Kejuaraan Asia di Suwon, Korea Selatan, Minggu (12/4), semakin memperkuat satu poin kemenangan dari sektor ganda putra pada kejuaraan dunia beregu campuran Piala Sudirman di Guangzhou, China, Mei mendatang. Pelatih ganda putra Sigit Pamungkas, di Jakarta, Senin (13/4) mengatakan kemenangan di Suwon tersebut semakin memantapkan satu target juara di Piala Sudirman. "Melihat kekuatan yang ada, tentunya kami akan berusaha sekeras mungkin untuk menyumbangkan satu angka bagi tim," ujarnya. Satu angka kemenangan dikarenakan tim Piala Sudirman diperkuat peringkat satu dunia Markis/Hendra, peringkat delapan dunia Bona Septano/Mohammad Ahsan dan peringkat 11 dunia Rian Sukmawan/Yonatan Surtayama. "Kita memiliki tiga pasangan yang dapat mendukung tim. Saya kita peningkatan performa akan terus kami lakukan kepada atlet untuk mendapatkam hasil maksimal. Khususnya untuk Kido yang baru saja bertandingan, masih perlu istirahat untuk mengembalikan kondisi," tandasnya. Sementara itu, pelatih ganda putri Aryono Miranat terlihat sibuk melakukan latihan service kepada para pemain ganda putri seperti Shendy Puspa Irawati, Meliana Jauhari, Greysia Polii, dan Nitya Krishinda. Menurutnya, teknik permainan masih perlu diperbaiki di sisa waktu yang ada. "Teknik masih akan ditingkatkan karena lawan juga telah mengantisipasinya," jelas Aryono. Di tempat yang sama, Shendy yang kini berada di peringkat sembilan dunia bersama Meliana mengungkapakan teknik permainan masih perlu ditingkatkan. Apalagi bila bermain dalam lima set yang nota bene sangat menguras tenaga. "Saya masih terus fokus berlatih agar dapat bermain baik di lima set," jelasnya. Penambahan teknik permainan service, ucap Shendy, menjadi upaya yang baik untuk mengukur kekuatan selama proses latihan. "Pelatih sudah menyarankan beberapa hal penting sehingga kami akan menerapkannya," tukasnya. Sementara itu, guna mempersiapkan keberangkatan ke China, PB PBSI akan menyelenggarakan outbound pada April. "Masih ada dua opsi untuk penentuan tempat yaitu di Sukabumi atau Bogor," ujar Ketua Bidang Pembinaan Prestasi Lius Pongoh. Sejak memenangi Piala Sudirman pada 1989, Indonesia belum pernah lagi menjadi juara turnamen tersebut. Walaupun tujuh kali menjadi finalis, termasuk dalam dua edisi terakhir. Pada final 2005 di Beijing dan 2007 di Glasgow Skotlandia, Indonesia kalah dari juara bertahan negara 'Tirai Bambu' masing-masing dengan skor 0-3. (IK/OL-03) </P> </TEXT> </DOC>

22 14 Lampiran 3 Perbandingan akurasi setiap classifier dan DCS-LA untuk dokumen pertanian No. Dokumen Rocchio Bayes Bernoulli Poisson NB DCS- LA DCS-LA 3 classifier dengan IDW DCS-LA 4 classifier tanpa IDW 1 jurnalhorti1.txt jurnalhorti102.txt jurnalhorti117.txt jurnalhorti127.txt jurnalhorti133.txt jurnalhorti141.txt jurnalhorti155.txt jurnalhorti159.txt jurnalhorti166.txt jurnalhorti17.txt jurnalhorti178.txt jurnalhorti19.txt jurnalhorti209.txt jurnalhorti263.txt jurnalhorti34.txt jurnalhorti4.txt jurnalhorti43.txt jurnalhorti49.txt jurnalhorti51.txt jurnalhorti60.txt jurnalhorti69.txt jurnalhorti75.txt jurnalhorti82.txt jurnalhorti87.txt jurnalhorti91.txt jurnalhorti100.txt jurnalhorti106.txt jurnalhorti108.txt jurnalhorti113.txt jurnalhorti121.txt jurnalhorti124.txt jurnalhorti126.txt jurnalhorti130.txt jurnalhorti14.txt jurnalhorti22.txt jurnalhorti23.txt jurnalhorti25.txt jurnalhorti31.txt jurnalhorti53.txt jurnalhorti55.txt

23 15 Lampiran 3 Lanjutan No. Dokumen Rocchio Bayes Bernoulli Poisson NB DCS- LA DCS-LA 3 classifier dengan IDW DCS-LA 4 classifier tanpa IDW 41 jurnalhorti59.txt jurnalhorti62.txt jurnalhorti65.txt jurnalhorti70.txt jurnalhorti77.txt jurnalhorti78.txt jurnalhorti83.txt jurnalhorti85.txt jurnalhorti93.txt jurnalhorti97.txt jurnalhorti10.txt jurnalhorti105.txt jurnalhorti112.txt jurnalhorti12.txt jurnalhorti149.txt jurnalhorti15.txt jurnalhorti177.txt jurnalhorti21.txt jurnalhorti210.txt jurnalhorti28.txt jurnalhorti33.txt jurnalhorti38.txt jurnalhorti41.txt jurnalhorti46.txt jurnalhorti54.txt jurnalhorti56.txt jurnalhorti64.txt jurnalhorti66.txt jurnalhorti71.txt jurnalhorti73.txt jurnalhorti76.txt jurnalhorti79.txt jurnalhorti9.txt jurnalhorti90.txt jurnalhorti95.txt Total Presentasi 61.33% 65.33% 61.33% 58.67% 66.67% 64% 61.33% Keterangan : 1 = Kelas prediksi benar 0 = Kelas prediksi salah

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #8 Text Classification (Manning, Ch.13, p.288/253) Ad Hoc Retrieval vs Standing Query User mencari informasi dengan memberikan satu atau lebih query terhadap koleksi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes Jurnal... Vol. XX, No. X, Bulan 20XX, XX-XX 1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes Abraham Koroh 1, Kartina Diah

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA Techno.COM, Vol. 15, No. 3, Agustus 216: 195-2 METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA Andrew Yova Kencana 1, Setia Astuti 2 1,2 Jurusan Teknik Ilmu

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

HASIL DAN PEMBAHASAN. menggunakan formula (4) dan (5) untuk setiap kelasnya berdasarkan tabel confusion matrix.

HASIL DAN PEMBAHASAN. menggunakan formula (4) dan (5) untuk setiap kelasnya berdasarkan tabel confusion matrix. yang tidak berarti sebagai pembeda antar dokumen. c. Pembobotan indeks yaitu pembobotan secara lokal dan global. Pembobotan lokal dilakukan dengan cara menghitung frekuensi kemunculan kata dan total seluruh

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama

Lebih terperinci

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER ACHMAD FAHRUROZI 1 1 Universitas Gunadarma, achmad.fahrurozi12@gmail.com Abstrak Masalah yang akan diangkat dalam makalah ini adalah bagaimana

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Indonesia merupakan negara tropis yang memiliki + 30.000 spesies tumbuh-tumbuhan ([Depkes] 2007). Tumbuh-tumbuhan tersebut banyak yang dibudidayakan sebagai tanaman hias. Seiring

Lebih terperinci

MEN BAHASA INDONESIA MENGGUNAKAN SE EMANTIC SMOOTHING

MEN BAHASA INDONESIA MENGGUNAKAN SE EMANTIC SMOOTHING KLASIFIKASII DOKUMEN BAHASA INDONESIA MENGGUNAKAN SEMANTIC SMOOTHING DENGAN EKSTRAKSI CIRI CHI-SQUARE NOFEL SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMA ATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIANN

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem

Lebih terperinci

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN) Klasifikasi Helpdesk Universitas Jenderal Achmad ni... (Herawan dkk.) KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP KATA PENGANTAR Syukur Alhamdulillah, puji dan syukur kami panjatkan kehadirat Allah SWT, karena dengan limpah dan rahmat dan karunia-nya penulis dapat menyelesaikan penyusunan laporan tugas akhir APLIKASI

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam

Lebih terperinci

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Jurnal Teknik Komputer Unikom Komputika Volume 3, No.2-2014 TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Selvia Lorena Br Ginting 1), Wendi Zarman

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

INVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB

INVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB INVERSE CLASS FREQUENCY DAN NAÏVE BAYES PADA KLASIFIKASI DUAL STAGE PADA DOKUMEN BERBAHASA ARAB Dika R. Yunianto dikarizky66@gmail.com Septyawan R. Wardhana rossywardhana@gmail.com Rizka W. Sholikah rizkaws@gmail.com

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen

Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Elisabeth Adelia Widjojo, Antonius Rachmat C, R. Gunawan Santosa Program Studi Teknik Informatika, Fakultas Teknologi

Lebih terperinci

Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan Lulus Tepat Waktu (Studi Kasus : Fakultas Ilmu Komputer Universitas Brawijaya)

Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan Lulus Tepat Waktu (Studi Kasus : Fakultas Ilmu Komputer Universitas Brawijaya) Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 4, April 2018, hlm. 1726-1732 http://j-ptiik.ub.ac.id Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO Sendy Winanta Yetli Oslan, Gunawan Santoso Abstrak Penjurusan siswa kelas X SMA yang akan naik

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA DENGAN PEMILIHAN FITUR C4.5 DAN KLASIFIKASI NAIVE BAYES SEPTIANDI WIBOWO

PERINGKASAN TEKS BAHASA INDONESIA DENGAN PEMILIHAN FITUR C4.5 DAN KLASIFIKASI NAIVE BAYES SEPTIANDI WIBOWO PERINGKASAN TEKS BAHASA INDONESIA DENGAN PEMILIHAN FITUR C4.5 DAN KLASIFIKASI NAIVE BAYES SEPTIANDI WIBOWO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN 10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.

Lebih terperinci

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA Erik Hadi Saputra 1), Burhan Alfironi Muktamar 2) 1), 2) Teknik Informatika

Lebih terperinci

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik

Lebih terperinci

PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN

PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN Herfina 1) 1) Program Studi Ilmu Komputer, FMIPA Universitas Pakuan Jl. Pakuan PO BOX 452, Ciheuleut Bogora email : herfinario@yahoo.com

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Jurnal Ilmiah Ilmu Komputer, Vol 15 No. 2, Desember 2010 : 38-41 Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Vera Yunita, Yeni Herdiyeni Departemen Ilmu

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data Setelah dilakukan analisis clustering maka algoritme tersebut akan dibandingkan berdasarkan cluster yang terbentuk dari hasil analisis cluster-nya. Hasil perbandingan diharapkan dapat membuktikan bahwa

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1 1.1 Latar Belakang BAB I PENDAHULUAN Dalam Peraturan Menteri Agama Republik Indonesia Nomor 30 Tahun 2014 tentang Biaya Kuliah Tunggal dan Uang Kuliah Tunggal pada Perguruan Tinggi Keagamaan Negeri di

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

PENGKLASIFIKASIAN BUNGA DENGAN MENGGUNAKAN METODE ISOMAP DAN NAIVE BAYES CLASSIFIER

PENGKLASIFIKASIAN BUNGA DENGAN MENGGUNAKAN METODE ISOMAP DAN NAIVE BAYES CLASSIFIER PENGKLASIFIKASIAN BUNGA DENGAN MENGGUNAKAN METODE ISOMAP DAN NAIVE BAYES CLASSIFIER Rifki Kosasih 1, Achmad Fahrurozi 2 1,2 Fakultas Teknologi Industri, Universitas Gunadarma Jl. Margonda Raya No. 100,

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang

Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang 1 Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang Ari Sulistiyo 1 1,3 Jurusan Teknik Informatika, FASILKOM UDINUS Jln. Nakula 1 No.5-11 Semarang

Lebih terperinci

PENERAPAN DATA MINING UNTUK RENCANA SUKSESI SUMBER DAYA MANUSIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DI PT POS INDONESIA

PENERAPAN DATA MINING UNTUK RENCANA SUKSESI SUMBER DAYA MANUSIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DI PT POS INDONESIA PENERAPAN DATA MINING UNTUK RENCANA SUKSESI SUMBER DAYA MANUSIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DI PT POS INDONESIA 1 Muhammad Hafiz Ardiansyah, 2 Wahyu Nurjaya WK 1 Program Studi Teknik Informatika,

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier. PENGGUNAAN METODE NAÏVE BAYES CLASSIFIER PADA APLIKASI PERPUSTAKAAN Selvia Lorena Br Ginting,S.Si., MT 1, Reggy Pasya Trinanda 2 1,2 Jurusan Teknik Komputer Unikom, Bandung 1 selvialorena@yahoo.com, 2

Lebih terperinci

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION)

DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION) DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION) Steffi Budi Fauziah¹, Shaufiah², Mahmud Dwi Suliiyo³ ¹Teknik Informatika,, Universitas Telkom

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0 PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C.0 Rachma Fauzia Azhary, Isnandar Slamet, Supriyadi Wibowo Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Desain penelitian adalah tahapan atau gambaran yang akan dilakukan dalam melakukan penelitian, untuk memperlancar proses penelitian maka desain penelitian

Lebih terperinci

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO)

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) Levina Fitri Rahmawati, Isnandar Slamet, dan Diari Indriati Program

Lebih terperinci

SPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH

SPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH SPAM FILTER MENGGUNAKAN MODEL KLASIFIKASI MULTIVARIATE BERNOULLI DAN MULTINOMIAL NAIVE BAYES DENIS FADILLAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala Metode Klasifikasi (SVM Light dan K-NNK NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech Jurusan Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Alur dan Proses Cleaning Process Dokumen

Lebih terperinci

Jurnal Politeknik Caltex Riau

Jurnal Politeknik Caltex Riau 1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id IMPLEMENTASI TEXT MINING DALAM KLASIFIKASI JUDUL BUKU PERPUSTAKAAN MENGGUNAKAN METODE NAIVE BAYES Siti Amelia Apriyanti 1), Kartina Diah Kesuma Wardhani

Lebih terperinci

DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED

DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED DETEKSI SUBJEKTIFITAS TEKS BERBAHASA INDONESIA MENGGUNAKAN METODE LEXICON RULE BASED Tugas Akhir Diajukan Untuk Memenuhi Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

Gambar 1.1 Proses Text Mining [7]

Gambar 1.1 Proses Text Mining [7] 1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM34 Temu Kembali Informasi KULIAH #7 Text Classifiation Ad Ho Retrieval User menari informasi dengan memberikan satu atau lebih query terhadap koleksi terkini. : menari multiore omputer hips terbaru.

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA ISSN : 2338-4018 PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA Agus Panoto ( ragilpanoto@gmail.com ) Yustina Retno Wahyu Utami ( yustina.retno@gmail.com

Lebih terperinci

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan BAB I PENDAHULUAN Sebagai negara berkembang, perekonomian Indonesia didorong untuk tumbuh dengan pesat. Salah satu indikator pertumbuhan perekonomian yang baik adalah tingginya daya beli masyarakat. Tingginya

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie / JUPITER Volume XV No.2 (2016) 109 KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie Staf Pengajar Teknik Informatika, Fakultas Ilmu Komputer

Lebih terperinci

KLASIFIKASI DOKUMEN MENGGUNAKAN BACKGROUND SMOOTHING ANDY PRAMURJADI

KLASIFIKASI DOKUMEN MENGGUNAKAN BACKGROUND SMOOTHING ANDY PRAMURJADI KLASIFIKASI DOKUMEN MENGGUNAKAN BACKGROUND SMOOTHING ANDY PRAMURJADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010 KLASIFIKASI DOKUMEN MENGGUNAKAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci