ISSN SUPPORT VECTOR MACHINE PADA INFORMATION RETRIEVAL. Oleh....(I Ketut Purnamawan)

Ukuran: px
Mulai penontonan dengan halaman:

Download "ISSN SUPPORT VECTOR MACHINE PADA INFORMATION RETRIEVAL. Oleh....(I Ketut Purnamawan)"

Transkripsi

1 ISSN SUPPORT VECTOR MACHINE PADA INFORMATION RETRIEVAL Oleh I Ketut Purnamawan Jurusan Manajemen Informatika Fakultas Teknik dan Kejuruan Universitas Pendidikan Ganesha tutpurna@yahoo.com ABSTRAK SVM merupakan classsifier yang mempunyai keunggulan dapat mengolah data berdimensi tinggi, tanpa mengalami penurunan performa yang signifikan. SVM sekarang ini semakin banyak dipergunakan. Pada information retrieval, SVM juga sudah banyak digunakan, khususnya pada bagian proses klasifikasi. Kemampuan SVM untuk mengolah data berdimensi besar sangat cocok untuk diterapkan pada data teks yang cenderung berdimensi besar. Pada tulisan ini dibahas perbandingan performa SVM dengan performa classsifier lain pada information retrieval. Pembahasan dilakukan berdasarkan hasil penelitian beberapa peneliti. Pada satu penelitian didapatkan bahwa SVM mengungguli classsifier lain. Pada penelitian lain didapatkan performa SVM berimbang dengan classsifier lain. Pada akhir tulisan dibahas mengenai langkah-langkah klasifikasi teks menggunakan SVM. Proses klasifikasi teks ini digunakan pada information retrieval data teks. Kata kunci : SVM, Information retrieval, classsifier. ABSTRACT SVM is classsifier that can process high-dimension data, without a significant loss in performance. SVM is now more widely used. In information retrieval, SVM has also been widely used, especially in the classification process. SVM ability to process high-dimension data is very suitable to be applied to the text data, which is has highdimension data. In this paper discussed the SVM performance comparisons with other classsifier performance in information retrieval. The discussion is based on the results of studies of several researchers. In one study it was found that SVM outperformed other classsifier. In the other study found SVM performance comparable with other classsifier. At the end of the paper, also discussed about the steps of text classification using SVM. This text classification process used in information retrieval of text data. Keywords : SVM, Information retrieval, classsifier. 1. PEDAHULUAN SVM (Support Vector Machine) adalah salah satu classsifier yang sekarang banyak digunakan untuk melakukan berbagai keperluan klasifikasi. Selain untuk klasifikasi, SVM juga digunakan untuk regresi. SVM merupakan binary classifier yang membagi data menjadi dua class dengan sebuah hyperplane. Hyperplane ini tepat berada di tengah-tengah kedua class dengan jarak d ke titik data terdekat untuk masing-masing class. d disebut margin, dan titik-titik data yang berada tepat pada jarak d dari hyperplane disebut support vector. Hyperplane SVM dinyatakan dengan persamaan sebagai berikut. w x + b = 0 Support Vector Machine...(I Ketut Purnamawan)

2 174 ISSN dimana w merupakan normal dari hyperplane, dan b w adalah jarak hyperplane ke titik origin. Gambar 1 memperlihatkan hyperplane yang membagi dua buah class. Gambar 1: Hyperplane membagi dua buah class. (sumber gambar: Fletcher (2009)) Titik-titik data yang masuk ke class 1 adalah titik-titik data yang memenuhi persamaan w x + b 1 dan titik-titik data yang masuk ke class 2 adalah titik-titik data yang memenuhi persamaan w x + b 1 Pada information retrieval SVM juga banyak digunakan, terutama pada proses klasifikasi data. Kemampuannya untuk mengolah data berdimensi besar menjadi keunggulan SVM dibanding dengan classsifier lain. Pada information retrieval data teks, keunggulan SVM untuk mengolah data berdimensi besar dapat dimanfaatkan, karena sifat data teks yang biasanya berdimensi besar. Pada tulisan ini akan dibahas perbandingan performa SVM dengan performa classsifier lain pada information retrieval. Perbandingan dibahas berdasarkan hasil penelitian beberapa peneliti. Di akhir tulisan juga dibahas langkah-langkah klasifikasi data teks. Proses klasifikasi ini digunakan pada proses information retrieval data teks. JPTK, UNDIKSHA, Vol. 12, No. 2, Juli 2015 :

3 ISSN PEMBAHASAN 2.1. SVM pada Information Retrieval dan Perbandingannya dengan algoritmaalgoritma lain Pada saat sekarang SVM telah banyak diterakan pada bidang information retrieval. Sebagian besar penggunaan SVM pada information retrieval adalah pada pengklasifikasian dan pengkategorian dokumen, serta pada proses searching yang menerapkan relevancy feedback. Selain penggunaan pada dua hal tersebut, SVM juga digunakan untuk proses perengkingan pada document retrieval. Kemampuan SVM yang cepat walaupun untuk data berdimensi tinggi kadang-kadang menjadi solusi yang tepat untuk keperluan information retrival yang membutuhkan kecepatan. Joachims (1998) mengenalkan SVM untuk text categorization. Di dalam tulisannya Joachims memberikan bukti secara teoritis dan secara eksperimen bahwa SVM sangat cocok untuk text categorization. Secara teoritis Joachims mengemukakan beberapa alasan mengapa SVM cocok digunakan untuk text categorization. Beberapa alasannya adalah sebagai berikut. 1. High dimensional input space: Pada text categorization akan didapati jumlah fitur yang sangat besar (lebih dari 10000), dan SVM cenderung tidak tergantung pada besarnya dimensi data. 2. Few irrelevant features: Karena sangat sedikit fitur-fitur yang tidak relevan, maka pemilihan fitur untuk tujuan mereduksi dimensi menjadi tidak efektif. 3. Document vectors are sparse: Vector-vector yang mewakili dokumen hanya memiliki sedikit bagian yang tidak bernilai 0. Kivinen, Warmuth, dan Auer (1995) memberikan bukti secara teoritis dan empiris, bahwa algoritma seperti SVM sangat cocok untuk menyelesaikan permasalahan seperti ini. 4. Most text categorization problems are linearly separable: Semua kategori dari data Ohsumed terpisah secara linear, begitu juga sebagian besar data Reuters. Ide dasar SVM adalah untuk medapatkan pemisah linear seperti itu. Secara eksperimen, Joachims membandingakn SVM dengan beberapa algoritma lain yaitu, Bayes, Rocchio, R4.5, dan k-nn. Dari hasil eksperimen diketahui bahwa SVM menghasilkan performa yang baik, mengungguli algoritma-algoritma lainnya secara substansial dan signifikan. Pada information retrieval, SVM juga digunakan pada proses relevance feedback. Pada information retrieval yang menggunakan relevancy feedback, feedback yang diberikan oleh user digunakan sebagai data training SVM, dimana selanjutnya classifier yang dihasilkan digunakan untuk menghasilkan result baru dengan tingkat relefansi lebih Support Vector Machine...(I Ketut Purnamawan)

4 176 ISSN tinggi. Proses pemberian feedback ini bisa dilakukan secara iteratif. Drucker, Shahrary, dan Gibbon (2002) membandingkan SVM dengan beberapa algoritma lain untuk information retrieval menggunakan relevancy feedback. Drucker, Shahrary, dan Gibbon (2002) membandingkan SVM dengan Rocchio, Ide, dan Ide dec-hi pada information retrieval dokumen teks menggunakan relevancy feedback. Dari kesimpulan yang diambil, Drucker, Shahrary, dan Gibbon kemudian memberikan 3 buah rekomendasi sebagai berikut. 1. Jika menggunakan TF-IDF weighting, dan dapat dipastikan bahwa pencarian awal dapat menghasilkan banyak dokumen yang relevan, maka SVM secara tipis lebih baik dari Ide dec-hi. Namun bagaimanapun, algoritma Ide dec-hi lebih simpel, lebih cepat, dan tidak perlu khawatir terhadap konvergensi algoritma SVM. Tidak pernah ada masalah dengan konvergensi, tapi hal itu bisa saja terjadi. 2. Jika lebih memilih untuk tidak menggunakan fitur TF-IDF, gunakan SVM dengan binary fiature weighting. 3. Gunakan SVM jika tidak bisa dipastikan seberapa berhasil pencarian awal yang akan dilakukan, karena jika pencarian awal jelek, maka algoritma-algoritma selain SVM akan memunyai performa yang buruk. Pada information retrieval, SVM juga digunakan untuk proses perengkingan dokumen. Perengkingan dokumen berbasis SVM dikenalkan oleh Herbrich, Graepel, dan Obermayer (1999). Cao dkk.(2006) yang mengacu metode yang dikenalkan oleh Herbrich, Graepel, dan Obermayer sebagai Ranking SVM (RSVM) menggunakannya kembali untuk information retrieval dengan menambahkan dua pilihan optimasi, yaitu gradient descent dan quadratic programming, dan menamai metodenya Ranking SVM for IR (RSVM-IR). Cao dkk. membandingkan RSVM-IR dengan BM25, dan language model for information retrieval (LMIR). Dari hasil percobaan yang dilakukan diambil kesimpulan bahwa RSVM-IR mengungguli Ranking SVM dan algoritma lainya secara signifikan. Colas dan Brazdil (2006) membandingkan SVM dengan k-nn dan Naive Bayes. Algoritma-algoritma dibandingkan dalam versi optimasi masing-masing. Hasil yang didapatkan menunjukkan bahwa semua algoritma mendapatkan performa yang sebanding di sebagian besar permasalahan. Satu hasil yang mengejutkan adalah SVM bukan merupakan pemenang sejati, meskipun cukup baik untuk performa keseluruhan. Jika preprocessing yang sesuai diterapkan pada k-nn, maka algoritma ini mendapatkan hasil JPTK, UNDIKSHA, Vol. 12, No. 2, Juli 2015 :

5 ISSN yang sangat bagus secara terus menerus. Naive Bayes juga mendapatkan performa yang bagus Langkah-langkah klasifikasi teks menggunakan SVM Proses klasifikasi teks dengan menggunakan SVM hampir sama dengan klasifikasi objek lain dengan menggunakan SVM. Perbedaannya terletak pada proses ekstraksi fitur. Pada information retrieval, proses ekstraksi fitur dikenal sebagai proses weighting. Secara garis besar langkah-langkah klasifikasi teks dengan SVM adalah indexing, weighting, training, dan testing Indexing Indexing merupakan suatu preprocessing dalam klasifikasi teks. Jika dokumen yang akan diklasifikasi sudah mengalami indexing sebelumnya, maka proses klasifikasi cukup menggunakan index dokumen untuk ekstraksi fitur. Jika dokumen belum di index, maka pada proses klasifikasi diperlukan proses searching dan pengorganisasian terms yang prosesnya tidak sederhana. Proses indexing penting karena weighting menggunakan ada tidaknya atau jumlah suatu term pada dokumen Weighting Proses weighting adalah kata lain dari ekstraksi fitur. Ada beberapa macam cara weighting, yaitu, binary weighting, term frequency (TF), inverse document frequency (IDF), dan perpaduan antara TF dan IDF disebut TF-IDF. Binary weighting adalah pembentukan vektor fitur dengan melihat ada tidaknya suatu term di dokumen tersebut. TF adalah pembentukan vektor fitur dari jumlah suatu term pada suatu dokumen. IDF adalah TF dikalikan dengan Log(N/n i ) dimana N adalah jumlah keseluruhan dokumen, dan n i adalah jumlah dokumen yang mengandung term tersebut. TF-IDF adalah kombinasi TF dan IDF dimana TF dikalikan oleh IDF. Pertama-tama ruang vektor fitur dibentuk dengan menghitung jumlah jenis kata yang terdapat di seluruh dokumen. Jika pada keseluruhan dokumen terdapat 1000 yang berbeda, maka vektor fitur akan berdimensi 1000, dimana setiap bagian vektor mewakili satu kata. Dimensi vektor dapat direduksi dengan cara mem-prunning kata-kata yang tidak signifikan. Setelah ruang vektor terbentuk, selanjutnya vektor-vektor yang mewakili suatu dokumen dibentuk dengan menggunakan salah satu metode weighting. Misalkan dari koleksi dokumen yang terdiri dari 500 dokumen ditemukan 1000 jenis kata yang berbeda, Support Vector Machine...(I Ketut Purnamawan)

6 178 ISSN jika tidak dilakukan prunning, maka akan didapatkan ruang vector berdimensi Misalkan dimensi pertama mewakili kata bola, dan dimensi ke-2 mewakili kata buku, maka jika pada dokumen pertama terdapat kata bola dan tidak terdapat kata buku, jika menggunakan binary weighting, maka vector yang mewakili dokumen pertama dimensi pertamanya akan bernilai 1 dan dimensi ke-2 nya bernilai 0. Jika dimensi pertama disebut x 1 dan dimensi ke-2 disebut x 2 maka x 1 = 1, dan x 2 = 0, dan seterusnya. Jika pada dokumen pertama terdapat 25 buah kata bola dan 5 buah kata buku, jika menggunakan TF maka vektor fitur untuk dokumen pertama x 1 = 25, dan x 2 = 5. IDF jarang dipergunakan karena prosesnya yang lebih komplek. Pada IDF vektor fitur baru dapat dibentuk setelah melakukan pernghitungan pada seluruh dokumen Training Setelah vektor-vektor fitur terbentuk, lengkap dengan labelnya masing-masing, maka vector-vector tersebut telah siap dimasukkan ke SVM untuk dijadikan data training. Yang perlu dijadikan perhatian pada proses training adalah permasalahan tunning terhadap parameter-parameter SVM. Penentuan parameter yang tepat akan menghasilkan classifier yang lebih baik. Namun permasalahannya adalah, sampai saat ini belum ada teori yang bisa menjadi dasar bagaimana cara untuk menentukan parameter-parameter SVM secara tepat. Selama ini cara yang dilakukan adalah metode coba-coba melalui proses iterasi. Selain itu untuk menentukan jenis kernel yang dipakaipun seharusnya terlebih dahulu harus diketahui sifat-sifat data, namun pada kenyataannya hal ini jarang terjadi. Sehingga untuk data yang tidak diketahui sifatnya, para peneliti lebih memilih menggunakan RBF kernel. Hasil keluaran SVM dari proses training adalah nilai alpha untuk setiap vektor dan sebuah nilai b. Untuk vektor yang bukan merupakan support vectors, nilai alpha-nya akan bernilai 0. Classifier akan dibentuk oleh nilai-nilai alpha dan nilai b Testing Pada saat testing diperlukan nilai-nilai alpha dan nilai b yang didapatkan pada saat training untuk melakukan proses klasifikasi. Vektor-vektor fitur yang dijadikan data testing dimasukkan ke SVM tanpa disertai labelnya beserta nilai-nilai alpha dan b. Keluaran hasil testing berupa label class hasil klasifikasi. Untuk mengecek tingkat akurasi classifier, label keluaran ini kemudian dibandingkan dengan label aslinya. JPTK, UNDIKSHA, Vol. 12, No. 2, Juli 2015 :

7 ISSN Masalah Multiclass Sebagian besar permasalahan klasifikasi yang dijumpai pada klasifikasi teks bersifat binary classification, misalnya pada proses filltering, yang dibutuhkan adalah jawaban ya atau tidak, pada relevancy feedback yang diperlukan adalah jawaban relevan atau tidak. Namun dalam beberapa kasus, permasalahan multiclass bisa muncul. Melihat sifat dasar SVM yang merupakan sebuah binary classifier, maka diperlukan suatu sekenario untuk menggunakan SVM sebagai multiclass classifier. Ada dua sekenario yang sering digunakan, yaitu sekenario one against one, dan one against all. Pada sekenario one against one dibuat sejumlah classifier yang memisahkan satu class dengan satu class lain. Setiap pasangan class diadu satu sama lain, class yang paling menang dijadikan sebagai class label akhir. Pada sekenario one against all, dibuat sejumlah classifier yang memisahkan satu class dengan semua class lainnya. Di saat data masuk ke suatu class dimana menghasilkan jarak yang paling jauh dari hyperplane, maka kelas tersebut dijadikan class label data tersebut. Untuk jumlah kelas yang banyak, sekenario one against one sulit untuk dilakukan, karena akan diperlukan banyak sekali classifier Masalah Perengkingan Masalah perengkingan biasanya timbul pada saat pengembalian suatu hasil query. Kadang kala, tidak semua hasil query yang bisa didapatkan oleh mesin disuguhkan kepada user, dan mungkin hanya sebagian kecilnya saja. Dari itu diusahakan supaya hasil yang ditampilkan kepada user adalah hasil yang paling baik. Untuk itu diperlukan suatu proses perengkingan. Proses perengkingan pada pengembalian hasil query mirip dengan proses sekenario one against all pada kasus klasifikasi multiclass. Bedanya adalah pada proses perengkingan ini hanya ada satu classifier. Nilai rengking ditentukan dari seberapa jauh letak vektor fitur dari hyperplane. Semakin jauh letak vektor fitur dari hyperplane, semakin jelas bahwa data tersebut masuk ke class tersebut, maka semakin baik rengking nya. 3. PENUTUP SVM dapat diterapkan pada berbagai bagian dalam information retrieval, seperti pengklasifikasian dan pengkategorian dokument atau teks, proses relefancy feedback, dan perengkingan dokumen. Kemampuan SVM yang tidak terpengaruh dimensi data sangat cocok untuk menyelesaikan masalah-masalah yang berkaitan dengan dimensi besar pada Support Vector Machine...(I Ketut Purnamawan)

8 180 ISSN information retrieval yang tidak bisa ditanggulangi oleh algoritma-algoritma lain. Dari hasil beberapa percobaan yang dilakukan oleh beberapa peneliti, dalam beberapa kasus, SVM sangat singnifikan mengungguli algoritma lain. Dalam percobaan yang lain ditunjukkan bahwa SVM mempunyai performa berimbang dengan beberapa algoritma lain dalam beberapa kasus. DAFTAR PUSTAKA Cao, Y., dkk Adapting Ranking SVM to document retrieval. SIGIR '06 Proceedings of the 29th annual international ACM SIGIR conference on Research and development in information retrieval. Page Colas, F., Brazdil, P Comparison of SVM and some older classification algorithms in text classification tasks. Artificial Intelligence in Theory and Practice. Page Springer US. Drucker, H., Shahrary, B., Gibbon, D. C Support Vector Machines: Relevance feedback and information retrieval. Information Processing and Management 38, Pergamon. Fletcher, T Support Vector Machine explained. UCL. Fletcher/. Herbrich, R., Graepel, T., Obermayer, K Large margin rank boundaries for ordinal regression. Advances in neural information processing systems. Page MIT. Joachims, T Text categorization with Support Vector Machines: Learning with many relevant features. Machine Learning: ECML-98, Lecture Notes in Computer Science Volume 1398, 1998, pp Springer Berlin Heidelberg. Kivinen, J., Warmuth, M. K., Auer, P The Perceptron algorithm versus Winnow: linear versus logarithmic mistake bounds when few input variables are relevant. Artificial Intelligence 97 (1997) Elsevier. JPTK, UNDIKSHA, Vol. 12, No. 2, Juli 2015 :

SVM untuk Regresi Ordinal

SVM untuk Regresi Ordinal MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

SVM untuk Ranking. Model Linear

SVM untuk Ranking. Model Linear MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman 811-820 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA

Lebih terperinci

SVM untuk Regresi. Machine Learning

SVM untuk Regresi. Machine Learning MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

BUKU RANCANGAN PEMBELAJARAN

BUKU RANCANGAN PEMBELAJARAN BUKU RANCANGAN PEMBELAJARAN Mata Kuliah Machine Learning oleh Dr. rer. nat. Hendri Murfi Program Studi Magister Matematika Departemen Matematika - FMIPA Universitas Indonesia 2013 DAFTAR ISI DAFTAR ISI

Lebih terperinci

ABSTRAK. Universitas Kristen Maranatha

ABSTRAK. Universitas Kristen Maranatha ABSTRAK Perkembangan multimedia saat ini sangat cepat. Dengan multimedia, pengguna dapat menyerap informasi dengan lebih mudah, sehingga pemilihan informasi yang tepat menjadi penting. Pemilihan informasi

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai

Lebih terperinci

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali BAB I PENDAHULUAN 1.1. Latar Belakang Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali objek 3 dimensi. Sistem penglihatan manusia dapat membedakan berbagai macam objek 3 dimensi

Lebih terperinci

Support Vector Machine

Support Vector Machine MMA10991 Topik Khusus Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

Seleksi Fitur Dua Tahap Menggunakan Information Gain dan Artificial Bee Colony untuk Kategorisasi Teks Berbasis Support Vector Machine

Seleksi Fitur Dua Tahap Menggunakan Information Gain dan Artificial Bee Colony untuk Kategorisasi Teks Berbasis Support Vector Machine Seleksi Fitur Dua Tahap Menggunakan Information Gain dan Artificial Bee Colony untuk Kategorisasi Teks Berbasis Support Vector Machine Khalid 1), Bagus Setya Rintyarna 2), Agus Zainal Arifin 3) 1) Prodi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian 4.1.1 Support Vector Machines (SVM) Setelah melalui proses training dan testing dengan metode Support Vector Machines (SVM), diperoleh hasil yang tertera

Lebih terperinci

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. BAB II DASAR TEORI Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. 2.1. Microsoft Visual Studio Microsoft Visual Studio adalah sebuah software yang

Lebih terperinci

PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE

PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE Vol 2, No 3 Juni 2012 ISSN 2088-2130 PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE Devie Rosa Anamisa 1), Eka Mala Sari Rochman 2) 1,2 Teknik Informatika, Fakultas

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan

Lebih terperinci

Analisis Akurasi Support Vector Machine...

Analisis Akurasi Support Vector Machine... ANALISIS AKURASI SUPPORT VECTOR MACHINE DENGAN FUNGSI KERNEL GAUSSIAN RBF UNTUK PRAKIRAAN BEBAN LISTRIK HARIAN SEKTOR INDUSTRI Luqman Assaffat 1 * 1 Jurusan Teknik Elektro, Fakultas Teknik, Universitas

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

KLASIFIKASI CITRA DOKUMEN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DENGAN EKSTRAKSI CIRI TERM FREQUENCY INVERSE DOCUMENT FREQUENCY

KLASIFIKASI CITRA DOKUMEN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DENGAN EKSTRAKSI CIRI TERM FREQUENCY INVERSE DOCUMENT FREQUENCY KLASIFIKASI CITRA DOKUMEN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DENGAN EKSTRAKSI CIRI TERM FREQUENCY INVERSE DOCUMENT FREQUENCY Arif Munandar *), Achmad Hidayatno, and Teguh Prakoso Departemen Teknik

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM) KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI Disusun Oleh : SRI MAYA SARI DAMANIK 24010210120002 JURUSAN STATISTIKA

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector Machine (SVM)

Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa Menggunakan Support Vector Machine (SVM) Scientific Journal of Informatics Vol. 3, No. 1, Mei 20xx p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Metode K-Means untuk Optimasi Klasifikasi Tema Tugas Akhir Mahasiswa

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

SKRIPSI. Oleh : PUSPHITA ANNA OCTAVIANI NIM PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM)

SKRIPSI. Oleh : PUSPHITA ANNA OCTAVIANI NIM PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG SKRIPSI Oleh : PUSPHITA ANNA OCTAVIANI NIM. 24010210120043 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

SUPPORT VECTOR MACHINE (SVM)

SUPPORT VECTOR MACHINE (SVM) MAKALAH DATA MINING SUPPORT VECTOR MACHINE (SVM) Di Susun Oleh : Nama : RA. Toyyibatul Faihah NRP : 07.04.111.00132 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS TRUNOJOYO 2010 1 PENDAHULUAN 1.1

Lebih terperinci

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Jurnal Ilmiah Ilmu Komputer, Vol 15 No. 2, Desember 2010 : 38-41 Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Vera Yunita, Yeni Herdiyeni Departemen Ilmu

Lebih terperinci

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI Disusun Oleh : MEKAR SEKAR SARI NIM. 24010210120008 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE

IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Jurnal Informatika Polinema ISSN: 2407-070X IMPLEMENTASI TWITTER SENTIMENT ANALYSIS UNTUK REVIEW FILM MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE Faisal Rahutomo 1, Pramana Yoga Saputra 2, Miftahul Agtamas

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan

Lebih terperinci

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,

Lebih terperinci

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM)

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) SKRIPSI Diajukan sebagai salah satu syarat Untuk memperoleh gelar Sarjana Teknik Oleh: WANTO NIM.

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST

PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST MAKARA, SAINS, VOL. 7, NO.3, DESEMBER 2003 PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST Zuherman Rustam 1,3, Benyamin Kusumoputro 2,3 dan Belawati Widjaja

Lebih terperinci

Pengantar Support Vector Machine

Pengantar Support Vector Machine Pengantar Support Vector Machine Anto Satriyo Nugroho February 8, 2007 1 Pengantar Pattern Recognition (PR) didefinisikan sebagai proses pemetaan suatu data ke dalam konsep tertentu yang telah didefinisikan

Lebih terperinci

DAFTAR ISI. BAB I PENDAHULUAN 1.1 Latar Belakang Tujuan Penelitian Manfaat Penelitian... 4

DAFTAR ISI. BAB I PENDAHULUAN 1.1 Latar Belakang Tujuan Penelitian Manfaat Penelitian... 4 DAFTAR ISI Halaman Judul... Halaman Pengesahan... Halaman Pernyataan... Halaman Pernyataan Publikasi... Kata Pengantar... Daftar Isi... Daftar Gambar... Daftar Tabel... Daftar Arti Lambang... Daftar Singkatan...

Lebih terperinci

OPTIMALISASI SUPPORT VEKTOR MACHINE (SVM) UNTUK KLASIFIKASI TEMA TUGAS AKHIR BERBASIS K-MEANS

OPTIMALISASI SUPPORT VEKTOR MACHINE (SVM) UNTUK KLASIFIKASI TEMA TUGAS AKHIR BERBASIS K-MEANS TELEMATIKA, Vol. 13, No. 02, JULI, 2016, Pp. 59 68 ISSN 1829-667X OPTIMALISASI SUPPORT VEKTOR MACHINE (SVM) UNTUK KLASIFIKASI TEMA TUGAS AKHIR BERBASIS K-MEANS Oman Somantri (1), Slamet Wiyono (2), Dairoh

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Masalah Pemilihan dosen pembimbing Tugas Akhir pada jurusan Teknik Informatika Universitas Muhammadiyah Malang dilakukan mahasiswa secara mandiri, hal

Lebih terperinci

KLASIFIKASI DOKUMEN MENGGUNAKAN KOMBINASI ALGORITMA PRINCIPAL COMPONENT ANALYSIS DAN SVM

KLASIFIKASI DOKUMEN MENGGUNAKAN KOMBINASI ALGORITMA PRINCIPAL COMPONENT ANALYSIS DAN SVM ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5140 KLASIFIKASI DOKUMEN MENGGUNAKAN KOMBINASI ALGORITMA PRINCIPAL COMPONENT ANALYSIS DAN SVM DOCUMENT CLASSIFICATION USING

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM) ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 1, Tahun 2015, Halaman 123-132 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO

Lebih terperinci

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad 1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal

Lebih terperinci

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin

Lebih terperinci

UJI KINERJA LEARNING TO RANK DENGAN METODE SUPPORT VECTOR REGRESSION

UJI KINERJA LEARNING TO RANK DENGAN METODE SUPPORT VECTOR REGRESSION IndoMS Journal on Industrial and Applied Mathematics Volume. 2, Issue. 1 (2015), pp. 15-25 UJI KINERJA LEARNING TO RANK DENGAN METODE SUPPORT VECTOR REGRESSION ABDUL AZIS ABDILLAH, HENDRI MURFI, DAN YUDI

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas

Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan

Lebih terperinci

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN

INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN INTEGRASI PERINGKAS DOKUMEN OTOMATIS SEBAGAI FEATURE REDUCTION PADA CLUSTERING DOKUMEN Abu Salam 1, Catur Supriyanto 2, Amiq Fahmi 3 1,2 Magister Teknik Informatika, Univ. Dian Nuswantoro Email: masaboe@yahoo.com

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014 ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014 Klasifikasi Informasi, Anjuran dan Larangan pada Hadits Shahih Bukhari menggunakan Metode Support Vector Machine. Andina

Lebih terperinci

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Di era globalisasi seperti sekarang ini, perkembangan teknologi komputer berpengaruh besar pada tingkat kebutuhan manusia di berbagai bidang seperti bidang

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS

PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS PENGGUNAAN FITUR ABSTRAKSI DAN CATATAN PUBLIKASI PENULIS UNTUK KLASIFIKASI ARTIKEL ILMIAH DENGAN METADATA YANG TERBATAS Halimatus Sa dyah, Nurissaidah Ulinnuha Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

Perbandingan Algoritma Pendeteksian Spam

Perbandingan Algoritma Pendeteksian Spam Perbandingan Algoritma Pendeteksian Spam Andros, Dimas Prawita, Juan Karsten, Maldy Vinandar Fakultas Ilmu Komputer, Universitas Indonesia Depok, Jawa Barat, Indonesia andros@ui.ac.id, dimas.prawita@ui.ac.id,

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #8 Text Classification (Manning, Ch.13, p.288/253) Ad Hoc Retrieval vs Standing Query User mencari informasi dengan memberikan satu atau lebih query terhadap koleksi

Lebih terperinci

ABSTRAK. Kata Kunci : klasifikasi, musik digital, jenis musik, support vector machine, fitur ekstraksi, daftar putar musik digital

ABSTRAK. Kata Kunci : klasifikasi, musik digital, jenis musik, support vector machine, fitur ekstraksi, daftar putar musik digital ABSTRAK Kemudahan dalam mendapatkan musik digital membuat orang-orang dapat memiliki banyaknya koleksi musik digital. Terkadang orang-orang menikmati musik dengan jenis musik tertentu berdasarkan kondisi

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR RIZKY NOVRIYEDI PUTRA 1132001001 PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN 10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.

Lebih terperinci

Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto

Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Parametric dan zone Index Sebuah dokumen, selain tersusun dari deretan term, juga

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

Penerapan Algoritma K-Means untuk Clustering

Penerapan Algoritma K-Means untuk Clustering Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 71 Penerapan Algoritma K-Means untuk ing Dokumen E-Jurnal STMIK GI MDP Ernie Kurniawan* 1, Maria Fransiska 2, Tinaliah 3, Rachmansyah

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Pengolahan Citra Digital [3] Citra atau gambar didefinisikan sebagai sebuah fungsi dua dimensi, f(x,y), di mana x dan y adalah koordinat bidang datar, dan harga fungsi f di setiap

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat mempermudah akses terhadap informasi tekstual yang sangat besar jumlahnya, baik yang terdapat pada Internet maupun pada koleksi dokumen

Lebih terperinci

Model Linear untuk Klasifikasi

Model Linear untuk Klasifikasi MMA10991 Topik Khusus - Machine Learning Model Linear untuk Klasifikasi Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439,

Lebih terperinci

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE

ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE ANALISIS SENTIMEN PADA ULASAN BUKU BERBAHASA INGGRIS MENGGUNAKAN INFORMATION GAIN DAN SUPPORT VECTOR MACHINE SENTIMENT ANALYSIS ON THE ENGLISH BOOK REVIEWS USING INFORMATION GAIN AND SUPPORT VECTOR MACHINE

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

Deteksi Mobil Menggunakan Histogram of Oriented Gradient

Deteksi Mobil Menggunakan Histogram of Oriented Gradient 1 Deteksi Mobil Menggunakan Histogram of Oriented Gradient Cahyo Permata,I Ketut Eddy Purnama dan Muhtadin Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut Teknologi Sepuluh Nopember (ITS)

Lebih terperinci

VECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto

VECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model index berdasar pada bobot untuk binary retrieval model Memahami

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci

Information Retrieval

Information Retrieval Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?

Lebih terperinci

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi

Lebih terperinci

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami

Lebih terperinci