KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) ARINY

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) ARINY"

Transkripsi

1 KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) ARINY DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Fragmen Metagenome Menggunakan Metode Support Vector Machine (SVM) adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2013 Ariny NIM G

4 ABSTRAK ARINY. Klasifikasi Fragmen Metagenome Menggunakan Metode Support Vector Machine (SVM). Dibimbing oleh WISNU ANANTA KUSUMA dan MUSHTHOFA. Analisis metagenome merupakan salah satu bidang kajian bioinformatika yang penting. Bidang ini terkait dengan analisis sequences genom yang diperoleh langsung dari lingkungan. Tujuan penelitian ini adalah melakukan klasifikasi fragmen metagenome ke dalam beberapa taksonomi dengan menggunakan metode support vector machine (SVM). Proses ekstraksi fitur dilakukan dengan menggunakan spaced k-mers. Proses klasifikasi diawali dengan membuat model menggunakan data latih dari 381 organisme. Berdasarkan hasil penelitian ini dapat diketahui bahwa nilai akurasi untuk fragmen berukuran pendek (400 bp) ialah 65.3% pada takson genus dan 82.1% pada takson filum. Sementara itu, nilai akurasi meningkat secara signifikan menjadi 95.4% pada takson genus dan 97.6% pada takson filum, ketika menggunakan fragmen yang berukuran panjang (10 Kbp). Dari hasil tersebut dapat disimpulkan bahwa nilai akurasi akan semakin tinggi seiring dengan semakin panjangnya ukuran fragmen dan semakin tingginya tingkat taksonomi. Selain itu, dari hasil penelitian juga dapat disimpulkan bahwa metode ekstraksi fitur yang digunakan sudah sangat baik dan menghasilkan data dengan kondisi linearly separable. Kata kunci: binning, metagenome, spaced k-mers, SVM ABSTRACT ARINY. Metagenome Fragment Binning Using Support Vector Machine (SVM) Method. Supervised by WISNU ANANTA KUSUMA and MUSHTHOFA. Metagenome analysis is one of the most important bioinformatics field. This field is related to genome which is taken directly from the environment. The purpose of this research is to classify metagenome fragment into some taxonomic levels using support vector machine (SVM) method. Feature extraction is performed using spaced k-mers. Classification process is conducted by creating model using the training data from 381 organisms. The evaluation results show that the accuracies for short fragments (400 bp) are 65.3% and 82.1% at genus level and phylum level, respectively. Meanwhile, the accuracies increase significantly for long fragments (10 kbp), with a value of 95.4% at genus level and 97.6% at phylum level. It can be stated that the accuracy will be increased with the increasing of fragments length and higher taxonomic levels. In addition, the results of the study also conclude that the feature extraction methods used was very good and produce data with linearly separable conditions. Keywords: binning, metagenome, spaced k-mers, SVM

5 KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) ARINY Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

6 Penguji: Prof Dr Antonius Suwanto

7 Judul Skripsi : Klasifikasi Fragmen Metagenome Menggunakan Metode Support Vector Machine (SVM) Nama : Ariny NIM : G Disetujui oleh Dr Wisnu Ananta Kusuma, ST MT Pembimbing I Mushthofa, SKom MSc Pembimbing II Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Shalawat dan salam penulis sampaikan kepada Nabi Muhammad shallallahu alaihi wasallam, keluarganya, sahabatnya, serta umatnya hingga akhir zaman. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan September 2012 ini ialah klasifikasi fragmen metagenome, dengan judul Klasifikasi Fragmen Metagenome Menggunakan Metode Support Vector Machine (SVM). Terima kasih penulis ucapkan kepada seluruh pihak yang telah berperan dalam penelitian ini, yaitu: 1 Ayahanda Arnedy Syamsu, Ibunda Dona Elfira, Kakak Ohayyo Randy Akbar, serta Aditya Ramadhan atas kasih sayang, doa, semangat, dan dorongan kepada penulis sehingga dapat menyelesaikan penelitian ini. 2 Bapak Dr Wisnu Ananta Kusuma, ST MT dan Bapak Mushthofa, SKom MSc selaku pembimbing, yang telah memberikan banyak ide, masukan, dan dukungan kepada penulis. 3 Bapak Prof. Antonius Suwanto yang telah bersedia menjadi penguji, dan memberikan saran yang berharga sehingga tulisan ini menjadi lebih baik dari sebelumnya. 4 Rekan-rekan terdekat Anisaul Muawwanah, Sabarina Hidayat, Husnul Khotimah, Dewi Humaira, Dian Lestari Auliani, Lizza Amini Gumilar, dan Viani Rahmawati yang telah memberi dukungan dan bantuan. 5 Aries Fitriawan, Muhammad Luthfi Fajar, Erwin Musa, dan Aditya Erlangga yang telah membantu mengatasi kesulitan pemrograman yang penulis hadapi. 6 Rekan-rekan Ilmu Komputer angkatan 46 yang saling menyemangati selama pengerjaan penelitian di tahun yang sama. 7 Seluruh rekan satu bimbingan Bapak Wisnu yang tidak dapat disebutkan satu persatu dan pihak-pihak lainnya. Semoga penelitian dan tulisan ini dapat memberikan manfaat. Bogor, Juli 2013 Ariny

9 DAFTAR ISI DAFTAR TABEL vii DAFTAR GAMBAR vii DAFTAR LAMPIRAN vii PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 2 Tujuan Penelitian 2 Manfaat Penelitian 3 Ruang Lingkup Penelitian 3 METODE 3 Pengumpulan Data 4 Pembagian Data 4 Praproses Data 4 Ekstraksi Fitur 4 Support Vector Machine (SVM) 5 Grid Search 7 Pelatihan SVM 7 Pengujian SVM 7 Analisis 7 Implementasi 8 HASIL DAN PEMBAHASAN 8 Pembagian Data 8 Praproses Data 9 Ekstraksi Fitur 9 Grid Search 10 Klasifikasi SVM 10 Analisis 11 Implementasi 18 SIMPULAN DAN SARAN 18 Simpulan 18 Saran 19 DAFTAR PUSTAKA 19

10 LAMPIRAN 21

11 DAFTAR TABEL 1 Hasil akurasi berdasarkan tingkat taksonomi dan panjang fragmen 11 2 Perbandingan waktu komputasi pembuatan model pada setiap kernel 15 3 Daftar organisme yang memiliki similarity dari hasil alignment Burkholderia sp JV3 pada BLAST 17 DAFTAR GAMBAR 1 Tahapan penelitian 3 2 Pola spaced k-mers dengan parameter w = 3 dan d = 0, 1, 2 (Kusuma 2012) 5 3 Kondisi linearly separable dengan hyperlane yang memiliki margin terbesar 5 4 Contoh hasil praproses data dengan jumlah fragmen 9600 dan panjang fragmen 400 bp 9 5 Hasil grid search mengeluarkan nilai parameter c dan γ terbaik serta akurasi 5-cross validation 10 6 Hasil akurasi berdasarkan tingkat taksonomi dan panjang fragmen 12 7 Perbandingan akurasi pada takson order, kelas, dan filum bila pembuatan model dilakukan untuk takson genus saja ( ) dan untuk setiap takson ( ) 13 8 Sensitivity takson genus 13 9 Specificity takson genus Sensitivity takson filum Specificity takson filum Akurasi menggunakan 4 fungsi kernel berbeda untuk panjang fragmen 10 Kbp dan takson genus Hasil klasifikasi data uji Burkholderia sp JV3 (genus Stenotrophomonas) pada panjang fragmen 400 bp Hasil klasifikasi data uji Burkholderia sp JV3 (genus Stenotrophomonas) pada panjang fragmen 1 Kbp Hasil klasifikasi data uji Burkholderia sp JV3 (genus Stenotrophomonas) pada panjang fragmen 10 Kbp 16 DAFTAR LAMPIRAN 1 Daftar nama organisme data latih 21 2 Daftar nama organisme data uji 30 3 Daftar tingkat taksonomi yang digunakan mulai dari genus, order, kelas dan filum 35 4 Daftar hasil praproses data yang menyatakan jumlah sequence di setiap tingkat takson dan panjang fragmennya untuk data latih 37 5 Daftar hasil praproses data yang menyatakan jumlah sequence di setiap tingkat takson dan panjang fragmennya untuk data uji 40

12 6 Nilai parameter c dan γ terbaik yang didapat pada tahap grid search 43 7 Perbandingan akurasi yang dihasilkan dari pembuatan model hanya pada takson genus dengan pembuatan model disetiap tingkat takson 44 8 Tahapan dan tampilan pengguna sistem 45

13 PENDAHULUAN Latar Belakang Analisis metagenome merupakan salah satu bidang kajian bioinformatika yang penting dan akan terus berkembang. Studi yang mempelajari metagenome ini disebut metagenomics. Berbeda dengan studi yang mempelajari genom (genomics), metagenomics tidak memerlukan pure clonal cultures dari sequencing individu tertentu. DNA yang berasal dari berbagai organisme dalam suatu komunitas mikrob dapat diperoleh melalui proses sequencing secara langsung (McHardy dan Rigoutsos 2007). Proses DNA sequencing komunitas mikrob secara langsung ini menghasilkan fragmen-fragmen dari berbagai organisme yang bercampur. Kondisi ini memungkinkan fragmen dari suatu organisme memiliki overlap dengan fragmen dari organisme lain. Kondisi ini dapat menyebabkan kesalahan perakitan fragmen-fragmen yang terkandung di dalam komunitas tersebut dan menghasilkan cymeric contigs (Wooley et al. 2010). Untuk meminimalkan cymeric contigs, salah satu solusinya adalah dengan melakukan sequence assembly dan binning secara berulang. Proses binning dalam persepktif ilmu komputer dapat dilakukan dengan metode supervised atau unsupervised learning. Pada metode supervised learning, fragmen-fragmen diklasifikasikan berdasarkan level taksonomi tertentu, misalnya yang paling rendah ialah level genus, mengingat sulitnya mengklasifikasikan fragmen pada level spesies. Beberapa peneliti telah melakukan penelitian yang terkait dengan pengklasifikasian fragmen metagenome ini. McHardy et al. (2007) melakukan penelitian untuk mengklasifikasikan fragmen metagenome dengan menggunakan data latih 340 organisme. Metode yang digunakan ialah multiclass support vector machine (SVM) dengan frekuensi k-mers sebagai fiturnya. Aplikasi yang dibangun dinamai PhyloPythia. Hasil akurasi yang diperoleh terbilang cukup tinggi khususnya untuk panjang fragmen 5 Kbp yaitu antara 60% sampai 90% di setiap tingkat takson. Tetapi akurasi ini terus menurun dengan signifikan jika menggunakan fragmen dengan panjang 3 Kbp. Pada fragmen dengan panjang 3 Kbp hanya diperoleh akurasi sebesar 40% sedangkan untuk panjang fragmen 1 Kbp akurasi yang diperoleh < 10%. Selain itu, PhyloPythia menggunakan 5-mers, yang berarti matriks fitur yang dihasilkan memiliki dimensi 4 5 = Proses ekstraksi fitur yang melibatkan dimensi yang besar ini memerlukan waktu komputasi yang tinggi. Untuk mengatasi problem komputasi pada PhyloPythia yang diakibatkan oleh dimensi fitur yang besar, Kusuma dan Akiyama (2011) mengusulkan metode klasifikasi fragmen metagenome dengan menggunakan SVM dan characterization vector sebagai fiturnya. Characterization vector diusulkan oleh Liu et al. (2006) yang hanya terdiri atas 12 dimensi. Untuk mengevaluasinya, Kusuma dan Akiyama (2011) mengimplementasikannya pada dataset kecil yang merepresentasikan komunitas mikrob kecil. Untuk data latih digunakan 10 organisme, sedangkan untuk data uji digunakan 9 organisme yang merepresentasikan organisme baru. Organisme yang digunakan pada data uji ialah organisme yang berbeda dengan data latih, namun termasuk ke dalam genus yang

14 2 sama. Penelitian ini hanya mengklasifikasikan organisme ke dalam tingkat takson genus. Organisme-organisme tersebut merupakan anggota dari 3 jenis genus berbeda. Hasil akurasi yang diperoleh dari penelitian ini cukup tinggi yaitu 78% untuk panjang fragmen 500 bp sampai dengan 87% untuk panjang fragmen 10 Kbp. Namun, ketika metode ini diterapkan pada dataset berukuran besar (374 organisme), akurasi yang diperoleh menurun secara signifikan, yaitu sebesar 30% untuk panjang fragmen 1 Kbp pada level genus. Oleh karena itu, untuk mengatasi masalah komputasi yang disebabkan oleh dimensi fitur yang besar dan menurunnya akurasi jika menggunakan dataset dari komunitas organisme yang besar, pada penelitian ini diusulkan metode multiclass SVM dengan frekuensi spaced k-mers sebagai fiturnya. Fitur hasil ekstraksi dengan menggunakan spaced k-mers hanya terdiri atas 192 dimensi. Adapun dataset yang digunakan untuk data latih terdiri atas 381 organisme dan untuk data uji terdiri atas 200 organisme. Fragmen DNA dari organisme tersebut akan diklasifikasikan ke dalam tingkat takson genus, order, kelas, dan filum. Selain itu juga digunakan 4 fungsi kernel berbeda pada pelatihan SVM untuk mengetahui kernel yang dapat menghasilkan model terbaik untuk pengklasifikasian fragmen metagenome. Perumusan Masalah Adapun permasalahan yang akan menjadi bahan analisis pada penelitian ini ialah: 1 Berapa akurasi yang dapat diperoleh jika digunakan metode SVM dengan 4 fungsi kernel yang akan diterapkan pada penelitian ini? 2 Bagaimana pengaruh panjang fragmen yang digunakan terhadap hasil akurasi? 3 Bagaimana kinerja metode klasifikasi yang diusulkan ini ketika melakukan pengklasifikasian fragmen metagenome yang berasal dari organisme-organisme baru? 4 Apakah pembuatan model untuk setiap tingkat takson bisa menghasilkan akurasi yang lebih baik bila dibandingkan dengan pembuatan model pada takson genus saja? Tujuan Penelitian Tujuan penelitian ini ialah: 1 Mengklasifikasikan fragmen metagenome ke dalam tingkat taksonominya dengan metode SVM menggunakan 4 fungsi kernel. Keempat kernel yang digunakan yaitu Gaussian radial basis function (RBF), linear (polinomial berderajat 1), kuadratik (polinomial berderajat 2), dan polinomial berderajat 3. 2 Mengetahui pengaruh panjang fragmen yang digunakan terhadap hasil akurasi. 3 Mengetahui kinerja metode pengklasifikasian terhadap fragmen yang berasal dari organisme baru. 4 Menjustifikasi pembuatan model setiap tingkat takson bisa menghasilkan akurasi yang lebih baik bila dibandingkan dengan pembuatan model hanya pada takson genus.

15 3 Manfaat Penelitian Manfaat dari penelitian ini diharapkan dapat memberikan kontribusi untuk mendukung proses analisis metagenome sequence. Ruang Lingkup Penelitian Ruang lingkup penelitian ini meliputi: 1 Data latih terbatas hanya 381 organisme yang termasuk dalam 48 genus, 31 order, 20 kelas, dan 13 filum. 2 Data uji terbatas hanya 200 organisme yang termasuk dalam taksonomi yang sama dengan data latih, dengan tambahan 1 genus yang tidak ada pada modelnya pada data latih untuk mengetahui kinerja pengklasifikasian SVM. 3 Fragmen yang digunakan dihasilkan dari perangkat lunak MetaSim yang mensimulasikan Illumina sequencer. Fragmen yang dihasilkan memiliki panjang yang tetap dan tidak mengandung sequencing error. 4 Level taksonomi yang digunakan yaitu genus, order, kelas, dan filum. METODE Penelitian ini dilaksanakan dalam beberapa tahapan yang diilustrasikan pada Gambar 1. Mulai Data metagenome NCBI Pembagian data Data training Praproses data Ekstrasi fitur Data testing Praproses data Ekstrasi fitur SVM Grid search Pelatihan SVM Pengujian SVM Analisis Implementasi Selesai Gambar 1 Tahapan penelitian

16 4 Pengumpulan Data Data latih dan data uji yang digunakan pada penelitian ini ialah data metagenome yang diunduh dari situs National Centre for Biotechnology Information (NCBI). NCBI merupakan suatu institusi yang fokus di bidang biologi molekuler dan menjadi sumber informasi untuk perkembangan bidang tersebut. Data metagenome ini merupakan sequence DNA organisme dengan format FastA. Alamat untuk mengunduh data ini yaitu ftp://ftp.ncbi.nih.gov/ genomes/bacteria/. Pembagian Data Pada penelitian ini organisme yang digunakan terbatas pada 381 organisme untuk data latih, dan 200 organisme untuk data uji. Pemilihan data uji dilakukan dengan mengambil organisme selain data latih yang juga termasuk ke dalam genus yang sama, serta 1 genus yang tidak termasuk dalam data latih. Pengambilan data uji yang tidak ada modelnya pada data latih ini untuk melihat kinerja hasil pengklasifikasiannya. Praproses Data Pada tahap praproses data, sequence DNA metagenome yang sudah dipilih lalu diuraikan fragmennya menggunakan perangkat lunak MetaSim (Richter et al. 2008). MetaSim adalah perangkat lunak untuk mensimulasikan sequencer. Data yang diproses dibaca berulang kali disesuaikan dengan kebutuhan penelitian. Pada penelitian ini data yang disiapkan untuk data latih berjumlah 9600 dan 320 ribu fragmen, sedangkan untuk data uji berjumlah 100 ribu fragmen. Panjang fragmen yang ditetapkan untuk setiap kali pengolahan yaitu 400 bp, 800 bp, 1 Kbp, 3 Kbp, 5 Kbp, dan 10 Kbp. Maka akan dilakukan 12 kali pengolahan untuk data latih dan 6 kali pengolahan untuk data uji, sehingga dihasilkan 18 fail FastA yang berisi fragmen sesuai dengan kebutuhan penelitian. Data latih dengan jumlah fragmen 9600 disiapkan sebagai data pendekatan pencarian parameter terbaik untuk kernel, sedangkan data latih dengan jumlah fragmen 320 ribu menjadi data masukan untuk pembuatan model. Penggunaan data latih kecil sebagai pendekatan pencarian paramater terbaik ini didasarkan pada percobaan yang dilakukan oleh McHardy et al. (2007). Ekstraksi Fitur Proses selanjutnya ialah ekstraksi fitur, tahapan ini dilakukan untuk data latih dan data uji. Metode ekstraksi fitur yang digunakan ialah spaced k-mers. Ada 2 buah variabel yang berpengaruh pada metode ekstraksi fitur ini, yaitu w (weight of pattern) adalah banyaknya posisi yang cocok, dan d adalah jumlah posisi don t care. Mengacu pada penelitian Kusuma (2012), pola terbaik spaced k-mers dengan nilai w = 3 dan d = 0, 1, 2 dapat dilihat pada Gambar 2. Metode ini memeriksa frekuensi nukleotida dari setiap fragmen DNA mulai dari AAA sampai GGG, A*AA sampai G*GG, dan A**AA sampai G**GG, sehingga didapat 192 dimensi fitur. Pengertian dari simbol * (don t care) pada fragmen DNA yang diperiksa adalah dapat berupa basa apapun, baik A, C, T,

17 5 Gambar 2 Pola spaced k-mers dengan parameter w = 3 dan d = 0, 1, 2 (Kusuma 2012) maupun G. Kemudian untuk simbol ** berarti diperbolehkan pasangan basa apapun mengisi 2 bit tersebut, sehingga kondisi ini dapat diisi oleh 2 4 pasang basa mulai dari AA, AC, AT, AG, dan seterusnya hingga GG. Support Vector Machine (SVM) SVM merupakan metode pengklasifikasian biner yang dikembangkan oleh Vladimir Vapnik tahun Konsep dasar pembelajaran SVM ini ialah menemukan hyperplane (bidang pemisah) terbaik yang dapat memisahkan d- dimensi data dengan sempurna ke dalam 2 kelas (kelas +1 dan kelas -1). Secara intuitif, hyperplane yang dicari ialah yang dapat memaksimumkan jarak geometri hyperplane ke support vector-nya. Jarak tersebut diistilahkan dengan margin (Boswell 2002). Menurut Osuna et al. (2007) linearly separable data merupakan suatu kondisi data yang dapat dipisahkan secara linear. Pada Gambar 3 diilustrasikan kondisi lineraly separable dengan hyperlane yang memiliki margin terbesar. Himpunan n adalah dataset dan - adalah label kelas dari i data i. Kondisi linearly separable terpenuhi jika dapat dicari pasangan (w, b) sedemikian sehingga: Gambar 3 Kondisi linearly separable dengan hyperlane yang memiliki margin terbesar

18 6 w i b i ke as w i b i ke as dengan w adalah bidang normal dan b adalah posisi bidang relatif terhadap pusat koordinat. Kemudian, ruang hipotesis untuk data tersebut ialah set fungsi yang diberikan oleh: w b sign w b 3 Setelah dilakukan penyelesaian dengan formula Lagrangian menggunakan Lagrange multipier dan normalisasi parameter w, maka fungsi keputusan untuk menentukan kelas dari data uji x adalah: ( ) sign i i ( i ) i l dengan = koefisien Lagrange multipier. Salah satu kendala dalam pengklasifikasian ialah ketersediaan data yang besar dan beragam yang dapat mengakibatkan data tersebut tidak dapat dipisahkan secara linear. Untuk kasus ini SVM memperkena kan kernel yang dapat merepresentasikan atau mentransformasikan data ke dimensi lebih tinggi (lebih besar dari 2) dengan fungsi transformasi. Sehingga, data yang sudah berada di dimensi lebih tinggi tersebut dapat dengan mudah dipisahkan dengan hyperplane secara linear (Boswell 2002). Jika terdapat sebuah fungsi kernel K sehingga i i, maka fungsi transformasi tidak perlu diketahui secara tepat. Dengan demikian fungsi yang dihasilkan dari pelatihan adalah: l ( ) sign i i ( i ) i b b. 5 Terdapat 3 kernel yang biasa digunakan dalam SVM, yaitu sebagai berikut (Osuna et al. 1997) : 1 Gaussian radial basis function (RBF): ( ) e p - - (6) 2 Polinomial dengan derajat d: ( ) d, (7) 3 Multi layer perceptron (untuk beberapa nilai θ : ( ) tanh - θ. (8) Pada penyelesaian penelitian ini SVM yang digunakan ialah multiclass SVM dengan menggunakan library SVM bernama LibSVM (Hsu et al. 2003). LibSVM ini dapat diunduh pada alamat Multiclass SVM pada LibSVM ini mengimplementasikan teknik one-versus-one. Akan dilakukan N(N-1)/2 pengklasifikasian biner yang berbeda, dengan N adalah banyaknya kelas. Sehingga data baru yang akan ditentukan kelasnya, akan masuk ke dalam kelas yang memiliki nilai fungsi keputusan terbesar. Apabila terdapat dua kelas atau lebih yang memiliki nilai keputusan yang sama besar, maka kelas yang indeksnya lebih kecil dinyatakan sebagai kelas dari data tersebut (Hsu dan Lin 2002).

19 7 Grid Search Setelah diperoleh fitur, tahap selanjutnya ialah grid search menggunakan data latih dengan jumlah fragmen Tahapan ini dilakukan dengan fungsi grid search. Fungsi grid search mengeluarkan nilai parameter terbaik yang dibutuhkan saat pembentukan model (tahap pelatihan) menggunakan kernel RBF dan polinomial. Parameter untuk kernel RBF adalah cost (c) dan gamma (γ), sedangkan untuk kernel polinomial adalah cost (c), gamma (γ), degree (d), dan koeff 0 (r). Akan tetapi, parameter r pada polinomial yang dipakai hanya nilai default-nya saja yaitu 0. Selain mengeluarkan nilai parameter terbaik, fungsi ini juga mengeluarkan akurasi 5-cross validation dari data latih. Cross-validation merupakan metode statistika untuk mengevaluasi dan membandingkan algoritme pembelajaran dengan membagi data menjadi dua bagian. Satu bagian untuk melatih model dan bagian lainnya untuk memvalidasi model tersebut. Salah satu bentuk cross-validation adalah k-fold cross-validation. K-fold cross-validation akan membagi data menjadi k bagian berukuran sama. Secara bertahap akan dilakukan pelatihan dan validasi sebanyak k ulangan. Sehingga dalam setiap perulangan k-1 bagian akan menjadi data latih, dan 1 bagian sisanya akan digunakan untuk validasi (Refaeilzadeh et al. 2009). Pelatihan SVM Proses pelatihan SVM dilakukan untuk data latih hasil ekstraksi fitur dengan jumlah fragmen 320 ribu. Dalam pelatihan ini, akan diterapkan pelatihan menggunakan 4 fungsi kernel, yaitu kernel RBF, linear, kuadratik, dan polinomial berderajat 3. Pengujian SVM Hasil dari pelatihan SVM sebelumnya ialah sebuah model yang akan diuji menggunakan hasil ekstraksi fitur dari data uji. Pengujian akan mengklasifikasikan data uji sebanyak 200 organisme ke dalam kelas taksonominya. Semua organisme yang telah dikelaskan menghasilkan persentase hasil pengklasifikasiannya. Analisis Dari hasil pelatihan dan pengujian SVM dengan 4 fungsi kernel yang berbeda, akan didapatkan hasil untuk kinerja algoritme SVM ini. Kemudian akurasi untuk hasil klasifikasi dapat dicari dengan menggunakan rumus: akurasi data uji benar data uji 00% 9 Selain akurasi, akan dihitung pula sensitivity dan specificity yang dikelompokkan berdasarkan level taksonnya yang pada pembuatan model pengklasifikasian menggunakan kernel RBF. Pada penelitian ini nilai sensitivity dan specificity yang dihitung yaitu untuk takson genus yang mewakili takson terkecil dan filum yang mewakili takson terbesar. Panjang fragmen yang digunakan hanya 400 bp, 1 Kbp, dan 10 Kbp yang mewakili panjang fragmen

20 8 kecil, sedang, dan besar. Rumus yang digunakan untuk menghitung nilai sensitivity dan specificity, yaitu: sensiti it s eci icit true ositi es true ositi es alse ne ati es true ne ati es true ne ati es alse ositi es 00% 0 00% dengan true positive adalah data uji kelas x yang diklasifikasikan ke kelas x, true negative adalah data uji kelas x yang diklasifikasikan ke kelas selain x, false positive adalah data uji kelas selain x yang diklasifikasikan ke kelas x, dan false negative adalah data uji kelas selain x yang diklasifikasikan ke kelas selain x, dengan kelas x adalah kelas yang akan dihitung nilai sensitivity dan specificity-nya. Setelah seluruh perhitungan nilai akurasi, sensitivity, dan specificity dari hasil kinerja pengklasifikasian fragmen metagenome menggunakan SVM ini didapat, beberapa hal yang akan menjadi bahan analisis ialah: 1 pengaruh panjang fragmen yang digunakan terhadap hasil akurasi, 2 hasil sensitivity dan specificity yang didapat, 3 penggunaan 4 fungsi kernel berbeda pada pelatihan SVM, dan 4 hasil pengklasifikasian data uji yang tidak ada modelnya pada data latih. Implementasi Implementasi sistem dilakukan dalam lingkungan pengembangan sebagai berikut: 1 bahasa pemrograman : PHP, 2 library komputasi : LibSVM 3.12, dan 3 database management system (DBMS) : MySQL. Sistem yang dikembangkan memiliki fungsi utama yaitu melakukan prediksi tingkat taksonomi suatu sequence DNA. Data masukkan untuk sistem ini ialah sebuah sequence DNA, dan keluarannya ialah tingkat taksonominya. Tingkat taksonomi yang akan ditampilkan sebagai hasil prediksi yaitu genus, order, kelas, dan filum. Sistem ini se anjutnya dinamai Metagenome Binning. HASIL DAN PEMBAHASAN Pembagian Data Data metagenome yang merupakan sequences DNA organisme dengan format FastA yang sudah diunduh dari situs NCBI dipilih 381 organisme untuk data latih dan 200 organisme untuk data uji. Daftar organisme untuk data latih dan data uji yang digunakan pada penelitian ini dapat dilihat pada Lampiran 1 dan Lampiran 2. Pemilihan data uji dilakukan dengan mengambil organisme selain data latih yang termasuk ke dalam tingkat taksonomi yang sama. Selain itu pada data uji juga disertakan 1 organisme yang takson genusnya tidak ada di data latih. Hal ini dilakukan untuk mengetahui kinerja pengklasifikasian SVM terdahap

21 suatu kelas yang tidak ada modelnya. Untuk daftar taksonomi yang digunakan dapat dilihat pada Lampiran 3. Praproses Data Pada tahap praproses data, sequence DNA metagenome yang sudah dibagi menjadi data latih dan data uji akan diuraikan fragmennya menggunakan perangkat lunak MetaSim. Pada penelitian ini data yang dipersiapkan untuk data latih dibaca sebanyak 9600 dan 320 ribu kali. Sehingga didapat 9600 dan 320 ribu fragmen data latih yang diurai dari 381 organisme. Sedangkan untuk data uji dibaca sebanyak 100 ribu kali. Sehingga didapat 100 ribu fragmen data uji yang diurai dari 200 organisme. Hasil praproses data yang menyatakan jumlah sequence di setiap tingkat takson dan setiap panjang fragmen untuk data latih dan data uji dapat dilihat pada Lampiran 4 dan Lampiran 5. Pada setiap praproses data yang dilakukan, ditentukan 6 panjang fragmen yang akan digunakan yaitu 400 bp, 800 bp, 1 Kbp, 3 Kbp, 5 Kbp, dan 10 Kbp. Keluaran dari pengolahan MetaSim ini ialah fail FastA yang berisi sequence DNA yang sudah terfragmen sesuai dengan nilai parameter yang dimasukkan. Berikut contoh hasil praproses data untuk data latih dengan jumlah fragmen 9600 dan panjang fragmen 400 bp pada Gambar 4. Ekstraksi Fitur Metode ekstraksi fitur yang digunakan ialah spaced k-mers dengan nilai w = 3 dan d = 0, 1, 2 yang merupakan pola terbaik yang akan menghasilkan akurasi terbesar dari klasifikasi menurut Kusuma (2012). Hasil dari proses ekstraksi fitur ialah frekuensi tri-nukleotida dari fragmen DNA, sehingga akan terdapat 192 kombinasi tri-nukleotida mulai dari AAA sampai GGG, A*AA sampai G*GG, dan A**AA sampai G**GG Gambar 4 Contoh hasil praproses data dengan jumlah fragmen 9600 dan panjang fragmen 400 bp

22 10 Berikut contoh hasil ekstraksi fitur untuk data latih takson genus dengan jumlah fragmen 9600 dan panjang fragmen 400 bp: 1 1:12 2:4 3:5 4:10 5:4 6:3 7:1 8:9 9:4 10:8 11:9 12:3 13: :13 191:6 192:13 1 1:23 2:7 3:11 4:8 5:5 6:5 7:1 8:9 9:8 10:9 11:10 12:11 13: :8 191:4 192:4 1 1:7 2:2 3:11 4:5 5:1 6:5 7:3 8:5 9:7 10:14 11:5 12:5 13: :3 191:3 192: :18 2:6 3:7 4:8 5:6 6:11 7:7 8:2 9:7 10:5 11:9 12:8 13: :7 191:5 192:3 48 1:14 2:11 3:12 4:5 5:3 6:10 7:6 8:5 9:12 10:5 11:10 12:6 13: :5 191:3 192:5 Grid Search Fungsi grid search pada LibSVM akan mengeluarkan nilai parameter yang dibutuhkan oleh kernel RBF dan polinomial. Nilai parameter tersebut akan didapat dengan melakukan proses cross validation dengan k = 5. Parameter yang dibutuhkan untuk RBF ia ah gamma γ sedangkan untuk polinomial ialah gamma γ degree (d), dan koeff 0 (r). Salah satu hasil grid search yang didapat untuk data latih takson genus dengan jumlah fragmen 9600 dan panjang fragmen 400 bp dapat dilihat pada Gambar 5. Dari gambar tersebut ditunjukkan bahwa nilai terbaik untuk c 8 dan γ 0. 5 dengan akurasi 5-cross validation = 59.6%. Hasil grid search lainnya dari setiap data yang digunakan dapat dilihat pada Lampiran 6. Klasifikasi SVM Setelah didapatkan fitur untuk data latih dengan banyak fragmen 320 ribu, data uji dengan jumlah fragmen 100 ribu, serta parameter kernel yang dibutuhkan, proses dilanjutkan dengan klasifikasi SVM. Proses klasifikasi SVM diawali dengan menskalakan data latih dan data uji terlebih dahulu sebelum dilakukan pelatihan maupun pengujian. Proses penskalaan ini sangat penting sebelum diterapkan pengklasifikasian dengan SVM. Keuntungan utama dari penskalaan Gambar 5 Hasil grid search mengeluarkan nilai parameter c dan γ terbaik serta akurasi 5-cross validation

23 yaitu untuk menghindari atribut atau fitur bernilai besar yang bisa mendominasi fitur lain yang bernilai kecil. Selain itu penskalaan juga dapat mengurangi tingkat kesulitan perhitungan selama proses pengklasifikasian. Setelah proses penskalaan selesai, proses selanjutnya adalah melakukan pelatihan SVM. Data latih dilatih satu per satu dengan 4 fungsi kernel mulai dari RBF, linear, kuadratik, dan polinomial derajat 3 dengan nilai parameter kernel terkait. Sebanyak 24 pelatihan dilakukan menggunakan fungsi kernel RBF, sedangkan untuk kernel lainnya hanya dilakukan pelatihan 1 kali yaitu pada panjang fragmen 10 Kbp pada tingkat takson genus. Model yang sudah dihasilkan dari pelatihan sebelumnya digunakan untuk mengklasifikasikan data uji yang merepresentasikan fragmen metagenome dari organisme-organisme baru. Dari pengujian ini diperoleh akurasi dari hasil klasifikasi menggunakan Persamaan 9, sensitivity dan specificity dari setiap kelas yang ada pada takson genus menggunakan Persamaan 10 dan Persamaan 11. Analisis Analisis dilakukan atas hasil akurasi yang dihasilkan dengan memvariasikan panjang fragmen, tingkat taksonomi, dan kernel yang digunakan. Tingkat taksonomi dan panjang fragmen Analisis pengaruh panjang fragmen terhadap nilai akurasi yang diperoleh merupakan analisis yang penting. Data metagenome yang diambil dari lingkungan terdiri atas banyak organisme di dalamnya, sehingga mengandung jumlah nukleotida yang sangat besar, bahkan bisa mencapai megabases. Sementara itu, teknik untuk melakukan DNA sequencing saat ini hanya berhasil men-sequence fragmen 700 bp untuk pembacaan individua atau 00 bp bi a menggunakan pyrosequencing (metode sequencing DNA berdasarkan prinsip sequencing by synthesis McHardy et al. 2007). Berdasarkan kondisi tersebut, maka diharapkan suatu penelitian terkait dengan metagenome dapat menghasilkan akurasi yang baik bahkan pada panjang fragmen yang pendek. Untuk hasil akurasi berdasarkan tingkat taksonomi, nilai akurasi yang analisis merupakan nilai akurasi dari setiap panjang fragmen yang dicobakan yaitu 400 bp, 800 bp, 1 Kbp, 3 Kbp, 5 Kbp, dan 10 Kbp. Sehingga akan didapatkan 6 akurasi untuk setiap tingkat taksonomi mulai dari genus, order, kelas, dan filum. Hasil akurasi ini ditunjukkan pada Tabel 1, dan divisualisasikan pada Gambar 6. Pada penelitian ini, panjang fragmen terkecil yang dicobakan adalah 400 bp. Tabel 1 Hasil akurasi berdasarkan tingkat taksonomi dan panjang fragmen Panjang fragmen (Kbp) Akurasi (%) Genus Order Kelas Filum

24 12 Genus Order Kelas Filum 100 Akurasi (%) Gambar 6 Hasil akurasi berdasarkan tingkat taksonomi dan panjang fragmen Hasil akurasi yang diperoleh pada panjang fragmen tersebut dapat dikatakan sudah cukup baik yaitu sebesar 65.3% pada takson genus, 72.0% pada takson order, 78.2% pada takson kelas, dan mencapai 82.1% pada takson filum. Selanjutnya, bila dilihat pada penggunaan panjang fragmen terbesar yaitu 10 Kbp akurasi yang diperoleh yaitu 95.4% 97.6%. Bila dilakukan peninjauan dan penarikan kesimpulan dari pengaruh panjang fragmen yang digunakan pada penelitian, dapat dilihat bahwa semakin panjang fragmen yang digunakan maka akan semakin besar hasil akurasi yang diperoleh dan sebaliknya. Unsur nukleotida yang terdapat pada fragmen DNA merupakan unsur genetik yang dimiliki oleh suatu organisme. Setiap organisme memiliki ciri yang berbeda yang dapat dilihat dari perbedaan unsur genetik yang dimilikinya. Oleh sebab itu, apabila fragmen yang digunakan untuk proses pengklasifikasian besar, maka perbedaan unsur nukleotida pun semakin besar yang mengakibatkan hasil pengklasifikasian pun lebih baik. Sedangkan apabila fragmen yang digunakan pendek, maka akan banyak fragmen yang memilki oligonukleotida yang sama. Setelah dilakukan analisis terhadap akurasi dari setiap model di setiap tingkat taksonomi, hasil akurasi bila hanya dilakukan pembuatan model pada takson genus pun juga dilakukan. Akurasi yang dihasilkan dari pembuatan model untuk setiap tingkat takson menghasilkan akurasi yang lebih baik dibandingkan pembuatan model hanya untuk takson genus. Perbandingan akurasi ini dapat dilihat pada Gambar 7 dan Lampiran 7. Sehingga disimpulkan bahwa pembuatan model untuk setiap tingkat takson memang lebih baik apabila diinginkan hasil penelitian yang baik. Sensitivity dan specificity Panjang fragmen (Kbp) Perhitungan sensitivity dan specificity pada penelitian ini dibatasi pada takson genus dan filum saja, serta hanya pada panjang fragmen 400 bp, 1 Kbp, dan 10 Kbp. Penelitian dengan ekstasi fitur menggunakan spaced k-mers dan pengklasifikasian menggunakan metode SVM ini dapat menghasilkan sensitivity yang baik pada level takson genus, yang dapat dilihat pada Gambar 8. Nilai sensitivity yang didapat pada panjang fragmen 400 bp yaitu berada di antara 21.1% 85.2% dengan rata-rata sensitivity-nya 60.6%. Nilai sensitivity yang

25 Order 100 Kelas Akurasi (%) Akurasi (%) ,4 0, Panjang fragmen (Kbp) 100 Filum 0 0,4 0, Panjang fragmen (Kbp) Akurasi (%) ,4 0, Panjang fragmen (Kbp) Gambar 7 Perbandingan akurasi pada takson order, kelas, dan filum bila pembuatan model dilakukan untuk takson genus saja ( ) dan untuk setiap takson ( ) didapat pada panjang fragmen 1 Kbp yaitu berada di antara 43.4% 94.5% dengan rata-rata sensitivity-nya 79.2%. Nilai sensitivity yang didapat pada panjang fragmen 10 Kbp yaitu berada di antara 56.0% 100% dengan rata-rata sensitivitynya 95.2%. Nilai sensitivity ini menunjukkan bahwa setidaknya ada 60.6% data pada suatu kelas dapat diklasifikasikan ke kelas sebenarnya. Untuk specificity didapat nilai yang baik yaitu antara 96.3% 100% pada setiap panjang fragmen yang dicobakan. Secara lengkap nilai specificity ini dapat dilihat pada Gambar 9. Hasil sensitivity dan specificity untuk kelas taksonomi selanjutnya,yaitu filum dapat dilihat pada Gambar 10 dan Gambar 11. Sensitivity pada level takson ini dikatakan baik bahkan pada panjang fragmen kecil yaitu 400 bp. Nilai Sensitivity (%) bp 1 Kbp 10 Kbp Bacillus Bacteroides Bartonella Borrelia Burkholderia Campylobacter Chlamydophila Clostridium Corynebacterium Dehalococcoides Francisella Frankia Geobacter Haemophilus Helicobacter Lactobacillus Listeria Methanococcus Methylobacterium Mycobacterium Mycoplasma Pseudomonas Pyrococcus Rickettsia Shewanella Staphylococcus Streptococcus Streptomyces Sulfolobus Thermoanaerobacter Thermotoga Wolbachieae Xanthomonas Yersinia Genus Gambar 8 Sensitivity takson genus

26 14 Specificity (%) bp 1 Kbp 10 Kbp Bacillus Bacteroides Bartonella Borrelia Burkholderia Campylobacter Chlamydophila Clostridium Corynebacterium Dehalococcoides Francisella Frankia Geobacter Haemophilus Helicobacter Lactobacillus Listeria Methanococcus Methylobacterium Mycobacterium Mycoplasma Pseudomonas Pyrococcus Rickettsia Shewanella Staphylococcus Streptococcus Streptomyces Sulfolobus Thermoanaerobacter Thermotoga Wolbachieae Xanthomonas Yersinia Genus Gambar 9 Specificity takson genus Sensitivity (%) bp 1 Kbp 10 Kbp Filum Gambar 10 Sensitivity takson filum Specificity (%) bp 1 Kbp 10 Kbp Filum Gambar 11 Specificity takson filum sensitivity yang didapat yaitu 40.8% 88.4% untuk panjang fragmen 400 bp, 60.7% 94.6% untuk panjang fragmen 1 Kbp, dan 66.2% 99.6% untuk panjang fragmen 10 Kbp. Kemudian untuk nilai specificity juga baik yaitu berkisar antara 88.1% 100.0% untuk semua panjang fragmen yang dicobakan. Bila ditinjau keterkaitan antara hasil sensitivity dengan jumlah data yang ada pada kelas taksonnya, disimpulkan bahwa semakin banyak jumlah data untuk kelas tersebut maka menghasilkan sensitivity yang besar, dan sebaliknya. Dapat dilihat data uji untuk filum Actinobacteria, Firmicutes, dan Sphirochaetes yang memiliki anggota filum tersebar dihasilkan sensitivity yang besar pula. Sensitivity

27 untuk ketiga filum tersebut yaitu 82.2% 99.6% pada panjang fragmen kecil (400 bp) dan panjang fragmen besar (10 Kbp). Namun untuk filum lainnya yang memiliki anggota filum jauh lebih kecil, hanya menghasilkan sensitivity < 50% pada panjang fragmen kecil (400 bp). Pengaruh semakin besarnya data yang membuat nilai sensitivity juga besar dipengaruhi oleh semakin banyaknya pembelajaran yang dilakukan. Jumlah data uji untuk setiap kelas taksonnya dapat dilihat pada Lampiran 5. Jenis kernel Pengujian pengaruh penggunaan kernel terhadap hasil akurasi dilakukan untuk mengetahui kernel yang dapat menghasilkan model terbaik pada kasus pengklasifikasian fragmen metagenome. Gambar 12 memvisualisasikan hasil akurasi berdasarkan fungsi kernel yang digunakan dari pengklasifikasian data uji dengan panjang fragmen 10 Kbp pada tingkat takson genus. Dapat dilihat bahwa akurasi yang didapatkan dengan menerapkan 4 jenis kernel berbeda menghasilkan persentase akurasi yang tidak jauh berbeda. Akurasi yang dihasilkan terbilang sudah sangat baik yaitu mencapai > 95%. Dari hasil akurasi ini dapat dikatakan bahwa penggunaan kernel ternyata tidak berpengaruh. Penggunaan kernel linear yang sesungguhnya tidak diterapkan kernel apapun menghasilkan akurasi yang tidak berbeda dengan penggunaan kernel lainnya. Maka pada kondisi ini dapat dikatakan bahwa metode ekstraksi fitur yang digunakan yaitu spaced k-mers sudah baik, sehingga data sudah terpisah secara linear tanpa perlu diterapkan fungsi kernel apapun pada pembutan modelnya. Setelah itu dilakukan pula pencatatan waktu komputasi pembuatan model dari setiap kernel yang dapat dilihat pada Tabel 2. Dari hasil ini dapat dikatakan bahwa kernel RBF memiliki kinerja terbaik dalam melakukan pelatihan SVM untuk data fragmen metagenome, tetapi membutuhkan waktu komputasi yang sedikit lebih lama ,4 95,2 95,1 95,1 Akurasi (%) RBF Linear Kuadratik Quadratic Polinomial Jenis kernel Gambar 12 Akurasi menggunakan 4 fungsi kernel berbeda untuk panjang fragmen 10 Kbp dan takson genus Tabel 2 Perbandingan waktu komputasi pembuatan model pada setiap kernel Waktu komputasi (menit) Panjang fragmen RBF Linear Kuadratik Polinomial (d=3) 10 Kbp

28 16 Hasil klasifikasi genus yang tidak ada pada data latih Pada penelitian ini diujikan 1 organisme yang tidak memiliki model pada data latihnya, yaitu Burkholderia sp JV3 yang termasuk dalam genus Stenotrophomonas. Genus ini tidak ada pada data latih, sehingga diharapkan dari pengujian data dengan kasus seperti ini dapat diketahui kinerja dari pengklasifikasian SVM. Burkholderia sp JV3 memiliki 1908 baris data (fragmen) pada data uji dengan panjang fragmen 400 bp, 2009 pada panjang fragmen 1 Kbp, dan 1985 pada panjang fragmen 10 Kbp. Hasil pengklasifikasian sebagian besar mengkelaskan fragmen organisme ini ke takson genus Xanthomonas dan Pseudomonas. Untuk hasil keseluruhan pengklasifikasian dapat dilihat pada diagram lingkaran yang ditunjukkan pada Gambar 13, 14 dan 15. Dari hasil klasifikasi tersebut, dilakukan pencocokan terhadap similarity dari Burkholderia sp JV3 pada program Basic Local Alignment Search Tool (BLAST) dari NCBI yang dapat diakses pada Blast.cgi?CMD=Web&PAGETYPE=BlastHome. BLAST adalah program yang Xanthomonas 42% Gambar 13 Hasil klasifikasi data uji Burkholderia sp JV3 (genus Stenotrophomonas) pada panjang fragmen 400 bp Xanthomonas 55% Bordetella 5% Cupriavidus 7% Mycobacterium 7% Pseudomonas 33% Bordetella 2% Cupriavidus 7% Mycobacterium 3% Pseudomonas 31% Bacillus Bordetella Bradyrhizobium Burkholderia Corynebacterium Cupriavidus Frankia Geobacter Lactobacillus Methanosarcina Methylobacterium Mycobacterium Pseudomonas Streptomyces Synechococcus Xanthomonas Gambar 14 Hasil klasifikasi data uji Burkholderia sp JV3 (genus Stenotrophomonas) pada panjang fragmen 1 Kbp Xanthomonas 90% Cupriavidus 5% Pseudomonas 4% Bacillus Bordetella Bradyrhizobium Burkholderia Corynebacterium Cupriavidus Frankia Geobacter Mycobacterium Pseudomonas Streptomyces Synechococcus Xanthomonas Bacillus Bordetella Brucella Burkholderia Cupriavidus Pseudomonas Xanthomonas Gambar 15 Hasil klasifikasi data uji Burkholderia sp JV3 (genus Stenotrophomonas) pada panjang fragmen 10 Kbp

29 dapat menemukan region of local similarity antar sequences. Program ini dapat membandingkan urutan nukleotida atau protein suatu sequence dengan sequence lainnya dan menghitung secara statistik unsur yang signifikan sama. BLAST dapat digunakan untuk menyimpulkan hubungan fungsional dan evolusioner antar sequences serta membantu mengidentifikasi anggota dari gen. Hasil BLAST dari organisme Burkholderia sp JV3 mengeluarkan daftar organisme yang memiliki similarity dengan organisme tersebut. Tabel 3 adalah daftar organisme-organisme yang dihasilkan dari BLAST yang juga merupakan organisme yang digunakan pada data latih. Dari hasil pengklasifikasian pada penelitian ini dan hasil BLAST, dapat dilihat bahwa benar Xanthomonas dan Pseudomonas memiliki tingkat similarity yang cukup besar dengan Burkholderia sp JV3. Maka hasil klasifikasi SVM pada Tabel 3 Daftar organisme yang memiliki similarity dari hasil alignment Burkholderia sp JV3 pada BLAST Max Query E No Deskripsi Total score 1 Xanthomonas campestris pv. campestris complete genome, strain B100 2 Xanthomonas campestris pv. campestris str. ATCC 33913, complete genome 3 Xanthomonas campestris pv. campestris str. 8004, complete genome 4 Xanthomonas campestris pv. vesicatoria complete genom 5 Xanthomonas oryzae pv. oryzae KACC10331, complete genome 6 Xanthomonas oryzae pv. oryzae MAFF DNA, complete genome 7 Xanthomonas oryzae pv. oryzae PXO99A, complete genome 8 Pseudomonas aeruginosa UCBPP- PA14, complete genome 9 Pseudomonas putida KT2440 complete genome 10 Pseudomonas putida GB-1, complete genome 11 Pseudomonas putida W619, complete genome Max score cover value ident % % % % % % % % % % % % % % % % % % % % % % 17

30 18 penelitian ini bergantung pada unsur nukleotida yang dimiliki oleh setiap data, baik data latih yang akan menjadi model maupun data uji yang akan diprediksi kelasnya. Implementasi Tahap akhir yaitu implementasi yang menghasilkan sistem bernama Metagenome Binning. Sistem ini dapat melakukan prediksi tingkat taksonomi dari sequence DNA yang menjadi masukkan sistem sebelumnya. Tingkat taksonomi yang akan ditampilkan sebagai keluaran sistem yaitu genus, order, kelas, dan filum. Tahapan dan tampilan dalam menggunakan sistem ini dapat dilihat pada Lampiran 8. SIMPULAN DAN SARAN Simpulan Pada penelitian ini, sudah disajikan pengklasifikasian fragmen metagenome menggunakan metode SVM. Secara keseluruhan penelitian ini sudah menghasilkan akurasi yang baik, bahkan pada panjang fragmen kecil 400 bp yaitu 65.3% untuk takson genus, 72.0% untuk takson order, 78.2% untuk takson kelas, dan 82.1% untuk takson filum. Pada panjang fragmen besar (10 Kbp) akurasi mencapai 95% untuk semua eve takson. Dari penggunaan berbagai panjang fragmen ini disimpulkan bahwa semakin panjang fragmen yang digunakan maka akan semakin besar hasil akurasi yang diperoleh dan sebaliknya. Penggunaan 4 fungsi kernel yang berbeda pada pemodelan SVM pun telah diterapkan. Dari hasil penelitian ini disimpulkan bahwa fungsi kernel yang diterapkan tidak terlalu berpengaruh terhadap hasil pengklasifikasian karena metode ekstraksi fitur yang digunakan ternyata sudah baik. Metode ekstraksi fitur spaced k-mers dengan variabel w = 3 dan d = 0, 1, 2 telah menghasilkan fitur yang dapat memisahkan data secara linear. Sehingga kondisi linearly separable sudah terpenuhi tanpa perlu menerapakan fungsi kernel apapun pada pembentukan model SVM. Kemudian untuk hasil pengklasifikasian data uji yang tidak ada modelnya pada data latih menunjukkan hasil yang serupa dengan hasil aplikasi BLAST. Fragmen data uji Burkholderia sp JV3 sebagian besar dikelaskan menjadi Xanthomonas dan Pseudomonas. Ini menunjukkan bahwa kinerja pengklasifikasian pada penelitian ini bergantung pada unsur nukleotida yang dimiliki oleh setiap data, baik data latih yang akan menjadi model maupun data uji yang akan diprediksi kelasnya. Setelah itu hasil justifikasi dari pembuatan model setiap takson yang sudah dilakukan, dihasilkan bahwa pembuatan model untuk setiap tingkat takson memang memberikan akurasi yang lebih baik. Bila dibandingkan dengan hanya dilakukannya pembuatan model pada takson genus yang menghasilkan akurasi lebih kecil. Sehingga apabila diinginkan akurasi penelitian yang lebih baik, maka pembuatan model untuk setiap takson lebih disarankan.

31 19 Saran Beberapa saran untuk penelitian selanjutnya yaitu: 1 Menggunakan sequence data 16S rrna yang dihasilkan dari proses sequencing dan sudah banyak tersedia di genbank dengan panjang fragmen yang mendominasi yaitu 400 bp, sehingga tidak perlu menggunakan data simulasi. 2 Menambah jumlah kelas pada data latih sehingga dapat melakukan prediksi untuk lebih banyak kelas. 3 Menggunakan data riil misal Sargasso Sea atau yang lainnya. DAFTAR PUSTAKA Boswell D Introduction to support vector machine [Internet]. [diunduh 2012 Des 9]. Tersedia pada: IntroToSVM.pdf Hsu CW, Chang CC, Lin CJ A practical guide to support vector classification [Internet]. [diunduh 2012 Des 9]. Tersedia pada: Hsu CW, Lin CJ A comparison of methods for multiclass support vector machine. IEEE Transactions on Neural Networks. 13(2): doi: / Kusuma, WA Combined approaches for improving the performance of de novo DNA sequence assembly and metagenomic classification of short fragments from next generation sequencer [disertasi]. Tokyo (JP): Tokyo Institute of Technology. Kusuma WA, Akiyama Y Metagenome fragment binning based on characterization vector. Di dalam: International Conference on Bioinformatics and Biomedical Technology (ICBBT 2011); 2011 Mar 25 27; Sanya, China. Liu L, Ho YK, Yau S Clustering DNA sequences by feature vectors. Molecular Phylogenetics and Evolution. 41(1): doi: /j.ympev McHardy AC, Martín HG, Tsirigos A, Hugenholtz P, Rigoutsos I Accurate phylogonetic classification of variabel-length DNA fragments. Nature Methods. 4(1): doi: /nmeth976. McHardy AC Rigoutsos I What s in the mi : phy ogenetic c assification of metagenome sequence samples. Current Opinion in Microbiology. 10(5): doi: /j.mib Osuna EE, Freund R, Girosi F Support vector machines: training and applications. AI Memo (1602). Refaeilzadeh P, Tang L, Liu H Cross-validation. Di dalam: Liu L, Öszu MT, editor. Encyclopedia of Database Systems. New York (US): Springer. Richter DC, Ott F, Auch AF, Schmid R, Huson DH MetaSim: a sequencing simulator for genomics and metagenomics. PLoS ONE. 3(10):1 12. doi: /journal.pone

32 20 Wooley JC, Godzik A, Friedberg I A primer on metagenomics. PLos Computational Biology. 6(2):1 13. doi: /journal.pcbi

33 21 Lampiran 1 Daftar nama organisme data latih No Nama Organisme No Nama Organisme 1 Bacillus amyloliquefaciens FZB42 23 Bartonella tribocorum CIP Bacillus anthracis str. 'Ames Ancestor' 24 Bordetella avium 197N 3 Bacillus anthracis str. Ames 25 Bordetella bronchiseptica RB50 4 Bacillus anthracis str. Sterne 26 Bordetella parapertussis Bacillus cereus ATCC Bordetella pertussis Tohama I 6 Bacillus cereus ATCC Bordetella petrii DSM Bacillus cereus E33L 29 Borrelia afzelii PKo 8 Bacillus cereus subsp. cytotoxis 30 Borrelia duttonii Ly NVH Bacillus clausii KSM-K16 31 Borrelia garinii PBi linear 10 Bacillus halodurans C Borrelia hermsii DAH 11 Bacillus licheniformis ATCC 33 Borrelia recurrentis A Bacillus subtilis subsp. subtilis str Borrelia turicatae 91E Bacillus thuringiensis serovar konkukian str Bradyrhizobium japonicum USDA Bacillus thuringiensis str. Al Hakam 36 Bradyrhizobium sp. BTAi1 15 Bacillus weihenstephanensis KBAB4 37 Bradyrhizobium sp. ORS Bacteroides fragilis NCTC Brucella abortus S Bacteroides fragilis YCH46 39 Brucella abortus bv. 1 str I 18 Bacteroides thetaiotaomicron VPI Brucella canis ATCC I 19 Bacteroides vulgatus ATCC Brucella melitensis biovar Abortus 2308 I 20 Bartonella bacilliformis KC Brucella melitensis bv. 1 str. 16M I 21 Bartonella henselae str. 43 Brucella ovis ATCC Houston-1 22 Bartonella quintana str. Toulouse I 44 Brucella suis 1330 I

34 22 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 45 Brucella suis ATCC I 65 Burkholderia thailandensis E264 I 46 Burkholderia ambifaria AMMD 1 66 Burkholderia vietnamiensis G Burkholderia ambifaria MC Burkholderia xenovorans LB Burkholderia cenocepacia AU 68 Campylobacter concisus Burkholderia cenocepacia HI Campylobacter curvus Burkholderia cenocepacia J Campylobacter fetus subsp. fetus Burkholderia cenocepacia MC0-71 Campylobacter hominis ATCC Burkholderia mallei ATCC Burkholderia mallei NCTC I 54 Burkholderia mallei NCTC I 55 Burkholderia mallei SAVP1 I 56 Burkholderia multivorans ATCC Burkholderia phymatum STM Burkholderia phytofirmans PsJN 1 59 Burkholderia pseudomallei 1106a I 60 Burkholderia pseudomallei 1710b I 61 Burkholderia pseudomallei 668 I 62 Burkholderia pseudomallei K Burkholderia sp Burkholderia sp BAA Campylobacter jejuni RM Campylobacter jejuni subsp. doylei Campylobacter jejuni subsp. jejuni NCTC Candidatus Phytoplasma australiense 76 Candidatus Phytoplasma mali 77 Chlamydophila abortus S26/3 78 Chlamydophila caviae GPIC 79 Chlamydophila felis Fe/C Chlamydophila pneumoniae AR39 81 Chlamydophila pneumoniae CWL Chlamydophila pneumoniae J Chlamydophila pneumoniae TW Chlorobium chlorochromatii CaD3

35 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 85 Chlorobium limicola DSM Clostridium tetani E88 86 Chlorobium luteolum DSM Clostridium thermocellum ATCC Chlorobium phaeobacteroides BS1 109 Corynebacterium diphtheriae NCTC Chlorobium phaeobacteroides DSM Corynebacterium efficiens YS Chlorobium phaeovibrioides DSM Corynebacterium glutamicum ATCC Chlorobium tepidum TLS 112 Corynebacterium glutamicum R 91 Clostridium acetobutylicum 113 Corynebacterium jeikeium K411 ATCC Clostridium beijerinckii NCIMB Corynebacterium urealyticum DSM Clostridium botulinum A str. ATCC Cupriavidus metallidurans CH34 94 Clostridium botulinum A str. ATCC Cupriavidus necator N Clostridium botulinum A str. Hall 117 Cupriavidus taiwanensis LMG Clostridium botulinum A3 str. Loch Maree 118 Dehalococcoides ethenogenes Clostridium botulinum B str. 119 Dehalococcoides sp. BAV1 Eklund 17B 98 Clostridium botulinum B1 str. Okra 120 Dehalococcoides sp. CBDB1 99 Clostridium botulinum E3 str. 121 Ehrlichia canis str. Jake Alaska E Clostridium botulinum F str. Langeland 122 Ehrlichia chaffeensis str. Arkansas 101 Clostridium difficile Ehrlichia ruminantium str. Gardel 102 Clostridium kluyveri DSM Ehrlichia ruminantium str. Welgevonden 103 Clostridium novyi NT 125 Francisella philomiragia subsp. philomiragia ATCC Clostridium perfringens ATCC Francisella tularensis subsp. holarctica FTNF Clostridium perfringens str Francisella tularensis subsp. 106 Clostridium phytofermentans ISDg holarctica LVS 128 Francisella tularensis subsp. holarctica OSU18 23

36 24 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 129 Francisella tularensis subsp. 151 Helicobacter pylori mediasiatica FSC Francisella tularensis subsp. novicida U Helicobacter pylori G Francisella tularensis subsp. tularensis FSC Helicobacter pylori HPAG1 132 Francisella tularensis subsp. 154 Helicobacter pylori J99 tularensis SCHU S4 133 Francisella tularensis subsp. tularensis WY Helicobacter pylori P Frankia alni ACN14a 156 Helicobacter pylori Shi Frankia sp. CcI3 157 Lactobacillus acidophilus NCFM 136 Frankia sp. EAN1pec 158 Lactobacillus brevis ATCC Geobacter bemidjiensis Bem 159 Lactobacillus casei ATCC Geobacter lovleyi SZ 160 Lactobacillus casei BL Geobacter metallireducens GS Lactobacillus delbrueckii subsp. bulgaricus ATCC Geobacter sulfurreducens PCA 162 Lactobacillus delbrueckii subsp. bulgaricus ATCC BAA Geobacter uraniireducens Rf4 163 Lactobacillus fermentum IFO Haemophilus ducreyi 35000HP 164 Lactobacillus gasseri ATCC Haemophilus influenzae NP 165 Lactobacillus helveticus DPC Haemophilus influenzae PittEE 166 Lactobacillus johnsonii NCC Haemophilus influenzae PittGG 167 Lactobacillus plantarum WCFS1 146 Haemophilus influenzae Rd KW Lactobacillus reuteri DSM Haemophilus somnus 129PT 169 Lactobacillus reuteri JCM Haemophilus somnus Lactobacillus sakei subsp. sakei 23K 149 Helicobacter acinonychis str. 171 Lactobacillus salivarius UCC118 Sheeba 150 Helicobacter hepaticus ATCC Leptospira biflexa serovar Patoc strain 'Patoc 1 (Ames)' I

37 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 173 Leptospira biflexa serovar Patoc strain 'Patoc 1 (Paris)' 194 Mycobacterium avium subsp. paratuberculosis K-10 I 174 Leptospira borgpetersenii serovar Hardjo-bovis L Mycobacterium bovis AF2122/ Leptospira interrogans serovar Copenhageni str. Fiocruz L1-130 I 176 Leptospira interrogans serovar Lai str I 196 Mycobacterium bovis BCG str. Pasteur 1173P2 197 Mycobacterium gilvum PYR- GCK 177 Listeria innocua Clip Mycobacterium leprae TN 178 Listeria monocytogenes EGD-e 199 Mycobacterium marinum M 179 Listeria monocytogenes serotype 4b str. F Listeria welshimeri serovar 6b str. SLCC Methanococcus maripaludis C5 182 Methanococcus maripaludis C6 183 Methanococcus maripaludis C7 184 Methanococcus maripaludis S2 185 Methanosarcina acetivorans C2A 186 Methanosarcina barkeri str. Fusaro 187 Methanosarcina mazei Go1 188 Methylobacterium extorquens PA1 189 Methylobacterium populi BJ Methylobacterium radiotolerans JCM Methylobacterium sp Mycobacterium abscessus ATCC Mycobacterium smegmatis str. MC Mycobacterium sp. JLS 202 Mycobacterium sp. KMS 203 Mycobacterium sp. MCS 204 Mycobacterium tuberculosis CDC Mycobacterium tuberculosis F Mycobacterium tuberculosis H37Ra 207 Mycobacterium tuberculosis H37Rv 208 Mycobacterium ulcerans Agy Mycobacterium vanbaalenii PYR Mycoplasma agalactiae PG2 211 Mycoplasma arthritidis 158L Mycoplasma capricolum subsp. capricolum ATCC Mycoplasma gallisepticum str. R(low) 193 Mycobacterium avium Mycoplasma genitalium G37

38 26 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 215 Mycoplasma hyopneumoniae Psychrobacter arcticus Mycoplasma hyopneumoniae Psychrobacter cryohalolentis K5 217 Mycoplasma hyopneumoniae J 240 Psychrobacter sp. PRwf Mycoplasma mobile 163K 241 Pyrobaculum aerophilum str. IM2 219 Mycoplasma mycoides subsp. mycoides SC str. PG1 242 Pyrobaculum arsenaticum DSM Mycoplasma penetrans HF Pyrobaculum calidifontis JCM Mycoplasma pneumoniae M Pyrobaculum islandicum DSM Mycoplasma pulmonis UAB CTIP 245 Pyrococcus abyssi GE5 223 Mycoplasma synoviae Pyrococcus furiosus DSM Onion yellows phytoplasma OY- M 247 Pyrococcus horikoshii OT3 225 Pseudomonas aeruginosa PA7 248 Rickettsia akari str. Hartford 226 Pseudomonas aeruginosa PAO1 249 Rickettsia bellii OSU Pseudomonas aeruginosa 250 Rickettsia bellii RML369-C UCBPP-PA Pseudomonas fluorescens Pf Rickettsia canadensis str. McKiel 229 Pseudomonas fluorescens Pf Rickettsia conorii str. Malish Pseudomonas putida F1 253 Rickettsia felis URRWXCal2 231 Pseudomonas putida GB Rickettsia massiliae MTU5 232 Pseudomonas putida KT Rickettsia prowazekii str. Madrid E 233 Pseudomonas putida W Rickettsia rickettsii str. 'Sheila Smith' 234 Pseudomonas syringae pv. phaseolicola 1448A 257 Rickettsia rickettsii str. Iowa 235 Pseudomonas syringae pv. 258 Rickettsia typhi str. Wilmington syringae B728a 236 Pseudomonas syringae pv. tomato str. DC Shewanella amazonensis SB2B 237 Pseudomonas syringae pv. tomato str. DC3000 plasmid pdc3000a 260 Shewanella baltica OS195

39 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 261 Shewanella denitrificans OS Staphylococcus aureus subsp. aureus COL 262 Shewanella frigidimarina NCIMB Staphylococcus aureus subsp. aureus JH1 263 Shewanella halifaxensis HAW- EB4 284 Staphylococcus aureus subsp. aureus JH9 264 Shewanella loihica PV Staphylococcus aureus subsp. aureus MRSA Shewanella oneidensis MR Staphylococcus aureus subsp. aureus MSSA Shewanella pealeana ATCC Staphylococcus aureus subsp. aureus MW2 267 Shewanella putrefaciens CN Staphylococcus aureus subsp. aureus Mu3 268 Shewanella sediminis HAW-EB3 289 Staphylococcus aureus subsp. aureus Mu Shewanella sp. ANA Staphylococcus aureus subsp. aureus N Shewanella sp. MR Staphylococcus aureus subsp. aureus NCTC Shewanella sp. MR Staphylococcus aureus subsp. aureus USA300_FPR Shewanella sp. W Staphylococcus aureus subsp. aureus USA300_TCH Shewanella woodyi ATCC Staphylococcus aureus subsp. aureus str. Newman 274 Shigella boydii CDC Staphylococcus epidermidis ATCC Shigella boydii Sb Staphylococcus epidermidis RP62A 276 Shigella dysenteriae Sd Staphylococcus haemolyticus JCSC Shigella flexneri 2a str. 2457T 298 Staphylococcus saprophyticus subsp. saprophyticus ATCC Shigella flexneri 2a str Streptococcus agalactiae 2603V/R 279 Shigella flexneri 5 str Streptococcus agalactiae A Shigella sonnei Ss Streptococcus agalactiae NEM Staphylococcus aureus RF Streptococcus equi subsp. zooepidemicus MGCS

40 28 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 303 Streptococcus gordonii str. 325 Streptococcus suis 05ZYH33 Challis substr. CH1 304 Streptococcus mutans UA Streptococcus suis 98HAH Streptococcus pneumoniae CGSP Streptococcus thermophilus CNRZ Streptococcus pneumoniae D Streptococcus thermophilus LMD Streptococcus pneumoniae G Streptococcus thermophilus LMG Streptococcus pneumoniae Hungary19A Streptomyces avermitilis MA Streptococcus pneumoniae R6 331 Streptomyces coelicolor A3(2) 310 Streptococcus pneumoniae TIGR4 332 Streptomyces griseus subsp. griseus NBRC Streptococcus pyogenes M1 GAS 333 Sulfolobus acidocaldarius DSM Streptococcus pyogenes MGAS Sulfolobus solfataricus P2 313 Streptococcus pyogenes MGAS Sulfolobus tokodaii str Streptococcus pyogenes MGAS Synechococcus elongatus PCC Streptococcus pyogenes MGAS Synechococcus elongatus PCC Streptococcus pyogenes 338 Synechococcus sp. CC9311 MGAS Streptococcus pyogenes 339 Synechococcus sp. CC9605 MGAS Streptococcus pyogenes MGAS Synechococcus sp. CC Streptococcus pyogenes MGAS Synechococcus sp. JA-2-3B'a(2-13) 320 Streptococcus pyogenes 342 Synechococcus sp. JA-3-3Ab MGAS Streptococcus pyogenes NZ Synechococcus sp. PCC Streptococcus pyogenes SSI Synechococcus sp. RCC Streptococcus pyogenes str. 345 Synechococcus sp. WH 7803 Manfredo 324 Streptococcus sanguinis SK Synechococcus sp. WH 8102

41 Lampiran 1 Lanjutan No Nama Organisme No Nama Organisme 347 Thermoanaerobacter pseudethanolicus ATCC Xanthomonas campestris pv. campestris str. ATCC Thermoanaerobacter sp. X Xanthomonas campestris pv. 349 Thermoanaerobacter tengcongensis MB4 350 Thermotoga lettingae TMO 351 Thermotoga maritima MSB8 352 Thermotoga petrophila RKU Thermotoga sp. RQ2 354 Vibrio cholerae O1 biovar El Tor str. N16961 I 355 Vibrio cholerae O Vibrio fischeri ES114 I 357 Vibrio fischeri MJ11 I 358 Vibrio vulnificus CMCP6 I 359 Vibrio vulnificus YJ016 I 360 Wolbachia endosymbiont of Culex quinquefasciatus Pel 361 Wolbachia endosymbiont of Drosophila melanogaster 362 Wolbachia endosymbiont strain TRS of Brugia malayi 363 Xanthomonas axonopodis pv. citri str Xanthomonas campestris pv. campestris str campestris str. B Xanthomonas campestris pv. vesicatoria str Xanthomonas oryzae pv. oryzae KACC Xanthomonas oryzae pv. oryzae MAFF Xanthomonas oryzae pv. oryzae PXO99A 371 Yersinia enterocolitica subsp. enterocolitica Yersinia pestis Angola 373 Yersinia pestis Antiqua 374 Yersinia pestis CO Yersinia pestis KIM Yersinia pestis Nepal Yersinia pestis Pestoides F 378 Yersinia pseudotuberculosis IP Yersinia pseudotuberculosis IP Yersinia pseudotuberculosis PB1/+ 381 Yersinia pseudotuberculosis YPIII 29

42 30 Lampiran 2 Daftar nama organisme data uji No Nama Organisme No Nama Organisme 1 Bacillus amyloliquefaciens DSM 7 23 Bacteroides helcogenes P Bacillus anthracis str. A Bacteroides salanitronis DSM Bacillus anthracis str. CDC Bartonella clarridgeiae 73 4 Bacillus atrophaeus Bartonella grahamii as4aup 5 Bacillus cellulosilyticus DSM Borrelia bissettii DN127 6 Bacillus cereus 03BB Borrelia burgdorferi ZS7 7 Bacillus cereus AH Burkholderia gladioli BSR3 1 8 Bacillus cereus AH Burkholderia glumae BGR1 1 9 Bacillus cereus B Burkholderia sp. CCGE Bacillus cereus G Burkholderia sp. JV3 11 Bacillus cereus Q1 33 Campylobacter jejuni subsp. jejuni Bacillus cereus biovar anthracis str. CI 34 Campylobacter jejuni subsp. jejuni Bacillus coagulans Campylobacter jejuni subsp. jejuni ICDCCJ Bacillus coagulans 36D1 36 Campylobacter lari RM Bacillus megaterium DSM Chlamydophila pecorum E58 16 Bacillus megaterium QM B Chlamydophila psittaci 6BC 17 Bacillus pseudofirmus OF4 39 Clostridium acetobutylicum DSM Bacillus pumilus SAFR Clostridium botulinum A2 str. Kyoto 19 Bacillus selenitireducens MLS10 41 Clostridium botulinum BKT Bacillus subtilis BSn5 42 Clostridium botulinum Ba4 str Bacillus subtilis subsp. spizizenii str. W23 43 Clostridium cellulolyticum H10 22 Bacillus thuringiensis BMB Clostridium cellulovorans 743B

43 Lampiran 2 Lanjutan No Nama Organisme No Nama Organisme 45 Clostridium difficile CD Haemophilus parainfluenzae T3T1 46 Clostridium difficile R Haemophilus parasuis SH Clostridium kluyveri NBRC 70 Helicobacter bizzozeronii CIII Clostridium ljungdahlii DSM 71 Helicobacter felis ATCC Clostridium saccharolyticum WM1 72 Helicobacter mustelae Clostridium sp. SY Helicobacter pylori B38 51 Clostridium sticklandii DSM Helicobacter pylori B8 52 Corynebacterium aurimucosum ATCC Helicobacter pylori PeCan4 53 Corynebacterium kroppenstedtii DSM Helicobacter pylori SJM Corynebacterium pseudotuberculosis FRC41 77 Lactobacillus acidophilus 30SC 55 Corynebacterium resistens DSM Lactobacillus amylovorus GRL Corynebacterium ulcerans BR- AD22 79 Lactobacillus buchneri NRRL B Corynebacterium variabile DSM Lactobacillus casei str. Zhang 58 Dehalococcoides sp. GT 81 Lactobacillus crispatus ST1 59 Dehalococcoides sp. VS 82 Lactobacillus delbrueckii subsp. bulgaricus ND02 60 Francisella sp. TX Lactobacillus johnsonii FI Frankia sp. EuI1c 84 Lactobacillus kefiranofaciens ZW3 62 Frankia symbiont of Datisca 85 Lactobacillus plantarum JDM1 glomerata 63 Geobacter sp. FRC Lactobacillus plantarum subsp. plantarum ST-III 64 Geobacter sp. M18 87 Lactobacillus reuteri SD Geobacter sp. M21 88 Lactobacillus rhamnosus GG 66 Haemophilus influenzae F Lactobacillus rhamnosus Lc Haemophilus influenzae F Lactobacillus ruminis ATCC

44 32 Lampiran 2 Lanjutan No Nama Organisme No Nama Organisme 91 Lactobacillus sanfranciscensis TMW Mycoplasma agalactiae 92 Listeria ivanovii subsp. ivanovii PAM Mycoplasma bovis Hubei-1 93 Listeria monocytogenes Mycoplasma bovis PG45 94 Listeria monocytogenes Mycoplasma conjunctivae HRC/ Listeria monocytogenes Clip Mycoplasma crocodyli MP Listeria monocytogenes HCC Mycoplasma fermentans JER 97 Listeria seeligeri serovar 1/2b str. SLCC Mycoplasma fermentans M64 98 Methanococcus aeolicus Nankai Mycoplasma haemofelis str. Langford 1 99 Methanococcus maripaludis XI 121 Mycoplasma hominis 100 Methanococcus vannielii SB 122 Mycoplasma hyorhinis HUB Methanococcus voltae A3 123 Mycoplasma leachii PG Methylobacterium chloromethanicum CM4 124 Mycoplasma mycoides subsp. capri LC str Methylobacterium extorquens AM1 125 Mycoplasma putrefaciens KS1 104 Methylobacterium extorquens 126 Mycoplasma suis KI3806 DM4 105 Methylobacterium nodulans ORS Mycoplasma suis str. Illinois 106 Mycobacterium africanum 128 Pseudomonas aeruginosa GM Mycobacterium bovis BCG str. Tokyo Mycobacterium canettii CIPT Mycobacterium leprae Br Mycobacterium sp. JDM Mycobacterium sp. Spyr1 112 Mycobacterium tuberculosis KZN 1435 LESB Pseudomonas brassicacearum subsp. brassicacearum NFM Pseudomonas entomophila L Pseudomonas fluorescens SBW Pseudomonas fulva 12-X 133 Pseudomonas mendocina NK Pseudomonas mendocina ymp

45 Lampiran 2 Lanjutan No Nama Organisme No Nama Organisme 135 Pseudomonas putida S Streptococcus mitis B6 136 Pseudomonas stutzeri A Streptococcus mutans UA Pseudomonas stutzeri ATCC 158 Streptococcus oralis Uo = LMG Pyrococcus sp. NA2 159 Streptococcus parasanguinis ATCC Pyrococcus yayanosii CH1 160 Streptococcus parauberis KCTC Rickettsia africae ESF Streptococcus pasteurianus ATCC Rickettsia heilongjiangensis Streptococcus pneumoniae 670-6B 142 Rickettsia peacockii str. Rustic 163 Streptococcus pneumoniae Shewanella baltica OS Streptococcus pneumoniae AP Shewanella baltica OS Streptococcus pneumoniae ATCC Shewanella baltica OS Streptococcus pneumoniae JJA 146 Shewanella piezotolerans WP3 167 Streptococcus pneumoniae P Shewanella violacea DSS Streptococcus pneumoniae TCH8431/19A 148 Staphylococcus aureus subsp. aureus ED Streptococcus pneumoniae Taiwan19F Staphylococcus carnosus subsp. carnosus TM Streptococcus pseudopneumoniae IS Staphylococcus lugdunensis 171 Streptococcus salivarius HKU Staphylococcus pseudintermedius HKU Streptococcus equi subsp. equi Streptococcus equi subsp. zooepidemicus 154 Streptococcus gallolyticus UCN Streptococcus gallolyticus subsp. gallolyticus ATCC BAA-2069 CCHSS3 172 Streptococcus suis BM Streptococcus suis P1/7 174 Streptococcus suis SC Streptococcus suis ST3 176 Streptococcus uberis 0140J 33

46 34 Lampiran 2 Lanjutan No Nama Organisme No Nama Organisme 177 Streptomyces scabiei Thermoanaerobacter mathranii subsp. mathranii str. A3 178 Streptomyces sp. SirexAA-E 190 Thermoanaerobacter sp. X Streptomyces violaceusniger Tu Thermoanaerobacter wiegelii Rt8.B1 180 Sulfolobus islandicus L.D Thermotoga naphthophila RKU Sulfolobus islandicus L.S Thermotoga neapolitana DSM Sulfolobus islandicus M Thermotoga thermarum DSM Sulfolobus islandicus M Wolbachia sp. wri 184 Sulfolobus islandicus M Xanthomonas albilineans GPE PC Sulfolobus islandicus Y.G Xanthomonas axonopodis pv. 186 Sulfolobus islandicus Y.N Thermoanaerobacter brockii subsp. finnii Ako Thermoanaerobacter italicus Ab9 citrumelo F1 198 Yersinia enterocolitica subsp. palearctica 105.5R(r) 199 Yersinia pestis Z Yersinia pestis biovar Microtus str

47 35 Lampiran 3 Daftar tingkat taksonomi yang digunakan mulai dari genus, order, kelas dan filum No Genus No Order 1 Bacillus 1 Bacillales 2 Bacteroides 2 Bacteroidales 3 Bartonella 3 Rhizobiales 4 Bordetella 4 Sphirochaetales 5 Borrelia 5 Burkholderiales 6 Bradyrhizobium 6 Campylobacterales 7 Brucella 7 Acholeplasmatales 8 Burkholderia 8 Chlamidiales 9 Campylobacter 9 Chlorobiales 10 Candidatus 10 Clostridiales 11 Chlamydophila 11 Actinomycetales 12 Chlorobium 12 Rickettsiales 13 Clostridium 13 Thiotrichales 14 Corynebacterium 14 Desulfuromonadales 15 Cupriavidus 15 Pasteurellales 16 Dehalococcoides 16 Lactobacillales 17 Ehrlichia 17 Methanococcales 18 Francisella 18 Methanosarcinales 19 Frankia 19 Mycoplasmatales 20 Geobacter 20 Pseudomonadales 21 Haemophilus 21 Thermoproteales 22 Helicobacter 22 Thermococcales 23 Lactobacillus 23 Alteromonadales 24 Leptospira 24 Enterobacteriales 25 Listeria 25 Chroococcales 26 Methanococcus 26 Thermoanaerobacterales 27 Methanosarcina 27 Thermotogales 28 Methylobacterium 28 Vibrionales 29 Mycobacterium 29 Xanthomonadales 30 Mycoplasma 30 Dehalococcoidales 31 Pseudomonas 31 Sulfolobales 32 Psychrobacter 33 Pyrobaculum 34 Pyrococcus 35 Rickettsia 36 Shewanella 37 Shigella 38 Staphylococcus 39 Streptococcus 40 Streptomyces 41 Sulfolobus

48 36 Lampiran 3 Lanjutan No Genus No Filum 42 Synechococcus 1 Firmicutes 43 Thermoanaerobacter 2 Bacteroidetes 44 Thermotoga 3 Proteobacteria 45 Vibrio 4 Sphirochaetes 46 Wolbachia 5 Teneicutes 47 Xanthomonas 6 Chlamidiae 48 Yersinia 7 Actinobacteria 8 Chloroflexi No Kelas 9 Euyarchaeota 1 Bacilli 10 Crenarchaeota 2 Bacteroida 11 Thermotogae 3 Alphaproteobacteria 12 Cyanobacteria 4 Sphirochaetes 13 Chlorobi 5 Betaproteobacteria 6 Epsilonproteobacteria 7 Mollicutes 8 Chlamidiae 9 Chlorobia 10 Clostridia 11 Actinobacteria 12 Dehalococcoidetes 13 Gammaproteobacteria 14 Deltaproteobacteria 15 Methanococci 16 Thermoprotei 17 Thermococci 18 Chroococcales 19 Thermotogae 20 Methanomicrobia

49 37 Lampiran 4 Daftar hasil praproses data yang menyatakan jumlah sequence di setiap tingkat takson dan panjang fragmennya untuk data latih Genus Panjang fragmen (Kbp) Bacillus Bacteroides Bartonella Bordetella Borrelia Bradyrhizobium Brucella Burkholderia Campylobacter Candidatus Chlamydophila Chlorobium Clostridium Corynebacterium Cupriavidus Dehalococcoides Ehrlichia Francisella Frankia Geobacter Haemophilus Helicobacter Lactobacillus Leptospira Listeria Methanococcus Methanosarcina Methylobacterium Mycobacterium Mycoplasma Pseudomonas Psychrobacter Pyrobaculum Pyrococcus Rickettsia Shewanella Shigella Staphylococcus Streptococcus Streptomyces Sulfolobus Synechococcus Thermoanaerobacter

50 38 Lampiran 4 Lanjutan Genus Panjang fragmen (Kbp) Thermotoga Vibrio Wolbachia Xanthomonas Yersinia Jumlah Order Panjang fragmen (Kbp) Acholeplasmatales Actinomycetales Alteromonadales Bacillales Bacteroidales Burkholderiales Campylobacterales Chlamidiales Chlorobiales Chroococcales Clostridiales Desulfuromonadales Enterobacteriales Lactobacillales Methanococcales Methanosarcinales Mycoplasmatales Pasteurellales Pseudomonadales Rhizobiales Rickettsiales Sphirochaetales Thermoanaerobacterales Thermococcales Thermoproteales Thermotogales Thiotrichales Vibrionales Xanthomonadales Dehalococcoidales Sulfolobales Jumlah

51 Lampiran 4 Lanjutan Kelas Panjang fragmen (Kbp) Actinobacteria Alphaproteobacteria Bacilli Bacteroida Betaproteobacteria Chlamidiae Chlorobia Chroococcales Clostridia Dehalococcoidetes Deltaproteobacteria Epsilonproteobacteria Gammaproteobacteria Methanococci Mollicutes Sphirochaetes Thermococci Thermoprotei Thermotogae Methanomicrobia Jumlah Filum Panjang fragmen (Kbp) Actinobacteria Bacteroidetes Chlamidiae Chloroflexi Crenarchaeota Euyarchaeota Firmicutes Proteobacteria Sphirochaetes Tenericutes Thermotogae Cyanobacteria Chlorobi Jumlah

52 40 Lampiran 5 Daftar hasil praproses data yang menyatakan jumlah sequence di setiap tingkat takson dan panjang fragmennya untuk data uji Genus Panjang fragmen (Kbp) Bacillus Bacteroides Bartonella Borrelia Burkholderia Stenotrophomonas Campylobacter Chlamydophila Clostridium Corynebacterium Dehalococcoides Francisella Frankia Geobacter Haemophilus Helicobacter Lactobacillus Listeria Methanococcus Methylobacterium Mycobacterium Mycoplasma Pseudomonas Pyrococcus Rickettsia Shewanella Staphylococcus Streptococcus Streptomyces Sulfolobus Thermoanaerobacter Thermotoga Wolbachieae Xanthomonas Yersinia Jumlah

53 Lampiran 5 Lanjutan Order Panjang fragmen (Kbp) Actinomycetales Alteromonadales Bacillales Bacteroidales Burkholderiales Campylobacterales Chlamydiales Clostridiales Dehalococcoidales Desulfuromonadales Enterobacteriales Lactobacillales Methanococcales Mycoplasmatales Pasteurellales Pseudomonadales Rhizobiales Rickettsiales Spirochaetales Sulfolobales Thermoanaerobacterales Thermococcales Thermotogales Thiotrichales Xanthomonadales Jumlah Kelas Panjang fragmen (Kbp) Actinobacteria Alphaproteobacteria Bacilli Bacteroidia Betaproteobacteria Chlamidiae Clostridia Dehalococcoidia Deltaproteobacteria Epsilonproteobacteria Gammaproteobacteria Methanococci Mollicutes Spirochaetia

54 42 Lampiran 5 Lanjutan Kelas Panjang fragmen (Kbp) Thermococci Thermoprotei Thermotogae Jumlah Filum Panjang fragmen (Kbp) Actinobacteria Bacteroidetes Chlamidiae Chloroflexi Crenarchaeota Euyarchaeota Firmicutes Proteobacteria Sphirochaetes Tenericutes Thermotogae Jumlah

55 Lampiran 6 Nilai parameter c dan γ terbaik yang didapat pada tahap grid search Genus Order Panjang fragmen Parameter Panjang fragmen Parameter (Kbp) c γ gamma (Kbp) c γ gamma Kelas Filum Panjang fragmen Parameter Panjang fragmen Parameter (Kbp) c γ gamma (Kbp) c γ gamma

56 44 Lampiran 7 Perbandingan akurasi yang dihasilkan dari pembuatan model hanya pada takson genus dengan pembuatan model disetiap tingkat takson Order (%) Kelas (%) Filum (%) Panjang Model Model Model Model Model Model fragmen (Kbp) genus order genus kelas genus filum

57 45 Lampiran 8 Tahapan dan tampilan pengguna sistem 1 Tampilan awal sistem 2 Pilih panjang fragmen yang akan digunakan 3 Masukkan sequence yang akan dilakukan prediksi tingkat taksonominya, dan klik button C assify

58 46 Lampiran 8 Lanjutan 4 Hasil atau keluaran sistem ialah tingkat taksonomi dari sequence masukkan

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA

OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN

Lebih terperinci

Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier. Metagenome Classification Using Naïve Bayes Classifier Method

Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier. Metagenome Classification Using Naïve Bayes Classifier Method Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 3 Nomor 1 halaman 9-18 ISSN: 2089-6026 Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier Metagenome Classification Using

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI Disusun Oleh : MEKAR SEKAR SARI NIM. 24010210120008 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

KLASIFIKASI METAGENOM DENGAN METODE NAÏVE BAYES CLASSIFIER DIAN KARTIKAUTAMI

KLASIFIKASI METAGENOM DENGAN METODE NAÏVE BAYES CLASSIFIER DIAN KARTIKAUTAMI KLASIFIKASI METAGENOM DENGAN METODE NAÏVE BAYES CLASSIFIER DIAN KARTIKAUTAMI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN 10 HASIL DAN PEMBAHASAN Pengumpulan Dokumen Tahapan awal yang dilakukan dalam penelitian adalah mengolah dokumen XML yang akan menjadi korpus. Terdapat 21578 dokumen berita yang terdiri atas 135 topik.

Lebih terperinci

PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI

PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

SVM untuk Regresi. Machine Learning

SVM untuk Regresi. Machine Learning MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA

PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

CLUSTERING FRAGMEN METAGENOM MENGGUNAKAN K-MEANS DAN EKSTRAKSI FITUR GLCM DENGAN VARIASI COVERAGE GAZA VIRYAGIE

CLUSTERING FRAGMEN METAGENOM MENGGUNAKAN K-MEANS DAN EKSTRAKSI FITUR GLCM DENGAN VARIASI COVERAGE GAZA VIRYAGIE CLUSTERING FRAGMEN METAGENOM MENGGUNAKAN K-MEANS DAN EKSTRAKSI FITUR GLCM DENGAN VARIASI COVERAGE GAZA VIRYAGIE DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI

OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

Support Vector Machine

Support Vector Machine MMA10991 Topik Khusus Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA

ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi

Lebih terperinci

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN MUHAMMAD DHIRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

PERBANDINGAN KINERJA EKSTRAKSI FITUR TINGKAT RENDAH MENGGUNAKAN METODE

PERBANDINGAN KINERJA EKSTRAKSI FITUR TINGKAT RENDAH MENGGUNAKAN METODE PERBANDINGAN KINERJA EKSTRAKSI FITUR TINGKAT RENDAH MENGGUNAKAN METODE Gray Level Co-occurrence Matrix (GLCM) dan GABOR FILTER DALAM PENGENALAN MOTIF BATIK OLEH : ANUGRAH SURADIPURWO NIM : 41508110061

Lebih terperinci

PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST

PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST MAKARA, SAINS, VOL. 7, NO.3, DESEMBER 2003 PENDETEKSIAN JENIS DAN KELAS AROMA DENGAN MENGGUNAKAN METODE ONE-VS-ONE DAN METODE ONE-VS-REST Zuherman Rustam 1,3, Benyamin Kusumoputro 2,3 dan Belawati Widjaja

Lebih terperinci

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN

Lebih terperinci

Metode Kernel. Machine Learning

Metode Kernel. Machine Learning MMA10991 Topik Khusus Machine Learning Metode Kernel Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439,

Lebih terperinci

PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER

PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER FERDINAN ANDREAS MANGASI SIMAMORA DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman 811-820 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA

Lebih terperinci

SKRIPSI. Oleh : PUSPHITA ANNA OCTAVIANI NIM PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM)

SKRIPSI. Oleh : PUSPHITA ANNA OCTAVIANI NIM PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG SKRIPSI Oleh : PUSPHITA ANNA OCTAVIANI NIM. 24010210120043 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

PENGELOMPOKAN SEKUEN DNA MENGGUNAKAN ALGORITME SINGLE LINK DAN FEATURE VECTORS AL HARIS TAMSIN

PENGELOMPOKAN SEKUEN DNA MENGGUNAKAN ALGORITME SINGLE LINK DAN FEATURE VECTORS AL HARIS TAMSIN PENGELOMPOKAN SEKUEN DNA MENGGUNAKAN ALGORITME SINGLE LINK DAN FEATURE VECTORS AL HARIS TAMSIN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

ABSTRAK. Kata Kunci : klasifikasi, musik digital, jenis musik, support vector machine, fitur ekstraksi, daftar putar musik digital

ABSTRAK. Kata Kunci : klasifikasi, musik digital, jenis musik, support vector machine, fitur ekstraksi, daftar putar musik digital ABSTRAK Kemudahan dalam mendapatkan musik digital membuat orang-orang dapat memiliki banyaknya koleksi musik digital. Terkadang orang-orang menikmati musik dengan jenis musik tertentu berdasarkan kondisi

Lebih terperinci

KAJIAN KEMAMPUAN GENERALISASI SUPPORT VECTOR MACHINE DALAM PENGENALAN JENIS SPLICE SITES PADA BARISAN DNA

KAJIAN KEMAMPUAN GENERALISASI SUPPORT VECTOR MACHINE DALAM PENGENALAN JENIS SPLICE SITES PADA BARISAN DNA KAJIAN KEMAMPUAN GENERALISASI SUPPORT VECTOR MACHINE DALAM PENGENALAN JENIS SPLICE SITES PADA BARISAN DNA Djati Kerami dan Hendri Murfi Departemen Matematika, FMIPA, Universitas Indonesia, Depok 16424,

Lebih terperinci

PENGENALAN KUALITAS BUAH JERUK KINTAMANI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) KOMPETENSI KOMPUTASI SKRIPSI KOMANG SONIYA GUNAWAN

PENGENALAN KUALITAS BUAH JERUK KINTAMANI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) KOMPETENSI KOMPUTASI SKRIPSI KOMANG SONIYA GUNAWAN PENGENALAN KUALITAS BUAH JERUK KINTAMANI MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) KOMPETENSI KOMPUTASI SKRIPSI KOMANG SONIYA GUNAWAN 1008605032 JURUSAN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

SVM untuk Regresi Ordinal

SVM untuk Regresi Ordinal MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

BAB I PENDAHULUAN. akan terus mengalami kenaikan rata-rata 3.3% pertahun dengan quantitas dan

BAB I PENDAHULUAN. akan terus mengalami kenaikan rata-rata 3.3% pertahun dengan quantitas dan BAB I PENDAHULUAN 1.1 LATAR BELAKANG Berdasarkan skala global, pasar enzim dunia adalah pasar yang sangat berprospek cerah. Pemasaran enzim dunia di beberapa 3 tahun terakhir diperkirakan telah mencapai

Lebih terperinci

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. BAB II DASAR TEORI Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. 2.1. Microsoft Visual Studio Microsoft Visual Studio adalah sebuah software yang

Lebih terperinci

4 Notepad dan Microsoft Excel sebagai editor data.

4 Notepad dan Microsoft Excel sebagai editor data. dengan menggunakan perangkat lunak ENVI disimpan dalam file.txt (Lampiran 1). File ini berisi informasi mengenai panjang gelombang dan nilai pantulan (reflectance) objek di permukaan bumi. Objek yang diperlukan

Lebih terperinci

Analisis Akurasi Support Vector Machine...

Analisis Akurasi Support Vector Machine... ANALISIS AKURASI SUPPORT VECTOR MACHINE DENGAN FUNGSI KERNEL GAUSSIAN RBF UNTUK PRAKIRAAN BEBAN LISTRIK HARIAN SEKTOR INDUSTRI Luqman Assaffat 1 * 1 Jurusan Teknik Elektro, Fakultas Teknik, Universitas

Lebih terperinci

ABSTRAK. Universitas Kristen Maranatha

ABSTRAK. Universitas Kristen Maranatha ABSTRAK Perkembangan multimedia saat ini sangat cepat. Dengan multimedia, pengguna dapat menyerap informasi dengan lebih mudah, sehingga pemilihan informasi yang tepat menjadi penting. Pemilihan informasi

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

1. Pendahuluan. 1.1 Latar Belakang

1. Pendahuluan. 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Persaingan dalam dunia bisnis, terlebih lagi bagi perusahaan besar, tidak lepas dari adanya proses jual beli saham. Saham secara umum merupakan surat berharga yang dapat

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan

BAB IV EKSPERIMEN. 4.1 Tujuan BAB IV EKSPERIMEN Pada bab ini dibahas mengenai eksperimen penggunaan SVM dalam pendeteksian intrusi pada jaringan. Pembahasan ini meliputi tujuan yang ingin dicapai melalui eksperimen ini, parameter evaluasi

Lebih terperinci

PERANCANGAN APLIKASI SISTEM PAKAR UNTUK MENDIAGNOSA PENYAKIT HERNIA DENGAN MENGGUNAKAN METODE BACKWARD CHAINING SKRIPSI

PERANCANGAN APLIKASI SISTEM PAKAR UNTUK MENDIAGNOSA PENYAKIT HERNIA DENGAN MENGGUNAKAN METODE BACKWARD CHAINING SKRIPSI PERANCANGAN APLIKASI SISTEM PAKAR UNTUK MENDIAGNOSA PENYAKIT HERNIA DENGAN MENGGUNAKAN METODE BACKWARD CHAINING SKRIPSI Ahmad Doli Hutagalung 081421037 PROGRAM EKSTENSI S1 ILMU KOMPUTER DEPARTEMEN ILMU

Lebih terperinci

PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR

PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR PENGENALAN CITRA TULISAN TANGAN DOKTER DENGAN MENGGUNAKAN SVM DAN FILTER GABOR Angga Lisdiyanto (1), Lukman Zaman P.C.S.W (2) Teknik Informatika, Universitas Islam Lamongan (1) Teknik Informatika, Sekolah

Lebih terperinci

DIAGNOSA KERUSAKAN BANTALAN BOLA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE

DIAGNOSA KERUSAKAN BANTALAN BOLA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DIAGNOSA KERUSAKAN BANTALAN BOLA MENGGUNAKAN METODE SUPPORT VECTOR MACHINE SKRIPSI Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Teknik Oleh: MUHAMMAD FATHURROHMAN NIM. I0411032 JURUSAN

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

PENERAPAN MODEL MESIN BELAJAR SUPPORT VECTOR MACHINES PADA AUTOMATIC SCORING UNTUK JAWABAN SINGKAT

PENERAPAN MODEL MESIN BELAJAR SUPPORT VECTOR MACHINES PADA AUTOMATIC SCORING UNTUK JAWABAN SINGKAT PENERAPAN MODEL MESIN BELAJAR SUPPORT VECTOR MACHINES PADA AUTOMATIC SCORING UNTUK JAWABAN SINGKAT TUGAS AKHIR Diajukan Untuk Memenuhi Sebagian Prasyarat Mencapai Derajat Teknik Informatika Disusun Oleh

Lebih terperinci

HALAMAN PERNYATAAN. Yogyakarta, 22 Agustus 2017 Yang menyatakan, Sitti Fadillah Umayah

HALAMAN PERNYATAAN. Yogyakarta, 22 Agustus 2017 Yang menyatakan, Sitti Fadillah Umayah HALAMAN PERNYATAAN Saya yang bertanda tangan di bawah ini: Nama : Sitti Fadillah Umayah NIM : 20130140193 Program studi : Teknik Informatika Fakultas : Teknik Jenis karya : Skripsi Judul karya : Penerapan

Lebih terperinci

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM)

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) SKRIPSI Diajukan sebagai salah satu syarat Untuk memperoleh gelar Sarjana Teknik Oleh: WANTO NIM.

Lebih terperinci

PRESENTASI TUGAS AKHIR IMPLEMENTASI PENGGABUNGAN ALGORITMA SUPPORT VECTOR MACHINE DAN SIMULATED ANNEALING PADA PERMASALAHAN KLASIFIKASI POLA

PRESENTASI TUGAS AKHIR IMPLEMENTASI PENGGABUNGAN ALGORITMA SUPPORT VECTOR MACHINE DAN SIMULATED ANNEALING PADA PERMASALAHAN KLASIFIKASI POLA PRESENTASI TUGAS AKHIR IMPLEMENTASI PENGGABUNGAN ALGORITMA SUPPORT VECTOR MACHINE DAN SIMULATED ANNEALING PADA PERMASALAHAN KLASIFIKASI POLA Penyusun Tugas Akhir : Astris Dyah Perwita (NRP : 5110.100.178)

Lebih terperinci

MODIFIKASI PEMBENTUKAN SPECTRUM PADA METODE SPECTRAL ALIGNMENT UNTUK PENGOREKSIAN DNA SEQUENCING ERROR GERRY INDRAMADES ALMI

MODIFIKASI PEMBENTUKAN SPECTRUM PADA METODE SPECTRAL ALIGNMENT UNTUK PENGOREKSIAN DNA SEQUENCING ERROR GERRY INDRAMADES ALMI MODIFIKASI PEMBENTUKAN SPECTRUM PADA METODE SPECTRAL ALIGNMENT UNTUK PENGOREKSIAN DNA SEQUENCING ERROR GERRY INDRAMADES ALMI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra

Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 3 Nomor 1 halaman 1-8 ISSN: 2089-6026 Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra Wood Type

Lebih terperinci

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014

ISSN : e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014 ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 5014 Klasifikasi Informasi, Anjuran dan Larangan pada Hadits Shahih Bukhari menggunakan Metode Support Vector Machine. Andina

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM)

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) 1 Lestari Handayani, 2 Fitriandini Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif

Lebih terperinci

PENGGOLONGAN UANG KULIAH TUNGGAL MENGGUNAKAN SUPPORT VECTOR MACHINE

PENGGOLONGAN UANG KULIAH TUNGGAL MENGGUNAKAN SUPPORT VECTOR MACHINE E-Jurnal Matematika Vol. 6 (4), November 2017, pp. 220-225 ISSN: 2303-1751 DOI: https://doi.org/10.24843/mtk.2017.v06.i04.p169 PENGGOLONGAN UANG KULIAH TUNGGAL MENGGUNAKAN SUPPORT VECTOR MACHINE I Gede

Lebih terperinci

Deteksi Mobil Menggunakan Histogram of Oriented Gradient

Deteksi Mobil Menggunakan Histogram of Oriented Gradient 1 Deteksi Mobil Menggunakan Histogram of Oriented Gradient Cahyo Permata,I Ketut Eddy Purnama dan Muhtadin Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut Teknologi Sepuluh Nopember (ITS)

Lebih terperinci

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali BAB I PENDAHULUAN 1.1. Latar Belakang Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali objek 3 dimensi. Sistem penglihatan manusia dapat membedakan berbagai macam objek 3 dimensi

Lebih terperinci

ANALISIS KINERJA DAN IMPLEMENTASI ALGORITMA KOMPRESI ARITHMETIC CODING PADA FILE TEKS DAN CITRA DIGITAL SKRIPSI SARIFAH

ANALISIS KINERJA DAN IMPLEMENTASI ALGORITMA KOMPRESI ARITHMETIC CODING PADA FILE TEKS DAN CITRA DIGITAL SKRIPSI SARIFAH ANALISIS KINERJA DAN IMPLEMENTASI ALGORITMA KOMPRESI ARITHMETIC CODING PADA FILE TEKS DAN CITRA DIGITAL SKRIPSI SARIFAH 061401090 PROGRAM STUDI S1 ILMU KOMPUTER DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Studi Literatur BAB II LANDASAN TEORI Penelitian yang berkaitan dengan klasifikasi kalimat tanya berdasarkan Taksonomi Bloom telah dilakukan oleh Selvia Ferdiana Kusuma dengan menggunakan algoritma

Lebih terperinci

DIAGNOSA KEGAGALAN RODA GIGI BERBASIS SINYAL GETARAN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE

DIAGNOSA KEGAGALAN RODA GIGI BERBASIS SINYAL GETARAN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DIAGNOSA KEGAGALAN RODA GIGI BERBASIS SINYAL GETARAN MENGGUNAKAN METODE SUPPORT VECTOR MACHINE SKRIPSI Diajukan sebagai salah satu syarat untuk memperoleh gelar Sarjana Teknik Oleh: AGIL RIZKI ARDIANSYAH

Lebih terperinci

Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan

Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan LAPORAN TUGAS AKHIR Disusun sebagai syarat kelulusan tingkat sarjana oleh : Krisantus Sembiring / 13503121 PROGRAM STUDI

Lebih terperinci

IDENTIFIKASI IKAN TUNA DAN TENGGIRI BERDASARKAN SEKUENS DNA BARCODE DENGAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) MULYATI

IDENTIFIKASI IKAN TUNA DAN TENGGIRI BERDASARKAN SEKUENS DNA BARCODE DENGAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) MULYATI IDENTIFIKASI IKAN TUNA DAN TENGGIRI BERDASARKAN SEKUENS DNA BARCODE DENGAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) MULYATI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN MENGENAI

Lebih terperinci

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO MENGGUNAKAN REGRESI LOGISTIK BINER DAN SUPPORT VECTOR MACHINE (SVM) ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 1, Tahun 2015, Halaman 123-132 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian KLASIFIKASI LAMA STUDI MAHASISWA FSM UNIVERSITAS DIPONEGORO

Lebih terperinci

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor PENGENALAN KADAR TOTAL PADAT TERLARUT PADA BUAH BELIMBING BERDASAR CITRA RED-GREEN-BLUE MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS (PCA) SEBAGAI EKSTRAKSI CIRI DAN KLASIFIKASI K-NEAREST NEIGHBORHOOD (KNN)

Lebih terperinci

PENGENALAN AKSARA SUNDA MENGGUNAKAN EKSTRAKSI CIRI ZONING DAN KLASIFIKASI SUPPORT VECTOR MACHINE ISNAN MULIA

PENGENALAN AKSARA SUNDA MENGGUNAKAN EKSTRAKSI CIRI ZONING DAN KLASIFIKASI SUPPORT VECTOR MACHINE ISNAN MULIA PENGENALAN AKSARA SUNDA MENGGUNAKAN EKSTRAKSI CIRI ZONING DAN KLASIFIKASI SUPPORT VECTOR MACHINE ISNAN MULIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

EKSTRAKSI CIRI TRANSFORMASI CURVELET DISKRIT UNTUK MENDETEKSI KERUSAKAN PERMUKAAN BUAH MANGGIS SKRIPSI

EKSTRAKSI CIRI TRANSFORMASI CURVELET DISKRIT UNTUK MENDETEKSI KERUSAKAN PERMUKAAN BUAH MANGGIS SKRIPSI EKSTRAKSI CIRI TRANSFORMASI CURVELET DISKRIT UNTUK MENDETEKSI KERUSAKAN PERMUKAAN BUAH MANGGIS SKRIPSI Disusun Guna Memenuhi Persyaratan Untuk Mencapai Derajat Strata-1 Pada Prodi Teknik Informatika Fakultas

Lebih terperinci

SISTEM DETEKSI PENYAKIT DIABETES MENGGUNAKAN METODE SUPPORT VECTOR MACHINES

SISTEM DETEKSI PENYAKIT DIABETES MENGGUNAKAN METODE SUPPORT VECTOR MACHINES IndoMS Journal on Statistics Vol. 2, No. 2 (2014), pp. 27 36 SISTEM DETEKSI PENYAKIT DIABETES MENGGUNAKAN METODE SUPPORT VECTOR MACHINES Abdul Azis Abdillah 1 dan Suwarno 2 1,2 STKIP Surya, 1 Politeknik

Lebih terperinci

KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DENGAN PEMILIHAN FITUR CHI-SQUARE ARINI DARIBTI PUTRI

KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DENGAN PEMILIHAN FITUR CHI-SQUARE ARINI DARIBTI PUTRI KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE SUPPORT VECTOR MACHINE DENGAN PEMILIHAN FITUR CHI-SQUARE ARINI DARIBTI PUTRI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

APLIKASI KAMUS ISTILAH BAHASA KOMPUTER DENGAN MENGGUNAKAN VISUAL BASIC 6.0 TUGAS AKHIR FAHMI HIDAYAT

APLIKASI KAMUS ISTILAH BAHASA KOMPUTER DENGAN MENGGUNAKAN VISUAL BASIC 6.0 TUGAS AKHIR FAHMI HIDAYAT APLIKASI KAMUS ISTILAH BAHASA KOMPUTER DENGAN MENGGUNAKAN VISUAL BASIC 6.0 TUGAS AKHIR Diajukan untuk melengkapi tugas dan memenuhi syarat memproleh Ahli Madya FAHMI HIDAYAT 082406086 PROGRAM STUDI D3

Lebih terperinci

HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK

HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK Oleh: MOH SHOCHWIL WIDAT 2011-51-034 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK

Lebih terperinci

PERBANDINGAN HASIL PEMODELAN ARTIFICIAL NEURAL NETWORKS DAN KERNEL SMOOTHING PADA DATA REGRESI NON LINIER

PERBANDINGAN HASIL PEMODELAN ARTIFICIAL NEURAL NETWORKS DAN KERNEL SMOOTHING PADA DATA REGRESI NON LINIER TUGAS AKHIR - ST 1325 PERBANDINGAN HASIL PEMODELAN ARTIFICIAL NEURAL NETWORKS DAN KERNEL SMOOTHING PADA DATA REGRESI NON LINIER ADITYA HIDAYAT JATI NRP 1302100044 Dosen Pembimbing Dra. Kartika Fitriasari,

Lebih terperinci

ANALISIS SUPPORT VECTOR REGRESSION

ANALISIS SUPPORT VECTOR REGRESSION ANALISIS SUPPORT VECTOR REGRESSION (SVR) DALAM MEMPREDIKSI KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT SKRIPSI Oleh : RISKY AMANDA NIM. 24010210141027 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS

Lebih terperinci

KLASIFIKASI PENERIMA PROGRAM BERAS MISKIN (RASKIN) DI KABUPATEN WONOSOBO DENGAN METODE SUPPORT VECTOR MACHINE MENGGUNAKAN LibSVM SKRIPSI

KLASIFIKASI PENERIMA PROGRAM BERAS MISKIN (RASKIN) DI KABUPATEN WONOSOBO DENGAN METODE SUPPORT VECTOR MACHINE MENGGUNAKAN LibSVM SKRIPSI KLASIFIKASI PENERIMA PROGRAM BERAS MISKIN (RASKIN) DI KABUPATEN WONOSOBO DENGAN METODE SUPPORT VECTOR MACHINE MENGGUNAKAN LibSVM SKRIPSI Oleh : YOGI SETIYO PAMUJI 24010211130053 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR

MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR MANAJEMEN RISIKO DI PERUSAHAAN BETON (STUDI KASUS UNIT READYMIX PT BETON INDONESIA) MUAMMAR TAWARUDDIN AKBAR SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR Dewi Pramudi Ismi 1), Ardiansyah 2) 1 Program Studi Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

1. PENDAHULUAN 1.1. Latar Belakang

1. PENDAHULUAN 1.1. Latar Belakang 1. PENDAHULUAN 1.1. Latar Belakang Kanker merupakan salah satu penyakit yang dapat beresiko pada kematian atau lebih dikenal dengan penyakit pembunuh. Salah satu penyakit pembunuh diantaranya kanker prostat

Lebih terperinci

Segmentasi Citra menggunakan Support Vector Machine (SVM) dan Ellipsoid Region Search Strategy (ERSS) Arimoto Entropy berdasarkan Ciri Warna dan Tekstur Lukman Hakim 1, Siti Mutrofin 2, Evy Kamilah Ratnasari

Lebih terperinci

APLIKASI KAMUS DIGITAL ISTILAH-ISTILAH BIOLOGI DENGAN MENGGUNAKAN VISUAL BASIC 6.0 TUGAS AKHIR AMELIA AGUSTINA

APLIKASI KAMUS DIGITAL ISTILAH-ISTILAH BIOLOGI DENGAN MENGGUNAKAN VISUAL BASIC 6.0 TUGAS AKHIR AMELIA AGUSTINA APLIKASI KAMUS DIGITAL ISTILAH-ISTILAH BIOLOGI DENGAN MENGGUNAKAN VISUAL BASIC 6.0 TUGAS AKHIR AMELIA AGUSTINA 072406122 PROGRAM STUDI D3 ILMU KOMPUTER DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

I. PENGENALAN NATIONAL CENTRE FOR BIOTECHNOLOGY INFORMATION (NCBI)

I. PENGENALAN NATIONAL CENTRE FOR BIOTECHNOLOGY INFORMATION (NCBI) I. PENGENALAN NATIONAL CENTRE FOR BIOTECHNOLOGY INFORMATION (NCBI) A. PENDAHULUAN NCBI (National Centre for Biotechnology Information) merupakan suatu institusi yang menyediakan sumber informasi terkait

Lebih terperinci

PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH

PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH PREDIKSI INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN SUPPORT VECTOR REGRESSION DENGAN ALGORITMA GRID SEARCH SKRIPSI Disusun Oleh : LUTFIA SEPTININGRUM 240 102 111 400 73 JURUSAN STATISTIKA FAKULTAS SAINS DAN

Lebih terperinci

HALAMAN PERNYATAAN. Yogyakarta, 26 Juli 2017 Yang menyatakan, Jaenudin

HALAMAN PERNYATAAN. Yogyakarta, 26 Juli 2017 Yang menyatakan, Jaenudin HALAMAN PERNYATAAN Saya yang bertanda tangan di bawah ini: Nama : Jaenudin NIM : 20130140074 Program studi : Teknik Informatika Fakultas : Teknik Jenis karya : Skripsi Judul karya : Penerapan Transformasi

Lebih terperinci

SISTEM PENDETEKSI WAJAH MANUSIA PADA CITRA DIGITAL

SISTEM PENDETEKSI WAJAH MANUSIA PADA CITRA DIGITAL 1 SISTEM PENDETEKSI WAJAH MANUSIA PADA CITRA DIGITAL (Human Face Detection System on Digital Images) Setyo Nugroho 1, Agus Harjoko 2 Program Studi Ilmu Komputer Program Pascasarjana Universitas Gadjah

Lebih terperinci

BAB III DATA DAN METODOLOGI

BAB III DATA DAN METODOLOGI 17 BAB III DATA DAN METODOLOGI 3.1 Data Pada penelitian ini, ada dua jenis data yang akan digunakan. Jenis data pertama adalah data curah hujan bulanan dan yang kedua adalah data luaran GCM. 3.1.1 Data

Lebih terperinci

BAB 4 HASIL DAN PEMBAHASAN

BAB 4 HASIL DAN PEMBAHASAN 68 BAB 4 HASIL DAN PEMBAHASAN 4.1. Uji Algoritma Pengujian dilakukan untuk mendapatkan algoritma yang paling optimal dari segi kecepatan dan tingkat akurasi yang dapat berjalan secara real time pada smartphone

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER ACHMAD FAHRUROZI 1 1 Universitas Gunadarma, achmad.fahrurozi12@gmail.com Abstrak Masalah yang akan diangkat dalam makalah ini adalah bagaimana

Lebih terperinci

SUPPORT VECTOR MACHINE (SVM)

SUPPORT VECTOR MACHINE (SVM) MAKALAH DATA MINING SUPPORT VECTOR MACHINE (SVM) Di Susun Oleh : Nama : RA. Toyyibatul Faihah NRP : 07.04.111.00132 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS TRUNOJOYO 2010 1 PENDAHULUAN 1.1

Lebih terperinci

PREDIKSI PRODUKSI PANEN KELAPA SAWIT MENGGUNAKAN JARINGAN SARAF RADIAL BASIS FUNCTION (RBF) SKRIPSI RINI JANNATI

PREDIKSI PRODUKSI PANEN KELAPA SAWIT MENGGUNAKAN JARINGAN SARAF RADIAL BASIS FUNCTION (RBF) SKRIPSI RINI JANNATI PREDIKSI PRODUKSI PANEN KELAPA SAWIT MENGGUNAKAN JARINGAN SARAF RADIAL BASIS FUNCTION (RBF) SKRIPSI RINI JANNATI 101402072 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI

Lebih terperinci

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala Metode Klasifikasi (SVM Light dan K-NNK NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech Jurusan Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Alur dan Proses Cleaning Process Dokumen

Lebih terperinci

: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M.

: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M. Judul : Analisis Diskriminan pada Klasifikasi Desa di Kabupaten Tabanan Menggunakan Metode K-Fold Cross Validation Nama : Ida Ayu Made Supartini Pembimbing : 1. Ir. I Komang Gde Sukarsa, M.Si 2. I Gusti

Lebih terperinci

KLASIFIKASI POLA BATIK DENGAN DETEKSI TEPI (LAPLACIAN DAN ROBERT) BERBASIS JARINGAN SYARAF TIRUAN

KLASIFIKASI POLA BATIK DENGAN DETEKSI TEPI (LAPLACIAN DAN ROBERT) BERBASIS JARINGAN SYARAF TIRUAN LAPORAN SKRIPSI KLASIFIKASI POLA BATIK DENGAN DETEKSI TEPI (LAPLACIAN DAN ROBERT) BERBASIS JARINGAN SYARAF TIRUAN Oleh : Dian Aniswari 2010-51-177 SKRIPSI DIAJUKAN SEBAGAI SALAH SATU SYARAT UNTUK MEMPEROLEH

Lebih terperinci

ALGORITMA SUPPORT VECTOR MACHINE UNTUK MENDETEKSI SMS SPAM BERBAHASA INDONESIA

ALGORITMA SUPPORT VECTOR MACHINE UNTUK MENDETEKSI SMS SPAM BERBAHASA INDONESIA ALGORITMA SUPPORT VECTOR MACHINE UNTUK MENDETEKSI SMS SPAM BERBAHASA INDONESIA Candra Putra Susanto dan Esther Irawati Setiawan Teknologi Informasi Sekolah Tinggi Teknik Surabaya Candra.ptr19@gmail.com

Lebih terperinci

IDENTIFIKASI PLAT NOMOR MENGGUNAKAN FITUR ZONING DENGAN KLASIFIKASI SUPPORT VECTOR MACHINE INTAN AYU OCTAVIA

IDENTIFIKASI PLAT NOMOR MENGGUNAKAN FITUR ZONING DENGAN KLASIFIKASI SUPPORT VECTOR MACHINE INTAN AYU OCTAVIA IDENTIFIKASI PLAT NOMOR MENGGUNAKAN FITUR ZONING DENGAN KLASIFIKASI SUPPORT VECTOR MACHINE INTAN AYU OCTAVIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Pada bab ini akan dibahas mengenai teori pendukung dan penelitian sebelumnya yang berhubungan dengan metode ekstraksi fitur, serta metode klasifikasi Support Vector Machine dalam

Lebih terperinci

PENGELOMPOKAN FRAGMEN METAGENOM DENGAN METODE GROWING SELF ORGANIZING MAP MARLINDA VASTY OVERBEEK

PENGELOMPOKAN FRAGMEN METAGENOM DENGAN METODE GROWING SELF ORGANIZING MAP MARLINDA VASTY OVERBEEK PENGELOMPOKAN FRAGMEN METAGENOM DENGAN METODE GROWING SELF ORGANIZING MAP MARLINDA VASTY OVERBEEK SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kredit merupakan salah satu bentuk usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumya, proses kredit dapat dilayani melalui lembaga

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci