KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN"

Transkripsi

1 KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Fragmen Metagenome Menggunakan Oblique Decision Tree dengan Optimasi Algoritme Genetika adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Agustus 2014 Alfat Saputra Harun NIM G

4 ABSTRAK ALFAT SAPUTRA HARUN. Klasifikasi Fragmen Metagenome Menggunakan Oblique Decision Tree dengan Optimasi Algoritme Genetika. Dibimbing oleh WISNU ANANTA KUSUMA. Analisis metagenome merupakan salah satu bidang kajian bioinformatika yang penting. Bidang ini terkait dengan analisis sampel genom yang diambil langsung dari lingkungan. Tujuan penelitian ini adalah melakukan klasifikasi fragmen metagenom ke dalam tingkat taksonomi genus menggunakan oblique decision tree yang dioptimasi dengan algoritme genetika. Proses ekstraksi ciri dilakukan dengan menggunakan frekuensi 2-mers, 3-mers, dan 4-mers. Proses klasifikasi diawali dengan membuat model berupa pohon keputusan menggunakan data latih dari 10 organisme yang termasuk ke dalam 3 genus. Dari penelitan yang dilakukan diperoleh pohon keputusan yang dapat digunakan untuk mengklasifikasikan fragmen metagenome baru ke dalam genus yang relevan. Evaluasi dilakukan dengan mengukur akurasi dari model klasifikasi. Model klasifikasi yang dihasilkan dengan metode ini kemudian dibandingkan dengan model yang dihasilkan dengan metode Naïve Bayes dan didapatkan bahwa model yang dihasilkan oleh metode oblique decision tree menghasilkan tingkat akurasi yang lebih baik dibandingkan metode Naïve Bayes, yaitu untuk fitur 3-mers dengan panjang fragmen 0.5 Kbp sampai dengan 10 Kbp metode oblique decision tree menghasilkan rata-rata akurasi 93.06%, sedangkan metode Naïve Bayes memperoleh rata-rata akurasi 89.11%. Dari percobaan menggunakan beberapa jenis fitur didapatkan bahwa semakin tinggi nilai k untuk k-mers maka semakin tinggi rata-rata akurasi yang dihasilkan, dengan fitur 4-mers menghasilkan ratarata akurasi tertinggi dan fitur 2-mers menghasilkan rata-rata akurasi terendah. Dari penggunaan beberapa jenis panjang fragmen didapatkan bahwa semakin panjang fragmen yang digunakan maka semakin tinggi hasil akurasi yang didapatkan. Kata kunci: algoritme genetika, klasifikasi, metagenom, oblique decision tree ABSTRACT ALFAT SAPUTRA HARUN. Metagenome Fragment Classification Using Oblique Decision Tree with Genetic Algorithm Optimization. Supervised by WISNU ANANTA KUSUMA. Metagenome analysis is one of the most important bioinformatics field. This field is related to genome sample which is taken directly from environment. The purpose of this research is to classify metagenome fragment into genus taxonomic level using oblique decision tree that optimized by genetic algorithm. Feature extraction is performed using 2-mers, 3-mers, and 4-mers frequencies. Classification process is conducted by creating model as a decision tree using the training data of 10 organisms that belong to 3 different genus. From the research conducted, obtained decision tree that could be used to classify new metagenome fragments to the relevant genus. Evaluation is conducted by measuring the

5 accuracy of the classification model. Classification model that generated by this method were then compared to the classification model by Naïve Bayes method and from the experiment, model by oblique decision tree obtained higher accuracy than the model of Naïve Bayes, there for the 3-mers feature with 0.5 Kbp to 10 Kbp fragment length oblique decision tree acquired 93.06% accuracy, and for Naïve Bayes method acquired 89.11% accuracy. From the experiment that using several types of features it was acquired that higher k value for k-mers will be resulted in better mean accuracy, with the 4-mers feature acquired highest mean accuracy and 2-mers feature acquired lowest mean accuracy. From using different fragment length it was acquired that the longer the fragment that used resulted in higher accuracy. Keywords: classification, genetic algorithm, metagenome, oblique decision tree

6

7 KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

8 Penguji: 1 Dr Ir Agus Buono, MSi MKom 2 Muhammad Asyhar Agmalaro, SSi MKom

9

10 PRAKATA Puji dan syukur ke hadirat Allah subhanahu wa ta ala atas segala karunia- Nya sehingga penulis bisa menyelesaikan tugas akhir dengan judul Klasifikasi Fragmen Metagenome Menggunakan Oblique Decision Tree dengan Optimasi Algoritme Genetika. Penelitian ini dilaksanakan sejak bulan November 2013 sampai dengan Juni Terima kasih penulis ucapkan kepada Bapak Dr Wisnu Ananta Kusuma, selaku pembimbing tugas akhir atas bimbingan dan arahan beliau selama pengerjaan tugas akhir ini. Terima kasih pula kepada kedua dosen penguji, yaitu Bapak Dr Agus Buono dan Bapak Muhammad Asyhar Agmalaro, MKom untuk segala saran dan masukannya. Tidak lupa ucapan terima kasih saya haturkan kepada kedua orang tua dan seluruh keluarga, atas segala doa dan dukungannya, serta kepada teman-teman Ilmu Komputer 47 dan semua pihak yang terkait secara langsung maupun tidak atas dukungannya selama penelitian ini dilakukan. Semoga karya ilmiah ini bermanfaat. Bogor, Agustus 2014 Alfat Saputra Harun

11 DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 2 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 METODE 2 Pengumpulan Data 2 Praproses Data 3 Ekstraksi Fitur 3 Pembagian Data 4 Oblique Decision Tree 4 Pengujian ODT-GA 7 Analisis 8 HASIL DAN PEMBAHASAN 8 Praproses Data 8 Ekstraksi Fitur 8 Pembagian Data 9 Pelatihan ODT-GA 9 Analisis 9 Panjang Fragmen dan Jenis Fitur 10 Perbandingan dengan Metode Naïve Bayes 11 Perhitungan Sensitivity dan Specificity 12 SIMPULAN DAN SARAN 14 Simpulan 14 Saran 15 DAFTAR PUSTAKA 15 DAFTAR LAMPIRAN 16 RIWAYAT HIDUP 17

12 DAFTAR GAMBAR 1 Tahapan penelitian 3 2 Contoh ekstraksi fitur menggunakan 3-mers 4 3 Ilustrasi k-fold cross validation 4 4 Contoh kelompok data yang dipisahkan oleh axis-parallel decision tree 5 5 Contoh operasi uniform crossover 6 6 Diagram alir proses pembentukan oblique DT 7 7 Contoh isi fail CSV fitur 3-mers untuk panjang fragmen 200 bp 9 8 Perbandingan akurasi fitur 3-mers metode ODT-GA dan Naïve Bayes 11 9 Sensitivity fitur 2-mers Sensitivity fitur 3-mers Sensitivity fitur 4-mers Specificity fitur 2-mers Specificity fitur 3-mers Specificity fitur 4-mers 13 DAFTAR LAMPIRAN 1 Daftar organisme yang digunakan pada penelitian 16 2 Akurasi metode ODT-GA sebelum penskalaan 16 3 Akurasi metode Naïve Bayes 16

13 PENDAHULUAN Latar Belakang Analisis metagenome merupakan salah satu bidang kajian bioinformatika yang penting dan terus berkembang. Menurut Handelsman et al. (1998) metagenome adalah kumpulan data genome dari suatu komunitas mikroba di alam dan data tersebut bisa digunakan untuk mengetahui fungsi biologis mikrobamikroba tersebut. Studi yang mempelajari tentang metagenome disebut metagenomika. Berbeda dengan studi yang mempelajari genom (genomika), metagenomika tidak memerlukan pure clonal cultures dari sequencing individu tertentu. DNA yang berasal dari berbagai organisme dalam suatu komunitas mikrob dapat diperoleh melalui proses sequencing secara langsung (McHardy dan Rigoutsos 2007). Proses DNA sequencing yang dilakukan secara langsung menghasilkan fragmen-fragmen dari berbagai organisme bercampur. Kondisi ini memungkinkan fragmen dari suatu organisme memiliki overlap dengan fragmen dari organisme lain sehingga dapat mengakibatkan kesalahan perakitan fragmen-fragmen yang terkandung di dalam komunitas tersebut (Wooley et al. 2010). Untuk meminimalkan kesalahan perakitan maka salah satu langkah yang dilakukan adalah binning. Proses binning bisa dilakukan dengan metode supervised learning atau unsupervised learning. Pada metode supervised learning, fragmen-fragmen diklasifikasikan berdasarkan level taksonomi tertentu, misalnya genus. Beberapa peneliti telah melakukan penelitian terkait dengan pengklasifikasian fragmen metagenome. McHardy et al. (2007) telah membangun aplikasi yang dinamai PhyloPythia. Aplikasi ini mengklasifikasikan fragmen metagenome menggunakan data latih 340 organisme dengan metode support vector machine (SVM) dan frekuensi 5-mers sebagai fiturnya. Hasil akurasi yang diperoleh cukup bervariasi, yaitu untuk panjang fragmen 5 Kilo base pair (Kbp) antara 60%-90%, untuk panjang fragmen 3 Kbp sebesar 40%, dan untuk panjang fragmen 1 Kbp diperoleh akurasi < 10%. Penelitian ini kemudian diteliti lebih lanjut oleh Ariny (2013) dengan menggunakan fitur spaced k-mers. Rosen et al. (2008) kemudian melakukan pengklasifikasian fragmen metagenome yang mengandung 635 organisme. Metode yang digunakan adalah naïve Bayes classifier (NBC) dengan fitur k-mers. Penelitian ini menghasilkan akurasi 38% untuk fragmen dengan panjang 500 bp dengan k = 3, serta akurasi tertinggi 88.8% setelah menggunakan k = 15. Rahmawati (2013) kemudian melakukan penelitian lebih lanjut dengan menambahkan fitur spaced k-mers. Didasari oleh penelitian-penelitian klasifikasi fragmen metagenome sebelumnya, penelitian ini menggunakan metode lain, yaitu oblique decision tree dengan optimasi algoritme genetika (ODT-GA) dengan fitur 2-mers, 3-mers, dan 4-mers. Penggunaan metode ini diharapkan bisa menghasilkan decision tree yang memberikan akurasi tinggi, sedangkan penggunaan beberapa jenis ekstraksi fitur yang berbeda akan dibandingkan sehingga fitur yang meningkatkan akurasi hasil klasifikasi fragmen metagenome jika menggunakan metode ini dapat diketahui.

14 2 Perumusan Masalah Rumusan masalah dalam penelitian ini yaitu besar akurasi yang diperoleh dengan menggunakan metode ODT-GA dan perbandingannya dengan metode Naïve Bayes. Rumusan masalah penelitian ini juga adalah pengaruh panjang fragmen dan jenis fitur yang digunakan terhadap hasil akurasi pengklasifikasian ODT-GA. Tujuan Penelitian Tujuan penelitian ini adalah untuk mengklasifikasikan fragmen metagenome ke dalam tingkat taksonomi genus dengan menggunakan metode ODT-GA kemudian membandingkan dengan metode klasifikasi Naïve Bayes. Tujuan lainnya adalah mengetahui pengaruh panjang fragmen dan jenis fitur yang digunakan terhadap hasil akurasi dari klasifikasi ODT-GA. Manfaat Penelitian Penelitian diharapkan dapat memberikan kontribusi untuk mendukung proses analisis metagenome sequence pada penelitian-penelitian yang akan datang. Ruang Lingkup Penelitian Penelitian yang dilakukan terbatas pada ruang lingkup tertentu, yaitu data yang digunakan hanya terdiri dari 10 organisme yang termasuk ke dalam 3 genus, fragmen yang digunakan mempunyai panjang tetap dan bebas dari sequencing error, serta tingkat taksonomi yang digunakan untuk klasifikasi hanya terbatas pada tingkat genus. Fitur k-mers yang digunakan terbatas pada nilai k = 2, k = 3, dan k = 4. Untuk panjang fragmen yang digunakan hanya dibatasi pada 200 base pair (bp), 500 bp, 1 Kilo bp (Kbp), 5 Kbp, dan 10 Kbp. METODE Penelitian dilakukan dalam beberapa tahapan yang diilustrasikan pada Gambar 1. Pengumpulan Data Data yang digunakan pada penelitian ini adalah data metagenome yang diunduh dari situs National Centre for Biotechnology Information (NCBI). NCBI merupakan suatu institusi yang fokus di bidang biologi molekuler dan menjadi

15 sumber informasi untuk perkembangan bidang tersebut. Data metagenome ini merupakan sequence DNA organisme dengan format FASTA. 3 Gambar 1 Tahapan penelitian Praproses Data Sekuens DNA metagenome yang ada diuraikan fragmennya menggunakan perangkat lunak MetaSim (Richter et al. 2008), yaitu suatu perangkat lunak untuk mensimulasikan kerja sequencer. Data yang diproses dibaca berulang kali sesuai dengan kebutuhan penelitian. Pada penelitian ini data yang dipersiapkan berjumlah 3 ribu fragmen dengan rincian jumlah fragmen organisme-organisme yang berada pada genus yang sama adalah 1000 fragmen. Keluaran dari pengolahan MetaSim ini adalah fail FASTA yang berisi sekuens DNA yang sudah terfragmen dengan panjang yang telah ditentukan. Ekstraksi Fitur Ekstraksi fitur pada penelitian ini adalah dengan melakukan pembacaan frekuensi nukleotida dengan k-mers pada sekuens DNA yang telah dibangkitkan dengan menggunakan MetaSim. Sebagai contoh, untuk k-mers dengan k = 3 maka dihitung frekuensi kemunculan dari kombinasi nukleotida yang memiliki panjang

16 4 3, yaitu AAA, AAC, AAT dan seterusnya hingga GGG. Nukleotida terdiri atas empat basa utama, yaitu Adenin, Cytosine, Thymine, dan Guanine yang disingkat menjadi A, C, T, G sehingga dimensi fitur dari k-mers dapat dihitung dengan 4 k. Contoh untuk ekstraksi fitur menggunakan fitur 3-mers dapat dilihat pada Gambar 2. Gambar 2 Contoh ekstraksi fitur menggunakan 3-mers Pembagian Data Data yang digunakan pada penelitian ini dibagi menjadi dua bagian, yaitu data latih dan data uji. Data yang digunakan terdiri atas 10 organisme yang termasuk pada 3 kelompok genus berbeda. Data latih dan data uji dibagi menggunakan k-fold cross validation dengan k = 10. Metode k-fold cross validation melakukan perulangan sebanyak k kali untuk membagi sebuah himpunan contoh secara acak menjadi k-subset yang saling bebas. Setiap ulangan terdapat satu subset yang digunakan untuk pengujian sedangkan sisanya digunakan untuk pelatihan. Gambar 3 Ilustrasi k-fold cross validation Oblique Decision Tree Decision tree (DT) merupakan salah satu metode yang populer digunakan untuk klasifikasi. Sebagian besar algoritme pembentukan tree menguji nilai dari suatu atribut tunggal untuk menjadi node pemisah. Pembentukan node seperti hal di atas bisa digambarkan seperti hyperplane yang paralel dengan salah satu sumbu pada dimensi atribut, oleh karena itu tree yang terbentuk disebut juga dengan axisparallel DT. Bentuk axis-parallel DT mudah digunakan karena model yang dihasilkan bisa lebih mudah dibaca oleh pengguna, namun juga axis-parallel DT dimungkinkan untuk menghasilkan akurasi rendah dikarenakan banyak kelompok data yang tidak bisa dipisahkan dengan hyperplane yang axis-parallel.

17 5 Gambar 4 Contoh kelompok data yang dipisahkan oleh axis-parallel decision tree Oblique DT menggunakan pengujian nilai dari banyak atribut yang kemudian membentuk suatu hyperplane yang tidak selalu axis-parallel untuk menjadi node pemisah, dan dalam beberapa kasus bisa menghasilkan ukuran tree yang lebih kecil serta akurasi yang lebih baik dibanding axis-parallel DT. Namun sekalipun dengan beberapa kelebihan tersebut, oblique DT masih jarang digunakan dikarenakan kerumitan untuk pembacaan model yang dihasilkan dan juga kebutuhan komputasi yang lebih besar dibanding dengan kebutuhan komputasi untuk membentuk axis-parallel DT. Oblique DT sendiri menggunakan hyperplane yang tidak selalu axisparallel untuk memisahkan kelompok data. Jika dicontohkan d adalah banyaknya atribut dari fitur yang digunakan, maka sebuah hyperplane bisa dituliskan sebagai atau dengan w adalah vektor suatu koefisien, x adalah vektor nilai atribut fitur, dan b adalah koefisien. Hyperplane dikatakan bisa memisahkan sekelompok data jika dapat ditemukan nilai dari w dan b sedemikian sehingga ( ) terpenuhi untuk data di atas hyperplane ( ) terpenuhi untuk data di bawah hyperplane dengan nilai x ji adalah nilai fitur atribut ke-i dari data ke-j. Dalam membentuk oblique DT terlebih dahulu perlu dicari node pemisah yang axis-parallel. Dalam menentukan node pemisah yang paling baik maka harus dipilih atribut yang bisa menjadi pemisah paling murni, yaitu atribut yang dapat memisahkan suatu kelas tanpa tercampur dengan kelas lainnya. Ukuran yang digunakan untuk melihat besaran kemurnian atau purity ini disebut informasi. Untuk mengukur baik tidaknya suatu pemisah maka perlu diketahui nilai selisih antara entropi sebelum dilakukan pemisahan dengan entropi setelah dilakukan pemisahan. Jika k adalah banyak kelas, entropi bisa dihitung dengan cara

18 6 dengan P(d i ) adalah peluang dari kelas i. Jika dicontohkan terdapat 2 jenis kelas dalam suatu kelompok data, yaitu kelas X dan kelas Y. Data kemudian dipisahkan menurut nilai dari suatu atribut sehingga terbagi menjadi dua kriteria. Jika n adalah jumlah data keseluruhan, k 1 adalah jumlah data pada kriteria pertama, k 2 adalah jumlah data pada kriteria kedua, x adalah jumlah data yang termasuk dalam kelas X, x i adalah jumlah data kelas X pada kriteria ke-i, y adalah jumlah data yang termasuk dalam kelas Y, y i adalah jumlah data kelas Y pada kriteria ke-i, maka peningkatan informasi untuk pembagian menurut kriteria tersebut bisa diketahui menurut perhitungan di bawah. ( ) ( ) ( ) Setelah ditemukan axis-parallel DT maka dilakukan optimasi dengan algoritme genetika. Gen yang digunakan adalah nilai w dan b yang merupakan koefisien dari hyperplane dan panjang gennya adalah d+1 dengan d adalah jumlah atribut fitur, dalam hal ini fitur yang digunakan adalah frekuensi k-mers, dengan jumlah fitur atau dimensinya 4 k. Sebagai contoh, 2-mers akan memberikan jumlah fitur 4 2 atau sama dengan 16. Pada library yang digunakan algoritme genetika menggunakan prinsip pairwise tournament selection, operator genetika uniform Sebelum crossover Individu 1 w1 w2 w3 w4 w5 w6 w7 w8 Individu 2 w1 w2 w3 w4 w5 w6 w7 w8 Setelah crossover Individu 1 w1 w2 w3 w4 w5 w6 w7 w8 Individu 2 w1 w2 w3 w4 w5 w6 w7 w8 Gambar 5 Contoh operasi uniform crossover crossover dengan probabilitas 1 dan tanpa mutasi. Contoh operasi uniform crossover bisa dilihat pada Gambar 5. Ukuran populasi yang digunakan adalah 20. Populasi awal dibentuk dari axis-parallel hyperplane terbaik yang mengisi 10% dari populasi awal dan sisanya diinisialisasi secara random dengan koefisien w i, b [-200,200]. Algoritme genetika berhenti setelah mencapai 25 generasi.

19 7 Gambar 6 Diagram alir proses pembentukan oblique DT Untuk lebih jelasnya langkah pembentukan oblique DT bisa dilihat pada Gambar 6. Untuk menerapkan oblique DT pada penelitian ini digunakan library DT_oblique yang didapatkan dari perangkat lunak KEEL (Alcalá-Fdezet al. 2009). KEEL merupakan perangkat lunak untuk data mining yang sebagian besar algoritmenya didasarkan pada prinsip evolusi, sedangkan library DT_oblique merupakan implementasi pada KEEL dari penelitian Cantú-Paz dan Kamath (2003) tentang algoritme oblique classifier yang dioptimasi menggunakan algoritme genetika. Pengujian ODT-GA Model decision tree yang dihasilkan dari penelitian ini digunakan untuk mengklasifikasikan data uji yang terdiri dari 300 fragmen untuk setiap fold atau perulangan. Untuk setiap perulangan didapatkan akurasi dari fragmen data uji yang ditempatkan pada genus yang sesuai. Hasil akurasi dari tiap perulangan kemudian dirata-ratakan sehingga didapatkan akurasi model yang dihasilkan oleh ODT-GA secara keseluruhan.

20 8 Analisis Berdasarkan hasil pengujian diperoleh keakuratan metode yang digunakan dalam pengklasifikasian fragmen metagenome dengan mengukur akurasi dari pengujian data uji dengan rumus: Selain akurasi, dihitung pula sensitivity dan specificity dari tiap genus dari hasil pengujian. Rumus yang digunakan untuk menghitung nilai sensitivity dan specificity, yaitu: HASIL DAN PEMBAHASAN Praproses Data Data yang diunduh dari NCBI masih berupa database dari sekuens DNA sehingga perlu diuraikan menjadi fragmen-fragmen menggunakan perangkat lunak MetaSim. Terdapat 10 organisme yang berasal dari 3 genus berbeda yang digunakan pada penelitian ini. Daftar organisme yang digunakan pada penelitian ini dapat dilihat di Lampiran 1. Pada penelitian ini terdapat beberapa panjang fragmen yang diteliti, yaitu 200 bp, 500 bp, 1 Kbp, 5 Kbp, dan 10 Kbp. Untuk tiap percobaan panjang fragmen, digunakan 3 ribu fragmen dengan rincian 1000 fragmen untuk masingmasing genus. Ekstraksi Fitur Dari fragmen-fragmen yang telah dihasilkan sebelumnya dilakukan ekstraksi fitur sehingga diperoleh atribut dari fragmen-fragmen tersebut yang dapat digunakan untuk proses klasifikasi. Untuk tiap kelompok panjang fragmen dilakukan 3 jenis ekstraksi fitur, yaitu menggunakan 2-mers, 3-mers, dan 4-mers. Jadi untuk percobaan dengan panjang fragmen 200 bp dihasilkan 3 buah fail berformat comma separated value (CSV) yang masing-masing dibagi menjadi data latih dan data uji kemudian digunakan untuk klasifikasi. Begitu pula untuk panjang fragmen 500 bp, 1 Kbp, 5 Kbp, dan 10 Kbp sehingga total fail CSV yang diperoleh adalah 15. Untuk contoh isi dari fail CSV yang dihasilkan dari ekstraksi fitur, misalnya untuk jenis fitur 3-mers, bisa dilihat pada Gambar 7.

21 9 Gambar 7 Contoh isi fail CSV fitur 3-mers untuk panjang fragmen 200 bp Pembagian Data Dari 3 ribu fragmen yang terbagi 1000 fragmen untuk setiap genus, dilakukan pembagian menjadi data latih dan data uji menggunakan 10-fold cross validation. Jadi terdapat 10 kali perulangan untuk tiap kelompok data dan di setiap perulangan 300 fragmen menjadi data uji sedangkan 2700 lainnya menjadi data latih. Jumlah fragmen yang menjadi data uji sama banyak dari setiap genus, yaitu 100. Pelatihan ODT-GA Proses pelatihan ODT-GA diawali dengan menskalakan data latih dan data uji dengan range nilai 0 hingga 1 terlebih dahulu sebelum melakukan pelatihan maupun pengujian. Proses penskalaan ini dilakukan untuk mencegah fitur atau atribut bernilai besar yang bisa mendominasi atribut lain yang bernilai kecil. Proses penskalaan terbukti dapat meningkatkan nilai akurasi dari penelitian ini. Untuk hasil akurasi sebelum penskalaan dapat dilihat pada Lampiran 2. Selanjutnya data latih digunakan untuk menghasilkan model klasifikasi yang mengklasifikasikan data uji. Analisis Analisis dilakukan terhadap hasil akurasi yang diperoleh dengan memvariasikan panjang fragmen dan jenis fitur. Kemudian akurasi dari model yang dihasilkan oleh metode ODT-GA dibandingkan dengan akurasi dari model yang dihasilkan oleh metode Naïve Bayes. Dilakukan analisis juga terhadap sensitivity untuk masing-masing genus.

22 10 Panjang Fragmen dan Jenis Fitur Untuk hasil akurasi berdasarkan jenis fitur, nilai akurasi yang dianalisis merupakan nilai akurasi dari setiap panjang fragmen yang diuji cobakan, yaitu 200 bp, 500 bp, 1 Kbp, 5 Kbp, dan 10 Kbp. Oleh karena itu didapatkan 5 akurasi untuk masing-masing fitur yang digunakan. Hasil akurasi ini ditunjukkan pada Tabel 2. Panjang fragmen terpendek yang digunakan adalah 0.2 Kbp dan memperoleh akurasi yang cukup baik, yaitu % untuk fitur 2-mers, 74.6% untuk fitur 3-mers, dan % untuk fitur 4-mers. Untuk fragmen terpanjang yaitu 10 Kbp didapatkan akurasi tinggi sebesar 97.3% untuk fitur 2-mers, % untuk fitur 3-mers, dan 98.8% untuk fitur 4-mers. Dilihat dari data yang ada penggunaan fitur 4-mers secara keseluruhan memberikan rata-rata akurasi yang lebih tinggi dibanding jenis fitur lainnya, dengan fitur 4-mers memiliki ratarata akurasi %, 3-mers %, dan 2-mers 84.96%. Terjadinya peningkatan akurasi dari penggunaan fitur 2-mers ke 4-mers disebabkan oleh jumlah atribut informasi yang tersedia, yaitu pada fitur 2-mers hanya memberikan informasi frekuensi dari kombinasi basa dengan panjang 2, sedangkan fitur 3-mers dan 4-mers memberikan informasi yang lebih baik dengan menghitung frekuensi dari kombinasi basa dengan panjang 3 dan 4. Pada beberapa kasus bisa dilihat bahwa fitur 3-mers memberikan akurasi yang lebih baik dibanding fitur 4-mers. Hal ini diduga disebabkan oleh parameter dari klasifikasi ODT-GA yang belum optimal, seperti peluang crossover atau populasi awal yang digunakan. Keterbatasan library yang digunakan pada penelitian ini belum memberikan keleluasaan bagi pengguna untuk memodifikasi nilai-nilai parameter tersebut. Tabel 1 Hasil akurasi klasifikasi ODT-GA berdasarkan jenis fitur dan panjang fragmen Panjang fragmen (Kbp) Akurasi 2-mers 3-mers 4-mers % % % % % % % % % % % % % % % Rata-rata % % % Berdasarkan data pada Tabel 2, semakin panjang fragmen yang digunakan maka semakin tinggi pula akurasi yang didapatkan. Ekstraksi fitur yang dilakukan pada penelitian ini adalah menghitung frekuensi kemunculan kombinasi basa dengan panjang tertentu, sehingga semakin panjang fragmen yang digunakan, semakin terlihat jelas perbedaan frekuensi kombinasi basa di setiap fragmen dan mempermudah untuk mengklasifikasikan ke dalam suatu genus. Apabila fragmen yang digunakan pendek maka frekuensi dari kombinasi basa banyak terdapat kemiripan.

23 Akurasi 11 Perbandingan dengan Metode Naïve Bayes Akurasi dari model klasifikasi yang dihasilkan oleh metode ODT-GA dibandingkan dengan model yang dihasilkan oleh Naïve Bayes. Pemilihan metode Naïve Bayes sebagai pembanding adalah untuk membandingkan dengan metode sebelumnya yang pernah dilakukan oleh Rahmawati (2013) dengan penyesuaian data yang digunakan, dengan jumlah fragmen yang digunakan untuk penelitian ini lebih sedikit dan atribut fitur tidak diproses menggunakan Principal Component Analysis. Hasil yang digunakan untuk perbandingan disesuaikan dengan percobaan sebelumnya, yaitu hasil akurasi dari jenis fitur 3-mers untuk panjang fragmen 500 bp, 1 Kbp, 5 Kbp, dan 10 Kbp. GP Naïve Bayes % 95.00% 90.00% 85.00% 80.00% 75.00% Panjang fragmen (Kbp) Gambar 8 Perbandingan akurasi fitur 3-mers metode ODT-GA dan Naive Bayes Dari Tabel 3 dapat dilihat bahwa secara keseluruhan hasil akurasi dari model yang dihasilkan oleh ODT-GA lebih tinggi dibandingkan dengan akurasi yang dihasilkan dengan metode Naïve Bayes. Dari rata-rata akurasi, metode ODT- GA memberikan nilai rata-rata akurasi sebesar % sedangkan metode Naïve Bayes menghasilkan rata-rata akurasi %. Terlihat pada grafik di atas bahwa selisih akurasi antara metode ODT-GA dengan Naïve Bayes semakin besar seiring dengan bertambahnya panjang fragmen. Nilai selisih akurasi terkecil antara kedua metode berada pada panjang fragmen 500 bp dengan metode ODT-GA mempunyai akurasi > 2.4%. Sementara itu, selisih akurasi terbesar terdapat pada panjang fragmen 10 Kbp dengan metode ODT-GA menghasilkan akurasi > 6.8%. Dari hasil ini dapat disimpulkan bahwa seiring dengan bertambahnya panjang fragmen, metode ODT-GA memberikan hasil klasifikasi yang semakin baik dibandingkan dengan metode Naïve. Nilai akurasi dari metode Naïve Bayes dapat dilihat lebih jelas pada Lampiran 3.

24 Sensitivity Sensitivity Sensitivity 12 Perhitungan Sensitivity dan Specificity Perhitungan sensitivity dan specificity dilakukan terhadap masing-masing genus untuk melihat akurasi dari model yang dihasilkan terhadap tiap genus. Untuk contoh perhitungan sensitivity, dari 1000 fragmen yang masuk ke dalam genus Bacillus, 973 fragmen berhasil diklasifikasikan ke dalam genus Bacillus, sedangkan 27 lainnya diklasifikasikan ke genus lainnya, maka sensitivity untuk genus Bacillus adalah 973 fragmen yang benar dibagi dengan 1000 fragmen yang seharusnya diklasifikasikan ke dalam genus Bacillus kemudian dikalikan 100%, yang hasilnya 97.3%. Hasil perhitungan sensitivity dapat dilihat pada Gambar 9, 10, 11 dan perhitungan specificity bisa dilihat di Gambar 12, 13, Kbp 0.5 Kbp 1 Kbp 5 Kbp 10 Kbp % 87.50% 75.00% 62.50% 50.00% Agrobacterium Bacillus Staphylococcus Genus Gambar 9 Sensitivity fitur 2-mers 0.2 Kbp 0.5 Kbp 1 Kbp 5 Kbp 10 Kbp % 87.50% 75.00% 62.50% 50.00% Agrobacterium Bacillus Staphylococcus Genus Gambar 10 Sensitivity fitur 3-mers 0.2 Kbp 0.5 Kbp 1 Kbp 5 Kbp 10 Kbp % 87.50% 75.00% 62.50% 50.00% Agrobacterium Bacillus Staphylococcus Genus Gambar 11 Sensitivity fitur 4-mers

25 Specificity Specificity Specificity Kbp 0.5 Kbp 1 Kbp 5 Kbp 10 Kbp % 87.50% 75.00% 62.50% 50.00% Agrobacterium Bacillus Staphylococcus Genus Gambar 12 Specificity fitur 2-mers 0.2 Kbp 0.5 Kbp 1 Kbp 5 Kbp 10 Kbp % 87.50% 75.00% 62.50% 50.00% Agrobacterium Bacillus Staphylococcus Genus Gambar 13 Specificity fitur 3-mers 0.2 Kbp 0.5 Kbp 1 Kbp 5 Kbp 10 Kbp % 87.50% 75.00% 62.50% 50.00% Agrobacterium Bacillus Staphylococcus Genus Gambar 14 Specificity fitur 4-mers Genus Agrobacterium memperoleh nilai rata-rata sensitivity tertinggi untuk semua jenis fitur, yaitu untuk fitur 2-mers sebesar 95.58%, untuk fitur 3-mers sebesar 97.28%, dan untuk fitur 4-mers sebesar 96.92%. Nilai rata-rata sensitivity terendah diperoleh oleh genus Bacillus, yaitu untuk fitur 2-mers didapat nilai sebesar 77.74%, untuk fitur 3-mers sebesar 83.98%, dan untuk 4-mers sebesar 84.58%. Untuk nilai specificity, genus Agrobacterium memperoleh nilai rata-rata specificity tertinggi dengan nilai untuk fitur 2-mers sebesar 97.93%, untuk fitur 3- mers sebesar 98.44%, dan untuk fitur 4-mers sebesar 98.61%. Nilai rata-rata terendah untuk specificity diperoleh genus Bacillus, dengan nilai untuk fitur 2- mers yaitu 88.78%, untuk fitur 3-mers sebesar 92.37%, dan untuk fitur 4-mers sebesar 92.78%. Dari percobaan yang telah dilakukan genus Agrobacterium memiliki nilai akurasi yang tinggi pada fragmen pendek dibandingkan dengan genus Bacillus maupun Staphylococcus. Jika dilihat dari taksonominya, Bacillus dan Staphylococcus memiliki kedekatan dalam klasifikasi ilmiahnya, yaitu kedua

26 14 genus tersebut termasuk pada ordo yang sama yaitu Bacillales, sedangkan Agrobacterium memiliki kesamaan dengan dua genus tersebut hanya pada tingkat kingdom Bacteria. Hal ini menyebabkan genus Bacillus dan Staphylococcus cenderung memiliki kemiripan sehingga dalam klasifikasi yang berfragmen pendek seringkali kedua genus tersebut tertukar dalam penempatannya. Seiring dengan bertambahnya panjang fragmen, akurasi kedua genus tersebut membaik dikarenakan informasi yang didapatkan pada fragmen yang panjang lebih lengkap sehingga bisa lebih mudah dalam mengklasifikasikan antara keduanya SIMPULAN DAN SARAN Simpulan Berdasarkan hasil yang diperoleh dari penelitian yang telah dilakukan, dapat disimpulkan bahwa metode klasifikasi dengan menggunakan ODT-GA dan ekstraksi fitur 2-mers, 3-mers, dan 4-mers berhasil mengklasifikasikan fragmen metagenome ke dalam level taksonomi genus dan memiliki akurasi yang cukup baik, yaitu untuk fragmen 200 bp mendapatkan akurasi > 69.83% dan fragmen 10 Kbp mendapatkan akurasi > 97%. Dari penelitian juga diketahui bahwa penggunaan fragmen panjang memberikan akurasi yang lebih tinggi dibanding penggunaan fragmen pendek. Metode ODT-GA juga memberikan akurasi yang lebih baik dibanding metode Naïve Bayes. Rata-rata akurasi untuk semua fragmen dengan jenis fragmen 3-mers pada metode ODT-GA lebih tinggi dibandingkan rata-rata akurasi metode Naïve Bayes. Berdasarkan perhitungan dari nilai sensitivity dan specificity yang telah dilakukan, nilai yang diperoleh untuk sensitivity berkisar dari 55.6% sampai dengan 99.95% sedangkan nilai untuk specificity beriksar dari 77.5% sampai dengan 99.95%. Semakin tinggi nilai sensitivity bermakna bahwa model yang dihasilkan semakin baik mendeteksi bahwa suatu fragmen termasuk dalam genus tertentu, sedangkan semakin tinggi nilai specificity bermakna bahwa model yang dihasilkan semakin baik mendeteksi bahwa suatu fragmen tidak termasuk dalam anggota genus tertentu. Dari nilai sensitivity dan specificity yang diperoleh, dengan nilai specificity lebih tinggi dibandingkan nilai sensitivity, bisa dikatakan bahwa model yang dihasilkan lebih baik dalam hal mengenali bahwa suatu fragmen bukan termasuk dalam suatu genus (true negative) dibanding mengenali bahwa suatu fragmen termasuk dalam kelas genus tertentu (true positive). Untuk contohnya, model yang dihasilkan lebih baik dalam mengenali bahwa suatu fragmen bukanlah termasuk dalam genus Bacillus sehingga fragmen tersebut dikelaskan ke genus selain Bacillus daripada mendeteksi bahwa suatu fragmen termasuk ke dalam genus Bacillus sehingga harus dikelaskan ke dalam genus Bacillus.

27 15 Saran Penelitian berikutnya bisa meningkatkan jumlah genus pada data yang digunakan sehingga model yang dihasilkan dapat mengklasifikasikan fragmenfragmen dari genus lainnya. Saran lainnya adalah mencari jenis fitur lain yang lebih representatif sehingga bisa memberikan akurasi yang lebih baik apabila dilakukan klasifikasi menggunakan ODT-GA, kemudian melakukan tuning dari segi optimasi algoritme genetikanya seperti mengubah nilai probabilitas untuk crossover dan menambahkan operasi mutasi dalam prosesnya. DAFTAR PUSTAKA Alcalá-Fdez J, Sánchez L, García S, Jesus MJ, Ventura S, Garrell JM, Otero J, Romero C, Bacardit J, Rivas VM, et al KEEL: A software tool to assess evolutionary algorithms to data mining problems. Soft Computing 13(3): doi: /s y. Ariny Klasifikasi fragmen metagenome menggunakan metode Support Vector Machine [skripsi]. Bogor (ID): Institut Pertanian Bogor. Cantú-Paz E, Kamath C Inducing oblique decision trees with evolutionary algorithms. IEEE Transactions on Evolutionary Computation 7(1): Handelsman J, Rondon MR, Brady SF, Clardy J, Goodman RM Molecular biological access to the chemistry of unknown soil microbes: A new frontier for natural products. Chemistry & Biology 5(10): McHardy AC, Martin HG, Tsirigos A, Hugenholtz P, Rigoutsos I Accurate phylogenetic classification of variable-length DNA fragments. Nature Methods. 4(1): doi: /nmeth976. McHardy AC, Rigoutsos I What s in the mix: phylogenetic classification of metagenome sequence samples. Current opinion in Microbiology. 10(5): doi: /j.mib Rahmawati V Perbandingan ekstraksi ciri k-mers dan spaced k-mers pada klasifikasi fragmen metagenome dengan Naïve Bayes Classifier [skripsi]. Bogor (ID): Institut Pertanian Bogor. Richter DC, Ott F, Auch AF, Schmid R, Huson DH MetaSim: a sequencing simulator for genomics and metagenomics. PLoS ONE. 3(10): doi: /journal.pone Rosen G, Garbarine E, Caseiro D, Polikar R, Sokhansanj Metagenome fragment classification using n-mer frequency profiles. Advances in Bioinformatics. doi: /2008/ Wooley JC, Godzik A, Friedberg I A primer on metagenomics. PLoS Computational Biology. 6(2): doi: /journal.pcbi

28 16 Lampiran 1 Daftar organisme yang digunakan pada penelitian Spesies Agrobacterium fabrum str. C58 chromosome circular Agrobacterium radiobacter K84 chromosome 2 Agrobacterium vitis S4 chromosome 1 Bacillus amyloliquefaciens FZB42 Bacillus anthracis str. Ames Ancestor chromosome Bacillus cereus 03BB102 Bacillus pseudofirmus OF4 chromosome Staphylococcus aureus subsp aureus JH1 chromosome Staphylococcus epidermis ATCC chromosome Staphylococcus haemolyticus JCSC1435 chromosome Genus Agrobacterium Bacillus Staphylococcus Lampiran 2 Akurasi metode ODT-GA sebelum penskalaan Panjang fragmen (Kbp) Akurasi 3-mers 4-mers Spaced 3-mers % % % % % % % % % % % % % % % Rata-rata % % % Lampiran 3 Akurasi metode Naïve Bayes Panjang fragmen (Kbp) Akurasi 3-mers % % % % Rata-rata %

29 17 RIWAYAT HIDUP Alfat Saputra Harun lahir pada tanggal 3 Februari 1993 bertempat di Gorontalo, dari pasangan Riansyah Harun dan Trisnawaty Bowta. Pada tahun 2010, penulis lulus dari MAN Insan Cendekia Gorontalo dan diterima sebagai mahasiswa di Departemen Ilmu Komputer, Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB. Selama menjadi mahasiswa, penulis menjadi asisten praktikum Algoritme Pemrograman (2012) di Departemen Ilmu Komputer. Pada tahun 2013, penulis melaksanakan kegiatan Praktik Kerja Lapangan (PKL) di DataOn (PT. Indodev Niaga Internet) selama 35 hari kerja. Selama masa perkuliahan, penulis juga pernah beberapa kali terlibat dalam proyek baik di dalam maupun di luar kampus, diantaranya adalah pembuatan Sistem E-voting Untuk Pemilihan Raya Fakultas Pertanian Institut Pertanian Bogor dan penerapan Sistem Rekomendasi Pengembangan Layanan Perbankan Untuk Daerah Bogor.

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI

OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA

OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN

Lebih terperinci

PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA

PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER

PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER FERDINAN ANDREAS MANGASI SIMAMORA DEPARTEMEN ILMU KOMPUTER FAKULTAS

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) ARINY

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) ARINY KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) ARINY DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN

Lebih terperinci

Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier. Metagenome Classification Using Naïve Bayes Classifier Method

Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier. Metagenome Classification Using Naïve Bayes Classifier Method Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 3 Nomor 1 halaman 9-18 ISSN: 2089-6026 Klasifikasi Metagenom dengan Metode Naïve Bayes Classifier Metagenome Classification Using

Lebih terperinci

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN

Lebih terperinci

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

METAGENOME FRAGMENT CLUSTERING MENGGUNAKAN ALGORITME PILLAR K-MEANS SECARA PARALEL DALAM MODEL MAPREDUCE FATHURROHMAN

METAGENOME FRAGMENT CLUSTERING MENGGUNAKAN ALGORITME PILLAR K-MEANS SECARA PARALEL DALAM MODEL MAPREDUCE FATHURROHMAN METAGENOME FRAGMENT CLUSTERING MENGGUNAKAN ALGORITME PILLAR K-MEANS SECARA PARALEL DALAM MODEL MAPREDUCE FATHURROHMAN SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN MENGENAI TESIS

Lebih terperinci

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI Disusun Oleh : MEKAR SEKAR SARI NIM. 24010210120008 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN MUHAMMAD DHIRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

ANALISIS KERAGAMAN GENETIK KELAPA SAWIT (Elaeis guineensis Jacq) ASAL JAWA BARAT DENGAN PENANDA RAPD (Random Amplified Polymorphic DNA)

ANALISIS KERAGAMAN GENETIK KELAPA SAWIT (Elaeis guineensis Jacq) ASAL JAWA BARAT DENGAN PENANDA RAPD (Random Amplified Polymorphic DNA) ANALISIS KERAGAMAN GENETIK KELAPA SAWIT (Elaeis guineensis Jacq) ASAL JAWA BARAT DENGAN PENANDA RAPD (Random Amplified Polymorphic DNA) MUHAMMAD IQBAL SYUKRI DEPARTEMEN BIOKIMIA FAKULTAS MATEMATIKA DAN

Lebih terperinci

ABSTRAK. Universitas Kristen Maranatha

ABSTRAK. Universitas Kristen Maranatha ABSTRAK Dalam beberapa tahun terakhir ini, peranan algoritma genetika terutama untuk masalah optimisasi, berkembang dengan pesat. Masalah optimisasi ini beraneka ragam tergantung dari bidangnya. Dalam

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada bagian ini akan diuraikan teori-teori dasar yang dijadikan sebagai landasan dalam penulisan tugas akhir ini. 2.1 Ilmu Bioinformatika Bioinformatika merupakan kajian yang mengkombinasikan

Lebih terperinci

MODIFIKASI PEMBENTUKAN SPECTRUM PADA METODE SPECTRAL ALIGNMENT UNTUK PENGOREKSIAN DNA SEQUENCING ERROR GERRY INDRAMADES ALMI

MODIFIKASI PEMBENTUKAN SPECTRUM PADA METODE SPECTRAL ALIGNMENT UNTUK PENGOREKSIAN DNA SEQUENCING ERROR GERRY INDRAMADES ALMI MODIFIKASI PEMBENTUKAN SPECTRUM PADA METODE SPECTRAL ALIGNMENT UNTUK PENGOREKSIAN DNA SEQUENCING ERROR GERRY INDRAMADES ALMI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

2 TINJAUAN PUSTAKA. 2.1 Peringkasan Teks

2 TINJAUAN PUSTAKA. 2.1 Peringkasan Teks 4 2 TINJAUAN PUSTAKA 2.1 Peringkasan Teks Peringkasan teks adalah proses pemampatan teks sumber ke dalam versi lebih pendek namun tetap mempertahankan informasi yang terkandung didalamnya (Barzilay & Elhadad

Lebih terperinci

PREDIKSI PENYAKIT MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DAN ALGORITMA GENETIKA UNTUK DATA BERDIMENSI TINGGI

PREDIKSI PENYAKIT MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DAN ALGORITMA GENETIKA UNTUK DATA BERDIMENSI TINGGI ISSN : 2355-9365 e-proceeding of Engineering : Vol.3, No.2 Agustus 2016 Page 3771 PREDIKSI PENYAKIT MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DAN ALGORITMA GENETIKA UNTUK DATA BERDIMENSI TINGGI DISEASE

Lebih terperinci

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM)

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) SKRIPSI Diajukan sebagai salah satu syarat Untuk memperoleh gelar Sarjana Teknik Oleh: WANTO NIM.

Lebih terperinci

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA Akmal Hidayat 1) & Entin Martiana 2) 1) Teknik Elektro Politeknik Bengkalis Jl.

Lebih terperinci

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh

Lebih terperinci

PREDIKSI TIME SERIES TINGKAT INFLASI INDONESIA MENGGUNAKAN EVOLUTION STRATEGIES

PREDIKSI TIME SERIES TINGKAT INFLASI INDONESIA MENGGUNAKAN EVOLUTION STRATEGIES PREDIKSI TIME SERIES TINGKAT INFLASI INDONESIA MENGGUNAKAN EVOLUTION STRATEGIES Universitas Telkom Jl.Telekomunikasi No. 1, Terusan Buah Batu, Bandung ritaris@telkomuniversity.ac.id Abstrak Prediksi tingkat

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Teknologi semakin berkembang seiring dengan berjalannya waktu. Disadari atau tidak, sebagian besar kehidupan ini dibantu oleh teknologi dan banyak sekali manfaat yang

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama

Lebih terperinci

BAB 2 LANDASAN TEORI. 2.1 Algoritma Genetika

BAB 2 LANDASAN TEORI. 2.1 Algoritma Genetika 6 BAB 2 LANDASAN TEORI 2.1 Algoritma Genetika Algoritma genetika merupakan metode pencarian yang disesuaikan dengan proses genetika dari organisme-organisme biologi yang berdasarkan pada teori evolusi

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

TEKNIK PENJADWALAN KULIAH MENGGUNAKAN METODE ALGORITMA GENETIKA. Oleh Dian Sari Reski 1, Asrul Sani 2, Norma Muhtar 3 ABSTRACT

TEKNIK PENJADWALAN KULIAH MENGGUNAKAN METODE ALGORITMA GENETIKA. Oleh Dian Sari Reski 1, Asrul Sani 2, Norma Muhtar 3 ABSTRACT TEKNIK PENJADWALAN KULIAH MENGGUNAKAN METODE ALGORITMA GENETIKA Oleh Dian Sari Reski, Asrul Sani 2, Norma Muhtar 3 ABSTRACT Scheduling problem is one type of allocating resources problem that exist to

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

KLASIFIKASI METAGENOM DENGAN METODE NAÏVE BAYES CLASSIFIER DIAN KARTIKAUTAMI

KLASIFIKASI METAGENOM DENGAN METODE NAÏVE BAYES CLASSIFIER DIAN KARTIKAUTAMI KLASIFIKASI METAGENOM DENGAN METODE NAÏVE BAYES CLASSIFIER DIAN KARTIKAUTAMI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK

Lebih terperinci

Identifikasi DNA dengan Rantai Markov Orde Satu dan Probabilistic Neural Network

Identifikasi DNA dengan Rantai Markov Orde Satu dan Probabilistic Neural Network Seminar Nasional Teknologi Informasi 2013 1 Identifikasi DNA dengan Rantai Markov Orde Satu dan Probabilistic Neural Network Toto Haryanto 1) Habib Rijzaani 2) Muhammad Luthfi Fajar 3) 1) Laboratorium

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

PERBANDINGAN K-NEAREST NEIGHBOR DAN NAIVE BAYES UNTUK KLASIFIKASI TANAH LAYAK TANAM POHON JATI

PERBANDINGAN K-NEAREST NEIGHBOR DAN NAIVE BAYES UNTUK KLASIFIKASI TANAH LAYAK TANAM POHON JATI Techno.COM, Vol. 15, No. 3, Agustus 2016: 241-245 PERBANDINGAN K-NEAREST NEIGHBOR DAN NAIVE BAYES UNTUK KLASIFIKASI TANAH LAYAK TANAM POHON JATI Didik Srianto 1, Edy Mulyanto 2 1,2 Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

CLUSTERING FRAGMEN METAGENOM MENGGUNAKAN K-MEANS DAN EKSTRAKSI FITUR GLCM DENGAN VARIASI COVERAGE GAZA VIRYAGIE

CLUSTERING FRAGMEN METAGENOM MENGGUNAKAN K-MEANS DAN EKSTRAKSI FITUR GLCM DENGAN VARIASI COVERAGE GAZA VIRYAGIE CLUSTERING FRAGMEN METAGENOM MENGGUNAKAN K-MEANS DAN EKSTRAKSI FITUR GLCM DENGAN VARIASI COVERAGE GAZA VIRYAGIE DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

RANCANG BANGUN PERANGKAT LUNAK PENJADWALAN PERKULIAHAN MENGGUNAKAN METODE META- HEURISTIK (PENGGABUNGAN METODE ALGORITMA GENETIK DAN TABU SEARCH)

RANCANG BANGUN PERANGKAT LUNAK PENJADWALAN PERKULIAHAN MENGGUNAKAN METODE META- HEURISTIK (PENGGABUNGAN METODE ALGORITMA GENETIK DAN TABU SEARCH) RANCANG BANGUN PERANGKAT LUNAK PENJADWALAN PERKULIAHAN MENGGUNAKAN METODE META- HEURISTIK (PENGGABUNGAN METODE ALGORITMA GENETIK DAN TABU SEARCH) TUGAS AKHIR Disusun Oleh : RIO PRAYOGA SUPRAYANA NPM. 06

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PEMBENTUKAN OVERLAP GRAPH MENGGUNAKAN ACGT WORDS TREE PADA SEKUENS DNA WISNU FEBRY PRADANA

PEMBENTUKAN OVERLAP GRAPH MENGGUNAKAN ACGT WORDS TREE PADA SEKUENS DNA WISNU FEBRY PRADANA PEMBENTUKAN OVERLAP GRAPH MENGGUNAKAN ACGT WORDS TREE PADA SEKUENS DNA WISNU FEBRY PRADANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN

Lebih terperinci

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA

PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA PEMODELAN JARINGAN SYARAF TIRUAN UNTUK PENGENALAN KATA PADA BERBAGAI KONDISI KESEHATAN PEMBICARA BAYU INDRAYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

MODEL PENDUGA VOLUME POHON MAHONI DAUN BESAR (Swietenia macrophylla, King) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, JAWA BARAT WAHYU NAZRI YANDI

MODEL PENDUGA VOLUME POHON MAHONI DAUN BESAR (Swietenia macrophylla, King) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, JAWA BARAT WAHYU NAZRI YANDI MODEL PENDUGA VOLUME POHON MAHONI DAUN BESAR (Swietenia macrophylla, King) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, JAWA BARAT WAHYU NAZRI YANDI DEPARTEMEN MANAJEMEN HUTAN FAKULTAS KEHUTANAN INSTITUT

Lebih terperinci

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP KATA PENGANTAR Syukur Alhamdulillah, puji dan syukur kami panjatkan kehadirat Allah SWT, karena dengan limpah dan rahmat dan karunia-nya penulis dapat menyelesaikan penyusunan laporan tugas akhir APLIKASI

Lebih terperinci

APLIKASI ALGORITMA GENETIKA DALAM PENENTUAN DOSEN PEMBIMBING SEMINAR HASIL PENELITIAN DAN DOSEN PENGUJI SKRIPSI

APLIKASI ALGORITMA GENETIKA DALAM PENENTUAN DOSEN PEMBIMBING SEMINAR HASIL PENELITIAN DAN DOSEN PENGUJI SKRIPSI Prosiding Seminar Nasional Matematika dan Terapannya 2016 p-issn : 2550-0384; e-issn : 2550-0392 APLIKASI ALGORITMA GENETIKA DALAM PENENTUAN DOSEN PEMBIMBING SEMINAR HASIL PENELITIAN DAN DOSEN PENGUJI

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO ANALISIS PERBANDINGAN PROSES CLUSTER MENGGUNAKAN K- MEANS CLUSTERING DAN K-NEAREST NEIGHBOR PADA PENYAKIT DIABETES MELLITUS SKRIPSI RONNY BENEDIKTUS SIRINGORINGO 131421021 PROGRAM STUDI S1 ILMU KOMPUTER

Lebih terperinci

PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI

PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh

Lebih terperinci

ANALISIS SPAM FILTERING PADA MAIL SERVER DENGAN METODE BAYESIAN CHI-SQUARE DAN NAIVE BAYES CLASSIFIER SKRIPSI

ANALISIS SPAM FILTERING PADA MAIL SERVER DENGAN METODE BAYESIAN CHI-SQUARE DAN NAIVE BAYES CLASSIFIER SKRIPSI ANALISIS SPAM FILTERING PADA MAIL SERVER DENGAN METODE BAYESIAN CHI-SQUARE DAN NAIVE BAYES CLASSIFIER SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika Disusun

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra

Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 3 Nomor 1 halaman 1-8 ISSN: 2089-6026 Identifikasi Jenis Kayu Menggunakan Support Vector Machine Berbasis Data Citra Wood Type

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat memberikan banyak kemudahan dalam penyelesaian masalah dan pencapaian hasil kerja yang memuaskan bagi kehidupan manusia. Salah satu

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1. 1.1 Latar Belakang Perkembangan dunia telekomunikasi meningkat secara signifikan dalam kurun waktu satu dekade terahir. Tidak hanya dari segi jumlah pengguna, jenis layanan yang ditawarkanpun

Lebih terperinci

4 HASIL DAN PEMBAHASAN

4 HASIL DAN PEMBAHASAN 24 4 HASIL DAN PEMBAHASAN 4.1 Data Korpus Data korpus berisi berita-berita nasional berbahasa Indonesia dari tanggal 11 Maret 2002 sampai 11 April 2002. Berita tersebut berasal dari berita online harian

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data Mining adalah proses pencarian pengetahuan dari suatu data berukuran besar melalui metode statistik, machine learning, dan artificial algorithm. Hal yang paling

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

Jaringan Syaraf Tiruan dengan Pembelajaran Algoritma Genetika dan Diversitas untuk Deteksi Kelas Penyakit

Jaringan Syaraf Tiruan dengan Pembelajaran Algoritma Genetika dan Diversitas untuk Deteksi Kelas Penyakit Jaringan Syaraf Tiruan dengan Pembelajaran Algoritma Genetika dan Diversitas untuk Deteksi Kelas Penyakit Abidatul Izzah 1), Ratih Kartika Dewi 2) 1)2) Jurusan Teknik Informatika ITS Surabaya Jl. Teknik

Lebih terperinci

PENDUGAAN POTENSI BIOMASSA TEGAKAN DI AREAL REHABILITASI HUTAN PENDIDIKAN GUNUNG WALAT MENGGUNAKAN METODE TREE SAMPLING INTAN HARTIKA SARI

PENDUGAAN POTENSI BIOMASSA TEGAKAN DI AREAL REHABILITASI HUTAN PENDIDIKAN GUNUNG WALAT MENGGUNAKAN METODE TREE SAMPLING INTAN HARTIKA SARI PENDUGAAN POTENSI BIOMASSA TEGAKAN DI AREAL REHABILITASI HUTAN PENDIDIKAN GUNUNG WALAT MENGGUNAKAN METODE TREE SAMPLING INTAN HARTIKA SARI DEPARTEMEN MANAJEMEN HUTAN FAKULTAS KEHUTANAN INSTITUT PERTANIAN

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Seiring dengan perkembangan pasar modal yang pesat, menuntut investor untuk memiliki banyak strategi dalam berinvestasi. Dalam berinvestasi dituntut untuk selalu mengelola

Lebih terperinci

BAB II LANDASAN TEORI. Tahun 2001 pemilik CV. Tunas Jaya membuka usaha di bidang penjualan dan

BAB II LANDASAN TEORI. Tahun 2001 pemilik CV. Tunas Jaya membuka usaha di bidang penjualan dan BAB II LANDASAN TEORI 2.1 Sejarah Perusahaan Tahun 2001 pemilik CV. Tunas Jaya membuka usaha di bidang penjualan dan pengadaan suku cadang computer. Dalam bidang tersebut diharuskan berbadan hukum PD,

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

STUDI HOMOLOGI DAERAH TERMINAL-C HASIL TRANSLASI INSCRIPTO BEBERAPA GEN DNA POLIMERASE I

STUDI HOMOLOGI DAERAH TERMINAL-C HASIL TRANSLASI INSCRIPTO BEBERAPA GEN DNA POLIMERASE I STUDI HOMOLOGI DAERAH TERMINAL-C HASIL TRANSLASI INSCRIPTO BEBERAPA GEN DNA POLIMERASE I T 572 MUL ABSTRAK DNA polimerase merupakan enzim yang berperan dalam proses replikasi DNA. Tiga aktivitas yang umumnya

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

PERNYATAAN. dikutip dalam naskah ini dan disebutkan dalam daftar pustaka.

PERNYATAAN. dikutip dalam naskah ini dan disebutkan dalam daftar pustaka. PERNYATAAN Dengan ini saya menyatakan bahwa dalam skripsi ini tidak terdapat karya yang pernah diajukan untuk memperoleh gelar kesarjanaan di suatu Perguruan Tinggi dan sepanjang pengetahuan saya juga

Lebih terperinci

LAPORAN TUGAS AKHIR. Disusun oleh: Franky

LAPORAN TUGAS AKHIR. Disusun oleh: Franky LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis

Lebih terperinci

SISTEM PENGENALAN WAJAH BERBASIS METODA FISHERFACE TUGAS AKHIR. Febrian Ardiyanto NIM :

SISTEM PENGENALAN WAJAH BERBASIS METODA FISHERFACE TUGAS AKHIR. Febrian Ardiyanto NIM : SISTEM PENGENALAN WAJAH BERBASIS METODA FISHERFACE TUGAS AKHIR Oleh Febrian Ardiyanto NIM : 13203137 PROGRAM STUDI TEKNIK ELEKTRO SEKOLAH TEKNIK ELEKTRO DAN INFORMATIKA INSTITUT TEKNOLOGI BANDUNG 2007

Lebih terperinci

LAJU INFILTRASI TANAH DIBERBAGAI KEMIRINGAN LERENG HUTAN PENDIDIKAN GUNUNG WALAT, KABUPATEN SUKABUMI JAWA BARAT LINGGA BUANA

LAJU INFILTRASI TANAH DIBERBAGAI KEMIRINGAN LERENG HUTAN PENDIDIKAN GUNUNG WALAT, KABUPATEN SUKABUMI JAWA BARAT LINGGA BUANA LAJU INFILTRASI TANAH DIBERBAGAI KEMIRINGAN LERENG HUTAN PENDIDIKAN GUNUNG WALAT, KABUPATEN SUKABUMI JAWA BARAT LINGGA BUANA DEPARTEMEN MANAJEMEN HUTAN FAKULTAS KEHUTANAN INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA (Studi Kasus Nilai Mata Pelajaran Pokok di SMA Negeri 1 Jepara) SKRIPSI

Lebih terperinci

IMPLEMENTASI ALGORITMA GENETIKA DALAM PENJADWALAN PERKULIAHAN DAN PRAKTIKUM (STUDI KASUS : FASILKOM-TI DAN FMIPA USU) SKRIPSI

IMPLEMENTASI ALGORITMA GENETIKA DALAM PENJADWALAN PERKULIAHAN DAN PRAKTIKUM (STUDI KASUS : FASILKOM-TI DAN FMIPA USU) SKRIPSI IMPLEMENTASI ALGORITMA GENETIKA DALAM PENJADWALAN PERKULIAHAN DAN PRAKTIKUM (STUDI KASUS : FASILKOM-TI DAN FMIPA USU) SKRIPSI YAKHDI PERARI PINEM 131421088 PROGRAM STUDI EKSTENSI S1 ILMU KOMPUTER FAKULTAS

Lebih terperinci

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG TESIS IVAN JAYA 117038072 PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan merupakan salah satu aspek penting di dalam kehidupan. Oleh karena itu, pendidikan mendapat perhatian besar dalam kehidupan masyarakat dan negara. Pendidikan

Lebih terperinci

PERBANDINGAN KINERJA EKSTRAKSI FITUR TINGKAT RENDAH MENGGUNAKAN METODE

PERBANDINGAN KINERJA EKSTRAKSI FITUR TINGKAT RENDAH MENGGUNAKAN METODE PERBANDINGAN KINERJA EKSTRAKSI FITUR TINGKAT RENDAH MENGGUNAKAN METODE Gray Level Co-occurrence Matrix (GLCM) dan GABOR FILTER DALAM PENGENALAN MOTIF BATIK OLEH : ANUGRAH SURADIPURWO NIM : 41508110061

Lebih terperinci

Kata kunci: Klasifikasi, warna kulit, naïve bayes

Kata kunci: Klasifikasi, warna kulit, naïve bayes PENGKLASIFIKASI GENUS PANTHERA (HARIMAU, SINGA, JAGUAR DAN MACAN TUTUL DENGAN METODE NAIVE BAYES Program Studi Informatika, Program Teknologi Informasi dan Ilmu Komputer, Agus Suryanto, Brian Andrianto,

Lebih terperinci

Keywords Algoritma, Genetika, Penjadwalan I. PENDAHULUAN

Keywords Algoritma, Genetika, Penjadwalan I. PENDAHULUAN Optimasi Penjadwalan Mata Kuliah Dengan Algoritma Genetika Andysah Putera Utama Siahaan Universitas Pembangunan Pancabudi Jl. Gatot Subroto Km. 4,5, Medan, Sumatra Utara, Indonesia andiesiahaan@gmail.com

Lebih terperinci

EKSTRAKSI FITUR MENGGUNAKAN ELLIPTICAL FOURIER DESCRIPTOR UNTUK PENGENALAN VARIETAS TANAMAN KEDELAI HERMAWAN SYAHPUTRA

EKSTRAKSI FITUR MENGGUNAKAN ELLIPTICAL FOURIER DESCRIPTOR UNTUK PENGENALAN VARIETAS TANAMAN KEDELAI HERMAWAN SYAHPUTRA EKSTRAKSI FITUR MENGGUNAKAN ELLIPTICAL FOURIER DESCRIPTOR UNTUK PENGENALAN VARIETAS TANAMAN KEDELAI HERMAWAN SYAHPUTRA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN MENGENAI TESIS

Lebih terperinci

PROFIL PLASMID Bacillus thuringiensis ISOLAT JAKARTA, BOGOR, TANGERANG, DAN BEKASI WISNU HERLAMBANG

PROFIL PLASMID Bacillus thuringiensis ISOLAT JAKARTA, BOGOR, TANGERANG, DAN BEKASI WISNU HERLAMBANG PROFIL PLASMID Bacillus thuringiensis ISOLAT JAKARTA, BOGOR, TANGERANG, DAN BEKASI WISNU HERLAMBANG PROGRAM STUDI BIOKIMIA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2007

Lebih terperinci

Denny Hermawanto

Denny Hermawanto Algoritma Genetika dan Contoh Aplikasinya Denny Hermawanto d_3_nny@yahoo.com http://dennyhermawanto.webhop.org Lisensi Dokumen: Seluruh dokumen di IlmuKomputer.Com dapat digunakan, dimodifikasi dan disebarkan

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

Kata kunci : dimensionality, data mining, K-Means, GA, SVM

Kata kunci : dimensionality, data mining, K-Means, GA, SVM Prediksi Penyakit Menggunakan Algoritma K-Means dan GA untuk Reduksi Dimensi dengan Mengintegrasikan SVM pada Data Berdimensi Tinggi. Disease Prediction using K-Means and GA for Dimension Reduction by

Lebih terperinci

Optimasi Pemilihan Pekerja Bangunan Proyek Pada PT. Citra Anggun Pratama Menggunakan Algoritma Genetika

Optimasi Pemilihan Pekerja Bangunan Proyek Pada PT. Citra Anggun Pratama Menggunakan Algoritma Genetika Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 2, Februari 2017, hlm. 80-84 http://j-ptiik.ub.ac.id Optimasi Pemilihan Pekerja Bangunan Proyek Pada PT. Citra Anggun

Lebih terperinci

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1 1.1 Latar Belakang BAB I PENDAHULUAN Dalam Peraturan Menteri Agama Republik Indonesia Nomor 30 Tahun 2014 tentang Biaya Kuliah Tunggal dan Uang Kuliah Tunggal pada Perguruan Tinggi Keagamaan Negeri di

Lebih terperinci

BABI PENDAHULUAN. 1.1 Latar Belakang

BABI PENDAHULUAN. 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Kanker payudara adalah jenis kanker yang dimulai pada sel-sel payudara sebagai sekelompok sel kanker, yang kemudian dapat menyerang jaringan di sekitarnya atau menyebar

Lebih terperinci

Aplikasi Algoritma Genetika Untuk Menyelesaikan Travelling Salesman Problem (TSP)

Aplikasi Algoritma Genetika Untuk Menyelesaikan Travelling Salesman Problem (TSP) JTRISTE, Vol.1, No.2, Oktober 2014, pp. 50~57 ISSN: 2355-3677 Aplikasi Algoritma Genetika Untuk Menyelesaikan Travelling Salesman Problem (TSP) STMIK Handayani Makassar najirah_stmikh@yahoo.com Abstrak

Lebih terperinci

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

Lebih terperinci

OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA

OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA OPTIMASI PENJADWALAN CERDAS MENGGUNAKAN ALGORITMA MEMETIKA Muhammad Arief Nugroho 1, Galih Hermawan, S.Kom., M.T. 2 1, 2 Universitas Komputer Indonesia Jl. Dipatiukur No. 112-116, Bandung 40132 E-mail

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

PENGENALAN BIOINFORMATIKA

PENGENALAN BIOINFORMATIKA PS-S1 Jurusan Biologi, FMIPA, UNEJ (2017) PENGENALAN BIOINFORMATIKA Oleh: Syubbanul Wathon, S.Si., M.Si. Pokok Bahasan Sejarah Bioinformatika Istilah-istilah biologi Pangkalan data Tools Bioinformatika

Lebih terperinci