PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER

Ukuran: px
Mulai penontonan dengan halaman:

Download "PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER"

Transkripsi

1 PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER FERDINAN ANDREAS MANGASI SIMAMORA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Pemodelan Biplot pada Klasifikasi Fragmen Metagenom dengan K-Mers sebagai Ekstraksi Ciri dan Probabilistic Neural Network sebagai Classifier adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Desember 2014 Ferdinan Andreas Mangasi Simamora NIM G

4 ABSTRAK FERDINAN ANDREAS MANGASI SIMAMORA. Pemodelan Biplot pada Klasifikasi Fragmen Metagenom dengan K-Mers sebagai Ekstraksi Ciri dan Probabilistic Neural Network sebagai Classifier. Dibimbing oleh AGUS BUONO Metagenom adalah studi terhadap material genetika yang diambil langsung dari sumber lingkungan organisme dengan melakukan prosedur sekuensing deoxyribonucleic acid. Sekuensing dilakukan pada sekumpulan genom yang sudah tercampur dengan beragam organisme lain pada lingkungan tersebut. Hal ini menyebabkan proses identifikasi organisme diperlukan untuk mencegah kesalahan perakitan fragmen antar organisme. Penelitian ini bertujuan untuk mengklasifikasikan fragmen metagenom pada tingkat genus dengan algoritme Probabilistic Neural Network dan k-mers sebagai pengekstraksi cirinya. Pemodelan biplot digunakan untuk mereduksi ciri dari hasil k-mers yang memiliki dimensi cukup besar. Penelitian ini menggunakan 3 genus mikroorganisme yang dibagi menjadi 2 kelompok dataset yaitu organisme dikenal dan organisme belum dikenal. fragmen yang digunakan untuk setiap dataset ialah 500 bp, 1 kbp, 5 kbp, dan 10 kbp. Dari hasil penelitian ini didapatkan akurasi terbaik sebesar 98.10% untuk data organisme dikenal dan 92.80% untuk data organisme belum dikenal. Pemodelan biplot berhasil mereduksi 68.75% ciri fragmen dengan efisiensi waktu pengklasifikasian sebesar 12%. Kata kunci: metagenom, DNA, k-mers, biplot, PNN. ABSTRACT FERDINAN ANDREAS MANGASI SIMAMORA. Biplot Modelling on Metagenome Fragment Classification using K-Mers as Feature Extraction and Probabilistic Neural Network as Classifier. Supervised by AGUS BUONO. Metagenomics is the study of the genetic material taken directly from the organism's source environment by performing deoxyribonucleic acid sequencing procedure. Sequencing was performed on a set of genomes that have been mixed with a variety of other organisms in the environment. This led to the identification of the organism is required to prevent fragment assembly error between organisms. This study objectives to classify metagenome fragments at the genus level with Probabilistic Neural Network algorithms and k-mers as the features extraction. Biplot modelling is used to reduce features of the k-mers results that have dimensions large enough. This study uses 3 genuses of microorganisms which are divided into 2 dataset groups, namely known organisms and unknown organisms. The length of fragments used for each dataset is 500 bp, 1 kbp, 5 kbp, and 10 kbp. From the results of this study, the best accuracy for the known organisms was 98.10% and 92.80% for unknown organisms. Biplot modelling managed to reduce 68.75% fragment features with classification efficiency of 12%. Keywords: metagenome, DNA, k-mers, biplot, PNN.

5 PEMODELAN BIPLOT PADA KLASIFIKASI FRAGMEN METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER FERDINAN ANDREAS MANGASI SIMAMORA Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

6 Penguji: 1 Dr Wisnu Ananta Kusuma, ST MT 2 Toto Haryanto, SKom MSi

7 Judul Skripsi : Pemodelan Biplot pada Klasifikasi Fragmen Metagenom dengan K-Mers Sebagai Ekstraksi Ciri Dan Probabilistic Neural Network Sebagai Classifier Nama : Ferdinan Andreas Mangasi Simamora NIM : G Disetujui oleh Dr Ir Agus Buono, MSi MKom Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Puji dan syukur penulis panjatkan kepada Tuhan Yang Maha Esa atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Tema yang dipilih dalam penelitian yang dilaksanakan sejak bulan Juli 2014 ini ialah bioinformatika, dengan judul Pemodelan Biplot pada Klasifikasi Fragmen Metagenom dengan K- Mers Sebagai Ekstraksi Ciri Dan Probabilistic Neural Network Sebagai Classifier. Terima kasih penulis ucapkan kepada Bapak Dr Ir Agus Buono, Msi MKom selaku pembimbing yang telah mengarahkan penulis dalam menyelesaikan penelitian ini, serta Bapak Dr Wisnu Ananta Kusuma, ST MT dan Bapak Toto Haryanto, SKom MSi selaku dosen penguji yang telah memberi saran. Di samping itu, penghargaan penulis sampaikan kepada rekan-rekan Ekstensi Ilkom angkatan 7 terutama rekan-rekan satu bimbingan yang telah saling membantu dalam menyelesaikan penelitian ini. Ungkapan terima kasih juga disampaikan kepada ayah, ibu, serta seluruh keluarga, atas segala doa dan kasih sayangnya. Semoga karya ilmiah ini bermanfaat. Bogor, Desember 2014 Ferdinan Andreas Mangasi Simamora

9 DAFTAR ISI DAFTAR TABEL vii DAFTAR GAMBAR vii DAFTAR LAMPIRAN viii PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 2 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 3 METODE 3 Penyiapan Data 4 Ekstraksi Ciri (K-Mers) 4 Reduksi Ciri (Biplot) 5 Pembagian Data 6 Klasifikasi 6 Pengujian, Evaluasi, dan Analisis Hasil 8 Lingkungan Implementasi 8 HASIL DAN PEMBAHASAN 9 Penyiapan Data 9 Ekstraksi Ciri (K-Mers) 10 Reduksi Ciri (Biplot) 11 Pembagian Data 16 Rangkaian Percobaan 16 Evaluasi dan Analisis Seluruh Hasil Percobaan 16 SIMPULAN DAN SARAN 24 Simpulan 24 Saran 25 DAFTAR PUSTAKA 25 LAMPIRAN 26 RIWAYAT HIDUP 34

10 DAFTAR TABEL 1 Dataset organisme dikenal 9 2 Dataset organisme belum dikenal 10 3 Nilai akurasi terbaik dan waktu eksekusi klasifikasi pada pengujian organisme dikenal 17 4 Confusion matrix untuk pengujian terbaik pada pengujian organisme dikenal 17 5 Perbandingan waktu eksekusi klasifikasi antara fragmen dengan biplot (terbaik) dan tanpa biplot 18 6 Waktu eksekusi klasifikasi fragmen dengan menggunakan biplot (terbaik) pada beberapa percobaan 18 7 Waktu eksekusi klasifikasi fragmen tanpa menggunakan biplot pada beberapa percobaan 18 8 Perbandingan akurasi klasifikasi antara fragmen dengan biplot (terbaik) dan tanpa biplot pada pembagian data latih 60%:40% 19 9 Nilai akurasi klasifikasi fragmen menggunakan biplot (terbaik) dengan pembagian data latih 60%:40% pada beberapa percobaan Nilai akurasi klasifikasi fragmen tanpa menggunakan biplot dengan pembagian data latih 60%:40% pada beberapa percobaan Perbandingan akurasi klasifikasi antara fragmen dengan biplot (terbaik) dan tanpa biplot pada pembagian data latih 80%:20% Nilai akurasi klasifikasi fragmen menggunakan biplot (terbaik) dengan pembagian data latih 80%:20% pada beberapa percobaan Nilai akurasi klasifikasi fragmen tanpa menggunakan biplot dengan pembagian data latih 80%:20% pada beberapa percobaan Nilai akurasi dan waktu eksekusi klasifikasi pada dimensi pengujian organisme belum dikenal Confusion matrix untuk pengujian terbaik pada pengujian organisme belum dikenal Nilai akurasi klasifikasi fragmen organisme belum dikenal pada beberapa percobaan 23 DAFTAR GAMBAR 1 Diagram alur metode penelitian 3 2 Ekstraksi ciri k-mers 5 3 Biplot pada 2 sumbu koordinat 6 4 Arsitektur PNN 7 5 Plot hasil akar ciri fragmen 500 bp dari dekomposisi nilai singular pada dimensi akar ciri = Plot hasil akar ciri fragmen 1 kbp dari dekomposisi nilai singular pada dimensi akar ciri = Plot hasil akar ciri fragmen 5 kbp dari dekomposisi nilai singular pada dimensi akar ciri = Plot hasil akar ciri fragmen 10 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 13

11 9 Biplot fragmen 500 bp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah Biplot fragmen 1 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah Biplot fragmen 5 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah Biplot fragmen 10 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah Plot perbandingan waktu eksekusi klasifikasi antara fragmen dengan biplot terbaik ( ) dan tanpa biplot ( ) Plot perbandingan akurasi klasifikasi antara fragmen dengan biplot terbaik dan tanpa biplot pada pembagian data latih 60%:40% Plot perbandingan akurasi klasifikasi antara fragmen dengan biplot terbaik dan tanpa biplot pada pembagian data latih 80%:20% Plot perbandingan akurasi klasifikasi antara fragmen organisme dikenal dengan organisme belum dikenal 24 DAFTAR LAMPIRAN 1 Nilai akurasi pada dimensi akar ciri yang berbeda dengan n = 10 peubah dan pembagian data latih dan data uji 60%:40% 26 2 Nilai akurasi pada dimensi akar ciri yang berbeda dengan n = 20 peubah dan pembagian data latih dan data uji 60%:40% 26 3 Nilai akurasi pada dimensi akar ciri yang berbeda dengan n = 30 peubah dan pembagian data latih dan data uji 60%:40% 27 4 Nilai akurasi pada dimensi akar ciri yang berbeda dengan semua peubah (tanpa biplot) dan pembagian data latih dan data uji 60%:40% 27 5 Nilai akurasi pada dimensi akar ciri yang berbeda dengan n = 10 peubah dan pembagian data latih dan data uji 80%:20% 28 6 Nilai akurasi pada dimensi akar ciri yang berbeda dengan n = 20 peubah dan pembagian data latih dan data uji 80%:20% 28 7 Nilai akurasi pada dimensi akar ciri yang berbeda dengan n = 30 peubah dan pembagian data latih dan data uji 80%:20% 29 8 Nilai akurasi pada dimensi akar ciri yang berbeda dengan semua peubah (tanpa biplot) dan pembagian data latih dan data uji 80%:20% 29 9 Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, n = 10 peubah, dan pembagian data latih dan data uji 60%:40% Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, n = 20 peubah, dan pembagian data latih dan data uji 60%:40% Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, n = 30 peubah, dan pembagian data latih dan data uji 60%:40% Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, semua peubah (tanpa biplot), dan pembagian data latih dan data uji 60%:40% 31

12 13 Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, n = 10 peubah, dan pembagian data latih dan data uji 80%:20% Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, n = 20 peubah, dan pembagian data latih dan data uji 80%:20% Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, n = 30 peubah, dan pembagian data latih dan data uji 80%:20% Nilai anomali akurasi beberapa percobaan pada dimensi akar ciri yang berbeda dengan h = 1, semua peubah (tanpa biplot), dan pembagian data latih dan data uji 80%:20% 33

13 PENDAHULUAN Latar Belakang Penelitian pada bidang material genetika organisme biasanya dilakukan dengan membudidayakan organisme yang ingin diteliti pada laboratorium dan melakukan penyejajaran sekuens untuk menyusun struktur protein dengan metode pemodelan de novo. Proses ini dilakukan untuk mengekstrak informasi urutan DNA yang berisi informasi genetika dari organisme. Akan tetapi, dari sekian banyak mikroorganisme yang ada di dunia hanya 1% yang dapat dibudidayakan. Untuk mikroorganisme selainnya harus dilakukan dengan mengambil sampel secara langsung dari lingkungan organisme tersebut. Oleh karena itu, metagenom berperan sebagai sebuah bidang studi yang mengkaji material genetika yang diambil langsung dari sumber lingkungan organisme dengan melakukan prosedur sekuensing DNA pada sekumpulan genom yang tercampur pada lingkungan tersebut (Kusuma dan Akiyama 2011). Genom adalah set lengkap molekul-molekul DNA dalam setiap sel dari organisme hidup yang diturunkan dari generasi ke generasi. Deoxyribonucleic acid (DNA) bertindak sebagai cetakan dari unit kehidupan karena memiliki kemampuan mengodekan informasi penting untuk menghasilkan protein-protein yang dibutuhkan pada proses seluler. DNA berbentuk rantai ganda dari molekul sederhana (nukleotida) yang diikat bersama-sama dalam struktur helix yang dikenal dengan double helix. Nukleotida tersebut tersusun atas 4 basa nitrogen yaitu adenin, timin, guanin, dan sitosin yang dapat direpresentasikan dalam abjad A, T, G, dan C yang membentuk pasangan basa (base pairs/bp) dengan basa komplemennya (de Carvalho 2003). Proses yang dilakukan pada metagenom ialah lisis dan ekstraksi DNA, kloning dan konstruksi, dan sequencing DNA dari hasil kloning tersebut. Tahap sequencing menghasilkan fragmen-fragmen metagenom yang saling tercampur dan overlap antar organisme. Kondisi overlap ini diperlukan sebagai kunci penyambung fragmen metagenom yang sejenis pada saat proses perakitan. Namun setiap organisme memiliki peluang kondisi overlap yang serupa dengan organisme lain yang berbeda jenis. Hal tersebut mengakibatkan proses identifikasi fragmen diperlukan untuk mencegah kesalahan perakitan fragmen antar organisme. Untuk tingkatan taksonomi pada hewan mulai dari tertinggi hingga terbawah yaitu terdiri dari Kingdom, Phyllum (filum), Class (kelas), Ordo (bangsa), Familia (suku), Genus (marga), dan Species (jenis). Pada tahun 2008, Wu melakukan penelitian klasifikasi terhadap fragmen metagenom dengan menggunakan k-mers yang dipadukan dengan PCA. Wu menggunakan 4 metode klasifikasi sebagai perbandingan yaitu linear, quadratic, n-nearest neighbor, dan decision tree. Dari penelitian tersebut diperoleh bahwa akurasi terbaik dihasilkan oleh pengklasifikasi linear. Tidak hanya menghasilkan akurasi yang paling baik, pengklasifikasi tersebut memiliki kompleksitas komputasi yang cukup baik diterapkan pada dimensi fitur yang besar (Wu 2008). Kusuma dan Akiyama (2011) melakukan penelitian klasifikasi fragmen metagenom dengan menggunakan algoritme SVM dan characterization vector sebagai pengekstraksi ciri. Penelitian tersebut dilakukan pada 2 kelompok dataset

14 2 yang merepresentasikan organisme latih dan organisme uji dengan panjang fragmen 500 bp, 1 kbp, 5 kbp, dan 10 kbp. Akurasi yang dicapai dari penelitian tersebut yaitu 78% untuk panjang fragmen 500 bp, 80% untuk panjang fragmen 1 kbp, 86% untuk panjang fragmen 5 kbp, dan 87% untuk panjang fragmen 10 kbp. Elliyana (2014) juga melakukan penelitian klasifikasi fragmen metagenom dengan ruang lingkup yang sama dengan Kusuma dan Akiyama. Metode klasifikasi yang digunakan ialah algoritme KNN dengan spaced k-mers sebagai pengekstraksi ciri. Nilai akurasi yang dicapai yaitu 86.11% untuk panjang fragmen 500 bp, 91.77% untuk panjang fragmen 1 kbp, 96.60% untuk panjang fragmen 5 kbp, dan 97.96% untuk panjang fragmen 10 kbp pada nilai k = 3. Dari kedua penelitian tersebut terlihat bahwa panjang fragmen dan tingkat akurasi pengklasifikasian memiliki korelasi positif. Untuk penelitian kali ini akan dilakukan pengklasifikasian fragmen metagenom menggunakan algoritme Probabilistic Neural Network (PNN) dan k- mers sebagai ekstraksi fitur. Namun k-mers memiliki kecenderungan untuk menghasilkan dimensi yang cukup besar. Hal ini disebabkan nilai k yang digunakan menjadi pangkat sebagai representasi jumlah kombinasi basa. Oleh karena itu, untuk mengatasi hal tersebut biplot digunakan sebagai pereduksi ekstraksi ciri hasil k-mers. Data organisme yang digunakan pada penelitian ini merujuk pada data penelitian Kusuma dan Akiyama (2011) untuk kemudian hasilnya akan dianalisis. Perumusan Masalah Berdasarkan latar belakang penelitian yang telah diuraikan sebelumnya, masalah yang akan diteliti sebagai berikut: 1 Bagaimana hasil pengklasifikasian fragmen metagenom pada tingkat genus dengan menggunakan algoritme PNN pada penelitian ini? 2 Bagaimana pengaruh biplot terhadap hasil akurasi pengklasifikasian? Tujuan Penelitian Penelitian ini bertujuan untuk: 1 Melakukan klasifikasi fragmen metagenom pada tingkat genus dengan algoritme PNN, k-mers sebagai pengekstraksi ciri, dan biplot sebagai pereduksi cirinya. 2 Mendapatkan hasil akurasi dari hasil penelitian. 3 Menganalisis pengaruh biplot terhadap hasil akurasi pengklasifikasian. Manfaat Penelitian Hasil penelitian ini diharapkan dapat bermanfaat untuk: 1 Membantu peneliti dalam mengidentifikasi dan mengklasifikasi fragmen metagenom sesuai dengan tingkat taksonomi untuk genus yang ditentukan. 2 Mendapatkan algoritme yang lebih baik dalam melakukan pengidentifikasian fragmen metagenom.

15 3 Mengembangkan teknik pengklasifikasian fragmen metagenom dengan penerapan biplot. 3 Ruang Lingkup Penelitian Ruang lingkup penelitian ini meliputi: 1 Data yang digunakan merujuk referensi data dari penelitian Kusuma dan Akiyama (2011). Data terdiri dari 2 kelompok dataset yang dibangkitkan oleh perangkat lunak MetaSim dengan format FASTA yang merepresentasikan organisme dikenal dan organisme belum dikenal. 2 fragmen untuk setiap dataset organisme meliputi 500 bp, 1 kbp, 5 kbp, 10 kbp. Dataset yang digunakan diambil dari genus Agrobacterium, Bacillus, dan Staphylococcus. 3 Sekuens DNA direpresentasikan sebagai 4 karakter A, T, G, dan C yang mewakili basa nitrogen adenin, timin, guanin, dan sitosin. METODE Penelitian ini dilakukan dengan beberapa tahapan proses pengujian. Rangkaian tahap penelitian mulai dari awal hingga akhir disajikan dengan diagram alur pada Gambar 1. Gambar 1 Diagram alur metode penelitian

16 4 Pada tahap awal data fragmen metagenom disiapkan terlebih dahulu menjadi 2 kelompok dataset yaitu organisme dikenal dan organisme belum dikenal. Setelah itu dilakukan ekstraksi ciri metagenom menggunakan k-mers untuk semua dataset. Hasil ekstraksi ciri dari organisme dikenal dipersiapkan menjadi 2 skema yaitu tanpa reduksi dan direduksi dengan menggunakan biplot. Selanjutnya pembagian data dibagi menjadi data latih dan data uji dilakukan secara manual dengan komposisi 60%:40% dan 80%:20%. Data organisme yang sudah dibagi kemudian diklasifikasi menggunakan algoritme PNN. Hasil pengujian tersebut dianalisis untuk disimpulkan data latih mana yang terbaik untuk digunakan sebagai data penguji di pengujian kedua dengan dataset organisme belum dikenal. Setelah itu data organisme belum dikenal diklasifikasikan menggunakan algoritme klasifikasi yang sama untuk hasilnya dianalisis kemudian. Penyiapan Data Data yang digunakan berupa 2 kelompok dataset yang dibangkitkan oleh perangkat lunak MetaSim dengan format FASTA yang merepresentasikan organisme dikenal sebagai pengujian pertama dan organisme belum dikenal sebagai pengujian kedua. Organisme dikenal berupa 10 spesies dari 3 genus dengan 4 panjang fragmen berbeda. Sedangkan dataset organisme belum dikenal menggunakan 9 spesies dari 3 genus yang sama dengan 4 panjang fragmen berbeda. Hal yang membedakan antara organisme dikenal dan belum dikenal ialah pada tingkat spesiesnya yang berbeda-beda. fragmen terdiri dari 500 bp, 1 kbp, 5 kbp, dan 10 kbp. Jumlah fragmen untuk dataset organisme dikenal dan organisme belum dikenal masing-masing adalah dan Ekstraksi Ciri (K-Mers) Tahapan ini dilakukan untuk mendapatkan fitur/ciri yang akan digunakan dalam klasifikasi dan pengujian. Ekstraksi ciri dilakukan dengan membaca frekuensi dari kombinasi nukleotida yang mungkin terbentuk dengan menggunakan k-mers untuk k = 3. Pola kemunculan k adalah pola yang menampilkan k pada suatu waktu dalam suatu sekuen. Pola kemunculan dalam sekuens dihitung menggunakan empat basa utama (A, C, G, dan T) dipangkat dengan rangkaian pasangan basa yang ingin digunakan (pola kemunculan 4 k, dengan k 1). Pada penelitian ini dengan menggunakan k = 3 berarti akan ada 64 pola kemunculan yang terbentuk. Ilustrasi perhitungan frekuensi pola kemunculan dengan ekstraksi ciri k-mers dapat dilihat pada Gambar 2.

17 5 Gambar 2 Ekstraksi ciri k-mers Reduksi Ciri (Biplot) Analisis biplot diperkenalkan oleh Gabriel (1971). Analisis ini bertujuan menggambarkan hubungan antarpeubah serta perbandingan antarobjek yang disajikan dalam grafik 2 dimensi maupun 3 dimensi (Gabriel 1971). Analisis biplot menggunakan teknik penguraian nilai singular (singular value decomposition/svd) terhadap matriks data (Buono 2014). Untuk matrix data n X p yang ada dikomposisikan pada Persamaan 1 berikut: nx p = n U r x r L r x r (A T ) p (1) Dalam hal ini r adalah pangkat matriks X, sedangkan U, L, dan A ditentukan berdasarkan akar ciri dan vektor ciri matrix X T X sehingga berlaku: λ 1 >λ 2 > >λ r >λ r+1 >λ n dengan vektor ciri yang bersesuaian dengan akar ciri ke-i adalah v i. Matriks U, L, dan A di atas dirumuskan pada Persamaan 2, 3, dan 4 berikut: A = [v 1 v 2 v 3 v r ] (2) λ 1 0 L = diagonal λ i = 0 0 (3) 0 λ r U = μ 1 μ 2 μ r dengan μ i = 1 λ i Xv i (4) Berdasarkan dekomposisi nilai singular di atas maka setiap matriks data n X p dirumuskan sebagai Persamaan 5 berikut: X = ULA T = G H (5) dengan nilai G dan H pada Persamaan 6 dan 7 berikut: G = U = g 1 g 2 g n T (6) H = LA T = h 1 h 2 h p (7) Dalam hal ini G merepresentasikan baris (biasanya objek) dan H merepresentasikan kolom (biasanya peubah) dengan setiap komponen matriksnya menggunakan Persamaan 8 dan 9 berikut:

18 6 h i = 1 n-1 h i (8) g i = n-1 g i (9) Biplot pada penelitian ini bertujuan untuk mereduksi ciri/peubah. Oleh karena itu, untuk setiap nilai H diplotkan ke dalam bentuk biplot (Gambar 3) untuk menggambarkan karakteristik setiap peubah. Semakin panjangnya garis peubah dari titik pusat ke titik koordinatnya mengindikasikan semakin besar pula pengaruhnya sebagai pembeda antarkelas. 1.8 HASIL BIPLOT bp.fna.txt CGG CCG GCC GGC CGC GCG Component CCC GGG TCG CGA GAC GTC CTG CAG GCA TGC AGC GCT AGG ACG CCA CCT CGTCC GGA TGG ACC GGT CTC GAG CAC GTG ATC GAT CAT ATG GAA TTC 0 CTA TAG ACT AGTTAC GTA TCA TGA ACA TGT AGA TCT AAC GTT CTT CAA TTG AAG ATA TAT TTA TAA ATT AAT AAA TTT Component 1 Gambar 3 Biplot pada 2 sumbu koordinat Pembagian Data Pembagian data latih dan data uji pada organisme dikenal dilakukan secara manual dengan komposisi 60%:40% dan 80%:20%. Total data organisme dikenal yang digunakan sebanyak dengan komposisi 10 spesies berbeda dalam 3 genus. Pembagian dilakukan berimbang dengan mengambil komposisi yang sama untuk setiap kelasnya. Klasifikasi Arsitektur PNN yang memiliki bagian lapisan masukan, pola, penjumlahan, dan keluaran (Specht 1990) yang disajikan pada Gambar 4. Pada penelitian ini lapisan masukan berupa hasil ekstraksi data uji. Lapisan pola (pattern layer) hanya menggunakan satu model PNN yaitu dengan nilai parameter pemulus (h) tetap. Lapisan penjumlahan akan memroses hasil dari setiap lapisan pola per kelasnya dan mendapatkan nilai akhir untuk setiap kelas. Lapisan output (decision

19 layer) memiliki 3 target kelas sesuai dengan jumlah genus dan mengambil hasil dari lapisan penjumlahan yang terbesar dari 3 kelas yang dimiliki. 7 Gambar 4 Arsitektur PNN Pada lapisan pola (pattern layer), keluaran dihitung dengan Persamaan 10 sebagai berikut: d f(x) = K x j-x ij dengan: d = dimensi vektor K(z) = e -0.5*z2 (kernel normal) x j = vektor input kolom ke-j x ij = vektor bobot baris ke-i kolom ke-j h j = parameter pemulus ke-j (smoothing parameter) j=1 Berikutnya, keluaran dari lapisan pola yang bersesuaian dengan kelas/kategori tertentu akan masuk ke lapisan penjumlahan (summation layer). Di masing-masing node akan dihitung dengan Persamaan 11 berikut: h j (10) 1 1 p(x) = (2π) d n K x j-x ij h 2h 1 h 2 h j d n i=1 d j=1 (11)

20 8 dengan: d = dimensi vektor input n = jumlah data latih di suatu kategori x j = vektor data uji ke-j x ij = data latih ke-i untuk ciri j Dengan menjabarkan nilai kernel pada lapisan pola ke dalam lapisan penjumlahan maka didapatkan Persamaan 12 berikut: n 1 1 p(x) = (2π) d 2h d n exp - (x-x ai )t (x-x ai ) 2h 2 (12) i=1 dengan: x = vektor data uji x ai = data latih ke-i dari kategori A x ij = data latih ke-i untuk ciri-j (Specht 1990) Terakhir, pada lapisan output (decision layer) akan ditetapkan hasil akhir kelas yang didapatkan dengan membandingkan setiap nilai dari hasil lapisan penjumlahan. Untuk nilai yang paling besar ditetapkan sebagai kelas. Pengujian, Evaluasi, dan Analisis Hasil Pengujian dilakukan dengan melakukan klasifikasi pada fragmen uji organisme dikenal dan organisme belum dikenal. Hasil tersebut kemudian dibandingkan dengan kelas hasil klasifikasi, apakah fragmen uji benar diklasifikasi atau salah diklasifikasi. Alat ukur pengklasifikasian yang digunakan ialah confusion matrix. Hasil penelitian diukur menggunakan tingkat akurasi dari fragmen metagenom yang diuji dan diamati. Nilai akurasi dihitung dengan Persamaan 13. Akurasi = data uji yang benar diklasifikasi data uji x 100% (13) Lingkungan Implementasi Lingkungan implementasi yang digunakan pada penelitian sebagai berikut: 1 Perangkat keras berupa notebook: AMD Athlon Neo X2 Dual Core Processor Memori 2 GB Harddisk kapasitas 250 GB Monitor dengan resolusi 1280 x 800 piksel ini adalah 2 Perangkat keras virtual (virtual machine) untuk membantu perhitungan pengklasifikasian: Intel Core i5-3317u 1.70GHz (2 core)

21 9 Memori 2 GB Harddisk kapasitas 60 GB Monitor dengan resolusi 1280 x 800 piksel 3 Perangkat lunak: Sistem operasi Microsoft Windows XP Professional (perangkat keras notebook) Sistem operasi Microsoft Windows 7 Professional (perangkat keras virtual) Simulator metagenom MetaSim Bloodshed Dev-C++ CodeBlocks Matlab 7.7 (R2008b) HASIL DAN PEMBAHASAN Penyiapan Data Penelitian ini menggunakan fragmen metagenom dari 3 genus, yaitu Agrobacterium, Bacillus, dan Staphylococcus. Fragmen tersebut dibagi menjadi kelompok dataset organisme dikenal dan organisme belum dikenal. Pembagian data organisme dapat dilihat pada Tabel 1 dan Tabel 2. Tabel 1 Dataset organisme dikenal Spesies Agrobacterium radiobacter K48 chromosome 2 Agrobacterium tumefaciens str. C58 chromosome circular Agrobacterium vitis S4 chromosome 1 Bacillus amyloliquefaciens FZB42 Bacillus anthracis str. Ames Ancestor Bacillus cereus 03BB102 Bacillus pseudofirmus OF4 chromosome Staphylococcus aureus subsp. Sureus JH1 Staphylococcus epidermidis 1228 chromosome Staphylococcus haemolyticus JCSC1435 chromosome Kelas Genus Agrobacterium Bacillus Staphylococcus

22 10 Tabel 2 Dataset organisme belum dikenal Spesies Agrobacterium radiobacter K48 chromosome 1 Agrobacterium tumefaciens str. C58 chromosome linear Agrobacterium vitis S4 chromosome 2 Bacillus pumilus SAFR-032 Bacillus subtilis subsp. subtilis str. 16B chromosome Bacillus thuringiensis str. Al Hakam chromosome Staphylococcus carnosus subsp. carnosus TM300 chromosome Staphylococcus lugdunensis HKU09-01 chromosome Staphylococcus saprophyticus subsp. saprophyticus ATCC Kelas Genus Agrobacterium Bacillus Staphylococcus Organisme belum dikenal diambil dari spesies yang berbeda dari organisme dikenal namun masih berada dalam satu genus. Organisme tersebut untuk sementara diasumsikan tidak dikenal dan belum diketahui kelas genusnya. Hal ini dimaksudkan sebagai skema pengujian kedua yang akan dilakukan untuk melakukan validasi pengklasifikasian. Jumlah fragmen yang diambil dari organisme dikenal sebanyak fragmen dari 10 spesies, sedangkan dari organisme belum dikenal diambil sebanyak fragmen dari 9 spesies. Jumlah fragmen antara tiap kelas tidak berimbang. fragmen yang digunakan untuk kedua dataset tersebut sama, yaitu 500 bp, 1 kbp, 5 kbp, dan 10 kbp dengan 4 basa penyusunnya yaitu A, G, C, dan T. Ekstraksi Ciri (K-Mers) Proses k-mers akan menghasilkan ciri dari fragmen dengan melakukan pembacaan terhadap susunan fragmen dengan mengambil k-substring. Nilai k yang digunakan pada penelitian ini adalah 3. Dengan demikian proses pembacaan k-mers akan menghasilkan 4 3 kombinasi basa yaitu sebanyak 64 basa untuk setiap pembacaan satu fragmen metagenom. Basa-basa tersebut menjadi peubah yang akan digunakan untuk pengklasifikasian. Pembacaan fragmen dilakukan terhadap dataset organisme dikenal dan organisme belum dikenal. Oleh karena itu, hasil ekstraksi ciri dari organisme dikenal akan menghasilkan matriks berukuran x 64 dan untuk organisme belum dikenal akan menghasilkan matriks berukuran x 64 untuk setiap panjang fragmen. Matriks tersebut berisi informasi frekuensi dari setiap pembacaan sekuen basa. Pada penelitian pengklasifikasian metagenom menggunakan Naïve Bayes, ekstraksi ciri k-mers dapat mencapai hasil yang baik dan memiliki potensi besar untuk diterapkan pada metagenom (Rosen et al. 2008).

23 11 Reduksi Ciri (Biplot) Reduksi ciri dilakukan dengan mengambil basa yang memiliki karakteristik kuat untuk membedakan data antar kelas dan mengeliminasi basa yang tidak memiliki karakteristik tersebut. Sebelum masuk ke tahap biplot, matriks hasil ekstraksi ciri diproses ke dalam mekanisme dekomposisi nilai singular. Rumus dekomposisi nilai singular yang ditunjukkan pada Persamaan 1, menginformasikan peubah r yang menunjukkan besarnya dimensi akar ciri (λ). Nilai peubah ini bisa ditentukan dengan bebas mulai dari nilai minimum akar ciri sebesar 1 hinggga nilai maksimum akar ciri sebesar 64. Oleh karena itu, nilai peubah r ini menjadi nilai yang perlu dimasukkan ke skenario percobaan. Besarnya dimensi akar ciri diambil 3 nilai yaitu 2, 10, dan 64. Nilai 2 digunakan sebagai nilai minimum yang bisa merepresentasikan biplot. Nilai 64 digunakan untuk merepresentasikan nilai dimensi maksimum dari dimensi k-mers = 3. Nilai 10 diambil sebagai nilai tengah setelah melihat hasil plot terhadap akar ciri untuk setiap panjang fragmen. Beberapa sampel plot akar ciri ditunjukkan pada Gambar 5, Gambar 6, Gambar 7, dan Gambar PLOT AKAR CIRI -500bp.fna.txt Gambar 5 Plot hasil akar ciri fragmen 500 bp dari dekomposisi nilai singular pada dimensi akar ciri = 2

24 PLOT AKAR CIRI -1000bp.fna.txt Gambar 6 Plot hasil akar ciri fragmen 1 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 7 x 104 PLOT AKAR CIRI -5000bp.fna.txt Gambar 7 Plot hasil akar ciri fragmen 5 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2

25 13 14 x 104 PLOT AKAR CIRI bp.fna.txt Gambar 8 Plot hasil akar ciri fragmen 10 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 Mulai dari nilai akar ciri 1 sampai 10 karakteristiknya cenderung menurun tajam. Kemudian dari nilai akar ciri 10 hingga 64 plot cenderung menurun stabil dan tidak memiliki perbedaan yang cukup signifikan. Hal ini terjadi pada plot akar ciri untuk setiap panjang fragmen percobaan. Oleh karena itu, nilai 10 dianggap sebagai nilai tengah yang bisa mencakup keempat percobaan untuk diujikan. Hasil dari dekomposisi nilai singular akan digunakan pada Persamaan 5 untuk menghasilkan 2 variabel biplot yaitu variabel G dan H. Variabel G merepresentasikan baris (biasanya objek) dan variabel H merepresentasikan kolom (biasanya peubah). Biplot pada penelitian ini bertujuan untuk mereduksi ciri/peubah. Untuk setiap nilai H diplotkan ke dalam bentuk biplot untuk menggambarkan karakteristik setiap peubah. Jika percobaan yang dilakukan menggunakan 2 peubah r yang menunjukkan besarnya dimensi akar ciri (λ) maka dimensi matriks H yang dihasilkan sebesar 2 x 64. Matriks H kemudian dilakukan operasi transpose untuk merepresentasikannya sebagai titik koordinat pada 64 peubah. Semakin panjang garis peubah dari titik pusat ke titik koordinatnya maka mengindikasikan semakin besar pula pengaruhnya sebagai pembeda antar kelas. Reduksi ciri dilakukan dengan mengambil n-buah garis terpanjang. Nilai n ini ikut dimasukkan ke skenario percobaan untuk diteliti. Besarnya nilai n diambil 3 nilai yaitu 10, 20, dan 30 peubah. Keputusan ini diambil dengan tujuan untuk meneliti pengaruh reduksi ciri yang dilakukan lebih dari 50% komposisi awal peubah terhadap hasil pengklasifikasian. Beberapa contoh biplot dengan mengambil 10 peubah terpanjang disajikan pada Gambar 9, Gambar 10, Gambar 11, dan Gambar 12.

26 14 HASIL BIPLOT -500bp.fna.txt Component GGC GCG TAA TTA TATATA ATT AAT AAA TTT Component 1 Gambar 9 Biplot fragmen 500 bp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah HASIL BIPLOT -1000bp.fna.txt Component GCC CGC TTA TAA ATT AAT TATATA TTT AAA Component 1 Gambar 10 Biplot fragmen 1 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah

27 15 HASIL BIPLOT -5000bp.fna.txt Component CGC GCG TTA TAA TATATA ATT AAA TTT AAT Component 1 Gambar 11 Biplot fragmen 5 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah HASIL BIPLOT bp.fna.txt Component GCC CGC TTA TAA AAA ATT TTT ATATAT AAT Component 1 Gambar 12 Biplot fragmen 10 kbp dari dekomposisi nilai singular pada dimensi akar ciri = 2 dengan mengambil 10 peubah

28 16 Pembagian Data Ciri yang sudah direduksi melalui tahap biplot selanjutnya dibagi menjadi data latih dan data uji sebelum masuk ke tahap pengklasifikasian. Pembagian data latih dan data uji pada organisme dikenal dilakukan secara manual dengan komposisi 60%:40% dan 80%:20%. Total data organisme dikenal yang digunakan sebanyak dengan komposisi 10 spesies berbeda dalam 3 genus. Pembagian dilakukan berimbang dengan mengambil komposisi yang sama untuk setiap kelasnya sehingga didapatkan data latih dan data uji untuk komposisi 60%:40% dan data latih dan data uji untuk komposisi 80%:20% dari 3 kelas genus. Rangkaian Percobaan Dari beberapa metode yang sudah diuraikan sebelumnya ditemukan beberapa parameter yang perlu diteliti pengaruhnya sehingga dimasukkan ke dalam skenario percobaan. Parameter tersebut meliputi: 1 Peubah r sebagai besaran dimensi akar ciri (λ) pada SVD. Untuk peubah ini ditetapkan menggunakan 3 nilai yaitu 2, 10, dan Peubah n sebagai banyaknya peubah yang digunakan dari hasil reduksi ciri. Untuk peubah ini ditetapkan menggunakan 3 nilai yaitu 10, 20, dan 30 peubah. 3 Persentase pembagian data latih dan data uji. Untuk persentase ini ditetapkan menggunakan 2 nilai yaitu 60%:40% dan 80%:20%. Pengklasifikasian PNN yang ditunjukkan pada Persamaan 10 juga memiliki parameter pemulus (h) ditentukan secara bebas dan akan sangat berpengaruh terhadap hasil akhir akurasi klasifikasi. Dari beberapa kali percobaan akhirnya ditentukan 6 nilai yang cukup mencakup kombinasi percobaan untuk diteliti yaitu nilai h = 1, 8, 9, 10, 11, dan 20. Percobaan yang akan dilakukan mengombinasikan keempat parameter tersebut sehingga didapatkan 120 percobaan untuk setiap panjang fragmen. Hasil dari 120 percobaan dilampirkan pada Lampiran 1 hingga Lampiran 8. Evaluasi dan Analisis Seluruh Hasil Percobaan Dari serangkaian kombinasi percobaan yang telah dilakukan dapat disimpulkan poin-poin sebagai berikut: 1 Hasil akurasi terbaik didapatkan dari percobaan dengan pembagian data latih 80%:20%, menggunakan 20 peubah, dengan besaran dimensi akar ciri r = 10 (SVD), dan nilai h pada klasifikasi PNN sebesar 10. Rata-rata akurasi yang dihasilkan sebesar 93.08%. 2 Untuk setiap percobaan yang dilakukan, parameter h dengan nilai 1 tidak baik untuk mengklasifikasi data untuk semua panjang fragmen. Terdapat anomali nilai klasifikasi mulai dari panjang fragmen 5 kbp hingga 10 kbp yang cenderung menurun.

29 3 Percobaan dengan pembagian data latih 80%:20% menghasilkan akurasi yang lebih baik daripada pembagian data latih 60%:40% untuk setiap percobaan. Oleh karena itu, dapat disimpulkan nilai akurasi dan banyaknya pembagian data latih memiliki korelasi positif. 4 Pada percobaan data latih dengan 10 peubah, klasifikasi menghasilkan nilai akurasi yang sama mulai dari dimensi akar ciri (r) sebesar 10 hingga 64 untuk semua parameter pemulus klasifikasi (h). 5 Penentuan reduksi ciri terbaik tidak dapat dilakukan dengan sembarang. Semakin banyak peubah dari hasil reduksi yang digunakan tidak menjamin hasil akurasi yang lebih baik. Hal ini terlihat dari percobaan menggunakan n = 30 peubah dengan pembagian data latih 60%:40%. Untuk semua besarnya dimensi vektor nilai akurasi pada percobaan 5 kbp lebih besar dibandingkan dengan percobaan dengan menggunakan 10 kbp. 6 Nilai h yang terbaik pada parameter PNN berbeda-beda untuk setiap pembagian data latih. Untuk pembagian data latih 60%:40%, nilai h mencapai maksimum pada nilai 8, sedangkan untuk pembagian data latih 80%:20% mencapai maksimum lebih variatif antara 8, 10, dan Besarnya dimensi akar ciri (r) yang maksimum pada dekomposisi nilai singular tidak menjamin nilai akurasi yang terbaik. Hal ini ditunjukkan oleh setiap percobaan yang menggunakan dimensi akar ciri 10 memiliki nilai akurasi lebih besar dibanding dimensi akar ciri 64. Hasil percobaan data latih terbaik ditampilkan pada Tabel 3 dan Tabel 4 dengan menunjukkan nilai akurasi, waktu eksekusi klasifikasi, dan confusion matrix. Tabel 3 Nilai akurasi terbaik dan waktu eksekusi klasifikasi pada pengujian organisme dikenal fragmen Akurasi (%) Waktu eksekusi klasifikasi (detik) 500 bp kbp kbp kbp Rata-rata Tabel 4 Confusion matrix untuk pengujian terbaik pada pengujian organisme dikenal Genus 500 bp 1 kbp 5 kbp 10 kbp agr bac sta agr bac sta agr bac sta agr bac sta agr bac sta Keterangan: agr = Agrobacterium bac = Bacillus sta = Staphylococcus 17

30 18 Sebagai perbandingan efisiensi waktu antara reduksi menggunakan biplot terbaik dengan tanpa biplot disajikan hasil percobaan yang telah dilakukan pada Tabel 5. Tabel 5 Perbandingan waktu eksekusi klasifikasi antara fragmen dengan biplot (terbaik) dan tanpa biplot Waktu eksekusi klasifikasi (detik) Efisiensi waktu Dengan biplot Tanpa biplot fragmen (%) (20 peubah) 500 bp kbp kbp kbp Rata-rata Untuk melihat variasi waktu eksekusi klasifikasi antara fragmen dengan menggunakan biplot terbaik dan tanpa biplot dilakukan 4 percobaan tambahan lain dengan mengubah susunan data latih dan data uji. Hasil dari percobaan variasi ini disajikan pada Tabel 6 dan Tabel 7. Tabel 6 Waktu eksekusi klasifikasi fragmen dengan menggunakan biplot (terbaik) pada beberapa percobaan Waktu eksekusi klasifikasi (detik) fragmen bp kbp kbp kbp Rata-rata Tabel 7 Waktu eksekusi klasifikasi fragmen tanpa menggunakan biplot pada beberapa percobaan Waktu eksekusi klasifikasi (detik) fragmen bp kbp kbp kbp Rata-rata Hasil perbandingan beberapa percobaan tersebut divisualisasikan dalam bentuk diagram garis pada Gambar 13.

31 19 Waktu eksekusi klasifikasi (detik) bp 1 kbp 5 kbp 10 kbp fragmen (base pairs) Gambar 13 Plot perbandingan waktu eksekusi klasifikasi antara fragmen dengan biplot terbaik ( ) dan tanpa biplot ( ) Dari percobaan terbaik dengan panjang fragmen berbeda-beda terlihat adanya efisiensi waktu sebesar lebih dari 10% dengan rata-rata sebesar 12.33%. Sebagai perbandingan akurasi 60%:40% data antara reduksi menggunakan biplot dengan tanpa biplot disajikan hasil percobaan yang telah dilakukan pada Tabel 8. Tabel 8 Perbandingan akurasi klasifikasi antara fragmen dengan biplot (terbaik) dan tanpa biplot pada pembagian data latih 60%:40% Selisih akurasi Dengan biplot Tanpa biplot fragmen (%) (20 peubah) 500 bp kbp kbp kbp Rata-rata Untuk melihat variasi nilai akurasi antara fragmen dengan menggunakan biplot terbaik dengan tanpa biplot pada pembagian data latih 60%:40%, dilakukan 4 percobaan tambahan lain dengan mengubah susunan data latih dan data uji. Hasil dari percobaan variasi ini disajikan pada Tabel 9 dan Tabel 10.

32 20 Tabel 9 Nilai akurasi klasifikasi fragmen menggunakan biplot (terbaik) dengan pembagian data latih 60%:40% pada beberapa percobaan fragmen Rata-rata 500 bp kbp kbp kbp Tabel 10 Nilai akurasi klasifikasi fragmen tanpa menggunakan biplot dengan pembagian data latih 60%:40% pada beberapa percobaan fragmen Rata-rata 500 bp kbp kbp kbp Hasil perbandingan beberapa percobaan tersebut divisualisasikan dalam bentuk diagram garis pada Gambar Dengan biplot Tanpa biplot 500 bp 1 kbp 5 kbp 10 kbp fragmen (base pairs) Gambar 14 Plot perbandingan rata-rata nilai akurasi klasifikasi beberapa percobaan antara fragmen dengan biplot terbaik dan tanpa biplot pada pembagian data latih 60%:40% Sebagai perbandingan akurasi 80%:20% data antara reduksi menggunakan biplot dengan tanpa biplot disajikan hasil percobaan yang telah dilakukan pada Tabel 11.

33 Tabel 11 Perbandingan akurasi klasifikasi antara fragmen dengan biplot (terbaik) dan tanpa biplot pada pembagian data latih 80%:20% Selisih akurasi Dengan biplot Tanpa biplot fragmen (%) (20 peubah) 500 bp kbp kbp kbp Rata-rata Untuk melihat variasi nilai akurasi antara fragmen dengan menggunakan biplot terbaik dengan tanpa biplot pada pembagian data latih 80%:20%, dilakukan 4 percobaan tambahan lain dengan mengubah susunan data latih dan data uji. Hasil dari percobaan variasi ini disajikan pada Tabel 12 dan Tabel 13. Tabel 12 Nilai akurasi klasifikasi fragmen menggunakan biplot (terbaik) dengan pembagian data latih 80%:20% pada beberapa percobaan fragmen Rata-rata 500 bp kbp kbp kbp Tabel 13 Nilai akurasi klasifikasi fragmen tanpa menggunakan biplot dengan pembagian data latih 80%:20% pada beberapa percobaan fragmen Rata-rata 500 bp kbp kbp kbp Hasil perbandingan beberapa percobaan tersebut divisualisasikan dalam bentuk diagram garis pada Gambar 15.

34 Dengan biplot Tanpa biplot 500 bp 1 kbp 5 kbp 10 kbp fragmen (base pairs) Gambar 15 Plot perbandingan rata-rata nilai akurasi klasifikasi beberapa percobaan antara fragmen dengan biplot terbaik dan tanpa biplot pada pembagian data latih 80%:20% Sebelum melanjutkan ke pengujian kedua, nilai anomali akurasi yang muncul pada setiap percobaan dengan parameter h = 1 diteliti lebih lanjut dengan melakukan 4 percobaan tambahan. Percobaan tambahan dilakukan dengan mengambil fragmen baru secara acak dengan panjang fragmen dan jumlah data fragmen yang sama. Hasil dari percobaan tersebut dilampirkan pada Lampiran 9 hingga Lampiran 16. Hasil percobaan dengan data fragmen baru acak menunjukkan bahwa untuk setiap percobaan memiliki pola yang sama, yaitu adanya kecenderungan nilai akurasi yang menurun mulai dari panjang fragmen 5 kbp hingga 10 kbp. Kesimpulan yang diambil dari percobaan tersebut ialah nilai anomali tidak disebabkan oleh kombinasi data latih yang kurang baik, namun disebabkan oleh faktor yang lain. Specht (1990) mengungkapkan bahwa nilai akurasi klasifikasi PNN yang dihasilkan tergantung dari ketepatan penggunaan nilai parameter pemulus (h) yang mendasari fungsi kepekatan peluang. Nilai h yang kecil mengakibatkan pola acak individu dalam semakin berpengaruh, sedangkan nilai h yang besar menujukkan sebaliknya dengan pola yang umum. Oleh karena itu, sesuai formula PNN pada Persamaan 12, nilai anomali pada klasifikasi sangat dipengaruhi oleh variasi individu dalam kelas untuk panjang fragmen 5 kbp hingga 10 kbp. Semakin panjang fragmennya semakin tinggi juga variasi antar kelas yang menyebabkan anomali hasil akurasi. Data latih terbaik dari pengujian pertama selanjutnya digunakan sebagai data latih untuk menguji dataset organisme belum dikenal di pengujian kedua. Fragmen organisme belum dikenal juga direduksi dengan menggunakan peubah yang sama dengan yang digunakan oleh data latihnya. Dari hasil percobaan tersebut didapatkan hasil akurasi, waktu eksekusi klasifikasi, dan confusion matrix yang ditunjukkan pada Tabel 14 dan Tabel 15.

35 23 Tabel 14 Nilai akurasi dan waktu eksekusi klasifikasi pada dimensi pengujian organisme belum dikenal fragmen Akurasi (%) Waktu eksekusi klasifikasi (detik) 500 bp kbp kbp kbp Rata-rata Tabel 15 Confusion matrix untuk pengujian terbaik pada pengujian organisme belum dikenal Genus 500 bp 1 kbp 5 kbp 10 kbp agr bac sta agr bac sta agr bac sta agr bac sta agr bac sta Keterangan: agr = Agrobacterium bac = Bacillus sta = Staphylococcus Untuk melihat variasi nilai akurasi antara fragmen organisme belum dikenal maka dilakukan 4 percobaan tambahan lain dengan mengubah susunan data latih dan data uji. Hasil dari percobaan variasi ini disajikan pada Tabel 16. Tabel 16 Nilai akurasi klasifikasi fragmen organisme belum dikenal pada beberapa percobaan fragmen Rata-rata 500 bp kbp kbp kbp Data latih yang digunakan pada pengujian organisme belum dikenal ialah data latih dengan biplot terbaik yang ditunjukkan pada Tabel 12. Oleh karena itu, hasil perbandingan beberapa percobaan organisme belum dikenal tadi dibandingkan dengan data Tabel 12 dan divisualisasikan dalam bentuk diagram garis pada Gambar 16.

36 Organisme dikenal Organisme belum dikenal 500 bp 1 kbp 5 kbp 10 kbp fragmen (base pairs) Gambar 16 Plot perbandingan rata-rata nilai akurasi klasifikasi beberapa percobaan antara fragmen organisme dikenal dengan organisme belum dikenal Pengujian pertama dan kedua menunjukkan hasil yang cukup baik. Nilai minimum akurasi didapatkan sebesar 85.45% pada pengujian pertama dan 80.46% pada pengujian kedua. Untuk akurasi maksimum didapatkan sebesar 98.10% pada pengujian pertama dan 92.80% pada pengujian kedua. Selisih di antara pengujian pertama dan kedua pun kecil dan kurang lebih berkisar di 5%. Efisiensi waktu pengklasifikasian yang dihasilkan oleh biplot menunjukkan nilai sebesar lebih dari 10% untuk setiap panjang fragmen dengan rata-rata sebesar 12%. Hasil ini dirasakan cukup baik karena hanya menggunakan 20 peubah dari total 64 peubah dengan persentase reduksinya sebesar 68.75%. Dari confusion matrix yang didapatkan, terlihat bahwa kesalahan klasifikasi lebih banyak terjadi pada genus Bacillus dan Staphylococcus. Hal ini disebabkan oleh masih dekatnya kekerabatan antara kedua genus tersebut yang masih berada dalam satu ordo. SIMPULAN DAN SARAN Simpulan Kombinasi percobaan antara k-mers sebagai ekstraksi ciri, biplot sebagai pereduksi ciri, dan PNN sebagai classifier disimpulkan baik dalam mengklasifikasikan fragmen metagenom. Percobaan fragmen metagenom terpendek berhasil mengklasifikasikan 85.45% organisme dikenal dan 80.46% organisme belum dikenal. Percobaan fragmen terpanjang berhasil mengklasifikasikan 98.10% organisme dikenal dan 92.80% organisme belum dikenal. Biplot yang berperan sebagai pereduksi ciri fragmen metagenom pada penelitian ini juga bekerja dengan baik. Nilai-nilai akurasi tersebut dihasilkan

37 dengan menggunakan 20 peubah hasil reduksi dari 64 peubah yang ada. Terdapat efisiensi waktu pengklasifikasian yang dihasilkan yaitu sebesar lebih dari 10% untuk setiap panjang fragmen dengan rata-rata sebesar 12%. 25 Saran Percobaan ini menggunakan menggunakan 3 parameter yang nilainya bebas ditentukan yaitu peubah r sebagai besaran dimensi akar ciri (λ) pada SVD, peubah n sebagai banyaknya peubah yang digunakan hasil dari reduksi ciri, dan parameter pemulus (h) pada klasifikasi PNN. Ketiga nilai parameter tersebut sangat berpengaruh terhadap hasil akurasi pengklasifikasian dan ditentukan dengan nilai praduga penelitian. Untuk mendapatkan hasil akurasi terbaik dibutuhkan parameter terbaik yang sesuai. Oleh karena itu, perlu digali lebih dalam karakteristik dari dekomposisi nilai singular, biplot, dan parameter pemulus PNN dengan penelitian lebih lanjut. Dari penelitian ini belum ditemukan karakteristik dan korelasi dari ketiga parameter tersebut. Untuk menguji realibilitas biplot sebagai pereduksi ciri yang baik akan lebih baik diujicobakan pada data dengan dimensi yang lebih besar yaitu menggunakan k-mers dengan nilai k yang lebih besar dari 3. DAFTAR PUSTAKA Buono A Lecture note kuliah magister matematika dan statistika ilmu komputer. Bogor (ID): Institut Pertanian Bogor. de Carvalho Jr SA Sequence alignment algorithms [tesis]. London (GB): University of London. Elliyana F Klasifikasi fragmen metagenom menggunakan fitur spaced n- mers dan k-nearest neighbour [skripsi]. Bogor (ID): Institut Pertanian Bogor. Gabriel KR The biplot graphic display of matrices with application to principal component analysis. Biometrika. 58(3): doi: /biomet/ Kusuma WA, Akiyama Y Metagenome fragment binning based on characterization vector. Di dalam: Proceedings of International Conference on Bioinformatics and Biomedical Technology; 2011 Mar 25-27; Sanya, China. hlm Rosen G, Garbarine E, Caseiro D, Polikar R, Sokhansanj B Metagenome fragment clasification using n-mer frequency profiles. Advances in Bioinformatics. 2008(1):1-12.doi: /2008/ Specht DF Probabilistic neural networks. Neural Networks. 3(1): doi: / (90)90049-Q. Wu H. 2008, PCA-based linear combinations of oligonucleotide frequencies for metagenomic DNA fragment binning. Di dalam: Computational Intelligence in Bioinformatics and Computational Biology, 2008; 2008 Sep 15-17; Sun Valley, United States. hlm

PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA

PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA PEMODELAN BIPLOT PADA KLASIFIKASI DATA METAGENOM DENGAN K-MERS SEBAGAI EKSTRAKSI CIRI DAN LVQ SEBAGAI CLASSIFIER RINDI ANTIKA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN FITUR SPACED N-MERS DAN K-NEAREST NEIGHBOUR FITRIA ELLIYANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG

KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG KLASIFIKASI FRAGMEN METAGENOM MENGGUNAKAN PRINCIPAL COMPONENT ANALYSIS DAN K-NEAREST NEIGHBOR VICTORIA FEBRINA ROMAULI SIMANGUNSONG DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN OBLIQUE DECISION TREE DENGAN OPTIMASI ALGORITME GENETIKA ALFAT SAPUTRA HARUN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Gambar 1. Skema penggolongan HIV-1 [Sumber: Korber dkk. 2001: ]

Gambar 1. Skema penggolongan HIV-1 [Sumber: Korber dkk. 2001: ] 75 Gambar 1. Skema penggolongan HIV-1 [Sumber: Korber dkk. 2001: 22--25.] Gambar 2. Struktur virus HIV-1 [Sumber: Henriksen 2003: 12.] 76 Keterangan: 5 LTR : daerah 5 Long Terminal Region gag : gen gag

Lebih terperinci

Isolasi dan Karakterisasi Gen Penyandi Protein Permukaan VP28 White Spot Syndrome Virus (WSSV) pada Udang Windu (Penaeus monodon Fabricius, 1798)

Isolasi dan Karakterisasi Gen Penyandi Protein Permukaan VP28 White Spot Syndrome Virus (WSSV) pada Udang Windu (Penaeus monodon Fabricius, 1798) Isolasi dan Karakterisasi Gen Penyandi Protein Permukaan VP28 White Spot Syndrome Virus (WSSV) pada Udang Windu (Penaeus monodon Fabricius, 1798) Asmi Citra Malina 1, Andi Aliah Hidayani 1 dan Andi Parenrengi

Lebih terperinci

BAHAN DAN METODE. Waktu dan Tempat

BAHAN DAN METODE. Waktu dan Tempat BAHAN DAN METODE Waktu dan Tempat Penelitian dilakukan terhadap sampel yang dikoleksi selama tujuh bulan mulai September 2009 hingga Maret 2010 di Kabupaten Indramayu. Penelitian dilaksanakan di Laboratorium

Lebih terperinci

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI SPACED K-MERS DENGAN JARINGAN SYARAF TIRUAN SEBAGAI CLASSIFIER CUT MALISA IRWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB IV Hasil dan Pembahasan

BAB IV Hasil dan Pembahasan BAB IV Hasil dan Pembahasan Bab ini akan membahas hasil PCR, hasil penentuan urutan nukleotida, analisa in silico dan posisi residu yang mengalami mutasi dengan menggunakan program Pymol. IV.1 PCR Multiplek

Lebih terperinci

BAB 3 METODOLOGI PENELITIAN

BAB 3 METODOLOGI PENELITIAN BAB 3 METODOLOGI PENELITIAN 3.1 Desain Penelitian Bentuk desain penelitian yang akan digunakan adalah bentuk deskriptif molekuler potong lintang untuk mengetahui dan membandingkan kekerapan mikrodelesi

Lebih terperinci

OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI

OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI OPTIMASI PENGEKSTRAKSI FITUR SPACED K-MERS FREKUENSI MENGGUNAKAN ALGORITME GENETIKA PADA PENGKLASIFIKASIAN FRAGMEN METAGENOME ARINI AHA PEKUWALI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Indonesia merupakan negara tropis yang memiliki + 30.000 spesies tumbuh-tumbuhan ([Depkes] 2007). Tumbuh-tumbuhan tersebut banyak yang dibudidayakan sebagai tanaman hias. Seiring

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1. Isolasi RNA Total RNA total sengon diisolasi dengan reagen Trizol dari jaringan xylem batang sengon yang tua (berumur 5-10 tahun) dan bibit sengon yang berumur 3-4 bulan.

Lebih terperinci

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA

KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA KLASIFIKASI METAGENOM PADA KASUS IMBALANCED DATA DENGAN METODE MAHALANOBIS DISTANCE BASED SAMPLING MAJESTY EKSA PERMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

ANALISIS GEN PENYANDI HEMAGLUTININ VIRUS HIGHLY PATHOGENIC AVIAN INFLUENZA SUBTIPE H5N1 ISOLAT UNGGAS AIR

ANALISIS GEN PENYANDI HEMAGLUTININ VIRUS HIGHLY PATHOGENIC AVIAN INFLUENZA SUBTIPE H5N1 ISOLAT UNGGAS AIR ANALISIS GEN PENYANDI HEMAGLUTININ VIRUS HIGHLY PATHOGENIC AVIAN INFLUENZA SUBTIPE H5N ISOLAT UNGGAS AIR ABSTRACT Avian influenza viruses (AIV) subtype H5N isolated from waterfowls in West Java pose the

Lebih terperinci

Saya telah melihat cara membuat strand dna ini di internet dan akhirnya,,,, inilah hasilnya

Saya telah melihat cara membuat strand dna ini di internet dan akhirnya,,,, inilah hasilnya Untuk menghasilkan bahan 3D saya ini, bahan yang telah saya gunakan adalah kertas berwarna, dawai, double tape, gabus dan pelekat. Bahan-bahan ini merupakan bahan yang mudah untuk dicari dan semestinya

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada bagian ini akan diuraikan teori-teori dasar yang dijadikan sebagai landasan dalam penulisan tugas akhir ini. 2.1 Ilmu Bioinformatika Bioinformatika merupakan kajian yang mengkombinasikan

Lebih terperinci

PENGELOMPOKAN SEKUENS DNA MENGGUNAKAN METODE K-MEANS DAN FITUR N-MERS FREQUENCY BERNITA SINURAT

PENGELOMPOKAN SEKUENS DNA MENGGUNAKAN METODE K-MEANS DAN FITUR N-MERS FREQUENCY BERNITA SINURAT PENGELOMPOKAN SEKUENS DNA MENGGUNAKAN METODE K-MEANS DAN FITUR N-MERS FREQUENCY BERNITA SINURAT DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014

Lebih terperinci

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI

PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI PENERAPAN K-MEANS PADA IMBALANCED DATA UNTUK KLASIFIKASI METAGENOM ABDUL AZIZ FAUZI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN

Lebih terperinci

V. GENETIKA MIKROORGANISME

V. GENETIKA MIKROORGANISME V. GENETIKA MIKROORGANISME Genetika merupakan suatu cabang ilmu yang membahas tentang sifat-sifat yang diturunkan oleh suatu organisme. Penelaahan genetika secara serius pertama kali dilakukan oleh Gregor

Lebih terperinci

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode

Lebih terperinci

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR

IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR IDENTIFIKASI DNA BAKTERI MENGGUNAKAN METODE EKSTRAKSI CIRI RANTAI MARKOV DENGAN PROBABILISTIC NEURAL NETWORK SEBAGAI CLASSIFIER MUHAMMAD LUTHFI FAJAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

METAGENOME FRAGMENT CLUSTERING MENGGUNAKAN ALGORITME PILLAR K-MEANS SECARA PARALEL DALAM MODEL MAPREDUCE FATHURROHMAN

METAGENOME FRAGMENT CLUSTERING MENGGUNAKAN ALGORITME PILLAR K-MEANS SECARA PARALEL DALAM MODEL MAPREDUCE FATHURROHMAN METAGENOME FRAGMENT CLUSTERING MENGGUNAKAN ALGORITME PILLAR K-MEANS SECARA PARALEL DALAM MODEL MAPREDUCE FATHURROHMAN SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN MENGENAI TESIS

Lebih terperinci

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra

Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Jurnal Ilmiah Ilmu Komputer, Vol 15 No. 2, Desember 2010 : 38-41 Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Vera Yunita, Yeni Herdiyeni Departemen Ilmu

Lebih terperinci

MUTASI GEN. Perubahan Struktur dan Ekspresi Gen

MUTASI GEN. Perubahan Struktur dan Ekspresi Gen MUTASI GEN Perubahan Struktur dan Ekspresi Gen Mutasi : Mutasi >< Perubahan Fisiologi Perubahan pada bahan genetik yang menyebabkan perubahan ekspresinya Terjadi perubahan pada tingkat metabolisme Perubahan

Lebih terperinci

PENENTUAN POHON FILOGENETIK BAKTERI XILANOLITIK SISTEM ABDOMINAL RAYAP TANAH BERDASARKAN 16S rrna

PENENTUAN POHON FILOGENETIK BAKTERI XILANOLITIK SISTEM ABDOMINAL RAYAP TANAH BERDASARKAN 16S rrna PENENTUAN POHON FILOGENETIK BAKTERI XILANOLITIK SISTEM ABDOMINAL RAYAP TANAH BERDASARKAN 16S rrna SKRIPSI SEPTHIA DWI SUKARTININGRUM DEPARTEMEN KIMIA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS AIRLANGGA

Lebih terperinci

UJI KINERJA FACE RECOGNITION MENGGUNAKAN EIGENFACES

UJI KINERJA FACE RECOGNITION MENGGUNAKAN EIGENFACES 1 Uji Kinerja Face Recognition Menggunakan Eigenfaces UJI KINERJA FACE RECOGNITION MENGGUNAKAN EIGENFACES ABDUL AZIS ABDILLAH 1 1STKIP Surya, Tangerang, Banten, abdillah.azul@gmail.com Abstrak. Pada paper

Lebih terperinci

ANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA

ANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA ANALISIS BIPLOT UNTUK MEMETAKAN MUTU SEKOLAH YANG SESUAI DENGAN NILAI UJIAN NASIONAL SUJITA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2009 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan

Lebih terperinci

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor PENGENALAN KADAR TOTAL PADAT TERLARUT PADA BUAH BELIMBING BERDASAR CITRA RED-GREEN-BLUE MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS (PCA) SEBAGAI EKSTRAKSI CIRI DAN KLASIFIKASI K-NEAREST NEIGHBORHOOD (KNN)

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Tahapan Penelitian Tahapan yang dilakukan dalam penelitian ini disajikan pada Gambar 14, terdiri dari tahap identifikasi masalah, pengumpulan dan praproses data, pemodelan

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan

dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan Gambar 8 Struktur PNN. 1. Lapisan pola (pattern layer) Lapisan pola menggunakan 1 node untuk setiap data pelatihan yang digunakan.

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Fuzzy Local Binary Pattern (FLBP) Fuzzifikasi pada pendekatan LBP meliputi transformasi variabel input menjadi variabel fuzzy, berdasarkan pada sekumpulan fuzzy rule. Dalam

Lebih terperinci

HASIL DAN PEMBAHASAN. Generalisasi =

HASIL DAN PEMBAHASAN. Generalisasi = 6 Kelas Target Sidik jari individu 5 0000100000 Sidik jari individu 6 0000010000 Sidik jari individu 7 0000001000 Sidik jari individu 8 0000000100 Sidik jari individu 9 0000000010 Sidik jari individu 10

Lebih terperinci

BAB III METODE PENELITIAN. Desain penelitian untuk pengenalan nama objek dua dimensi pada citra

BAB III METODE PENELITIAN. Desain penelitian untuk pengenalan nama objek dua dimensi pada citra BAB III METODE PENELITIAN 3.1 Desain Penelitian Desain penelitian untuk pengenalan nama objek dua dimensi pada citra adalah sebagai berikut. Gambar 3.1 Desain Penelitian 34 35 Penjelasan dari skema gambar

Lebih terperinci

Kelas. Kelas. p q r s t u v w x y Level Transformasi.

Kelas. Kelas. p q r s t u v w x y Level Transformasi. Fitur yang digunakan untuk pelatihan pada algoritme VFI5 diperoleh dari tiap-tiap piksel pada citra tanda tangan. Fitur pada pelatihan yang semula berupa matriks berukuran 3 4 piksel disusun menjadi matriks

Lebih terperinci

HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK

HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK HALAMAN SAMPUL SKRIPSI PENGENALAN POLA TELAPAK TANGAN DENGAN MENGGUNAKAN ALGORITMA BACK PROPAGATION NEURAL NETWORK Oleh: MOH SHOCHWIL WIDAT 2011-51-034 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

Indikator 30. Urutan yang sesuai dengan sintesis protein adalah

Indikator 30. Urutan yang sesuai dengan sintesis protein adalah Indikator 30 1. Fase-fase sintesis protein: 1) RNAd meninggalkan inti menuju ribosom 2) RNAt mengikat asam amino yang sesuai 3) RNAd dibentuk di dalam inti oleh DNA 4) Asam amino berderet sesuai dengan

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER

KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER ACHMAD FAHRUROZI 1 1 Universitas Gunadarma, achmad.fahrurozi12@gmail.com Abstrak Masalah yang akan diangkat dalam makalah ini adalah bagaimana

Lebih terperinci

PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE

PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE Widodo Muda Saputra, Helmie Arif Wibawa, S.Si, M.Cs, dan Nurdin Bahtiar, S.Si, M.T Fakultas Sains dan Matematika, Jurusan Ilmu Komputer

Lebih terperinci

DAFTAR ISI. BAB I PENDAHULUAN 1.1 Latar Belakang Tujuan Penelitian Manfaat Penelitian... 4

DAFTAR ISI. BAB I PENDAHULUAN 1.1 Latar Belakang Tujuan Penelitian Manfaat Penelitian... 4 DAFTAR ISI Halaman Judul... Halaman Pengesahan... Halaman Pernyataan... Halaman Pernyataan Publikasi... Kata Pengantar... Daftar Isi... Daftar Gambar... Daftar Tabel... Daftar Arti Lambang... Daftar Singkatan...

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi 4 Perangkat keras berupa Notebook: Processor intel Core i3 2.2 GHz. RAM kapasitas 2. GB. Harddisk Kapasitas 5 GB. Monitor pada resolusi 1366 x 768 piksel. Merek Acer Aspire 475. Perangkat lunak berupa:

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN HASIL DAN PEMBAHASAN Isolasi RNA Total RNA total M. malabathricum telah berhasil diisolasi melalui modifikasi metode Chang et al. (1993). Modifikasi dilakukan pada larutan penyangga dengan peningkatan

Lebih terperinci

PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN

PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN Herfina 1) 1) Program Studi Ilmu Komputer, FMIPA Universitas Pakuan Jl. Pakuan PO BOX 452, Ciheuleut Bogora email : herfinario@yahoo.com

Lebih terperinci

PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI

PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI PEMODELAN SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI BAKTERI PATOGEN DAN NON PATOGEN BERDASARKAN DATA SEKUENS GENOM ESKAWATI KURNIA DWIMARDYASTUTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Metode Penelitian Penelitian mengenai peningkatan kecepatan prediksi produksi susu sapi ini menggunakan metode eksperimen dengan metode sebagai berikut: a. Pengumpulan data

Lebih terperinci

UJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR

UJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR UJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR oleh: MOH. KHAWARIZMIE ALIM F14101030 2006 FAKULTAS TEKNOLOGI PERTANIAN INSTITUT

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

KOMPRESI CITRA DIGITAL DENGAN MENGGUNAKAN HEBBIAN BASED PRINCIPAL COMPONENT ANALYSIS

KOMPRESI CITRA DIGITAL DENGAN MENGGUNAKAN HEBBIAN BASED PRINCIPAL COMPONENT ANALYSIS KOMPRESI CITRA DIGITAL DENGAN MENGGUNAKAN HEBBIAN BASED PRINCIPAL COMPONENT ANALYSIS 1 Sofyan Azhar Ramba 2 Adiwijaya 3 Andrian Rahmatsyah 12 Departemen Teknik Informatika Sekolah Tinggi Teknologi Telkom

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. 4.1 Pengembangan Sistem Pengenalan Wajah 2D

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. 4.1 Pengembangan Sistem Pengenalan Wajah 2D 30 BAB IV HASIL PENELITIAN DAN PEMBAHASAN 4.1 Pengembangan Sistem Pengenalan Wajah 2D Penelitian ini mengembangkan model sistem pengenalan wajah dua dimensi pada citra wajah yang telah disiapkan dalam

Lebih terperinci

Deteksi Kemiripan Citra Tanaman Anggrek Menggunakan Metode Support Vector Machine (SVM) Kernel Linear

Deteksi Kemiripan Citra Tanaman Anggrek Menggunakan Metode Support Vector Machine (SVM) Kernel Linear Jurnal Ilmiah ESAI Volume 8, No.3, Juli 214 ISSN No. 1978-634 Detecting Resemblance Of Orchid Plant Image Through Support Vector Machine (SVM) Of Kernel Linear Method Deteksi Kemiripan Citra Tanaman Anggrek

Lebih terperinci

BAB 5 UJI COBA DAN ANALISA HASIL

BAB 5 UJI COBA DAN ANALISA HASIL BAB 5 UJI COBA DAN ANALISA HASIL Pada bab ini diuraikan mengenai lingkungan uji coba, hasil uji coba serta analisa hasil uji coba dari perangkat lunak. 5.1 Lingkungan Lingkungan uji coba merupakan komputer

Lebih terperinci

Plot Multivariate Menggunakan Kernel Principal Component Analysis (KPCA) dengan Fungsi Power Kernel

Plot Multivariate Menggunakan Kernel Principal Component Analysis (KPCA) dengan Fungsi Power Kernel Plot Multivariate Menggunakan Kernel Principal Component Analysis (KPCA) dengan Fungsi Power Kernel Vitawati Bawotong, Hanny Komalig, Nelson Nainggolan 3 Program Studi Matematika, FMIPA, UNSRAT, vbawotong@gmail.com

Lebih terperinci

g(x, y) = F 1 { f (u, v) F (u, v) k} dimana F 1 (F (u, v)) diselesaikan dengan: f (x, y) = 1 MN M + vy )} M 1 N 1

g(x, y) = F 1 { f (u, v) F (u, v) k} dimana F 1 (F (u, v)) diselesaikan dengan: f (x, y) = 1 MN M + vy )} M 1 N 1 Fast Fourier Transform (FFT) Dalam rangka meningkatkan blok yang lebih spesifik menggunakan frekuensi dominan, akan dikalikan FFT dari blok jarak, dimana jarak asal adalah: FFT = abs (F (u, v)) = F (u,

Lebih terperinci

SISTEM PENGENALAN WAJAH BERBASIS METODA FISHERFACE TUGAS AKHIR. Febrian Ardiyanto NIM :

SISTEM PENGENALAN WAJAH BERBASIS METODA FISHERFACE TUGAS AKHIR. Febrian Ardiyanto NIM : SISTEM PENGENALAN WAJAH BERBASIS METODA FISHERFACE TUGAS AKHIR Oleh Febrian Ardiyanto NIM : 13203137 PROGRAM STUDI TEKNIK ELEKTRO SEKOLAH TEKNIK ELEKTRO DAN INFORMATIKA INSTITUT TEKNOLOGI BANDUNG 2007

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

Identifikasi DNA dengan Rantai Markov Orde Satu dan Probabilistic Neural Network

Identifikasi DNA dengan Rantai Markov Orde Satu dan Probabilistic Neural Network Seminar Nasional Teknologi Informasi 2013 1 Identifikasi DNA dengan Rantai Markov Orde Satu dan Probabilistic Neural Network Toto Haryanto 1) Habib Rijzaani 2) Muhammad Luthfi Fajar 3) 1) Laboratorium

Lebih terperinci

IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES ROSITA TRI INDRATI

IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES ROSITA TRI INDRATI IDENTIFIKASI VARIETAS DURIAN BERDASARKAN TEKSTUR DAUN MENGGUNAKAN K-NEAREST NEIGHBOR DENGAN CIRI STATISTICAL TEXTURES ROSITA TRI INDRATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi

BAB 1 PENDAHULUAN. Sistem Pakar (Expert System), Jaringan Saraf Tiruan (Artificial Neural Network), Visi BAB 1 PENDAHULUAN 1.1 Latar Belakang Di era yang semakin maju ini, teknologi telah memegang peranan penting dalam kehidupan manusia sehari-hari, sehingga kemajuannya sangat dinantikan dan dinikmati para

Lebih terperinci

KROMOSOM, GEN, DAN DNA

KROMOSOM, GEN, DAN DNA KROMOSOM, GEN, DAN DNA Kompetensi Dasar: Mahasiswa dapat menjelaskan hubungan antara kromosom, gen, dan DNA Menjelaskan proses replikasi, transkripsi, dan translasi Membuat peta pikiran tentang kromosom,

Lebih terperinci

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( )

DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara P. ( ) Sidang Tugas Akhir September 2009 Implementasi Metode Ant Colony Optimization untuk Pemilihan Fitur pada Kategorisasi Dokumen Teks DOSEN PEMBIMBING Chastine Fatichah, S.Kom, M.Kom MAHASISWA Yudis Anggara

Lebih terperinci

Akurasi. Perangkat Lunak: Sistem operasi: Windows Vista Home Premium Aplikasi pemrograman: Matlab 7.0

Akurasi. Perangkat Lunak: Sistem operasi: Windows Vista Home Premium Aplikasi pemrograman: Matlab 7.0 Tabel 1 Dimensi citra di tiap level Level transformasi Dimensi citra 1 46 56 2 23 28 3 12 14 4 6 7 5 3 4 6 2 2 Pada Gambar 5 disajikan visualisasi transformasi wavelet hingga level 3. Deskripsi citra dekomposisi

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan Eksperimen. 4.2 Lingkungan Eksperimen

BAB IV EKSPERIMEN. 4.1 Tujuan Eksperimen. 4.2 Lingkungan Eksperimen BAB IV EKSPERIMEN 4.1 Tujuan Eksperimen Terdapat beberapa hal yang menjadi tujuan eksperimen, yaitu: 1. Membandingkan performansi hasil eksperimen dengan hasil penelitian [LI05a], menggunakan dataset dan

Lebih terperinci

ABSTRAK. Kata Kunci : klasifikasi, musik digital, jenis musik, support vector machine, fitur ekstraksi, daftar putar musik digital

ABSTRAK. Kata Kunci : klasifikasi, musik digital, jenis musik, support vector machine, fitur ekstraksi, daftar putar musik digital ABSTRAK Kemudahan dalam mendapatkan musik digital membuat orang-orang dapat memiliki banyaknya koleksi musik digital. Terkadang orang-orang menikmati musik dengan jenis musik tertentu berdasarkan kondisi

Lebih terperinci

Phylogenetic Tree dari Empat Isolat Edwardsiella Tarda di Indonesia

Phylogenetic Tree dari Empat Isolat Edwardsiella Tarda di Indonesia Biota Vol. 16 (2): 348 353, Juni 2011 ISSN 0853-8670 Phylogenetic Tree dari Empat Isolat Edwardsiella Tarda di Indonesia Phylogenetic Tree from Four Isolates of Edwardsiella tarda in Indonesia Siti Narwiyani

Lebih terperinci

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG

MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG MODEL PERAMALAN HARGA SAHAM DENGAN JARINGAN SYARAF TIRUAN PROPAGASI BALIK TRIANA ENDANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan ini

Lebih terperinci

Identifikasi Daun Shorea menggunakan KNN dengan Ekstraksi Fitur 2DPCA. Shorea Leaves Identification using KNN with 2DPCA Feature Extraction

Identifikasi Daun Shorea menggunakan KNN dengan Ekstraksi Fitur 2DPCA. Shorea Leaves Identification using KNN with 2DPCA Feature Extraction Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 3 Nomor 1 halaman 19-27 ISSN: 2089-6026 Identifikasi Daun Shorea menggunakan KNN dengan Ekstraksi Fitur 2DPCA Shorea Leaves Identification

Lebih terperinci

METODE Waktu dan Tempat Materi Sampel DNA Primer

METODE Waktu dan Tempat Materi Sampel DNA Primer METODE Waktu dan Tempat Penelitian ini dilaksanakan mulai bulan September 2010 sampai dengan bulan Pebruari 2011. Penelitian dilakukan di Laboratorium Genetika Molekuler Ternak Bagian Pemuliaan dan Genetika

Lebih terperinci

OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA

OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA OPTIMASI PARAMETER PADA SUPPORT VECTOR MACHINE UNTUK KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN ALGORITME GENETIKA INNA SABILY KARIMA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian BAB III METODOLOGI PENELITIAN 3.1.1 Alat Alat yang digunakan dalam penelitian ini adalah: a. Hardware a. Prosesor : Intel Core i5-3230m CPU @ 2.60GHz b. Memori : 4.00 GB c.

Lebih terperinci

TINJAUAN PUSTAKA Analisis Biplot Biasa

TINJAUAN PUSTAKA Analisis Biplot Biasa TINJAUAN PUSTAKA Analisis Biplot Biasa Analisis biplot merupakan suatu upaya untuk memberikan peragaan grafik dari matriks data dalam suatu plot dengan menumpangtindihkan vektor-vektor dalam ruang berdimensi

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

Crossover Probability = 0.5 Mutation Probability = 0.1 Stall Generation = 5

Crossover Probability = 0.5 Mutation Probability = 0.1 Stall Generation = 5 oleh pengguna sistem adalah node awal dan node tujuan pengguna. Lingkungan Pengembangan Sistem Implementasi Algoritme Genetika dalam bentuk web client menggunakan bahasa pemrograman PHP dan DBMS MySQL.

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : Tabel 2.1 Penelitian sebelumnya Parameter Penulis Objek Metode Hasil

Lebih terperinci

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN

KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN KLASIFIKASI FRAGMEN METAGENOME MENGGUNAKAN KNN DAN PNN DENGAN EKSTRAKSI FITUR GRAY LEVEL CO-OCCURRENCE MATRIX (GLCM) PADA VARIASI PANJANG FRAGMEN MUHAMMAD DHIRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA

Lebih terperinci

METODE PENELITIAN. Gambar 2 Metodologi penelitian.

METODE PENELITIAN. Gambar 2 Metodologi penelitian. 4 penelitian i, kata diasosiasikan dengan anotasi citra (kata) dan dokumen diasosiasikan dengan citra. Matriks kata-citra tersebut didekomposisi meadi : A USV T dengan A adalah matriks kata-citra, matriks

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada bab ini akan dibahas teori yang berkaitan dengan pemrosesan data untuk sistem pengenalan gender pada skripsi ini, meliputi cropping dan resizing ukuran citra, konversi citra

Lebih terperinci

3. METODE PENELITIAN

3. METODE PENELITIAN 19 3. METODE PENELITIAN 3.1 Diagram Alir Penelitian Kerangka pemikiran pada penelitian ini dapat digambarkan dalam suatu bagan alir seperti pada Gambar 8. Gambar 8 Diagram Alir Penelitian Pengumpulan Data

Lebih terperinci

dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. akurasi =.

dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. akurasi =. dan 3. Jumlah partisi vertikal (m) dari kiri ke kanan beturut-turut adalah 1, 2, 3, 4, dan 5. Gambar 5 Macam-macam bentuk partisi citra. Ekstraksi Fitur Pada tahap ini semua partisi dari citra dihitung

Lebih terperinci

BAB III METODE PENELITIAN. tangan dengan menggunakan metode Support Vector Machine (SVM).

BAB III METODE PENELITIAN. tangan dengan menggunakan metode Support Vector Machine (SVM). BAB III METODE PENELITIAN 3.1 Desain Penelitian Di dalam desain penelitian ini akan menggambarkan proses pengenalan tulisan tangan dengan menggunakan metode Support Vector Machine (SVM). Praproses Input

Lebih terperinci

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM)

DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) DIAGNOSA KETIDAKLURUSAN (MISALIGNMENT) POROS MENGGUNAKAN METODE MULTICLASS SUPPORT VECTOR MACHINE (SVM) SKRIPSI Diajukan sebagai salah satu syarat Untuk memperoleh gelar Sarjana Teknik Oleh: WANTO NIM.

Lebih terperinci

BAB 3 METODOLOGI. seseorang. Hal inilah yang mendorong adanya perkembangan teknologi

BAB 3 METODOLOGI. seseorang. Hal inilah yang mendorong adanya perkembangan teknologi BAB 3 METODOLOGI 3.1. Kerangka Berpikir Pengenalan ekspresi wajah adalah salah satu bentuk representasi kecerdasan manusia yang dapat digunakan untuk mendeteksi kondisi emosi seseorang. Hal inilah yang

Lebih terperinci

BAB III METODELOGI PENELITIAN. Alat yang digunakan dalam penelitian ini adalah: a. Prosesor : Intel Core i5-6198du (4 CPUs), ~2.

BAB III METODELOGI PENELITIAN. Alat yang digunakan dalam penelitian ini adalah: a. Prosesor : Intel Core i5-6198du (4 CPUs), ~2. BAB III METODELOGI PENELITIAN 3.1 Alat dan Bahan Penelitian 3.1.1 Alat Alat yang digunakan dalam penelitian ini adalah: 1. Hardware a. Prosesor : Intel Core i5-6198du CPU @2.30GHz (4 CPUs), ~2.40GHz b.

Lebih terperinci

BAB IV APLIKASI MODEL HIDDEN MARKOV DISKRET PADA DNA

BAB IV APLIKASI MODEL HIDDEN MARKOV DISKRET PADA DNA 50 BAB IV APLIKASI MODEL HIDDEN MARKOV DISKRET PADA DNA Pada Bab ini dijelaskan mengenai DNA cendawan pada spesies Aspergillus niger [http://www.ncbi.nlm.gov/ 06/05/2009] sebagai data input yang digunakan

Lebih terperinci

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP KATA PENGANTAR Syukur Alhamdulillah, puji dan syukur kami panjatkan kehadirat Allah SWT, karena dengan limpah dan rahmat dan karunia-nya penulis dapat menyelesaikan penyusunan laporan tugas akhir APLIKASI

Lebih terperinci

EKSTRAKSI JALAN SECARA OTOMATIS DENGAN DETEKSI TEPI CANNY PADA FOTO UDARA TESIS OLEH: ANDRI SUPRAYOGI NIM :

EKSTRAKSI JALAN SECARA OTOMATIS DENGAN DETEKSI TEPI CANNY PADA FOTO UDARA TESIS OLEH: ANDRI SUPRAYOGI NIM : EKSTRAKSI JALAN SECARA OTOMATIS DENGAN DETEKSI TEPI CANNY PADA FOTO UDARA (Menggunakan Transformasi Wavelet Untuk Penghalusan Citra ) TESIS Karya tulis sebagai salah satu syarat untuk memperoleh gelar

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO)

PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) PENENTUAN JALUR TERPENDEK PADA APLIKASI OJEK ONLINE GO-JEK DENGAN PROBABILISTIC NEURAL NETWORK (PNN) DAN PARTICLE SWARM OPTIMIZATION (PSO) Levina Fitri Rahmawati, Isnandar Slamet, dan Diari Indriati Program

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

Hardisk 80 GB Perangkat lunak Window XP Profesional MATLAB 7.0.1

Hardisk 80 GB Perangkat lunak Window XP Profesional MATLAB 7.0.1 Hardisk 8 GB Perangkat lunak Window XP Profesional MATLAB 7..1 HASIL DAN PEMBAHASAN Percobaan yang dilakukan pada penelitian ini terdiri atas dua macam, yaitu citra yang akan mengalami proses pengenalan

Lebih terperinci

Pendekatan Dynamic Programming untuk Menyelesaikan Sequence Alignment

Pendekatan Dynamic Programming untuk Menyelesaikan Sequence Alignment Pekatan Dynamic Programming untuk Menyelesaikan Sequence Alignment Ray Andrew Obaja Sinurat - 13515073 Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung,

Lebih terperinci

KAJIAN MOLEKULER LUMBA-LUMBA HIDUNG BOTOL (Tursiops sp.) ASAL LAUT JAWA BERDASAR URUTAN GEN CYTOCHROME C OXIDASE SUB-UNIT II (COX II)

KAJIAN MOLEKULER LUMBA-LUMBA HIDUNG BOTOL (Tursiops sp.) ASAL LAUT JAWA BERDASAR URUTAN GEN CYTOCHROME C OXIDASE SUB-UNIT II (COX II) Jurnal Kedokteran Hewan P-ISSN : 1978-225X; E-ISSN : 2502-5600 Rini Widayanti dan Yuda Heru Fibrianto KAJIAN MOLEKULER LUMBA-LUMBA HIDUNG BOTOL (Tursiops sp.) ASAL LAUT JAWA BERDASAR URUTAN GEN CYTOCHROME

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

BAB III DATA DAN METODOLOGI

BAB III DATA DAN METODOLOGI 17 BAB III DATA DAN METODOLOGI 3.1 Data Pada penelitian ini, ada dua jenis data yang akan digunakan. Jenis data pertama adalah data curah hujan bulanan dan yang kedua adalah data luaran GCM. 3.1.1 Data

Lebih terperinci

METODE PENELITIAN. Survei dan Pendataan

METODE PENELITIAN. Survei dan Pendataan METODE PENELITIAN Tempat dan Waktu Penelitian Kegiatan identifikasi penyebab penyakit umbi bercabang pada wortel dilakukan di Laboratorium Nematologi dan Laboratorium Virologi Departemen Proteksi Tanaman

Lebih terperinci

HASIL DAN PEMBAHASAN. B fch a. d b

HASIL DAN PEMBAHASAN. B fch a. d b 7 dengan nilai σ yang digunakan pada tahap pelatihan sebelumnya. Selanjutnya dilakukan perhitungan tingkat akurasi SVM terhadap citra yang telah diprediksi secara benar dan tidak benar oleh model klasifikasi.

Lebih terperinci