KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM"

Transkripsi

1 KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan K-Nearest Neigbor adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Desember 2015 Fitri Kusumaningrum NIM G

4 ABSTRAK FITRI KUSUMANINGRUM. Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan Algoritme K-Nearest Neighbor. Di bawah bimbingan IMAS SUKAESIH SITANGGANG. Titik panas merupakan salah satu indikasi kebakaran hutan pada lahan gambut. Data kemunculan titik panas dianalisis menggunakan metode dalam data mining, yaitu K-Nearest Neighbor. KNN merupakan metode untuk mengklasifikasikan obyek berdasarkan data training yang terletak paling dekat dengan objek terdekat. Data yang digunakan adalah data titik panas untuk periode dan data lahan gambut dari tahun Hasil penelitian menunjukkan bahwa KNN dapat digunakan untuk mengklasifikasikan kemunculan titik panas di Sumatera dan Kalimantan. Akurasi tertinggi dataset di Sumatera adalah 97,04% pada tahun 2007 dengan jumlah tetangga (k) adalah 1. Akurasi tertinggi dataset di Kalimantan adalah 100% pada tahun 2001, 2003, 2007, dan 2011 dengan (k) adalah 1. Selain itu pada tahun 2005, akurasi tertinggi adalah 100% dengan (k) adalah 1 dan (k) adalah 3. Akurasi rata-rata dataset di Sumatera adalah 94.14% dan pada dataset di Kalimantan adalah 97.67%. Berdasarkan hasil penelitian dapat disimpulkan bahwa algoritme KNN dapat digunakan untuk memprediksi kemunculan titik panas pada lahan gambut di Sumatera dan Kalimantan berdasarkan jarak kedekatan titik panas. Kata kunci: k-nearest Neighbor, model prediksi, titik panas ABSTRACT FITRI KUSUMANINGRUM. Classification of Hotspot Occurences on Peatland in Sumatera and Kalimantan using K-Nearest Neighbor Algorithm. Supervised by IMAS SUKAESIH SITANGGANG. Forest fires is considered as indicator of forest fire on peatland. Data hotspot occurrence were analyzed using a methods in data mining, namely the K- Nearest Neighbor. KNN is method to classify objects based on the training data that located to the closest object. The data used are hot-spots for the period 2001 to 2014 and peatlands data from 1990 to The result showes that KNN can be used to classify hot-spots occurrence in Sumatera and Kalimantan. The highest accurancy in Sumatera datasets is 97.04% in 2007 with number of neighbors of (k) of 1. The highest accurancy in Kalimantan datasets is 100% in 2001, 2003, 2007, and 2011 with (k) of 1. In addition in 2005, the highest accurancy is 100% with (k) of 1 and (k) of 3. The average of accurancy on Sumatera datasets is 94.14% and on Kalimantan datasets is 97.67%. Based on the result of the experiment it can be concluded that the KNN algorithm can be used to predict hotspots occurrences in peatland in Sumatera and Kalimantan based on the distance proximity of hotspots. Keywords: hotspot, k-nearest Neighbor, prediction model

5

6 KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGBOR FITRI KUSUMANINGRUM Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

7 Penguji : 1 Toto Haryanto, Skom MSi 2 Muhammad Asyhar Agmalaro, Ssi MKom

8 Judul Skripsi : Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan Algoritme K-Nearest Neigbor Nama : Fitri Kusumaningrum NIM : G Disetujui oleh Dr Imas Sukaesih Sitanggang, SSi MKom Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

9 PRAKATA Puji dan syukur penulis panjatkan kepada Allah Subhana wa ta'ala. Shalawat serta salam semoga senantiasa dilimpahkan kepada Nabi Muhammad, keluarganya, sahabatnya, dan kepada kita yang selau berusaha menggapai ridha Allah. Alhamdulillah atas bimbingan dan petunjuk dari Allah Subhana wa ta'ala serta bimbingan dari semua pihak, penyusunan tugas akhir yang berjudul Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan Algoritme K-Nearest Neighbor dapat diselesaikan. Tugas akhir ini tidak mungkin dapat diselesaikan tanpa adanya bantuan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terimakasih dan penghargaan yang setinggi-tingginya kepada: Bapak, Ibu dan keluarga yang selalu mendoakan, memberi nasihat, kasih sayang, semangat, dan dukungan sehingga penelitian ini bisa diselelsaikan. Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku pembimbing yang telah memberi saran, masukan dan ide-ide dalam penelitian ini. Bapak Toto Haryanto, SKom MSi dan Bapak Muhammad Asyhar Agmalaro, SSi MKom sebagai penguji. Teman seperjuangan Elin, Resa, Upi dan Uni yang telah memberikan semangat dan masukan. Departemen Ilmu Komputer IPB, staf dan dosen yang telah banyak membantu selama masa perkuliahan hingga penelitian. Wetland Internasional Indonesia yang telah berkenan memberikan data lahan gambut di Sumatera dan Kalimantan. Semoga penelitian ini bermanfaat. Bogor, Desember 2015 Fitri Kusumaningrum

10 DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 1 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 METODE 2 Data 2 Tahapan Penelitian 6 Pengambilan Data 7 Praproses Data 7 Pembagian Data 8 Tahapan Klasifikasi menggunakan Algoritme KNN 8 Perhitungan Akurasi 9 Pemilihan Hasil Klasifikasi Terbaik 9 Pemilihan Data Baru 9 Hasil Klasifikasi Terbaik 9 Peralatan Penelitian 10 HASIL DAN PEMBAHASAN 10 Pengambilan Data 10 Praproses Data 10 Pembagian Data 17 Tahapan Klasifikasi Menggunakan Algoritme K-Nearest Neigbor 18 Perhitungan Akurasi 18 Pemilihan Hasil Klasifikasi Terbaik 21 Pemilihan Data Baru 21 Hasil Klasifikasi Terbaik 22

11 SIMPULAN DAN SARAN 23 Simpulan 23 Saran 23 DAFTAR PUSTAKA 23 LAMPIRAN 13 RIWAYAT HIDUP 15

12 DAFTAR TABEL 1 Tingkat kedalaman lahan gambut 3 2 Atribut dari titik panas 3 3 Luas jenis gambut di Kalimantan 5 4 Luas jenis gambut di Sumatera 5 5 Atribut pada dataset Atribut pada dataset Contoh isi tabel dataset Jumlah missing value dataset Sumatera dan Kalimantan 16 9 Data hasil konversi nominal ke binary sudah dalam bentuk kolom Confusion matrix pada dataset Pulau Kalimantan tahun 2003 dengan nilai Nilai akurasi tertinggi hasil klasifikasi setiap tahun untuk dataset Sumatera Nilai akurasi tertinggi hasil klasifikasi setiap tahun untuk dataset Kalimantan Nilai akurasi rata-rata hasil klasifikasi setiap tahun untuk dataset Pulau Sumatera Nilai akurasi rata-rata hasil klasifikasi setiap tahun untuk dataset Pulau Kalimantan Confusion matrix di R untuk data baru tahun 2015 dengan k = Confusion matrix di R untuk data baru tahun 2015 dengan k = 3 22 DAFTAR GAMBAR 1 Peta lahan gambut Kalimantan 4 2 Peta lahan gambut Sumatera 4 3 Tahapan metode penelitian 6 4 Jumlah titik panas pertahun di Sumatera dan Kalimantan 11 5 Sistem referensi di Indonesia (Oswald dan Astrini 2012) 11 6 Peta lahan gambut di Pulau Sumatera yang dioverlay dengan titik panas tahun Peta lahan gambut di Pulau Sumatera yang dioverlay dengan titik panas tahun Data non titik panas pada lahan gambut di Sumatera untuk tahun Data non titik panas pada lahan gambut di Kalimantan untuk tahun Data hasil konversi nominal ke binary masih dalam bentuk text Grafik akurasi Pulau Sumatera tahun Grafik akurasi Pulau Kalimantan tahun DAFTAR LAMPIRAN 1 Grafik confussion matrix Pulau Sumatera tahun Grafik confussion matrix Pulau Sumatera tahun

13 3 Grafik confussion matrix Pulau Sumatera tahun Grafik confussion matrix Pulau Sumatera tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Grafik confussion matrix Pulau Kalimantan tahun Record data training Pulau Kalimantan Record data testing Pulau Kalimantan Hasil perhitungan euclidean Hasil perhitungan jarak euclidean sudah terurut Ilustrasi KNN dari Lampiran Kelas untuk nilai k = 1 sampai k = 9 33

14

15 PENDAHULUAN Latar Belakang Indonesia merupakan negara yang memiliki kekayaan alam yang melimpah termasuk diantaranya adalah lahan gambut. Lahan gambut memiliki peranan yang sangat penting dalam menyimpan karbon, dimana kemampuan menyimpan karbon jauh lebih tinggi dibanding lahan mineral. Indonesia memiliki lahan gambut terluas diantara negara tropis, yaitu 20,6 juta hektar atau sekitar 10,8% dari luas daratan di Indonesia, dimana 5,7 juta hektar terdapat di Kalimantan dan 7,2 juta hektar di Sumatra (Wibowo dan Suyatno 1998). Namun sekarang ini, lahan gambut terancam rusak akibat banyaknya kebakaran lahan gambut di Sumatera dan Kalimantan. Kebakaran lahan gambut hampir setiap tahun terjadi. Hal itu menimbulkan masalah baru untuk lingkungan hidup di sekitarnya. Terjadinya kebakaran lahan gambut dapat dideteksi dengan melihat sebaran titik panas di area lahan gambut tertentu. Sebaran titik panas dapat diperolah dari satelit yang mencatat area tertentu yang dianggap memiliki suhu tinggi. Pemanfaatan data titik panas menjadi informasi yang lebih berguna dapat dengan menggunakan teknik data mining, karena data mining dapat mengolah data yang cukup besar menjadi pengetahuan. Salah satu metode dalam data mining adalah K-Nearest Neighbor (KNN). Metode ini dapat mengklasifisikasikan data titik panas ke dalam kelas tertentu berdasarkan jarak kedekatan objek. Dengan metode ini dapat menggunakan data titik panas untuk menentukan informasi kemunculan titik panas baru. Pada penelitian sebelumnya telah dilakukan penelitian mengenai kebakaran hutan oleh Sitanggang (2013). Dalam penelitiannya dibahas mengenai upaya pencegahan kebakaran hutan dengan pemodelan untuk menilai resiko terjadinya kebakaran hutan dengan klasifikasi C4.5, SimpleCart, Niave Bayes, regresi logistik dan pohon keputusan ID3. Penelitian lain oleh Fernando dan Sitanggang (2014) mengenai klasifikasi data titik panas di propinsi Riau dengan menggunakan teknik pohon keputusan ID3. Selain itu penelitian yang menggunakan metode KNN juga pernah dilakukan oleh Ernawati (2008). Dalam penelitian tersebut dilakukan prediksi status keaktifan studi mahasiswa dengan algoritma C5.0 dan K-Nearest Neigbor dengan hasil akurasi tertinggi 90% pada jumlah tetangga (k) = 1. Penelitian ini mengklasifikasi kemunculan titik panas pada lahan gambut di Sumatera dan Kalimantan dengan menggunakan algoritme KNN untuk menentukan kemunculan titik panas dan mengklasifikasikan berdasarkan jarak kedekatan antar objek pada lahan gambut di Sumatera dan Kalimantan. Hasil klasifikasi ini diharapkan dapat memberikan informasi jarak kedekatan antar objek pada lahan gambut dimana titik panas terjadi. Perumusan Masalah Meningkatnya kebakaran lahan gambut menjadi masalah utama dalam penelitian ini. Salah satu upaya untuk mencegah kebakaran lahan gambut adalah dengan menentukan kemunculan titik panas di lahan gambut. Berdasarkan latar belakang dalam penelitian ini, maka perumusan masalah dalam penelitian ini

16 2 adalah bagaimana mengklasifikasi kemunculan titik panas di lahan gambut di Sumatera dan Kalimantan menggunakan algoritme KNN. Tujuan Penelitian Tujuan dari penelitian ini adalah mengklasifikasi kemunculan titik panas di lahan gambut di Sumatera dan Kalimantan menggunakan algoritme KNN. Manfaat Penelitian Penelitian ini diharapkan dapat menghasilkan prediksi kemunculan titik panas pada lahan gambut berdasarkan jarak kedekatan objek yang akurat untuk masa yang akan datang, sehingga digunakan untuk mencegah kebakaran pada lahan gambut. Ruang Lingkup Penelitian Ruang lingkup dari penelitian ini adalah: 1 Karakteristik yang digunakan untuk data lahan gambut pada penelitian ini terdiri dari jenis lahan gambut, kedalaman lahan gambut dan tutupan lahan. 2 Wilayah kajian pada penelitian ini pada lahan gambut di Sumatera dan Kalimantan. 3 Penelitian ini menggunakan package class yang sudah disediakan oleh perangkat lunak RStudio. 4 Dataset yang dapat dijalankan untuk Sumatera hanya pada 2001, 2007, 2008, dan Dataset yang dapat dijalankan untuk Kalimantan hanya pada 2001, 2003, 2005, 2007, 2008, 2010, 2011, 2012, dan METODE Data Data yang digunakan pada penelitian ini terdiri dari 2 data, yaitu data titik panas pulau Sumatera dan pulau Kalimantan dari tanggal 1 Januari 2001 sampai 31 Maret 2015 dan data lahan gambut dari tahun 1990 sampai Data titik panas diperoleh dari Nasional Aeronautics and Space Administration (NASA) Fire Information for Resource Management (FIRMS) dalam format shapefile (.shp) dengan cara mengunduh. Data lahan gambut didapat dari Wetlands International Indonesia Programme (WI PI) yang ada di Jl. Ahmad Yani No 53 Bogor, Jawa Barat. Menurut Sitanggang et al. (2012) atribut data lahan gambut yang digunakan terdiri dari 3 atribut, yaitu jenis lahan gambut, kedalaman lahan gambut dan tutupan lahan gambut. Jenis lahan gambut yang ada di Sumatera dan Kalimantan digunakan untuk melihat jenis gambut yang terbakar. Berdasarkan tingkat dekomposisi bahan organiknya gambut dibedakan menjadi 3 yaitu fibrists, hemists, dan saprists (Suwanto et al. 2010). Berikut penjelasan mengenai Jenis gambut: 1 Fibrists Gambut yang masih muda dengan tingkat pelapukan awal dan lebih dari ¾ bagian volumenya berupa serat kasar, air perasan berwarna bening/jernih.

17 2 Hemists Gambut yang mempunyai tingkat pelapukan sedang, bagian yang masih berupa serat kasar sekitar 1/4 hingga kurang dari 3/4 bagian, dan air perasan berwarna coklat dan mengandung bahan yang tidak larut. 3 Saprists Gambut yang tingkat pelapukannya sudah lanjut (matang), berupa serat kasar kurang dari 1/4 bagian, dan air perasan berwarna hitam. Atribut tutupan lahan digunakan untuk melihat penggunaan lahan gambut tersebut. Penggunaan lahan gambut di Sumatera dan Kalimantan digunakan untuk hutan rawa, kelapa sawit, belukar rawa, sawah intensif (padi-palawija/beras), kelapa, sawah tadah hujan (padi-palawija/beras) dan masih banyak lagi. Kedalaman lahan gambut digunakan untuk melihat tingkat kedalaman lahan gambut tersebut. Untuk melihat tingkat kedalamannya lahan gambut dapat dilihat pada Tabel 1. Tabel 1 Tingkat kedalaman lahan gambut (Suwanto 2010) 3 D0 D1 D2 D3 D4 Kedalaman Keterangan Sangat dangkal/ sangar tipis < 50 cm Dangkal/ tipis cm Sedang cm Dalam/ tebal cm Sangat dalam/ sangat tebal > 400 cm Dari Tabel 1 dapat dilihat penjelasan dari simbol D0, D1, D2, D3, dan D4. Tingkat kedalaman gambut juga sudah dijelaskan dengan tingkat ukuran (cm). Mulai dari kurang dari 50 cm sampai lebih 400 cm. Untuk atribut data titik panas terdiri dari 12 atribut yang dapat dilihat pada Tabel 2. Tabel 2 Atribut dari titik panas No Atribut Tipe 1 Latitude Numerik 2 Longitude Numerik 3 Brightness Numerik 4 Scan Numerik 5 Track Numerik 6 Acq_date Date 7 Acq_time Character varying(5) 8 Satelit Character varying(3) 9 Confidence Integer 10 Version Character varying(1) 11 Brigh_T31 Numerik 12 FRP Numerik Dari 12 atribut pada Tabel 2 hanya diambil 3 atribut saja yaitu longitude, latitude, dan confidence. Longitude dan latitude akan digunakan untuk menunjukkan posisi dari titik panas yang terjadi. Confidence digunakan untuk seleksi titik panas yang memiliki potensi besar sebagai kebakaran. Untuk melihat peta gambut di Kalimantan dapat dilihat pada Gambar 1, sedangkan peta lahan gambut di Sumatera dapat dilihat pada Gambar 2.

18 4 Gambar 1 Peta lahan gambut Kalimantan Gambar 2 Peta lahan gambut Sumatera Dari Gambar 1 dan Gambar 2, dapat dilihat letak jenis gambut dan letaknya di Pulau Kalimantan dan Sumatera. Lahan gambut di Kalimantan dan Sumatera terdiri dari 2 atau 3 jenis untuk setiap daerahnya. Untuk melihat luas jenis gambut di Pulau Kalimantan dapat dilihat pada Tabel 3.

19 5 Tabel 3 Luas jenis gambut di Kalimantan No Tipe Gambut Luas (ha) 1 Hemists/Fibrists Hemists/Fibrists/Mineral Hemists/Mineral Saprists/Mineral Saprists/Hemists/Mineral Hemists/Saprists/Mineral Hemists/Fibrists/Saprists Luas lahan gambut di Pulau Kalimantan yang dapat dilihat pada Tabel 3 menunjukkan luas jenis gambut yang paling luas pada jenis Hemists/Fibrists dengan luasnya mencapai ha. Hemists/Fibrists maksutnya pada daerah tersebut tedapat jenis Hemist dan Saprist. Luas jenis gambut paling sempit ada pada jenis Hemists/Fibrists/Saprists dengan luas ha. Hemists/Fibrists/Saprists maksudnya pada daerah tersebut terdapat lebih dari 2 jenis lahan gambut, yaitu Hemists, Fibrists, dan Saprists. Untuk melihat luas jenis gambut di Pulau Sumatera dapat dilihat pada Tabel 4. Tabel 4 Luas jenis gambut di Sumatera No Tipe Gambut Luas (ha) 1 Hemists/Saprists (60/40), sedang Saprists/min (50/50), dangkal Saprists/Hemists (60/40), sedang Saprists/min (30/70), sedang Saprists/min (90/10), sedang Hemists (100), dalam Hemists/Saprists (60/40), dalam Hemists (100), sedang Saprists/min (50/50), dalam Hemists/min(90/10),sangat dalam Hemists/Saprists (60/40), sedang Hemists/min (30/70), dangkal Hemists/Saprists (60/40), sangat dalam Saprists/Hemists (60/40), dalam Saprists/Hemists (60/40), sedang Hemists/min (90/10), dangkal Hemists/Saprists (60/40), dangkal Hemists/min (70/30), sedang Saprists/min (30/70), dalam Hemists/min (90/10), sedang Hemists/min (50/50), dangkal Saprists/min (50/50), sedang Hemists/min (90/10), sedang Fibrists/Saprists (60/40), sedang Saprists/Hemists (60/40), sangat dalam Hemists/min (30/70), sedang

20 6 No Tipe Gambut Luas (ha) 27 Saprists (100), sedang Saprists (100), dalam Berbeda dengan Tabel 3 jenis gambut di Pulau Kalimantan, pada Tabel 4 jenis gambut di Pulau Sumatera terdapat angka dan keterangan (sedang, dalam dan sangat dalam). Angka di belakang jenis menunjukkan perbandingan jumlah kadungan jenis gambut yang ada. Misalnya pada luas jenis gambut terluas Hemists/Saprists (60/40), sedang dengan luasnya ha. Hemists/Saprists (60/40) maksudnya adalah dalam daerah tersebut terdapat kandungan jenis lahan gambut Hemists sebanyak 60% dan jenis lahan gambut Saprists sebanyak 40%. Untuk luas paling sempit terdapat pada jenis Hemists/min (90/10), sedang dengan luasnya 0.63 ha. Hemists/min (90/10) maksudnya pada daerah tersebut terdapat kadungan jenis lahan gambut Hemists 90% dan min (mineral) sebanyak 10%. Luas keseluruhan tipe gambut di Sumatera mencapai ha. Tahapan Penelitian Tahapan yang dilakukan pada penelitian ini dapat dilihat pada Gambar 3 Gambar 3 Tahapan metode penelitian

21 7 Pengambilan Data Pada tahapan ini yang dilakukan adalah melakukan pengambilan data. Data yang digunakan terdiri dari 2 data. Data titik panas yang didapat dari Nasional Aeronautics and Space Administration (NASA) dan data lahan gambut yang didapat dari Wetland Internasional Indonesia. Praproses Data Pada tahapan ini, terdapat beberapa tahapan yang akan dilakukan terhadap data titik panas dan data lahan gambut. Pertama yang dilakukan yaitu memlihat data titik panas yang lengkap (terdapat titik panas setiap bulannya dalam satu tahun). Kemudian data dipisah pertahunnya, untuk Sumatera sendiri untuk kalimantan sendiri. Dataset Sumatera untuk lahan gambut atributnya terdiri dari jenis lahan gambut, tutupan lahan dan kedalaman lahan gambut, sedangkan untuk dataset Kalimantan atributnya hanya terdiri dari jenis lahan gambut dan kedalaman lahan gambut. Perbedaan jumlah atribut tersebut dikarenakan data yang didapat dari wetland untuk dataset Kalimantan tidak mencantumkan jenis tutupan lahan, karena harga datanya yang sangat mahal. Seleksi Data Titik Panas pada Lahan Gambut Pada tahapan ini yang dilakukan adalah membuat data titik panas yang berada diatas lahan gambut. Cara untuk mendapatkannya dengan menggabungkan hasil data titik panas Pulau Sumatera dengan data lahan gambut di Pulau Sumatera dan data titik panas di Pulau Kalimantan dengan data lahan gambut di Pulau Kalimantan. Pembuatan Data Non Titik Panas pada Lahan Gambut Pada tahapan ini yang dilakukan adalah membuat data non titik panas. Untuk membuat data non titik panas diperlukan data titik panas dan data lahan gambut. Terdapat beberapa proses untuk mendapatkan data non titik panas yaitu pembuatan buffer, disolve, operasi difference, dan pembangkitan random point. Setelah proses tersebut dilakukan maka data non titik panas sudah didapat. Pembuatan Dataset Setelah didapatkan data titik panas pada lahan gambut dan data bukan titik panas pada lahan gambut. Proses selanjutnya adalah menambahkan kolom baru untuk kelas sebagai identifier yang membedakan antara titik panas dan bukan titik panas. Dari hasil tersebut diambil data titik panas confidence-nya 70 karena dianggap memiliki potensi kebakaran. Barulah kemudian dibuat dataset yang akan digunakan dalam proses klasifikasi. Membuang Missing Value Pada tahapan ini yang akan dilakukan adalah melihat jumlah missing value dan presentase dengan jumlah keseluruhan data. Setelah didapat presentase dalam jumlah persen data yang kurang dari 10% akan dibuang karena dianggap tidak memiliki mengaruh besar dalam proses klasifikasi.

22 8 Konversi Data Pada tahapan ini dilakukan konversi data yaitu mengubah data dari tipe data nominal ke dalam bentuk numeric. Proses konversi dilakukan karena untuk klasifikasi menggunakan algoritme KNN hanya data yang bersifat numeric yang dapat diproses, sedangkan data yang didapat masih dalam bentuk nominal. Pembagian Data Pada tahapan ini, dilakukan pembagian data menjadi data latih dan data uji. Metode yang digunakan untuk membagi data adalah metode 10 fold cross validation. Data dibagi secara random ke dalam 10 bagian dengan perbandingan yang sama, kemudian dari setiap bagian terbaik akan menjadi data uji dan 9 bagian lainnya akan menjadi data latih. Tahapan Klasifikasi menggunakan Algoritme KNN Algoritme KNN K-Nearest Neighbor (KNN) termasuk kelompok instance-based-learning. Algoritme ini juga merupakan salah satu teknik lazy learning. KNN dilakukan dengan mencari kelompok k objek dalam data training yang paling dekat (mirip) dengan objek pada data baru atau data testing (Wu dan Kumar 2009). Ada banyak cara mengukur jarak kedekatan antara data baru dengan data lama (data training), diantaranya euclidean distance dan manhattan distance, formula jarak yang paling sering digunakan adalah euclidean distance (Bramer 2007) yaitu: euclidean= (a i -b i ) 2 n i=1 Keterangan: a = (a 1, a 2,, a n ) dan b = (b 1, b 2,, b n ) mewakili n nilai atribut dari 2 record. Langkah-langkah dalam Algoritme K-Nearest Neighbor (Bramer 2007): 1 Menentukan parameter K (jumlah tetangga paling dekat). 2 Menghitung kuadrat jarak euclid (query instance) masing-masing objek terhadap data sampel yang diberikan. 3 Kemudian mengurutkan objek-objek tersebut ke dalam kelompok yang mempunyai jarak euclid terkecil. 4 Mengumpulkan kategori Y (Klasifikasi-Nearest Neighbor), dimana Y merupakan class target. 5 Dengan menggunakan kategori Nearest Neighbor yang paling mayoritas maka didapat objek yang diprediksikan. Tahapan Klasifikasi Pada tahapan ini, data yang sudah dipraproses dan dibagi akan diklasifikasi dengan menggunakan algoritme K-nearest neighbor. Pembentukan tahapan klasifikasi ini menggunakan bahasa pemrograman R dengan package class. Tahapan klasifikasi yang dilakukan dengan memberikan masukan data yang akan dihitung jarak antar datanya. Kemudian dari hasil semua jarak yang telah dilakukan perhitungan, diurutkan dari yang terbesar ke yang terkecil. Setelah itu (1)

23 menentukan nilai k untuk menentukan kelasnya. Jika nilai k sudah ditentukan, class didapat dengan melihat anggota yang paling banyak. Setelah data titik panas diubah dalam bentuk binary barulah dapat dilakukan menghitungan jarak antar data. Dalam ilustrasi ini data training yang digunakan terdiri dari 6 data titik panas (T) dan 4 data bukan titik panas (F). Sedangkan data testing terdiri dari 1 data titik panas. Record data training dapat dilihat pada Tabel 5 dan record data testing dapat dilihat pada Lampiran 14. Perhitungan Akurasi Pada tahap ini, dilakukan perhitungan nilai akurasi dari hasil klasifikasi menggunakan data uji. Akurasi menunjukkan tingkat kebenaran pengklasifikasian data terhadap kelas yang sebenarnya. Nilai akurasi yang baik adalah yang mendekati 100% dan semakin rendah nilai akurasi maka semakin tinggi kesalahan klasifikasi pada data baru. Nilai akurasi didapat berdasarkan data pengujian terhadap hasil klasifikasi. Untuk menghitung akurasi hasil klasifikasi digunakan rumus sebagai berikut: 9 data uji benar diklasifikasi Akurasi= total data uji (2) Jika akurasi sudah mencapai 70% proses dilanjutkan ke tahap validasi data, tetapi jika akurasi kurang dari 70% maka akan kembali ke tahapan klasifikasi menggunakan algoritme KNN. Diperkirakan ada kesalahan dalam perhitungan jarak kedekatan antar objek. Pemilihan Hasil Klasifikasi Terbaik Pada tahapan ini yang dilakukan adalah melihat hasil akurasi Pulau Sumatera dan Kalimantan dari perhitungan akurasi. Masing-masing pulau akan dicari nilai akurasi tertingginya. Akurasi tertinggi untuk Pulau Sumatera dan Kalimantan yang akan digunakan sebagai data training pada proses selanjutnya yaitu hasil klasifikasi terbaik. Pemilihan Data Baru Pada tahapan ini yang dilakukan adalah memilih data baru yang akan digunakan sebagai data testing pada proses selanjutnya yaitu hasil klasifikasi terbaik. Data yang digunakan adalah data baru yang belum pernah digunakan pada tahapan klasifikasi. Untuk data yang digunakan pada penelitian ini adalah data titik panas dan data non titik panas dari 1 Januari 2015 sampai 31 Maret Hasil Klasifikasi Terbaik Pada tahapan ini, dilakukan pengujian menggunakan data baru yang akan digunakan sebagai data testing dan akurasi tertinggi hasil klasifikasi akan digunakan sebagai data training. Dengan demikian, hasil klasifikasi menggunakan data baru dapat digunakan untuk memprediksi titik panas baru berdasarakan jarak kedekatan antar objek.

24 10 Peralatan Penelitian Perangkat lunak yang digunakan dalam penelitian ini adalah: 1 Sistem operasi Windows 7 Home Basic 2 Bahasa pemrograman R dengan packages class. 3 Rstudio version dengan package class digunakan untuk proses klasifikasi menggunakan algoritme KNN. 4 Quantum GIS untuk melihat plot data titik panas dan data bukan titik panas pada lahan gambut. 5 Microsoft Excel digunakan untuk mengubah data dalam bentuk text ke dalam bentuk kolom. 6 Weka digunakan untuk menghilangkan missing value dan mengkonversi data dari nominal ke numeric. 7 PostgreSQL versi 9.1 sebagai sistem manajemen basis data pengolahan kueri data lahan gambut. 8 Notepad ++ digunakan untuk menuliskan code program untuk dijalankan di R. Spesifikasi perangkat keras dan perangkat lunak yang digunakan untuk penelitian ini adalah sebagai berikut:sistem operasi: 1 Processor Intel (R) Core (TM) i3 2370M CPU 2.40GHz 2 RAM 6 GB 3 64 bit Operating system HASIL DAN PEMBAHASAN Pengambilan Data Pada tahapan ini yang dilakukan adalah mencari data. Data yang digunakan terdiri dari 2 data, yaitu data titik panas dan data lahan gambut. Data titik panas didapat dari Nasional Aeronautics and Space Administration (NASA) dengan cara mengunduh, sedangkan data titik panas didapat dari Wetland Internasional Indonesia yang dirasa lengkap. Data lahan gambut sendiri sangat susah didapatkannya, selain itu harganya sangat mahal. Setalah data titik panas yang telah didapat dan data lahan gambut yang telah didapat akan digunakan untuk proses selanjutnya yaitu praproses data. Praproses Data Pada penelitian ini tahapan yang dilakukan yaitu praproses data. Pada tahapan ini akan dilakukan adalah pemisahan data titik panas dari tahun 2001 sampai 2015 yang ada di Pulau Sumatera dan di Pulau Kalimantan. Pemisahan data yang dimaksud adalah mengambil titik panas yang memiliki data titik panas lengkap atau terdapat titik panas setiap bulannya dalam jangka waktu satu tahun. Pemisahan data pada tahapan ini dilakukan dengan menggunakan QuantumGIS. Dari hasil penentuan titik panas di Pulau sumatera dan di Pulau Kalimantan yang lengkap hanya terdapat dari tahun 2001 sampai Jumlah titik panas pertahun di Pulau Sumatera dan di Pulau Kalimantan dapat diilihat pada Gambar 5.

25 11 Gambar 4 Jumlah titik panas pertahun di Sumatera dan Kalimantan Dari Gambar 5 dapat dilihat jumlah titik panas terbanyak untuk kurun waktu 2001 sampai 2014 di Pulau Sumatera terdapat pada tahun 2014, sedangkan di Pulau Kalimantan jumlah titik panas paling banyak terdapat pada tahun Untuk jumlah titik panas paling sedikit di Pulau Sumatera terdapat di tahun 2001, sedangkan di Pulau Kalimantan terdapat di tahun Seleksi Data Titik Panas pada Lahan Gambut Pada tahapan ini yang dilakukan adalah menggabungkan hasil data titik panas Pulau Sumatera dengan data lahan gambut di Pulau Sumatera dan data titik panas di Pulau Kalimantan dengan data lahan gambut di Pulau Kalimantan. Proses penggabungan ini menggunakan Quantum GIS. Proses penggabungan ini tidak dapat dilakukan secara langsung, karena pada proses ini diperlukan kesamaan sistem referensi koordinat untuk data titik panas dengan data lahan gambut yang akan digabungkan. Untuk melihat sistem referensi di Indonesia dapat dilihat pada Gambar 5. Gambar 5 Sistem referensi di Indonesia (Oswald dan Astrini 2012)

26 12 Sistem referensi terbagi menjadi 60 zone, dimana untuk Indonesia terletak pada zone 46 sampai 54. Berdasarkan Gambar 6 Sumatera berada di zona 47 dan 48, namun karena zona 47 lebih banyak maka sistem referensi koordinat yang di pakai adalah ESPG: WGS84/UTM Zone 47N. Untuk Pulau Kalimantan sistem referensi koordinatnya berada pada zone 49 dan 50, namun karena zona 49 lebih banyak maka sistem referensi koordinat yang di pakai adalah ESPG: WGS84/UTM Zone 49N. Proses penggabungan data titik panas dan lahan gambut baru bisa dilakukan setelah sistem referensi disesuaikan dengan aturan zone. Dari hasil penggabungan ini untuk Pulau Sumatera tahun 2007 dapat dilihat pada Gambar 6 dan untuk pulau kalimantan tahun 2007 dapat dilihat pada Gambar 7. Gambar 6 Peta lahan gambut di Pulau Sumatera yang dioverlay dengan titik panas tahun 2007 Gambar 7 Peta lahan gambut di Pulau Sumatera yang dioverlay dengan titik panas tahun 2007

27 Pembuatan Data Non Titik Panas pada Lahan Gambut Pada tahapan ini yang dilakukan adalah menentukan data bukan titik panas yang berada pada lahan gambut di Sumatera dan Kalimantan dengan menggunakan Quantum GIS. Proses ini melibatkan data titik panas pertahun pada lahan gambut di Sumatera dan Kalimantan. Tapi sebelum di buat data bukan tititk panas, dibuat tabel titik panas yang nilai confidence-nya 70. Langkah pertama adalah membuat tabel baru yang terdiri dari gid, the geom, longitude, latitude, acq date, confidence, dan kelas yang berisi titik panas dengan confidence-nya 70. Nilai confidence yang digunakan hanya yang 70, karena memiliki potensi tinggi sebagai kebakaran. Dari data titik panas yang nilai confidence-nya 70 barulah digunakan untuk membuat data bukan titik panas. Untuk mendapatkan data bukan titik panas pada daerah lahan gambut di Sumatera dan Kalimantan dilakukan beberapa proses yaitu pembuatan buffer, disolve, operasi difference, dan pembangkitan random point. Dari proses ini didapat data bukan titik panas pada lahan gambut di Sumatera dan Kalimantan dengan nama false alarm yang akan digunakan sebagai proses klasifikasi. Hasil data bukan titik panas pada lahan gambut di Sumatera untuk tahun 2007 dapat dilihat pada Gambar Gambar 8 Data non titik panas pada lahan gambut di Sumatera untuk tahun 2007 Dari Gambar 8 dapat dilihat sebaran data bukan titik panas pada lahan gambut di Sumatera pada tahun Titik panas muncul pada daerah yang bukan merupakan daerah titik panas. Sebaran data bukan titik panas pada lahan gambut di Kalimantan pada tahun 2007 juga muncul pada daerah yang bukan merupakan daerah titik panas. Data bukan titik panas pada lahan gambut di Kalimantan untuk tahun 2007 dapat dilihat pada Gambar 10.

28 14 Gambar 9 Data non titik panas pada lahan gambut di Kalimantan untuk tahun 2007 Pembuatan Dataset Setelah didapatkan data titik panas pada lahan gambut dan data bukan titik panas pada lahan gambut. Proses selanjutnya adalah menambahkan kolom baru untuk kelas. Pada atribut kelas data titik panas pertahun diberikan isian T atau true dan untuk data bukan titik panas pada gambut akan diisikan F atau false. Proses ini dilakukan menggunakan postgres SQL. Dari proses ini didapat tabel baru yang diberi nama target tahun. Proses ini masih dilakukan menggunakan postgres SQL. Dari data yang telah memiliki nilai confidence 70 selanjutnya akan dibuat dataset1 dan dataset2 menggunakan postgres SQL. Adapun untuk dataset1 berisi data dari tabel lahan gambut dan data target. Atribut data yang ada di dataset1 dapat dilihat pada Tabel 5. Tabel 5 Atribut pada dataset1 No Atribut Tipe 1 Gid Big integer 2 Gid2 Integer 3 The geom Geometri(point) 4 Confidence Integer 5 Legend Character varying(42) 6 Landuse Character varying(60) 7 Ketebalan Character varying(16) Dataset1 digunakan untuk menyimpan informasi yang lebih lengkap yang dapat digunakan untuk melihat letak dari objek dalam peta lahan gambut yang dapat dilakukan di Quantum GIS. Untuk proses klasifikasi di R dibuat dataset2 yang diambil dari data target dan data gambut. Atribut pada dataset2 dapat dilihat pada Tabel 6.

29 15 Tabel 6 Atribut pada dataset2 No Atribut Tipe 1 Legend Character varying(42) 2 Landuse Character varying(60) 3 Ketebalan Character varying(16) 4 Kelas Character Atribut pada Tabel 6 ini hanya untuk Pulau Sumatera, sedangkan untuk Pulau Kalimantan hanya terdiri legend, ketebalan dan kelas. Atribut landuse tidak terdapat pada Pulau Kalimantan karena data yang diberikan dari wetland tidak mencantumkan landuse. Alasan menggunakan data lahan gambut dari wetland, karena data lahan gambut yang lengkap sangat mahal. Sementara itu, wetland bisa memberikan data tanpa harus membayar. Contoh record dalam dataset2 dapat dilihat pada Tabel 7. Tabel 7 Contoh isi tabel dataset2 No Jenis Gambut Tutupan Lahan Kedalaman Kelas 1 Saprists/Hemists(60/40), Hutan rawa D2 F sedang 2 Saprists/Hemists(60/40), Belukar rawa D2 F sedang 3 Saprists/Hemists(60/40), Hutan rawa D2 F dalam 4 Saprists/Hemists(60/40), Hutan rawa D3 F dalam 5 Saprists/Hemists(60/40), Sawah dan kelapa D1 T dalam 6 Saprists/Hemists(60/40), Hutan rawa D4 F sangat dalam 7 Saprists/Hemists(90/10), Hutan rawa D2 F dalam 8 Hemists/Saprists (60/40), Belukar rawa D2 T sedang 9 Hemists/Saprists (60/40), Hutan rawa D2 F sedang 10 Hemists/Saprists (60/40), sangat dalam Hutan rawa D4 T Membuang Missing Value Pada tahapan ini yang dilakukan adalah menentukan jumlah data missing value. Untuk melihat jumlah missing value dapat dilihat dari weka. Setelah didapat data missing value, kemudian menghitung presentase jumlah missing value terhadap data keseluruhan. Untuk data yang memiliki presentase missing value 10% dibuang, karena dianggap tidak memiliki pengaruh yang cukup besar dalam proses klasifikasi. Jumlah missing value di Pulau Sumatera dan di Pulau Kalimantan dapat dilihat pada Tabel 8.

30 16 Tabel 8 Jumlah missing value dataset Sumatera dan Kalimantan Dataset Missing Value Jumlah Titik Panas Presentase (%) Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Sumatera Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Dari Tabel 8 dapat dilihat jumlah missing value tertinggi pada dataset Kalimantan2006 yaitu 460, namun jumlah tersebut hanya 1.51% dibandingkan jumlah datanya yang mencapai Presentase tertinggi ada pada 1.46% tidak lebih dari 10%, jadi semua missing value dihilangkan. Konversi Data Sebelum dataset diolah di R dengan menggunakan model klasifikasi menggunakan algoritme K-Nearest Neighbor diperlukan konversi data, karena KNN hanya bisa memproses data bertipe numeric sedangkan dataset bertipe data nominal. Dataset diubah dari nominal ke dalam bentuk binary agar dapat diproses di R menggunakan algoritme KNN. Perubahan tipe data ini dilakukan oleh Weka. Dari hasil proses ini didapat data berbentuk binary. Contoh data hasil konversi dapat dilihat pada Gambar 10.

31 17 Gambar 10 Data hasil konversi nominal ke binary masih dalam bentuk text Setelah proses konversi data selesai data tidak dapat langsung diolah di R, dikarenakan nama atribut yang menggunakan koma (,) yang seharusnya hanya 1 kolom di dalam R terbaca menjadi 2 kolom. Hal tersebut sangat fatal karena menimbulkan pergeseran data yang berakibat timbul data kosong. Apabila itu terjadi data menjadi tidak akurat lagi. Solusi yang dilakukan yaitu dataset yang sebelumnya dipisahkan dengan koma (,) bukan dalam bentuk kolom diolah dengan Microsoft Excel agar terpisah dengan baik. Pemisahan dataset ini menggunakan fasilitas yang di sediakan oleh Microsoft Excel untuk mengubah text kedalam bentuk kolom. Contoh dataset yang telah diolah di Microsoft Excel dapat dilihat pada Tabel 9. Tabel 9 Data hasil konversi nominal ke binary sudah dalam bentuk kolom No Legend= Saprists/Hemists (60/40), sedang Legend= Saprists/Hemists (60/40), dalam Dari hasil pemisahan data Microsoft Excel yang telah dilakukan harus dilakukan pengecekan ulang. Hal ini dilakukan untuk memastikan data telah sesuai untuk diproses ditahap selanjutnya. Pembagian Data Pembagian data pada pengolahan data di R akan menggunakan 10 fold cros validation. Dengan demikian, 10% dari data akan dijadikan sebagai data uji dan 90% bagian data akan dijadikan data latih. Adapun keseluruhan data dibagi

32 18 menjadi 10 bagian, kemudian dari setiap bagian terbaik akan menjadi data uji dan 9 bagian lainnya akan menjadi data latih. Tahapan Klasifikasi Menggunakan Algoritme K-Nearest Neigbor Setiap record data uji dihitung jaraknya dengan ke setiap record data latih untuk mengetahui ukuran kedekatan antara data uji dengan data latih. Untuk data bertipe numeric, selisih antara data uji dengan data latih adalah pengurangan nilai data uji dengan data latih, selanjutnya ditentukan nilai k tetangga terdekat. Percobaan ini dimulai dengan nilai k dari 1 sampai 19 dengan selang 2 dalam KNN. Pada setiap percobaan dihitung akurasinya untuk k = 1, k = 3, k = 5, k = 7, k = 9, k = 11, k = 13, k = 15, k = 17, dan k = 19. Matrik confusion hasil tahapan klasifikasi dengan KNN Pulau Kalimantan tahun 2003 dengan nilai k=1 dapat dilihat pada Tabel 10. Tabel 10 Matrik confusion pada dataset Pulau Kalimantan tahun 2010 dengan nilai k = 13 Kelas Prediksi Kelas Aktual False True False True Dari matrik confusion dapat dilihat bahwa data yang diprediksi sebagai false atau salah menghasilkan false atau salah adalah 115. Untuk data yang diprediksi sebagai false atau salah menghasilkan true atau benar adalah 21. Untuk data yang diprediksi sebagai true atau benar menghasilkan false atau salah adalah 9. Untuk data yang diprediksi sebagai true atau benar menghasilkan true atau benar adalah 127. Dari hasil matrik confusion ini selanjutnya akan digunakan untuk menghitung nilai akurasi hasil tahapan klasifikasi dengan menggunakan KNN. Namun untuk mendapatkan hasil tahapan klasifikasi menggunakan algoritme KNN ini tidak semua data dapat diolah oleh packages class pada R karena untuk Pulau Sumatera tahun 2002 sampai 2006, 2009, dan 2011 sampai 2014 memiliki jumlah atribut yang sangat banyak. Untuk Pulau Kalimantan tahun 2002, 2004, 2006, 2009, dan 2014 tidak dapat di olah di R karena jumlah data yang terlalu banyak. Perhitungan Akurasi Pada tahapan ini akan dihitung nilai akurasi dari hasil tahapan klasifikasi yang dihasilkan oleh masing masing nilai k. Untuk menghitung nilai akurasi digunakan rumus sebagai berikut: data uji benar diklasifikasi Akurasi= total data uji (3) Dengan menggunakan nilai hasil tahapan klasifikasi menggunakan algoritme KNN yang telah dihasilkan pada proses klasifikasi, selanjutnya dihitung

33 untuk mendapatkan nilai akurasinya. Berdasarkan Tabel 10 akurasi hasil klasifikasi dengan KNN dengan k = 1 adalah Akurasi= =88.97 (3) Perhitungan akurasi dilakukan untuk semua dataset dan semua nilai k. Akurasi tertinggi untuk dataset setiap tahunnya untuk Pulau Sumatera dapat dilihat pada Tabel 11. Tabel 11 Nilai akurasi tertinggi hasil klasifikasi setiap tahun untuk dataset Sumatera Dataset Nilai k Terbaik Akurasi (%) Sumatera Sumatera Sumatera Sumatera Berdasarkan Tabel 11 akurasi yang diperoleh selisihnya tidak terlalu berbeda jauh. Akurasi tertinggi untuk Pulau Sumatera adalah pada Sumatera2010 untuk nilai k = 1. Grafik akurasi untuk dataset Sumatera2010 dapat dilihat pada Gambar 12, sedangkan untuk grafik dataset Sumatera lainnya dapat dilihat pada lampiran. 19 Gambar 11 Grafik akurasi Pulau Sumatera tahun 2010 Dari Gambar 11 dapat dilihat grafik akurasi untuk nilai k = 1 sampai k = 19 yang cenderung menurun. Jumlah tetangga (k) = 1 memiliki akurasi tertinggi untuk dataset Sumatera, jadi untuk pengujian dengan menggunakan dataset Sumatera 2010 menggunakan jumlah tetangga (k) = 1. Akurasi tertinggi untuk dataset setiap tahunnya di Pulau Kalimantan dapat dilihat pada Tabel 13.

34 20 Tabel 12 Akurasi tertinggi hasil klasifikasi setiap tahun untuk dataset Kalimantan Dataset Nilai k Tertinggi Akurasi(%) Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Berdasarkan Tabel 13 akurasi yang diperoleh selisihnya tidak terlalu berbeda jauh. Akurasi tertinggi terdapat pada dataset Kalimantan2001 dengan k = 1, dataset Kalimantan2003 dengan k = 1, dataset Kalimantan2005 dengan nilai k = 1, dan 3, Kalimantan2007 dengan k = 1, dan Kalimantan2011 dengan k = 1. Grafik akurasi untuk jumlah tetangga (k) = 1 sampai (k) = 19 untuk dataset Kalimantan 2005 dapat dilihat pada Gambar 12, sedangkan untuk grafik dataset Kalimantan lainnya dapat dilihat pada lampiran. Gambar 12 Grafik akurasi Pulau Kalimantan tahun 2003 Dari Gambar 12 menunjukkan jumlah tetangga (k) = 1 memiliki akurasi tertinggi. Untuk nilai akurasi k = 3 sampai k = 19 menunjukkan grafik yang cenderung menurun. Walaupun pada k = 7 mengalami kenaikan tetapi kenaikannya tidak lebih tinggi dari akurasi k = 1. Akurasi rata-rata setiap tahun Pulau Sumatera dapat dilihat pada Tabel 13.

35 Tabel 13 Nilai akurasi rata-rata hasil klasifikasi setiap tahun untuk dataset Pulau Sumatera Dataset Akurasi (%) Sumatera Sumatera Sumatera Sumatera Rata-rata Akurasi rata-rata tertinggi untuk Pulau Sumatera adalah 97.10% yaitu pada dataset Sumatera2010. Akurasi rata-rata keseluruhan untuk Pulau Sumatera adalah sebesar 95.20% dan merupakan akurasi rata-rata hasil tahapan klasifikasi dengan algoritme KNN untuk Pulau Sumatera. Akurasi rata-rata setiap tahun untuk Pulau Kalimantan dapat dilihat pada Tabel 14. Tabel 14 Nilai akurasi rata-rata hasil klasifikasi setiap tahun untuk dataset Pulau Kalimantan Dataset Akurasi(%) Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Kalimantan Rata-rata Nilai akurasi tertinggi untuk Pulau Kalimantan adalah 99.79% pada dataset Kalimantan2012. Akurasi rata-rata keseluruhan untuk Pulau Kalimantan adalah sebesar 98.66% dan merupakan akurasi rata-rata tahapan hasil klasifikasi dengan algoritme KNN untuk Pulau Kalimantan. Pemilihan Hasil Klasifikasi Terbaik Setelah dilakukan klasifikasi menggunakan algoritme KNN dan dihitung nilai akurasinya maka akan didapat hasil akurasi tertinggi. Untuk Pulau Sumatera akurasi tertinggi pada dataset pada tahun 2010 dengan nilai k = 1. Akurasi tertinggi untuk Pulau Kalimantan pada dataset tahun 2001, 2007, dan 2011 dengan nilai k = 1, sedangkan dataset tahun 2005 pada k = 1 dan k = 3. Pemilihan Data Baru Pada tahapan ini yang dilakukan adalah memilih data baru yang akan digunakan sebagai data testing. Untuk data yang digunakan pada penelitian ini adalah data titik panas dan data non titik panas dari 1 Januari 2015 sampai 31 Maret

36 22 Hasil Klasifikasi Terbaik Pada tahapan ini, dilakukan pengujian menggunakan data titik panas pada tahun 2015 yang akan digunakan sebagai data testing dan dataset Kalimantan tahun 2005 sebagai data training, karena dataset Kalimantan 2005 merupakan salah satu hasil tahapan klasifikasi tertinggi untuk Pulau Kalimantan. Dari hasil pengujian menggunakan hasil tahapan klasifikasi menggunakan KNN dengan k = 1 dapat dilihat hasil matrik confusion pada Tabel 15. Untuk pengujian menggunakan hasil tahapan klasifikasi menggunakan KNN dengan k = 3 dapat dilihat hasil matrik confusion pada Tabel 16. Tabel 15 Matrik confusion di R untuk data baru Kalimantan 2015 dengan k = 1 Kelas Prediksi Kelas Aktual False True False 76 1 True 0 23 Tabel 16 Matrik confusion di R untuk data baru Kalimantan tahun 2015 dengan k = 3 Kelas Prediksi Kelas Aktual False True False 76 1 True 0 23 Hasil matrik confusion untuk k = 1 dan k = 3 menghasilkan nilai yang sama. Klasifikasi menggunakan KNN menunjukan dapat memprediksi data bukan titik panas pada lahan gambut benar sebagai data bukan titik panas pada lahan gambut dan dapat memprediksi data titik panas pada lahan gambut benar sebagai data titik panas pada lahan gambut. Untuk mendapatkan nilai akurasi dari hasil pengujian menggunakan data titik panas tahun 2015, maka dilakukan penghitungan menggunakan rumus akurasi. Berdasarkan Tabel 15 dan Tabel 16 akurasi hasil tahapan klasifikasi dengan k = 1 dan k = 3 adalah Akurasi= =99% (5) Akurasi hasil tahapan klasifikasi menggunakan KNN untuk dataset Kalimantan2005 yang dijadikan data training dan data titik panas tahun 2015 sebagai data testing adalah 99%. Untuk jumlah tetangga terdekat (k) = 1 dan (k) = 3 mempunyai akurasi yang sama, jadi akurasi hasil tahapan klasifikasi menggunakan KNN untuk data baru adalah 99%. Hasil tahapan klasifikasi tertinggi untuk Pulau Sumatera tidak dapat digunakan sebagai data training untuk data titik panas di Sumatera tahun 2015 karena jumlah atribut yang berbeda antara data tahun 2015 dengan data tertinggi hasil klasifikasi sehingga tidak dapat diproses di R.

37 23 SIMPULAN DAN SARAN Simpulan Algoritme KNN dapat digunakan untuk klasifikasi kemunculan titik panas di Pulau Sumatera dengan nilai akurasi tertinggi adalah 99.15% pada tahun 2010 dengan jumlah tetangga (k) = 1. Untuk dataset Pulau Kalimantan nilai akurasi tertinggi adalah 100% pada tahun 2001, 2003, 2007, dan 2011 dengan nilai k = 1 sedangkan untuk tahun 2005 dengan nilai k = 1 dan k = 3. Akurasi rata-rata hasil klasifikasi dengan algoritme KNN dengan jumlah perulangan k sebanyak 10 untuk Pulau Sumatera adalah 95.20% dan untuk Pulau Kalimantan adalah 98.66%. Hasil klasifikasi menggunakan KNN dengan dataset Kalimantan tahun 2005 sebagai data traning dan dataset Kalimantan tahun 2015 sebagai data testing menghasilkan nilai akurasi 99%. Saran Untuk penelitian selanjutnya, dapat pengembangan aplikasi berbasis web untuk memudahkan dalam memprediksi kemunculan titik panas pada lahan gambut berdasarkan jarak kedekatan objek pada lahan gambut dapat diketahui secara cepat. DAFTAR PUSTAKA Bramer M Principles of Data Mining. London: Springer. Ernawati I Prediksi status keaktifan studi mahasiswa dengan algoritma C5.0 dan k-nearest neigbor [skripsi]. Bogor (ID): Institut Pertanian Bogor. Fernando V, Sitanggang IS Klasifikasi data spasial untuk kemunculan hotspot di Provinsi Riau menggunakan algoritme ID3. Integrasi Sains MIPA untuk Mengatasi Masalah Pangan, Energi, Kesehatan, Reklamasi, dan Lingkungan. Bogor, Indonesia. Bogor (ID): SEMIRATA, pp ISBN: Oswald P, Astrini R Tutorial QuantumGIS Tingkat Dasar Versi Lisboa. Mataram (ID): GIZ Decentralization as Contribution to Good Governance (DeCGG). Sitanggang IS, Yaakob R, Mustapha N, Ainuddin AN Appclication of classification algorithms in data mining for hotspots occurrence prediction in Riau Province Indonesia dalam: JATIT 43(2), pp ISSN: Sitanggang IS Penggunaan teknik data mining dalam pemodelan resiko terjadinya kebakaran hutan. Peran Teknologi Informasi dalam Menghadapi Pasar Global China-ASEAN Bogor, Indonesia. Bogor (ID): HIPI, pp ISBN: Suwanto A, Maas A, Sutaryo D, Wijaya DY, Sartono D, Achsani H, Komarsa, Hastuti S, Soli TI. Profil Ekosistem Gambut di Indonesia. Jakarta (ID).Wibowo, P dan N Suyatno An Overview of Indonesian Wetlands Sites II. Wetlands Internationa Indonesia Programme (WI-IP). Wu X, Kumar V The top ten algorithms in data mining. CRC Press Taylor dan Francis Group: Boca Raton London.

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME RANDOM FOREST RESA RUKMIGAYATRI

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME RANDOM FOREST RESA RUKMIGAYATRI KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME RANDOM FOREST RESA RUKMIGAYATRI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME NAIVE BAYES YEVILINA AULIA RIZKA

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME NAIVE BAYES YEVILINA AULIA RIZKA KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME NAIVE BAYES YEVILINA AULIA RIZKA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA

ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi 4 Perangkat keras berupa Notebook: Processor intel Core i3 2.2 GHz. RAM kapasitas 2. GB. Harddisk Kapasitas 5 GB. Monitor pada resolusi 1366 x 768 piksel. Merek Acer Aspire 475. Perangkat lunak berupa:

Lebih terperinci

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA ISSN : 2338-4018 PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA Agus Panoto ( ragilpanoto@gmail.com ) Yustina Retno Wahyu Utami ( yustina.retno@gmail.com

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

BAB 4 IMPLEMENTASI DAN PENGUJIAN

BAB 4 IMPLEMENTASI DAN PENGUJIAN BAB 4 IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Tahap implementasi merupakan tahap pengimplementasian metode kedalam perangkat lunak simulasi, tahap lanjut dari tahap perancangan simulasi di bab sebelumnya.

Lebih terperinci

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN

Lebih terperinci

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : BAB 3 METODE PENELITIAN 3.1 Instrumen Penelitian Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : 3.1.1 Bahan Bahan yang digunakan dalam penelitian ini yaitu data siswa kelas SMA

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN METODE PENELITIAN Proses Dasar Sistem Proses dasar pengembangan sistem secara umum terdiri dari tahapan sebagai berikut: 1 Praproses. Pada tahap ini dilakukan persiapan yang meliputi seleksi data, transformasi

Lebih terperinci

Spatio-Temporal Clustering Hotspot di Sumatera Selatan Tahun Menggunakan Algoritme ST-DBSCAN dan Bahasa Pemrograman R

Spatio-Temporal Clustering Hotspot di Sumatera Selatan Tahun Menggunakan Algoritme ST-DBSCAN dan Bahasa Pemrograman R Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 3 Nomor 2 halaman 112-121 ISSN: 2089-6026 Spatio-Temporal Clustering Hotspot di Sumatera Selatan Tahun 2002-2003 Menggunakan Algoritme

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

3 METODOLOGI PENELITIAN

3 METODOLOGI PENELITIAN 19 3 METODOLOGI PENELITIAN 3.1. Kerangka Berpikir Kebakaran hutan yang sering terjadi di Indonesia berkaitan erat dengan dua faktor utama yaitu faktor alam dan faktor manusia. Kemungkinan terdapat karakteristik

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT Ahmad Khusaeri 1, Septian Ilham 2, Desi Nurhasanah 3, Derrenz Delpidat 4, Anggri 5, Aji Primajaya 6, Betha Nurina

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1  Abstract Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian 3 Ruang Lingkup Penelitian 1. Teknik yang digunakan dalam membentuk clustering titik panas adalah DBSCAN. 2. Data yang digunakan pada penelitian ini adalah data titik panas kebakaran hutan di Indonesia

Lebih terperinci

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO ANALISIS PERBANDINGAN PROSES CLUSTER MENGGUNAKAN K- MEANS CLUSTERING DAN K-NEAREST NEIGHBOR PADA PENYAKIT DIABETES MELLITUS SKRIPSI RONNY BENEDIKTUS SIRINGORINGO 131421021 PROGRAM STUDI S1 ILMU KOMPUTER

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

emrrata MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI

emrrata MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI A 181 S. 2014 emrrata SEMIRATA 2014 Bidang MIPA BKS-PTN-Barat "Integrasi sains MIPA untuk mengatasi masalah pangan, energi, kesehatan, reklamasi, dan lingkungan" IPB International Convention Center dan

Lebih terperinci

APLIKASI SEQUENTIAL PATTERN MINING PADA DATA TITIK PANAS DI LAHAN GAMBUT SUMATRA DAN KALIMANTAN AIZUL FADIN

APLIKASI SEQUENTIAL PATTERN MINING PADA DATA TITIK PANAS DI LAHAN GAMBUT SUMATRA DAN KALIMANTAN AIZUL FADIN APLIKASI SEQUENTIAL PATTERN MINING PADA DATA TITIK PANAS DI LAHAN GAMBUT SUMATRA DAN KALIMANTAN AIZUL FADIN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

Tabel 2 Jumlah data prosedur uji. Crop Variable. Jumlah data LAI 104 SPAD 105 yield 64 LAI 104 SPAD 105 yield 64 LAI 62 SPAD 63 yield 34.

Tabel 2 Jumlah data prosedur uji. Crop Variable. Jumlah data LAI 104 SPAD 105 yield 64 LAI 104 SPAD 105 yield 64 LAI 62 SPAD 63 yield 34. 2. Cross validation 5 fold dengan pemisahan data Indramayu dan, menggunakan data berikut: 3. Supplied test set : training:, testing: Hymap training:, testing: Hymap 4. Percentage split dengan data training

Lebih terperinci

POLA SEKUENSIAL KEMUNCULAN TITIK PANAS BERDASARKAN DATA CUACA DI PROVINSI RIAU TRIA AGUSTINA

POLA SEKUENSIAL KEMUNCULAN TITIK PANAS BERDASARKAN DATA CUACA DI PROVINSI RIAU TRIA AGUSTINA POLA SEKUENSIAL KEMUNCULAN TITIK PANAS BERDASARKAN DATA CUACA DI PROVINSI RIAU TRIA AGUSTINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

DETEKSI PENCILAN PADA DATA TITIK PANAS MENGGUNAKAN CLUSTERING BERBASIS MEDOIDS MOHAMAD BENTAR CAHYADAHRENA

DETEKSI PENCILAN PADA DATA TITIK PANAS MENGGUNAKAN CLUSTERING BERBASIS MEDOIDS MOHAMAD BENTAR CAHYADAHRENA i DETEKSI PENCILAN PADA DATA TITIK PANAS MENGGUNAKAN CLUSTERING BERBASIS MEDOIDS MOHAMAD BENTAR CAHYADAHRENA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:

Lebih terperinci

MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI

MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI SEMIRATA 2014 Bidang MIPA BKS-PTN-Barat "Integrasi sains MIPA untuk mengatasl masalah pangan, energi, kesehatan, reklamasi, dan lingkungan'' IPB International Convention Center dan Kampus IPB Baranangsiang,

Lebih terperinci

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG TESIS IVAN JAYA 117038072 PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS

Lebih terperinci

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4.

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4. SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5 KHAIRIL AMRI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

Apa itu is K-Nearest Neighbor (KNN) Algorithm? K-Nearest Neighbor Pendahuluan K-Nearest Neighbour atau KNN adalah salah dari algoritma instance based learning atau case-based reasoning. Definisi case based reasoning: KNN digunakan dalam banyak aplikasi

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining. Modul Praktikum WEKA Yudi Wibisono (e: yudi@upi.edu ); t: @yudiwbs Ilmu Komputer Universitas Pendidikan Indonesia (cs.upi.edu) Versi BETA : Oktober 2013 http://creativecommons.org/licenses/by-nc-sa/3.0/

Lebih terperinci

KATA PENGANTAR Aplikasi Penginderaan Jauh dalam Mendeteksi Kebakaran Hutan Menggunakan Citra Satelit Landsat

KATA PENGANTAR Aplikasi Penginderaan Jauh dalam Mendeteksi Kebakaran Hutan Menggunakan Citra Satelit Landsat KATA PENGANTAR Puji syukur penulis panjatkan kehadirat Ida Sang Hyang Widhi Wasa/Tuhan Yang Maha Esa, karena atas berkat dan rahmat-nya, penulis dapat menyelesaikan tugas akhir dengan judul Aplikasi Penginderaan

Lebih terperinci

KLASIFIKASI TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME ID3 SPASIAL YANG DIPERLUAS YAUMIL KHOIRIYAH

KLASIFIKASI TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME ID3 SPASIAL YANG DIPERLUAS YAUMIL KHOIRIYAH KLASIFIKASI TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME ID3 SPASIAL YANG DIPERLUAS YAUMIL KHOIRIYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor PENGENALAN KADAR TOTAL PADAT TERLARUT PADA BUAH BELIMBING BERDASAR CITRA RED-GREEN-BLUE MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS (PCA) SEBAGAI EKSTRAKSI CIRI DAN KLASIFIKASI K-NEAREST NEIGHBORHOOD (KNN)

Lebih terperinci

III. METODE PENELITIAN

III. METODE PENELITIAN III. METODE PENELITIAN A. Lokasi dan Waktu Penelitian ini dilakukan pada daerah kajian Provinsi Kalimantan Barat. Pengolahan dan analisis data dilakukan di Laboratorium Fisik Remote Sensing dan Sistem

Lebih terperinci

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2. 6 tahap ini, pola yang telah ditemukan dipresentasikan ke pengguna dengan teknik visualisasi agar pengguna dapat memahaminya. Deskripsi aturan klasifikasi akan dipresentasikan dalam bentuk aturan logika

Lebih terperinci

SPETINDO, Sistem Pendukung Keputusan Pembudidayaan Tanaman Menggunakan Algoritma Quantum Swarm Evolutionary

SPETINDO, Sistem Pendukung Keputusan Pembudidayaan Tanaman Menggunakan Algoritma Quantum Swarm Evolutionary SPETINDO, Sistem Pendukung Keputusan Pembudidayaan Tanaman Menggunakan Algoritma Quantum Swarm Evolutionary Eka Ayu Puspitaningrum 5109100176 Dosen Pembimbing UMI LAILI YUHANA, S.Kom., M.Sc. WIJAYANTI

Lebih terperinci

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI Disusun Oleh : ATIKA ELSADINING TYAS 24010211120013 JURUSAN STATISTIKA

Lebih terperinci

EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING

EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING Oleh: Yuandri Trisaputra G64120004 2012 Oktarina Safar Nida G14120052 2012 INSTITUT PERTANIAN BOGOR BOGOR 2016

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

BAB I PENDAHULUAN. Kota Medan sebagai Ibukota Provinsi Sumatera Utara adalah sebagai pusat

BAB I PENDAHULUAN. Kota Medan sebagai Ibukota Provinsi Sumatera Utara adalah sebagai pusat BAB I PENDAHULUAN I.1. Latar Belakang Kota Medan sebagai Ibukota Provinsi Sumatera Utara adalah sebagai pusat kegiatan pemerintahan, sosial politik, pendidikan dan kebudayaan. Keberadaan fasilitas pendidikan

Lebih terperinci

APLIKASI KONSEP EKOWISATA DALAM PERENCANAAN ZONA PEMANFAATAN TAMAN NASIONAL UNTUK PARIWISATA DENGAN PENDEKATAN RUANG

APLIKASI KONSEP EKOWISATA DALAM PERENCANAAN ZONA PEMANFAATAN TAMAN NASIONAL UNTUK PARIWISATA DENGAN PENDEKATAN RUANG APLIKASI KONSEP EKOWISATA DALAM PERENCANAAN ZONA PEMANFAATAN TAMAN NASIONAL UNTUK PARIWISATA DENGAN PENDEKATAN RUANG (Studi Kasus Wilayah Seksi Bungan Kawasan Taman Nasional Betung Kerihun di Provinsi

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Metode Penelitian Penelitian mengenai peningkatan kecepatan prediksi produksi susu sapi ini menggunakan metode eksperimen dengan metode sebagai berikut: a. Pengumpulan data

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO

ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO ANALISIS PENYAKIT PARU-PARU MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORS PADA RUMAH SAKIT ALOEI SABOE KOTA GORONTALO Olha Musa 1 dan Alang 2 1 0lh4mu54@gmail.com, 2 virus.stimik@gmail.com 12 STMIK Ichsan

Lebih terperinci

ABSTRAK. Kata Kunci: kebakaran hutan, penginderaan jauh, satelit Landsat, brightness temperature

ABSTRAK. Kata Kunci: kebakaran hutan, penginderaan jauh, satelit Landsat, brightness temperature ABSTRAK Indonesia sebagai negara kepulauan memiliki hamparan hutan yang luas tidak terlepas dengan adanya masalah-masalah lingkungan yang dihasilkan, khususnya kebakaran hutan. Salah satu teknologi yang

Lebih terperinci

ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS

ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS ANALISIS GRAFOLOGI BERDASARKAN HURUF a DAN t MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR AMANDA KARATIKA HUBEIS DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 1, Januari 2018, hlm. 184-189 http://j-ptiik.ub.ac.id Klasifikasi Standar Produk Baja PT. Krakatau Steel (Persero)

Lebih terperinci

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh : ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI Oleh : Frista Yulianora 1401128832 Muchammad Hasbi Latif 1401136065 Rika Jubel Febriana

Lebih terperinci

DATA DAN METODE Data

DATA DAN METODE Data DATA DAN METODE Data Sumber data yang digunakan dalam penelitian berasal dari data mahasiswa tahun angkatan 2000 sampai dengan 2005, dan dari tiga program studi yaitu S1- Sistem Informasi, S1-Teknik Informatika,

Lebih terperinci

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Salah satu persoalan lingkungan yang muncul hampir setiap tahun di Indonesia terutama pasca tahun 2000 adalah kebakaran hutan, termasuk di wilayah provinsi Riau. Kebakaran hutan

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada bab ini akan dibahas teori yang berkaitan dengan pemrosesan data untuk sistem pengenalan gender pada skripsi ini, meliputi cropping dan resizing ukuran citra, konversi citra

Lebih terperinci

PENERAPAN ALGORITMA K-NEARST NEIGHBOR PADA NUPTK UNTUK PREDIKSI PESERTA SERTIFIKASI GURU

PENERAPAN ALGORITMA K-NEARST NEIGHBOR PADA NUPTK UNTUK PREDIKSI PESERTA SERTIFIKASI GURU PENERAPAN ALGORITMA K-NEARST NEIGHBOR PADA NUPTK UNTUK PREDIKSI PESERTA SERTIFIKASI GURU THE APPLICATION OF K-NEAREST NEIGHBOR ALGORITHM ON NUPTK FOR PARTICIPANTS PREDICTION TEACHER CERTIFICATION 1 Dena

Lebih terperinci

HASIL DAN PEMBAHASAN Praproses Data Clustering

HASIL DAN PEMBAHASAN Praproses Data Clustering Perangkat lunak: Sistem operasi: Windows XP Home Edition, WEKA versi 3.5.7, ArcView GIS 3.3, Map Server For Windows (ms4w) 2.3.1 Chameleon 2.4.1 Perangkat keras: Prosessor intel Pentium 4 ~2GHz Memory

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-534

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-534 JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-534 Rancang Bangun Sistem Navigasi Indoor Berbasis Integrasi Symbolik Location Model dan Wifi Based Positioning System Untuk

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM V.1 Lingkungan Implementasi Lingkungan implementasi meliputi lingkungan perangkat keras (hardware) dan lingkungan perangkat lunak (software) yang digunakan pada

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

PEMBUATAN SPATIAL DECISION TREE MENGGUNAKAN ALGORITME NBTREE UNTUK PERSEBARAN HOTSPOT DI PROVINSI RIAU PRITASARI PALUPININGSIH

PEMBUATAN SPATIAL DECISION TREE MENGGUNAKAN ALGORITME NBTREE UNTUK PERSEBARAN HOTSPOT DI PROVINSI RIAU PRITASARI PALUPININGSIH PEMBUATAN SPATIAL DECISION TREE MENGGUNAKAN ALGORITME NBTREE UNTUK PERSEBARAN HOTSPOT DI PROVINSI RIAU PRITASARI PALUPININGSIH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

Analisis Kinerja Struktur Data Kd-Tree Pada Metode K-Nearest Neighbors

Analisis Kinerja Struktur Data Kd-Tree Pada Metode K-Nearest Neighbors Riau Journal of Computer Science Vol.2 No.2 Tahun 2016 : 1-6 1 Analisis Kinerja Struktur Data Kd-Tree Pada Metode K-Nearest Neighbors Yuan Lukito Program Studi Teknik Informatika, Fakultas Teknologi Informasi

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Menentukan posisi seseorang dalam konteks outdoor dapat dengan mudah dilakukan menggunakan Global Positioning System (GPS). Namun, belum ada metode standar tertentu

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada bab ini akan dijelaskan tahap-tahap yang dilakukan dalam melakukan penelitian. Tahapan penelitian berguna agar pelaksanaan penelitian dapat berjalan dengan baik dan sistematis

Lebih terperinci

K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI

K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster) Volume 07, No. 1 (2018), hal 9-14. K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA Susanti, Shantika Martha, Evy Sulistianingsih INTISARI Missing data

Lebih terperinci

Analisa Kesesuaian Lahan Dan Potensi Perkebunan Kelapa Sawit di Kabupaten Tanah Laut Menggunakan Sistem Informasi Geografis

Analisa Kesesuaian Lahan Dan Potensi Perkebunan Kelapa Sawit di Kabupaten Tanah Laut Menggunakan Sistem Informasi Geografis Analisa Kesesuaian Lahan Dan Potensi Perkebunan Kelapa Sawit di Kabupaten Tanah Laut Menggunakan Sistem Informasi Geografis Widiarti 1 dan Nurlina 2 Abstrak: Kalimantan Selatan mempunyai potensi untuk

Lebih terperinci

ANALISIS TRAYEKTORI KABUT ASAP DARI KEBAKARAN LAHAN GAMBUT DI PROVINSI RIAU MENGGUNAKAN ALGORITME CLUSTERING DBSCAN DAN K-MEANS HAMIDATUL KHAIRAT

ANALISIS TRAYEKTORI KABUT ASAP DARI KEBAKARAN LAHAN GAMBUT DI PROVINSI RIAU MENGGUNAKAN ALGORITME CLUSTERING DBSCAN DAN K-MEANS HAMIDATUL KHAIRAT ANALISIS TRAYEKTORI KABUT ASAP DARI KEBAKARAN LAHAN GAMBUT DI PROVINSI RIAU MENGGUNAKAN ALGORITME CLUSTERING DBSCAN DAN K-MEANS HAMIDATUL KHAIRAT DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Bab III METODOLOGI PENELITIAN. Pada penelitian ini menggunakan ala penelitian berupa perangkat keras

Bab III METODOLOGI PENELITIAN. Pada penelitian ini menggunakan ala penelitian berupa perangkat keras Bab III METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan ala penelitian berupa perangkat keras dan perangkat lunak, yaitu: a. Perangkat keras 1. Processor Intel Core

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Defenisi Sistem Menurut (Marimin, 2004) yang dikutip oleh (Febrealty, 2011) sistem adalah suatu kesatuan usaha yang terdiri dari bagian-bagian yang berkaitan satu sama lain yang

Lebih terperinci

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, BAB II TINJAUAN PUSTAKA 2.1 Terdahulu Dalam penelitian ini, peneliti juga menyertakan beberapa uraian singkat mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, klasifikasi, metode

Lebih terperinci

KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME POHON KEPUTUSAN BERBASIS SPATIAL ENTROPY INDRY DESSY NURPRATAMI

KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME POHON KEPUTUSAN BERBASIS SPATIAL ENTROPY INDRY DESSY NURPRATAMI KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME POHON KEPUTUSAN BERBASIS SPATIAL ENTROPY INDRY DESSY NURPRATAMI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

KLASIFIKASI GAMBAR GERAK PEMAIN BOLA VOLI DENGAN MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

KLASIFIKASI GAMBAR GERAK PEMAIN BOLA VOLI DENGAN MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) KLASIFIKASI GAMBAR GERAK PEMAIN BOLA VOLI DENGAN MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) Edis Siswanto Karo Karo,Dr. Pulung Nurtantio Andono, S.T.,M.KOM Program Studi Teknik Informatika, Fakultas

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 40 BAB III METODOLOGI PENELITIAN 3.1 DESAIN PENELITIAN Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian

Lebih terperinci

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Jurnal Teknik Komputer Unikom Komputika Volume 3, No.2-2014 TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Selvia Lorena Br Ginting 1), Wendi Zarman

Lebih terperinci

PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB)

PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB) JIMT Vol. 12 No. 2 Desember 2016 (Hal 115-124) ISSN : 2450 766X PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB) Nurfajri 1,

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci