KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME RANDOM FOREST RESA RUKMIGAYATRI

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME RANDOM FOREST RESA RUKMIGAYATRI"

Transkripsi

1 KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME RANDOM FOREST RESA RUKMIGAYATRI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Prediksi Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan Algoritme Random Forest adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir skripsi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Desember 2015 Resa Rukmigayatri NIM G

4 ABSTRAK RESA RUKMIGAYATRI. Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan Algoritme Random Forest. Dibimbing oleh IMAS SUKAESIH SITANGGANG. Pengelolaan lahan gambut dengan menanam jenis tanaman yang tidak sesuai karakteristik lahan gambut serta kebakaran menyebabkan lahan gambut mengalami degradasi. Titik panas merupakan suatu indikator kebakaran hutan dan lahan. Meskipun tidak semua titik panas diindikasikan sebagai kebakaran. Kemungkinan kemunculan titik panas dapat diprediksi berdasarkan karakteristik lahan gambut. Penelitian ini mengembangkan model klasifikasi dari kemunculan titik panas pada lahan gambut di Sumatera dan Kalimantan pada periode 2001 sampai 2014 menggunakan algoritme Random Forest. Algoritme ini merupakan pengembangan dari Classification and Regression Tree (CART). Penerapan algoritme Random Forest pada dataset menghasilkan akurasi rata-rata model klasifikasi tahun 2001 untuk dataset Sumatera sebesar 87.40% dan 72.50% untuk dataset Kalimantan. Penerapan algoritme Random Forest pada data baru tahun 2015 menggunakan model tahun Hasil penerapan algoritme Random Forest dalam mengklasifikasikan titik panas pada lahan gambut di Sumatera tahun 2015 adalah 60.80% dan akurasi pada data baru di Kalimantan tahun 2015 adalah 39.13%. Kata kunci: model prediksi, random forest, titik panas ABSTRACT RESA RUKMIGAYATRI. Classification for Hotspot Occurences on Peatland in Sumatera and Kalimantan Using Random Forest Algorithm. Supervised by IMAS SUKAESIH SITANGGANG. Peatland management by planting inappropriate plant with the characteristic of peatland and fire cause peatland degradation. A hotspot is an indicator of forest and land fires. However not all of the hotspot is indicated as fires. The possibility of hotspot occurrences can be predicted based on characteristics of peatland. This research developed a classification model of hotspots occurences on peatlands in Sumatera and Kalimantan in the period 2001 to 2014 using the Random Forest algorithm. This algorithm is an improvement of Classification and Regression Tree (CART). The implementation of the Random Forest algorithm on datasets result in an average accuracy of classification models in 2001 is 87.40% for Sumatera and % for Kalimantan. The implementation using Random Forest algorithm on new data in 2015 using model of Random Forest algorithm result in classifying the hotspot in the peatland in Sumatera in 2015 was 60.80% and the accuracy of new data in Kalimantan in 2015 was 39.13%. Keywords: hotspots, prediction models, random forest

5 KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME RANDOM FOREST RESA RUKMIGAYATRI Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

6 Penguji : 1 Husnul Khotimah, SKomp MKom 2 Muhammad Asyhar Agmalaro, SSi MKom

7 Judul Skripsi : Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan Algortime Random Forest Nama : Resa Rukmigayatri NIM : G Disetujui oleh Dr Imas Sukaesih Sitanggang, SSiMKom Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Puji dan syukur penulis panjatkan kepada Allah Subhana wa ta'ala.shalawat serta salam semoga senantiasa dilimpahkan kepada Nabi Muhammad, keluarganya, sahabatnya, dan kepada kita yang selau berusaha menggapai ridha Allah. Alhamdulillah atas bimbingan dan petunjuk dari Allah Subhana wa ta'alaserta bimbingan dari semua pihak, penyusunan tugas akhir yang berjudul Klasifikasi Kemunculan Titik Panas pada Lahan Gambut di Sumatera dan Kalimantan Menggunakan Algoritme Random Forest dapat diselesaikan. Tugas akhir ini tidak mungkin dapat diselesaikan tanpa adanya bantuan dari berbagai pihak. Oleh karena itu, penulis ingin mengucapkan terimakasih dan penghargaan yang setinggi-tingginya kepada: Papa (Sabari Maryono), Mama (Aida Refni), adik-adikku Niken Safitri dan Wahyu Agung Wicaksono, serta keluarga yang selalu mendoakan, memberi nasihat, kasih sayang, semangat, dan dukungan sehingga penelitian ini bisa diselelsaikan. Ibu Dr Imas Sukaesih Sitanggang, SSi MKom selaku pembimbing yang telah memberi saran, masukan dan ide-ide dalam penelitian ini. Ibu Husnul Khotimah, Skomp Mkom dan Bapak Muhammad Asyhar Agmalaro, Ssi MKom sebagai penguji. Pihak Wetlands International yang telah memberikan izin untuk menggunakan data lahan gambut Sumatera dan Kalimantan. Teman seperjuangan elin, fitri, dan dhita yang telah memberikan semangat dan masukan. Departemen Ilmu Komputer IPB, staf dan dosen yang telah banyak membantu selama masa perkuliahan hingga penelitian. Semoga penelitian ini bermanfaat. Bogor, Desember 2015 Resa Rukmigayatri

9 DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 1 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 2 METODE 2 Data Penelitian 2 Tahapan Penelitian 5 Pengumpulan Data 5 Praproses Data 6 Pembagian Data 6 Pembuatan Model Klasifikasi Menggunakan Algoritme Random Forest 6 Perhitungan Akurasi 8 Penerapan pada Model Data Baru 8 Peralatan Penelitian 8 HASIL DAN PEMBAHASAN 8 Praproses Data 8 Pembagian Data 12 Pembuatan model klasifikasi menggunakan algoritme Random Forest 12 Perhitungan Akurasi 14 Penerapan pada Model Data Baru 14 SIMPULAN DAN SARAN 15 Simpulan 15 Saran 15 DAFTAR PUSTAKA 16 RIWAYAT HIDUP 32

10 DAFTAR TABEL 1 Atribut dari titik panas 2 2 Luas tipe lahan gambut di Sumatera 4 3 Luas tipe lahan gambut di Kalimantan 5 4 Akurasi rata-rata model klasifikasi untuk dataset tahun 2001 sampai Model klasifikasi terbaik pada datast Sumatera tahun Model klasifikasi terbaik pada datast Kalimantan tahun Confusion matrix untuk klasifikasi pada data Sumatera tahun Confusion matrix untuk klasifikasi pada data Kalimantan tahun DAFTAR GAMBAR 1 Lahan gambut di Sumatera 3 2 Lahan gambut di Kalimantan 3 3 Tahapan metode penelitian 5 4 Arsitektur umum Random Forest (Verikas et al.2011) 7 5 Zona sistem koordinat di Indonesia (Oswald dan Astrini 2012) 9 6 Jumlah titik panas per tahun 10 7 Hasil buffer titik panas 10 8 Hasil pembangkitan random point (non titik panas) disekitar titik panas 11 DAFTAR LAMPIRAN 1 Lampiran 1 Akurasi model dataset pulau Sumatera tahun Lampiran 2 Akurasi model dataset pulau Sumatera tahun Lampiran 3 Akurasi model dataset pulau Sumatera tahun Lampiran 4 Akurasi model dataset pulau Sumatera tahun Lampiran 5 Akurasi model dataset pulau Sumatera tahun Lampiran 6 Akurasi model dataset pulau Sumatera tahun Lampiran 7 Akurasi model dataset pulau Sumatera tahun Lampiran 8 Akurasi model dataset pulau Sumatera tahun Lampiran 9 Akurasi model dataset pulau Sumatera tahun Lampiran 10 Akurasi model dataset pulau Sumatera tahun Lampiran 11 Akurasi model dataset pulau Sumatera tahun Lampiran 12 Akurasi model dataset pulau Sumatera tahun Lampiran 13 Akurasi model dataset pulau Sumatera tahun Lampiran 14 Akurasi model dataset pulau Sumatera tahun Lampiran 15 Akurasi model dataset pulau Kalimantan tahun Lampiran 16 Akurasi model dataset pulau Kalimantan tahun Lampiran 17 Akurasi model dataset pulau Kalimantan tahun Lampiran 18 Akurasi model dataset pulau Kalimantan tahun

11 19 Lampiran 19 Akurasi model dataset pulau Kalimantan tahun Lampiran 20 Akurasi model dataset pulau Kalimantan tahun Lampiran 21 Akurasi model dataset pulau Kalimantan tahun Lampiran 22 Akurasi model dataset pulau Kalimantan tahun Lampiran 23 Akurasi model dataset pulau Kalimantan tahun Lampiran 24 Akurasi model dataset pulau Kalimantan tahun Lampiran 25 Akurasi model dataset pulau Kalimantan tahun Lampiran 26 Akurasi model dataset pulau Kalimantan tahun Lampiran 27 Akurasi model dataset pulau Kalimantan tahun Lampiran 28 Akurasi model dataset pulau Kalimantan tahun Lampiran 29 Contoh dataset sederhana Kalimantan 26

12

13 PENDAHULUAN Latar Belakang Indonesia merupakan negara yang mempunyai lahan gambut seluas Ha (Suwanto et al.2010). Penyebaran lahan gambut tersebut meliputi pulau Sumatera, Kalimantan, Sulawesi, Papua, dan Jawa. Gambut adalah material organik yang terbentuk dari sisa-sisa tumbuhan yang telah mengalami dekomposisi dan terakumulasi di daerah rawa atau genangan air (Suwanto et al.2010). Kemampuan gambut dalam menyerap air relatif tinggi, oleh karena itu lahan gambut alaminya tidak mudah terbakar. Namun, keseimbangan ekologis dapat terganggu dengan adanya konversi lahan atau pembuatan kanal. Pada musim kemarau, kondisi lahan gambut akan sangat kering sampai kedalaman tertentu dan hal ini yang menyebabkan lahan mudah terbakar. Terbakarnya lahan gambut mengakibatkan kerugian besar, seperti kebakaran lahan gambut yang terjadi di Riau pada bulan Maret tahun Menurut Adinugroho et al.(2005) penyebab kebakaran lahan dapat diketahui melalui suatu indikator yaitu titik panas. Dengan indikator titik panas kebakaran hutan dapat diprediksi dan hal ini dapat membantu pencegahan terjadinya kebakaran. Salah satu teknik data mining yang dapat dilakukan adalah klasifikasi. Klasifikasi dilakukan untuk memprediksi kemunculan titik panas. Penelitian mengenai model klasifikasi untuk titik panas yang dilakukan oleh Sitanggang dan Ismail (2011) menggunakan Decision Tree dengan hasil akurasi sebesar 63.17%. Penelitian Fernando dan Sitanggang (2014), pemodelan klasifikasi data spasial kemunculan titik panas dilakukan dengan menggunakan algoritme ID3. Penelitian tersebut bertujuan untuk membuat model klasifikasi dan memprediksi kemunculan titik api di Provinsi Riau pada tahun Penelitian berikutnya yang pernah dilakukan oleh Nurpratami dan Sitanggang (2015) menggunakan algoritme pohon keputusan untuk memprediksi kejadian titik panas pada Kabupaten Bengkalis, Provinsi Riau. Penelitian tersebut menggunakan 5-\ fold cross validation dengan rata-rata akurasi sebesar 89.04% untuk data latih dan 52.05% untuk data uji. Aturan-aturan klasifikasi dari ketiga penelitian tersebut baru diimplementasikan dalam bentuk single tree. Pada penelitian ini akan dibangun pemodelan klasifikasi kemunculan titik panas pada lahan gambut di Sumatera dan Kalimantan menggunakan algoritme Random Forest. Pemodelan yang akan dibangun untuk memprediksi kemunculan titik panas yaitu dengan mengambil beberapa sampel acak sebagai data latih dan menggunakan teknik 10-fold cross validation. Algoritme Random Forest merupakan salah satu cara klasifikasi pengembangan dari Classification and Regression Tree (CART), yaitu dengan menerapkan metode bootstrap aggregating bagging dan random feature selection (Breiman 2001). Perumusan Masalah Rumusan masalah pada penelitian ini adalah bagaimana algoritme Random Forest digunakan untuk klasifikasi kemunculan titik panas pada lahan gambut di Sumatera dan Kalimatan.

14 2 Tujuan Penelitian Tujuan dari penelitian ini adalah: 1 Menerapkan algoritme Random Forest pada data titik panas di lahan gambut di Sumatera dan Kalimantan. 2 Evaluasi akurasi model klasifikasi untuk prediksi kemunculan titik panas di lahan gambut di pulau Sumatera dan Kalimantan. Manfaat Penelitian Manfaat dari penelitian ini adalah informasi model klasifikasi yang dihasilkan dapat digunakan untuk pencegahan kebakaran hutan oleh pihak berwenang. Ruang Lingkup Penelitian Ruang lingkup dari penelitian ini adalah: 1 Pembentukan model klasifikasi menggunakan algoritme Random Forest pada data titik panas dan lahan gambut wilayah Sumatera dan Kalimantan. 2 Karakteristik lahan gambut yang dianalisis adalah tipe lahan gambut (legend), ketebalan gambut, dan tutupan lahan (landuse). 3 Implementasi klasifikasi model yang digunakan yaitu package randomforest yang tersedia di R. METODE Data Penelitian Data yang digunakan pada penelitian ini adalah data lahan gambut pulau Sumatera dan Kalimantan dari tahun yang didapatkan dari Wetlands International Indonesia Programme (WI-IP) dalam format shp. Sedangkan data titik panas dari tahun diperoleh dari FIRMS (Fire Information for Resource Management System) MODIS NASA dalam format csv. Tabel 1 Atribut dari titik panas No Atribut Tipe 1 Latitude Numerik 2 Longitude Numerik 3 Brigthness Numerik 4 Scan Numerik 5 Track Numerik 6 Acq_date Date 7 Acq_time Character varying (5) 8 Satelite Character varying (1) 9 Confidence Integer 10 Version Character varying (3) 11 Bright_T31 Numerik 12 FRP Numerik

15 Data titik panas terdiri dari 12 atribut dan tipe dari masing-masing atribut dapat dilihat pada Tabel 1. Sedangkan peta lahan gambut di Sumatera dan Kalimantan dapat dilihat pada Gambar 1 dan Gambar 2. Pemilihan atribut dari titik panas dan lahan gambut berdasarkan penelitian yang dilakukan oleh Sitanggang et al. (2012) serta berdasarkan ketersediaan data yang diperoleh dari WI-IP dan FIRMS. Atribut titik panas (Tabel 1) yang digunakan untuk pengolahan data pada penelitian ini adalah Latitude, Longitude, dan confidence. Latitude dan Longitude dibutuhkan untuk menunjukkan posisi dari titik panas yang terjadi. Sedangkan confidence digunakan untuk seleksi titik panas yang diindikasikan sebagai kebakaran. 3 Gambar 1 Lahan gambut di Sumatera Gambar 2 Lahan gambut di Kalimantan

16 4 Data lahan gambut berdasarkan tingkat dekomposisi bahan organiknya dibedakan menjadi 3 yaitu fibrists, hemists, dan saprists (Suwanto et al. 2010). Tipe lahan gambut fibrists adalah gambut yang masih muda dengan tingkat pelapukan awal dan lebih dari 3/4 bagian volumenya berupa serat kasar, air perasan berwarna bening/jernih. Tipe gambut hemists adalah gambut yang mempunyai tingkat pelapukan sedang, bagian yang masih berupa serat kasar sekitar 1/4 hingga kurang dari 3/4 bagian, air perasan berwarna coklat dan mengandung bahan yang tidak larut. Tipe gambut saprists adalah gambut yang tingkat pelapukannya sudah lanjut (matang), berupa serat kasar kurang dari 1/4 bagian, dan air perasan berwarna hitam. Tiga jenis lahan gambut yang berada di Sumatera dan Kalimantan dapat dilihat pada Gambar 1 dan Gambar 2. Pada Gambar 1 terdapat keterangan Fibrists/Saprists (60/40), sedang. Maksud dari keterangan tersebut adalah Fibrists dan Saprists adalah tipe lahan gambut, 60/40 merepresentasikan kombinasi dari Fibrists sebesar 60% dan Saprists sebesar 40%, kemudian "sedang" menunjukkan ketebalan dari lahan gambut tersebut. Ketebalan dari lahan gambut dibagi menjadi 5 yaitu sangat dangkal (D0), dangkal (D1), sedang (D2), dalam (D3), dan sangat dalam (D4). D0 merupakan kedalaman lahan gambut < 50 cm. D1 kedalaman lahan gambut antara cm, kedalaman lahan gambut D cm, D3 sedalam cm, dan kedalaman lahan gambut D4 > 400 cm. Pada Gambar 1 dan Gambar 2 terdapat keterangan mengenai tipe lahan gambut yang terdapat di Sumatera dan Kalimantan. Sedangkan pada Tabel 2 dan Tabel 3 dapat dilihat luas area (Ha) dari setiap tipe lahan gambut dari pulau Sumatera dan Kalimantan. Tipe lahan gambut yang berada di Sumatera berjumlah 28 dan tipe lahan gambut di Kalimantan berjumlah 7. Tabel 2 Luas tipe lahan gambut di Sumatera No Tipe Gambut Luas (Ha) 1 Hemists/Saprists (60/40), sedang Saprists/min (50/50), dangkal Saprists/Hemists (60/40), sedang Saprists/min (30/70), sedang Saprists/min (90/10), sedang Hemists (100), dalam Hemists/Saprists (60/40), dalam Hemists (100), sedang Saprists/min (50/50), dalam Hemists/min (90/10), sangat dalam Hemists/Saprists (60/40), sedang Hemists/min (30/70), dangkal Hemists/Saprists (60/40), sangat dalam Saprists/Hemists (60/40), dalam Saprists/Hemists (60/40), sedang Hemists/min (90/10), dangkal Hemists/Saprists (60/40), dangkal Hemists/min (70/30), sedang Saprists/min (30/70), dalam Hemists/min (90/10), sedang Hemists/min (50/50), dangkal

17 5 22 Saprists/min (50/50), sedang Hemists/min (90/10), sedang Fibrists/Saprists (60/40), sedang Saprists/Hemists (60/40), sangat dalam Hemists/min (30/70), sedang Saprists (100), sedang Saprists (100), dalam Tabel 3 Luas tipe lahan gambut di Kalimantan No Tipe Gambut Luas (Ha) 1 Hemists/Fibrists Hemists/Fibrists/Mineral Hemists/Mineral Saprists/Mineral Saprists/Hemists/Mineral Hemists/Saprists/Mineral Hemists/Fibrists/Saprists Tahapan Penelitian Tahapan-tahapan yang dilakukan pada penelitian ini dapat dilihat pada Gambar 3. Gambar 3 Tahapan metode penelitian Pengumpulan Data Pada tahap pengumpulan data, semua data dari WI-IP dan FIRMS dikumpulkan untuk praproses data. Dalam penelitian ini terdapat 2 format data yang akan diproses yaitu dalam format csv dan shp. Terdapat perbedaan antara lahan gambut di Sumatera dengan lahan gambut di Kalimantan. Perbedaannya

18 6 yaitu pada data lahan gambut Sumatera terdiri dari 3 atribut yaitu legend, landuse, dan ketebalan. Sedangkan pada data lahan gambut di Kalimantan terdiri dari 2 atribut yaitu legend dan ketebalan. Perbedaan atribut pada data lahan gambut terjadi karena ketersediaan data yang diperoleh. Praproses Data Terdapat beberapa tahapan dalam praproses data yaitu pembersihan data, seleksi variabel data, dan penggabungan data. Pembersihan data dilakukan untuk menghilangkan missing value. Seleksi variabel data dilakukan untuk mendapatkan data yang relevan. Serta penggabungan data sesuai dengan bentuk yang digunakan. Variabel yang diseleksi meliputi legend, landuse, dan ketebalan. Pada tahapan ini dilakukan penambahan variabel class dan digunakan saat pembuatan model klasifikasi. Pembagian Data Pembagian data pada tahapan penelitian dibagi menjadi data latih dan data uji. Metode yang digunakan dalam pembagian data adalah K-fold cross validation dengan nilai K=10, sehingga 10% dari data akan dijadikan sebagai data uji. Menurut Fu (1994) K-fold cross validation merupakan metode yang membagi himpunan contoh secara acak menjadi K himpunan bagian. Pembuatan Model Klasifikasi Menggunakan Algoritme Random Forest Algoritme Random Forest (RF) merupakan pengembangan dari metode Classification and Regression Tree (CART) dengan menerapkan metode bootstrap aggregating (bagging) dan random feature selection (Breiman 2001). Algoritme RF merupakan algoritme yang cocok digunakan untuk klasifikasi data yang besar dan pada algoritme RF tidak terdapat pruning atau pemangkasan variabel seperti pada algoritme decision tree. Metode RF menggabungkan banyak pohon (tree) tidak seperti single tree yang hanya terdiri dari satu pohon untuk membuat klasifikasi dan prediction class. Pada RF pembentukan tree dilakukan dengan cara melakukan training sampel data. Sampling with replacement adalah cara yang digunakan untuk mengambil sampel data. Pemilihan variabel yang digunakan untuk split diambil secara acak. Klasifikasi dijalankan setelah semua tree terbentuk. Penentuan klasifikasi pada RF ini diambil berdasarkan vote dari masing-masing tree dan vote terbanyak yang menjadi pemenang. Arsitektur umum dari RF dapat dilihat pada Gambar 4.

19 7 Gambar 4 Arsitektur umum Random Forest (Verikas et al.2011) Berikut ini adalah prosedur atau algoritme untuk membangun Random Forest pada gugus data yang terdiri dari n amatan dan p peubah penjelas (Breiman 2001; Breiman dan Cutler 2003): 1 Lakukan penarikan contoh acak berukuran n dengan pemulihan pada gugus data. Langkah ini dinamakan dengan bootstrap (bag). 2 Dengan menggunakan contoh bootstrap, pohon dibangun sampai mencapai ukuran maksimum yaitu tanpa pemangkasan (pruning). Pembangunan pohon dilakukan dengan menerapkan random feature selection yaitu m peubah penjelas dipilih secara acak dimana m << p, selanjutnya pemilah terbaik dipilih berdasarkan $m$ peubah penjelas. Ulangi langkah 1 dan 2 sebanyak k kali untuk membuat sebuah forest yang terdiri dari k pohon. Contoh dataset sederhana dapat dilihat pada Lampiran 29. Tahapan pembuatan model klasifikasi menggunakan algoritme Random Forest dilakukan setelah membuat pemodelan data latih menggunakan package randomforest di R. Pembentukan tree pada algoritme Random Forest dilakukan dengan cara melakukan training pada sampel. Variabel yang digunakan untuk split diambil secara acak dan klasifikasi dijalankan setelah semua tree terbentuk. Penentuan klasifikasi pada Random Forest ini diambil berdasarkan vote dari masing-masing tree dan vote terbanyak yang menjadi pemenang. Pada pembentukan Random Forest menggunkan nilai Gini Index untuk menentukan split yang akan dijadikan root/node. Berikut ini adalah rumus-rumus untuk mencari nilai Gini Index (Yin 2013): Gini S =1 - pi 2 k i=1 dimana p i adalah probabilitas dari S milik class i. Setelah menghitung nilai Gini (S), langkah berikutnya adalah menghitung nilai GiniGain. n S i GiniGain S = Gini (S) Gini (A,S) = Gini (S) - S Gini (S i) (2) dimana S i adalah partisi dari S yang disebabkan oleh atribut A. i=1 (1)

20 8 Perhitungan Akurasi Perhitungan akurasi dilakukan setelah proses klasifikasi selesai dilakukan. Perhitungan ini berfungsi menunjukkan tingkat kebenaran pengkalisifikasian data terhadap data yang sebenarnya. Perhitungan akurasi dilakukan dengan menggunakan rumus sebagai berikut: data uji benar klasifikasi Akurasi= 100% (3) jumlah total data uji Setelah menghitung nilai akurasi dari setiap tahun maka dilakukan penghitungan nilai precision atau nilai presisi. Rumus untuk menghitung nilai presisi (Manning et al. 2008) sebagai berikut: tp Akurasi= 100% (4) tp + fp dimana tp adalah nilai true positive dan fp adalah nilai false negative. Nilai tp merupakan nilai yang sama antara data latih (predictive) dengan data uji (reference). Nilai tp + fp pada rumus 4 merupakan jumlah keseluruhan data uji. Penerapan pada Model Data Baru Penerapan model pada data baru tahun 2015 dilakukan setelah mendapatkan dataset dengan akurasi tertinggi (2001 sampai 2014) dari masing-masing pulau. Setelah itu dataset tersebut yang akan digunakan untuk memprediksi data baru tahun Peralatan Penelitian Perangkat lunak yang digunakan dalam penelitian ini adalah: Sistem operasi : Windows 7 Ultimate Bahasa pemrograman : R Antarmuka bahasa pemrograman : R Studio Pengolahan data spasial : QuantumGIS versi Membaca titik panas : Microsoft Excel 2007 Pengolahan query (manajemen basis data): PostgreSql versi 1.20 Perangkat keras yang digunakan dalam penelitian ini adalah komputer personal dengan spesifikasi: Prosesor : Intel Core i5-2430m 2.40 GHz Memory : 4 GB System type : 64-bit operating system VGA : NVDIA GeForce GT540M HASIL DAN PEMBAHASAN Praproses Data Praproses data merupakan tahapan untuk menyeleksi variabel. Tahapan ini menggunakan QuantumGIS dan PostgreSql dalam pengolahan data titik panas dan lahan gambut. Oleh karena itu, coordinate reference system (crs) atau sistem referensi koordinat kedua data tersebut harus sesuai yaitu ESPG:32647-WGS 84/UTM Zone 47N untuk Sumatera dan ESPG:32647-WGS 84/UTM Zone 49N

21 untuk Kalimantan. Operasi spasial antara kedua data tidak dapat dilakukan jika crs tidak sama. Bumi dibagi menjadi beberapa zona yaitu antara 01 sampai dengan 60 dengan satuan meter. Sistem koordinat di Indonesia paling cocok menggunakan crs WGS84 / EPSG:4326. Pembagian zona di Indonesia dapat dilihat pada Gambar 5. Pada sistem koordinat bumi dibagi menjadi dua bagian yaitu di atas khatulistiwa sebagai bagian utara disimbolkan dengan N serta dibagian selatan disimbolkan dengan S. 9 Gambar 5 Zona sistem koordinat di Indonesia (Oswald dan Astrini 2012) Langkah awal dalam praproses data yaitu seleksi titik panas yang berada di atas lahan gambut, kemudian memisahkan data titik panas per tahun. Data titik panas yang dipilih adalah data titik panas yang lengkap 12 bulan. Sehingga data titik panas yang akan diolah adalah data titik panas dari tahun Pemisahan data titik panas per tahun dilakukan di Quantum GIS (QGIS). Berikut ini adalah operasi di QGIS untuk memisahkan data Sumatera dan Kalimantan tahun 2001: acq_date < 2002 Jumlah titik panas per tahun Sumatera dan Kalimantan dapat dilihat pada Gambar 6. Klasifikasi titik panas pada lahan gambut dapat dilakukan setelah menambahkan atribut class T (untuk titik panas) dan F (untuk non titik panas) pada dataset. Penambahan class tersebut dilakukan menggunakan PostgreSql. Sebelum menambahkan class, tambahkan persebaran non titik panas yang diperoleh dari titik-titik di luar titik panas (hotspot) menggunakan QGIS. Persebaran ini didapat dengan cara membangkitkan titik acak (random point) di sekitar titik panas. Non titik panas tersebut dibangkitkan di luar buffer dengan distance sebesar 0.01 (dalam derajat). Hasil buffer titik panas dapat dilihat pada Gambar 7.

22 10 Gambar 6 Jumlah titik panas per tahun Gambar 7 Hasil buffer titik panas Titik panas berada di bagian tengah buffer, hasil buffer titik panas yang bertumpuk satu sama lain akan dilebur menggunakan operasi dissolve yang tersedia pada QGIS. Hasil dissolve digunakan untuk memotong lahan gambut menggunakan operasi difference pada QGIS. Hal ini dilakukan untuk menghindari bercampurnya non titik panas dengan titik panas. Data non titik panas didapatkan dengan membuat random point, jumlah titik disesuaikan dengan titik panas per tahun dengan nilai confidence > 70. Hasil pembangkitan random point (non titik panas) di sekitar titik panas dapat dilihat pada Gambar 8.

23 11 Gambar 8 Hasil pembangkitan random point (non titik panas) disekitar titik panas Praproses selanjutnya dilakukan import data lahan gambut dan data titik panas yang sudah terdapat non titik panas ke PostgreSql. Berikut adalah query untuk menambahkan class T dan F: update titikpanassumatera2_2001_rep set class= T ; update false_alarm_2001_rep set class= F ; kemudian membuat tabel target dengan query sebagai berikut: CREATE TABLE target2001_1 AS SELECT gid,the_geom,longitude,latitude,confidence,class FROM titikpanassumatera2_2001_rep Proses selanjutnya yaitu menggabungkan data non titik panas ke dalam tabel target. Penggabungan data dilakukan dengan menggunakan query : INSERT INTO target2001_1 (gid,the_geom,class) SELECT gid,the_geom,class FROM false_alarm_2001_rep; Perbandingan jumlah titik panas (T) dan non titik panas (F) pada lahan gambut seimbang (tidak ada missing value). Langkah selanjutnya adalah rename gid pada target2001_1 menjadi gid2, kemudian tambahkan gid auto number dengan cara sebagai berikut: ALTER TABLE target2001_1 ADD COLUMN gid BIGSERIAL PRIMARY KEY; Hal ini dilakukan agar gid asli dari data target tidak berubah. Setelah semua tahapan tersebut, berikutnya adalah pembuatan dataset yang diambil dari tabel target dan tabel lahan gambut. Query yang digunakan sebagai berikut: CREATE TABLE dataset1 AS SELECT t.gid,t.gid2,t.the_geom,t.confidence,g.legend, g.landuse,g.ketebalan FROM target2001_1 as t,gambutsumatera1_out as g WHERE ST_Within(t.the_geom, g.the_geom) ORDER BY t.gid;

24 12 Dataset1 terdiri dari 7 variabel yaitu gid, gid2, the_geom, confidence, legend, landuse, dan ketebalan. Variabel legend menunjukkan tipe dari lahan gambut. Dataset yang akan diolah untuk klasifikasi terdiri dari 4 variabel yaitu class, legend, landuse, dan ketebalan. Query yang digunakan untuk membuat dataset tersebut sebagai berikut: CREATE TABLE dataset3 AS SELECT t.class,g.legend,g.landuse,g.ketebalan FROM target2001_1 as t,gambutsumatera1_out as g WHERE ST_Within(t.the_geom, g.the_geom); Dataset3 digunakan untuk klasifikasi menggunakan algoritme Random Forest. Pembagian Data Pembagian data latih dan data uji pada dataset menggunakan 10-fold cross validation. Data yang digunakan merupakan dataset yang sudah tidak mengandung missing value. Dataset dibagi menjadi 10 bagian (fold). Pembentukan model klasifikasi dilakukan menggunakan data latih. Sedangkan hasil akurasi model klasifikasi diperoleh dari data uji. Pembuatan model klasifikasi menggunakan algoritme Random Forest Jumlah tree yang akan dibangun pada algoritme Random Forest sebanyak 100. Sedangkan pembagian untuk setiap node sebanyak 3, berdasarkan jumlah variabel penjelas. Berikut ini adalah kode yang digunakan untuk membangun model menggunakan algoritme Random Forest: >library (randomforest) >set.seed(100) >traindata1 <- fold1 [1:3156,] >testdata1 <- fold1[3157:3507,] >rf1<-randomforest(class~.,data=traindata1, ntree=100, mtry=3) >tmp.predict.rf1 <- predict(rf1, newdata = testdata1, type = "class") >conf.mat1 <- table(testdata1$class, tmp.predict.rf1, dnn = c("prediction", "Reference")) >accuracy.percent.test1<- 100*sum(diag(conf.mat1))/sum(conf.mat1) Data yang digunakan untuk membangun model menggunakan package randomforest di R yaitu data latih yang diberi nama traindata1. Argumen yang digunakan untuk pembagian setiap node pada tree adalah mtry dan banyaknya jumlah tree yang dibangun ditunjukkan oleh argumen ntree. Pembangunan model tersebut dilakukan sebanyak 10 kali (10-fold) menggunakan algoritme Random Forest untuk setiap tahun (2001 sampai 2014). Hasil rataan model klasifikasi (data uji) dataset Sumatera dan Kalimantan dapat dilihat pada Tabel 4. Tabel 4 Akurasi rata-rata model klasifikasi untuk dataset tahun 2001 sampai 2014 Dataset Akurasi rata-rata Sumatera Akurasi rata-rata (%) Kalimantan (%)

25 Rata-rata Pada Tabel 4 nilai akurasi rata-rata model klasifikasi dataset tertinggi untuk Sumatera 87.40% dan Kalimantan 72.50% di tahun yang sama yaitu tahun Pemodelan menggunakan algoritme Random Forest yang dijalankan di R ini tidak menghasilkan model berupa tree dan vote yang terpilih. Algoritme ini menghasilkan confusion matrix dari data latih dan data uji. Confusion matrix untuk model klasifikasi terbaik pada dataset tahun 2001 di Sumatera Kalimantan Tabel 5 dan Tabel 6. Tabel 5 Model klasifikasi terbaik pada datast Sumatera tahun Akurasi model klasifikasi tertinggi dari 10 fold pada Tabel 5 yaitu fold ke-2. Pada Tabel 5 dan 6 tersebut terdapat 4 kriteria yaitu TP (True Positive), TN (True Negative), FP (False Positive), dan FN (False Negative). TP adalah kasus dataset titik panas di lahan gambut diprediksi benar terdapat titik panas. TN diprediksi sebagai bukan titik panas yang ada di atas lahan gambut dan benar bukan titik panas yang berada di atasnya. FP merupakan prediksi bahwa terdapat titik panas, tetapi kenyataannya tidak terdapat titik panas di lahan gambut tersebut. Sedangkan FN adalah prediksi tidak ada titik panas, tetapi sebenarnya terdapat titik panas di lahan gambut. Pada Tabel 6 akurasi model klasifikasi tertinggi yaitu fold ke-5. Akurasi yang diperhatikan untuk dataset Sumatera dan Kalimantan adalah akurasi

26 14 dari data uji. Akurasi model klasifikasi dataset pulau Sumatera dan Kalimantan dari tahun 2001 sampai dengan 2014 dapat dilihat pada halaman Lampiran. Tabel 6 Model klasifikasi terbaik pada datast Kalimantan tahun Perhitungan Akurasi Proses klasifikasi dan pembuatan model telah dilakukan pada tahapan sebelumnya. Selanjutnya perhitungan akurasi dapat dilakukan untuk menunjukkan tingkat kebenaran pengklasifikasian data dengan terhadap data yang sebenarnya. Akurasi rata-rata dari data uji Sumatera didapatkan sebesar 87.40% dan akurasi rata-rata untuk Kalimantan sebesar 72.50%. Penerapan pada Model Data Baru Tahapan lebih lanjut pada penelitian ini akan dilakukan percobaan untuk dataset tahun Penerapan model pada data baru dapat dilakukan setelah mendapatkan akurasi model klasifikasi tertinggi dari dataset Sumatera dan Kalimantan. Oleh karena itu model yang diperoleh dari Sumatera dan Kalimantan adalah dataset tahun 2001, kemudian diterapkan pada data baru yaitu tahun Jumlah data tahun 2015 Sumatera yang akan dijadikan data uji adalah 1056 titik, terdiri dari titik panas dan non titik panas. Sedangkan jumlah data latih Sumatera tahun 2001 adalah 1174 titik. Jumlah data tahun 2015 Kalimantan yang akan dijadikan data uji adalah 46 titik dan jumlah data latih Kalimantan tahun 2001 adalah 1778 titik. Tabel 7 Confusion matrix untuk klasifikasi pada data Sumatera tahun 2015 Reference Prediction False True False True

27 Tabel 8 Confusion matrix untuk klasifikasi pada data Kalimantan tahun 2015 Prediction Reference False True False 15 8 True 20 3 Selanjutnya data latih dan data uji untuk pulau Sumatera dan Kalimantan tersebut diolah menggunakan algoritme Random Forest untuk mendapatkan nilai akurasi. Akurasi model pada data baru Sumatera tahun 2015 adalah 60.80%. Detil dari nilai confusion matrix data Sumatera dapat dilihat pada Tabel 7. Akurasi model pada data baru Kalimantan tahun 2015 adalah 39.13%. Detil dari nilai confusion matrix data Kalimantan dapat dilihat pada Tabel 8. Pada Tabel 7 menunjukkan bahwa semua data tahun 2015 di pulau Sumatera dengan class true (merupakan titik panas) diklasifikasikan benar sebanyak 210 titik panas. Sebaliknya terdapat 96 data dengan class bukan titik panas (false) diklasifikasi salah ke class titik panas (true). Pada Tabel 8 menunjukkan bahwa terdapat 8 titik dengan class bukan titik panas (false) diklasifikasi salah ke class titik panas (true). Sedangkan data titik panas (true) yang diklasifikasikan benar sebanyak 3 titik panas. Selain informasi dari tabel confusion matrix juga dapat dihitung nilai presisi (precision). Nilai presisi ini untuk melihat titik panas yang benar diklasifikasi berdasarkan class true. Nilai presisi pada data baru tahun 2015 di Sumatera adalah 68.63%. Nilai presisi data baru tahun 2015 di Sumatera tersebut menunjukkan keakuratan hasil akurasi klasifikasi. Sedangkan untuk data baru tahun 2015 di Kalimantan presisi atau keakuratan hasil klasifikasi untuk kemunculan titik panas adalah 27.27%. SIMPULAN DAN SARAN Simpulan Penelitian ini menerapkan algoritme Random Forest untuk klasifikasi kemunculan titik panas pada lahan gambut di Sumatera dan Kalimantan. Dataset kemunculan titik panas terdiri dari legend, landuse, ketebalan, dan class. Akurasi rata-rata dari hasil klasifikasi untuk memprediksi kemunculan titik panas tahun 2001 pada model yang menggunakan Random Forest adalah 87.40% untuk Sumatera dan 72.50% untuk Kalimantan. Kemudian model yang diperoleh dari dataset tahun 2001 tersebut diterapkan pada data baru tahun Akurasi model yang didapatkan untuk data baru tahun 2015 Sumatera yaitu 60.80% dan akurasi model untuk Kalimantan yaitu 39.13%. Model yang dihasilkan dari algoritme Random Forest untuk data baru Sumatera berhasil mengklasifikasikan class true (merupakan titik panas) sebanyak 210 titik. Sedangkan model yang dihasilkan dari algoritme Random Forest untuk data baru Kalimantan berhasil mengklasifikasikan class true (merupakan titik panas) sebanyak 3 titik. Saran Saran yang dapat dilakukan untuk penelitian selanjutnya yaitu pengembangan sistem berbasis web dengan menampilkan visualisasi klasifikasi titik panas dalam bentuk peta. 15

28 16 DAFTAR PUSTAKA Adinugroho WC, Suryadiputra INN, Saharjo BH, dan Siboro L Panduan Pengendalian Kebakaran Hutan dan Lahan Gambut.Proyek Climate Changes, Forest and Peatlands in Indonesia.Bogor (ID): Weylands International- Indonesia Programme dan Wildlife Habitat Canada. Breiman L Random Forests dalam: Machine Learning 45, pp Breiman L dan A Cutler Manual Setting Up, Using, And Understanding Random Forests V4.0. [Internet]. [Diunduh tanggal 06/06/2015 ]. Dapat diunduh dari: Random Forest. [Internet]. [Diunduh tanggal 6/06/2015 ].Dapat diunduh dari: Fernando V, Sitanggang IS Klasifikasi Data Spasial untuk Kemunculan Hotspot di Provinsi Riau Menggunakan Algoritme ID3. Integrasi Sains MIPA untuk mengatasi Masalah Pangan, Energi, Kesehatan, Reklamasi, dan Lingkungan; Mei Bogor, Indonesia. Bogor (ID): SEMIRATA, pp ISBN: Fu L Neural Network in Computers Intelligence. Singapura: McGraw-Hill. Nurpratami ID, Sitanggang IS Classification Rules for Hotspot Occurences Using Spatial Entropy-Based Decision Tree Algorithm. The 1 st International Symposium on LAPAN-IPB Satellite for Food Security and Environmental Monitoring. Bogor, Indonesia. Bogor (ID): Procedia Environmental Sciences, pp DOI: /j.proenv Oswald P, Astrini R Tutorial QuantumGIS Tingkat Dasar Versi Lisboa. Mataram (ID): GIZ Decentralization as Contribution to Good Governance (DeCGG). Sitanggang IS, Ismail MH Classification model for hotspot occurences using a decision tree method dalam: Geomatics, Natural Hazard and Risk 2 2, pp DOI: / Sitanggang IS, Yaakob R, Mustapha N, Ainuddin AN Appclication Of Classification Algorithms in Data Mining for Hotspots Occurrence Prediction in Riau Province Indonesia dalam: JATIT 43(2), pp ISSN: Suwanto A, Maas A, Sutaryo D, Wijaya DY, Sartono D, Achsani H, Komarsa, Hastuti S, Soli TI. Profil Ekosistem Gambut di Indonesia. Jakarta (ID). Verikas A, Gelzinis A, Becausekiene M Mining data with random forest: A survey and result of new tests dalam: Pattern Recognition 44, pp DOI: /j.patcog

29 Lampiran 1 Akurasi model dataset pulau Sumatera tahun Lampiran 2 Akurasi model dataset pulau Sumatera tahun Lampiran 3 Akurasi model dataset pulau Sumatera tahun

30 18 Lampiran 4 Akurasi model dataset pulau Sumatera tahun Lampiran 5 Akurasi model dataset pulau Sumatera tahun Lampiran 6 Akurasi model dataset pulau Sumatera tahun

31 Lampiran 7 Akurasi model dataset pulau Sumatera tahun Lampiran 8 Akurasi model dataset pulau Sumatera tahun Lampiran 9 Akurasi model dataset pulau Sumatera tahun

32 20 Lampiran 10 Akurasi model dataset pulau Sumatera tahun Lampiran 11 Akurasi model dataset pulau Sumatera tahun Lampiran 12 Akurasi model dataset pulau Sumatera tahun

33 Lampiran 13 Akurasi model dataset pulau Sumatera tahun Lampiran 14 Akurasi model dataset pulau Sumatera tahun Lampiran 15 Akurasi model dataset pulau Kalimantan tahun

34 22 Lampiran 16 Akurasi model dataset pulau Kalimantan tahun Lampiran 17 Akurasi model dataset pulau Kalimantan tahun Lampiran 18 Akurasi model dataset pulau Kalimantan tahun

35 Lampiran 19 Akurasi model dataset pulau Kalimantan tahun Lampiran 20 Akurasi model dataset pulau Kalimantan tahun Lampiran 21 Akurasi model dataset pulau Kalimantan tahun

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR FITRI KUSUMANINGRUM DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME NAIVE BAYES YEVILINA AULIA RIZKA

KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME NAIVE BAYES YEVILINA AULIA RIZKA KLASIFIKASI KEMUNCULAN TITIK PANAS PADA LAHAN GAMBUT DI SUMATERA DAN KALIMANTAN MENGGUNAKAN ALGORITME NAIVE BAYES YEVILINA AULIA RIZKA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian 3 Ruang Lingkup Penelitian 1. Teknik yang digunakan dalam membentuk clustering titik panas adalah DBSCAN. 2. Data yang digunakan pada penelitian ini adalah data titik panas kebakaran hutan di Indonesia

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

Spatio-Temporal Clustering Hotspot di Sumatera Selatan Tahun Menggunakan Algoritme ST-DBSCAN dan Bahasa Pemrograman R

Spatio-Temporal Clustering Hotspot di Sumatera Selatan Tahun Menggunakan Algoritme ST-DBSCAN dan Bahasa Pemrograman R Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 3 Nomor 2 halaman 112-121 ISSN: 2089-6026 Spatio-Temporal Clustering Hotspot di Sumatera Selatan Tahun 2002-2003 Menggunakan Algoritme

Lebih terperinci

ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA

ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA ANALISIS DATA DERET WAKTU HOTSPOT PROVINSI RIAU BERDASARKAN TIPE PENUTUPAN LAHAN ANESIA MEILA ROSA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT Ahmad Khusaeri 1, Septian Ilham 2, Desi Nurhasanah 3, Derrenz Delpidat 4, Anggri 5, Aji Primajaya 6, Betha Nurina

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

emrrata MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI

emrrata MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI A 181 S. 2014 emrrata SEMIRATA 2014 Bidang MIPA BKS-PTN-Barat "Integrasi sains MIPA untuk mengatasi masalah pangan, energi, kesehatan, reklamasi, dan lingkungan" IPB International Convention Center dan

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2. 6 tahap ini, pola yang telah ditemukan dipresentasikan ke pengguna dengan teknik visualisasi agar pengguna dapat memahaminya. Deskripsi aturan klasifikasi akan dipresentasikan dalam bentuk aturan logika

Lebih terperinci

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4.

SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4. SISTEM INFORMASI GEOGRAFIS BERBASIS WEB UNTUK KLASIFIKASI KEMUNCULAN TITIK API DI PROVINSI RIAU MENGGUNAKAN POHON KEPUTUSAN C4.5 KHAIRIL AMRI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal 234 Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal Comparative Analysis Of ID3 And C4.5 Algorithm For Classification Of Grant

Lebih terperinci

KLASIFIKASI TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME ID3 SPASIAL YANG DIPERLUAS YAUMIL KHOIRIYAH

KLASIFIKASI TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME ID3 SPASIAL YANG DIPERLUAS YAUMIL KHOIRIYAH KLASIFIKASI TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME ID3 SPASIAL YANG DIPERLUAS YAUMIL KHOIRIYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB 4 IMPLEMENTASI DAN PENGUJIAN

BAB 4 IMPLEMENTASI DAN PENGUJIAN BAB 4 IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Tahap implementasi merupakan tahap pengimplementasian metode kedalam perangkat lunak simulasi, tahap lanjut dari tahap perancangan simulasi di bab sebelumnya.

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV

HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV HIERARCHICAL CLUSTERING PADA DATA TIME SERIES HOTSPOT PROVINSI RIAU ILHAM ALPHA DINOV DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : BAB 3 METODE PENELITIAN 3.1 Instrumen Penelitian Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : 3.1.1 Bahan Bahan yang digunakan dalam penelitian ini yaitu data siswa kelas SMA

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED Studi Kasus Perilaku Seksual Remaja di Indonesia Hasil SDKI 2012 Yogo Aryo Jatmiko 1, Septiadi Padmadisastra 2, Anna Chadidjah 3 Prodi

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

KLASIFIKASI KERAPATAN TITIK API DI BENGKALIS RIAU DENGAN MENGGUNAKAN ALGORITME POHON KEPUTUSAN ID3 SPASIAL ROUDHOTUL JANNAH

KLASIFIKASI KERAPATAN TITIK API DI BENGKALIS RIAU DENGAN MENGGUNAKAN ALGORITME POHON KEPUTUSAN ID3 SPASIAL ROUDHOTUL JANNAH KLASIFIKASI KERAPATAN TITIK API DI BENGKALIS RIAU DENGAN MENGGUNAKAN ALGORITME POHON KEPUTUSAN ID3 SPASIAL ROUDHOTUL JANNAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

APLIKASI SEQUENTIAL PATTERN MINING PADA DATA TITIK PANAS DI LAHAN GAMBUT SUMATRA DAN KALIMANTAN AIZUL FADIN

APLIKASI SEQUENTIAL PATTERN MINING PADA DATA TITIK PANAS DI LAHAN GAMBUT SUMATRA DAN KALIMANTAN AIZUL FADIN APLIKASI SEQUENTIAL PATTERN MINING PADA DATA TITIK PANAS DI LAHAN GAMBUT SUMATRA DAN KALIMANTAN AIZUL FADIN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA

STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA STUDI ALGORITMA CART DENGAN INDUKSI FUZZY DALAM MENGKLASIFIKASIKAN DATA SKRIPSI OKTAVIYANI DASWATI 1308230003 PROGRAM STUDI S-1 EKSTENSI MATEMATIKA DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

POST PRUNING POHON KEPUTUSAN SPASIAL UNTUK KLASIFIKASI KEMUNCULAN TITIK PANAS ANDI DYNAWAVY NURZAKYAH

POST PRUNING POHON KEPUTUSAN SPASIAL UNTUK KLASIFIKASI KEMUNCULAN TITIK PANAS ANDI DYNAWAVY NURZAKYAH POST PRUNING POHON KEPUTUSAN SPASIAL UNTUK KLASIFIKASI KEMUNCULAN TITIK PANAS ANDI DYNAWAVY NURZAKYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA

PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA PENERAPAN DATA MINING MENGGUNAKAN ALGORITME C4.5 DALAM PENENTUAN JURUSAN SISWA SMA NEGERI 2 SURAKARTA oleh NADYA AL FITRIANI M0111060 SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI

MATEMATIKA, FISIKA, KIMIA, BIOLOGI, STATISTIKA, KOMPUTER, STEM, GEOFISIKA DAN METEOROLOGI SEMIRATA 2014 Bidang MIPA BKS-PTN-Barat "Integrasi sains MIPA untuk mengatasl masalah pangan, energi, kesehatan, reklamasi, dan lingkungan'' IPB International Convention Center dan Kampus IPB Baranangsiang,

Lebih terperinci

DETEKSI PENCILAN PADA DATA TITIK PANAS MENGGUNAKAN CLUSTERING BERBASIS MEDOIDS MOHAMAD BENTAR CAHYADAHRENA

DETEKSI PENCILAN PADA DATA TITIK PANAS MENGGUNAKAN CLUSTERING BERBASIS MEDOIDS MOHAMAD BENTAR CAHYADAHRENA i DETEKSI PENCILAN PADA DATA TITIK PANAS MENGGUNAKAN CLUSTERING BERBASIS MEDOIDS MOHAMAD BENTAR CAHYADAHRENA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR

IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR IMPLEMENTASI ALGORITMA RANDOM FORESTS UNTUK KLASIFIKASI SPAM PADA CITRA DAN TEXT INSTAGRAM TUGAS AKHIR RIZKY NOVRIYEDI PUTRA 1132001001 PROGRAM STUDI INFORMATIKA FAKULTAS TEKNIK DAN ILMU KOMPUTER UNIVERSITAS

Lebih terperinci

PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI)

PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI) I Made, Prediksi Lama Studi Mahasiswa,,,201 PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI) Prediction Of Students Learning Study Periode By Using Random Forest Method

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME POHON KEPUTUSAN BERBASIS SPATIAL ENTROPY INDRY DESSY NURPRATAMI

KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME POHON KEPUTUSAN BERBASIS SPATIAL ENTROPY INDRY DESSY NURPRATAMI KLASIFIKASI DATA TITIK API DI BENGKALIS RIAU MENGGUNAKAN ALGORITME POHON KEPUTUSAN BERBASIS SPATIAL ENTROPY INDRY DESSY NURPRATAMI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG

ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG ANALISIS SELEKSI ATRIBUT PADA ALGORITMA NAÏVE BAYES DALAM MEMPREDIKSI PENYAKIT JANTUNG TESIS IVAN JAYA 117038072 PROGRAM STUDI S2 TEKNIK INFORMATIKA FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS

Lebih terperinci

POLA SEKUENSIAL KEMUNCULAN TITIK PANAS BERDASARKAN DATA CUACA DI PROVINSI RIAU TRIA AGUSTINA

POLA SEKUENSIAL KEMUNCULAN TITIK PANAS BERDASARKAN DATA CUACA DI PROVINSI RIAU TRIA AGUSTINA POLA SEKUENSIAL KEMUNCULAN TITIK PANAS BERDASARKAN DATA CUACA DI PROVINSI RIAU TRIA AGUSTINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN

Lebih terperinci

PROSIDING ISSN:

PROSIDING ISSN: PM-19 PREDIKSI PERFORMA AKADEMIK SISWA PADA PELAJARAN MATEMATIKA MENGGUNAKAN BAYESIAN NETWORKS DAN ALGORITMA KLASIFIKASI MACHINE LEARNING Betha Nurina Sari Teknik Informatika, Fakultas Ilmu Komputer, Universitas

Lebih terperinci

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR

PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR PENGEMBANGAN APLIKASI FUZZY TEMPORAL ASSOCIATION RULE MINING (STUDI KASUS : DATA TRANSAKSI PASAR SWALAYAN ) HANDAYANI RETNO SUMINAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA Yasinta Agustyani, Yuliana Susanti, dan Vika Yugi Program Studi Matematika Fakultas

Lebih terperinci

MODEL KLASIFIKASI NILAI AKHIR MATA KULIAH DATA MINING BERDASARKAN AKTIVITAS MAHASISWA PADA LMS MENGGUNAKAN POHON KEPUTUSAN MUTIARA SANTIKA

MODEL KLASIFIKASI NILAI AKHIR MATA KULIAH DATA MINING BERDASARKAN AKTIVITAS MAHASISWA PADA LMS MENGGUNAKAN POHON KEPUTUSAN MUTIARA SANTIKA MODEL KLASIFIKASI NILAI AKHIR MATA KULIAH DATA MINING BERDASARKAN AKTIVITAS MAHASISWA PADA LMS MENGGUNAKAN POHON KEPUTUSAN MUTIARA SANTIKA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

PENYELESAIAN MASALAH PENGIRIMAN PAKET KILAT UNTUK JENIS NEXT-DAY SERVICE DENGAN MENGGUNAKAN TEKNIK PEMBANGKITAN KOLOM. Oleh: WULAN ANGGRAENI G

PENYELESAIAN MASALAH PENGIRIMAN PAKET KILAT UNTUK JENIS NEXT-DAY SERVICE DENGAN MENGGUNAKAN TEKNIK PEMBANGKITAN KOLOM. Oleh: WULAN ANGGRAENI G PENYELESAIAN MASALAH PENGIRIMAN PAKET KILAT UNTUK JENIS NEXT-DAY SERVICE DENGAN MENGGUNAKAN TEKNIK PEMBANGKITAN KOLOM Oleh: WULAN ANGGRAENI G54101038 PROGRAM STUDI MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1 Instrumen Penelitian Instrumen penelitian ini diperlukan agar penelitian dapat berjalan dengan lancar dan baik. Instrumen tersebut terdiri dari perangkat keras dan perangkat

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 368~372 368 PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI Adhika Novandya AMIK BSI Bekasi e-mail:

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

ABSTRAK. Kata kunci : sistem pakar, penyakit gigi, konsultasi, algoritma ID3. vi Universitas Kristen Maranatha

ABSTRAK. Kata kunci : sistem pakar, penyakit gigi, konsultasi, algoritma ID3. vi Universitas Kristen Maranatha ABSTRAK Aplikasi sistem pakar diagnosa penyakit gigi dengan pembelajaran mesin ini dibuat untuk membantu pasien dan juga pakar untuk melakukan diagnosa awal penyakit yang dialami pasien berdasarkan gejala-gejala

Lebih terperinci

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support 6 Representasi Pengetahuan Tahap ini merupakan tahap akhir dari proses KDD. Sederetan aturan atau rule disajikan kepada pengguna dengan menggunakan algoritme Rule Generation. Mulai Data transaksi Pembersihan

Lebih terperinci

MODEL SPASIAL TINGKAT KERAWANAN KEBAKARAN HUTAN DAN LAHAN (Studi Kasus di Wilayah Propinsi Kalimantan Tengah) SAMSURI

MODEL SPASIAL TINGKAT KERAWANAN KEBAKARAN HUTAN DAN LAHAN (Studi Kasus di Wilayah Propinsi Kalimantan Tengah) SAMSURI MODEL SPASIAL TINGKAT KERAWANAN KEBAKARAN HUTAN DAN LAHAN (Studi Kasus di Wilayah Propinsi Kalimantan Tengah) SAMSURI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN Dengan ini saya

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN METODE PENELITIAN Proses Dasar Sistem Proses dasar pengembangan sistem secara umum terdiri dari tahapan sebagai berikut: 1 Praproses. Pada tahap ini dilakukan persiapan yang meliputi seleksi data, transformasi

Lebih terperinci

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5 DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5 DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB I PENDAHULUAN. Kota Medan sebagai Ibukota Provinsi Sumatera Utara adalah sebagai pusat

BAB I PENDAHULUAN. Kota Medan sebagai Ibukota Provinsi Sumatera Utara adalah sebagai pusat BAB I PENDAHULUAN I.1. Latar Belakang Kota Medan sebagai Ibukota Provinsi Sumatera Utara adalah sebagai pusat kegiatan pemerintahan, sosial politik, pendidikan dan kebudayaan. Keberadaan fasilitas pendidikan

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

Bab III METODOLOGI PENELITIAN. Pada penelitian ini menggunakan ala penelitian berupa perangkat keras

Bab III METODOLOGI PENELITIAN. Pada penelitian ini menggunakan ala penelitian berupa perangkat keras Bab III METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan ala penelitian berupa perangkat keras dan perangkat lunak, yaitu: a. Perangkat keras 1. Processor Intel Core

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse 1.1.Pengumpulan data BAB IV HASIL DAN PEMBAHASAN Data yang digunakan dalam penelitian ini adalah data warehouse Graduation Universitas Muhammadiyah Yogyakarta pada Fakultas Teknik UMY tahun kelulusan 2013,

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG

METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG MUHAMMAD JAMAL MUTTAQIN 1311 201 205 PEMBIMBING DR. BAMBANG WIDJANARKO OTOK, M.SI. SANTI PUTERI RAHAYU, M.SI., PH.D.

Lebih terperinci

DETEKSI SEBARAN TITIK API PADA KEBAKARAN HUTAN GAMBUT MENGGUNAKAN GELOMBANG-SINGKAT DAN BACKPROPAGATION (STUDI KASUS KOTA DUMAI PROVINSI RIAU)

DETEKSI SEBARAN TITIK API PADA KEBAKARAN HUTAN GAMBUT MENGGUNAKAN GELOMBANG-SINGKAT DAN BACKPROPAGATION (STUDI KASUS KOTA DUMAI PROVINSI RIAU) TESIS DETEKSI SEBARAN TITIK API PADA KEBAKARAN HUTAN GAMBUT MENGGUNAKAN GELOMBANG-SINGKAT DAN BACKPROPAGATION (STUDI KASUS KOTA DUMAI PROVINSI RIAU) TRI HANDAYANI No. Mhs. : 125301914 PROGRAM STUDI MAGISTER

Lebih terperinci

PENYAJIAN SISTEM INFORMASI SPASIAL SUMBER DAYA ALAM DENGAN MENGGUNAKAN FRAMEWORK PMAPPER AMALIA RAHMAWATI G

PENYAJIAN SISTEM INFORMASI SPASIAL SUMBER DAYA ALAM DENGAN MENGGUNAKAN FRAMEWORK PMAPPER AMALIA RAHMAWATI G PENYAJIAN SISTEM INFORMASI SPASIAL SUMBER DAYA ALAM DENGAN MENGGUNAKAN FRAMEWORK PMAPPER AMALIA RAHMAWATI G64103020 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis)

PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis) , April 2011 p : -43 ISSN : 0853-811 Vol 16 No.1 PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis) Nariswari Karina Dewi 1, Utami Dyah Syafitri

Lebih terperinci

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining. Modul Praktikum WEKA Yudi Wibisono (e: yudi@upi.edu ); t: @yudiwbs Ilmu Komputer Universitas Pendidikan Indonesia (cs.upi.edu) Versi BETA : Oktober 2013 http://creativecommons.org/licenses/by-nc-sa/3.0/

Lebih terperinci

KATA PENGANTAR Aplikasi Penginderaan Jauh dalam Mendeteksi Kebakaran Hutan Menggunakan Citra Satelit Landsat

KATA PENGANTAR Aplikasi Penginderaan Jauh dalam Mendeteksi Kebakaran Hutan Menggunakan Citra Satelit Landsat KATA PENGANTAR Puji syukur penulis panjatkan kehadirat Ida Sang Hyang Widhi Wasa/Tuhan Yang Maha Esa, karena atas berkat dan rahmat-nya, penulis dapat menyelesaikan tugas akhir dengan judul Aplikasi Penginderaan

Lebih terperinci

MODEL ALOMETRIK BIOMASSA PUSPA (Schima wallichii Korth.) BERDIAMETER KECIL DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI RENDY EKA SAPUTRA

MODEL ALOMETRIK BIOMASSA PUSPA (Schima wallichii Korth.) BERDIAMETER KECIL DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI RENDY EKA SAPUTRA MODEL ALOMETRIK BIOMASSA PUSPA (Schima wallichii Korth.) BERDIAMETER KECIL DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI RENDY EKA SAPUTRA DEPARTEMEN MANAJEMEN HUTAN FAKULTAS KEHUTANAN INSTITUT PERTANIAN

Lebih terperinci

BAB I PENDAHULUAN 1.1.Latar Belakang Masalah

BAB I PENDAHULUAN 1.1.Latar Belakang Masalah BAB I PENDAHULUAN 1.1.Latar Belakang Masalah Mengingat kondisi perekonomian saat ini sedang tumbuh dan berkembang secara signifikan, di negara khususnya Indonesia, memiliki peningkatan permintaan produk

Lebih terperinci

3 METODOLOGI PENELITIAN

3 METODOLOGI PENELITIAN 19 3 METODOLOGI PENELITIAN 3.1. Kerangka Berpikir Kebakaran hutan yang sering terjadi di Indonesia berkaitan erat dengan dua faktor utama yaitu faktor alam dan faktor manusia. Kemungkinan terdapat karakteristik

Lebih terperinci

SPATIAL CO-LOCATION PATTERN DARI DATA CUACA DAN KEBAKARAN HUTAN DI ROKAN HILIR, PROVINSI RIAU SERGI ROSELI

SPATIAL CO-LOCATION PATTERN DARI DATA CUACA DAN KEBAKARAN HUTAN DI ROKAN HILIR, PROVINSI RIAU SERGI ROSELI SPATIAL CO-LOCATION PATTERN DARI DATA CUACA DAN KEBAKARAN HUTAN DI ROKAN HILIR, PROVINSI RIAU SERGI ROSELI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

ii

ii KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun

Lebih terperinci

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering. BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang

Lebih terperinci

ANALISIS TRAYEKTORI KABUT ASAP DARI KEBAKARAN LAHAN GAMBUT DI PROVINSI RIAU MENGGUNAKAN ALGORITME CLUSTERING DBSCAN DAN K-MEANS HAMIDATUL KHAIRAT

ANALISIS TRAYEKTORI KABUT ASAP DARI KEBAKARAN LAHAN GAMBUT DI PROVINSI RIAU MENGGUNAKAN ALGORITME CLUSTERING DBSCAN DAN K-MEANS HAMIDATUL KHAIRAT ANALISIS TRAYEKTORI KABUT ASAP DARI KEBAKARAN LAHAN GAMBUT DI PROVINSI RIAU MENGGUNAKAN ALGORITME CLUSTERING DBSCAN DAN K-MEANS HAMIDATUL KHAIRAT DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING

EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING Oleh: Yuandri Trisaputra G64120004 2012 Oktarina Safar Nida G14120052 2012 INSTITUT PERTANIAN BOGOR BOGOR 2016

Lebih terperinci

PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION BASED ASSOCIATION HERWANTO

PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION BASED ASSOCIATION HERWANTO PEMBANGUNAN SISTEM DATA MINING UNTUK DIAGNOSIS PENYAKIT DIABETES MENGGUNAKAN ALGORITME CLASSIFICATION BASED ASSOCIATION HERWANTO SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006 1 PERNYATAAN MENGENAI

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai

Lebih terperinci

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 4.1 Implementasi Sistem Tahap implementasi sistem merupakan tahap pembangunan perangkat lunak, tahap lanjut dari tahap perancangan sistem. Tahap yang dilakukan untuk

Lebih terperinci

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh : ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI Oleh : Frista Yulianora 1401128832 Muchammad Hasbi Latif 1401136065 Rika Jubel Febriana

Lebih terperinci

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN 3 Nilai fuzzy support bagi frequent sequence dengan ukuran k diperoleh dengan mengkombinasikan frequent sequence dengan ukuran k-1. Proses ini akan berhenti jika tidak memungkinkan lagi untuk membangkitkan

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci