PENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES

dokumen-dokumen yang mirip
BAB III METODOLOGI PENELITIAN. Dataset

BAB 3 METODE PENELITIAN

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

PENENTUAN KUALITAS IKAN BANDENG MENGGUNAKAN ALGORITMA NAIVE BAYES BERDASARKAN TEKSTUR PADA CITRA ABSTRAK

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

BAB II LANDASAN TEORI

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

BAB 2. Landasan Teori

BAB III METODE PENELITIAN

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

REKOMENDASI TOPIK TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA DI UNIVERSITAS MUHAMMADIYAH JEMBER MENGGUNAKAN METODE NAÏVE BAYESIAN CLASSIFIER

TINJAUAN PUSTAKA. Definisi Data Mining

Analisis Hubungan antar Faktor dan Komparasi Algoritma Klasifikasi pada Penentuan Penundaan Penerbangan

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

( ) ( ) (3) II-1 ( ) ( )

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

PERBANDINGAN AKURASI KLASIFIKASI TINGKAT KEMISKINAN ANTARA ALGORITMA C 4.5 DAN NAÏVE BAYES

BAB II TINJAUAN PUSTAKA

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

Prediksi Tingkat Kelulusan Mahasiswa Tepat Waktu Menggunakan Naïve Bayes: Studi Kasus UIN Syarif Hidayatullah Jakarta

BAB I PENDAHULUAN Latar Belakang

Sistem Pendukung Keputusan Untuk Mengevaluasi Internal Program Studi

SAINTEKBU: Jurnal Sains dan Teknologi Volume 9 No.2 Mei 2017 EVALUASI INTERNAL PROGRAM STUDI MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER (NBC)

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

Sekip Utara Yogyakarta * 1 2

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

SISTEM PENDUKUNG KEPUTUSAN BERBASIS DECISION TREE DALAM PEMBERIAN BEASISWA STUDI KASUS: AMIK BSI YOGYAKARTA

BAB I PENDAHULUAN 1.1 Latar Belakang

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

CONTOH KASUS DATA MINING

BAB I PENDAHULUAN 1.1 Latar Belakang

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

KLASIFIKASI PADA TEXT MINING

BAB 2 TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

BAB II KAJIAN PUSTAKA. pola seperti teknik statistic dan matematika (Larose, 2005).

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

PENERAPAN ALGORITMA KLASIFIKASI DATA MINING C4.5 PADA DATASET CUACA WILAYAH BEKASI

Implementasi Metode Klasifikasi Naïve Bayes Dalam Memprediksi Besarnya Penggunaan Listrik Rumah Tangga

PENERAPAN DATA MINING UNTUK KLASIFIKASI PENJURUSAN SEKOLAH MENENGAH ATAS PADA SMA 1 KAJEN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB III METODELOGI PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

Penentuan Kualitas Kayu Kelapa Menggunakan Algoritma Naive Bayes Berdasarkan Tekstur pada Citra

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE

PERBANDINGAN DECISION TREE

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

BAB 2 TINJAUAN PUSTAKA

BAB III METODE PENELITIAN

PENERAPAN METODE NAIVE BAYES UNTUK KLASIFIKASI JAGUNG PRODUKTIF DI GORONTALO

PENGGUNAAN METODE MULTINOMIAL NAÏVE BAYES PADA KLASIFIKASI SPAM ABSTRAK

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

Pemanfaatan Educational Data Mining (EDM)...

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

KLASIFIKASI UNTUK DIAGNOSA DIABETES MENGGUNAKAN METODE BAYESIAN REGULARIZATION NEURAL NETWORK (RBNN)

PENERAPAN NAÏVE BAYES UNTUK PREDIKSI KELAYAKAN KREDIT

THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015

Analisis perbandingan Klasifikasi penyakit jantung dengan menggunakan naïve bayes

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Penerapan Algoritma Klasifikasi Data Mining C4.5 Pada Dataset Cuaca Wilayah Bekasi

Klasifikasi Kelayakan Kredit Dengan Menggunakan Metode Naive Bayes

KLASIFIKASI PADA TEXT MINING

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB II LANDASAN TEORI

BAB III ANALISA DAN PERANCANGAN SISTEM

PARTICLE SWARM OPTIMIZATION MENINGKATKAN AKURASI NAÏVE BAYES CLASSIFIER

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

PEMETAAN SEBARAN ASAL SISWA DAN KLASIFIKASI JARAK ASAL SISWA SMA NEGERI DI KABUPATEN PRINGSEWU MENGGUNAKAN METODE NAÏVE BAYES

Klasifikasi Proses Penjurusan Siswa Tingkat SMA Menggunakan Data Mining

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

Technologia Vol 7, No.3, Juli September OPTIMASI KLASIFIKASI PENILAIAN AKREDITASI LEMBAGA KURSUS MENGGUNAKAN METODE K-NN DAN NAIVE BAYES

SISTEM PREDIKSI PENGUNDURAN DIRI PESERTA DIDIK MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER

BAB II LANDASAN TEORI

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

Transkripsi:

PENERAPAN DATA MINING UNTUK MENENTUKAN POTENSI HUJAN HARIAN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES Ahmad Subhan 1, Ahmad Zainul Fanani 2 1,2 Teknik Informatika, Ilmu Komputer, Universitas Dian Nuswantoro Semarang, Jl. Nakula I No. 5-11, Semarang, 50131, Indonesia E-mail : jl.pati.tayu@gmail.com 1, a.zainul.fanani@dsn.dinus.ac.id 2 Abstrak Cuaca adalah kondisi udara di suatu tempat pada waktu relatif singkat, yang dinyatakan dengan nilai parameter seperti kecepatan angin, suhu, tekanan, curah hujan, dan fenomena atmosfer lainnya sebagai komponen utama. Jalannya aktivitas manusia dapat dipengaruhi oleh kondisi cuaca, seperti bidang transportasi, bidang pertanian, bidang perkebunan, bidang bangunan atau bahkan bidang olah raga sekalipun. Oleh karena itu penentuan cuaca untuk mendapatkan informasi cuaca perlu dibuat sehingga dapat dimanfaatkan oleh masyarakat. Pembangunan sistem klasifikasi otomatis dapat dibangun menggunakan metode naive bayes berdasarkan pada analisis data cuaca untuk menentukan cuaca hujan atau tidak hujan. Dan hasil pengujian menunjukkan bahwa klasifikasi penentuan cuaca harian dengan menggunakan metode naive bayes mendapatkan nilai akurasi sebesar 82.5136612021858% dengan nilai recall sebesar 82.6544559868781% dan presisi sebesar 80.0427565392354%. Kata kunci : Data Mining, Klasifikasi, Penentuan Hujan Harian, Naive Bayes, Confusion Matrix Abstract The weather is the condition of the air somewhere in a relatively short time, expressed with a value of parameters such as wind speed, temperature, pressure, rainfall, and other atmospheric phenomena as main componen. The course of human activity can be affected by weather conditions, such as the fields of transport, agriculture, plantations, construction field or even field of sports though. Therefore, the determination of the weather to get the weather information needs to be made so that it can be utilized by the community. Development of automated classification system can be built using Naive Bayes method is based on analysis of weather data to determine weather rain or no rain. And the test results show that the determination of daily weather classification using Naive Bayes method gets an accuracy of 75.3424657534247% with recall value for 82.6544559868781% and precision of 80.0427565392354%. Keywords: Data Mining, Classification, Determination Of Daily Rain, Naive Bayes, Confusion Matrix 1. PENDAHULUAN 1 Cuaca adalah kondisi udara di suatu tempat pada waktu relatif singkat, yang dinyatakan dengan nilai parameter seperti kecepatan angin, suhu, tekanan, curah hujan, dan fenomena atmosfer lainnya sebagai komponen utama [1]. Cuaca merupakan hal penting yang tidak akan pernah lepas dari kehidupan manusia. Jalannya aktivitas manusia dapat dipengaruhi oleh kondisi cuaca, seperti bidang transportasi, bidang pertanian, bidang perkebunan, bidang bangunan atau bahkan bidang olah raga sekalipun. Misal keputusan waktu yang baik untuk mencocok tanam, penentuan waktu yang baik untuk melakukan pertandingan sepak bola, bahkan penentuan waktu yang tepat untuk akad nikah. Besarnya pengaruh yang ditimbulkan oleh cuaca mendorong perkembangan sistem penentuan cuaca yang menentukan kondisi cuaca. Pendekatan yang didukung menggunakan teknologi yang tersedia merupakan penerapan sistem penentuan cuaca yang ada saat ini [2]. Penentuan cuaca adalah proses penerapan ilmu serta teknologi untuk menentukan keadaan

atmosfer bumi. Proses penentuan cuaca menggunakan metode untuk menghasilkan output penentuan cuaca [3]. Penggunaan metode yang baik, akhir-akhir ini menjadi kegiatan yang sering dikerjakan oleh para peneliti cuaca atau atmosfer. Untuk mendapatkan hasil yang lebih baik dan lebih akurat, para peneliti terdorong untuk terus menerus melakukan penelitian terkait atmosfer cuaca dan mengembangkan metodemetode untuk memenuhi kebutuhan akan informasi kondisi cuaca atau atmosfer [1]. Naive Bayes Clasifier (NBC) adalah suatu metode pembelajaran supervised yang handal, mudah, efektif, efisien dan mengatasi derau data seperti atribut yang kurang atau tidak relevan. Dataset yang besar baik yang atribut variabel diskrit atau kontinu juga dapat ditangani oleh Naive bayes clasifier [4] [5]. Penggunaan algoritma ini diharapkan akan mempermudah proses penentuan cuaca dengan akurasi yang baik. 2. METODE PENELITIAN Penelitian ini menggunakan beberapa metode yang bertujuan untuk menyelesaikan masalah yang ada dalam penelitian ini. Metode yang diusukan dalam penelitian ini adalah sebagai berikut : 2.1. Pengolahan Awal Data (Preparation Data) Di dalam penelitian ini, ada beberapa tahap yang harus dikerjakan terhadap data yang sudah diperoleh dalam data tersebut, semua data atau record dan atribut tidak digunakan semua, data atau record dan atribut harus melalui beberapa tahap pengolahan awal data (preparation data). Sehingga mendapatkan data yang berkualitas, beberapa teknik yang dikerjakan sebagai berikut [6] : a. Data Cleaning Data yang baik dan berkualitas adalah kunci dasar untuk menghasilkan data yang berkualitas, data nois data yang masih outliers atau eror, data incomplete data yang nilai atributnya hilang, dan data inconsistent data yang tidak konsisten di dalam pengisian atributnya. 1. Tahapan-tahapan dalam data cleaning: 2. Menghilangkan atau identifikasi outliers dan menghilangkan data nois. 3. Melengkapi nilai-nilai yang tidak lengkap atau hilang (missing value), algoritma naive bayes mempunyai keunggullan tersendiri yaitu dapat menangani data yang tidak lengkap atau hilang (missing value) 4. Data yang tidak konsisten diperbaiki. 5. Memecah redundansi yang disebabkan oleh interogasi data. b. Data intergration and transformasion Langkah selanjutnya adalah integration teknik yang digunakan untuk menganalisis data korelasi, atribut yang redudan dan duplikat data, dan transformation digunakan untuk meningkatkan akurasi dan efisiensi algoritma. Kelebihan algoritma naive bayes adalah dapat memproses data yang bernilai nominal, kontinyu, dan ordinal. Oleh karena itu nilai dari setiap atribut yang terdapat dalam dataset tidak usah di transformasikan. c. Data reduction Data rection adalah proses mereduksi dataset dengan cara mengurangi jumlah atribut atau record yang tidak diperlukan agar lebih sedikit namun tetap bersifat informatif. Mendapatkan representasi dalam volume data yang dikurangi namun masih mendapatkan hasil analitis yang sama atau serupa dan deskritasi data yang merupakan bagian dari reduksi data, bagian yang penting untuk data numerik. 2.2. Metode Klasifikasi dan Algoritma Naive Bayes Klasifikasi dapat didefinisikan dengan detail sebagai suatu kegiatan melakukan pembelajaran atau pelatihan terhadap fungsi f yang memetakan vektor x ke dalam suatu dari beberapa label y kelas yang tersedia. Kegiatan tersebut akan memberikan hasil suatu model yang selanjutnya disimpan sebagai model [7]. Model yang dibuat pada saat pembelajaran selanjutnya dapat digunakan untuk menentukan label kelasnya. Selama proses pembelajaran dalam pembuatan model, diperlukan suatu algoritma pembelajaran antara lain yaitu: KNN, SVM, Naive Bayes, Decission Tree, dan lain sebagainya [7]. Naive Bayes Classifier (NBC) juga disebut sebagai Bayesian Classification adalah metode Pengklasifikasian statistik yang berguna untuk proses menentukan probabilitas suatu keanggotaan dari suatu class. Teorema Bayes mendasari Naive Bayes Classifier yang mempunyai kemampuan klasifikasi yang serupa

dengan Decision Tree dan Neural Network. NBC juga efisien, efektif, dan handal menangani derau data seperti atribut yang tidak relevan. NBC juga bisa mengatasi dataset besar baik dengan atribut variabel maupun kontinu [4] [5]. Cara kerja NBC secara umum berdasarkan bentuk umum teorema bayes sebagai berikut [5]: P(C i X) = P(X C i)p(c i ) P(X) Dimana dalam hal ini: (1) C i = hipotesis data X merupakan suatu kategori/class spesifik. X = data dengan class yang belum diketahui. P(C i X) = probabilitas hipotesis C i berdasarkan kondisi X (posteriori probability). P(X C i ) = probabilitas X berdasarkan kondisi pada hipotesis C i. P(C i ) = probabilitas hipotesis C i (prior probability). P(X) = probabilitas dari data X. Pada data yang nilainya normal maka penggunaan metode sebelumnya berjalan secara langsung sebagai mana mestinya. Tetapi untuk tipe data numerik ada tambahan pekerjaan. Asumsi nilai numerik bahwa mereka memiliki probabilitas distribusi yang normal atau Gaussian dengan cara menghitung nilai dari rerata µ serta standar deviasi σ di setiap class. Yang didefinisikan dengan [8] [9]: g (x, µ, σ) = 1 σ 2π e (x µ)2 2(σ2) (2) Dan bisa disimpulkan pencarian probabilitas X tergantung kondisi dari hipotesis C i : P(X k C i ) = g (x k, µ i, σ i ) (3) 2.3. Pengukuran akurasi, Recall, dan Presisi Tujuan dari pengukuran akurasi adalah untuk mengetahui kinerja dari Algoritma Naive Bayes dalam menentukan cuaca dalam mengklasifikasi data ke dalam kelas yang telah ditentukan. Sehingga mengetahui kinerjanya maka diperlukannya suatu metode perhitungan kinerja yaitu dengan menggunakan metode confusion matrix. Confusion Matrix yaitu mempresentasikan hasil evaluasi model dengan menggunakan tabel matriks, jika dataset terdiri dari dua kelas, maka kelas pertama dianggap positif, dan kelas kedua dianggap negatif. Evaluasi dari Confusion Matrix tersebut menghasilkan nilai Akurasi, Precision, dan Recall [10]. Tabel 1 : Confusion Matrix Correct Classified as Classification + - + True positives False negatives - False positives True negatives Pada tabel 1, True Positive (TP) adalah jumlah record positif dalam dataset yang diklasifikasi positif. True Negative (TN) adalah jumlah record negatif dalam dataset yang diklasifikasikan negatif. False Positive (FP) adalah jumlah record negatif dalam dataset yang diklasifikasikan positif. False Negative (FN) adalah ulah record positif yang diklasifikasikan negatif [10]. Berikut adalah persamaan model Confusion Matrix: Nilai akurasi adalah persentase jumlah record data yang diklarifikasikan dengan benar oleh suatu algoritma klasifikasi [9]. Nilai recall digunakan untuk membandingkan True Positive dengan tupel positif. Sedangkan nilai presisi adalah proposisi kasus dengan hasil diagnosa positif [10]. Perhitungan nilai akurasi didefinisikan dengan persamaan sebagai berikut: Akurasi = Recall = Presisi = TP + TN TP + TN + FP + FN TP TP + FN TP TP + FP (4) (5) (6) Dalam hal ini dijelaskan bahwa: TP = jumlah dari data yang terklasifikasi di kelas yang benar. TN = jumlah dari data yang terklasifikasi di kelas sebaliknya yang benar. FP = jumlah data yang dianggap berada di kelas yang benar oleh sistem padahal seharusnya data tersebut berada di

kelas yang sebaliknya. FN = jumlah data yang dianggap berada di kelas yang sebaliknya oleh sistem padahal seharusnya data tersebut berada di kelas yang benar. 3. HASIL DAN PEMBAHASAN 3.1. Pengolahan data Dalam melakukan eksperimen ini diperlukan data cuaca sebanyak 761 data yakni data cuaca dari bulan Januari tahun 2015 sampai bulan Desember tahun 2016 yang digunakan sebagai dataset. Dataset tersebut didapatkan dari situs http://www.ogimet.com. Situs tersebut merupakan situs serupa yang digunakan oleh penelitian [11] dalam memperoleh data penelitiannya. Sebelum dilakukan proses klasifikasi, data atau record dan atribut harus melalui beberapa tahap pengolahan awal data (preparation data). Sehingga mendapatkan data yang berkualitas. Pada data yang tidak lengkap atau hilang menyebabkan ketidakbenaran atau bahkan kekeliruan, oleh karena itu untuk mendapatkan data yang berkualitas, beberapa tahap pengolahan data awal (preparation data) dilakukan sebagai berikut: a. Data Cleaning Proses penghapusan data yang tidak lengkap (Incomplete data), data noise, dan nilai atribut yang hilang yaitu sebesar 30 record. b. Reduksi Data Menghapus data noise dan memecah redudansi data dengan cara menghapus atribut dan nilai yang kurang penting. Menghapus atribut Date (tanggal) tidak akan memberi informasi yang dibutuhkan dalam mining. Berikut ini adalah hasil dari proses pengolahan data awal (preparation data) yaitu Data Cleaning dan Reduksi Data. Didapatkan dari 761 record menjadi 731 record dan dari 12 atribut menjadi 11 atribut yaitu 10 atribut numerik dan 1 atribut kategorial. Atribut numerik adalah atribut yang domainnya berupa bilangan integer atau riil, nilai modelnya yaitu Temperature MAX, Temperature MIN, Temperature Mean, Hr. Med, Wind Max, Wind Mean, Pressure SLP, Pressure STN, Vis, dan Prec. Atribut kategorial adalah adalah atribut yang domainnya merupakan sebuah himpunan, nilai himpunannya adalah Diary yang merupakan label target. Langkah berikutnya yaitu membagi keseluruhan 731 dataset cuaca menjadi dua bagian yaitu data traning dan data testing. Berdasarkan keseluruhan dataset cuaca yang ada, selanjutnya dibagi dengan komposisi perbandingan 75% untuk data traning dan 25% untuk data testing, pembagian tersebut berdasarkan pada penelitian [12]. Sehingga data traning yaitu sebanyak 548 record dan data testing sebanyak 183 record. 3.2. Hasil Implementasi Dari hasil eksperimen yang telah dilakukan menggunakan metode naive bayes, didapatkan hasil kecocokan data testing antara hasil dari metode yang diusulkan dengan menggunakan 182 data cuaca uji dan kondisi cuaca sebenarnya. Hasil dari pencocokan data uji tersebut kemudian dimasukkan ke dalam tabel confusion matriks. Berdasarkan tabel 2 maka nilai akurasi dapat dihitung menggunakan perhitungan berikut: Tabel 2 Confusion Matriks True Hujan True Tidak Hujan Pred Hujan 49 10 Pred Tidak Hujan 22 102 Akurasi menyatakan bahwa nilai rasio jumlah data cuaca yang diklasifikasi di kelas secara benar (true positive) dan jumlah dari data yang terklasifikasi di kelas yang sebaliknya (true negative) dengan seluruh data cuaca diklasifikasikan. 1. Menghitung Akurasi Nilai akurasi adalah proporsi jumlah prediksi yang benar [10]. Dihitung menggunakan persamaan (4) sebagai berikut: Akurasi = TP + TN TP + TN + FP + FN (4) Akurasi = 151 x 100% = 82.5136612021858 % 183 2. Menghitung Recall Nilai recall digunakan untuk membandingkan True Positive dengan tupel positif [10]. Dihitung dengan menggunakan persamaan (5) sebagai berikut:

TP Recall = TP + FN (5) Recall Hujan = 49 x 100% = 83.0508474576271% 59 Recall Tidak Hujan = 102 x 100% = 82.258064516129% 124 5. SARAN Berdasarkan hasil pembahasan dan analisis pada penelitian tersebut, maka peneliti memberikan saran untuk penelitian selanjutnya yang diharapkan bisa dijadikan dasar untuk mengembangkan penelitian ini yaitu: 3. Menghitung Presisi Nilai presisi adalah proposisi kasus dengan hasil diagnosa positif [10]. Dihitung dengan menggunakan persamaan (6) sebagai berikut: Presisi = TP TP + FP (6) Presisi Hujan = 49 x 100% = 69.0140845070423% 71 Presisi Tidak Hujan = 91.0714285714286% 102 112 x 100% = Dari pengujian 183 data uji menggunakan metode naive bayes didapatkan akurasi sebesar 82.5136612021858% dengan nilai recall sebesar 82.6544559868781% dan presisi sebesar 80.0427565392354%. Hal ini menunjukkan bahwa penggunaan metode naive bayes dalam menentukan cuaca harian dapat digunakan sebagai sistem klasifikasi cuaca harian. 4. KESIMPULAN Berdasarkan hasil dari eksperimen penelitian penentuan cuaca harian dengan menggunakan metode naive bayes telah dilakukan, sehingga dapat disimpulkan beberapa hal sebagai berikut: 1. Dari hasil pengujian menunjukkan bahwa klasifikasi penentuan cuaca harian dengan menggunakan metode naive bayes mendapatkan nilai akurasi sebesar 82.5136612021858% dengan nilai recall sebesar 82.6544559868781% dan presisi sebesar 80.0427565392354%. 2. Dari hasil penelitian dan pengujian yang telah dilakukan, maka metode yang diusulkan pada penelitian ini yaitu klasifikasi cuaca harian (Hujan dan Tidak Hujan) dengan menggunakan metode naive bayes dapat digunakan untuk menentukan cuaca harian (Hujan dan Tidak Hujan). 1. Perlu adanya penelitian pada tahap selanjutnya, yaitu dengan menggunakan metode lain atau menggabungkan beberapa metode sehingga diharapkan dapat meningkatkan akurasi dengan menutup kekurangan-kekurangan metode yang telah digunakan sebelumnya. 2. Diharapkan penelitian selanjutnya memperbanyak dataset supaya hasil yang didapat lebih akurat. DAFTAR PUSTAKA [1] N. E. Sari dan E. Sukirman, Prediksi Cuaca Berbasis Logika Fuzzy Untuk Rekomendasi Penerbangan Di Bandar Dara Raja Haji Fisabilillah, 2011. [2] H. Maharan, Konstruksi Bayesian Network Dengan Algoritma K2 Pada Kasus Prediksi Cuaca, 2015. [3] R. Chaniago, T. H. Liong dan K. R. R. Wardani, Prediksi Cuaca Menggunakan Metode Case Based Reasoning dan Adaptive Neuro Fuzzy Inference System, Jurnal Informatika, vol. 12, 2014. [4] Y. Yang and G. I. Webb, On Why Discretization Works for Naive-Bayes Classifier, 2003. [5] K. dan E. T. Luthfi, Algoritma Data Mining, Yogyakarta: Penerbit Andi, 2009. [6] D. c. Mahendra dan A. W. Kurniawan, Klasifikasi Data Debitur Untuk Menentukan Kelayakan Kredit Dengan Menggunakan Metode Naive Bayes, 2015.

[7] E. Prasetyo, DATA MINING - Mengolah Data Menjadi Informasi Menggunakan Matlab, Yogyakarta: ANDI, 2014. [8] I. H. Witten, E. Frank dan M. A. Hall, Data Mining Practical Machine Learning Tools and Techniques, Burlington: Morgan Kaufmann, 2011. [9] J. Han, M. Kamber dan J. Pei, Data Mining Concepts and Techniques, Waltham: Morgan Kaufmann, 2012. [10] D. T. Wahyuni, T. Sutojo dan A. Luthfiarta, Prediksi Hasil Pemilu Legislatif Dki Jakarta Menggunakan Naïve Bayes Dengan Algoritma Genetika Sebagai Fitur Seleksi, 2014. [11] S. Mujiasih, Pemanfatan Data Mining Untuk Prakiraan Cuaca, 2011. [12] M. G. Salman, B. Kanigoro dan Y. Heryadi, Weather Forecasting using Deep Learning Techniques, 2015.