PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED

Ukuran: px
Mulai penontonan dengan halaman:

Download "PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED"

Transkripsi

1 PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED Studi Kasus Perilaku Seksual Remaja di Indonesia Hasil SDKI 2012 Yogo Aryo Jatmiko 1, Septiadi Padmadisastra 2, Anna Chadidjah 3 Prodi Magister Statistika Terapan, Universitas Padjajaran, Bandung 1,2,3 yj29289@gmail.com ABSTRAK Random Forest merupakan salah satu metode ensemble untuk meningkatkan ketepatan klasifikasi suatu data. Kinerja klasifikasi suatu data umumnya dievaluasi menggunakan ukuran akurasi data. Namun, hal ini menjadi kurang tepat ketika data yang digunakan merupakan data yang imbalanced. Salah satu cara untuk mengatasi hal ini adalah dengan melakukan resample pada data asli, yaitu over-sampling pada kelas minoritas atau undersampling pada kelas mayoritas. Selain kedua metode diatas, terdapat metode hybrid Synthetic Minority Over-sampling Technique (SMOTE), yaitu suatu metode kombinasi dari over-sampling pada kelas minoritas dan under-sampling pada kelas mayoritas. Perbedaan teknik sampling tentunya memberikan perbedaan dalam keakuratan dan ketepatan hasil klasifikasi prediksi. Tujuan dari penelitian ini adalah membandingkan beberapa teknik sampling dalam Machine Learning menggunakan metode Random Forest pada data imbalanced. Aplikasi dilakukan pada kelas imbalanced perilaku seksual remaja berdasarkan hasil SDKI Berdasarkan hasil penelitian, ketiga metode meningkatkan presisi, recall, dan sensitivity hasil klasifikasi dibandingkan dengan data asli. Kata kunci: Random Forest, Over-sampling, Under-sampling, SMOTE, SDKI PENDAHULUAN Metode ensemble merupakan sebuah metode dengan gagasan melakukan berbagai macam gabungan kombinasi dari banyak pemilah tunggal (classifier) menjadi sebuah prediksi akhir berdasarkan proses voting mayoritas. Random Forests (RF) adalah salah satu metode ensemble dalam pohon keputusan yang merupakan pengembangan dari metode Bootsrap Aggregating (Bagging). Berbeda dengan Bagging, Random Forest dikembangkan dengan gagasan perlu adanya penambahan layer pada proses resampling acak pada Bagging. Oleh karena itu, bukan hanya data sampel yang diambil secara acak untuk membentuk pohon klasifikasi, tetapi juga variabel prediktor diambil sebagian secara acak dan baru dipilih sebagai pemilah terbaik saat penentuan pemilah pohon, sehingga diharapkan menghasilkan prediksi yang lebih akurat [1]. Random Forests (RF) merupakan salah satu metode ensemble untuk meningkatkan akurasi suatu klasifikasi data dari sebuah pemilah tunggal yang tidak stabil melalui kombinasi banyak pemilah dari suatu metode yang sama dengan proses voting untuk memperoleh prediksi klasifikasi akhir [2]. Ukuran kinerja ketepatan klasifikasi dari sebuah algoritma Machine Learning seperti Random Forest biasanya dievaluasi menggunakan ukuran akurasi. Namun, hal ini menjadi tidak tepat ketika dataset yang digunakan merupakan sebuah data yang imbalanced [3]. Data imbalanced adalah suatu kondisi dimana kategori klasifikasi tidak 398

2 terwakili secara seimbang [3]. Sebagai gambaran, pada 100 baris data dalam suatu dataset klasifikasi kelas biner, sebanyak 80 baris berkode kelas 1 dan 20 sisanya berkode kelas 2. Kondisi ini merupakan kondisi sebuah dataset yang imbalanced karena rasio antara kelas 1 terhadap kelas 2 adalah 80:20 atau 4:1. Imbalanced merupakan kejadian yang biasa dalam suatu dataset, namun ketika perbandingan kelas seperti 4:1 diatas, dataset imbalanced bisa menyebabkan masalah seperti Accuracy Paradox [4]. Accuracy Paradox untuk analisis prediktif menyatakan bahwa model prediktif dengan tingkat akurasi tertentu mungkin memiliki daya prediksi lebih besar daripada model dengan tingkat akurasi yang lebih tinggi. Dalam kondisi seperti ini lebih baik menggunakan ukuran ketepatan klasifikasi yang lain selain ukuran akurasi, seperti presisi dan recall [4]. Komunitas Machine Learning menanggapi permasalahan kelas yang imbalanced melalui dua pendekatan [3]. Pendekatan pertama adalah dengan menetapkan biaya yang berbeda untuk contoh-contoh training. Pendekatan lain adalah dengan melakukan resample pada data asli, baik melalui over-sampling pada kelas minoritas, undersampling pada kelas mayoritas maupun dengan memadukan under-sampling pada kelas mayoritas dengan bentuk khusus dari over-sampling pada kelas minoritas, yang dikenal dengan Synthetic Minority Over-sampling Technique (SMOTE) [3]. Sebagai bagian dari masyarakat, remaja merupakan bagian yang sedang mengalami perubahan baik perubahan fungsi organ tubuh maupun perubahan fungsi sosial. Tiga Permasalahan Kesehatan Reproduksi Remaja (TRIAD KRR) merupakan masalah yang menonjol dikalangan remaja, yaitu seputar seksualitas, HIV dan AIDS, serta Napza. Rendahnya pengetahuan remaja tentang Kesehatan Reproduksi Remaja (KRR) menimbulkan kegiatan seksual yang tidak bertanggung jawab dikalangan remaja. Setiap tahunnya remaja meninggal dunia karena kehamilan dan komplikasi persalinan di seluruh dunia [5]. Hal ini ditunjukkan oleh hasil SDKI 2012 dimana terdapat 0,9 persen remaja wanita dan 8,3 persen remaja pria belum kawin di Indonesia yang pernah melakukan hubungan seksual [6]. Persentase remaja yang melakukan hubungan seksual di luar nikah masih jauh lebih kecil dibandingkan jumlah seluruh remaja di Indonesia. Hal ini menyebabkan dataset perilaku seksual remaja memilki kelas yang imbalanced. Berdasarkan latar belakang yang telah dipaparkan, penelitian ini bertujuan untuk membandingkan beberapa teknik sampling (over-sampling, under-sampling dan SMOTE) dalam Machine Learning menggunakan metode Random Forest pada kelas imbalanced perilaku seksual remaja di Indonesia hasil SDKI

3 2. METODE PENELITIAN 2.1 Data dan Variabel Penelitian Analisis ini menggunakan data dengan sampel sebanyak 1500 secara Simple Random Sampling (SRS) dari dataset hasil SDKI 2012 dengan responden remaja berumur tahun dan status belum kawin/belum hidup bersama, baik data remaja laki-laki ataupun perempuan. Data-data dari SDKI 2012 memberikan informasi yang lengkap mengenai perilaku maupun pengetahuan tentang hubungan seksual pranikah remaja yang terjadi di Indonesia. Variabel yang digunakan dalam analisis ini adalah sebagai berikut: 1) Variabel tak bebas (Y): Remaja pernah atau tidak melakukan hubungan seksual di luar nikah (pernah =0 ; tidak pernah =1) 2) Variabel bebas (X) terdiri dari: a. Klasifikasi daerah kota/desa (1 = kota ; 0 = desa) b. Umur c. Jenis Kelamin (laki-laki = 1 ; perempuan = 0) d. Merokok ( Ya = 1 ; tidak = 0) e. Mengonsumsi alkohol (pernah = 1 ; tidak pernah = 0) f. Mengonsumsi narkoba (pernah = 1 ; tidak pernah = 0) g. Pernah/tidak pacaran (pernah =1 ; tidak pernah = 0) h. Sekolah (masih sekolah = 1 ; tidak sekolah lagi = 0) i. Tingkat Pendidikan (pernah sekolah SLTP ke atas = 1 ; lulus SD ke bawah = 0) j. Komunikasi kesehatan reproduksi dengan Ibu (Ya = 1 ; Tidak = 0) k. Komunikasi kesehatan reproduksi dengan Bapak (Ya = 1 ; Tidak = 0) l. Komunikasi kesehatan reproduksi dengan Saudara Kandung (Ya = 1 ; Tidak = 0) m. Mempunyai teman yang pernah atau tidak melakukan hubungan seksual di luar nikah (Ya =1 ; Tidak =0) Penelitian ini terbatas pada data-data hasil pengolahan data SDKI remaja laki-laki dan perempuan tahun Data remaja perempuan diambil dari data Wanita Usia Subur (WUS) yang berumur tahun dan status perkawinannya belum kawin. Variabel yang dipilih merupakan hasil pengolahan data SDKI dengan mempertimbangkan validitas serta untuk observasi-observasi yang mengandung missing value tidak disertakan dalam analisis. 2.2 Random Forest Random Forests (RF) merupakan salah satu metode ensemble untuk meningkatkan akurasi suatu klasifikasi data dari sebuah pemilah tunggal yang tidak stabil melalui kombinasi banyak pemilah dari suatu metode yang sama dengan proses voting untuk memperoleh prediksi klasifikasi akhir [2]. Istilah Random Forests diusulkan pertama kali oleh Tin Kam Ho dari Bell Labs pada tahun Pengembangan Random Forests dilakukan oleh Leo Breiman pada tahun 2001 dari proses Bootsrap Aggregating atau yang lebih popular dengan sebutan Bagging. Dalam proses bagging digunakan resampling bootstrap untuk membangkitkan pohon klasifikasi yaitu suatu teknik bangkitan dengan banyak versi yang kemudian 400

4 mengkombinasikannya untuk memperoleh prediksi akhir. Sedangkan dalam metode Random Forests proses pengacakan tidak hanya dilakukan pada data sampel saja melainkan juga pada pengambilan variabel bebas sehingga pohon klasifikasi yang dibangkitkan akan memiliki ukuran dan bentuk yang berbeda-beda [1]. Berikut merupakan algoritma Random Forest menurut Liaw dan Wiener [1]. 1. Mengambil n data sampel dari dataset awal dengan teknik resampling bootstrap dengan pengembalian. 2. Untuk setiap dataset hasil resampling bootstrap, buat sebuah pohon klasifikasi tanpa melalui proses pruning, dengan melakukan modifikasi berikut a. Pada setiap node, penentuan pemilah terbaik didasarkan pada variabel-variabel prediktor yang diambil secara acak mtry. b. Jumlah variabel yang diambil secara acak (m) dapat ditentukan melalui perhitungan 1 m atau m [8] Melakukan prediksi klasifikasi data sampel berdasarkan pohon klasifikasi yang terbentuk. 4. Mengulangi langkah 1 sampai dengan langkah 3 sejumlah K pohon klasifikasi yang diinginkan. 5. Melakukan prediksi klasifikasi data sampel akhir dengan mengkombinasikan hasil prediksi sejumlah K pohon klasifikasi yang didapatkan berdasarkan aturan majority vote. 2.3 Teknik Sampling Kelas Imbalanced Beberapa teknik sampling dalam Machine Learning yang digunakan untuk mengatasi kelas imbalanced. 1. Under-sampling Suatu metode sampling dimana metode yang digunakan dalam kategori ini berisi resampling eliminasi dari kelas mayoritas secara acak sampai jumlahnya sebanyak contoh dari kelas lainnya (kelas minoritas) [7]. 2. Over-sampling Suatu metode sampling dimana metode yang digunakan dalam kategori ini berisi resampling dari kelas minoritas secara acak sampai jumlahnya sebanyak contoh dari kelas lainnya (kelas mayoritas) [7]. 3. Synthetic Minority Over-sampling Technique (SMOTE) Suatu metode sampling dimana kelas minoritas dilakukan over-sampling dengan membuat sampel sintetis daripada dilakukan over-sampling dengan melakukan duplikasi pada data sebenarnya. Tergantung kepada jumlah over-sampling yang dibutuhkan, neighbours dari k- nearest neighbours dipilih secara acak. Berikut adalah algoritma SMOTE menurut Chawla [3] Algorithm SMOTE(T, N, k) Input: Jumlah sampel kelas minoritas T; Jumlah SMOTE N%; Jumlah nearest neighbors k Output: (N/100)* T sampel kelas minoritas buatan 1. ( Jika N kurang dari 100%, acak sampel kelas minoritas karena hanya persentase acaknya yang akan diambil SMOTE. ) 2. if N < then Randomize the T minority class samples 4. T = (N/100) T 5. N = endif 7. N = (int)(n/100) ( Jumlah SMOTE adalah kelipatan integral dari 100. ) 8. k = Jumlah nearest neighbors 9. numattrs = Jumlah attributes 10. Sample[ ][ ]: array untuk sampel kelas minoritas yang asli 11. newindex: menyimpan hitungan jumlah sampel sintetis yang dihasilkan, diinisialisasi ke Synthetic[ ][ ]: array untuk sampel sintetis ( Menghitung k nearest neighbors untuk setiap sampel kelas minoritas. ) 401

5 13. for i 1 to T 14. Menghitung k nearest neighbors for i, Dan simpan indeks dalam nnarray 15. Populate(N, i, nnarray) 16. endfor Populate(N, i, nnarray) ( Fungsi untuk membangkitkan sampel sintetis. ) 17. while N!= Pilih angka random antara 1 dan k, sebut saja nn. (*Langkah ini memilih salah satu k nearest neighbors dari i.*) 19. for attr 1 to numattrs 20. Hitung: dif= Sample[nnarray[nn]][attr] Sample[i][attr] 21. Hitung: gap = random number between 0 and Synthetic[newindex][attr] = Sample[i][attr] + gap dif 23. Endfor 24. newindex N = N Endwhile 27. return ( Akhir Populasi. ) 2.4 Ukuran Ketepatan Klasifikasi Pengukuran ketepatan klasifikasi diukur melalui beberapa ukuran, yaitu, sensitivitas, spesifikasi, G- means, Apparent Error Rate (APER) dan total accuracy rate (1-APER) yang dihitung berdasarkan Tabel Klasifikasi [9]. Bentuk umum Tabel Klasifikasi adalah sebagai berikut: Tabel 1. Tabel Klasifikasi Aktual Prediksi 0 1 Total 0 n 11 n 12 n 1. 1 n 21 n 22 n 2. Total n.1 n.2 N Dimana, n 11 = jumlah observasi dari kelas 1 yang tepat diprediksi sebagai kelas 1 n 22 =jumlah observasi dari kelas 2 yang tepat diprediksi sebagai kelas 2 n 12 = jumlah observasi dari kelas 1 yang salah diprediksi sebagai kelas 2 n 21 =jumlah observasi dari kelas 2 yang salah diprediksi sebagai kelas 1 n 1. = jumlah observasi dari kelas 1 n 2. = jumlah observasi dari kelas 2 N= jumlah observasi 402

6 Berdasarkan Tabel 1, persamaan untuk menghitung ketepatan klasifikasi berupa sensitivitas, spesifikasi, G-means, Apparent Error Rate (APER) dan total accuracy rate (1-APER) adalah sebagai berikut: n 11 (1) Sensitivitas (dalam %) = 100% n n (2) Spesifikasi (dalam %) = 100% n 2. G means = sensitivitas spesifikasi (3) n 21 + n 12 Apparent Error Rate (APER) (dalam %) = 100% N n 11 + n 22 total accuracy rate (1 APER) (dalam %) = 100% N Dikarenakan dataset yang digunakan merupakan dataset yang imbalanced, sehingga kemungkinan terjadi accuracy paradox sehingga perlu digunakan ukuran lain seperti presisi dan recall. Tabel 2. Tabel Klasifikasi Aktual Prediksi Negatif Positif Negatif TN FP Positif FN TP (4) (5) Dimana, TN= True Negative = jumlah observasi negatif yang tepat diprediksi TP= True Positive = jumlah observasi positif yang tepat diprediksi FN= False Negative = jumlah observasi negatif yang salah diprediksi sebagai positif FP= False Positive = jumlah observasi positif yang salah diprediksi sebagai negatif Berdasarkan tabel 2. Rumus presisi dan recall adalah sebagai berikut [3]: TP Presisi (dalam %) = 100% TP + TP recall (dalam %) = 100% TP + Tujuan utama pada data training dari dataset imbalanced adalah untuk meningkatkan recall tanpa mempengaruhi presisi. Namun, tujuan dari presisi dan recall sering berseberangan, karena ketika meningkatkan nilai true positive untuk kelas minoritas, jumlah dari false positive juga meningkat, ini akan menyebabkan nilai presisi berkurang. (6) (7) 403

7 3. HASIL DAN PEMBAHASAN Hasil perhitungan klasifikasi pada Tabel 3. menunjukkan bahwa 1-APER random forest pada data asli (original) bernilai 0,9109 atau dengan kata lain, data sampel yang tepat diklasifikasikan secara keseluruhan sebanyak 91,09 persen dengan metode random forest. Lebih detil, akurasi klasifikasi lainnya perlu diperhatikan juga, mengingat data yang digunakan merupakan dataset yang imbalanced. Sensitivity random forest pada data asli bernilai 0 yang artinya tidak ada data sampel remaja yang pernah melakukan hubungan seksual pranikah yang tepat diklasifikasikan pernah melakukan hubungan seksual pranikah. adapun nilai specificity random foret pada data asli bernilai 0,9976 yang artinya sebanyak 99,76 persen remaja yang tidak pernah melakukan hubungan seksual pranikah tepat diklasifikasikan tidak pernah. Keseimbangan akurasi prediksi diukur dari nilai G- means yang biasa digunakan untuk mengukur permasalahan data imbalanced. Hal ini diperlukan karena metode klasifikasi cenderung baik dalam memprediksi kelas dengan data sampel yang lebih banyak namun buruk dalam memprediksi kelas dengan data sampel yang sedikit. Tabel 3. Menunjukkan bahwa G-means random forest pada data asli bernilai 0, yang artinya terjadi ketidakseimbangan prediksi. Hasil akurasi tersebut menunjukkan bahwa metode random forest bagus dalam mengklasifikasikan remaja yang tidak pernah melakukan hubungan seksual pranikah, namun tidak dapat menangkap remaja yang pernah melakukan hubungan seksual pranikah. Hal ini menandakan bahwa terjadi hasil akurasi yang bias atau biasa dikenal accuracy paradox, dimana analisis prediktif menyatakan bahwa model prediktif dengan tingkat akurasi tertentu mungkin memiliki daya prediksi lebih besar daripada model dengan tingkat akurasi yang lebih tinggi. Dalam kondisi seperti ini lebih baik menggunakan ukuran ketepatan klasifikasi yang lain selain ukuran akurasi, seperti presisi dan recall [4]. Tabel 3. Ukuran Kinerja Teknik Sampling Akurasi Original Under Over SMOTE 1-APER APER Sensitivity Specificity G-means Tabel 3. menunjukkan bahwa 1-APER random forest pada ketiga teknik sampling memberikan nilai akurasi yang lebih kecil, dimana akurasi pada teknik sampling SMOTE masih lebih baik disbanding Over- sampling dan Under-sampling. Adapun nilai sensitivity random forest pada Under-sampling bernilai 0,8462 yang artinya sebesar 84,62 persen data sampel remaja yang pernah melakukan hubungan seksual pranikah yang tepat diklasifikasikan pernah melakukan hubungan seksual pranikah. Nilai ini lebih besar dibandingkan Over-sampling dan SMOTE, yaitu 0,3590 dan 0,

8 Gambar 1. Nilai Akurasi Teknik Sampling Tabel 4. Menunjukkan bahwa ketiga teknik sampling (Under-sampling, Over-sampling, dan SMOTE) memberikan nilai presisi dan recall yang lebih baik dibandingkan data asli. Teknik sampling SMOTE memberikan nilai presisi paling besar yaitu 0,2821 yang artinya sebesar 28,21 persen tingkat ketepatan antara remaja yang pernah melakukan hubungan seksual pranikah dengan tingkat remaja yang diklasifikasikan pernah melakukan hubungan seksual pranikah. Sedangkan Under-sampling dan Over- sampling memberikan nilai presisi sebesar 0,2157 dan 0,2222. Sementara, teknik sampling Under-sampling memberikan nilai recall paling besar yaitu 0,9797 yang artinya sebesar 97,97 persen tingkat keberhasilan sistem dalam menemukan kembali informasi remaja yang pernah melakukan hubungan seksual pranikah. Sedangkan SMOTE dan Over-sampling memberikan nilai recall sebesar 0,9542 dan 0,9352. Tabel 4. Ukuran Presisi dan Recall Teknik Sampling Akurasi Original Under Over SMOTE Precision Recall

9 Gambar 2. Perbandingan Presisi dan Recall Teknik Sampling 4. KESIMPULAN Data remaja yang pernah melakukan hubungan seksual pranikah hasil SDKI 2012 menghasilkan akurasi yang bias dengan metode random forest dilihat dari nilai sensitivity yang bernilai 0. Secara umum, ketiga metode teknik sampling yang digunakan baik Under-sampling, Over-sampling dan SMOTE meningkatkan nilai sensitivity, presisi, dan recall dari data asli. Teknik Undersampling memberikan nilai sensitivity dan recall yang paling besar yaitu 84,62 persen dan 97,97 persen, sedangkan presisi terbaik diberikan oleh teknik sampling SMOTE dengan nilai 28,21 persen. 5. DAFTAR PUSTAKA [1] A. Liaw and M. Wiener, Classification and Regression by Random Forest, R News, vol. 2, pp [2] M. V. Wezel and R. Potharst, Improved Customer Choice Prediction using Ensemble Method, European Journal of Operational Research, vol.181, pp [3] N. V. Chawla, K. W. Bowyer, L. O. Hall, and W. P. Kegelmeyer, SMOTE: Synthetic Minority Over- sampling Technique, Journal of Artificial Intelligence Research, vol. 16, pp , (references) [4] Zhu, Xingquan, Knowledge Discovery and Data Mining: Challenges and Realities, IGI Global, 2007.pp , ISBN [5] Reproductive Helath: Teen Pregnancy, [Internet] [cited 2017 september 27] available from: [6] Y. A. Jatmiko, dan S. Wahyuni, Determinan Perilaku Seksual Remaja di Indonesia, Prosiding Seminar Ilmiah Kependudukan, Bandung, [7] N. Japkowicz, The Class Imbalance Problem: Significance and Strategies. In Proceedings of the 200 International Conference on Artificial Intelligence (IC-AI 2000): Special Track on Inductive Learning Las Vegas, Nevada, [8] L. Breiman, Random Forests, Machine Learning, Vol.45 (2001)

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG

METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG MUHAMMAD JAMAL MUTTAQIN 1311 201 205 PEMBIMBING DR. BAMBANG WIDJANARKO OTOK, M.SI. SANTI PUTERI RAHAYU, M.SI., PH.D.

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Metode Klasifikasi Data Mining dan Teknik Sampling Smote... METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Hairani

Lebih terperinci

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4725 Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel Handling Imbalanced Data

Lebih terperinci

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ZK. Abdurahman Baizal 1, Moch. Arif Bijaksana 2, Angelina Sagita Sastrawan 3 Telp (022)7564108 ext 2298 Fax

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Perkembangan teknologi sekarang ini semakin pesat. Kebutuhan akan informasi dan komunikasi bertambah. Telah ditemukan berbagai perangkat teknologi yang memudahkan manusia

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

Metode Ensemble pada CART untuk Perbaikan Klasifikasi Kemiskinan di Kabupaten Jombang

Metode Ensemble pada CART untuk Perbaikan Klasifikasi Kemiskinan di Kabupaten Jombang 1 Metode Ensemble pada CART untuk Perbaikan Klasifikasi Kean di Kabupaten Jombang Muhammad Jamal Muttaqin, Bambang W. Otok, dan Santi Puteri Rahayu Jurusan Statistika, Fakultas MIPA, Institut Teknologi

Lebih terperinci

IPTEK-KOM, Vol. 19 No.12, Juni 2017: ISSN

IPTEK-KOM, Vol. 19 No.12, Juni 2017: ISSN Implementasi Teknik Sampling untuk Mengatasi Imbalanced Data pada Penentuan Status Gizi Balita dengan Menggunakan Learning Vector Quantization Implementation of Sampling Techniques for Solving Imbalanced

Lebih terperinci

PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA

PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA PENANGANAN MASALAH KELAS DATA TIDAK SEIMBANG PADA PEMODELAN RISIKO HIV DI PAPUA EVLINA TRISIA SALSABELLA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Muh. Safri Juliardi Program Studi Informatika Universitas Sebelas Maret Jl. Ir. Sutami No. 36 A Surakarta juliardi@student.uns.ac.id

Lebih terperinci

PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI)

PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI) I Made, Prediksi Lama Studi Mahasiswa,,,201 PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI) Prediction Of Students Learning Study Periode By Using Random Forest Method

Lebih terperinci

Bambang Widjanarko Otok (1), dan Dian Seftiana (2) (1,2) Jurusan Statistika, FMIPA, Institut Teknologi Sepuluh Nopember (ITS)

Bambang Widjanarko Otok (1), dan Dian Seftiana (2) (1,2) Jurusan Statistika, FMIPA, Institut Teknologi Sepuluh Nopember (ITS) 1 Klasifikasi Rumah Tangga Sangat Miskin di Kabupaten Jombang Menurut Paket Bantuan Rumah Tangga yang Diharapkan dengan Pendekatan Random Forests Classification and Regression Trees (RF-CART) Bambang Widanarko

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Seminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011

Seminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011 Surabaya, Juli 2011 Seminar Tugas Akhir Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING Ibrahim Widyandono 1307 100 001 Pembimbing : Dr. Bambang Widjanarko

Lebih terperinci

MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA C5.

MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA C5. ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 3138 MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN

Lebih terperinci

ANALISIS CHURN PREDICTION MENGGUNAKAN METODE LOGISTIC REGRESSION DAN SMOTE (Synthetic Minority Over-sampling Technique) PADA PERUSAHAAN TELEKOMUNIKASI

ANALISIS CHURN PREDICTION MENGGUNAKAN METODE LOGISTIC REGRESSION DAN SMOTE (Synthetic Minority Over-sampling Technique) PADA PERUSAHAAN TELEKOMUNIKASI ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 217 Page 546 ANALISIS CHURN PREDICTION MENGGUNAKAN METODE LOGISTIC REGRESSION DAN SMOTE (Synthetic Minority Over-sampling Technique)

Lebih terperinci

CHURN PREDICTION PADA TELEKOMUNIKASI SELULER DENGAN METODE BAGGING DAN BOOSTING

CHURN PREDICTION PADA TELEKOMUNIKASI SELULER DENGAN METODE BAGGING DAN BOOSTING CHURN PREDICTION PADA TELEKOMUNIKASI SELULER DENGAN METODE BAGGING DAN BOOSTING Ina Rofi atun Nasihati, ZK. Abdurahman Baizal, dan Moch. Arif Bijaksana Institut Teknologi Telkom, Bandung zka@ittelkom.ac.id,

Lebih terperinci

RANDOM FOREST DAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) BINARY RESPONSE UNTUK KLASIFIKASI PENDERITA HIV/AIDS DI SURABAYA

RANDOM FOREST DAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) BINARY RESPONSE UNTUK KLASIFIKASI PENDERITA HIV/AIDS DI SURABAYA RANDOM FOREST DAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) BINARY RESPONSE UNTUK KLASIFIKASI PENDERITA HIV/AIDS DI SURABAYA 1 Nidhomuddin, 2 Bambang Widjanarko Otok 1,2 Jurusan Statistika,Fakultas

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

ANALISIS PENGARUH METODE COMBINE SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI

ANALISIS PENGARUH METODE COMBINE SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ANALISIS PENGARUH METODE COMBINE SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI Angelina Sagita Sastrawan 1, ZK. Abdurahman Baizal 2, Moch. Arif Bijaksana 3, Telp (022)7564108 ext 2298

Lebih terperinci

Integrasi Density Based Feature Selection dan Adaptive Boosting dalam Mengatasi Ketidakseimbangan Kelas

Integrasi Density Based Feature Selection dan Adaptive Boosting dalam Mengatasi Ketidakseimbangan Kelas IJCCS, Vol.x, No.x, Julyxxxx, pp. 1~5 Integrasi Density Based Feature Selection dan Adaptive Boosting dalam Mengatasi Ketidakseimbangan Kelas Sudarto 1, Muhammad Zarlis 2, Pahala Sirait 3 1,2 Universitas

Lebih terperinci

BAB I PENDAHULUAN. kelompok umur tahun dengan total jiwa, jenis kelamin

BAB I PENDAHULUAN. kelompok umur tahun dengan total jiwa, jenis kelamin BAB I PENDAHULUAN A. Latar Belakang Menurut World Health Organization remaja merupakan mereka yang berada pada tahap transisi antara anak-anak dan dewasa pada rentang usia 10-19 tahun dan menurut Badan

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 4.1. Hasil Penelitian Kurva ID anteseden menampilkan model ambang hujan dan persamaan empirik yang disajikan pada Gambar 4.1. Model ambang hujan pada penelitian yang

Lebih terperinci

60 Register: Jurnal Ilmiah Teknologi Sistem Informasi, Juli 2016, Volume 2, Nomor 2

60 Register: Jurnal Ilmiah Teknologi Sistem Informasi, Juli 2016, Volume 2, Nomor 2 Prediksi Kelulusan Mata Kuliah Menggunakan Hybrid Fuzzy Inference System Abidatul Izzah 1 dan Ratna Widyastuti 2 1,2 Teknik Informatika Politeknik Kediri, Kediri E-mail: 1 abidatul.izzah90@gmail.com, 2

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP 1 DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP Achmad Ramadhan Safutra 1, Dwi Wahyu Prabowo 1 1 Jurusan Sistem Informasi, Fakultas Ilmu Komputer Universitas Darwan

Lebih terperinci

PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis)

PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis) , April 2011 p : -43 ISSN : 0853-811 Vol 16 No.1 PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis) Nariswari Karina Dewi 1, Utami Dyah Syafitri

Lebih terperinci

PENANGANAN MASALAH KELAS TIDAK SEIMBANG DENGAN RUSBOOST DAN UNDERBAGGING (STUDI KASUS: MAHASISWA DROP OUT SPs IPB PROGRAM MAGISTER)

PENANGANAN MASALAH KELAS TIDAK SEIMBANG DENGAN RUSBOOST DAN UNDERBAGGING (STUDI KASUS: MAHASISWA DROP OUT SPs IPB PROGRAM MAGISTER) PENANGANAN MASALAH KELAS TIDAK SEIMBANG DENGAN RUSBOOST DAN UNDERBAGGING (STUDI KASUS: MAHASISWA DROP OUT SPs IPB PROGRAM MAGISTER) YULIANA PERMATASARI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine. ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi

Lebih terperinci

Memprediksi Waktu Memperbaiki Bug dari Laporan Bug Menggunakan Klasifikasi Random Forest

Memprediksi Waktu Memperbaiki Bug dari Laporan Bug Menggunakan Klasifikasi Random Forest 156 JURNAL SISTEM DAN INFORMATIKA Memprediksi Waktu Memperbaiki Bug dari Laporan Bug Menggunakan Klasifikasi Random Forest Nur Fajri Azhar 1) dan Siti Rochimah 2) 1, 2) Teknik Informatika, Institut Teknologi

Lebih terperinci

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI Disusun Oleh : ATIKA ELSADINING TYAS 24010211120013 JURUSAN STATISTIKA

Lebih terperinci

Pembangunan Model Prediksi Defect Menggunakan Metode Ensemble Decision Tree Dan Cost Sensitive Learning

Pembangunan Model Prediksi Defect Menggunakan Metode Ensemble Decision Tree Dan Cost Sensitive Learning 1 Pembangunan Model Prediksi Defect Menggunakan Metode Ensemble Decision Tree Dan Cost Sensitive Learning Satrio Agung Wicaksono, Daniel Oranova S dan Sarwosri Abstrak - Rencana project pengembangan perangkat

Lebih terperinci

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 Universitas Pesantren Tinggi Darul Ulum

Lebih terperinci

PREDIKSI NASABAH POTENSIAL MENGGUNAKAN METODE KLASIFIKASI POHON BINER

PREDIKSI NASABAH POTENSIAL MENGGUNAKAN METODE KLASIFIKASI POHON BINER PREDIKSI NASABAH POTENSIAL MENGGUNAKAN METODE KLASIFIKASI POHON BINER Ari Wibowo Program Studi Teknik Informatika Politeknik Negeri Batam Jl. Parkway No 1, Batam Center, Batam Telp 0778-469856, Fax 0778-463620

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) Andika Elok Amalia 1), Muhammad Zidny Naf an 2) 1), 2) Program Studi Informatika ST3 Telkom Jl D.I.

Lebih terperinci

PERBANDINGAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN POHON KLASIFIKASI C5.0 PADA DATA TIDAK SEIMBANG (Studi Kasus: Pekerja Anak di Jakarta)

PERBANDINGAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN POHON KLASIFIKASI C5.0 PADA DATA TIDAK SEIMBANG (Studi Kasus: Pekerja Anak di Jakarta) PERBANDINGAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN POHON KLASIFIKASI C5.0 PADA DATA TIDAK SEIMBANG (Studi Kasus: Pekerja Anak di Jakarta) DIMAS ADIANGGA SEKOLAH PASCASARJANA INSTITUT PERTANIAN

Lebih terperinci

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Chandra Purnamaningsih Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami No 36 A Surakarta cpurnamaningsih@gmail.com

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

Statistika Regresi Logistik Neural Network Deskriptif Ketepatan Klasifikasi Model dengan Input Signifikan

Statistika Regresi Logistik Neural Network Deskriptif Ketepatan Klasifikasi Model dengan Input Signifikan Statistika Regresi Logistik Neural Network Deskriptif Ketepatan Klasifikasi Model dengan Input Signifikan Predicted Predicted Actual < 3,5 3,5 Actual Tidak tepat Tepat waktu < 3,5 36 10 Tidak tepat 74

Lebih terperinci

KLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE CHAID (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN CART (CLASSIFICATION AND REGRESSION TREE)

KLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE CHAID (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN CART (CLASSIFICATION AND REGRESSION TREE) Surabaya, 3 Juli 2013 Seminar Hasil Tugas Akhir KLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN (CLASSIFICATION AND REGRESSION TREE) Dosen Pembimbing

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

EKSPLORA INFORMATIKA 127

EKSPLORA INFORMATIKA 127 EKSPLORA INFORMATIKA 127 Implementasi Algoritma C4.5 untuk Analisa Performa Pelayanan Bank Terhadap Nasabah Implementation of C4.5 Algorithm for Bank Service Performance Analysis To Customer Fandi Ramadhan

Lebih terperinci

ii

ii KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun

Lebih terperinci

Analisis Churn Prediction pada Data Pelanggan PT. Telekomunikasi dengan Logistic Regression dan Underbagging

Analisis Churn Prediction pada Data Pelanggan PT. Telekomunikasi dengan Logistic Regression dan Underbagging ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 3210 Analisis Churn Prediction pada Data Pelanggan PT. Telekomunikasi dengan Logistic Regression dan Underbagging 1 Tesha Tasmalaila

Lebih terperinci

GAMBARAN PENGETAHUAN REMAJA PUTRI TENTANG DAMPAK PERNIKAHAN DINI TERHADAP KESEHATAN REPRODUKSI DI SMA NEGERI 1 PEUSANGAN KABUPATEN BIREUEN TAHUN 2017

GAMBARAN PENGETAHUAN REMAJA PUTRI TENTANG DAMPAK PERNIKAHAN DINI TERHADAP KESEHATAN REPRODUKSI DI SMA NEGERI 1 PEUSANGAN KABUPATEN BIREUEN TAHUN 2017 GAMBARAN PENGETAHUAN REMAJA PUTRI TENTANG DAMPAK PERNIKAHAN DINI TERHADAP KESEHATAN REPRODUKSI DI SMA NEGERI 1 PEUSANGAN KABUPATEN BIREUEN TAHUN 2017 Irma Fitria 1*) Herrywati Tambunan (2) 1,2 Dosen Program

Lebih terperinci

Klasifikasi Jenis Perceraian Kabupaten Sleman Berdasarkan Distal Causes Menggunakan Regresi Logistik

Klasifikasi Jenis Perceraian Kabupaten Sleman Berdasarkan Distal Causes Menggunakan Regresi Logistik Klasifikasi Jenis Perceraian Kabupaten Sleman Berdasarkan Distal Causes Menggunakan Regresi Logistik Khusnul Hajar Nuansari 1,*, Arum Handini Primandari 1, Desi Yuniarti 2 1 Program Studi Statistika, Universitas

Lebih terperinci

Memodelkan regresi logistik biner data set hasil sampel bootstrap B.

Memodelkan regresi logistik biner data set hasil sampel bootstrap B. B O O T S T R A P A G G R E G A T I N G 1 2 3 4 5 6 7 Tinjauan Pustaka Algoritma Bagging Regresi Logistik Biner Mengambil sampel bootstrap sebanyak n dari data set dengan pengulangan sebanyak n. Pengambilan

Lebih terperinci

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di:

ISSN: JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman Online di: ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman 161-170 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian ANALISIS CREDIT SCORING MENGGUNAKAN METODE BAGGING K-NEAREST

Lebih terperinci

BAB I PENDAHULUAN. logistik didasarkan pada pendekatan analisis regresi linear merupakan metode yang

BAB I PENDAHULUAN. logistik didasarkan pada pendekatan analisis regresi linear merupakan metode yang BAB I PENDAHULUAN 1.1 Latar Belakang Klasifikasi merupakan suatu metode statistika untuk mengelompokkan sekumpulan objek yang disusun secara sistematis ke dalam suatu kelompokkelompok baru yang lebih kecil

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada BAB II ini akan disampaikan materi-materi yang berkaitan dengan konsep data mining, yang merupakan landasan bagi pembahasan klasifikasi untuk evaluasi kinerja pegawai. 2. 1 Tinjauan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Penelitian ini adalah penelitian eksperimen dengan langkah-langkah atau metode penelitian sebagai berikut: 1. Penentuan Masalah Penentuan masalah ini diperoleh dari studi literature

Lebih terperinci

BAB I 1 PENDAHULUAN. atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi

BAB I 1 PENDAHULUAN. atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi BAB I 1 PENDAHULUAN 1.1 Latar Belakang Tulang punggung merupakan bagian dari tulang belakang yang tersusun atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi (Berthonnaud et

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

BAB 1 PENDAHULUAN. sama yaitu mempunyai rasa keingintahuan yang besar, menyukai pertualangan dan

BAB 1 PENDAHULUAN. sama yaitu mempunyai rasa keingintahuan yang besar, menyukai pertualangan dan BAB 1 PENDAHULUAN 1.1 Latar Belakang Masa remaja merupakan periode terjadinya pertumbuhan dan perkembangan pesat baik fisik, psikologis maupun intelektual. Pola karakteristik pesatnya tumbuh kembang ini

Lebih terperinci

METODE BOOTSTRAP AGGREGATING REGRESI LOGISTIK BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

METODE BOOTSTRAP AGGREGATING REGRESI LOGISTIK BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 6, Nomor 1, Tahun 2017, Halaman 121-130 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian METODE BOOTSTRAP AGGREGATING REGRESI LOGISTIK BINER UNTUK KETEPATAN

Lebih terperinci

PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R)

PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R) Arifin, Perbandingan Akurasi Klasifikasi Dari Algoritma Naïve Bayes, C4.5, PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R) M Zainal Arifin Abstrak : Artikel ini menjabarkan

Lebih terperinci

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal 234 Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal Comparative Analysis Of ID3 And C4.5 Algorithm For Classification Of Grant

Lebih terperinci

PENCARIAN BERUNTUN (SEQUENTIAL SEARCHING)

PENCARIAN BERUNTUN (SEQUENTIAL SEARCHING) PENCARIAN BERUNTUN (SEQUENTIAL SEARCHING) a. Introduction b. Tanpa Boolean c. Dengan Boolean d. Penggunaan dalam Fungsi INTRODUCTION Merupakan algoritma pencarian yang paling sederhana. Proses Membandingkan

Lebih terperinci

PENERAPAN SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) TERHADAP DATA TIDAK SEIMBANG PADA PEMBUATAN MODEL KOMPOSISI JAMU

PENERAPAN SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) TERHADAP DATA TIDAK SEIMBANG PADA PEMBUATAN MODEL KOMPOSISI JAMU Xplore, 2013, Vol. 1(1):e9(1-6) c 2013 Departemen Statistika FMIPA IPB PENERAPAN SYNTHETIC MINORITY OVERSAMPLING TECHNIQUE (SMOTE) TERHADAP DATA TIDAK SEIMBANG PADA PEMBUATAN MODEL KOMPOSISI JAMU Rossi

Lebih terperinci

MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE

MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE Hartono Program Studi Teknik Informatika, STMIK IBBI Jalan Sei Deli No. 18 Medan, Medan-Indonesia E-mail : hartonoibbi@gmail.com

Lebih terperinci

PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS NARISWARI KARINA DEWI

PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS NARISWARI KARINA DEWI PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS NARISWARI KARINA DEWI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 RINGKASAN NARISWARI KARINA

Lebih terperinci

BAB I PENDAHULUAN. A. Latar Belakang. Remaja mempunyai permasalahan yang sangat kompleks seiring dengan masa

BAB I PENDAHULUAN. A. Latar Belakang. Remaja mempunyai permasalahan yang sangat kompleks seiring dengan masa 1 BAB I PENDAHULUAN A. Latar Belakang Remaja mempunyai permasalahan yang sangat kompleks seiring dengan masa transisi yang dialami remaja. Masalah yang menonjol dikalangan remaja yaitu permasalahan seputar

Lebih terperinci

BAB I PENDAHULUAN. penduduk dunia merupakan remaja berumur tahun dan sekitar 900

BAB I PENDAHULUAN. penduduk dunia merupakan remaja berumur tahun dan sekitar 900 BAB I PENDAHULUAN A. Latar Belakang Menurut World Health Organization (WHO) sekitar seperlima dari penduduk dunia merupakan remaja berumur 10-19 tahun dan sekitar 900 juta berada di negara sedang berkembang.

Lebih terperinci

BAB I PENDAHULUAN. dewasa. Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN)

BAB I PENDAHULUAN. dewasa. Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN) BAB I PENDAHULUAN 1.1 Latar Belakang Masa remaja merupakan suatu masa transisi antara masa anak-anak dengan masa dewasa. Badan Kependudukan dan Keluarga Berencana Nasional (BKKBN) mendefinisikan remaja

Lebih terperinci

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) SKRIPSI Disusun Oleh : DESY RATNANINGRUM 24010211140097 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

CITEE 2017 Yogyakarta, 27 Juli 2017 ISSN:

CITEE 2017 Yogyakarta, 27 Juli 2017 ISSN: Integrasi Synthetic Minority Over-Sampling Technique (SMOTE) dengan Correlated Naïve Bayes Classifier (C-NBC) pada Klasifikasi Siswa Berkesulitan Belajar Zia Ulhaq, Teguh Bharata Adji Department of Electrical

Lebih terperinci

PERBANDINGAN ALGORITMA C4.5 DENGAN C4.5 BAGGING DALAM MEMPREDIKSI DAN ANALISA DATA SET PEMILIH MINYAK PELUMAS MESIN (OLI) PADA KEDARAAN RODA DUA

PERBANDINGAN ALGORITMA C4.5 DENGAN C4.5 BAGGING DALAM MEMPREDIKSI DAN ANALISA DATA SET PEMILIH MINYAK PELUMAS MESIN (OLI) PADA KEDARAAN RODA DUA D.1 PERBANDINGAN ALGORITMA C4.5 DENGAN C4.5 BAGGING DALAM MEMPREDIKSI DAN ANALISA DATA SET PEMILIH MINYAK PELUMAS MESIN (OLI) PADA KEDARAAN RODA DUA Tri Ginanjar Laksana *, Fahrudin Mukti Wibowo Jurusan

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Persiapan Data BAB III ANALISA DAN PERANCANGAN SISTEM Dalam pengerjaan tugas akhir ini data yang digunakan adalah kalimat tanya Berbahasa Indonesia, dimana kalimat tanya tersebut diambil dari soal-soal

Lebih terperinci

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif Khafiizh Hastuti 1, Erwin Yudi Hidayat 2 1, 2 Fakultas Ilmu Komputer, Universitas Dian Nuswantoro, Semarang 50131 E-mail : 1 afis@dsn.dinus.ac.id,

Lebih terperinci

INTEGRASI TEKNIK SMOTE BAGGING DENGAN INFORMATION GAIN PADA NAIVE BAYES UNTUK PREDIKSI CACAT SOFTWARE

INTEGRASI TEKNIK SMOTE BAGGING DENGAN INFORMATION GAIN PADA NAIVE BAYES UNTUK PREDIKSI CACAT SOFTWARE VOL.. NO. FEBRUARI 07 E-ISSN: 57-86 JURNAL ILMU PENGETAHUAN DAN TEKNOLOGI KOMPUTER INTEGRASI TEKNIK SMOTE BAGGING DENGAN INFORMATION GAIN PADA NAIVE BAYES UNTUK PREDIKSI AAT SOFTWARE Sukmawati Anggraeni

Lebih terperinci

PENERAPAN TEKNIK BAGGING PADA ALGORITMA KLASIFIKASI UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS DATASET MEDIS

PENERAPAN TEKNIK BAGGING PADA ALGORITMA KLASIFIKASI UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS DATASET MEDIS PENERAPAN TEKNIK BAGGING PADA ALGORITMA KLASIFIKASI UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS DATASET MEDIS Rizki Tri Prasetio 1, dan Pratiwi 2 1 Universitas BSI Bandung, rizki.rte@bsi.ac.id 2 Universitas

Lebih terperinci

Kata Kunci : Optimasi, Naïve Bayes, Risiko Kredit, Algoritma Genetika, Seleksi Fitur.

Kata Kunci : Optimasi, Naïve Bayes, Risiko Kredit, Algoritma Genetika, Seleksi Fitur. OPTIMASI SELEKSI FITUR KLASIFIKASI NAÏVE BAYES MENGGUNAKAN ALGORITMA GENETIKA UNTUK PREDIKSI RISIKO KREDIT KONSUMEN (Studi Kasus : PT. Finansia Multi Finance (KreditPlus) Tanjungpinang) Sisma Tri Wulan

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

Skripsi Ini Disusun Guna Memenuhi Salah Satu Syarat. Untuk Memperoleh Ijazah S1 Kesehatan Masyarakat. Disusun Oleh: NORDINA SARI J

Skripsi Ini Disusun Guna Memenuhi Salah Satu Syarat. Untuk Memperoleh Ijazah S1 Kesehatan Masyarakat. Disusun Oleh: NORDINA SARI J PERBEDAAN PENGETAHUAN KESEHATAN REPRODUKSI, SIKAP SEKSUALITAS, DAN PERILAKU PACARAN PADA PELAJAR SLTA DAMPINGAN PKBI JATENG DAN PADA PELAJAR SLTA KONTROL DI KOTA SEMARANG Skripsi Ini Disusun Guna Memenuhi

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

BAB. III. ANALISA PERMASALAHAN

BAB. III. ANALISA PERMASALAHAN BAB. III. ANALISA PERMASALAHAN Pada Bab II telah diuraikan beberapa teori dasar yang akan menjadi acuan / referensi ilmiah dalam melakukan penelitian. Bab ini akan berisi studi kasus yang dibangun dari

Lebih terperinci

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK) IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK) Diana Septiari Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang. Remaja sejatinya adalah harapan semua bangsa, negara-negara yang

BAB I PENDAHULUAN. 1.1 Latar Belakang. Remaja sejatinya adalah harapan semua bangsa, negara-negara yang BAB I PENDAHULUAN 1.1 Latar Belakang Remaja sejatinya adalah harapan semua bangsa, negara-negara yang memiliki remaja yang kuat serta memiliki kecerdasan spiritual,intelektual serta emosional yang kuat

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN) Klasifikasi Helpdesk Universitas Jenderal Achmad ni... (Herawan dkk.) KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA Optimization Techniques Modi ed k Nearest Neighbor Classi cation Using Genetic Algorithm Siti Mutro n 1, Abidatul

Lebih terperinci

Penerapan Dizcretization dan Teknik Bagging Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada Algoritma C4.5 dalam Mendiagnosa Diabetes

Penerapan Dizcretization dan Teknik Bagging Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada Algoritma C4.5 dalam Mendiagnosa Diabetes Penerapan Dizcretization dan Teknik Bagging Untuk Meningkatkan Akurasi Klasifikasi Berbasis Ensemble pada Algoritma C4.5 dalam Mendiagnosa Diabetes Mirqotussa adah a1, Much Aziz Muslim a2, Endang Sugiharti

Lebih terperinci

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA

PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA PENERAPAN ALGORITMA KLASIFIKASI C4.5 UNTUK DIAGNOSIS PENYAKIT KANKER PAYUDARA Laily Hermawanti Program Studi Teknik Informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro No. 1B

Lebih terperinci

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4. IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.5 Amelia Halim 1) dan Joko Lianto Buliali 2) 1) Program Studi Magister

Lebih terperinci