THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD

Ukuran: px
Mulai penontonan dengan halaman:

Download "THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD"

Transkripsi

1 THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD 1 JACOB SOARES, 2 ALBERTUS JOKO SANTOSO, 3 SUYOTO 1, 2, 3 Universitas Atma Jaya Yogyakarta 1 soaresmokong@gmail.com, 2 albjoko@staff.uajy.ac.id, 3 suyoto@staff.uajy.ac.id Abstract - Teknik Prediksi merupakan hal yang patut untuk di perhitungkan dalam mewaspadai setiap kondisi yang terjadi. prediksi masa studi mahasiswa merupakan langkah penting dalam mempertimbangkan proses pengambilan keputusan sebagai peringatan dini (early warning) terhadap mahasiswa yang berpotensi menyalahi ketentuan lama studinya. Dili Institute of Technology merupakan salah satu perguruan tinggi swasta di Timor-Leste yang memiliki jumlah mahasiswa yang sangat banyak yang masih terkendala dalam mengontrol lama studi setiap mahasiswanya. Tujuan penelitian ini adalah memanfaatkan teknik data mining dalam memprediksi lama studi mahasiswa pada perguruan tinggi Dili Institute Of Technology. Proses klasifikasi terhadap 334 record data mahasiswa menggunakan metode naïve bayes dengan nilai akurasi sebesar 86,22% yang diprediksi tepat waktu, sedangkan 12,57% tidak tepat waktu. Namun dari hasil yang didapat belum memuaskan sehingga memerlukan metode adaboost untuk menangani error value dengan nilai yang didapatkan... Dari hasil prediksi yang dilakukan oleh peneliti maka, pihak DIT dapat mengetahui jumlah mahasiswa tertentu yang berdasarkan hasil prediksinya dinyatakan berpotensi lulus dengan melampaui ketentuan lama studi yang ditentukan dengan mengambil tindakan preventif secara dini. Keywords - Data Mining, Prediksi, Naïve Bayes, Adaboost. I. INTRODUCTIONS Pertumbuhan jumlah data yang tersimpan pada masing-masing organisasi atau institusi saat ini sangat berkembang pesat dan terus menerus perkembangan [1]. Pemanfaatan teknik data mining merupakan langkah konkrit dalam menghadapi pertumbuhan data yang semaking berkembang pesat dengan teknik pengekstraksian data tersembunyi di dalam gudang data [2]. Dili Institute of Technology (DIT) merupakan salah satu perguruan tinggi swasta yang berada di Timor Leste dan telah terdaftar di pengadilan Dili, serta mendapatkan pengakuan secara Internasional dengan persentasi akreditasi kampus 92.88% yang telah dilakukan oleh kementrian Pendidikan Timor Leste [3][4]. Seiring dengan berjalannya waktu pertumbuhan jumlah mahasiswanya cukup banyak. Hal ini terlihat dari peningkatan jumlah data calon mahasiswa baru pada setiap tahun ajaran baru yang semakin bertambah. Sehingga pencatatan data mahasiswapun semakin menumpuk karena terdapat jumlah mahasiswa yang lulus tidak sesuai dengan ketentuan masa studi yang ditetapkan dan perolehan Indeks Prestasi Kumulatif (IPK) yang rendah. Pemanfaatan teknik data mining agar mendapatkan informasi dan pengetahuan yang baru dari sejumlah data yang besar [1]. Dengan data mining dapat memprediksi lama masa studi mahasiswa pada perguruan tinggi Dili Institute of Technology agar dapat mengetahui setiap mahasiswa yang melampaui lama studi atas dasar data kelulusan sebelumnya. Beberapa algoritma klasifikasi yang sudah digunakan oleh peneliti lain yaitu, Neural Network, Naïve Bayes, Decision Tree, Adaboost, Instance-Based Learning, Logistic Regression dan Support Vector Machine [5]. Dalam penelitian ini penulis menerapkan teknik data mining untuk prediksi lama studi mahasiswa dengan menggunakan metode Naïve Bayes dan Adaboost. Metode Naïve Bayes sangat mudah diaplikasikan dalam mesin pembelajaran dalam kumpulan data set berdasarkan data training yang diperoleh dengan menggunakan probabilitas bersyarat sebagai dasarnya [6]. Sedangkan metode Adaboost pada dasarnya dapat digunakan untuk meningkatkan ketelitian untuk proses klasifikasi dalam melakukan prediksi dengan cara membangkitkan kombinasi dari suatu model Model yang lemah dan menggabungkannya menjadi lebih baik secara signifikan, tetapi hasil klasifikasi atau prediksi yang dipilih adalah model yang memiliki nilai bobot paling besar[6][7]. Kombinasi ke dua metode ini diharapkan dapat membantu proses pengelolaan data sampel yang diperoleh sehingga dapat menentukan parameter serta atribut yang cocok dalam melakukan proses klasifikasi data berdasarkan ketentuan data mining secara efisien dan efektif. Hasil yang didapatkan dapat menentukan kerangka sistem dalam memprediksi lama studi mahasiswa berdasakaran klasifikasi data berbasis naïve bayes dalam mengasumsikan keakuratan akan independensi dari masing-masing kondisi mahasiswa terhadap nilai yang didapatkan. Klasifikasi data pengujian yang didapatkan akan di bantu dengan memanfaatkan proses boosting untuk menangani ketidakseimbangan kelas, meningkatkan akurasi yang tinggi dan dapat 70

2 mengurangi tingkat error klasifikasi terhadap nilai mahasiswa dengan metode Adaboost. II. DETAILS EXPERIMENTAL 2.1 Penelitian terdahulu Berikut adalah uraian singkat tentang beberapa penelitian sebelumnya yang terkait dengan prediksi, klasifikasi, metode Naïve Bayes dan Adaboost. Penelitian yang dilakukan oleh (Amornsinlaphachai, 2016) yang berjudul Efficiency of data mining models to predict academic performance and a cooperative learning model dengan tujuan Memilih model Data Mining untuk memprediksi prestasi akademik terhadap peserta didik program computer untuk membandingkan model efisiensi data mining dengan teknik klasifikasi dan membagun model pembelajaran berbasis web terhadap partisipasi peserta didik [8]. Sedangkan pada penelitiannya (Devasia, P and Hegde, 2016) yang berjudul Prediction of Students Performance using Educational Data Mining Mengusulkan sebuah sistem berbasis web dengan memanfaatkan teknik data mining untuk mengekstraksi informasi yang berguna. Percobaan yang dilakukan menggunakan metode Naïve Bayes terhadap 700 data siswa dengan 19 atribut [9]. Sedangkan Peneliatian lain dilakukan oleh (Guleria and Sood, 2015) dengan judul Predicting student placements using Bayesian classification permintaan siswa agar institusi menempatkan pendidikan tinggi yang berkwalitas dan bermanfaat bagi para siswa. Didalam aplikasi teorema bayesian pada dataset pendidikan telah diusulkan untuk memprediksi hasil penempatan. Hasilnya yang didapatkan akan dievaluasi menggunakan Naive Bayes Classifer dengan alat bantu WeKa dan Rapid Miner. Hasil yang dievaluasi akan membantu para pendidik agar meningkatkan aspek-aspek dalam hal penempatkan para siswa [5]. Penelitian berikut yang dilakukan oleh (Liu et al., 2017) dengan topic A Preprocessing Method of AdaBoost for Mislabeled Data Classification mengusulkan metode adaboost konvensional untuk memperbaiki data yang nois, Decision Stump merupakan algoritma pembelajaran lemah untuk klasifikasi data [10]. Sedangkan penelitian yang dilakukan oleh peniliti (Jacob et al, 2017) dengan judul Combination of naive Bayes and adaboost methods in predicting the study period of the students tujuan dari penelitian ini dapat memprediksi lama studi dari setiap mahasiswa atas dasar data kelulusan sebelumnya, hasilnya dapat digunakan sebagai bahan pertimbangan pimpinan dalam proses pengambilan kebijakan dan keputusan sebagai peringatan dini (early warning) bagi mahasiswa yang berdasarkan hasil prediksi dinyatakan berpotensi lulus dengan melampaui ketentuan lama studinya. 2.2 Data Mining Data Mining adalah Serangkaian proses untuk menggali nilai tambah berupa informasi dalam melakukan prediksi seperti hasil akhir peserta 71 terhadap suatu kegiatan pembelajaran berdasarkan jumlah data yang selama ini tidak diketahui secara manual dari suatu basis data dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basisdata [8][11]. Tolak ukur penggunaan data mining mejadi hal penting dalam mengelola data yang sangat besar untuk memudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar dapat memberikan informasi yang akurat bagi penggunanya. Data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat di lakukan, berikut langkah-langkahnya dalam proses data mining: Fig 1. Proses pengelompokan Data Mining 1. Data cleaning (untuk menghilangkan noise data yang tidak konsisten) 2. Data integration (di mana sumber data yang terpecah dapat disatukan) 3. Data selection (di mana data yang relevan dengan tugas analisis dikembalikan ke dalam database) 4. Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi) 5. Knowledge Discovery (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data) 6. Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik) 7. Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kepada user). 2.3 Metode Nive Bayes Naïve Bayes Classifier (NBC) merupakan sebuah pengklasifikasi probabilitas sederhana yang

3 mengaplikasikan Teorema Bayes dengan asumsi ketidaktergantungan (independent) yang tinggi dengan menggunakan mode batch Strategi [12][12]. Keuntungan penggunan penerapan NBC sangat jauh berbedah dengan metode lain seperti Regression, Decision Tree, Neural networks yang hanya membutuhkan jumlah data pelatihan (training data) yang kecil dalam menentukan estimasi parameter yang diperlukan dalam proses pengklasifikasian [9]. Karena yang diasumsikan sebagai variable independent, maka hanya varians dari suatu variable dalam sebuah kelas yang dibutuhkan untuk menentukan klasifikasi, bukan keseluruhan dari matriks kovarians..() P (H/ X)= ()...(1) Dimana: X : Data dengan class yang belum diketahui H : Hipotesis data merupakan suatu class spesifik P(H X) : Probabilitas hipotesis H berdasar kondisi X (posteriori probabilitas) P(H) : Probabilitas hipotesis H (prior probabilitas) P(X H) : Probabilitas X berdasarkan kondisi pada hipotesis H P(X) : Probabilitas X Proses klasifikasi memerlukan sejumlah petunjuk untuk menentukan kelas mana yang cocok bagi sampel yang dianalilis tersebut. Maka persamaan Naïve Bayes diatas dapat diturunkan sebagai berikut: P (C F 1. F n ) = ()(. )..(2) (. ) Untuk X merepresentasikan vector masukan yang berisikan fitur. Sedangkan C i merepresentasikan label kelas. Dengan asumsi bahwa nilai variable dalam tiap kelas saling independen yang kuat (Naïve) satu dengan yang lain maka: P(X C i ) = = P(X 1 C i ) x P(X 2 C i ) =P(X n C i ) (3) P(X C 2.4 Metode AdaBoost Metode AdaBoost atau Adaptive Boosting, merupakan algoritma pembelajaran mesin yang dirumuskan oleh Yoav Freund dan Robert Schapire. AdaBoost merupakan suatu meta-algorithm, dan dapat digunakan bersamaan dengan banyak algoritma pembelajaran lain untuk meningkatkan kinerjanya dalam melakukan klasifikasi teks, deteksi wajah dan pelacakan dengan tingkat keberhasilan yang baik [10]. AdaBoost bersifat adaptif, dimana classifiers berikutnya dibangun untuk mendukung data-data yang mengalami kesalahan klasifikasi oleh classifier sebelumnya. Algoritma Adaboost pada dasarnya digunakan untuk dapat meningkatkan classifier data seperti akurasi klasifikasi, waktu pemrosesan dan kehandalan [2]. Penerapan algoritma ini cukup mudah dalam proses membangun sebuah model awal dari dataset pelatihan, kemudian melakukan proses identifikasi terhadap rekaman data 72 dalam data pelatihan yang modelnya tidak ditemukan, dengan persamaan adaboost seperti berikut [6]. =1 to m Untuk m Min imumkan fungsi error w = w () = exp (α )....(4) 2. Set α = ln Which one e =...(5) 3. Update value w () () exp( α ) = w if that observation Miss classification and w () = w () exp( α ) = w () for others.(6) 2.5 Confucion Matrix Confusion matrix merupakan suatu metode yang di gunakan untuk melakukan perhitungan akurasi dalam konsep data mining. Rumus ini melakukan perhitungan dengan 4 keluaran yaitu: Recall, Procicion, Accuracy dan Error Reate. Evaluasi dengan confucion matrix dapat menghasilkan nilai, Recall, Precision dan Accuracy [5]. Recall adalah proporsi kasus positif yang diidentifikasi dengan benar. Precision adalah proporsi kasus yang positif. Accuracy adalah perbandingan kasus yang diidentifikasi benar dengan jumlah semua kasus. Prediction value Confusion Matrix True Correct Positive Classification False Positive Table1 1: Confusion Matrix True Negative False Negative Perhitungan Accuracy, Precision dan Recall dengan menggunakan table confucion matrix sebagai berikut: Recall = Precision = III. RESULTS AND DISCUSSION 3.1 Konsep Prediksi Kelulusan Mahasiswa Pada penelitian ini, beberapa tahap penting yang akan dilakukan dalam model prediksi kelulusan mahasiswa seperti pada gambar 3.1 berikut: Fig 2 the concept of Graduation Prediction

4 1. Preprocessing: Dataset yang akan digunakan sebagai proses mining dan pengujian berupa sampel data induk mahasiswa angkatan 2010 s/d Dataset mahasiswa ini akan diterapkan ke dalam alat pemodelan, sehingga pada akhirnya terbentuk sebuah dataset baru yang siap untuk di mining. Atribut yang digunakan yaitu, Pendapatan orangtua, Jenis kelamin, Nilai Tes seleksi, Asal sekolah, IPK semester satu sampai empat. Kemudian melakukan proses Cleaning terhadap data yang tidak lengkap atau missing velue. Sehingga pada akhirnya terdapat jumlah 334 record data yang siap untuk dimining. 2. Ekstraksi fitur: adalah salah satu tahap yang dilakukan untuk memilih fitur yang akan digunakan pada dataset mahasiswa sebagai data training dan data testing. 3. Klasifikasi: melakukan proses klasifikasi terhadap data latih dan data testing, menggunakan dua kelas yang akan dijadikan untuk kelas target yaitu, kelas Tepat Waktu dan kelas Tidak Tepat Waktu. 4. Implementasi Naïve bayes: Dataset mahasiswa akan diolah dengan Microsoft excel. Berukut adalah proses klasifikasi algoritma Naïve Bayes secara manual adalah sebagai berikut: a. Mulai Hitung P(Ci) untuk setiap kelas Hitung P(X Ci) untuk setiap kriteria dan setiap kelas Cari P(X Ci) yang paling besar menjadi kesimpulan b. Tampilkan hasil prediksi 5. Adaboost: Mengambil nilai yang minimum kemudian boosting dengan menggunakan adaboost untuk meningkatkan nilai akurasi yang lebih baik Implementasi Algoritma Nive Bayes Berikut ini merupakan contoh data training yang siap untuk dimining. Gender Income Parents From School Test Scores Grade Note M M Private M 3.19 Yes M H Public M 2.75 Yes Table 2: Data Training Note Gender : Female (F) and Male (M) Income Parents : High (H), Medium (M) and Low (L) From School : Public, Private and Vocational Test Scores : High (H), Medium (M) and Low (L) Grade : Study results semesters 1-4 Note/Information : Tepat Waktu (Yes) Dan Tidak Tepat Waktu (No) Data kelulusan mahasiswa yang digunakan sebagai dataset untuk melakukan proses klasifikasi berjumlah 334 record data dengan status lulus. Setelah dilakukan proses klasifikasi terdapat 285 atau 85,33% yang diprediksi tepat waktu dan 49 14,67% diprediksi tidak tepat waktu. Hasil yang di dapatkan menggunakan metode naïve bayes dengan pembagian 10 k fold validation henhasikan nilai precicion, Recall dan Accuracy seperti berikut ini. Berikut salah satu contoh data testing dengan atribut Jenis kelamin = Perempuan, pendapatan orang tua = Tinggi, asal sekolah Swasta, Nilai tes masuk Nilai sedang, IPK = apakah mahasiswa tersebut setelah setelah diprediksi Tepat Waktu atau tidak? Pertama menghitung jumlah kelas bagi label: P(Y = Tepat) = 285/334 = P(Y = Tidak Tepat) = 49/334 = Kedua menghitung jumlah kasus yang sama dengan kelas yang sama: F H Public L 3.13 Yes M L Public H 3.13 No M L Public M 3.19 Yes F H Vocational L 2.94 No M H Private L 3.19 Yes M L Public L 2.88 Yes F M Public M 3.38 Yes M L Private L 3.19 Yes F M Public L 3.06 No F H Public M 3.13 Yes M M Public L 3.5 Yes M H Vocational L 3.31 Yes Kalikas semua variable tepat dan terlambat: Kelas Tepat = x x x x x = Kelas Tidak Tepat = x x x x x 0.2 = Bandingkan hasil kelas tepat dan terlambat: Jadi karena hasil kelas Tidak Tepat lebih besar kelas Tepat maka keputusannya adalah Tidak Tepat Pengujian Menggunakan Menggunakan Naïve Bayes Classifier Dari jumlah dataset mahasiswa sebanyak 334 record yang diklasifikasi tepat waktu sebanyak 283 record dan 2 record tidak tepat waktu. Sedangkan data yang diprediksi tepat tetapi data aslinya bukan tepat waktu 73

5 yaitu sebanyak 47 record. Berdasarkan table 2 confusion matrix dibawah maka dapat diuji nilai akurasinya sebagai berikut: % = A = Yes B = No Recall Precision Table 3: Confusion Matrix = = Pengujian Dengan Adaboost Adaboost digunakan untuk melakukan busting terhadap algoritma naïve bayes yang bertujuan untuk meningkatkan akurasi dan mengurangi tingkat kesalahan error pada klasifikasi. Optimasi yang dilakukan sebanyak 10 kali iterasi. Berikut merupakan pembobotan dari algoritma adaboost. Input: Dataset D = (x 1, y 2 ), (x n, y n ), Y 1 = {-1, + 1} X 1 = is instance Y 1 = classification For k = 1,.,k Buat klasifikasi D k, {1,.,N} Pilih klasifikasi lemah dengan error terkecil di D k H k = x {-1, + 1} k = Pro D k [h k (x i ) y i ] Output single final classifier Pembentukan bobot D k: w (i) = w = () c(x) c(x) e, ( ) e, y h ( ) a Z H (x) = sign( a h (x)) Setelah melakukan klasifikasi terhadap kelas tepat waktu 277 record dan kelas tidak tepat waktu 42 record, setelah diprediksi menghasilkan data tepat waktu 8 record, sedangkan data yang diprediksi tidak tepat waktu 7 record. Yes No Recall Precision , % = = = IV. HASIL KOMBINASI METODE NAIVE BAYES DAN ADABOOST Teknik kombinasi ini digunakan untuk mencari tingkat nilai dengan akurasi yang lebih baik. Berdasarkan tebel 4 dibawah ini dapat ditarik kesimpulan bahwa nilai yang diperoleh dengan metode naïve bayes memiliki tingkat nilai akurasi, Precision dan Recall yang signifikan, akan tetapi memerlukan algoritma Adaboost untuk memastikan nilai tersebut agar mendapatkan tingkat akurasi yang lebih baik ketika menggabungkan kedua metode tersebut seperti terlihat pada table 4. Accuracy Precision Recall Naïve Bayes NBAdaboost Table 5: Result Combinations Method CONCLUSIONS Hasil dari penelitian ini berdasarkan beberapa data yang gunakan seperti data training maupun testing dari mahasiswa Dili Institute of Technology menunjukan bahwa tingkat keakurasian perhitungan dalam melakukan prediksi lama studi mahasiswa menggunkaan metode naïve bayes memiliki nilai yang tidak terlalu signifikan sehingga penggabungan metode seperti naïve bayes dan adaboost sangat diperlukan untuk mendapatkan tingkat nilai dengan akurasi, Precision dan Recall yang lebih tinggi dalam mempredikisi lama masa estudi mahasiswa. Hasil tersebut diperoleh dengan memanfaatkan proses perhitungan manual yang dibandingkan dengan hasil dari aplikasi WEKA sehingga bisa membantu pihak Dili Institute of Technology (DIT) dalam mengambil keputusan lebih dini berdasarkan perkembangan mahasiswanya agar bisa menghindari masalahmasalah yang akan dihadapi mahasiswa di kemudian hari, khususnya lama estudi mahasiswa. Kedepangnya peneliti berharap ada keberlanjutan dari penelitian ini dengan menambahkan atribut atau metode dalam mendukung tingkat akurasi sesuai dengan keperluan masing-masing institusi serta dapat dikembangkan lagi dalam sebuah system berbasis desktop maupun web site sehingga lebih efektif dan efisien dalam memprediksi lama masa estudi mahasiswa. 74

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, BAB II TINJAUAN PUSTAKA 2.1 Terdahulu Dalam penelitian ini, peneliti juga menyertakan beberapa uraian singkat mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, klasifikasi, metode

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENERAPAN DATA MINING UNTUK PREDIKSI LAMA STUDI MAHASISWA DENGAN MENGGUNAKAN METODE NAÏVE BAYES DAN ADABOOST

PENERAPAN DATA MINING UNTUK PREDIKSI LAMA STUDI MAHASISWA DENGAN MENGGUNAKAN METODE NAÏVE BAYES DAN ADABOOST TESIS PENERAPAN DATA MINING UNTUK PREDIKSI LAMA STUDI MAHASISWA DENGAN MENGGUNAKAN METODE NAÏVE BAYES DAN ADABOOST Jacob Soares No. Mhs: 145302261/PS/MTF PROGRAM STUDI MAGISTER TEKNIK INFORMATIKA PROGRAM

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

CONTOH KASUS DATA MINING

CONTOH KASUS DATA MINING CONTOH KASUS DATA MINING CONTOH KASUS DATA MINING Sebuah rumah sakit ingin ingin menekan biaya perawatan pasien tanpa mengurangi kualitas pelayanan. Salahsatu potensi yang dapat dimanfaatkan pada penerapan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : Tabel 2.1 Penelitian sebelumnya Parameter Penulis Objek Metode Hasil

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

Prosiding SNATIF Ke-1 Tahun 2014 ISBN:

Prosiding SNATIF Ke-1 Tahun 2014 ISBN: SISTEM PENDUKUNG KEPUTUSAN UNTUK MEMPREDIKSI KELULUSAN MAHASISWA MENGGUNAKAN METODE NAÏVE BAYES Diana Laily Fithri, Eko Darmanto Program Studi Sistem Informasi, Fakultas Teknik, Universitas Muria Kudus

Lebih terperinci

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA Erik Hadi Saputra 1), Burhan Alfironi Muktamar 2) 1), 2) Teknik Informatika

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2. 1. Dasar Teori 2. 1. 1 Data mining Data mining merupakan suatu proses penemuan pola dan pengetahuan atau informasi yang menarik dari data dengan jumlah yang

Lebih terperinci

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan PENERAPAN DATA MINING DENGAN METODE KLASIFIKASI NAÏVE BAYES UNTUK MEMPREDIKSI KELULUSAN MAHASISWA DALAM MENGIKUTI ENGLISH PROFICIENCY TEST (Studi Kasus : Universitas Potensi Utama) Alfa Saleh Teknik Informatika

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM

JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM Oleh: BENI KURNIAWAN 12.1.03.02.0201 Dibimbing oleh : 1. Resty

Lebih terperinci

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA Alfa Saleh Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan Email : alfasoleh1@gmail.com Abstrak

Lebih terperinci

( ) ( ) (3) II-1 ( ) ( )

( ) ( ) (3) II-1 ( ) ( ) BAB II LANDASAN TEORI 2.1 Naïve Bayes Classifier 2.1.1 Teorema Bayes Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang berdasar pada penerapan teorema Bayes (atau aturan Bayes) dengan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

Klasifikasi. Diadaptasi dari slide Jiawei Han

Klasifikasi. Diadaptasi dari slide Jiawei Han Klasifikasi Diadaptasi dari slide Jiawei Han http://www.cs.uiuc.edu/~hanj/bk2/ Pengantar Classification Memprediksi kelas suatu item Membuat model berdasarkan data pelatihan dan digunakan untuk mengklasifikasi

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya pembangunan gedung sekolah maupun perguruan tinggi menjadi tanda berkembangnya pendidikan. Jumlah pendaftar

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK)

IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK) IMPLEMENTASI METODE NAIVE BAYES CLASSIFICATION DALAM KLASIFIKASI KELAYAKAN CALON PENDONOR DARAH (STUDI KASUS PMI KAB. DEMAK) Diana Septiari Program Studi Teknik Informatika, Fakultas Ilmu Komputer, Universitas

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa ISSN: 2089-3787 1215 Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa Muhammad Faisal Amin Program Studi Teknik Informatika, STMIK Banjarbaru Jl. A. Yani Km. 33,3 Banjarbaru Faisal.indonesia@gmail.com

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Sebelum melakukan penelitian adapun penulis mencari penelitian penelitian yang memungkinkan terkait dengan penelitian antara lain : 1. Analisis Kinerja Data

Lebih terperinci

Klasifikasi. Diadaptasi dari slide Jiawei Han

Klasifikasi. Diadaptasi dari slide Jiawei Han Klasifikasi Diadaptasi dari slide Jiawei Han http://www.cs.uiuc.edu/~hanj/bk2/ yudi@upi.edu / Okt 2012 Pengantar Classification Memprediksi kelas suatu item Membuat model berdasarkan data pelatihan dan

Lebih terperinci

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier Octia Nuraeni 55410244 Teknik Informatika Pembimbing : Dr. Riza Adrianti

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Dalam era yang semakin berkembang ini, penggunaan data mining semakin banyak dalam berbagai bidang dan menjadi bagian dari perkembangan teknologi informasi

Lebih terperinci

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Penelitian ini adalah penelitian eksperimen dengan langkah-langkah atau metode penelitian sebagai berikut: 1. Penentuan Masalah Penentuan masalah ini diperoleh dari studi literature

Lebih terperinci

BAB 1 PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1-1 BAB 1 PENDAHULUAN Bab ini menguraikan penjelasan umum mengenai tugas akhir yang dikerjakan. Penjelasan tersebut meliputi latar belakang masalah, tujuan tugas akhir, lingkup tugas akhir, metodologi yang

Lebih terperinci

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM Teknik Informatika, Teknik Industri, Teknik Informatika Fakultas Teknik - Universitas Majalengka

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif Khafiizh Hastuti 1, Erwin Yudi Hidayat 2 1, 2 Fakultas Ilmu Komputer, Universitas Dian Nuswantoro, Semarang 50131 E-mail : 1 afis@dsn.dinus.ac.id,

Lebih terperinci

Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak)

Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak) n 1 Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak) Nurliana Nasution 1, Khairani Djahara 2, Ahmad Zamsuri 3 1,2,3 Program Studi Teknik Informatika

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout  Data mining BAB 1 PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, identifikasi masalah, ruang lingkup tugas akhir, maksud dan tujuan tugas akhir, metode penelitian tugas akhir, dan sistematika penulisan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah BAB III METODOLOGI Dalam penelitian ini metodologi memegang peranan penting guna mendapatkan data yang obyektik, valid dan selanjutnya digunakan untuk memecahkan permasalahan yang telah dirumuskan. Maka

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB 2. Landasan Teori

BAB 2. Landasan Teori BAB 2 Landasan Teori 2.1 Pengertian Data Mining Menurut Han dan Kamber (2011:6) menjelaskan bahwa Data Mining merupakan pemilihan atau menggali pengetahuan dari jumlah data yang banyak. Berbeda dengan

Lebih terperinci

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE JURNA TEKNIK, (2014) 1-6 1 AIKASI DATA MINING UNTUK MEMREDIKSI ERFORMANSI MAHASISWA DENGAN METODE KASIFIKASI DECISION TREE Irfan Fahmi, Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini sering terjadi data explosion problem yaitu data data yang tersimpan dalam database berjumlah sangat besar namun dari data data tersebut belum banyak dimanfaatkan

Lebih terperinci

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP

DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP 1 DIAGNOSIS PENYAKIT KANKER PAYUDARA MENGGUNAKAN METODE NAIVE BAYES BERBASIS DESKTOP Achmad Ramadhan Safutra 1, Dwi Wahyu Prabowo 1 1 Jurusan Sistem Informasi, Fakultas Ilmu Komputer Universitas Darwan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Instrumen Penelitian Penelitian yang akan dilakukan penulis ini menggunakan beberapa instrument penelitian, instrument tersebut dalam bentuk software maupun hardware yang

Lebih terperinci

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG 1 IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES DALAM MENENTUKAN PENGUNDURAN DIRI CALON MAHASISWA PADA UNIVERSITAS DIAN NUSWANTORO SEMARANG Muhammad Efendi Program Studi Teknik Informatika

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Rumah sakit merupakan suatu institusi atau organisasi kesehatan yang melalui tenaga medis profesional memberikan pelayanan kesehatan, asuhan keperawatan, diagnosis

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS

PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS 9 PENERAPAN METODE DECISION TREE ALGORITMA C4.5 UNTUK SELEKSI CALON PENERIMA BEASISWA TINGKAT UNIVERSITAS Nadiya Hijriana 1) dan Muhammad Rasyidan 2) 1,2 Program Studi Teknik Informatika Universitas Islam

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

Sekip Utara Yogyakarta * 1 2

Sekip Utara Yogyakarta   * 1 2 IJCCS, Vol.9, No.1, January 2015, pp. 1~12 ISSN: 1978-1520 1 Klasifikasi Data NAP (Nota Analisis Pembiayaan) untuk Prediksi Tingkat Keamanan Pemberian Kredit (Studi Kasus : Bank Syariah Mandiri Cabang

Lebih terperinci

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA

METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA Techno.COM, Vol. 15, No. 3, Agustus 216: 195-2 METODE KLASIFIKASI DENGAN ALGORITMA NAÏVE BAYES UNTUK REKOMENDASI PENJURUSAN SMA TERANG BANGSA Andrew Yova Kencana 1, Setia Astuti 2 1,2 Jurusan Teknik Ilmu

Lebih terperinci

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala Metode Klasifikasi (SVM Light dan K-NNK NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech Jurusan Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Alur dan Proses Cleaning Process Dokumen

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES Nama : Muhammad Rizki NPM : 54410806 Jurusan Pembimbing

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

PENENTUAN KUALITAS IKAN BANDENG MENGGUNAKAN ALGORITMA NAIVE BAYES BERDASARKAN TEKSTUR PADA CITRA ABSTRAK

PENENTUAN KUALITAS IKAN BANDENG MENGGUNAKAN ALGORITMA NAIVE BAYES BERDASARKAN TEKSTUR PADA CITRA ABSTRAK PENENTUAN KUALITAS IKAN BANDENG MENGGUNAKAN ALGORITMA NAIVE BAYES BERDASARKAN TEKSTUR PADA CITRA Rahmanika Ratna Sari 1, Hanny Haryanto 2 1,2 Teknik Informatika, Fakultas Ilmu Komputer, Universitas Dian

Lebih terperinci

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1  Abstract Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan

Lebih terperinci

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015 KLASIFIKASI DATA NAP (NOTA ANALISIS PEMBIAYAAN) DENGAN 5C+1S UNTUK PENENTUAN TINGKAT KEAMANAN PEMBIAYAAN MENGGUNKAN ALGORITMA NAÏVE BAYES CLASSIFIER PADA BANK SYARIAH Sumarni Adi1) 1) Teknik Informatika

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM).

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

APLIKASI PREDIKSI KELULUSAN MAHASISWA DENGAN METODE LINEAR DISCRIMINANT ANALYSIS

APLIKASI PREDIKSI KELULUSAN MAHASISWA DENGAN METODE LINEAR DISCRIMINANT ANALYSIS APLIKASI PREDIKSI KELULUSAN MAHASISWA DENGAN METODE LINEAR DISCRIMINANT ANALYSIS Sulistio PT Adicipta Inovasi Teknologi (AdIns) Jakarta email : sulistio.workmail@gmail.com Abstrak Aplikasi Prediksi Status

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

Perkiraan Waktu Studi Mahasiswa Menggunakan Metode Klasifikasi Dengan Algoritma Naive Bayes

Perkiraan Waktu Studi Mahasiswa Menggunakan Metode Klasifikasi Dengan Algoritma Naive Bayes Perkiraan Waktu Studi Mahasiswa Menggunakan Metode Klasifikasi Dengan Algoritma Naive Bayes Lestari Handayani 1, Eka Lona Maulida 2 Teknik Informatika, Fakultas Sains dan Teknologi, UIN Sultan Syarif Kasim

Lebih terperinci

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel BAB III PEMBAHASAN A. Sumber Data Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan Bermotor (BPKB) serta

Lebih terperinci

Bayesian Classifier. Bahan Kuliah Data Mining. Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Program Studi Teknik Informatika FMIPA Universitas Syiah Kuala

Bayesian Classifier. Bahan Kuliah Data Mining. Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Program Studi Teknik Informatika FMIPA Universitas Syiah Kuala Naïve Bayesian Classifier Dr. Taufik Fuadi Abidin, S.Si., M.Tech Program Studi Teknik Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Bahan Kuliah Data Mining Outline Pertemuan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Database Database (Connoly dan Begg, 2010 : 54-66) adalah suatu pembagian kumpulan data yang berisi secara logika, dan keterangan dari masing-masing data yang didesain untuk mendapatkan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Job Order merupakan pekerjaan yang dilakukan apabila ada order yang diterima dari konsumen. Setiap detil pekerjaan 100% ditentukan oleh calon pembeli, pihak pembuat

Lebih terperinci

BAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus

BAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus BAB I PENDAHULUAN I.1. Latar Belakang Bank adalah lembaga keuangan yang usaha pokoknya adalah menghimpun dana dan menyalurkan kembali dana tersebut ke masyarakat dalam bentuk kredit serta memberikan jasa-jasa

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) Andika Elok Amalia 1), Muhammad Zidny Naf an 2) 1), 2) Program Studi Informatika ST3 Telkom Jl D.I.

Lebih terperinci

Sistem Pendukung Keputusan Untuk Mengevaluasi Internal Program Studi

Sistem Pendukung Keputusan Untuk Mengevaluasi Internal Program Studi 40 Jurnal Sistem Informasi Bisnis 01(2015) On-line : http://ejournal.undip.ac.id/index.php/jsinbis Sistem Pendukung Keputusan Untuk Mengevaluasi Internal Program Studi Indhitya R. Padiku a*, Achmad Widodo

Lebih terperinci