Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu

Ukuran: px
Mulai penontonan dengan halaman:

Download "Data ini berisi 13 atribut, yaitu. Dengan tipe atribut, yaitu"

Transkripsi

1 Hai khalayak ramai, pada kesempatan kali ini aku mau ngasik tutorial yang berkaitan dengan data mining. Apa sih itu data mining?? Data mining adalah suatu proses menemukan knowledge atau informasi dari data yang berjumlah besar, di mana knowledge nya itu menarik, tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. knowledge yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru. Yak itulah sekilas tentang data mining. Pada tutorial ini aku mau me mining data dari data set yang disediakan oleh UCI yaitu data Statlog (Heart), ini link download datanya (klik gambar) Data ini berisi 13 atribut, yaitu Attribute Information: age sex chest pain type (4 values) resting blood pressure serum cholestoral in mg/dl fasting blood sugar > 120 mg/dl resting electrocardiographic results (values 0,1,2) maximum heart rate achieved exercise induced angina oldpeak = ST depression induced by exercise relative to rest the slope of the peak exercise ST segment number of major vessels (0-3) colored by flourosopy thal: 3 = normal; 6 = fixed defect; 7 = reversable defect Dengan tipe atribut, yaitu Real: 1,4,5,8,10,12 Ordered:11, Binary: 2,6,9 Nominal:7,3,13

2 Serta Kelas label yang berisi Absence (1) or presence (2) of heart disease. Berdasarkan 13 atribut yang ada di atas kelas label ini akan menghasilkan kelompok data yang terdiri dari 2, yaitu ada atau tidak adanya penyakit jantung. Dilihat dari data set tersebut, maka digunakan metode data mining yang paling tepat, yaitu klasifikasi. Apa sih klasifikasi itu?? Dalam data mining klasifikasi termasuk dalam metode prediksi, yaitu metode yang menggunakan beberapa variabel untuk memprediksi nilai yang belum diketahui (unknown ) atau nilai selanjutnya (future) dari variabel lain. Dalam klasifikasi: Terdapat sejumlah record/data yang disebut (training set ), yaitu record yang terdiri dari sejumlah atribut dan salah satunya merupakan atribut kelas /label. Dengan training set itu kita dapat mencari model untuk atribut kelas sebagai fungsi nilai dari atribut lain. Tujuannya adalah dengan model itu kita dapat melabeli seakurat mungkin record/data yang belum diketahui kelasnya. Untuk mengetahui dan menentukan tingkat akurasi model maka digunakan yang namanya test set, yaitu beberapa data yang digunakan untuk menguji model yang telah dibuat. Jadi dalam klasifikasi biasanya dataset akan dibagi menjadi dua bagian yang pertama untuk pembangunan model (training set) dan yang kedua sebagai data untuk memvalidasi model (test set). Sehingga didapat 2 langkah besar untuk melakukan klasifikasi: 1. Pembangunan Model: dengan mendeskripsikan kelas yang sudah ditentukan sebelumnya. Tiap tuple/sample diasumsikan termasuk dalam salah satu kelas yang ditunjukkan oleh atribut kelas. Tuple atau record yang digunakan untuk pembangunan model disebut sebagai training set. Model yang dihasilkan bisa berupa: rule klasifikasi, decision trees, atau rumus matematika. 2. Penggunaan Model: untuk mengklasifikasikan objek yg selanjutnya atau yg belum diketahui kelasnya Perhitungan akurasi model Label test set yang sebenarnya akan dibandingkan dengan hasil pelabelan test set dari penggunaan model. Tingkat akurasi adalah persentase test set yang terklasifikasi dengan benar oleh model. Test set independen terhadap training set, jika tidak maka kondisi over-fitting akan terjadi.

3 Jika akurasi dapat diterima, maka model bisa digunakan untuk mengklasifikasikan data yang labelnya belum diketahui. Nah itulah klasifikasi. Sekarang data set yang kita dapat sudah ada atribut dan kelas labelnya, hanya saja kita tidak mendapat data yang hanya berisi atribut tanpa kelas label untuk menguji model dari klasifikasi yang kita dapat nanti. Jadi di sini aku membagi data set Statlog (Heart) menjadi dua yaitu data dari yang pertama sampai yang terakhir sebanyak 65% sebagai training set dan sisanya sampai yang paling akhir yaitu 35% sebagai test set. Untuk melakukan klasifikasi ini aku gunain aplikasi WEKA. Link ada di gambar Sedangkan teknik klasifikasinya aku pilih Naïve Bayes dan Decision Tree. Nanti kita akan membandingkan hasil dari penggunaan dua teknik tersebut. Oke langsung saja kita mulai langkah pengerjaannya. 1. Menyiapkan Data Data set yang disediakan di UCI belum berbentuk tabel, oleh sebab itu kita harus copy paste datanya ke excel, lalu membuatnya menjadi tabel dan memberikan nama kolomkolom sesuai atributnya. Pertama kita download dulu datanya, pada halaman web klik link data folder

4 Pilih heart.dat Maka akan muncul datanya

5 Copy paste data tersebut pada notepad++, lalu ubah spasi menjadi ; dan. menjadi,.

6 Klik replace all, lalu simpan file tersebut dalam format csv

7 Misalnya di sini aku bikin nama statlog_heart.csv, buka file csv ini dengan excel lalu beri nama kolom Umur Kelamin Tipe Nyeri Tekanan Darah Kolesterol Serum Gula Darah elektrokardiografi Detak Jantung Maximal Angina Oldpeak Kemiringan Segmen flourosopy Kondisi Penyakit Jantung Kelas label diberi nama kolom penyakit jantung ubah 1 menjadi tidak ada dan 2 menjadi ada seperti gambar di bawah ini

8 Simpan data tersebut tetap dalam format csv. Buka lagi file csv tersebut dengan notepad++ ubah kembali, menjadi. Dan ; menjadi, agar nantinya csv tersebut dapat dibuka dengan weka.

9 Simpan data dengan nama statlog_heart - Copy.csv 2. Menyiapkan Attribut Data Pada Weka Buka file statlog_heart - Copy.csv pada weka. Pertama buka weka lalu klik explorer Maka akan muncul tampilan seperti ini, klik open file, pilih tipe file csv, cari file statlog_heart - Copy.csv, klik open.

10

11 Defaultnya weka akan mengkategorikan tipe attribut yang angka dengan numeric. Tetapi dari tipe attribut data set kita tadi di atas ada tipe nominal dan binary, maka kita ubah dulu kolom dengan tipe attribut tersebut. Pada weka ada fungsi filter klik choose Pilih seperti gambar di atas lalu cari numerictobinary Klik 2x pada numerictobinary

12 Pada attributeindices masukkan nomor attribut yang akan dirubah yaitu 2,6,9 klik ok, lalu klik apply. Maka attribut 2,6,9 berubah jadi binary seperti ini Ulangi pilih filter, kali ini pilih numerictonominal

13 Pilih attribut 7, 3, 13 klik ok, klik apply. Maka berubahlah attributnya menjadi nominal seperti ini

14 Sedangkan pada attribut real dan ordered tetap saja dibiarkan numeric. Attribut real pada weka memang disebutnya numeric, sedangkan attribut ordinal weka ga support jadi tetap saja biarkan numeric karena kita perlu bobotnya, kalo diubah jadi nominal attribut ordinal ini urutannya nanti jadi hilang. 3. Melakukan klasifikasi Pada klasifikasi ini kita akan menggunakan teknik Naïve Bayes dan Decision Tree. Sebelum kita menggunakan kedua teknik itu, aku mau jelasin dulu apa sih Naïve Bayes dan Decision Tree itu?? Pertama Naïve Bayes, Klasifikasi Naive bayes adalah suatu klasifikasi dengan peluang sederhana berdasarkan aplikasi teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen). Jadi diasumsikan bahwa kehadiran atau ketiadaan suatu kejadian tertentu dari suatu kelompok tidak ada hubungannya dengan kehadiran atau ketiadaan dari kejadian lainnya. Klasifikasi Naive Bayes memiliki beberapa kelebihan dan kekurangan yaitu sebagai berikut : Kelebihan Naive Bayes : Menangani kuantitatif dan data diskrit Kokoh untuk titik noise yang diisolasi, misalkan titik yang dirata ratakan ketika mengestimasi peluang bersyarat data. Hanya memerlukan sejumlah kecil training set untuk mengestimasi parameter (rata rata dan variansi dari variabel) yang dibutuhkan untuk klasifikasi. Menangani missing value dengan mengabaikan instansi selama perhitungan estimasi peluang Cepat dan efisiensi ruang Kokoh terhadap atribut yang tidak relevan Kekurangan Naive Bayes : Tidak berlaku jika probabilitas kondisionalnya adalah nol, apabila nol maka probabilitas prediksi akan bernilai nol juga Mengasumsikan variabel bebas Selanjutnya Decision tree Decision tree adalah salah satu metode klasifikasi yang mudah untuk diinterpretasi oleh manusia. Decision tree adalah model prediksi menggunakan struktur pohon atau struktur

15 berhirarki. Konsep dari decision tree ialah mengubah data menjadi pohon keputusan dan aturan-aturan keputusan. Manfaat utama dari penggunaan decision tree yaitu kemampuannya untuk mem-break down proses pengambilan keputusan yang kompleks menjadi lebih simpel sehingga pengambil keputusan akan lebih mudah menginterpretasikan solusi dari permasalahan. Kelebihan decision tree: Daerah pengambilan keputusan yang sebelumnya kompleks, diubah menjadi lebih simpel dan spesifik. Eliminasi perhitungan-perhitungan yang tidak diperlukan, karena sample diuji hanya berdasarkan kriteria atau kelas tertentu. Fleksibel untuk memilih features dari internal nodes yang berbeda, feature yang terpilih akan membedakan suatu kriteria dibandingkan kriteria yang lain dalam node yang sama. Sehingga meningkatkan kualitas keputusan yang dihasilkan. Dalam analisis multivariat, dengan kriteria dan kelas yang jumlahnya sangat banyak, seorang penguji biasanya perlu untuk mengestimasikan baik itu distribusi dimensi tinggi ataupun parameter tertentu dari distribusi kelas tersebut. Metode decision tree dapat menghindari munculnya permasalahan ini dengan menggunakan kriteria yang jumlahnya lebih sedikit pada setiap node internal tanpa banyak mengurangi kualitas keputusan yang dihasilkan. Kekurangan decision tree: Terjadi overlap terutama ketika kelas-kelas dan kriteria yang digunakan jumlahnya sangat banyak. Hal tersebut juga dapat menyebabkan meningkatnya waktu pengambilan keputusan dan jumlah memory yang diperlukan. Pengakumulasian jumlah error dari setiap level dalam sebuah pohon keputusan yang besar. Kesulitan dalam mendesain decision tree yang optimal. Hasil kualitas keputusan yang didapatkan dari metode decision tree sangat tergantung pada bagaimana pohon tersebut didesain.

16 Itulah sekilas tentang Naïve Bayes dan Decision Tree serta kelebihan dan kekurangan masing-masing, kuy kembali ke weka. Sesuai kesepakatan tadi, dengan menggunakan kedua teknik ini kita akan menggunakan 65% dari data set sebagai training set dan sisanya 35% sebagai test set. Dimulai dari Naïve Bayes, pada weka klik tab classify, pada fungsi classifier pilih NaïveBayes setelah itu pilih percentage split 65%, artinya 65% dari datanya menjadi training set dan sisanya yang tentunya 35% menjadi test set.

17 Klik start Melalui hasil test set model yang didapat dari klasifikasi naive bayes bisa dilihat bahwa teknik ini dapat menebak lebih baik yang tidak ada penyakit jantung dibandingkan yang

18 ada penyakit jantung. Di mana yang tidak ada penyakit jantung dapat ditebak dengan benar sejumlah 40 dan salah sejumlah 5. Sedangkan yang ada penyakit jantung dapat ditebak dengan benar hanya sejumlah 38 dan salah sejumlah 11. Dengan tingkat keberhasilan sekitar 83% dan error sekitar 17%. Serta model yang didapat sebagai berikut

19

20

21 Pada model, data numeric pengelompokannya dibedakan berdasarkan rata-rata (mean), standar deviasi, jumlah, dan presisi, sedangkan data nominal dan binary dibedakan berdasarkan jumlah saja. Selanjutnya menggunakan decision tree, langkahnya sama seperti tadi menggunakan fungsi classifier, tapi kali ini pilih tree, karena yang mau kita pake decision tree, pilih J48 yang mengimplementasikan algoritma C4.5, yaitu algoritma yang dasarnya adalah pembentukan pohon keputusan (decision tree). Percentage split masih tetap sama 65% yaitu sebagai training set dan sisanya yang pasti 35% sebagai test set, lalu klik start

22 Maka didapat hasilnya seperti ini Hasil test set gunain model yang didapat dari klasifikasi decision tree dapat menebak dengan sangat baik tidak ada penyakit jantung dengan jumlah benar sebanyak 43 dan

23 salah sebanyak 2, tapi sangat buruk dalam menebak ada penyakit jantung dengan jumlah benar sebanyak 29 dan salah sebanyak 20. Dengan tingkat keberhasilan sekitar 77% dan error sekitar 23%. Serta model yang didapat sebagai berikut

24 Model di atas dapat dibaca misalnya row data yang kolom kondisi =6 dan kolom flourosopy isinya > 0 maka termasuk dalam kelompok (kelas) ada penyakit jantung, sedangkan dalam kondisi yang sama =6 dan flourosopy isinya <= 0 maka termasuk dalam kelompok (kelas) tidak ada penyakit jantung. Untuk lebih jelasnya kita bisa membuat pohon keputusan dengan klik kanan, lalu pilih visualize tree

25 Tapi karena ukuran tree nya besar yaitu 43 sehingga leaves nya banyak 25, maka weka mengenerate tree nya jadi mepet-mepet sehingga ga begitu jelas.

26 Oleh sebab itu kita maximize, lalu klik kanan, pilih fit to screen Jadinya seperti ini

27 Atau kalo mau lebih jelas lagi klik kanan pilih auto scale Nanti jadi nya seperti ini, karena tree nya cukup besar jadi harus geser-geser buat liat keseluruhan

28 4. Kesimpulan Jadi kesimpulannya berdasarkan klasifikasi yang sudah kita lakukan tadi, membuktikan bahwa data set UCI yaitu Statlog (Heart) pengklasifikasiannya lebih baik menggunakan teknik Naïve Bayes dibandingkan dengan Decision Tree yaitu dengan tingkat keberhasilan Naïve Bayes sekitar 83% sedangkan Decision Tree sekitar 77%.

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

DIAGNOSA PENYAKIT JANTUNG MENGGUNAKAN TEKNIK AUTOMATIC POST PRUNING DECISION TREE

DIAGNOSA PENYAKIT JANTUNG MENGGUNAKAN TEKNIK AUTOMATIC POST PRUNING DECISION TREE DIAGNOSA PENYAKIT JANTUNG MENGGUNAKAN TEKNIK AUTOMATIC POST PRUNING DECISION TREE Susilawati, Aullia Rachman, Andi Batari Nurulniza, Chandra Prasetyo Utomo Universitas YARSI Jl.Let.Jend.Suprapto Cempaka

Lebih terperinci

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining. Modul Praktikum WEKA Yudi Wibisono (e: yudi@upi.edu ); t: @yudiwbs Ilmu Komputer Universitas Pendidikan Indonesia (cs.upi.edu) Versi BETA : Oktober 2013 http://creativecommons.org/licenses/by-nc-sa/3.0/

Lebih terperinci

OPTIMASI JARINGAN SYARAF TIRUAN BACKPROPAGATION MENGGUNAKAN PARTICLE SWARM OPTIMIZATION UNTUK DETEKSI PENDERITA PENYAKIT JANTUNG

OPTIMASI JARINGAN SYARAF TIRUAN BACKPROPAGATION MENGGUNAKAN PARTICLE SWARM OPTIMIZATION UNTUK DETEKSI PENDERITA PENYAKIT JANTUNG OPTIMASI JARINGAN SYARAF TIRUAN BACKPROPAGATION MENGGUNAKAN PARTICLE SWARM OPTIMIZATION UNTUK DETEKSI PENDERITA PENYAKIT JANTUNG Hargianti Henni Oktawandari Program Studi Teknik Informatika, Fakultas Ilmu

Lebih terperinci

Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Naïve Bayes

Seleksi Fitur Information Gain untuk Klasifikasi Penyakit Jantung Menggunakan Kombinasi Metode K-Nearest Neighbor dan Naïve Bayes Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 9, September 2018, hlm. 2546-2554 http://j-ptiik.ub.ac.id Seleksi Fitur Information Gain untuk Klasifikasi Penyakit

Lebih terperinci

Penggunaan Metodologi Analisa Komponen Utama (PCA) untuk Mereduksi Faktor-Faktor yang Mempengaruhi Penyakit Jantung Koroner

Penggunaan Metodologi Analisa Komponen Utama (PCA) untuk Mereduksi Faktor-Faktor yang Mempengaruhi Penyakit Jantung Koroner Penggunaan Metodologi Analisa Komponen Utama (PCA) untuk Mereduksi Faktor-Faktor yang Mempengaruhi Penyakit Jantung Koroner Galih Hendro M. galih_smula@yahoo.com T. B. Adji adji.tba@gmail.com N. A. Setiawan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Penelitian ini adalah penelitian eksperimen dengan langkah-langkah atau metode penelitian sebagai berikut: 1. Penentuan Masalah Penentuan masalah ini diperoleh dari studi literature

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA

ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA 53 ALGORITMA C4.5 UNTUK SIMULASI PREDIKSI KEMENANGAN DALAM PERTANDINGAN SEPAKBOLA Marwana*) Abstract : Abstract-This study is a simulation for memperiksi victory in a football game using the C4.5 data

Lebih terperinci

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Materi Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Dosen Pengasuh Dr. Taufik Fuadi Abidin, M.Tech Dr. Muhammad Subianto, M.Si {tfa,subianto}@informatika.unsyiah.ac.id

Lebih terperinci

Manfaat Pohon Keputusan

Manfaat Pohon Keputusan DECISION TREE (POHON KEPUTUSAN) Latar Belakang Pohon Keputusan Di dalam kehidupan manusia sehari-hari, manusia selalu dihadapkan oleh berbagai macam masalah dari berbagai macam bidang. Masalah-masalah

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Model. Pengklasifikasian: Definisi. Catatan Kuliah untuk Bab 4

Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Model. Pengklasifikasian: Definisi. Catatan Kuliah untuk Bab 4 Data Mining Pengklasifikasian: Konsep Dasar, Pohon Keputusan, and Evaluasi Catatan Kuliah untuk Bab 4 Pengantar Data Mining oleh Tan, Steinbach, Kumar dialihbahasakan oleh Tim Pengajar Konsep Data Mining

Lebih terperinci

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel BAB III PEMBAHASAN A. Sumber Data Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan Bermotor (BPKB) serta

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika Classification Decision Tree Classification Decision Tree Pengertian Pohon Keputusan Pohon keputusan adalah

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan Sistem Pendukung Keputusan (SPK) / Decision Support Sistem (DSS) adalah sistem komputer yang saling berhubungan dan menjadi alat bantu bagi seorang

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

BAB III METODE PENELITIAN. Desain penelitian yang dikembangkan dalam pengembangan sistem. keputusan jantung ini adalah sebagai berikut.

BAB III METODE PENELITIAN. Desain penelitian yang dikembangkan dalam pengembangan sistem. keputusan jantung ini adalah sebagai berikut. BAB III METODE PENELITIAN 3.1 Desain Penelitian Desain penelitian yang dikembangkan dalam pengembangan sistem keputusan jantung ini adalah sebagai berikut. Studi Literatur Data Pelatihan Data Data testing

Lebih terperinci

ANALISIS FAKTOR PREDIKSI DIAGNOSIS TINGKAT KEPARAHAN PENYAKIT JANTUNG (HEART DISEASE) MENGGUNAKAN METODE STEPWISE BINARY LOGISTIC REGRESSION

ANALISIS FAKTOR PREDIKSI DIAGNOSIS TINGKAT KEPARAHAN PENYAKIT JANTUNG (HEART DISEASE) MENGGUNAKAN METODE STEPWISE BINARY LOGISTIC REGRESSION ANALISIS FAKTOR PREDIKSI DIAGNOSIS TINGKAT KEPARAHAN PENYAKIT JANTUNG (HEART DISEASE) MENGGUNAKAN METODE STEPWISE BINARY LOGISTIC REGRESSION Indana Lazulfa Program Studi Teknik Informatika, Fakultas Teknologi

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R)

PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R) Arifin, Perbandingan Akurasi Klasifikasi Dari Algoritma Naïve Bayes, C4.5, PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R) M Zainal Arifin Abstrak : Artikel ini menjabarkan

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG Era komunikasi dengan menggunakan fasilitas internet memberikan banyak kemudahan dalam mendapatkan informasi yang dikehendaki. Dengan demikian semakin banyak orang,

Lebih terperinci

PENGGABUNGAN ALGORITMA BACKWARD ELIMINATION DAN K-NEAREST NEIGHBOR UNTUK MENDIAGNOSIS PENYAKIT JANTUNG

PENGGABUNGAN ALGORITMA BACKWARD ELIMINATION DAN K-NEAREST NEIGHBOR UNTUK MENDIAGNOSIS PENYAKIT JANTUNG PENGGABUNGAN ALGORITMA BACKWARD ELIMINATION DAN K-NEAREST NEIGHBOR UNTUK MENDIAGNOSIS PENYAKIT JANTUNG Laily Hermawanti *, Sucianna Ghadati Rabiha Jurusan Teknik Informatika, Fakultas Teknik, Universitas

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik. BAB IV HASIL DAN PEMBAHASAN 4.1. Identifikasi Masalah Dalam menentukan status calon dosen dan dosen tetap terdapat masalahmasalah dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya sebagai

Lebih terperinci

BAB I PENDAHULUAN. Informasi merupakan hal yang sangat berharga dalam kehidupan manusia,

BAB I PENDAHULUAN. Informasi merupakan hal yang sangat berharga dalam kehidupan manusia, BAB I PENDAHULUAN 1.1 Latar Belakang Informasi merupakan hal yang sangat berharga dalam kehidupan manusia, terlebih lagi jika informasi tersebut dapat memberikan manfaat dalam mendukung suatu keputusan.

Lebih terperinci

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani Jurusan Sistem Informasi, STMIK MDP Palembang Jln. Rajawali No.14 Palembang 30113 Telp. (0711) 376400, Faks.

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: 1907-5022 Yogyakarta, 15-16 Juni 2012 PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Teknologi semakin berkembang seiring dengan berjalannya waktu. Disadari atau tidak, sebagian besar kehidupan ini dibantu oleh teknologi dan banyak sekali manfaat yang

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Deposito merupakan salah satu tabungan berjangkaayangamodel pengambilannya berdasarkan pada kesepakatan dari pihak bank dengan nasabah deposito [1].Suku bunga

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini sering terjadi data explosion problem yaitu data data yang tersimpan dalam database berjumlah sangat besar namun dari data data tersebut belum banyak dimanfaatkan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal

Lebih terperinci

ALGORITMA K-NEAREST NEIGHBOR BERBASIS FORWARD SELECTION UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER

ALGORITMA K-NEAREST NEIGHBOR BERBASIS FORWARD SELECTION UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER KOMPUTAKI Vol.3, No.1 Februari 2017 ALGORITMA K-NEAREST NEIGHBOR BERBASIS FORWARD SELECTION UNTUK MENDIAGNOSIS PENYAKIT JANTUNG KORONER Achmad Nuruddin Safriandono email : udinozz@gmail.com Abstrak K-Nearest

Lebih terperinci

PRAKTIKUM KE-5 KLASIFIKASI I

PRAKTIKUM KE-5 KLASIFIKASI I PRAKTIKUM KE-5 KLASIFIKASI I 1. Tujuan Praktikum 1) Mahasiswa mempunyai pengetahuan dan kemampuan dasar mengenai metode pencarian pengetahuan / pola data dari sejumlah data dengan menggunakan teknik klasifikasi.

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penyakit Kanker merupakan suatu peyakit yang paling ditakuti oleh masyakat karena proses penyembuhannya yang sulit, efek yang ditimbulkan dan memerlukan biaya yang

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

Klasifikasi & Prediksi

Klasifikasi & Prediksi Klasifikasi & Prediksi Elsen Ronando, S.Si.,M.Si.,M.Sc. elsen.ronando@untag-sby.ac.id Teknik Informatika Fakultas Teknik Universitas 17 Agustus 1945 Surabaya 2017 Elsen Ronando, S.Si.,M.Si.,M.Sc. (UNTAG)

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

4.1. Pengambilan Data

4.1. Pengambilan Data BAB IV HASIL PENGUJIAN DAN PEMBAHASAN Hasil pengujian adalah hasil final yang berarti penelitian telah selesai dilakukan, semua yang berkaitan dengan pengujian akan dibahas pada bab ini mulai dari pengolahan

Lebih terperinci

Penerapan Data Mining dalam Memprediksi Pembelian cat

Penerapan Data Mining dalam Memprediksi Pembelian cat Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Penerapan Data Mining dalam Memprediksi Pembelian cat Fitriana Harahap STMIK POTENSI UTAMA Jl. KL. Yos Sudarso KM 6,5

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam

Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam Supervised Learning Misalkan kita ingin membuat suatu program komputer yang ketika diberi gambar seseorang, dapat menentukan apakah orang dalam gambar tersebut pria atau wanita. Program yang kita buat

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB 1 PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1-1 BAB 1 PENDAHULUAN Bab ini menguraikan penjelasan umum mengenai tugas akhir yang dikerjakan. Penjelasan tersebut meliputi latar belakang masalah, tujuan tugas akhir, lingkup tugas akhir, metodologi yang

Lebih terperinci

DIAGNOSA PENYAKIT JANTUNG PADA PONSEL MENGGUNAKAN POHON KEPUTUSAN

DIAGNOSA PENYAKIT JANTUNG PADA PONSEL MENGGUNAKAN POHON KEPUTUSAN DIAGNOSA PENYAKIT JANTUNG PADA PONSEL MENGGUNAKAN POHON KEPUTUSAN Febri Maspiyanti Teknik Informatika Universitas Pancasila febri.maspiyanti@univpancasila.ac.id Jullend Gatc Sistem Informasi Kalbis Institute

Lebih terperinci

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4. KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.1 Muhammad Syahril Program Studi Sistem Informasi, STMIK Triguna

Lebih terperinci

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5

DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5 Konferensi Nasional Ilmu Sosial & Teknologi (KNiST) Maret 2017, pp. 7~12 7 DIAGNOSA PREDIKSI PENYAKIT JANTUNG DENGAN MODEL ALGORITMA NAÏVE BAYES DAN ALGORITMA C4.5 Tri Retnasari 1, Eva Rahmawati 2 1 STMIK

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : Tabel 2.1 Penelitian sebelumnya Parameter Penulis Objek Metode Hasil

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse 1.1.Pengumpulan data BAB IV HASIL DAN PEMBAHASAN Data yang digunakan dalam penelitian ini adalah data warehouse Graduation Universitas Muhammadiyah Yogyakarta pada Fakultas Teknik UMY tahun kelulusan 2013,

Lebih terperinci

1. Model Prediksi Ini Menggunakan Tools RapidMiner

1. Model Prediksi Ini Menggunakan Tools RapidMiner 1. Model Prediksi Ini Menggunakan Tools RapidMiner RapidMiner memiliki keunggulan tersendiri, RapidMiner merupakan aplikasi data mining berbasis sistem open-source dunia yang terkemuka dan ternama. Tersedia

Lebih terperinci

Bab I Pendahuluan. 1.1 Latar Belakang

Bab I Pendahuluan. 1.1 Latar Belakang Bab I Pendahuluan 1.1 Latar Belakang Klasifikasi merupakan task dari data mining yang bertujuan untuk memberikan label kelas terhadap suatu data. Pemberian label kelas ini dilakukan oleh classifier. Suatu

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3 APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3 SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom) Pada Program Studi Sistem

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 40 BAB III METODOLOGI PENELITIAN 3.1 DESAIN PENELITIAN Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES Nama : Muhammad Rizki NPM : 54410806 Jurusan Pembimbing

Lebih terperinci

Perangkat Lunak - Weka*

Perangkat Lunak - Weka* MMA10991 Topik Khusus - Machine Learning Perangkat Lunak - Weka* Dr. rer. nat. Hendri Murfi * Beberapa bagian dari slide ini adalah terjemahan dari slide Data Mining oleh I. H. Witten, E. Frank dan M.

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

BAB I PENDAHULUAN. basis data dan mengubahnya menjadi informasi yang berguna. Metode data

BAB I PENDAHULUAN. basis data dan mengubahnya menjadi informasi yang berguna. Metode data BAB I PENDAHULUAN 1.1 Latar Belakang Data-data pinjaman yang tersimpan pada Koperasi XYZ yang selama ini hanya dijadikan arsip koperasi sebenarnya dapat dimanfaatkan menjadi sesuatu yang lebih berguna.

Lebih terperinci

CONTOH KASUS DATA MINING

CONTOH KASUS DATA MINING CONTOH KASUS DATA MINING CONTOH KASUS DATA MINING Sebuah rumah sakit ingin ingin menekan biaya perawatan pasien tanpa mengurangi kualitas pelayanan. Salahsatu potensi yang dapat dimanfaatkan pada penerapan

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER

KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2005 KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER Agustina Ratna Puspitasari¹,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

Data Mining II Estimasi

Data Mining II Estimasi Data Mining II Estimasi Matakuliah Data warehouse Universitas Darma Persada Oleh: Adam AB Data Mining-2012-a@b 1 Tahapan proses datamining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/

Lebih terperinci

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan. BAB I PENDAHULUAN A. Latar Belakang Dengan kemajuan teknologi informasi dewasa ini kebutuhan akan informasi yang akurat sangat dibutuhkan, dikarenakan informasi akan menjadi suatu elemen penting dalam

Lebih terperinci

BAB 2. Landasan Teori

BAB 2. Landasan Teori BAB 2 Landasan Teori 2.1 Pengertian Data Mining Menurut Han dan Kamber (2011:6) menjelaskan bahwa Data Mining merupakan pemilihan atau menggali pengetahuan dari jumlah data yang banyak. Berbeda dengan

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa. ABSTRAK Kemajuan teknologi membuat begitu mudahnya dalam pengolahan suatu informasi. Waktu tidak lagi menjadi hambatan dalam pengolahan data yang sangat banyak. Hal ini didukung pula dengan adanya perkembangan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Dalam era yang semakin berkembang ini, penggunaan data mining semakin banyak dalam berbagai bidang dan menjadi bagian dari perkembangan teknologi informasi

Lebih terperinci

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier Octia Nuraeni 55410244 Teknik Informatika Pembimbing : Dr. Riza Adrianti

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 Sulidar Fitri Teknik Informatika STMIK AMIKOM Yogyakarta email : inboxfitri@gmail.com Abstraksi Penelitian

Lebih terperinci

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE JURNA TEKNIK, (2014) 1-6 1 AIKASI DATA MINING UNTUK MEMREDIKSI ERFORMANSI MAHASISWA DENGAN METODE KASIFIKASI DECISION TREE Irfan Fahmi, Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri,

Lebih terperinci

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis 1 BAB I PENDAHULUAN 1.1 Latar Belakang Dalam bisnis Leasing, pemilihan keputusan penyetujuan suatu aplikasi merupakan hal mutlak dan bersifat sangat sensitif. Pada Umumnya, memang penyetujuan pengajuan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Laporan Implementasi Naïve Bayes dan Feed Forward Neural Network untuk Klasifikasi

Laporan Implementasi Naïve Bayes dan Feed Forward Neural Network untuk Klasifikasi Laporan Implementasi Naïve Bayes dan Feed Forward Neural Network untuk Klasifikasi dibuat oleh 707 Berusaha Imba: 13514002 M. Diaztanto Haryaputra 13514023 Fanda Yuliana Putri 13514025 Ratnadira Widyasari

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

2. Data & Proses Datamining

2. Data & Proses Datamining 2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)

Lebih terperinci

Modul IV KLASIFIKASI

Modul IV KLASIFIKASI LABORATORIUM DATA MINING JURUSAN TEKNIK INDUSTRI FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS ISLAM INDONESIA Modul IV KLASIFIKASI TUJUAN PRAKTIKUM Setelah mengikuti praktikum modul ini diharapkan: 1. Mahasiswa

Lebih terperinci

PENGENALAN APLIKASI STATISTICAL PRODUCT AND SERVICE SOLUTIONS (SPSS)

PENGENALAN APLIKASI STATISTICAL PRODUCT AND SERVICE SOLUTIONS (SPSS) MODUL 8 PENGENALAN APLIKASI STATISTICAL PRODUCT AND SERVICE SOLUTIONS (SPSS) Tujuan Praktikum : Mahasiswa mengenal aplikasi pengolah data statistik yaitu SPSS Mahasiswa dapat menggunakan aplikasi SPSS

Lebih terperinci

Analisis perbandingan Klasifikasi penyakit jantung dengan menggunakan naïve bayes

Analisis perbandingan Klasifikasi penyakit jantung dengan menggunakan naïve bayes Analisis perbandingan Klasifikasi penyakit jantung dengan menggunakan naïve bayes Muhammad Sulkifly Said Program Studi Magister Teknologi Informasi, Universitas Gadjah Mada Jl. Grafika No.2 Kampus UGM,

Lebih terperinci

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit

Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit Klasifikasi Nasabah Menggunakan Algoritma C4.5 Sebagai Dasar Pemberian Kredit Larissa Navia Rani Dosen Sistem Informasi UPI YPTK Padang Jl. Raya Lubuk Begalung Padang - Sumatera Barat larissa_navia_rani@upiyptk.ac.id

Lebih terperinci

3.1 Metode Pengumpulan Data

3.1 Metode Pengumpulan Data BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data Sebuah penelitian memerlukan pengumpulan data dan metode pengumpulan data karena sangat berpengaruh terhadap akurasi dan kualitas data yang digunakan

Lebih terperinci

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup 1 BAB I PENDAHULUAN 1.1. Latar Belakang Pendidikan merupakan salah satu faktor utama dalam hidup seorang manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup setiap orang. Namun keberadaan

Lebih terperinci

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi,

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi, BAB I PENDAHULUAN 1.1 Latar Belakang Pengambilan suatu keputusan dapat membantu dalam mencari solusi dari sekian banyak solusi yang ada. Pengambilan keputusan adalah hasil dari suatu proses yang termasuk

Lebih terperinci

BAB IV PEMBAHASAN. Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni

BAB IV PEMBAHASAN. Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni BAB IV PEMBAHASAN Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni 2013-2015, rentan waktu itu di jadikan sebagai bahan penelitian karena cukup relevan dengan tahun sekarang, faktor

Lebih terperinci