Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A

dokumen-dokumen yang mirip
Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

Bayesian Classifier. Bahan Kuliah Data Mining. Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Program Studi Teknik Informatika FMIPA Universitas Syiah Kuala

BAB III METODE PENELITIAN

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III ANALISIS DAN PERANCANGAN

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB II LANDASAN TEORI

BAB I PENDAHULUAN I-1

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

SKRIPSI TI S1 FIK UDINUS 1

Student Clustering Based on Academic Using K-Means Algoritms

BAB 1 PENDAHULUAN 1-1

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

BAB II LANDASAN TEORI

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

DATA MINING MENGGUNAKAN ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI KELULUSAN MAHASISWA UNIVERSITAS DIAN NUSWANTORO ABSTRAK

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

BAB 2. Landasan Teori

SILABUS MATAKULIAH. Revisi : 4 Tanggal Berlaku : 04 September Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

BAB III 3. METODOLOGI PENELITIAN

BAB II TINJAUAN PUSTAKA

TechnoXplore ISSN : X Jurnal Ilmu Komputer & Teknologi Informasi Vol 1 No : 2, Oktober 2016

BAB III METODOLOGI PENELITIAN

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

DATA MINING DENGAN METODE CLUSTERING UNTUK PENGOLAHAN INFORMASI PERSEDIAAN OBAT PADA PUSKESMAS PANDANARAN SEMARANG

PENERAPAN DATA MINING UNTUK KLASIFIKASI PENJURUSAN SEKOLAH MENENGAH ATAS PADA SMA 1 KAJEN DENGAN MENGGUNAKAN ALGORITMA NAIVE BAYES CLASSIFIER

Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak)

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

Konsep Business Inteligence. (Bag. 2) Ade Sarah H., M.Kom

BAB 3 METODE PENELITIAN

CONTOH KASUS DATA MINING

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

TRANSFORMASI Jurnal Informasi & Pengembangan Iptek

MODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015

BAB 3 LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

ANALISIS SISTEM PRODUKSI GULA SEMUT FORTIFIKASI VITAMIN A DENGAN TIGA TINGKATAN KUALITAS GRADE

BAB I PENDAHULUAN. dari pemikiran-pemikiran manusia yang semakin maju, hal tersebut dapat. mendukung bagi pengembangan penyebaran informasi.

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

M. Zidny Naf an Gasal 2016/2017

REKOMENDASI TOPIK TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA DI UNIVERSITAS MUHAMMADIYAH JEMBER MENGGUNAKAN METODE NAÏVE BAYESIAN CLASSIFIER

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

PENENTUAN STRATEGI MARKETING PENJUALAN PRODUK DENGAN ALGORITMA APRIORI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Prosiding SNATIF Ke-1 Tahun 2014 ISBN:

Klasifikasi. Diadaptasi dari slide Jiawei Han

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. secara manual dari suatu kumpulan data. Defenisi lain data mining adalah sebagai

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

BAB 2 TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

IMPLEMENTASI DATA MINING MENGGUNAKAN CRISP-DM PADA SISTEM INFORMASI EKSEKUTIF DINAS KELAUTAN DAN PERIKANAN PROVINSI JAWA TENGAH

BAB I PENDAHULUAN. kegiatan simpan pinjam layaknya bank, dimana ijin operasionalnya di bawah

Prediksi Ketepatan Waktu Kelulusan Dengan Algoritma Data Mining C4.5

DATA CLUSTERING MENGGUNAKAN METODE CRISP DM UNTUK MENGETAHUI KEBUTUHAN TENAGA PENDIDIK JENJANG SMA DI KABUPATEN BANJAR

DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA. Oleh : Rita Prima Bendriyanti ABSTRAK

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

APLIKASI DATA MINING UNTUK MENGHASILKAN POLA KELULUSAN SISWA DENGAN METODE NAÏVE BAYES

Gambar 1 Peningkatan Jumlah Mahasiswa Prodi Teknik Informatika

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN Latar Belakang

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) PENERAPAN IMPROVED APRIORI PADA APLIKASI DATA MINING DI PERUSAHAAN KALVIN SOCKS PRODUCTION

II. TINJAUAN PUSTAKA

BAB 3 METODE PENELITIAN

BAB II LANDASAN TEORI

Klasifikasi. Diadaptasi dari slide Jiawei Han

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA ECLAT

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

DATA MINING CLASSIFICATION UNTUK PREDIKSI LAMA MASA STUDI MAHASISWA BERDASARKAN JALUR PENERIMAAN DENGAN METODE NAIVE BAYES

BAB I PENDAHULUAN 1.1 Latar Belakang

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

BAB I PENDAHULUAN. Perguruan tinggi yang baik dipengaruhi oleh kualitas. mahasiswa di dalamnya. Mahasiswa merupakan objek

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Universitas Indonesia

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Investasi merupakan penanaman sejumlah dana dalam bentuk uang

BAB I PENDAHULUAN 1-1

BAB III METODOLOGI PENELITIAN

Transkripsi:

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A11.2011.06038 Kel : A11.4812

CRISP-DM CRISP - DM adalah metodologi data mining komprehensif dan Model proses untuk siapa pun (dari pemula sampai ahli data mining) dengan blueprint untuk melakukan proyek data mining. CRISP - DM breaks down siklus hidup proyek data mining dibagi menjadi 6 fase.

Sejarah CRISP-DM diusulkan pada pertengahan 1990an oleh konsorsium perusahaan-perusahaan eropa untuk dijadikan methodology standard nonproprietary bagi DM (CRISP-DM, 2009) Diluncurkan pada pertengahan tahun 1996 Dikembangakan dan disempurnakan dari workshops (1997-1999) yang didukung oleh 300 lebih perusahaan. CRISP - DM 1.0 diterbitkan ( 1999) Lebih dari 200 anggota SIG CRISP - DM di seluruh dunia Vendor DM - SPSS, NCR, IBM, SAS, SGI, Data Distilleries, Syllogic, Magnify

Standart data mining CRISP-DM

6 fase CRISP-DM 1. Fase Pemahaman Bisnis (Business Understanding Phase) 2. Fase Pemahaman Data (Data Understanding Phase) 3. Fase Pengolahan Data (Data Preparation Phase) 4. Fase Pemodelan (Modeling Phase) 5. Fase Evaluasi (Evaluation Phase) 6. Fase Penyebaran (Deployment Phase)

Fase Pemahaman Bisnis(1) Rencana projek untuk menemukan knowledge sehingga menetapkan orang-orang yang bertanggaungjawab untuk koleksi data, analisa, melaporkan temuan-temuan Penentuan tujuan proyek dan kebutuhan secara detail Menerjemahkan tujuan dan batasan permasalahan data mining Menyiapkan strategi awal untuk mencapai tujuan Perlunya menentukan budget untuk mendukung kajian ini.

Fase Pemahaman Data(2) Mengidentifikasi data yang relevan dari berbagai database yang ada. Analisa data agar dapat mengenali data lebih lanjut. Mengevaluasi kualitas data. Jika diinginkan, pilih sebagian kecil kelompok data yang mungkin mengandung pola dari permasalahan Contoh : project DM untuk retail mungkin ingin mengetahui mengenai perilaku belanja para wanita penggemar belanja yang membeli baju-baju untuk musiman berdasarkan demografis mereka, transaksi kartu kredit mereka, dan ciri-ciri sosioekonomi mereka.

Fase Pengolahan Data(3) Pemrosesan data menyita waktu dan usaha paling banyak. Sekitar 80% dari total waktu yang dibutuhkan dalam pengerjaan proyek. Pilih kasus dan variabel sesuai analisis yang akan dilakukan. Lakukan perubahan pada beberapa variabel jika dibutuhkan. Siapkan data awal sehingga siap untuk perangkat pemodelan. Contoh : mengkonversi data rill yang pada umumnya tidak lengkap, noisy(berisi data error), data tidak konsisten agar bisa menjadi dataset yang bisa digali

Fase Pemodelan(4) Tahap pembuatan model juga mencakup penilaian dan analisa komparatif dari berbagai model yang dibangun. Karena tidak ada satupun model yang secara universal dianggap sebagai metode / algoritma yang terbaik. Pilih dan aplikasikan teknik pemodelan yang sesuai. Beberapa teknik mungkin dapat digunakan pada permasalahan yang sama. Proses dapat kembali ke fase pengolahan data jika diperlukan. Contoh : beberapa metode DM seperti decision tree,classification, k-means untuk clustering, dan Apriori untuk association rule mining

Fase Evaluasi(5) Tahap ini mengukur sejauh mana model yang sudah dipilih memenuhi sasaran-sasaran bisnis Mengevaluasi satu atau lebih model sebelum disebarkan. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal. Menentukan apakah terdapat permasalahan penting dari bisnis atau penelitian yang tidak tertangani dengan baik. Contoh : menginterpretasikan hasil-hasil solusi matematis yang canggih maka seringkali digunakan berbagai macam tabulasi dan teknik-teknik visualisasi (misalnya table-tabel pivot, tabulasi silang dari berbagai temuan,diagram pie,diagram batang,scatterplots).

Fase Penyebaran(6) Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek. Tahap deployment mungkin juga meliputi berbagai aktivitas maintenance pada model yang sudah digunakan. Karena semua yang terkait dengan bisnis pasti mengalami perubahan Contoh sederhana penyebaran: Pembuatan laporan. Contoh kompleks Penyebaran: Penerapan proses data mining secara paralel pada departemen lain.

Referensi http://repository.widyatama.ac.id/xmlui/bitstream/handle/ 123456789/2360/13.%20BAB%20II.pdf?sequence=14 http://paginas.fe.up.pt/~ec/files_0405/slides/02%20cris P.pdf http://beritati.blogspot.com/2013/08/seri-data-mining-forbusiness_19.html diakses 7/10/2014

Naive bayesian classifier Adalah metode classifier yang berdasarkan probabilitas dan Teorema Bayesian dengan asumsi bahwa setiap variabel X bersifat bebas (independence) Mengansumsikan bahwa keberadaan sebuah atribut (variabel) tidak ada kaitannya dengan beradaan atribut (variabel) yang lain Karena asumsi atribut tidak saling terkait (conditionally independent), maka:

Bila P(X Ci) dapat diketahui melalui perhitungan di atas, maka klas (label) dari data sampel X adalah klas (label) yang memiliki P(X Ci)*P(Ci) maksimum

Contoh soal NO JENIS KELAMIN STATUS MAHASISWA STATUS PRENIKAHAN IPK Semester 1-6 STATUS KELULUSAN 1 LAKI - LAKI MAHASISWA BELUM 3.17 TEPAT 2 LAKI - LAKI BEKERJA BELUM 3.30 TEPAT 3 PEREMPUAN MAHASISWA BELUM 3.01 TEPAT 4 PEREMPUAN MAHASISWA MENIKAH 3.25 TEPAT 5 LAKI - LAKI BEKERJA MENIKAH 3.20 TEPAT 6 LAKI - LAKI BEKERJA MENIKAH 2.50 TERLAMBAT 7 PEREMPUAN BEKERJA MENIKAH 3.00 TERLAMBAT 8 PEREMPUAN BEKERJA BELUM 2.70 TERLAMBAT 9 LAKI - LAKI BEKERJA BELUM 2.40 TERLAMBAT 10 PEREMPUAN MAHASISWA MENIKAH 2.50 TERLAMBAT 11 PEREMPUAN MAHASISWA BELUM 2.50 TERLAMBAT 12 PEREMPUAN MAHASISWA BELUM 3.50 TEPAT 13 LAKI - LAKI BEKERJA MENIKAH 3.30 TEPAT 14 LAKI - LAKI MAHASISWA MENIKAH 3.25 TEPAT 15 LAKI - LAKI MAHASISWA BELUM 2.30 TERLAMBAT

Tentukan keterangan KELAMIN STATUS PRENIKAHAN IPK KETERANGA N LAKI LAKI MAHASISWA BELUM 2.70???

Tahap penyelesaian

Hasil KELAMIN STATUS PRENIKAHAN IPK KETERANGAN LAKI - LAKI MAHASISWA BELUM 2.70 TERLAMBAT

Kelebihan dan kelemahan Kelebihan : Mudah diimplementasi Memberikan hasil yang baik untuk banyak kasus Kelemahan: Harus mengasumsi bahwa antar fitur tidak terkait (independent) Dalam realita, keterkaitan itu ada Keterkaitan tersebut tidak dapat dimodelkan oleh Naïve Bayesian Classifier

Referensi http://charitasfibriani.files.wordpress.com/2010/11/perte muan_82.doc http://educationprogrammer.blogspot.com/search/label/data%20mining http://www.informatika.unsyiah.ac.id/tfa/dm/dmbayesian-classifier.pdf