Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

dokumen-dokumen yang mirip
Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 1. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Student Clustering Based on Academic Using K-Means Algoritms

BAB III ANALISIS DAN PERANCANGAN

Materi 1 BASIS DATA 3 SKS Semester 4 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III METODE PENELITIAN

BAB II TINJAUAN PUSTAKA

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

BAB II TINJAUAN STUDI DAN LANDASAN TEORI

Materi 1 SISTEM BASIS DATA 3 SKS Semester 2 S1 Sistem Informasi UNIKOM 2017 Nizar Rabbi Radliya

PENERAPAN METODE ASOSIASI GSP DAN APRIORI UNTUK STOK DAN REKOMENDASI PRODUK

BAB II TINJAUAN PUSTAKA

BASIS DATA. Pertemuan 1. 3 SKS Semester 4 S1 Sistem Informasi Nizar Rabbi Radliya

TechnoXplore ISSN : X Jurnal Ilmu Komputer & Teknologi Informasi Vol 1 No : 2, Oktober 2016

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA ECLAT

information karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi

Materi 1 PERANCANGAN BASIS DATA (PBD) 3 SKS Semester 5 S1 Sistem Informasi UNIKOM 2014 Nizar Rabbi Radliya

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

BAB III 3. METODOLOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB I PENDAHULUAN I-1

PERANCANGAN BASIS DATA

BAB II TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

TUGAS KONSEP DASAR DATA MINING

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

Data Warehouse dan Data Minig. by: Ahmad Syauqi Ahsan

2.2 Data Mining. Universitas Sumatera Utara

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Universitas Indonesia

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

ANALISA POLA TRANSAKSI OBAT MENGGUNAKAN ALGORITMA APRIORI Shalsabilla Luthfi Dewati ABSTRAK


DATA CLUSTERING MENGGUNAKAN METODE CRISP DM UNTUK MENGETAHUI KEBUTUHAN TENAGA PENDIDIK JENJANG SMA DI KABUPATEN BANJAR

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan

DATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

BAB II TINJAUAN PUSTAKA

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

Konsep Business Inteligence. (Bag. 2) Ade Sarah H., M.Kom

BAB 3 METODE PENELITIAN

SKRIPSI TI S1 FIK UDINUS 1

II. TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1-1

DATA MINING DENGAN METODE CLUSTERING UNTUK PENGOLAHAN INFORMASI PERSEDIAAN OBAT PADA PUSKESMAS PANDANARAN SEMARANG

RENCANA PEMBELAJARAN SEMESTER

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA


PENENTUAN STRATEGI MARKETING PENJUALAN PRODUK DENGAN ALGORITMA APRIORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Data Mining. Sistem Basis Data Lanjut

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB II TINJAUAN PUSTAKA

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

Gambar 1 Peningkatan Jumlah Mahasiswa Prodi Teknik Informatika

BAB I PENDAHULUAN. Keberadaan minimarket di kota-kota besar sangat dibutuhkan bagi. masyarakat khususnya di daerah perumahan. Bagi sebagian besar

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

ANALISIS DATA MINING UNTUK MENENTUKAN VARIABEL VARIABEL YANG MEMPENGARUHI KELAYAKAN KREDIT KEPEMILIKAN RUMAH MENGGUNAKAN TEKNIK KLASIFIKASI

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

BAB III METODOLOGI PENELITIAN

DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA. Oleh : Rita Prima Bendriyanti ABSTRAK

Transkripsi:

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Memahami definisi, proses serta teknik data mining. Pengenalan Data Mining: 1. Definisi data mining 2. Proses data mining 3. Teknik data mining Kompetensi Dasar Pokok Bahasan I. Definisi Data Mining Munculnya data mining didasarkan pada jumlah data yang tersimpan dalam basis data semakin besar. Dari fenomena tersebut data mining berusaha menjawab dengan melakukan proses yang dapat menemukan suatu informasi baru yang berguna. Istilah data mining kadang disebut juga dengan knowledge discovery. Pada perkuliahan ini data mining akan diimplementasikan pada data-data yang terkumpul di dalam sebuah sistem informasi. Data-data tersebut disimpan dengan menggunakan teknologi basis data berupa data warehouse. Basis data merupakan salah satu bidang dari bidang lainnya yang berkaitan dengan data mining. Bidang-bidang yang berkaitan dengan data mining sudah kita bahas pada materi sebelumnya. Sudah banyak yang mendefinisikan data mining melalui buku yang ditulisnya, diantaranya: Tan (2006) mendefinisikan data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Data mining juga dapat diartikan sebagai pengekstrakan informasi baru yang diambil dari bongkahan data besar yang membantu dalam pengambilan keputusan. Darly Pregibon (2011) menyatakan bahwa data mining adalah campuran dari statistic, kecerdasan buatan, dan riset basis data. Pramudiono (2006) mengartikan data mining sebagai serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. 1

Definisi-definisi di atas mengenai data mining hanyalah sebagian dari banyaknya definisi yang ada. Akan tetapi pada intinya adalah data mining merupakan proses mendapatkan pola atau informasi (pengetahuan) baru dengan teknik tertentu (dengan melibatkan beberapa bidang lainnya) dari kumpulan data yang besar. Salah satu teknik yang dibuat dalam data mining adalah bagaimana menelusuri data yang ada untuk membangun sebuah model, kemudian menggunakan model tersebut agar dapat mengenali pola data yang lain, yang tidak/belum berada dalam basis data yang tersimpan. Kebutuhan untuk proses prediksi juga dapat menggunakan pola tersebut. Dalam data mining, pengelompokan data juga dapat dilakukan. Tujuannya adalah agar kita dapat mengetahui pola universal data-data yang ada. Anomali data transaki juga perlu dideteksi untuk dapat mengetahui tindak lanjut berikutnya yang dapat diambil. Jadi pengetahuan yang dihasilkan oleh data mining dapat kita manfaatkan dalam sistem informasi pengambilan keputusan guna menciptakan bisnis cerdas (business intelligence) pada sebuah organisasi. Selanjutnya kita akan melihat beberapa contoh yang masuk dalam kategori data mining dan bukan data mining. 1. Bukan data mining: Pencarian informasi tertentu di internet (misalnya mencari informasi masakan menggunakan google). Termasuk data mining: Pengelompokan informasi yang mirip dalam kontek tertentu pada hasil pencarian (misalnya masakan sunda, masakan padang dan sebagainya yang ditemukan google). 2. Bukan data mining: Petugas medis mencari data medis untuk menganalisis catatan pasien dengan penyakit tertentu. Termasuk data mining: Peneliti medis mencari cara pengelompokan data penyakit pasien berdasarkan data diagnosis, umur, alamat. 3. Bukan data mining: Pembuatan laporan tahunan penjualan perusahaan dengan merekap semua data selama setahun. Termasuk data mining: Pemanfaatan data penjualan perusahaan untuk mendapatkan pola prediksi stok yang sebaiknya disediakan pada tahun berikutnya. II. Proses Data Mining Cross-Industry Standard Process for Data Mining (CRISP-DM) merupakan standar yang dapat kita gunakan dalam melaksanakan proses data mining. CRIPS-DM 2

dikembangkan pada tahun 1996 oleh beberapa industri seperti DaimlerChrysler, SPSS dan NRC. CRIPS-DM merupakan siklus hidup proyek data mining yang terbagi dalam enam fase seperti terlihat pada gambar 1 di bawah ini. Pengerjaan fase bersifat adaptif, dimana fase berikutnya bergantung pada keluaran fase sebelumnya. Fase yang sudah dikerjakan mungkin dapat kembali pada fase sebelumnya apabila diperlukan evaluasi atau kesalahan pada fase sebelumnya. Fase Pemahaman Bisnis Fase Pemahaman Data Fase Penyebaran Fase Pengolahan Fase Evaluasi Fase Pemodelan Gambar 1. Proses Data Mining menurut CRIPS-DM Berikut penjelasan dari setiap fase CRIPS-DM (Larose, 2005): 1. Fase Pemahaman Bisnis (Business Undersanting Phase) a. Penentuan tujuan proyek dan kebutuhan secara detail dalam lingkup bisnis atau unit penelitian secara keseluruhan. b. Menerjemahkan tujuan dan batasan menjadi formula dari permasalahan data mining. c. Menyiapkan strategi awal untuk mencapai tujuan. 2. Fase Pemahaman Data (Data Understanding Phase) a. Mengumpulkan data. 3

b. Menggunakan analisis penyelidikan data untuk mengenali lebih lanjut data dan pencarian pengetahuan awal. c. Mengevaluasi kualitas data. d. Jika diinginkan, pilih sebagian kecil group data yang mungkin mengandung pola dari permasalahan. 3. Fase Pengolahan Data (Data Preparation Phase) a. Siapkan dari data awal, kumpulan data yang akan digunakan untuk keseluruhan fase berikutnya. Fase ini merupakan pekerjaan berat yang perlu dilaksanakan secara intensif. b. Pilih kasus dan variable yang ingin dianalisis dan yang sesuai analisis yang akan dilakukan. c. Lakukan perubahan pada beberapa variable jika dibutuhkan. d. Siapkan data awal sehingga siap untuk perangkat pemodelan. 4. Fase Pemodelan (Modeling Phase) a. Pilih dan aplikasi teknik pemodelan yang sesuai. b. Kalibrasi aturan model untuk mengoptimalkan hasil. c. Perlu diperhatikan bahwa beberapa teknik mungkin untuk digunakan pada permasalahan data mining yang sama. d. Jika diperlukan, proses dapat kembali ke fase pengolahan data untuk menjadikan data ke dalam bentuk yang sesuai dengan spesifikasi kebutuhan teknik data mining tertentu. 5. Fase Evaluasi (Evaluation Phase) a. Mengevaluasi satu atau lebih model yang digunakan dalam fase pemodelan untuk mendapatkan kualitas dan efektivitas sebelum disebarkan untuk digunakan. b. Menetapkan apakah terdapat model yang memenuhi tujuan pada fase awal. c. Menentukan apakah terdapat permasalahan penting dari bisnis atau penelitian yang tidak tertangani dengan baik. d. Mengambil keputusan berkaitan dengan penggunaan hasil dari data mining. 6. Fase Penyebaran (Deployment Phase) a. Menggunakan model yang dihasilkan. Terbentuknya model tidak menandakan telah terselesaikannya proyek. b. Contoh sederhana penyebaran: pembuatan laporan. 4

c. Contoh komplek penyebaran: penerapan proses data mining secara parallel pada departemen lain. Informasi lebih lanjut mengenai CRIPS-DM dapat dilihat di www.crisp-dm.org. Selain CRIPS-DM terdapat langkah sistematis lainnya yang kurang lebih intinya sama. Berikut tiga langkah utama dalam proses data mining (Gonunescu, 2011): 1. Ekplorasi/pemrosesan awal data Ekploasi/pemrosesan awal data terdiri dari normalisasi data, transformasi data, penanganan data yang salah, reduksi dimensi, pemilihan subset fitur, dan sebagainya. 2. Membangun model dan melakukan validasi terhadapnya Membangun model dan melakukan validasi terhadapnya berarti melakukan analisis berbagai model dan memilih model dengan kinerja prediksi yang terbaik. Dalam langkah ini digunakan metode-metode seperti klasifikasi, regresi, analisis cluster, deteksi anomali, analisis asosiasi, analisis pola sekuensial, dan sebagainya. Dalam beberapa refrensi, deteksi anomali juga masuk dalam langkah ekplorasi. Akan tetapi, deteksi anomali juga dapat digunakan sebagai algoritma utama, terutama untuk mencari data-data yang special. 3. Penerapan Penerapan berarti menerapkan model pada data yang baru untuk menghasilkan perkiraan/prediksi masalah yang diinvestigasi. Penjelasan dari masing-masing langkah akan dijelaskan pada materi-materi berikutnya. III. Teknik Data Mining Teknik data mining dibagi menjadi beberapa kelompok berdasarkan tugas yang dapat dilakukan diantaranya: classification, clustering, association, anomaly, regression, sequential pattern, deviation detection. Pada perkuliahan ini tidak semua teknik data mining akan dibahas karena didasari oleh keterbatasan waktu. Hanya empat teknik data mining yang akan dibahas yaitu diantaranya: 1. Klasifikasi (classification) Kasifikasi merupakan salah satu teknik dari model prediksi. Teknik ini digunakan untuk pembuatan model yang dapat melakukan pemetaan dari setiap himpunan variabel ke setiap targetnya, kemudian menggunakan model tersebut untuk memberikan nilai target pada himpunan variabel baru yang didapat. 5

Beberapa contoh masalah yang dapat diselesaikan dengan klasifikasi: a. Menentukan apakah suatu transaksi kartu kredit merupakan transaksi yang curang atau bukan. b. Melakukan deteksi penyakit pasien berdasarkan sejumlah nilai parameter penyakit yang diderita. c. Memprediksi pelanggan mana yang akan berpindah ke kompetitor kita atau tetap setia. 2. Penklusteran (clustering) Teknik ini digunakan untuk melakukan pengelompokan data-data ke dalam sejumlah kelompok (cluster) berdasarkan karakteristik masing-masing data pada kelompok-kelompok yang ada. Data-data yang masuk dalam batas kesamaan dengan kelompoknya akan bergabung dalam kelompok tersebut, begitu juga sebaliknya. Beberapa contoh masalah yang dapat diselesaikan dengan pengklusteran: a. Mengetahui pola pembelian barang oleh para konsumen pada waktu-waktu tertentu. b. Mendapatkan kelompok-kelompok konsumen untuk target pemasaran. 3. Asosiasi (association) Teknik ini digunakan untuk menemukan pola yang menggambarkan kekuatan hubungan fitur dalam data. Mendeteksi kumpuluan atribut-atribut yang muncul bersamaan dalam frekuensi yang sering, dan membentuk sejumlah kaidah dari kumpulan-kumpulan tersebut. Teknik ini sering digunakan untuk melakukan analisis keranjang belanja. Beberapa contoh masalah yang dapat diselesaikan dengan asosiasi: a. Untuk mengenali item-item yang dibeli bersama-sama oleh cukup banyak pelanggan. b. Untuk mengetahui suku cadang yang membutuhkan perbaikan setelah suku cadang yang lainnya mengalami kerusakan. 4. Anomali (anomaly) Teknik ini berkaitan dengan pengamatan sebuah data dari sejumlah data yang secara signifikan mempunyai karakteristik yang berbeda dari sisa data yang lain. Algoritma deteksi anomali yang baik harus mempunyai laju eror yang rendah. Beberapa contoh masalah yang dapat diselesaikan dengan anomali: 6

IV. a. Untuk mengetahui pola data yang memasuki jaringan sehingga penyusupan bisa ditemukan jika pola kerja data yang datang berbeda. b. Diteksi perilaku kondisi cuaca yang mengalami anomali. Daftar Pustaka [1] Astuti, F.A. 2013. Data Mining. Yogyakarta: Andi. [2] Kusrini & Taufiz, E.L. 2009. Algoritma Data Mining. Yogyakarta: Andi. [3] Prasetyo, E. 2012. Data Mining: Konsep dan Aplikasi Menggunakan MATLAB. Yogyakarta: Andi. [4] Prasetyo, E. 2014. Data Mining: Mengolah Data Menjadi Informasi Menggunakan MATLAB. Yogyakarta: Andi. V. Materi Berikutnya Pokok Bahasan Sub Pokok Bahasan Set Data 1. Definisi dan tipe data 2. Kualitas data 3. Similaritas dan dissimilaritas 7