Outine Pengertian Dasar Arsitektur Tugas Data Mining Contoh Penggunaan Data Mining
Latar Beakang 3
Mengapa harus Data Mining?
Definisi Data Mining
Pengertian Yang Saah
Imu Data Mining
Arsitektur Data Mining -1-
Arsitektur Data Mining -2- Knowedge Base - Daerah knowedge yang digunakan untuk memberi petunjuk pencarian atau mengevauasi hasi poa Data Mining Engine - Terdiri dari sekumpuan mode fungsiona seperti characterization, association, cassification, custer anaysis, evauation and deviation anaysis
Arsitektur Data Mining -3- Pattern Evauation Modue - Komponen yang berinteraksi dengan modu data mining untuk pencarian poa GUI (Graphica User Interface) - modu yang mempermudah user berinteraksi dengan sistem data mining
Tugas Data Mining Tugas Utama Data Mining Predictive Descriptive memprediksikan niai dari atribut tertentu berdasarkan niai dari atribut ainnya. memperoeh poa (correation, trend, custer, trajectory, anomay) untuk menyimpukan hubungan di daam data
Metode daam Data Mining Tugas Data Mining Predictive Descriptive Cassification Custering Time Series Anaysis Regression Association Rue Sequence Discovery
Predictive - Cassification Menemukan fungsi atau mode yang membedakan keas data Fungsi atau mode tsb dapat berbentuk aturan if-ese, descision tree, formua matematika, atau neura network Tujuannya untuk memperkirakan keas dari suatu objek yang abenya tidak diketahui Agoritma : Decision Tree (C4.5), Artificia Neura Network, Naïve Bayes, Genetic Agorithm, Fuzzy, Case-Based Reasoning, k-nearest Neighbor Supervised Method
Contoh
Contoh Lain..
Metode Pohon Keputusan
Lanj..
Predictive Time Series Anaysis Time series data : sekuens data yang niainya berubah setiap interva waktu tertentu. Time series data dapat dipresentasikan daam bentuk grafik atau kurva yang menunjukkan fungsi sebuah variabe data terhadap satuan waktu. Metode : Neura Network (mode Backpropagation, muti ayer perceptron) Apikasi : memprediksikan indeks harga saham
Contoh : Prediksi daam pasar saham garis yang tegas adaah time-series data sebenarnya dari niai saham Microsoft, dan garis putus-putus adaah time series mode yang memprediksi niai saham berdasarkan niai saham pada masa au.
Predictive - Regression Regression vs Cassification : - Regression diterapkan untuk mengkasifikasikan target data numerik - Cassification untuk mengkasifikasikan target data kategoria Apikasi : prediksi niai penjuaan yang akan datang berdasarkan trend data penjuaan tahun sebeumnya. Agoritma : Support Vector Machine (SVM), Generaized Linear Mode (GLM)
Descriptive - Custering Mengidentifikasi keompok aami dari data berdasarkan kemiripan atribut Disebut juga Segmentation Unsupervised Method : tidak satupun atribut yang digunakan untuk memandu proses pembeajaran (tidak ada abe) Agoritma : k-means, k-medoid, Fuzzy C- Means, Subtractive, Mountain, Hierarki
Contoh : Data Peanggan Terdiri dari dua atribut, yaitu Age (Umur) dan Income (Pendapatan). Agoritma Custering mengeompokkan keompok data kedaam tiga segment berdasarkan kedua atribut ini. - Custer 1 : popuasi berusia muda dengan pendapatan rendah - Custer 2 : popuasi berusia menengah dengan pendapatan yang ebih tinggi - Custer 3 : popuasi berusia tua dengan pendapatan yang reatif rendah.
Contoh
Lanj..
Descriptive Association Rue Disebut juga Market Basket Anaysis. Menganaisa tabe transaksi penjuaan dan mengidentifikasi produk-produk yang seringkai dibei bersamaan oeh customer Untuk mengidentifikasi keompok kesamaan dari produk dan kebiasaan apa yang terjadi guna kepentingan cross-seing - Untuk mencari produk apa yang biasanya terjua bersamaan - Untuk mencari tahu apa aturan yang menyebabkan kesamaan tersebut.
Contoh Ketika orang membei susu, dia biasanya membei keju Ketika orang membei pepsi atau coke, biasanya dia membei juice
Contoh Lain
Descriptive Sequence Anaysis Digunakan untuk mencari poa pada serangkaian kejadian yang disebut dengan Sequence. Contoh rangkaian kik pada sebuah website berisi rentetan URL. Impementasi : memodekan pembeian oeh peanggan sebagai sebuah sequence (rangkaian) data : - Pertama-tama seorang peanggan membei komputer - kemudian membei speaker - dan akhirnya membei sebuah webcam.
Contoh : Rangkaian Kik pada Sebuah Website Berita Setiap node adaah sebuah kategori URL. Garis meambangkan transisi antar kategori URL tersebut. Setiap transisi dikeompokan dengan sebuah bobot yang menggambarkan kemungkinan transisi antara satu URL dan URL yang ain.
Penerapan Data Mining Custering Tingkat keuusan