/, _ PENGANTAR DATA MINING. Menggali Pengetahuan dari Bon&kahan Data. crh. 3...:t...:.. o:o/t.'ih9. t 7.=... L. .II /r_.!j """""'_: I. P.? r. ...

dokumen-dokumen yang mirip
Data Mining I. Mata kuliah Data Warehouse Universitas Darma Persada Oleh: Adam AB

Data Mining Terapan dengan Matlab

BAB II LANDASAN TEORI

ii Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

PENERAPAN DATA MINING UNTUK MENDISKRIPSIKAN TINGKAT KREDIT BERMASALAH PADA BANK

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Perum Candi Gebang Permai Blok R No. 6 Yogyakarta Telp. : ; Fax. :

BA PENILAIAN AUTENTIK. Oleh : Ridwan Abdullah Sani Editor: Riza Dwi Aningtyas

STATISTIKA TERAPAN Disertai Contoh Aplikasi dengan SPSS

Ekonomi Rekayasa. (Engineering Economy) Ir Donny M. Mangitung, M.Sc., Ph.D. Untad Press Palu

SISTEM ESTIMASI HARGA JUAL MOTOR BEKAS MENGGUNAKAN METODE REGRESI LINIER BERGANDA (STUDI KASUS : SHOWROOM ILHAM MOTOR)

Bank dan Lembaga Keuangan Lainnya

PENGENDALIAN HAMA TERPADU

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

AKUNTANSI PERUSAHAAN MANUFAKTUR

BUKU 1 PERPAJAKAN. Pendekatan Praktis WISNU HARYO PRAMUDYA STIE RAJAWALI PRESS

BAB I PENDAHULUAN Latar Belakang

KESEHATAN LINGKUNGAN UIEU - University Press

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

GENETIKA. : Agus Hery Susanto. Edisi Pertama Cetakan Pertama, 2011

AKUNTANSI KOPERASI Pendekatan Praktis Penyusunan Laporan Keuangan

METODOLOGI PENELITIAN PETERNAKAN

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)


PENERAPAN METODE APRIORI ASOSIASI TERHADAP PENJUALAN PRODUCT COSMETIC UNTUK MENDUKUNG STRATEGI PENJUALAN

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU


Semua informasi tentang buku ini, silahkan scan QR Code di cover belakang buku ini

Candi Gebang Permai Blok R/6 Yogyakarta Telp. : ; Fax. :

Pengantar Statistika

Taksonomi Pengadaan Jasa Konstruksi

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

..::Data Mining::.. Prediksi

Candi Gebang Permai Blok R/6 Yogyakarta Telp. : ; Fax. :

Program Studi Sistem Informasi, STMIK Triguna Dharma

Metode Penelitian Kualitatif METODE PENELITIAN KUALITATIF

DAN FIRRAR UTDIRARTATMO

PPDAFTAR GAMBAR Gambar Halaman Yuni Melawati, 2013

Terampil Menulis: Cara Mudah dan Praktis dalam Menulis

APLIKASI STATISTIKA DAN HITUNG PELUANG

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Akuntansi untuk Perusahaan Jasa dan Dagang/Sigit Hermawan;

PENGELOLAAN STATISTIK YANG MENYENANGKAN, oleh Muhammad Rusli Hak Cipta 2014 pada penulis

PRAGMATIK DAN PENELITIAN PRAGMATIK

Komunikasi Keperawatan

Teori, Kuesioner dan Analisis Data Pemasaran dan Perilaku Konsumen

BAB II LANDASAN TEORI

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

Dr. H. M. Nurul Irfan, M.Ag. HUKUM PIDANA ISLAM. ~AMzAH AMZAH

KONVERGENSI IFRS DAN PENGARUHNYA TERHADAP PERPAJAKAN: Hasil Penelitian Komprehensif dan Terlengkap atas Seluruh PSAK pasca Konvergensi IFRS

Ekonomi Mikro dan Implementasinya, oleh Prof. Dr. Dyah Sawitri, S.E., M.M. Hak Cipta 2014 pada penulis


HALAMAN PENGESAHAN...

Data Mining II Estimasi

PENGARUH KESETIAKAWANAN SOSIAL DAN KEMANDIRIAN BELAJAR TERHADAP PRESTASI BELAJAR MAHASISWA PROGRAM STUDI PENDIDIKAN AKUNTANSI FKIP UMS ANGKATAN 2009

Ruko Jambusari No. 7A Yogyakarta Telp. : ; Fax. :

DAFTAR ISI JUDUL... ABSTRAK... iii LEMBAR PENGESAHAN... PERNYATAAN ORISINALITAS... vi. KATA PENGANTAR... vii. DAFTAR ISI... ix. DAFTAR TABEL...


Analisis Regresi Linear Ganda dengan SPSS

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI )

STATISTIKA UNTUK PENELITIAN

KINERJA PEGAWAI Teori, Pengukuran dan Implikasi

PREDIKSI KETEPATAN KELULUSAN MAHASISWA MENGGUNAKAN METODE DECISION TREE BERBASIS PARTICLE SWARM OPTIMATION (PSO)

LINGKARAN; Menguak Misteri Bilangan π, Bangun Datar dan Bangun Ruang Terkait dengan Lingkaran, oleh Hendra Gunawan Hak Cipta 2015 pada penulis

2. Tahapan Penelitian pemahaman merupakan awal proses penelitian

Menjadi Tutor Terampil dan Profesional,

PENGARUH LAYANAN INTERNET DAN KETERSEDIAAN KOLEKSI TERHADAP TINGKAT KUNJUNGAN PENGGUNA DI KANTOR PERPUSTAKAAN UMUM KOTA MEDAN SKRIPSI

PERSAMAAN DIFERENSIAL BIASA Model Matematika Fenomena Perubahan

Pembentukan dan Pembinaan Kondisi Fisik,

Ruko Jambusari No. 7A Yogyakarta Telp. : ; Fax. : info@grahailmu.co.id

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

SKRIPSI. Diajukan Kepada Fakultas Ekonomi Universitas Negeri Yogyakarta untuk Memenuhi Sebagian Persyaratan Guna Memperoleh Gelar Sarjana Pendidikan

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS PENGARUH STRES KERJA TERHADAP KINERJA DAN MOTIVASI KERJA KARYAWAN DI PT. BANK NEGARA INDONESIA CABANG USU MEDAN.

MERANCANG GEDUNG BANGUNAN BERTINGKAT RENDAH

STUDI KELAYAKAN PROYEK: Teknik dan Prosedur Penyusunan Laporan Oleh: Drs. Suratman, M.Si

ANALISIS ALGORITMA APRIORI UNTUK REKOMENDASI PENEMPATAN BUKU PADA PERPUSTAKAAN

DAFTAR ISI LEMBAR PERSETUJUAN...

Ruko Jambusari No. 7A Yogyakarta Telp. : ; Fax. :

PENGARUH SELF ASSESSMENT SYSTEM TERHADAP TINGKAT PEMAHAMAN PAJAK PENGHASILAN PERORANGAN. (Studi Kasus Pada PGRI Gamping)

DAFTAR ISI. Halaman Sampul... i. Halaman Judul... ii. Halaman Pengesahan... iv. Motto... v. Halaman Persembahan... vi. Daftar Isi...

BAB 2 TINJAUAN PUSTAKA

JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM

METODOLOGI PENELITIAN TEKNIK SIPIL

PERBANDINGAN NAIVE BAYES CLASSIFIER DENGAN NEAREST NEIGHBOR UNTUK IDENTIFIKASI PENYAKIT MATA

UNIVERSITAS BINA NUSANTARA ABSTRAK

information karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi

IL.MU ALA.MIAH OASAR Penulis: Muhammad Kadri. S.Si.. M.Sc.

Semua informasi tentang buku ini, silahkan scan QR Code di cover belakang buku ini

COMPUTERIZED ADAPTIVE TEST BERBASIS WEB

RIZKY ALFIANI K

Ruko Jambusari No. 7A Yogyakarta Telp. : ; Fax. : info@grahailmu.co.id

Ruko Jambusari No. 7A Yogyakarta Telp. : ; Fax. :

PENGARUH MOTIVASI KERJA DAN LINGKUNGAN KERJA TERHADAP KINERJA KARYAWAN DI PDAM TIRTA BENTENG

ANALISIS SISTEM PENGENDALIAN PROSES

Skripsi Diajukan untuk Memperoleh Gelar Sarjana Pendidikan Pada Program Studi Pendidikan Akuntansi

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

HUKUM TEKNOLOGI INFORMASI DAN KOMUNIKASI (TIK) SEBAGAI HUKUM POSITIF DI INDONESIA DALAM PERKEMBANGAN MASYARAKAT GLOBAL

Semua informasi tentang buku ini, silahkan scan QR Code di cover belakang buku ini

Transkripsi:

tr.?-. /, _ PENGANTAR DATA MINING Menggali Pengetahuan dari Bon&kahan Data.II /r_.!j """""'_: crh. 3...:t...:.. o:o/t.'ih9 I. P.? r. t 7.=.... L.. '""""""'". 0 L..........

PENGANTAR DATA MINING Menggali Pengetahuan dari Bongkahan Data t?l:1 7- l ft I \1.'0--\\. Penerbit AND! Yogyakarta

PENGANTAR DATA MINING Menggali Pengetahuan dari Bongkahan Data Oleh: Sani Susanto & Dedy Suryadi Hak Cipta 201 0 pad a Penulis Editor Setting Desain Cover Korektor : Nikodemus WK : Alek : Bowo : Marsi / Aktor Sadewa Hak Cipta dilindungi undang-undang. Dilarang memperbanyak atau memindahkan sebagian atau seluruh isi buku ini dalam bentuk apapun, baik secara elektronis maupun mekanis, termasuk memfotocopy, merekam atau dengan sistem penyimpanan lainnya, tanpa izin tertulis dari Penulis. Penerbit: C.V ANDI OFFSET (Penerbit ANDI) Jl. Beo 38-40, Telp. (0274) 561881 (Hunting), Fax. (0274) 588282 Yogyakarta 55281 Percetakan: ANDI OFFSET Jl. Beo 38-40, Telp. (0274) 561881 (Hunting), Fax. (0274) 588282 Yogyakarta 55281 Perpustakaan Nasional: Katalog dalam Terbitan (KDT) Susanto, Sani PENGANTAR DATA MINING Menggali Pengetahuan dari Bongkahan Data/ Sani Susanto & Dedy Suryadi; - Ed. I. - Yogyakarta: ANDI, 19 18 17 16 15 14 13 12 11 10 xx + 124 him.; 14 x 21 Cm. 10 9 a 7 6 5 4 3 2 ISBN: 978-979 - 29-1649 - 2 I. Judul 1. Basis Data/Computer 2. Suryadi, Dedy DDC'21 : 005.74

Sebuab persembaban untuk Universitas Katolik Para/mangan

KATA PENGANTAR Teknologi Internet telah mengubah dunia. Tentu masih lekat dalam ingatan kita masa-masa sebelum teknologi ini memasyarakat hingga ke pelosok-pelosok planet bumi ini. Pada masa itu, kegiatan mencari, memperoleh, atau memiliki informasi mempakan hal yang tidak mudah diusahakan. Mengapa demikian? Karena bahan baku informasi, yaitu data, pun sulit dicari, sulit diperoleh, dan, terlebih lagi, sulit untuk dimiliki. Kondisi terse but sangat berbeda dengan kondisi yang kita hadapi dewasa ini. Pada masa kini, kita benar-benar diterpa "tsunami data". Data tersedia secara luar biasa melimpah. Sedemikian melimpahnya data, bahkan disertai dengan sedemikian mudahnya cara memperolehnya (sekalipun mungkin tidak untuk kita miliki), membuat kita semakin tertantang untuk bertanya, "Pengetahuan apakah yang dapat dihasilkan dari data a tau informasi tersebut?" Buku ini kami beri judul Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data karena bahasan utama buku ini berpusat pada upaya penggalian pengetahuan yang masih tersimpan dalam bongkahan data. Dengan terbitnya buku ini, kami mengucapkan rasa syukur pertama-tama kepada Tuhan yang Mahapengasih, tanpa penyertaan dan petunjuk-nya, proses penulisan buku tidak akan pernah selesai. Kedua, penulis menyampaikan terima kasih yang sebesar-besarnya kepada: Dr. Cecilia Lauw, Rektor Universitas Katolik Parahyangan, untuk dorongan tanpa henri kepada kami

" Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data untuk senantiasa berkarya bagi Universitas Katolik Parahyangan, Dr. Paulus Sukapto, Dekan Fakultas Teknologi Industri, Universitas Katolik Parahyangan, untuk fasilitas fakultas yang diberikan selama proses penulisan, berikut peringatan agar buku ini segera selesai, Dr. Kinley Aritonang, Ketua )urusan Teknik Industri, Universitas Katolik Parahyangan, untuk fasilitas jurusan yang telah diberikan, dan Pihak Penerbit AND! yang membantu menjadikan buku yang kami impikan dapat berada di tangan pembaca sekalian. Embrio buku ini berasal dari diktat kuliah yang dibuat pada tahun 2007. Diktat kuliah itu dibuat dengan dana yang berasal dari perolehan Program Hibah Kompetisi K-1 yang telah diupayakan oleh Dr. Budi Husodo Bisowarno, Dekan Fakultas Teknologi Industri, Universitas Katolik Parahyangan periode April 2004 - Oktober 2007. Terima kasih untuk keberhasilan upayanya. Ucapan terima kasih juga penulis ucapkan kepada segenap kolega di )urusan Teknik Industri Universitas Katolik Parahyangan atas segenap diskusi maupun bantuannya, baik secara langsung maupun tidak langsung. Kedua penulis juga tidak melupakan hal-hal yang bersifat pribadi. Penulis pertama mengucapkan terima kasih atas kesabaran istri (Julianti Kasih) dan kedua anak penulis (Griselda Raisa Susanto dan Hans Adrian Susanto) yang waktu kebersamaan dalam keluarga telah tersita untuk penyelesaian buku ini. Penulis kedua mengucapkan terima kasih kepada Bapak Sani

Fungsi Minor Pertama Data Mining: Deskripsi vii Susanto yang telah memunculkan gagasan awal hingga akhirnya buku ini berhasil diselesaikan. Besar harapan agar buku ini bermanfaat dan nyaman untuk dibaca. Bandung, 20 Mei 2010 (Hari Kebangkitan Nasional) Sani Susanto, Ph.D. Dedy Suryadi, S.T., M.S.

DAITAR ISI KATA PENGANTAR... v DAFI'AR lsi... ix DAFI'AR TABEL... :... xiii DAFI'AR GAMBAR... xvii BAB I PENGANTAR... 1 1.1 Pengertian Data Mining... 2 1.2 Fungsi-fungsi dalam Data Mining... 2 BAB II FUNGSI MINOR PERTAMA DATA MINING: DESKRIPSI... 5 2.1 Pengantar... 5 2.2 Berbagai Cara Deskripsi dan Pengetahuan yang Dihasilkannya... 7 2.2.1 Deskripsi Grafis... 7 2.2.2 Deskripsi Lokasi..................... 10 2.2.3 Deskripsi Keberagaman......... 15 2.3 Deskripsi: Epilog... 19 2.4 Soal Latihan... 19 BAB III FUNGSI MINOR KEDUA DATA MINING: ESTIMASI... 21 3.1 Pengantar... 21 3.2 Pengenalan Beberapa Istilah Dasar... 22

x Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data 3.3 Estimasi Titik dan Pengetahuan yang Dihasilkannya.... 23 3.4 Selang Kepercayaan dan Pengetahuan yang Dihasilkannya.... 25 3.5 Epilog: Estimasi... 29 3.6 Soal Latihan... 29 BAB IV FUNGSI MINOR KETIGA DATA MINING: PREDIKSI... 31 4.1 Pengantar... 31 4.2 Regresi Linear dan Pengetahuan yang Dihasilkannya...... 33 4.2.1 Regresi Linear Sederhana... 34 4.2.2 Regresi Li near Berganda (Multiple Linear Regression)... 38 4.3 Analisis Garis Regresi Menggunakan Koefisien Determinasi... 43 4.4 Epilog: Prediksi... 47 4.5 Soal Latihan... 48 BAB V FUNGSI MAYOR PERTAMA DATA MINING: KLASIFIKASI... 51 5.1 Pengantar... 51 5.2 Pengenalan Beberapa Istilah Dasar... 53 5.3 Prototipe Masalah Klasifikasi dan Pengetahuan yang Dihasilkannya... 54 5.4 Algoritme Klasifikasi: CART ( Gassificadon and Regression Trees)... 57 5.5 Klasifikasi: Pengembangan Selanjutnya... 77

Daftar lsi x1 5.6 Klasifikasi: Epilog................................... 78 5.7 Soal Latihan... 78 BAB VI FUNGSI MAYOR KEDUA DATA MINING: PENGELOMPOKAN... 81 6.1 Pengantar... 81 6.2 Pengenalan Beberapa Istilah Dasar... 83 6.3 Prototipe Masalah Pengelompokan dan Pengetahuan yang Dihasilkannya... 84 6.4 Algoritme Pengelompokan k-means... 85 6.5 Pengelompokan: Pengembangan Selanjutnya. 92 6.6 Pengelompokan: Epilog... 93 6.7 Soal Latihan... 93 BAB VII FUNGSI MAYOR KETIGA DATA MINING: ATURAN ASOSIASI... 95 7.1 Pengantar... 95 7.2 Pengenalan Beberapa Istilah Dasar... 97 7.3 Prototipe Masalah Aturan Asosiasi dan Pengetahuan yang Dihasilkannya... 101 7.4 Algoritme Aturan Asosiasi: MBA (Market Basket Analysis)....... 102 7.5 Aturan Asosiasi: Pengembangan Selanjutnya.. 108 7.6 Aturan Asosiasi: Epilog... 108 7.7 Soal Latihan... 109 DAFTAR PUSTAKA... 113 BIOGRAFI SING KAT... 115

DAITAR TABEL TABEL 2.1 TABEL2.2 TABEL2.3 TABEL 2.4 TABEL2.5 Data tinggi badan I 0 siswa dari Kelas Biasa ( dalam sentimeter)... 5 Data tinggi badan 10 siswa dari Kelas Plus (dalam sentimeter)... 6 Data tinggi badan 30 siswa dari Kelas Biasa ( dalam sentimeter)... 8 Interval tinggi badan siswa dari Kelas Biasa ( dalam senti meter)... 9 Interval dan frekuensi tinggi badan siswa dari Kelas Biasa (dalam sentimeter)... 9 TABEL2.6 Perincian perhitungan untuk Kelompok I dan II pada Contoh 2.2......... 18 TABEL 3.1 Data volume air minum di dalam botol..... 21 TABEL 3.2 Perincian perhitungan rata-rata dan varians untuk data TABEL 3.1... 24 TABEL 4.1 Data waktu pengantaran pes a nan... 31 TABEL4.2 TABEL4.3 Perincian perhitungan untuk regresi linear sederhana... 36 Data waktu pengantaran pesanan yang mengikutsertakan faktor lampu merah... 40 TABEL4.4 Perincian perhitungan untuk regresi linear berganda... 41

XIV Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data TABEL 4.5 Perincian perhitungan koefisien determinasi. 45 TABELS.l TABEL5.2 TABEL5.3 TABEL5.4 TABEL5.5 TABEL5.6 TABEL5.7 TABEL6.1 Data tabungan, aset, pendapatan, dan risiko kredit nasabah Bank Bhatara Putra... 51 Daftar calon cabang mutakhir masalah nasabah Bank Bhatara Putra (iterasi-1)... 60 Perhitungan nilai kesesuaian untuk calon cabang l, 2, 3, 4, 5, 6, 7, 8, 9... 62 Daftar calon cabang mutakhir masalah nasabah Bank Bhatara Putra (iterasi-2)... 67 Perhitungan nilai kesesuaian untuk calon cabang I, 2, 3, 5, 6, 7, 8, 9... 68 Daftar calon cabang mutakhir masalah nasa bah Bank Bhatara Putra (iterasi-3)... 73 Perhitungan nilai kesesuaian untuk calon cabang I, 2, 5, 6, 7, 8, 9... 74 Data jumlah rumah dan mobil yang dimiliki oleh 8 nasabah Bank Bhatara Putra... 81 TABEL6.2 Hasil pengelompokan nasa bah ke dalam 3 kelompok... 84 TABEL6.3 Perhitungan jarak catatan ke pusat kelompok dan penetapan keanggotaan catatan (iterasi-i)... 87 TABEL6.4 Perhitungan jarak catatan ke pusat kelompok dan penetapan keanggotaan catatan (iterasi-2)... 89

Daftar label XV TABEL 6.5 Perhitungan jarak catatan ke pusat kelompok dan penetapan keanggotaan catatan (iterasi-3)............... 91 TABEL 7.1 Daftar item belanja dari 14 pengunjung Toserba Favorit... 95 TABEL 7.2 Daftar cajon aturan asosiasi... 107 TABEL 7.3 Daftar aturan asosiasi yang memenuhi syarat min (support)= 30% dan min (confidence) = 70%... 108

DAITAR GAMBAR Gambar 2.1 Diagram titik untuk tinggi badan siswa dari Kelas Bias a dan Kelas Plus... 8 Gambar2.2 Histogram untuk tinggi badan 30 siswa dari Kelas Biasa...... 10 Gambar3.1 Cara membaca tabel distribusi normal... 26 Gambar4.1 Data TABEL 4.1 dengan jarak sebagai sumbu X dan Waktu sebagai sumbu Y... 34 Gambar4.2 Contoh tiga garis lurus untuk mendekati titik-titik data TABEL 4.1......... 35 Gambar 5.1 Pohon keputusan bagi masalah klasifikasi data nasabah Bank Bhatara Putra... 55 Gambar 5.2 Pohon keputusan bagi masalah klasifikasi data nasabah Bank Bhatara Putra (iterasi-1)... 66 Gambar5.3 Pohon keputusan bagi masalah klasifikasi data nasabah Bank Bhatara Putra (iterasi-2)... 72 Gambar5.4 Pohon keputusan bagi masalah klasifikasi data nasa bah Bank Bhatara Putra (iterasi-3)... 76

BABI PENGANTAR Istilah gelombang ketiga a tau gelombang informasi pertama kali terdengar sekitar seperempat abad yang lalu. Futuris Alvin Toffler-lah yang memperkenalkannya melalui bukunya The Third Wave, yang sudah diterjemahkan ke dalam berbagai bahasa. Sekalipun akan, sedang, atau bahkan telah muncul gelombang-gelombang berikutnya, satu hal yang pasti adalah bahwa gelombang ketiga ini belum berlalu, melainkan tetap ada, hanya mungkin disertai dengan hadirnya gelombang yang lain, yaitu gelombang keempat a tau gelombang pengetahuan. Diakui atau tidak, teknologi Internet telah mengubah dunia. Tentu masih lekat dalam ingatan kita masa-masa sebelum teknologi ini memasyarakat hingga ke pelosok-pelosok planet bumi ini. Pada masa itu, kegiatan mencari, memperoleh, atau memiliki informasi merupakan hal yang tidak mudah diusahakan. Mengapa demikian? Karena bahan baku informasi, yaitu data, pun sulit dicari, sulit diperoleh, dan, terlebih lagi, sulit untuk dimiliki. Kondisi tersebut sangat berbeda dengan kondisi yang kita hadapi dewasa ini. Pada masa kini, kita benar-benar diterpa "tsunami data". Data begitu melimpah. Melimpahnya data, bahkan disertai dengan mudahnya cara untuk memperolehnya (sekalipun mungkin tidak untuk kita miliki), membuat kita semakin tertantang untuk bertanya, "Pengetahuan apakah yang dapat dihasilkan dari data atau informasi tersebut?"

l. 2 Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data 1.1 PENGERTIAN DATA MINING Istilah data mining memiliki beberapa padanan, seperti knowledge discove..ryataupun pattern recognition. Kedua istilah tersebut sebenarnya memiliki ketepatannya masing-masing. Istilah knowledge discove..ry atau penemuan pengetahuan tepat digunakan karena tujuan utama dari data mining memang untuk mendapatkan pengetahuan yang masih tersembunyi di dalam bongkahan data. Istilah pattern recognition atau pengenalan pola pun tepat untuk digunakan karena pengetahuan yang hendak digali memang berbentuk pola-pola yang mungkin juga masih perlu digali dari dalam bongkahan data yang tengah dihadapi. Bila dalam tulisan ini digunakan istilah data mining, hal ini lebih didasarkan pada lebih populernya istilah tersebut dalam kegiatan penggalian pengetahuan data. Jadi, apakah sebenarnya data mining itu? Banyak definisi bagi istilah ini dan belum ada yang dibakukan atau disepakati semua pihak. Namun demikian, istilah ini memiliki hakikat (notion) sebagai disiplin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki. Kegiatan inilah yang menjadi garapan atau perhatian utama dari disiplin ilmu data mining. 1.2 FUNGSI-FUNGSI DALAM DATA MINING Lalu, fungsi atau subkegiatan apa sajakah yang ada dalam data mining dalam rangka menemukan, menggali, atau menambang pengetahuan tersebut? Mengacu kepada Larose (2005), terdapat enam fungsi dalam data mining, yaitu 1. fungsi deskripsi (description), 2. fungsi estimasi (estimation),

Pengantar 3 3. fungsi prediksi (prediction), 4. fungsi klasifikasi (classification), 5. fungsi pengelompokan (classification), dan 6. fungsi asosiasi (association). Mengacu kepada Berry dan Browne (2006), keenam fungsi data mining tersebut dapat dipilah menjadi: 1. fungsi minor atau fungsi tambahan, yang meliputi ketiga fungsi yang pertama, yaitu deskripsi, estimasi, dan prediksi; 2. fungsi mayor atau fungsi utama, yang meliputi ketiga fungsi berikutnya, yaitu klasifikasi, pengelompokan, dan asosiasi. Fungsi mayor maupun fungsi minor dari data mining akan dibahas dalam buku ini.

BAB II FUNGSI MINOR PERTAMA DATA MINING, DESKRIPSI 2.1 PENGANTAR Sebagai gambaran kasus. Anda akan diberi data tinggi badan para siswa dari kelas yang tidak diberi makanan suplemen dan dari kelas yang diberi makanan suplemen peninggi badan. Sebut saja keduanya Kelas Biasa dan Kelas Plus. Data tinggi badan para siswa selengkapnya (dalam sentimeter) ditampilkan pada TABEL 2.1 dan TABEL 2.2 label 2.1 Data tinggi badan 10 siswa dari Kelas Biasa (dalam sentimeter) Nom or Siswa (Kelas Biasa) Tinggi Badon I 168 2 164 3 167 4 164 5 171 6 166 7 169 8 172 9 166 10 166

6 Pengantar Data Mining: Menggali Pengetahuan dari Bongkahan Data label 2.2 Data tinggi badan 10 siswa dari Kelas Plus (dalam sentimeter) Nomor Siswo (Kelas Plus) Tinggi Badon I 175 2 176 3 183 4 180 5 177 6 177 7 182 8 179 9 179 10 171 Ketika diberi sekumpulan data, terkadang agak sukar bagi kita untuk menangkap arti kumpulan data tersebut. Sekumpulan angka-angka tersebut perlu dirangkum sedemikian rupa agar dapat "berbicara" sehingga kita memiliki gambaran mengenai kumpulan data tersebut. Lebih jauh, bayangkan seandainya peneliti memutuskan untuk melibatkan 10.000 siswa. Peneliti tersebut melibatkan begitu banyak orang agar hasil penelitiannya lebih dapat dipercaya. Akibatnya, kita justru akan dihadapkan pada 10.000 angka! Menelusuri deretan angka sebanyak itu dengan mata manusia tentu tidak akan membawa manfaat apa pun. Oleh karena itu, kita memerlukan suatu cara untuk menggambarkan sekumpulan data secara ringkas. Cara tersebut dinamakan deskripsi, yang merupakan fungsi minor pertama dari data mining dan akan dibahas pada bab ini. Subbab selanjutnya akan membahas berbagai cara untuk mendeskripsikan data. Di dalam pembahasan tersebut juga akan