ii Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

dokumen-dokumen yang mirip
Data Mining Terapan dengan Matlab

MATLAB UNTUK STATISTIKA & TEKNIK OPTIMASI Aplikasi untuk Rekayasa & Bisnis

SUPERVISED NEURAL NETWORKS DAN APLIKASINYA/Mauridhi


MANAJEMEN PROYEK Konsep & Implementasi

Akuntansi untuk Perusahaan Jasa dan Dagang/Sigit Hermawan;

TEORI DAN PRAKTEK PEMROGRAMAN TURBO PASCAL/Edhy

DESAIN & ANALISIS ALGORITMA

SERI PERPAJAKAN INDONESIA-6 PPnBM, Revaluasi Aktiva Tetap dan Fasilitas PPh

Pengantar Teknologi Informasi

KESEHATAN LINGKUNGAN UIEU - University Press

Candi Gebang Permai Blok R/6 Yogyakarta Telp. : ; Fax. :

Artificial Intelligence. (Teknik dan Aplikasinya)

Membangun Jaringan Syaraf Tiruan (Menggunakan MATLAB & Excel Link)

ii Pengantar Bisnis

Perum Candi Gebang Permai Blok R No. 6 Yogyakarta Telp. : ; Fax. :

Candi Gebang Permai Blok R/6 Yogyakarta Telp. : ; Fax. :

Pendahuluan

ii Akuntansi Biaya: Kajian Teori dan Aplikasi

Manajemen Koperasi; Teknik Penyusunan Laporan Keuangan, Pelayanan Prima dan Pengelolaan SDM GRAHA ILMU

PERENCANAAN PABRIK Penerbit Universitas Pancasila

Dasar-dasar Perancangan Produks Tekstil/Dalyono

IDENTIFIKASI POLA SINYAL DENGAN MENGGUNAKAN TEKNIK NEURAL NETWORKS

ii MATEMATIKA EKONOMI: Fungsi dan Aplikasi


KRISTIAN WIDYA WICAKSONO

ii Pengendalian Hayati


Candi Gebang Permai Blok R/6 Yogyakarta Telp. : ; Fax. :

AKUNTANSI PERUSAHAAN MANUFAKTUR

Belajar Membuat Iklan Sukses

KEPRIBADIAN DAN ETIKA PROFESI

ii MATEMATIKA EKONOMI: Fungsi dan Aplikasi

Cara Mudah Belajar Linux

BAB I PENDAHULUAN 1.1. Latar Belakang

METODE RISET SUMBER DAYA MANUSIA

MANAJEMEN TEKNOLOGI NAZARUDDIN

Konsep Dasar Pendidikan Kesehatan

Pengantar Statistika

Analisis Regresi Linear Ganda dengan SPSS

Aljabar Linier, Vektor, dan Eksplorasinya dengan Maple

Sistem Kendali dengan Format Vektor - Matriks

Pemodelan Visual dengan UML

: Mienati Somya Lasmana Budi Setiorahardjo. Edisi Pertama Cetakan Pertama, 2008

ii Penyusunan Anggaran Perusahaan

PERKAWINAN BEDA WANGSA DALAM MASYARAKAT BALI

METODOLOGI PENELITIAN SOSIAL

Wesli Drainase Perkotaan/Wesli - Edisi Pertama Yogyakarta; Graha Ilmu, 2008 viii hlm, 1 Jil. : 21 cm. ISBN:

KALKULUS LANJUT. Oleh: Prayudi. Edisi Pertama Cetakan pertama, 2009

Ruko Jambusari No. 7A Yogyakarta Telp. : ; Fax. :

PEMBANGUNAN PEDESAAN DAN PERKOTAAN

TIP UNIX MICROSOFT EXCEL 2003

Kecerdasan Tiruan (Artificial Inteligence)

Komunikasi Keperawatan

STUDI KOMPARASI METODE KLASIFIKASI DUA KELAS

Siklus Pengadaan Barang

PENGANTAR SISTEM INFORMASI

STATISTIKA UNTUK PENELITIAN

Edisi Pertama Cetakan Pertama, 2013

TEKNOLOGI BROADCASTING TV

Edisi Pertama Cetakan Pertama, 2009

TEKNOLOGI BROADCASTING TV. Ciptono Setyobudi

TEKNIK SISTEM KONTROL

ROBOT VISI FADLISYAH M. SAYUTI

PERSAMAAN DIFERENSIAL BIASA Model Matematika Fenomena Perubahan

APLIKASI STATISTIKA DAN HITUNG PELUANG

S.P. HARININGSIH, S.T.

PENELITIAN OPERASIONAL

DAN FIRRAR UTDIRARTATMO

Penerbit GRAHA ILMU & KEUANGAN AKUNTANSI (Untuk Manajer Non Keuangan) Budi Rahardjo

ii Kalkulus

ILMU KOMUNIKASI: TEORI & PRAKTIK

METODOLOGI PENELITIAN PETERNAKAN

ERP & SOLUSI BISNIS : Santo F. Wijaya Suparto Darudiato. Edisi Pertama Cetakan Pertama, 2009

Penjadwalan. Mesin. Rosnani Ginting

Candi Gebang Permai Blok R/6 Yogyakarta Telp. : ; Fax. :

Edisi Pertama Cetakan Pertama, 2009

ii Pengendalian Biaya Departemen F & B di Perhotelan

Membangun Karakter dan Kepribadian Kewirausahaan/Mudjiarto

ii Ekonomi Mikro: Teori dan Soal Latihan

ANALISIS KELAYAKAN INVESTASI BISNIS Kajian dari Aspek Keuangan

Perilaku Keorganisasian


MARI BERPIKIR MATEMATIS: Panduan Olimpiade Sains Nasional SMP

Teknik Digital Dasar. Edisi 2. Pendekatan Praktis. Saludin Muis

Edisi Pertama Cetakan Pertama, 2009

Ruko Jambusari No. 7A Yogyakarta Telp. : ; Fax. :

Aplikasi dalam Pelayanan

Mudah Mengisi SPT Tahunan PPh Wajib Pajak Orang Pribadi

" " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " " "

Mesin-mesin Budidaya Pertanian di Lahan Kering CREATA - LPPM R T A N T S A N N I B O G O


Pengertian PPh. Pasal 23

Etika Oleh: Magdalena Pranata Santoso Ilustrator: Yessi Mutiara

Islam: Makna dan Kerangka Dasar Ajaran

AUTISME: Pemahaman Baru untuk Hidup Bermakna Bagi Orang Tua/

Instrumentasi. Alat Ukur

ii AKUNTANSI untuk Bisnis Jasa dan Dagang

MINYAK IKAN Teknologi & Penerapannya untuk Pangan dan Kesehatan

GRAHA ILMU Candi Gebang Permai Blok R/6 Yogyakarta Telp. : ; Fax. :

Transkripsi:

Decision Tree i

ii Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

Decision Tree iii

DATAMI NING: Teknik Pemanfaatan Data untuk Keperluan Bisnis Oleh : Budi Santosa Edisi Pertama Cetakan Pertama, 2007 Hak Cipta 2007 pada penulis, Hak Cipta dilindungi undang-undang. Dilarang memperbanyak atau memindahkan sebagian atau seluruh isi buku ini dalam bentuk apa pun, secara elektronis maupun mekanis, termasuk memfotokopi, merekam, atau dengan teknik perekaman lainnya, tanpa izin tertulis dari penerbit. Candi Gebang Permai Blok R/6 Yogyakarta 55511 Telp. : 0274-882262; 0274-4462135 Fax. : 0274-4462136 E-mail : info@grahailmu.com Santosa, Budi DATA MINING: Teknik Pemanfaatan Data untuk Keperluan Bisnis/Budi Santosa -Edisi Pertama Yogyakarta; Graha Ilmu, 2007 xxii + 240 hlm, 1 Jil. : 26 cm. ISBN: 978-979-756-224-3 1. Komputer I. Judul iv Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

Untuk Lina, Ardi, Shima dan Raissa Kata Pengantar v

vi Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

Kata Pengantar Mungkin belum banyak buku tentang Data Mining atau sebelumnya sering juga disebut dengan nama Pattern Recognition yang ditulis dalam Bahasa Indonesia. Sementara itu, buku dengan topik ini sangat dibutuhkan oleh berbagai kalangan seperti dosen, mahasiswa SI, mahasiswa pasca sarjana maupun praktisi di bidang manajemen, meteorologi, kedokteran, mikrobiologi dan lain-lain dalam rangka memahami dan mengimplementasikannya. Dalam konteks inilah motivasi penulisan buku ini mendapatkan tempatnya. Topik yang dibahas di dalam buku ini semakin hari semakin penting karena semakin dibutuhkan dalam menyelesaikan masalah-masalah nyata baik di dalam dunia keilmuan, rekayasa, industri, finansial dan cuaca. Apalagi dengan perkembangan teknologi pengumpulan data saat ini, dimana jumlah data yang dikumpulkan per unit waktu semakin besar dengan kecepatan yang berlipat. Dalam dunia bisnis maupun teknologi, semakin banyak transaksi-transaksi yang dilakukan secara otomatis baik yang on line melalui internet maupun lewat jaringan elektronik. Di bidang cuaca, data yang ditangkap oleh radar per satuan waktu juga mencapai jumlah yang sangat besar. Hal ini menambah volume data yang tersimpan dan harus diolah semakin membesar. Peningkatan volume data yang besar memerlukan metode yang bisa bekerja cepat dan terotomatisasi untuk mengolah dan mengambil kesimpulan dari data tersebut. Buku ini memuat metode-metode tradisional yang sudah sering dipelajari dalam bukubuku statistik maupun data mining hingga metode-metode mutakhir yang dikembangkan dalam sepuluh tahun terakhir dimana penulis aktif mengikuti, mengimplementasikan dan memberi sedikit kontribusi pengembangan. Sengaja metode-metode tradisional dimasukkan dalam buku ini agar pembaca bisa membandingkan perbedaannya dengan metode-metode mutakhir yang dikembangkan dalam sepuluh tahun terakhir. Buku ini dibagi dalam beberapa bab. Penjelasan singkat dalam setiap bab adalah sebagai berikut: Kata Pengantar vii

Bab 1 memberi pengantar bagi pembaca untuk memperoleh gambaran akan isi buku ini. Bab 2 berisi beberapa konsep dasar yang harus dimengerti pembaca seperti konsep supervised dan unsupervised learning, konsep klasifikasi dan regresi, klasifikasi dua kelas dan klasifikasi multi kelas, konsep jarak, teori tentang fungsi convex, set convex dan teori matriks. Bab 3 akan membahas mengenai teknik klasifikasi unsupervised yang cukup populer yaitu klastering. Akan dibahas beberapa teknik yang sering dipakai dan prosedur pemakaiannya, serta diberikan contoh implementasi menggunakan Matlab. Bab 4 membahas teknik klasifikasi supervised yang cukup terkenal yaitu analisis diskriminan. Dalam bab ini dibahas analisis diskriminan untuk kasus dua kelas dan multi kelas disertai beberapa contoh. Bab 5 membahas mengenai Teorema Bayes dan aplikasinya dalam klasifikasi obyek. Bab 6 akan membahas mengenai decision tree, pembahasan meliputi karakteristik masalah seperti apa yang sesuai diselesaikan dengan decision tree, kriteria-kriteria pembuaan decision tree dan jenis-jenis decision tree. Dalam Bab 7 akan dibahas teknik supervised yang masuk dalam kategori artificial neural networks (ANN) yaitu back-propagasi. Dalam bab ini akan dijelaskan ide dasarnya, prosedure dan algoritma. Dalam Bab 8 akan dibahas teknik supervised yang masuk dalam kategori metode kernel yaitu Support Vector Machine. Dalam bab ini akan dijelaskan ide dasarnya, formulasi matematik, metode kernel beserta contoh pemakaian untuk kasus yang sederhana. Dalam bahasan ini hanya memuat kasus klasifikasi dua kelas. Dalam Bab 9 akan dibahas teknik Support Vector Machine untuk kasus klasifikasi multi kelas. Dalam bab ini akan dijelaskan ide dasarnya, formulasi matematik, contoh sederhana pemakaian prosedurnya. Dalam Bab 10 akan dibahas teknik tradisonal yang sudah sangat populer yaitu regresi linier sederhana, regresi linier multiple dan regresi logistik. Dalam Bab 11 akan dibahas teknik Support Vector Machine untuk kasus regresi. Dalam bab ini akan dijelaskan ide dasarnya, formulasi matematik, contoh sederhana pemakaian prosedurnya, serta diberikan contoh implementasi menggunakan Matlab. Sebelumnya akan didahului dengan review regresi linear dan regresi logistik untuk mengantarkan pembaca memahami persoalan regresi. Bab ini dilengkapi juga dengan varian dari metode kernel dalam kasus klasifikasi. Dalam Bab 12 akan dibahas teknik seleksi variabel. Dalam bab ini akan dijelaskan teknik dasar pengurangan dimensi data dan applikasi SVM untuk pemilihan variabel. Dalam Bab 13 dibahas mengenai teknik-teknik yang menggunakan metode kernel. Teknikteknik yang dibahas adalah teknik-teknik tradisional yang dikembangkan dalam kerangka metode kernel. Juga dibahas mengenai pemilian model untuk prediksi. viii Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis

Dalam Bab 14 dibahas mengenai aturan asosiasi dalam analisis market basket. Contoh diberikan untuk penerapan aturan asosiasi ini dalam database transaksi. Dalam setiap bab diusahakan untuk disertai dengan implementasi menggunakan paket software Matlab. Software ini cukup mudah dipelajari dan sangat umum digunakan dalam komunitas machine learning dan data mining. Dengan penyertaan implementasi diharapkan para pembaca akan dapat menerapkan teknik-teknik yang dipelajari untuk kasus nyata sesudah membaca buku ini. Buku ini mencakup hanya sebagian kecil dari bahasan data mining yang area cakupannya sangat luas. Pada kesempatan ini, saya ingin mengucapkan terima kasih pada teman-teman di Jurusan Teknik Industri-ITS, Surabaya. Terima kasih juga untuk teman-teman di kelompok diskusi milis Soft-Computing (scina) yang tidak bisa saya sebutkan satu per satu. Terima kasih untuk temanteman di milis data mining (indo-dm). Juga untuk Dr Mauridhi, ITS, atas masukannya untuk perbaikan buku ini. Tidak lupa saya ucapkan terima kasih ke istri saya, Karlina, atas pengertian dan dukungannya sehingga saya mempunyai cukup waktu untuk menyelesaikan buku ini. Terima kasih saya ucapkan kepada Direktorat Penelitian dan Pengabdian Kepada Masyarakat Direktorat Jenderal Pendidikan Tinggi (DP2M Dikti) atas dukungan dana untuk penulisan buku ini. Masukan dan umpan balik dari para pembaca sangat diharapkan untuk lebih memperbaiki isi buku ini. Mudah-mudahan buku ini bisa bermanfaat bagi para pembaca sekalian. Surabaya, 4 Maret 2007 Budi Santosa budi_s@ie.its.ac.id Kata Pengantar ix

x Data Mining: Teknik Pemanfaatan Data untuk Keperluan Bisnis