I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan

dokumen-dokumen yang mirip
BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB. III. ANALISA PERMASALAHAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Gambar I-1 Jaringan Regulatori Genetik

BAB I PENDAHULUAN I.1.

BAB I PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN 1.1 Latar Belakang

DAFTAR ISI... LEMBAR PENGESAHAN PEMBIMBING... LEMBAR PENGESAHAN PENGUJI... HALAMAN PERSEMBAHAN... HALAMAN MOTTO... KATA PENGANTAR...

BAB I PENDAHULUAN 1.1. Latar Belakang

ANALISA DAN PERANCANGAN PERANGKAT LUNAK

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 3 METODE PENELITIAN

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

CONTOH KASUS DATA MINING

Bab 1 PENDAHULUAN 1.1 Latar Belakang Masalah

APLIKASI PEMBANGUNAN BAYESIAN NETWORK PADA DATA MINING TESIS. HENGKY SIPAYUNG NIM : Program Studi Magister Informatika

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat

BAB I PENDAHULUAN I.1 Latar Belakang

DAFTAR ISI PHP... 15

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN. Pada masa sekarang ini, banyak jenis-jenis usaha dan bisnis yang mulai

BAB I PERSYARATAN PRODUK

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN Latar Belakang

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN Latar Belakang. Pertumbuhan pasar swalayan dewasa ini telah meningkat dengan pesat di

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

1. BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Hasil studi kasus seorang psikolog perkembangan Deni Nasri,mengemukakan bahwa empat dari lima orang dewasa yang krisis kepribadian

Bab I Pendahuluan. I.1 Latar Belakang

IMPLEMENTASI DAN PENGUJIAN

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB III LANDASAN TEORI. Flippo (1984) mendefinisikan sebagai berikut: Penarikan calon pegawai

ANALISIS PEMANFAATAN SEQUENTIAL PATTERN UNTUK MENENTUKAN NODE ORDERING PADA ALGORITMA KONSTRUKSI STRUKTUR BAYESIAN NETWORK

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. beli sepeda motor bermerek Honda. Dalam kegiatan operaisonalnya, PD. Wijaya

BAB 1 PENDAHULUAN. teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Hampir

dengan harga jual yang lebih rendah. Sedangkan diskon atau potongan harga adalah pengurangan harga langsung dari suatu produk yang dilakukan dalam

TRANSFORMASI Jurnal Informasi & Pengembangan Iptek

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

BAB I PENDAHULUAN. kegiatan simpan pinjam layaknya bank, dimana ijin operasionalnya di bawah

BAB I PENDAHULUAN. Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan informasi yang akurat

BAB 1 PENDAHULUAN 1-1

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

BAB IV ANALISIS, PERANCANGAN, DAN IMPLEMENTASI PERANGKAT LUNAK

APLIKASI DATA MINING UNTUK ANALISIS ASOSIASI POLA PEMBELIAN DENGAN ALGORITMA APRIORI

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

BAB I PENDAHULUAN. I.1 Latar Belakang I-1

BAB I PENDAHULUAN. 1.1 Latar Belakang

Keoptimalan Naïve Bayes Dalam Klasifikasi

BAB II LANDASAN TEORI

Algoritma Bayesian Network Untuk Simulasi Prediksi Pemenang PILKADA Menggunakan MSBNx

BAB 1 PENDAHULUAN. Setiap orang, dari setiap golongan, selalu mendambakan tubuh yang sehat.

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

DATA & INFORMASI. Defri Kurniawan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. saham harus memperhatikan dengan baik keadaan ekonomi yang sedang berlangsung.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

1. PENDAHULUAN 1.1. Latar Belakang Masalah

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI DATA ULANG PENSIUN

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 1 PENDAHULUAN. bagi individu yang menempati kamar tidur tersebut. suasana nyaman dan dapat mempengaruhi psikologis penghuni.

PENDAHULUAN. I.1 Latar Belakang

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB I PENDAHULUAN. Perkembangan teknologi komputer yang semakin canggih, membuat para ahli

BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap

BAB 1 PENDAHULUAN. semakin bertambah ketatnya persaingan dalam bidang perdagangan. Setiap usaha

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

Struktur Bayesian Network untuk Penentuan Class Karakteristik Siswa pada Sistem Tutor Cerdas

Transkripsi:

BAB. I. PENDAHULUAN I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan datanya secara elektronik dan bersifat permanen dengan terus menerus yang mengakibatkan basis data akan memiliki volume data yang semakin besar dan terus bertambah. Bertambahnya volume data ini, tidak diikuti oleh kemampuan manusia melakukan analisis terhadap data untuk mengambil intisari informasi yang terkandung didalamnya. Fenomena ini disebut dengan situasi data rich but poor information [HAN01]. Hal ini mengakibatkan perlunya kebutuhan menganalisa data dalam basis data secara otomatis untuk memperoleh pengetahuan yang diinginkan. Teknologi yang dapat menjawab kebutuhan tersebut adalah teknologi data mining, yaitu suatu teknologi untuk mengekstraksi pengetahuan yang diinginkan dari sebuah basis data. Klasifikasi adalah salah satu metode data mining, yakni sebuah proses pencarian sekumpulan model (fungsi) yang dapat membedakan kelas-kelas data. Model ini dapat digunakan untuk memprediksikan objek kelas yang labelnya tidak diketahui atau dapat memprediksikan data yang akan muncul dimasa depan.[han01]. Sebagai contoh, model klasifikasi dapat dibangun untuk memprediksi suatu item barang tertentu akan laku dijual atau tidak berdasarkan atribut-atribut yang terdapat pada barang tersebut, ataupun berdasarkan fakta-fakta lain yang ada pada saat klasifikasi dilakukan. Proses dalam membangun sebuah model klasifikasi dapat diilustrasikan dengan Gambar 1.1. Gambar 1.1.(a) merupakan tahap pertama dalam membangun model klasifikasi, yaitu model dibangun berdasarkan training data yang berisi sejumlah record data. Tiap record diasumsikan dimiliki oleh kelas yang telah didefinisikan sebelumnya. Dengan menggunakan suatu metode (seperti decision tree, backpropagation, bayesian networks), akan dihasilkan aturan-aturan klasifikasi. Aturan-aturan inilah yang akan menjadi model klasifikasi. Gambar 1.1.(b) merupakan tahap kedua dalam membangun model klasifikasi yaitu model digunakan untuk mengklasifikasikan data baru atau objek yang label kelasnya belum diketahui [HAN01].

Gambar 1.1. Proses membangun model klasifikasi [HAN02]. Motivasi kegunaan visualisasi adalah bahwa setiap orang dapat dengan cepat menyerap informasi yang ditampilkan dalam bentuk visual dan secara langsung dapat menemukan pola yang terdapat dalam informasi yang divisualisasikan tersebut. Selain itu visualisasi pada data mining mempunyai kegunaan untuk membuat pengguna untuk benar-benar mengerti apa yang akan dicari dalam konteks bisnis [FAY02]. Visualisasi data pada data mining dapat dibagi menjadi beberapa jenis visualisasi[han01], yaitu : Visualisasi data, data ditampilkan dalam beberapa tingkatan abstraksi. Data dapat ditampilkan dalam bentuk 3D, cubes, kurva. Visualisasi hasil dari data mining, adalah memvisualisasikan pengetahuan yang didapat data mining. Visualisasi proses data mining, memvisualisasikan proses data mining, yaitu proses bagaimana data dapat diekstrak sehingga diperoleh suatu pengetahuan. Pada tesis ini, penulis menjadikan klasifikasi berdasarkan Bayesian Networks sebagai bahan eksplorasi dengan melakukan studi literatur bagaimana membangun 2

struktur Bayesian Networks sebagai model klasifikasi dengan mengimplementasikan algoritma TPDA dan memvisualisasikan struktur Bayesian Networks-nya. Beberapa hal yang menjadi alasan mengapa penulis memilih topik tersebut adalah antara lain : 1. Klasifikasi sudah sangat luas dipakai untuk data mining, hal ini menjadi pertimbangan penulis untuk kemudahan dalam mencari referensi dan literatur yang dibutuhkan. 2. Berdasarkan literatur yang ada, Bayesian Networks mempunyai beberapa kelebihan/keunggulan dalam membangun model klasifikasi dibandingkan dengan metode lain, antara lain Bayesian Networks dapat digunakan untuk mengambil suatu kesimpulan berdasarkan nilai probabilitas suatu domain nilai dengan menggunakan Teorema Bayes, sehingga dapat mengurangi kompleksitas perhitungan [NEA04] 3. Visualisasi (dalam hal ini adalah grafik) merupakan salah satu aspek yang perlu diperhatikan dalam merepresentasikan hasil data mining dan pada suatu perangkat lunak dilihat dari perspektif pengguna. Hal ini disebabkan pengguna lebih mudah memahami data bila ditampilkan dalam bentuk visual. 4. Latar belakang pendidikan formal penulis yaitu Rekayasa Perangkat Lunak, sehingga memilih membuat suatu perangkat lunak dengan menggunakan metode yang baik dan benar baik itu mengenai pengembangannya maupun dalam hal pengujian suatu perangkat lunak. I.2 Rumusan Masalah Adapun rumusan masalah dalam tesis ini adalah sebagai berikut : 1. Bagaimana Bayesian Networks dapat menjadi model data mining yang digunakan untuk klasifikasi?. 2. Bagaimana menerapkan algoritma yang berkaitan dengan rumusan masalah yang pertama (no.1) ke dalam sebuah aplikasi dan memvisualisasikan hasil data mining (dalam hal ini adalah struktur Bayesian Networks)?. 3. Bagaimana melakukan tahapan rekayasa perangkat lunak yang baik untuk aplikasi data mining khususnya untuk klasifikasi berdasarkan Bayesian Neworks?. 3

I.3 Tujuan Tujuan umum dari pembuatan tesis ini adalah untuk memahami persoalan dan konsep data mining dengan fungsionalitas klasifikasi berdasarkan Bayesian Networks serta menerapkan pengetahuan tersebut dalam suatu aplikasi. Sedangkan tujuan khusus dari penelitian ini adalah: 1. Membangun sebuah perangkat lunak untuk aplikasi data mining dengan klasifikasi berdasarkan Bayesian Networks. 2. Mempelajari secara studi literatur mengenai algoritma yang dapat membangun Bayesian Networks dan mengimplementasikannya ke dalam sebuah aplikasi. 3. Mempelajari tahapan melakukan rekayasa perangkat lunak dengan studi kasus untuk persoalan data mining berdasarkan Bayesian Networks. I.4 Batasan Masalah Batasan masalah pada tesis ini adalah: 1. Tidak terdapat noise dan missing value pada data yang digunakan perangkat lunak, yaitu data yang dipakai adalah data yang siap pakai. 2. Data yang digunakan merupakan data untuk tugas pada data mining. 3. Metode pengembangan perangkat lunak yang digunakan adalah Unified Process. 4. Mining data dilakukan pada basis data model relasi. 5. Studi kasus untuk implementasi adalah data nasabah bank. 6. Algoritma Bayesian Networks yang dieksplorasi secara studi literatur adalah TPDA (Three Phase Dependency Analysis). 7. Visualisasi yang dilakukan adalah visualisasi pengetahuan yang merupakan hasil data mining yaitu struktur Bayesian Networks. 8. Tidak dilakukan analisis terhadap hasil visualisasi struktur Bayesian Networks, melainkan melakukan evaluasi kinerja dalam memprediksi label kelas target berdasarkan struktur Bayesian Networks yang di hasilkan oleh aplikasi. 4

I.5 Metodologi Penelitian Metodologi yang digunakan pada tesis ini adalah sebagai berikut : 1. Studi Literatur Mempelajari sumber-sumber pustaka yang dapat dijadikan referensi. Sumbersumber pustaka tersebut adalah mengenai data mining dengan fungsionalitas klasifikasi berdasarkan Bayesian Networks. Sumber-sumber pustaka dapat berupa buku, paper, atau halaman web. 2. Analisis Masalah Melakukan analisisis permasalahan yang akan diselesaikan pada persoalan data mining dengan teknik Bayesian Networks. Permasalahan yang akan diselesaikan adalah membangun aplikasi Bayesian Networks untuk persoalan data mining. 3. Analisis dan Pengumpulan Kebutuhan Mendefinisikan masalah-masalah pada perangkat lunak yang akan dikembangkan serta studi kasus yang akan diterapkan pada perangkat lunak. Melakukan analisis kebutuhan mengenai perangkat lunak yang akan dikembangkan, sehingga memperoleh gambaran umum mengenai perangkat lunak. Gambaran umum tersebut meliputi definisi perspektif produk perangkat lunak, asumsi dan ketergantungan yang digunakan dalam mengembangkan perangkat lunak, dan deskripsi rinci kebutuhan. 4. Perancangan Melakukan perancangan terhadap perangkat lunak yang akan dikembangkan berdasarkan hasil yang diperoleh dari analisis. Perancangan tersebut meliputi rancangan lingkungan implementasi, dekomposisi fungsional ke dalam modul/kelas, deskripsi data, dan deskripsi proses. 5. Implementasi Melakukan implementasi terhadap perangkat lunak yang akan dikembangkan berdasarkan hasil yang diperoleh dari perancangan. Implementasi ini akan menghasilkan produk perangkat lunak. 6. Pengujian 5

Melakukan pengujian terhadap produk perangkat lunak yang telah dibangun. Jika masih terdapat kekurangan atau kesalahan pada perangkat lunak maka akan diperbaiki. I.6 Sistematika Penulisan Penulisan dalam tesis ini terdari 6 (enam) bab utama. Secara umum, penjelasan untuk setiap bab yang terdapat pada tesis ini adalah sebagai berikut : 1. BAB I, bab ini berisi pokok utama dari penelitian / hal hal yang mendasari dilakukannya penelitian. Bab ini mencakup latar belakang masalah, tujuan penelitian, batasan masalah penelitian dan metodologi penelitian yang digunakan. 2. BAB II, bab ini berisi tinjauan pustaka atau landasan teori yang dipakai penulis untuk melakukan penelitian. Bab ini berisi topik data mining dengan klasifikasi berdasarkan Bayesian Networks dan beberapa bentuk grafis yang umum digunakan dalam visualisasi data. Bab ini juga membahas algoritma TPDA yang akan diimplementasikan ke dalam perangkat lunak. 3. BAB III, berisi analisa masalah secara umum. Analisa yang dilakukan meliputi analisa terhadap data agar siap untuk digunakan dalam sistem dan penentuan algoritma yang akan diaplikasikan Permasalahan yang akan diselesaikan adalah membangun aplikasi data mining untuk klasifikasi berdasarkan struktur Bayesian Network. 4. BAB IV, bab ini berisi uraian analisis dan perancangan perangkat lunak yang akan dikembangkan untuk mengimplementasikan algoritma TPDA, seperti deskripsi umum perangkat lunak, spesifikasi kebutuhan perangkat lunak, fungsi utama perangkat lunak, perancangan komponen-kompenen perangkat lunak. 5. BAB V, berisi uraian implementasi dan pengujian perangkat lunak yang dihasilkan serta evaluasi kinerja struktur Bayesian Networks yang dihasilkan ketika digunakan untuk memprediksi label kelas. Implementasi mencakup lingkungan perangkat lunak, lingkungan perangkat keras, implementasi kelas dan antar muka. Pengujian mencakup prosedur uji yang dilakukan dan metode pengujian yang dilakukan. 6

6. Kesimpulan dan Saran, yang berisi kesimpulan dan saran yang di dapat penulis selama melakukan penelitian hingga menghasilkan suatu produk yakni sebuah perangkat lunak. Selain 6 (enam) bab utama tersebut diatas, terdapat juga beberapa lembaranlembaran informasi yang berkaitan dengan tulisan tesis ini seperti daftar pustaka yang berisi daftar referensi yang dipakai oleh penulis dan beberapa lampiran. 7