BAB 1 PENDAHULUAN. 1 Universitas Indonesia. Implementasi algoritma clustering..., Adolf Pandapotan

dokumen-dokumen yang mirip
BAB 2 LANDASAN TEORI

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 3 ANALISA DAN PERENCANAAN

BAB II LANDASAN TEORI

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB I PENDAHULUAN 1-1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Universitas Indonesia

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah 1.2. Rumusan Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. alternatif aksi yang bertujuan untuk memenuhi satu atau beberapa sasaran. Sistem

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

1.1 Latar Belakang Masalah

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB I PENDAHULUAN. Dengan kemajuan teknologi informasi dewasa ini, kebutuhan akan

Keywords : Clustering, COBWEB, Hierarchical, Internal similarity 1 Pendahuluan

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Pengantar

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

BAB 2 TELAAH PUSTAKA

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

IMPLEMENTASI ALGORITMA-ALGORITMA ASSOCIATION RULES SEBAGAI BAGIAN DARI PENGEMBANGAN DATA MINING ALGORITHMS COLLECTION

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Pengantar Pendahuluan 1.2 Latar Belakang Masalah

Analisis Pola Pemilihan Konsentrasi Ilmu Jurusan Sistem Informasi Di STMIK TIME

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Pendahuluan 1.2 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

UKDW BAB I PENDAHULUAN Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM

BAB 1 PENDAHULUAN. Hampir semua kegiatan memerlukan informasi untuk mencapai tujuan yang

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Rumusan Masalah

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. Universitas Muhammadiyah Surakarta merupakan salah satu dari beberapa instansi

BAB II LANDASAN TEORI

1.1 Latar Belakang Masalah

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

1.5 Spesifikasi Sistem Dalam menyelesaikan tugas akhir ini, penulis menggunakan spesifikasi hardware, software,dan Brainware sebagai berikut: 1.

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. Wiley & Sons, 2003, Hal : 1. 1 Poe Vidette, Klauer Patricia dan Brobst Stephen, Building A Data WareHouse for Decision Support

BAB I PENDAHULUAN. secara manual dari suatu kumpulan data. Defenisi lain data mining adalah sebagai

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

TINJAUAN PUSTAKA. Definisi Data Mining

E-Journal Teknik Informatika Vol.8, No.1, April 2016

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB IV HASIL DAN UJICOBA. Penerapan Data Mining Market Basket Analysis Terhadap Data Penjualan Produk

BAB 1 PENDAHULUAN 1.1 Pendahuluan

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. banyak transaksi maka akan memerlukan banyak media penyimpanan

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. I.1 Latar Belakang

BAB I PENDAHULUAN. berukuran besar. Kegunaan Data Mining adalah untuk menspesifikasikan pola

BAB I PENDAHULUAN. 1.1 Latar Belakang

dengan harga jual yang lebih rendah. Sedangkan diskon atau potongan harga adalah pengurangan harga langsung dari suatu produk yang dilakukan dalam

BAB III LANDASAN TEORI

UKDW BAB I PENDAHULUAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

BAB I PENDAHULUAN I.1.

BAB 1 PENDAHULUAN Latar Belakang

BAB I PERSYARATAN PRODUK

BAB 1 PENDAHULUAN Pengantar

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

I-1 BAB I PENDAHULUAN

BAB 1 PENDAHULUAN. Peranan teknologi informasi pada aktifitas manusia pada saat ini memang begitu

BAB 1 PENDAHULUAN. keperluan bahkan kebutuhan yang sangat bersifat umum dan vital, terutama bagi

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

KATA PENGANTAR. Maha Esa, yang telah berkenan memelihara dan membimbing penulis, sehingga

JURNAL IT STMIK HANDAYANI

3.1 Metode Pengumpulan Data

BAB I PENDAHULUAN. bidang industri peralatan rumah tangga dengan berbagai jenis dan ukuran.

1.1 Latar Belakang Masalah

UKDW BAB I PENDAHULUAN Latar Belakang Masalah

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB V IMPLEMENTASI SISTEM

BAB 1 PENDAHULUAN. 1.1 Pendahuluan. 1.2 Latar Belakang Masalah

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 4 PERANCANGAN DAN IMPLEMENTASI PROGRAM. Oriented Programming) atau secara procedural.

U K D W BAB I PENDAHULUAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Transkripsi:

BAB 1 PENDAHULUAN Saat ini, kebutuhan manusia akan informasi sangat besar. Informasi yang penting harus disimpan karena bisa saja digunakan untuk masa yang akan datang. Sebagai contoh informasi penjualan produk sebuah perusahaan. Tiap tahun bahkan tiap bulan, informasi mengenai jumlah penjualan produk maupun wilayahnya harus disimpan dan jumlahnya sangat besar. Untuk menyimpan data yang jumlahnya sangat besar diperlukan suatu sistem yang baik. Sistem ini dinamakan database. Database tidak hanya mampu menyimpan data dengan jumlah besar namun juga mampu membantu kita untuk memperoleh data dengan mudah jika sewaktu-waktu dibutuhkan. Namun demikian, database tidak bisa digunakan untuk menjawab pertanyaan seperti apakah ada pengaruh penjualan pasta gigi terhadap sikat gigi?. Oleh sebab itu, untuk menjawabnya dibutuhkan data mining. Data mining merupakan suatu proses iterasi menganalisa data untuk mencari informasi (Kantardzic, 2003). Seperti contoh diatas, data mining dapat digunakan untuk mengetahui hubungan antara penjualan pasta gigi dengan sikat gigi. Teknik-teknik dalam data mining sangat banyak dan memiliki keunggulan masing-masing. Penggunaan teknik tersebut disesuaikan dengan kebutuhan informasi yang ingin didapat. Pada perkembangan selanjutnya, setiap teknik bermunculan algoritma-algoritma sesuai dengan ciri teknik tersebut. Algoritmaalgoritma ini berkembang seiring kebutuhan akan proses dalam data mining yang efektif dan efisien. Pada bab ini akan dijelaskan mengenai latar belakang, tujuan penelitian, ruang lingkup tugas akhir, metode penelitian dan sistematika penulisan laporan. 1.1 Latar Belakang Dalam setiap transaksi, baik pembelian maupun penjualan suatu barang atau jasa, selalu ada data yang disimpan. Data tersebut berisi informasi mengenai 1

2 setiap transaksi yang terjadi setiap waktu. Data tersebut hanya berisi informasi tertentu, sebagai contoh dalam penjualan barang berupa nama barang, jumlah yang terjual dan harga barang. Suatu perusahaan dalam waktu-waktu tertentu selalu memiliki rencana untuk meningkatkan penjualan barang atau jasa miliknya. Setiap rencana selalu memerlukan pertimbangan atau analisa mengenai penjualannya. Analisa tersebut salah satunya didapat dari data-data penjualan yang telah terjadi. Sebagai contoh, suatu perusahaan ingin menjual barang hanya pada daerah yang penjualannya diatas 100.000 barang tiap tahun untuk mengurangi biaya pengiriman, maka perusahaan tersebut dapat mengetahuinya dari database penjualan. Seperti yang telah dijelaskan sebelumnya, ada beberapa pertanyaan yang tidak dapat diperoleh hanya dengan melihat database saja. Sebagai contoh, bagaimana jika perusahaan ingin mengetahui hubungan dari suatu barang dengan barang yang lain, seperti apakah dalam pembelian sikat gigi selalu terjadi pembelian pasta gigi, atau apakah dalam setiap pembelian gula selalu ada pembelian kopi. Untuk mengetahui jawaban dari pertanyaan tersebut, maka digunakanlah data mining. Data mining biasanya terdapat pada business intelligent tools, dimana data mining merupakan bagian yang penting untuk mengolah data. Walaupun saat ini banyak sekali aplikasi business intelligent tools, namun sedikit aplikasi yang hanya berupa tools data mining. Salah satu tools data mining yang banyak digunakan dan open source yaitu WEKA (Waikato Environment for Knowledge Analysis). WEKA dibuat oleh universitas Waikato, New Zealand, yang mengimplementasikan teknik-teknik data mining, antara lain Classification, clustering dan Association. Algoritmaalgoritma yang diimplementasikan dalam WEKA antara lain NaiveBayes, ZeroR (Classification), EM, Cobweb (clustering), Appriori, Tertius (Association). Namun, algoritma-algoritma terbaru dan popular tidak diimplementasikan dalam

3 WEKA seperti Iterate, FP Growth, CMAR. Algoritma-algoritma tersebut diimplementasikan dengan menggunakan bahasa Java. Fakultas Ilmu Komputer (Fasilkom UI) melalui RUUI 2007, mengembangkan data mining Algorithms Collection sebagai workbench data mining dengan mengimplementasi algoritma-algoritma menggunakan bahasa pemrograman C/C++ yang diharapkan lebih cepat dan efisien dibandingkan Java. Tugas Akhir ini merupakan salah satu bagian dalam data mining Algorithms Collection, dimana penulis mengimplementasikan 2 buah algoritma yang menggunakan teknik clustering. Algoritma tersebut yaitu algoritma Iterate dan Cobweb. Kedua algoritma tersebut diimplementasikan dengan menggunakan bahasa pemrograman Visual C++. Algoritma Cobweb, yang merupakan salah satu algoritma clustering yang banyak dikenal, dikemukakan oleh Douglas H. Fisher pada tahun 1987. Algoritma ini menggunakan incremental hierarchy conceptual clustering yaitu terusmenerus (incremental) mengobservasi obyek-obyek ke dalam klasifikasi tree. Dalam klasifikasi tree tersebut, setiap node merupakan sebuah kelas (concept) yang memiliki probabilitas kelas dan attribute-attribute dari obyek-obyek yang disimpannya (Fisher, 1987). Algoritma Iterate dikemukakan oleh Gautam Biswas, Jerry B.Weinberg, dan C.Li pada tahun 1995. Algoritma ini juga menggunakan klasifikasi tree, namun tidak seperti Cobweb yang menggunakan proses merge, split dan new node untuk memperbaiki klasifikasi tree, Iterate mengumpulkan node-node yang nilainya rendah untuk memperbaiki tree dan menggunakan fungsi ADO untuk mengurutkan obyek sebelum klasifikasi tree dibentuk. 1.2 Tujuan penelitian Tujuan khusus pelaksanaan dari Tugas Akhir ini adalah untuk melakukan analisa dan mengimplementasikan algoritma Cobweb dan Iterate sebagai bagian dari data mining Algorithms Collection, serta melakukan uji coba untuk membandingkan kualitas dan waktu eksekusi implementasi algoritma Cobweb

4 hasil implementasi dengan algoritma Cobweb pada WEKA dan implementasi algoritma Iterate. Selain itu, tujuan umum dari Tugas Akhir ini adalah untuk memenuhi syarat memperoleh gelar sarjana S1 Ilmu Komputer serta agar penulis dapat menerapkan ilmu yang didapat dalam perkuliahan. 1.3 Ruang Lingkup Tugas Akhir Tugas akhir ini meliputi analisa dan implementasi algoritma Cobweb dan Iterate. Pada tahap implemetasi program, dilakukan implementasi dengan menggunakan MFC (Microsoft Foundation Class) dan bahasa pemrograman Visual C++ pada Framework Visual Sudio.NET 2005. Kedua algoritma tersebut diimplementasi dengan menggunakan sebuah komputer Pentium 4 2,00 GHz, memory 256 MB DDR. Tahap analisa algoritma dilakukan untuk memahami algoritma Cobweb dan Iterate, melakukan perencanaan kebutuhan input dan output program, dan menganalisa kebutuhan struktur data. 1.4 Metode Penelitian Metode yang digunakan dalam Laporan Tugas Akhir ini adalah studi literatur, analisa algoritma, penerapan algoritma dan percobaan. Literatur yang menjadi sumber penulisan dan implementasi algoritma Cobweb dan Iterate ini antara lain buku, situs web, dan berbagai makalah tentang data mining, clustering, Cobweb dan Iterate. Analisa penerapan dilakukan yaitu dengan membaca hasil analisa dari para ahli dan membandingkannya dengan hasil analisa yang didapat dari penelitian ini. Penerapan algoritma yang dilakukan penulis hanya pada algoritma clustering yaitu Cobweb dan Iterate. Pengujian yang dilakukan dengan menggunakan dataset kecil dahulu agar mudah dilakukan analisa sehingga dapat dilakukan perbandingan kualitas partisi. Pengujian selanjutnya menggunakan dataset dalam jumlah besar untuk membandingkan waktu eksekusi program. 1.5 Sistematika Penulisan Laporan Sistematika penulisan laporan Tugas Akhir ini dibagi menjadi beberapa bagian, antara lain:

5 Bab 1: Pendahuluan Pada bab ini dijelaskan mengenai latar belakang penulisan, tujuan penelitian, ruang lingkup Tugas Akhir, metode penelitian, dan sistematika penulisan laporan. Bab 2: Landasan Teori Pada bab ini dijelaskan mengenai landasan teori Tugas Akhir yaitu penjelasan mengenai teknik-teknik dalam data mining, penjelasan teknik clustering dan contoh algoritma clustering, penjelasan algoritma Cobweb yang terdiri dari fungsi evaluasi heuristik, representasi state, operator, strategi kontrol Cobweb, dan penjelasan langkah-langkah dalam algoritma Iterate. Bab 3: Analisa dan Perencanaan Pada bab ini dijelaskan mengenai analisa yang dibutuhkan dalam implementasi algoritma. Bab ini juga menjelaskan mengenai perencanaan langkah-langkah yang akan dilakukan dalam implementasi algoritma. Bab 4: Implementasi Algoritma Pada bab ini dijelaskan mengenai algoritma Cobweb dan Iterate, implementasi algoritma Cobweb dan Iterate. Bab 5: Hasil Uji Coba Implementasi Pada bab ini dijelaskan mengenai hasil uji coba yang menggunakan dataset kecil dan dataset besar serta analisa hasil uji coba.

6 Bab 6: Kesimpulan dan Saran Bab ini berisikan kesimpulan dari Tugas Akhir serta saran dari penulis untuk penelitian data mining lebih lanjut dalam clustering, khususnya algoritma Cobweb dan Iterate.