DATA MINING DENGAN ALGORITMA APRIORI PADA RDBMS ORACLE

dokumen-dokumen yang mirip
PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

BAB 2 TINJAUAN PUSTAKA

PENERAPAN ALGORITMA APRIORI ASSOCIATION RULE UNTUK ANALISA NILAI MAHASISWA DI UNIVERSITAS GUNADARMA

PENERAPAN METODE ASSOCIATION RULE MENGGUNAKAN ALGORITMA APRIORI PADA SIMULASI PREDIKSI HUJAN WILAYAH KOTA BANDUNG

Pengembangan Aplikasi Market Basket Analysis Menggunakan Algoritma Generalized Sequential Pattern pada Supermarket

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lili Tanti. STMIK Potensi Utama, Jl. K.L. Yos Sudarso Km. 6,5 No. 3A Tj. Mulia Medan ABSTRACT

ANALISA ALGORITMA APRIORI UNTUK MENENTUKAN MEREK PAKAIAN YANG PALING DIMINATI PADA MODE FASHION GROUP MEDAN

Aplikasi Data Mining dengan Menggunakan Teknik ARM untuk Pengolahan Informasi Rendemen Obat

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

Angelina Prima Kurniati¹, -². ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Penerapan Metode Association Rule Menggunakan Algoritma Apriori pada Simulasi Prediksi Hujan Wilayah Kota Bandung

ANALISIS DAN IMPLEMENTASI DATA MINING DENGAN CONTINUOUS ASSOCIATION RULE MINING ALGORITHM (CARMA) UNTUK REKOMENDASI MATA KULIAH PADA PERWALIAN

PENGENALAN POLA TRANSAKSI SIRKULASI BUKU PADA DATABASE PERPUSTAKAAN MENGGUNAKAN ALGORITMA GENERALIZED SEQUENTIAL PATTERN

2.2 Data Mining. Universitas Sumatera Utara

ANALISA DATA PENJUALAN OBAT DENGAN MENGGUNAKAN ALGORITMA APRIORI PADA RUMAH SAKIT UMUM DAERAH H. ABDUL MANAN SIMATUPANG KISARAN

PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

PEMODELAN POLA HUBUNGAN KEMAMPUAN LULUSAN UNIVERSITAS LANCANG KUNING DENGAN KEBUTUHAN DUNIA USAHA DAN INDUSTRI

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

ALGORITMA GENERALIZED SEQUENTIAL PATTERN UNTUK MENGGALI DATA SEKUENSIAL SIRKULASI BUKU PADA PERPUSTAKAAN UK PETRA

ALGORITMA GENERALIZED SEQUENTIAL PATTERN UNTUK MENGGALI DATA SEKUENSIAL SIRKULASI BUKU PADA PERPUSTAKAAN UK PETRA

DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION)

PENERAPAN ALGORITMA APRIORI DALAM PERANGKAT LUNAK DATA BASE Amroni, S.Kom, M.Kom

BAB II LANDASAN TEORI

PENERAPAN ASSOCIATION RULE DENGAN ALGORITMA APRIORI PADA TRANSAKSI PENJUALAN DI MINIMARKET SKRIPSI. Diajukan Untuk Memenuhi Sebagian Syarat Guna

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

APLIKASI DATA MINING UNTUK POLA PERMINTAAN DARAH DI UDD ( UNIT DONOR DARAH ) PMI KOTA SURABAYA MENGGUNAKAN METODE APRIORI

ANALISA PENCARIAN FREQUENT ITEMSETS MENGGUNAKAN ALGORITMA FP-MAX

PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI

BAB 2 TINJAUAN PUSTAKA

BAB III METODE PENELITIAN. Metode penelitian merupakan suatu prosedur beserta tahapan-tahapan yang

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ANALISA DAN PERANCANGAN APLIKASI ALGORITMA APRIORI UNTUK KORELASI PENJUALAN PRODUK (STUDI KASUS : APOTIK DIORY FARMA)

IMPLEMENTASI ALGORITMA APRIORI UNTUK MENEMUKAN FREQUENT ITEMSET DALAM KERANJANG BELANJA

Analisis asosiasi Penguasaan ICT Mahasiswa Baru dan Pencapaian Prestasi Akademik Mahasiswa dengan Algoritma Apriori.

BAB II TINJAUAN PUSTAKA

Journal of Informatics and Telecommunication Engineering. Analisa Algoritma Data Mining Eclat Dan Hui Miner

ANALISIS DAN IMPLEMENTASI ALGORITMA CT-APRIORI UNTUK ASOSIASI TRANSAKSI BARANG

Student Clustering Based on Academic Using K-Means Algoritms

IMPLEMENTASI DATA MINING PADA PENJUALAN TIKET PESAWAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus: Jumbo Travel Medan)

PENGGUNAAN ALGORITHMA APRIORI DALAM MENGANALISA PRILAKU MAHASISWA DALAM MEMILIH MATA KULIAH ( STUDI KASUS : FKIP UPI YPTK )

1 st Seminar on Application and Research in Industrial Technology, SMART Yogyakarta, 27 April 2006

IMPLEMENTASI DATA WAREHOUSE DAN DATA MINING: STUDI KASUS ANALISIS PEMINATAN STUDI SISWA

Decision Support on Supply Chain Management System Using Apriori Data Mining Algorithm

ANALISA POLA DATA HASIL PEMBANGUNAN KABUPATEN MALANG MENGGUNAKAN METODE ASSOCIATION RULE

Implementasi data mining menggunakan metode apriori (studi kasus transaksi penjualan barang)

DAFTAR REFERENSI. xiii. Computer Science Education, San Jose, United States, 1997.

PEMBUATAN PERANGKAT LUNAK DATA MINING UNTUK PENGGALIAN KAIDAH ASOSIASI MENGGUNAKAN METODE APRIORI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

ANALISA PENERAPAN DATAMINING PADA PENJUALAN PRODUK OLI MESIN SEPEDA MOTOR DENGAN ALGORITMA APRIORI

II. TINJAUAN PUSTAKA

PREDIKSI KEBUTUHAN PENOMORAN PADA JARINGAN TELEKOMUNIKASI MENGGUNAKAN METODE APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

REKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE

SATUAN ACARA PERKULIAHAN UNIVERSITAS GUNADARMA

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

ANALISIS DAN IMPLEMENTASI ALGORITMA FP-GROWTH PADA APLIKASI SMART UNTUK MENENTUKAN MARKET BASKET ANALYSIS PADA USAHA RETAIL (STUDI KASUS : PT.

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

ALGORITMA PARALEL FP-GROWTH UNTUK PENGGALIAN KAIDAH ASOSIASI PADA JARINGAN KOMPUTER

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) PENERAPAN IMPROVED APRIORI PADA APLIKASI DATA MINING DI PERUSAHAAN KALVIN SOCKS PRODUCTION

PEMBANGKITAN KAIDAH ASOSIASI DARI TOP-K FREQUENT CLOSED ITEMSET YANG DIDASARKAN PADA STRUKTUR DATA BERBASIS LATTICE

Journal of Informatics and Technology, Vol 2, No 2, Tahun 2013, p

Cross-Selling: Perangkat Utama Customer Relationship Managem. Meningkatkan Loyalitas Pelanggan

IMPLEMENTASI DATA MINING MENGGUNAKAN METODE APRIORI PADA TRANSAKSI PENJUALAN BARANG (STUDI KASUS DI CHORUS MINIMARKET)

Pembuatan Perangkat Lunak Data Mining Untuk Penggalian Kaidah Asosiasi Menggunakan Metode Apriori

Jurnal Teknologi Informasi & Komunikasi Digital Zone, Volume 7, Nomor 1, Februari 2016: ISSN:

Kata kunci: Sistem Informasi, poin of sale, aplikasi data mining, algoritma apriori, Borland Delphi, SQL 2000, Association rules.

IMPLEMENTASI ALGORITMA APRIORI UNTUK MENGANALISA POLA PEMBELIAN PRODUK PADA DATA TRANSAKSI PENJUALAN

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

SISTEM REKOMENDASI PEMESANAN SPAREPART DENGAN ALGORITMA FP-GROWTH (STUDI KASUS PT. ROSALIA SURAKARTA)

Link Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3)

IMPLEMENTASI ALGORITMA-ALGORITMA ASSOCIATION RULES SEBAGAI BAGIAN DARI PENGEMBANGAN DATA MINING ALGORITHMS COLLECTION

Association Rule Mining Data Peminjaman Perpustakaan Menggunakan Apriori dan Jaccard Similarity

Mahasiswa mampu menjelaskan fungsi data management, business process management dalam suatu perancangan SIM suatu organisasi.

Aplikasi Data Mining untuk meneliti Asosiasi Pembelian Item Barang di Supermaket dengan Metode Market Basket Analysis

PENCARIAN ATURAN ASOSIASI MENGGUNAKAN ALGORITMA APRIORI SEBAGAI BAHAN REKOMENDASI STRATEGI PEMASARAN PADA TOKO ACIICA

Implementasi Algoritme Modified-Apriori Untuk Menentukan Pola Penjualan Sebagai Strategi Penempatan Barang Dan Promo

BAB II TINJAUAN PUSTAKA. mewakilkan objek dan peristiwa yang memiliki arti dan sangat penting bagi

Penerapan Data Mining Association Rule Menggunakan Algoritma Apriori Untuk Meningkatkan Penjualan dan Memberikan Rekomendasi Pemasaran Produk Speedy

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISA POLA PEMILIHAN PROGRAM STUDI BAGI CALON MAHASISWA DI UNIVERSITAS ABDURRAB MENGGUNAKAN ASSOCIATION RULE

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA 2.1 DASAR TEORI Business Analytic

DATA MINING UNTUK ANALISA PENJUALAN KERIPIK UD MARTOP PRATAMA MENGGUNAKAN ALGORITMA APRIORI

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH PADA DATA TRANSAKSI PENJUALAN OBAT

PENERAPAN METODE ASSOCIATION RULE MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENEMUKAN POLA PEMINJAMAN BUKU

FREQUENT ITEMSET MINING MENGGUNAKAN ALGORITMA PIE

DATA MINING INFORMASI TINGKAT KELULUSAN MAHASISWA STMIK PELITA NUSANTARA MEDAN. Anita Sindar RM Sinaga

BAB 2 LANDASAN TEORI

ALGORITMA ATURAN ASOSIASI APRIORI-TID DENGAN METODE KLASTERISASI HIERARKI AGLOMERATIF. Tri Khairul I.A 1 ABSTRAK

Kata kunci: graph, graph database, GIndex, subgraph query, size-increasing support constraint, discriminative fragments, index, subgraph matching

BAB I PENDAHULUAN. 1.1 Latar Belakang

Royes Otpin S¹, Arie Ardiyanti Suryani², Warih Maharani³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

DATA & INFORMASI. Defri Kurniawan

IDENTIFIKASI POLA PENYAKIT ANAK DIBAWAH 5 TAHUN (BALITA) DENGAN MENGGUNAKAN ALGORITMA APRIORI

Transkripsi:

1 DATA MINING DENGAN ALGORITMA APRIORI PADA RDBMS ORACLE Dana Sulistiyo Kusumo 1, Moch. Arief Bijaksana 2, Dhinta Darmantoro Jurusan Teknik Informatika Sekolah Tinggi Teknologi Telkom 1 dana@stttelkom.ac.id, 2 arifb@telkom.co.id, dhinta@stttelkom.ac.id Abstrak Data mining merupakan proses analisis data menggunakan perangkat lunak untuk menemukan pola dan aturan (rules) dalam himpunan data. Data mining dapat menganalisis data yang besar untuk menemukan pengetahuan guna mendukung pengambilan keputusan. Dalam penelitian ini akan dibahas Association Rule sebagai salah satu fungsi data mining yang diimplementasikan menggunakan Algoritma Apriori. Akan dianalisis pula dua teknik penghitungan support di candidate generation pada Algoritma Apriori, yakni : dan 2 Group-By pada tiga sampel dataset dengan atribut transaksi id dan item. Pada penelitian ini terlihat bahwa permasalahan penghitungan support di candidate generation merupakan bottleneck dari Algoritma Apriori dimana perbaikan Algoritma Apriori ditekankan pada candidate generation dan efektivitas dari Algoritma Apriori. Penelitian ini dilakukan pada RDBMS Oracle dengan memanfaatkan tools TKPROF untuk mengukur performansi query berdasarkan operasi I/O pada penghitungan support di candidate generation. Hasil penelitian membuktikan bahwa metode support counting lebih baik daripada Two Group-by. Kata Kunci : Data Mining, Association Rule, Algoritma Apriori, candidate generation,, 2 Group-By Abstract Data Mining is a data process analysis using software for finding pattern and rule in dataset. Data Mining could analyze large dataset to obtain knowledge as a pattern having meaning for making decision in management level for business organization. This paper discusses Association Rule as one function of data mining implemented using Apriori Algorithm. Two counting techniques of support in candidate generation in Apriori algorithm, i.e. and 2 group-by on three dataset samples with transaction attribute id and item, would also be discussed. This research reveals that the problem of support counting in candidate generation is a bottleneck of Apriori algorithm, where Apriori Algorithm fitting is emphasised on candidate generation and effectiveness of Apriori Algorithm. This research was done on RDBMSS Oracle utilizing TKPROF tools to measure query performance based on I/O operation on support counting in candidate generation. The result shows that support counting method is better than Two Group-by method. Keywords : Data Mining, Association Rule, Apriori algorithm, support, candidate generation,, 2 Group-By and RDBMS. 1. Pendahuluan Data mining merupakan suatu proses pendukung pengambil keputusan dimana kita mencari pola informasi dalam data. Pencarian ini dapat dilakukan oleh pengguna, misalnya dengan menggunakan query (dalam kasus ini sangat sulit dilakukan) atau dapat dibantu dengan suatu aplikasi yang secara otomatis mencari pola informasi pada basis data. Pencarian ini disebut discovery. Discovery adalah proses pencarian dalam basis data untuk menemukan pola yang tersembunyi tanpa ide yang didapatkan sebelumnya atau hipotesa tentang pola yang ada. Dengan kata lain aplikasi mengambil inisiatif untuk menemukan pola dalam data tanpa pengguna berpikir mengenai pertanyaan yang relevan terlebih dulu. Salah satu bentuk pola yang dapat dihasilkan data mining adalah association rule. Association Rule dapat digunakan untuk menemukan: hubungan atau sebab akibat. Association rule memiliki bentuk LHS RHS dengan interpretasi bahwa jika setiap item dalam LHS (Left Hand Side) dibeli, maka item dalam RHS (Right Hand Side) juga dibeli. Association rule dapat dihasilkan dengan Algoritma Apriori. Salah satu penggunaan Association rule adalah mendukung pengambilan keputusan dalam bidang pemasaran, misalnya untuk mengetahui pola pembelian pelanggan, penentuan tata letak barang dan lain-lain. Salah satu obyek untuk data mining adalah RDBMS. Umumnya data mining dilakukan pada penyimpanan data berukuran besar. Dalam penelitian ini akan dilakukan pengujian terhadap proses penghitungan support dalam implementasi data mining pada RDBMS. Analisis terhadap teknik penghitungan support perlu dilakukan karena faktor : 1. Banyaknya kandidat frequent-itemset yang dihasilkan sebagai input terhadap penghitungan support, 2. Scan/pembacaan record pada RDBMS.

2 Kedua faktor diatas dapat mempengaruhi jalannya pemrosesan query pada RDBMS. Penelitian ini dilakukan dengan tujuan untuk menerapkan Algoritma Apriori dengan teknik support counting dan 2 Group-By, mencari Association Rule pada RDBMS Oracle, dan mengimplemantasikannya dalam bentuk perangkat lunak. Analisis Algoritma Apriori didasarkan pada hasil pengukuran performansi proses query pada teknik support counting dan 2 Group-By menggunakan tools TKPROF pada RDBMS Oracle. Batasan masalah untuk penelitian ini adalah sebagai berikut : 1. Data yang digunakan merupakan tabel relasional 2. Hanya digunakan tiga dataset sebagai bahan pengukuran untuk analisis pemrosesan query 2. Data Mining 2.1 Definisi Data Mining Pengertian Data Mining atau Knowledge Discovery in Database menurut William J. Frawley, Gregory Piatetsky-Shapiro dan Christopher J. Matheus [1]: Data Mining atau Knowledge Discovery in Database( KDD ) adalah penyaringan data secara implisit dimana sebelumnya tidak diketahui terdapatnya informasi yang potensial. 2.2 Fungsi dan Tugas Data Mining Data mining menganalisis data menggunakan tool untuk menemukan pola dan aturan dalam himpunan data. Perangkat lunak bertugas untuk menemukan pola dengan mengidentifikasi aturan dan fitur pada data. Tool Data mining diharapkan mampu mengenal pola ini dalam data dengan input minimal dari user. Dalam penelitian ini pembahasan Data Mining diklasifikasikan dalam fungsi Association. 2. Association Rule Tipe pola yang penting yang dapat ditemukan dari basis data adalah sebuah aturan. Association rule mempunyai bentuk LHS RHS dengan interpretasi jika setiap item dalam LHS dibeli maka sepertinya item dalam RHS juga dibeli. Dua pengukuran penting untuk sebuah rule adalah support dan confidence. Kita dapat menghitung semua association rule dengan ambang support dan confidence masukkan pengguna dengan postprocessing frequent-itemset. Secara umum Association Rule mempunyai bentuk : LHS RHS, dimana LHS dan RHS adalah himpunan item; jika setiap item-item dalam LHS terdapat dalam transaksi maka item-item di RHS juga terdapat dalam transaksi. Ada dua aturan pengukuran untuk association rule : 1. Support Support untuk himpunan item adalah prosentase transaksi yang berisi semua item-item ini. Support untuk aturan LHS RHS di-support untuk himpunan item-item LHS RHS. 2. Confidence Pertimbangkan transaksi yang berisi semua item dalam LHS. Confidence untuk rule : LHS RHS adalah prosentasi transaksi yang juga terdiri semua item-item dalam RHS. Lebih tepatnya, misalkan sup (LHS) adalah prosentase transaksi yang berisi LHS dan sup (LHS RHS) adalah prosentase transaksi yang berisi LHS dan RHS, maka confidence rule: LHS RHS adalah sup( LHS RHS )/sup (LHS ). Permasalahan Association Rule dapat dikomposisikan menjadi dua sub masalah, yaitu: 1. Penemuan semua kombinasi item-item, yang disebut frequent-itemset, yang support-nya lebih besar daripada minimum support. 2. Gunakan frequent-itemset untuk membangkitkan aturan yang diinginkan. Idenya adalah, katakan, ABCD dan AB sering muncul dalam transaksi, maka aturan AB CD akan dipenuhi jika perbandingan antara support(abcd) terhadap support(ab) minimum sebesar minimum confidence. Semua rule akan mempunyai minimum support karena ABCD sering muncul dalam transaksi. 2.4 Algoritma Apriori Langkah yang membutuhkan pemrosesan lebih adalah penemuan frequent-itemset. Algoritma untuk menemukan frequent-itemset berdasar pada sifat frequent-itemset: Sifat Apriori : Setiap subset frequent-itemset harus menjadi frequent-itemset [12]. Algoritma Apriori untuk menemukan frequentitemset merupakan iterasi pada data. Pada iterasi kek ditemukan semua himpunan item-item yang mempunyai k item yang disebut k-itemset. Setiap iterasi terdiri dari dua tahap.. Pertama, adalah tahap pembangkitan kandidat (candidate generation) dimana himpunan semua frequent(k 1)-itemset F k-1 yang ditemukan pada pass ke-(k 1) digunakan untuk membangkitkan kandidat itemset C k. Prosedur pembangkitan kandidat menjamin bahwa C k adalah superset dari himpunan semua frequent k-itemset. Kemudian data di-scan dalam tahap Penghitungan Support (Support Counting). Pada akhir pass C k diperiksa untuk menentukan kandidat mana yang sering muncul, menghasilkan F k. Penghitungan support berakhir ketika F k atau C k+1 kosong. Untuk membangkitkan rule akan dibangkitkan lebih dahulu candidate rule. Candidate rule berisi semua kemungkinan rule yang memiliki support > minimum support karena input candidate rule adalah frequent-itemset. Kemudian candidate rule akan di- Jurnal Penelitian dan Pengembangan TELEKOMUNIKASI, Juni 2, Vol. 8 No. 1

join dengan tabel F untuk menemukan support antecedent. Confidence rule dihitung dengan cara membandingkan support rule dengan support antecedent rule. Hanya rule yang mempunyai confidence > minimum confidence yang disimpan dalam tabel rule (tabel R).. Pengukuran data penelitian Untuk menganalisis teknik penghitungan support dan 2 Group-By pada Algoritma Apriori digunakan sampel dataset dengan atribut transaction identifier (id) dan item identifier (item), dimana untuk setiap id terdapat beberapa item. Deskripsi data yang digunakan dalam penelitian ini diperlihatkan pada Tabel 1 di bawah ini. menjadi masukan outer query. Pada Two Group-by agregasi dilakukan dua kali. 7 6 4 2 1 6 6,891% 2% 48,1 % Gambar 1. I/O pada dataset A Tabel 1. Data Penelitian I II III IV V VI A 12 27 9,78 B 2771 84 16 9 4,74 C 9784 1168 2 18 8,1 Keterangan judul kolom : I : Dataset IV : Transaksi II : Record V : Item III : Group VI : Max. Itemset VII : Rata-rata item per transaksi 2 2 1 1 26 26629 41 7691 878 78 4% 2% 6,81% Untuk menganalisis kedua teknik penghitungan support di atas digunakan tools TKPROF untuk mengetahui besarnya operasi I/O () pada eksekusi Algoritma Apriori. Pengukuran terhadap operasi I/O () dijadikan suatu parameter karena operasi I/O () mendominasi waktu total eksekusi query pada RDBMS. Pada Gambar 1, 2, dan ditampilkan hasil pengukuran operasi I/O () pada tiga sampel dataset. Performansi kedua metode support counting dipengaruhi oleh besarnya minimum support dan data yang digunakan. Jika minimum support kecil maka semakin banyak kebutuhan I/O dibandingkan dengan jika minimum support besar. Hal ini disebabkan karena jumlah record yang diproses lebih banyak. Data yang di-mining juga memberi pengaruh terhadap jumlah record yang diproses. Besarnya data yang di-mining berbanding lurus terhadap jumlah record yang diproses. Sehingga berdasar hasil pengukuran, secara umum lebih baik daripada Two Group-by, karena lebih sedikit dalam melakukan operasi I/O dibandingkan dengan Two Group-by. 4. Analisis Algoritma Apriori Berdasarkan teori pemrosesan query, Two Group-by berbentuk nested query dengan inner query dan outer query-nya berbentuk group by. Pada pemrosesan query Two Group-by, Inner group-by melakukan sorting menggunakan banyak relasi antara. Hasil query dari inner query kemudian 4 2 2 1 1 Gambar 2. I/O pada dataset B 619 27171 8466 8744 28 27 18% 2% 6,42% Gambar. I/O pada Dataset C Pemrosesan query pada lebih sedikit menggunakan relasi antara yang berupa sorting dibandingkan Two Group-by. Pada agregasi hanya dilakukan sekali. Berdasar pemrosesan query diatas, lebih sedikit dalam melakukan sorting dan operasi agregasi dalam mengeksekusi query dibandingkan Two Group-by. Algoritma Apriori untuk menemukan frequentitemset merupakan iterasi pada data. Algoritma Apriori dimulai dengan pembangkitan kandidat itemset. Pembangkitan itemset menjamin C k adalah superset dari himpunan semua frequent k-itemset.

4 Kemudian data di-scan dalam tahap Penghitungan Support (Support Counting). insert into F k select item 1,, item k, count(*) from ( select item 1,, item k, count(*) From Xact, C k where item = C k.item 1 or.. item = C k.item k group by item 1,, item k, tid having count(*) = k ) group by item 1,, item k having count(*) > : Gambar 4. Penghitungan support insert into F k select item 1,, item k, count(*) from C k, Xact t 1,, Xact t k where t 1.item = C k.item 1 and t k.item = C k.item k and t 1.id = t 2.id and t k-1.id = t k.id group by item 1,, item k having count(*) > : Gambar. Penghitungan support Penghitungan support menggunakan data dengan skala menengah ke atas dengan nilai minimum support yang kecil dapat ditangani menggunakan pada bagian support counting. Penggunaan Two Group-by pada proses support counting pada data berskala menengah ke atas tidak dianjurkan karena untuk minimum support dengan nilai yang kecil akan menyebabkan pemrosesan query dengan banyak sorting (misalnya : pada dataset B dengan minimum support =,1, masih dapat berjalan dengan baik tetapi pada 2 Group-by, algoritma Apriori berhenti tidak normal). Dengan banyaknya sorting menyebabkan temporary segments yang digunakan sebagai area kerja operasi sorting pada tablespace yang ada tidak dapat dikembangkan lagi karena telah mencapai batas maksimal. Sehingga dapat menyebabkan iterasi dalam pengisian tabel F tidak selesai yang dapat mengakibatkan berhentinya algoritma Apriori secara tidak normal. Pada akhir iterasi, C k diperiksa untuk menentukan kandidat mana yang sering muncul, menghasilkan F k. Penghitungan support berakhir ketika F k atau C k+1 kosong. Untuk menghasilkan rule digunakan tabel RC yang berisi semua kemungkinan rule dari frequentitemset dengan nilai sup > minimum support. Jika nilai minimum support yang diberikan sangat kecil menyebabkan pengisian tabel RC terdiri atas banyak operasi sorting. Hal ini menyebabkan temporary segments yang digunakan sebagai area kerja operasi sorting pada tablespace yang ada tidak dapat dikembangkan lagi karena telah mencapai batas maksimal. Sehingga dapat menyebabkan iterasi dalam pengisian tabel RC tidak selesai yang dapat mengakibatkan berhentinya algoritma Apriori secara tidak normal. Pembangkitan rule dimulai dengan cara melakukan join antara antecedent dari kandidat rule dengan frequent-itemset untuk mendapatkan support antecedent. Confidence dari rule didapatkan dengan membagi support dari rule dengan support antecedent-nya. Algoritma berakhir setelah pembangkitan rule menghasilkan rule-rule dengan nilai support > minimum support dan confidence > minimum confidence.. Kesimpulan Berdasar analisis pengukuran, metode support counting lebih baik daripada karena operasi sorting dan agregasi pada lebih sedikit dibandingkan Two Group-by sehingga lebih sedikit mengkonsumsi I/O (). Besarnya minimum support berbanding terbalik dengan banyak baris record yang diproses. Sedangkan besarnya baris record yang diproses berbanding lurus dengan konsumsi operasi I/O, akses buffer dan elapsed time. mampu dengan baik menangani data berskala menengah ke atas dengan nilai minimum support yang kecil, sedangkan penggunaan dapat mengakibatkan berhentinya Algoritma Apriori secara tidak normal. Teknik candidate frequent k-itemset (candidate generation) merupakan bottleneck dari Algoritma Apriori karena: a. banyaknya kandidat frequent-itenset yang dihasilkan sebagai input terhadap penghitungan support sangat besar. b. scan/pembacaan berulang record pada RDBMS Diperlukan konfigurasi perangkat keras yang mendukung implementasi data mining. Selain itu, pada sisi RDBMS perlu dilakukan tuning pada implementasi data mining, karena sifat data yang dimining biasanya merupakan data berukuran besar. Perlu dilakukan perbaikan terhadap teknik candidate frequent k-itemset (candidate generation) yang merupakan bottleneck algoritma Apriori. Dapat dilakukan pengembangan lanjut implementasi Association Rule, yaitu meliputi: a. dataware housing: OLAP mining b. data mining yang lain: spatial data, multimedia data, time series data dsb. Daftar Pustaka [1] Agrawal R., T. Imielinski, and A.Swami. 199. Special Issue on Learning and Discovery in Knowledge Based Databases. Database Mining : A Performance Perspective. IEEE Transactions on Knowledge and Data Engineering, 914-92. [2] Agrawal R. and R. Srikant. 1994. Fast Algorithms for Mining Association Rules in Large Databases. Research Report RJ 989. San Jose, CA: IBM Almaden Research Center [] Ambarwaty, Retno. 1997. Sistem Pendukung Keputusan Pemasaran Jasa Telepon Dengan Segmentasi Pelanggan Psikografis. Studi Kasus di Kandatel Jakarta Barat. Bandung: Sekolah Tinggi Teknologi Telkom. Jurnal Penelitian dan Pengembangan TELEKOMUNIKASI, Juni 2, Vol. 8 No. 1

[4] Direct Marketing Association. 1992. Managing Database Marketing Technology for Sucess. [] Date, C.J. 1994. An Introduction to Database System. New York: Addison Wesley. [6] Fayyad, U., G.Piatetsky-Shapiro, and P. Smyth. 1996. From data mining to knowledge discovery : An overview. In Advances in Knowledge Discovery and Data Mining. Cambridge, MASS: AAAI/MIT Press, [7] Han, Jiawei and M. Kamber. 2. Data Mining: Concepts and Techniques. Morgan Kaufmann. [8] Han, Jiawei. Towards On-line Analytical Mining : An Integration of OLAP and Data Mining. Intelligent Systems. Canada: Database Research Lab. DBMiner Technology Inc. and School of Computing Science Simon Fraser University, British Columbia. http://www.dbsummit.com/articles/han/ [9] Information Discovery, Inc. 1996. Datamines for Dataware Houses. [1] The Parallel Computer Center. 199. Data Mining : An Introduction. Student Note. The Queen's University of Belfast. http://www.pcc.qub.ac.uk [11] Piatetsky-Shapiro, G., Fayyad, U., and P. Smyth. 1996. The KDD Process for Extracting Useful Knowledge from Volumes of Data. Communications of The ACM, November 1996/Vol. 6, No. 11. ACM [12] Ramakrishnan, Raghu. 2. Database Management System. MacGraw Hill. [1] Sarawagi, S., Thomas S. and R. Agrawal. 1998. Integrating association rules mining with relational database system : Alternative and implications. Research Report RJ 117 (9192 ). IBM Almaden Research Center. [14] Silberschatz, Abraham, Henry F. Korth, and S. Sudarshan. 1997. Database System Concepts. The McGraw-Hill Companies, Inc. [1] Stonebraker, M. 199 The DBMS research at crossroads. Dublin: Proc. of the VLDB Conference. [16] Turban, Efrain. 199. Decision Support System and Expert System, Prentice Hall, Inc. [17] Yourdon, Edward. 1989. Modern Structured Analysis. Prentice Hall, Inc.