PEMBANGKITAN KAIDAH ASOSIASI DARI TOP-K FREQUENT CLOSED ITEMSET YANG DIDASARKAN PADA STRUKTUR DATA BERBASIS LATTICE

dokumen-dokumen yang mirip
PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI

Penelitian ini melakukan pencarian

PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS TANPA BATASAN MINIMUM SUPPORT PADA BASIS DATA RETAIL

Aplikasi Data Mining dengan Menggunakan Teknik ARM untuk Pengolahan Informasi Rendemen Obat

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

Journal of Informatics and Telecommunication Engineering. Analisa Algoritma Data Mining Eclat Dan Hui Miner

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGGALIAN FREQUENT CLOSED ITEMSETS DENGAN MULTIPLE MINIMUM SUPPORT PADA BASISDATA RETAIL

BAB 1 PENDAHULUAN Latar Belakang

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

BAB I PENDAHULUAN 1.1 Latar Belakang

ANALISIS DAN IMPLEMENTASI DATA MINING DENGAN CONTINUOUS ASSOCIATION RULE MINING ALGORITHM (CARMA) UNTUK REKOMENDASI MATA KULIAH PADA PERWALIAN

1 st Seminar on Application and Research in Industrial Technology, SMART Yogyakarta, 27 April 2006

PENERAPAN ALGORITMA APRIORI ASSOCIATION RULE UNTUK ANALISA NILAI MAHASISWA DI UNIVERSITAS GUNADARMA

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Aplikasi Data Mining untuk meneliti Asosiasi Pembelian Item Barang di Supermaket dengan Metode Market Basket Analysis

Association Rule Mining Data Peminjaman Perpustakaan Menggunakan Apriori dan Jaccard Similarity

REKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE

PENGEMBANGAN APLIKASI PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS PADA BASIS DATA RETAIL

Analisis asosiasi Penguasaan ICT Mahasiswa Baru dan Pencapaian Prestasi Akademik Mahasiswa dengan Algoritma Apriori.

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

BAB II TINJAUAN PUSTAKA

Link Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3)

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Pengembangan Aplikasi Market Basket Analysis Menggunakan Algoritma Generalized Sequential Pattern pada Supermarket

JURNAL TEKNIK ITS Vol. 1, (Sept, 2012) ISSN: A-445

TINJAUAN PUSTAKA Data Mining

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH PADA DATA TRANSAKSI PENJUALAN OBAT

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

SISTEM REKOMENDASI PEMESANAN SPAREPART DENGAN ALGORITMA FP-GROWTH (STUDI KASUS PT. ROSALIA SURAKARTA)

Lili Tanti. STMIK Potensi Utama, Jl. K.L. Yos Sudarso Km. 6,5 No. 3A Tj. Mulia Medan ABSTRACT

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

ANALISA PENCARIAN FREQUENT ITEMSETS MENGGUNAKAN ALGORITMA FP-MAX

BAB 2 TINJAUAN PUSTAKA

1. BAB I PENDAHULUAN 1.1. Latar Belakang ,

The Implementation Of Apriori Algorithm And Chi-Square Test In Determining Pattern Of Relationship Among The Rawi Hadis

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

IMPLEMENTASI ALGORITMA APRIORI UNTUK MENGANALISA POLA PEMBELIAN PRODUK PADA DATA TRANSAKSI PENJUALAN

Association Rule Mining on Library Books Lending Data Using Combination of Apriori And Jaccard Similarity

2.2 Data Mining. Universitas Sumatera Utara

BAB I PENDAHULUAN. 1.1 Latar Belakang

DATA MINING UNTUK ANALISA PENJUALAN KERIPIK UD MARTOP PRATAMA MENGGUNAKAN ALGORITMA APRIORI

PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN

IMPLEMENTASI ALGORITMA ECLAT UNTUK FREQUENT PATTERN MINING PADA PENJUALAN BARANG

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

ANALISA DAN PERANCANGAN APLIKASI ALGORITMA APRIORI UNTUK KORELASI PENJUALAN PRODUK (STUDI KASUS : APOTIK DIORY FARMA)

Journal of Informatics and Technology, Vol 2, No 2, Tahun 2013, p

II. TINJAUAN PUSTAKA

ASSOCIATION RULES PADA TEXT MINING

PREDIKSI KEBUTUHAN PENOMORAN PADA JARINGAN TELEKOMUNIKASI MENGGUNAKAN METODE APRIORI

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

BAB I PENDAHULUAN. yang cepat dan besar di Asia (Kartiwi, 2006). Pertumbuhan e-commerce yang

BAB I PENDAHULUAN. dalam suatu sistem basis data melalui aplikasi sistem informasi manajemen. Dari

ALGORITMA GENERALIZED SEQUENTIAL PATTERN UNTUK MENGGALI DATA SEKUENSIAL SIRKULASI BUKU PADA PERPUSTAKAAN UK PETRA

PENERAPAN ALGORITMA APRIORI DALAM PERANGKAT LUNAK DATA BASE Amroni, S.Kom, M.Kom

BAB I PENDAHULUAN. Keberadaan minimarket di kota-kota besar sangat dibutuhkan bagi. masyarakat khususnya di daerah perumahan. Bagi sebagian besar

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

PENGGUNAAN MARKET BASKET ANALYSIS DALAM DATA MINING

BAB 2 TINJAUAN PUSTAKA

PENERAPAN ASSOCIATION RULE DENGAN ALGORITMA APRIORI PADA TRANSAKSI PENJUALAN DI MINIMARKET SKRIPSI. Diajukan Untuk Memenuhi Sebagian Syarat Guna

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

Pembuatan Perangkat Lunak Data Mining Untuk Penggalian Kaidah Asosiasi Menggunakan Metode Apriori

BAB II TINJAUAN PUSTAKA. Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam

PENCARIAN ATURAN ASOSIASI MENGGUNAKAN ALGORITMA APRIORI SEBAGAI BAHAN REKOMENDASI STRATEGI PEMASARAN PADA TOKO ACIICA

PEMODELAN POLA HUBUNGAN KEMAMPUAN LULUSAN UNIVERSITAS LANCANG KUNING DENGAN KEBUTUHAN DUNIA USAHA DAN INDUSTRI

ALGORITMA GENERALIZED SEQUENTIAL PATTERN UNTUK MENGGALI DATA SEKUENSIAL SIRKULASI BUKU PADA PERPUSTAKAAN UK PETRA

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

Penerapan Data Mining Association Rule Menggunakan Algoritma Apriori Untuk Meningkatkan Penjualan dan Memberikan Rekomendasi Pemasaran Produk Speedy

PENGGALIAN POLA CLOSED SEQUENTIAL PADA BASIS DATA YANG BERTAMBAH SECARA BERTAHAP

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA ECLAT

IMPLEMENTASI DATA MINING DENGAN ALGORITMA APRIORI PADA TOKO BANGUNAN UD. RUFI SENTOSA JAYA SAMBIREJO - PARE

Analisa Data Mining Menggunakan Algoritma Frequent Pattern Growth Pada Data Transaksi Penjualan Restoran Joglo Kampoeng Doeloe Semarang

Abstrak. Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris.

DATA MINING DENGAN ALGORITMA APRIORI PADA RDBMS ORACLE

IMPLEMENTASI ALGORITMA-ALGORITMA ASSOCIATION RULES SEBAGAI BAGIAN DARI PENGEMBANGAN DATA MINING ALGORITHMS COLLECTION

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah Identifikasi Masalah Masalah Umum

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Teknologi Informasi sekarang ini telah digunakan hampir di semua aspek

Cross-Selling: Perangkat Utama Customer Relationship Managem. Meningkatkan Loyalitas Pelanggan

ALGORITMA PARALEL FP-GROWTH UNTUK PENGGALIAN KAIDAH ASOSIASI PADA JARINGAN KOMPUTER

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

PEMBUATAN PERANGKAT LUNAK DATA MINING UNTUK PENGGALIAN KAIDAH ASOSIASI MENGGUNAKAN METODE APRIORI

SKRIPSI TI S1 FIK UDINUS 1

FREQUENT ITEMSET MINING MENGGUNAKAN ALGORITMA DF-APRIORI

BAB IV HASIL DAN UJICOBA. Penerapan Data Mining Market Basket Analysis Terhadap Data Penjualan Produk

BAB 1 PENDAHULUAN 1.1 Pendahuluan 1.2 Latar Belakang Masalah

Mining Association Rules dalam Basis Data yang Besar

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

BAB III METODE PENELITIAN. desaign dan coding program. Dibutuhkan waktu selama kurang lebih 8 bulan

Kata kunci : Perpustakaan, Sistem Rekomendasi, Knowledge Discovery from Database (KDD), Association Rule Mining, Algoritma CT-PRO

BAB 2 LANDASAN TEORI

IMPLEMENTASI ALGORITMA APRIORI UNTUK MENEMUKAN FREQUENT ITEMSET DALAM KERANJANG BELANJA

ASSOCIATION RULES PADA TEXT MINING

Analisis Efisiensi Algoritma Data Mining

ASSOCIATION RULE MINING UNTUK PENENTUAN REKOMENDASI PROMOSI PRODUK

IMPLEMENTASI ALGORITMA FP- GROWTH MENGGUNAKAN ASSOCIATION RULE PADA MARKET BASKET ANALYSIS

Transkripsi:

PEMBANGKITAN KAIDAH ASOSIASI DARI TOP-K FREQUENT CLOSED ITEMSET YANG DIDASARKAN PADA STRUKTUR DATA BERBASIS LATTICE Dian Puspita Hapsari dan Arif Djunaidy Fakultas Teknologi Informasi, Institut Teknologi Sepuluh Nopember (ITS) Email: hapsari_dp04@yahoo.com ABSTRAK Dari penelitian sebelumnya yang menggunakan algoritma CHARM, untuk mendapatkan frequent closed itemset yang didasarkan pada struktur data lattice, terdapat kendala dalam menentukan batasan minimum support (min_sup) yang sesuai. Nilai batasan minimum support yang terlalu kecil, akan membangkitkan ribuan itemset, sedangkan bila terlalu besar sering tidak menghasilkan jawaban (itemset itemset yang sesuai dengan batasan minimum support). Dari permasalahan ini, kami mencoba memodififikasi algoritma penggalian frequent closed itemset berbasis struktur data lattice dengan menggunakan Top-K dari derajat kemunculan sebuah itemset. Metode modifikasi ini disatu sisi, dimaksudkan untuk memudahkan pengguna dalam menentukan batasan yang diinginkan untuk mendapatkan pola yang menarik, sedangkan sisi lainnya, penggunaan struktur lattice akan sangat berguna dalam pembangkitan kaidah asosiasi. Secara umum didalam analisis asosiasi, pengukuran tingkat kemenarikan (Interestingness) sebuah kaidah asosiasi selalu dibatasi dengan beberapa parameter, yang dapat dikendalikan oleh pengguna user defined. Berdasarkan penelitian sebelumnya, sebuah pengukuran obyektif tingkat kemenarikan sebuah kaidah asosiasi secara umum hanya menggunakan analisis nilai support-confidence. Pada formulasi pembangkitan kaidah asosiasi yang ada, ukuran support confidence dipakai untuk menghilangkan pola pola yang tidak menarik (uninteresting pattern). Namun analisis ini memiliki kelemahan, mengakibatkan pola pola menarik yang potensial menjadi hilang akibat penetapan nilai support confidence tersebut. Untuk memperbaikinya ditambahkan sebuah nilai pengukuran dengan menggunakan analisis korelasi sehingga menghasilkan kaidah asosiasi yang kuat atau disebut sebagai positive association rule. Metode ini diimplementasikan dengan melakukan uji coba serta analisis untuk mengetahui karakteristik algoritma dengan berbagai parameter seperti support, confidence serta korelasi. Penelitian ini menghasilkan sebuah algoritma yang efisien untuk pengalian top-k frequent closed itemset berbasis struktur data lattice dan pembangkitan kaidah asosiasi dari top-k frequent closed itemset yang ditemukan. Hasil analisa menunjukkan bahwa top-k frequent closed itemset berbasis struktur data lattice mampu memvisualisasikan hasil top-k frequent closed itemset, dengan waktu komputasi yang relatif cepat dan penambahan nilai pengukuran dengan menggunakan analisis korelasi mampu menghasilkan positive association rule atau kaidah asosiasi yang kuat. Kata kunci: top-k closed itemset yang sering muncul, closed itemset lattice, kaidah asosiasi, data mining. PENDAHULUAN Pada tahap pertama dalam algoritma pencarian kaidah asosiasi, yaitu pencarian itemset-itemset yang sering muncul pada umumnya menggunakan sebuah batasan nilai minsup untuk menghasilkan kumpulan itemset itemset yang sering muncul secara

lengkap dan benar. Hal tersebut didasari oleh algoritma yang sangat populer, yaitu algoritma Apriori (Agrawal, 1996). Keunggulan algoritma Apriori adalah mampu mengurangi ruang pencarian atau search space dari itemset-itemset yang sering muncul (frequent itemset) dengan Downward Closure Property, (bahwa setiap subpola dari sebuah pola yang sering muncul pasti bersifat sering muncul pula). Namun algoritma Apriori akan mengalami penurunan performa pada dataset yang rapat (yaitu dataset yang memiliki transaksi dan field yang banyak). Kelemahan algoritma Apriori diperbaiki pada algoritma CHARM-L (Zaki, Hsiao, 2005) yang mampu menghasilkan frequent closed itemset lattice. Pencarian itemset-itemset yang sering muncul dengan menggunakan frequent closed itemset akan membantu dalam pembangkitan set-set kaidah-kaidah yang tidak berulang atau nonredundant rules sets. Dan dengan menggunakan lattice akan meningkatkan efisiensi waktu pencarian itemset-itemset yang sering muncul dan memudahkan pengguna untuk mengetahui hubungan subset-superset yang sangat berguna dalam melakukan proses selanjutnya yaitu tahap pembangkitan kaidah asosiasi. Namun algoritma CHARM-L juga memiliki kendala dalam menentukan batasan minimum_support (minsup) yang sesuai. Dalam menentukannya dibutuhkan pengetahuan yang rinci tentang mining query dan tugas spesifikasi data, serta kemampuan untuk estimasi, tanpa harus melakukan pencarian kaidah asosiasi. Dalam menentukan nilai batasan minimum_support pada pencarian frequent itemset, bila ditetapkan terlalu kecil akan membawa pada pembangkitan ribuan itemset itemset, dan bila terlalu besar sering tidak menghasilkan jawaban (itemset itemset yang sesuai dengan batasan minimum_support). Untuk mengatasi kendala tersebut beberapa peneliti mengusulkan sebuah model pencarian dengan Top-k yang digunakan untuk menentukan ruang pencarian dengan derajat tertentu (nilai derajat k, yang ditentukan oleh pengguna. Dimana k adalah sejumlah angka yang menentukan derajat kemunculan dari frequent itemset yang paling dicari atau yang diinginkan oleh pengguna). Dalam hal ini, menentukan nilai k dianggap lebih mudah dilakukan dibandingkan dengan menentukan batasan minimum_support. (Wang, Han, Lu and Tzvetkov, 2005). Perumusan Masalah Berdasarkan latar belakang yang telah dijelaskan sebelumnya, maka perumusan masalah dalam penelitian ini berkaitan dengan upaya untuk mengembangkan algoritma pembangkitan kaidah asosiasi dari top-k frequent closed itemset lattice. Pada algoritma yang akan dikembangkan ini, diharapkan akan memberi solusi terhadap kendala yang ada pada algoritma CHARM_L. Kendala-kendala tersebut sebagai berikut; Sulitnya menentukan nilai batasan minsup yang tepat bagi pengguna pada pencarian itemset-itemset yang sering muncul, digantikan dengan menentukan nilai k untuk Top-k yang dinginkan oleh pengguna. Keterbatasan nilai confidence sebagai Interestingness measure yang digunakan untuk mengurangi jumlah pola-pola yang kurang menarik pada tahap Rule Generation digantikan dengan nilai korelasi sebagai salah satu pengukuran obyektif yang digunakan untuk mengevaluasi kualitas pola-pola asosiasi. Berdasar pada kendala-kendala tersebut maka dapat dirumuskan sebuah masalah bagaimana mengembangkan algoritma pembangkitan kaidah asosiasi dari Top-k frequent closed itemset lattice. Tujuan Tujuan penelitian ini adalah untuk membuat algoritma pembangkitan kaidah asosiasi dari Top-k Frequent Closed Itemset yang didasarkan pada struktur data lattice. C-21-2

Batasan Penelitian Berdasarkan perumusan masalah yang ada dalam penelitian ini, maka ditentukan batasan penelitian sebagai berikut; a. Dataset yang digunakan berupa data transaksi dengan format orizontal untuk pencarian top-k frequent closed itemset lattice. b. Pembentukan struktur data dari data set yang ada dalam database akan disesuaikan dengan besar memory yang tersedia. Kontribusi dan Manfaat Penelitian Kontribusi penelitian ini adalah tersedianya algoritma yang efisien untuk pembangkitan kaidah asosiasi dari top-k frequent closed itemset yang didasarkan pada struktur data berbasis lattice yang dapat menghasilkan kaidah asosiasi yang kuat. Manfaat penelitian ini adalah tersedianya aplikasi analisis asosiasi yang mampu menghasilkan kaidah asosiasi yang kuat. PENCARIAN KAIDAH ASOSIASI SECARA UMUM Analisis kaidah asosiasi atau association analysis merupakan salah satu teknik dalam data mining, digunakan untuk mengungkapkan hubungan yang menarik (interesting relationship), yang tersembunyi dalam sekelompok data transaksional dalam jumlah yang sangat besar. Sebuah hubungan yang belum terungkap dapat direpresentasikan dengan sebuah kaidah asosiasi atau sekelompok itemset yang sering muncul. Analisis kaidah asosiasi dipelajari secara intensif untuk banyak kegunaan seperti, dibidang system rekomender, data bioinformatik, diaknosa pendukung keputusan, telekomunikasi, deteksi instruksi, web mining untuk analisis dokumen dan pengungkapan hubungan asosiasi pada data dalam jumlah besar juga berguna dalam bidang pemasaran. Dengan pengungkapan hubungan asosiasi yang menarik pada record transaksi bisnis, dapat membantu dalam realisasi desain katalog, promosi pemasaran, manajemen gudang, analisa keputusan dan manajemen bisnis. Sebagai contoh yang paling sederhana pada kegiatan analisis kaidah asosiasi adalah analisis keranjang belanja atau market basket analysis, yang mempelajari kebiasaan-kebiasaan pembelian dari konsumen, dengan cara mencari kelompokkelompok barang yang sering dibeli dalam sekali transaksi belanja. Sebagai contoh; {Mie instan} {Telur}, yang memiliki hubungan implikasi yang kuat antara penjualan mie instan dan telur. Yang mempunyai arti, banyak pelanggan yang membeli mie instan juga membeli telur. Informasi tersebut dapat meningkatkan penjualan bagi pihak penjual antara lain dengan strategi tata letak barang dalam supermarket atau strategi pemasaran silang produk dan kombinasi barang yang akan dikenakan potongan harga. Analisis kaidah asosiasi sendiri dapat diklasifikasikan kedalam beberapa kategori berdasarkan pada kriteria yang berbeda. Berdasarkan pada tipe dari nilai yang dikandung dari sebuah kaidah, asosiasi dapat diklasifikasikan kedalam asosiasi boolean dan asosiasi quantitative. Sebuah asosiasi boolean dapat menunjukkan hubungan antara obyek-obyek yang bersifat kategorikal atau diskrit. Sebagai contoh; {Komputer} {Software}, dan sebuah asosiasi quantitative merupakan sebuah asosiasi multidimensional yang melibatkan atribut-atribut numerik yang didiskritkan secara dinamis (pada contoh, umur dan pendapatan) dan dimungkinkan juga melibatkan atribut-atribut kategorikal. Sebagai contoh; umur{x, 30-34 } pendapatan{x. 5jt- 10jt } membeli{x, LCD TV }. Dalam analisis asosiasi, akan dilakukan pencarian kaidah asosiasi atau C-21-3

association rule mining yang terdiri dari dua aktifitas utama. Yang pertama yaitu, menemukan frequent itemset, mencari kelompok-kelompok barang atau disebut dengan itemset yang sering muncul dan memenuhi sebuah batasan minimum_support untuk seluruh transaksi-transaksi belanja yang terjadi. Dan aktifitas yang kedua, akan dicari sebuah kaidah asosiasi yang kuat (strong rule) dan memenuhi batasan minimum_confidence. DESAIN PEMBANGKITAN KAIDAH ASOSIASI DARI TOP-K FREQUENT CLOSED ITEMSET BERBASIS STRUKTUR DATA LATTICE Pada bagian ini akan dijelaskan desain utama dari Pembangkitan Kaidah Asosiasi dari Top-k Frequent Closed Itemset Berbasis Struktur Data Lattice. Pada analisis kaidah asosiasi pada penggalian data atau data mining terdapat strategi umum yang terdiri dari dua tahapan, sebagai berikut; (1) Pembangkitan itemset yang sering muncul atau Frequent Itemset Generation, merupakan strategi yang secara obyektif mencari semua itemset itemset yang tepat dengan menggunakan batasan minimum support. Itemset ini disebut dengan frequent itemset atau itemset yang sering muncul. Kemudian diikuti tahap yang ke-(2) Pembangkitan Kaidah Asosiasi atau Rule Generation, merupakan strategi yang secara obyektif mengekstrak semua rule yang memiliki nilai confidence yang tinggi dari itemset - itemset yang sering muncul, yang ditemukan pada tahap sebelumnya. Maka tahap ini akan menghasilkan sebuah kaidah asosiasi dan kaidah ini disebut dengan kaidah yang kuat atau strong rules. Dari penjelasan tersebut akan menjadi dasar desain utama Pembangkitan Kaidah Asosiasi berdasarkan Top-k Frequent Closed Itemset Berbasis Struktur Data Lattice. Desain Utama Pembangkitan Kaidah Asosiasi berdasarkan Top-k Frequent Closed Itemset Berbasis Struktur Data Lattice yang ditunjukkan berikut ini. Dari blok diagram dapat terlihat dengan jelas proses-proses utama yang ada pada Desain Utama Pembangkitan Kaidah Asosiasi dari Top-k Frequent Closed Itemset Berbasis Struktur Data Lattice. Gambar 1. Desain Utama Pembangkitan Kaidah Asosiasi dari Top-k Frequent Closed Itemset Berbasis Struktur Data Lattice. C-21-4

HASIL DAN ANALISIS UJI COBA Lingkungan Uji Coba Pada sub bab ini akan dijelaskan tentang mengenai lingkungan uji coba aplikasi pembangkitan kaidah asosiasi dari top-k frequent closed itemset berdasarkan struktur data lattice, yang diimplementasikan dengan menggunakan bahasa pemrograman C. Serta menggunakan komputer dengan processor Intel Celeron 1.8 GHz, RAM 1 GB, dan sistem operasi Windows XP Pro. Data Uji Coba Dataset yang digunakan pada penelitian ini adalah dataset nyata, yang memiliki karakteristik sangat rapat (terdiri dari banyak itemset yang sering muncul meskipun dikenakan nilai support yang tinggi). Dalam uji coba ini terdapat dua dataset nyata yang digunakan adalah dataset gazelle dan connect. Dataset gazelle digunakan untuk mewakili sparse database atau basis data yang renggang dan dataset connect digunakan dalam ujicoba ini untuk mewakili dense database atau basis data yang rapat. Grafik run Time 12,000 10,000 Runtime(sec) 8,000 6,000 4,000 2,000 TFP Tlattice 0,000 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Nilai Top-k Gambar 2.Grafik Perbandingan Waktu Proses pada Dataset Pumsb Grafik Run Time Runtime (sec) 6,000 5,500 5,000 4,500 4,000 3,500 3,000 2,500 2,000 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 Nilai Top-k TFP Tlattice KESIMPULAN Gambar 3. Grafik Perbandingan Waktu Proses pada Dataset Connect Berdasarkan hasil uji coba pembangkitan kaidah asosiasi dari top-k frequent closed itemset berdasarkan struktur data lattice yang telah dilakukan yaitu algoritma pengembangan ini memudahkan pengguna dalam melakukan analisis asosiasi dengan cara, pengguna hanya memberikan nilai masukan sederhana yaitu nilai k untuk menentukan Top-k yang disesuaikan dengan keinginan pengguna. Untuk hasil perbandingan kecepatan waktu proses algoritma pengembangan Tlattice ini sedikit lebih lambat dibandingkan dengan algoritma pembandingnya algoritma TFP, terutama untuk dataset-dataset yang bersifat rapat dengan pola-pola yang panjang. Namun algoritma pengembangan ini memiliki kelebihan dalam struktur data yang berbentuk lattice yang C-21-5

akan memudahkan penentuan hubungan subset dan superset yang akan berguna dalam proses pembangkitan kaidah untuk analisis keranjang belanja. SARAN Dalam penelitian yang telah dilakukan, pada tahap pembangkitan Top-k frequent closed itemset lattice membutuhkan waktu yang lebih lama dibandingkan dengan TFP, dikarenakan proses pembentukan struktur lattice. Hal ini memberikan peluang untuk dilakukan pengembangan lebih lanjut untuk Algoritma Tlattice yang lebih fokus pada kecepatan prosesnya. DAFTAR PUSTAKA Agrawal, R., Imielinski, T., Swami, A. (1993) Mining association rules between sets of items in large databases. In: Proc. of SIGMOD. 207 216. Brin, S., Motwani, R., Silverstein, C. (1997) Beyond market basket: Generalizing association rules to correlations. In: Proc. of SIGMOD. 265 276. Han J., J. Pei, and Y. Yin, (2000) Mining Frequent Patterns without Candidate Generation, Proc. 2000 ACM-SIGMOD Int l Conf. Management of Data (SIGMOD 00), pp. 1-12. Han J., Kamber M., (2000) Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers. Lu Ying, and Tzvetkov Petre, Han J., (2005) TFP: An Efficient Algorithm for Mining Top-K Frequent Closed Itemsets. Proc. Sixth ACM SIGKDD Int l Conf. Knowledge Discovery and Data Mining. Maria-Luiza, Antonie Osmar R. (2005) Mining Positive and Negative Association Rules: An Approach for Confined Rules. Department of Computing Science, University of Alberta Edmonton, Alberta, Canada. N. Pasquier, Y. Bastide, R. Taouil, and L. Lakhal, (1999) Discovering Frequent Closed Itemsets for Association Rules, Proc. Seventh Int l Conf. Database Theory. S. Brin, R. Motwani, and C. Silverstein, (1997) Beyond Market Basket: Generalizing Association Rules to Correlations, Proc. 1997 ACMSIGMOD Int l Conf. Management of Data (SIGMOD 97), pp. 265-276. Tan Pan Ning., Kumar V. and Steinbach M.(2005) Introduction to Data Mining. Addison Wesley, USA. Tan, Pan-Ning., Kumar, V. (2000) Interestingness measures for association patterns: A perspective. In: Proc. of Workshop on Postprocessing in Machine Learning and Data Mining. Zaki, M,J. (2000) Generating Non-Redundant Association Rules, Proc. Sixth ACM SIGKDD Int l Conf. Knowledge Discovery and Data Mining. Zaki M.J. and Hsiao C.-J., 2005, Efficient Algorithms for Mining Closed Itemsets and Their Lattice Structure. Technical Report 99-10, Computer Science Dept., Rensselaer Polytechnic Inst. C-21-6