PENGGALIAN FREQUENT CLOSED ITEMSETS DENGAN MULTIPLE MINIMUM SUPPORT PADA BASISDATA RETAIL

dokumen-dokumen yang mirip
PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI

2.2 Data Mining. Universitas Sumatera Utara

ANALISA PENCARIAN FREQUENT ITEMSETS MENGGUNAKAN ALGORITMA FP-MAX

Penelitian ini melakukan pencarian

PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS TANPA BATASAN MINIMUM SUPPORT PADA BASIS DATA RETAIL

ASSOCIATION RULES PADA TEXT MINING

BAB II LANDASAN TEORI. Anindita Dwi Respita,2015. a. Penelitian ini menjelaskan tentang tujuan : menggunakan metode market basket analysis.

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH PADA DATA TRANSAKSI PENJUALAN OBAT

PENDAHULUAN TINJAUAN PUSTAKA

Mining Association Rules dalam Basis Data yang Besar

Cust. 1 : milk, bread, cereal. Cust. 2 : milk, bread, Sugar, eggs. Cust. 3 : milk, bread, butter

Journal of Informatics and Telecommunication Engineering. Analisa Algoritma Data Mining Eclat Dan Hui Miner

PENGEMBANGAN APLIKASI PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS PADA BASIS DATA RETAIL

BAB I PENDAHULUAN 1.1 Latar Belakang

ASSOCIATION RULES PADA TEXT MINING

IMPLEMENTASI ALGORITMA FP- GROWTH MENGGUNAKAN ASSOCIATION RULE PADA MARKET BASKET ANALYSIS

Pembentukan Temporal Association Rules Menggunakan Algoritma Apriori (Studi Kasus:Toko Batik Diyan Solo)

SISTEM REKOMENDASI PEMESANAN SPAREPART DENGAN ALGORITMA FP-GROWTH (STUDI KASUS PT. ROSALIA SURAKARTA)

ANALISIS DAN IMPLEMENTASI DATA MINING DENGAN CONTINUOUS ASSOCIATION RULE MINING ALGORITHM (CARMA) UNTUK REKOMENDASI MATA KULIAH PADA PERWALIAN

PEMBANGKITAN KAIDAH ASOSIASI DARI TOP-K FREQUENT CLOSED ITEMSET YANG DIDASARKAN PADA STRUKTUR DATA BERBASIS LATTICE

ALGORITMA PARALEL FP-GROWTH UNTUK PENGGALIAN KAIDAH ASOSIASI PADA JARINGAN KOMPUTER

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi Penentuan Frequent Itemset

Penggunaan Struktur FP-Tree dan Algoritma FP- Growth dalam Rekomendasi Promosi Produk pada Situs Belanja Online

SISTEM REKOMENDASI PAKET MAKANAN DENGAN ALGORITMA FP-GROWTH PADA RESTORAN SEAFOOD XYZ

PENDAHULUAN. Latar Belakang

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

PENERAPAN ALGORITMA APRIORI ASSOCIATION RULE UNTUK ANALISA NILAI MAHASISWA DI UNIVERSITAS GUNADARMA

IMPLEMENTASI ALGORITMA APRIORI UNTUK MENEMUKAN FREQUENT ITEMSET DALAM KERANJANG BELANJA

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

Abstrak. Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris.

Implementasi Algoritme Modified-Apriori Untuk Menentukan Pola Penjualan Sebagai Strategi Penempatan Barang Dan Promo

IMPLEMENTASI ALGORITMA-ALGORITMA ASSOCIATION RULES SEBAGAI BAGIAN DARI PENGEMBANGAN DATA MINING ALGORITHMS COLLECTION

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

IMPLEMENTASI ALGORITMA ECLAT UNTUK FREQUENT PATTERN MINING PADA PENJUALAN BARANG

ANALISIS DAN IMPLEMENTASI ALGORITMA FP-GROWTH PADA APLIKASI SMART UNTUK MENENTUKAN MARKET BASKET ANALYSIS PADA USAHA RETAIL (STUDI KASUS : PT.

FREQUENT ITEMSET MINING MENGGUNAKAN ALGORITMA PIE

PREDIKSI KEBUTUHAN PENOMORAN PADA JARINGAN TELEKOMUNIKASI MENGGUNAKAN METODE APRIORI

BAB 2 TINJAUAN PUSTAKA

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA CT-Pro PADA KOMODITAS EKSPOR DAN IMPOR SKRIPSI ELISA SEMPA ARIHTA KABAN

PENGEMBANGAN ALGORTIMA APRIORI UNTUK PENGAMBILAN KEPUTUSAN TEKNIK INFORMATIKA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Decision Support on Supply Chain Management System Using Apriori Data Mining Algorithm

Lili Tanti. STMIK Potensi Utama, Jl. K.L. Yos Sudarso Km. 6,5 No. 3A Tj. Mulia Medan ABSTRACT

DATA MINING UNTUK ANALISA PENJUALAN KERIPIK UD MARTOP PRATAMA MENGGUNAKAN ALGORITMA APRIORI

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

Analisis Efisiensi Algoritma Data Mining

BAB 2 LANDASAN TEORI

Pembuatan Perangkat Lunak Data Mining Untuk Penggalian Kaidah Asosiasi Menggunakan Metode Apriori

Analisa Data Mining Menggunakan Algoritma Frequent Pattern Growth Pada Data Transaksi Penjualan Restoran Joglo Kampoeng Doeloe Semarang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III METODE PENELITIAN. Metode penelitian merupakan suatu prosedur beserta tahapan-tahapan yang

Implementasi Data Mining Untuk Analisa Tingkat Pelanggaran Lalu Lintas Dengan Algoritma Association Rule

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN ALGORITMA APRIORI DALAM PERANGKAT LUNAK DATA BASE Amroni, S.Kom, M.Kom

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

PEMBUATAN PERANGKAT LUNAK DATA MINING UNTUK PENGGALIAN KAIDAH ASOSIASI MENGGUNAKAN METODE APRIORI

BAB I PENDAHULUAN 1.1 Latar Belakang

Perancangan dan Pembuatan Modul Data Mining Market Basket Analysis pada Odoo dengan Studi Kasus Supermarket X

BAB II TINJAUAN PUSTAKA

PENGEMBANGAN ALGORTIMA APRIORI UNTUK PENGAMBILAN KEPUTUSAN THE DEVELOPMENT APRIORI ALGORITHM FOR DECISION- MAKING

Link Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3)

BAB IV HASIL DAN UJICOBA. Penerapan Data Mining Market Basket Analysis Terhadap Data Penjualan Produk

Aplikasi Data Mining untuk meneliti Asosiasi Pembelian Item Barang di Supermaket dengan Metode Market Basket Analysis

PENERAPAN ASSOCIATION RULE DENGAN ALGORITMA APRIORI PADA TRANSAKSI PENJUALAN DI MINIMARKET SKRIPSI. Diajukan Untuk Memenuhi Sebagian Syarat Guna

FREQUENT ITEMSET MINING MENGGUNAKAN ALGORITMA DF-APRIORI

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

BAB 2 TINJAUAN PUSTAKA

Kata kunci : Perpustakaan, Sistem Rekomendasi, Knowledge Discovery from Database (KDD), Association Rule Mining, Algoritma CT-PRO

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

PENGGUNAAN ALGORITMA APRIORI UNTUK MENENTUKAN REKOMENDASI STRATEGI PENJUALAN PADA TOSERBA DIVA SKRIPSI

ANALISA DAN PERANCANGAN APLIKASI ALGORITMA APRIORI UNTUK KORELASI PENJUALAN PRODUK (STUDI KASUS : APOTIK DIORY FARMA)

BAB II TINJAUAN PUSTAKA

ASSOCIATION RULES PADA TEXT MINING

BAB III ANALISIS DAN DESAIN SISTEM

APLIKASI DATA MINING UNTUK POLA PERMINTAAN DARAH DI UDD ( UNIT DONOR DARAH ) PMI KOTA SURABAYA MENGGUNAKAN METODE APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

IMPLEMENTASI ALGORITMA FOLD-GROWTH PADA PEMODELAN POLA PEMBELIAN BARANG SEBAGAI PENDUKUNG PENENTUAN LETAK BARANG

II. TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

APLIKASI MONITORING KETERSEDIAAN STOK BARANG MINIMARKET DENGAN METODE MARKET BASKET ANALYSIS (MBA)

Perbaikan Struktur Weighted Tree dengan Metode Partisi Fuzzy dalam Pembangkitan Frequent Itemset

Prosiding Statistika ISSN:

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

PENGGALIAN POLA CLOSED SEQUENTIAL PADA BASIS DATA YANG BERTAMBAH SECARA BERTAHAP

Analisis asosiasi Penguasaan ICT Mahasiswa Baru dan Pencapaian Prestasi Akademik Mahasiswa dengan Algoritma Apriori.

PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN

PERBAIKAN STRUKTUR WEIGHTED TREE DENGAN METODE PARTISI FUZZY DALAM PEMBANGKITAN FREQUENT ITEMSET

PENCARIAN ASSOCIATION RULES PADA DATA LULUSAN MAHASISWA PERGURUAN TINGGI MENGGUNAKAN ALGORITMA FP-GROWTH SKRIPSI SHARFINA FAZA

ALGORITMA ATURAN ASOSIASI APRIORI-TID DENGAN METODE KLASTERISASI HIERARKI AGLOMERATIF. Tri Khairul I.A 1 ABSTRAK

BAB I PENDAHULUAN. 1.1 Latar Belakang

Implementasi data mining menggunakan metode apriori (studi kasus transaksi penjualan barang)

ANALISA POLA DATA HASIL PEMBANGUNAN KABUPATEN MALANG MENGGUNAKAN METODE ASSOCIATION RULE

Pengembangan Aplikasi Market Basket Analysis Menggunakan Algoritma Generalized Sequential Pattern pada Supermarket

SISTEM REKOMENDASI PENYEWAAN PERLENGKAPAN PESTA MENGGUNAKAN COLLABORATIVE FILTERING DAN PENGGALIAN ATURAN ASOSIASI

Transkripsi:

Vol. 5, No. 4, Juli 010 ISSN 016-0544 PENGGALIAN FREQUENT CLOSED ITEMSETS DENGAN MULTIPLE MINIMUM SUPPORT PADA BASISDATA RETAIL Endah Purwanti Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Airlangga Kampus C Unair, Jl. Mulyosari, Surabaya, 60115 E-Mail: endah_purwanti@unair.ac.id Abstrak Penggalian frequent pattern memegang peranan penting pada proses Association Rule Mining. Namun penggalian frequent pattern seringkali menghasilkan sejumlah besar frequent itemsets dan rule, sehingga mengurangi efisiensi dan keefektifan dari proses mining karena user harus menyaring sejumlah besar rule hasil penggalian untuk menemukan rule yang penting. Masalah ini dapat ditangani dengan melakukan proses penggalian rule hanya pada frequent closed itemsets. Dalam dunia retail, pihak manajemen dapat memanfaatkan pengetahuan hasil analisis dari basisdata penjualan untuk memahami pola kebutuhan pelanggan untuk membantu membuat keputusan bisnis. Analisis terhadap basisdata retail dalam jumlah yang besar bukanlah suatu pekerjaan yang mudah. Penggunaan minsup sama (tunggal) untuk semua item secara implisit mengasumsikan bahwa semua item pada basisdata memiliki sifat dan frekuensi yang sama. Padahal pada kenyataannya, item yang berbeda memiliki kriteria yang berbeda untuk mempertimbangkan kepentingannya. Multiple minimum support digunakan untuk menggambarkan sifat dasar dan frekuensi dari item yang ada. Penelitian ini menerapkan struktur MIS-tree untuk menggali frequent closed itemsets dengan menggunakan multiple minimum support. MIS-tree adalah struktur pohon yang dikembangkan serupa dengan struktur FP-tree. Hasil uji coba menunjukkan bahwa himpunan frequent closed itemsets dengan multiple minimum support mampu mereduksi jumlah redundant rule yang dihasilkan pada proses rule mining. Kata kunci: Data Mining, Association Rule Mining, Frequent Closed Itemsets, Multiple Minimum Support. Abstract Excavating of frequent pattern has significant role in process of Association Rule Mining. It, however, results in the number of frequent itemsets and rule which decreases the efficiency and effectiveness in mining process because the users have to filter a number of rules of excavating in order to get the important rule. The obstacles can also be handled by excavating rule process at the frequent closed itemsets. In addition, management in retail industry is able to consider the result of analysis for basis selling data to catch the users needs pattern to construct business policies. The analysis of retail database is not easy one since the use of single minsup for all the item implicitly assumes that all item in the database has sameness in character and frequency. In fact, the different item has distinction in criterion to consider its significance, and multiple minimum support used can describe the basis character and frequency of the items. This research is conducted to apply the structure of MIS-tree to excavate the frequent closed itemsets by using multiple minimum support. Alike structure of FP-tree, MIS-tree is diagram tree which is developed of FP-tree. The result shows that structure of frequent closed itemsets and multiple minimum sport are able to reduce a number of redundant rule resulted in rule mining process. Kata kunci: Data Mining, Association Rule Mining, Frequent Closed Itemsets, Multiple Minimum Support.

4 Jurnal Ilmiah KURSOR Vol. 5, No. 4, Juli 010, hlm. -9 PENDAHULUAN Data mining merupakan proses penggalian pola yang penting dan tersembunyi dari data yang sangat besar. Salah satu topik penting dalam data mining adalah Association Rule Mining. Association Rule Mining [1] digunakan untuk menemukan relasi antar item yang ada pada basisdata transaksi. Sejak Association Rule Mining dikenalkan, telah banyak penelitian yang dilakukan untuk menemukan metode yang efektif untuk melakukan penggalian frequent itemset. Penggalian frequent pattern mining seringkali menghasilkan sejumlah besar frequent itemsets dan rule. Hal ini mengurangi tidak hanya efisiensi namun juga keefektifan dari proses mining. Elemen kunci yang membuat Association Rule Mining dapat dijalankan adalah minimum support (minsup). Minsup digunakan untuk memangkas atau memperkecil ruang pencarian frequent itemset dan juga untuk membatasi jumlah rule yang akan dihasilkan. Penentuan nilai minsup yang tepat juga menjadi topik penelitian yang menarik. Terdapat alternatif yang menarik yang diajukan oleh Pasquier dkk [] sebagai ganti mining complete set dari frequent itemset. Association Rule Mining hanya diperlukan untuk menemukan frequent closed itemsets. Implikasi yang penting dari pernyataan tersebut adalah bahwa mining frequent closed itemsets memiliki kekuatan yang sama dengan mining complete set dari frequent itemsets. Mining frequent closed itemsets mampu mengurangi jumlah rule yang redundant yang dihasilkan sehingga menaikkan efisiensi dan keefektifan dari proses mining. Menggunakan single minsup secara implisit berarti mengasumsikan bahwa semua item pada basisdata memiliki sifat dan frekuensi yang sama. Akan tetapi tidak demikian yang belaku pada kenyataannya. Pada basisdata retail, umumnya item yang berhubungan dengan keperluan sehari-hari, barang konsumsi, dan barang-barang dengan harga rendah akan dibeli lebih sering daripada barang mewah atau barang dengan harga mahal. Pada situasi tersebut, jika minsup yang digunakan terlalu tinggi, maka semua pola yang ditemukan akan berhubungan dengan barang-barang harga murah. Padahal barang tersebut hanya memberikan keuntungan sedikit. Namun, jika minsup yang diberikan telalu rendah, maka rule yang dihasilkan akan sangat banyak, yang mungkin saja banyak yang tidak berguna. Hal ini akan menyebabkan kesulitan bagi pengambil keputusan untuk memahami pola yang ada yang dihasilkan dari data mining. Untuk menyelesaikan masalah tersebut, Liu dkk [] telah mengembangkan model association rule. Model ini memperbolehkan user untuk menggunakan multiple minimum support. Multiple minimum support itu sendiri digunakan untuk menggambarkan sifat dasar serta frekuensi yang berbeda dari item yang ada. Berdasarkan latar belakang permasalahan yang telah dijelaskan sebelumnya, maka penelitian ini melakukan penggalian frequent closed itemsets dengan menggunakan multiple minimum support. Penggalian akan dilakukan dengan menggunakan struktur Multiple Item Support Tree (MIS-Tree) dan Algoritma CLOSET [4]. MIS-tree merupakan struktur pohon yang dikembangkan serupa dengan struktur FP-tree untuk menyimpan informasi yang ringkas dan penting mengenai frequent pattern. Algoritma CLOSET merupakan algoritma untuk menggali frequent closed itemsets, namun dengan menggunakan single minimum support. ASSOCIATION RULE MINING Sebuah transaksi I = {i 1,i,i,,i d } adalah himpunan item yang ditransaksikan, sedangkan T = {t 1,t,t,,t n } adalah himpunan transaksi. Setiap transaksi t i terdiri dari item yang merupakan subset dari I. Sebuah itemset X adalah himpunan bagian tidak kosong dari I. Support dari sebuah itemset X, disimbolkan dengan sup(x), adalah jumlah transaksi yang mengandung itemset X. Association rule R: X Y adalah implikasi antara dua itemset X dan Y, dimana X, Y I dan X Y = Ø. Nilai support dari rule disebut dengan sup(x Y), didefinisikan sebagai sup(x Y). Confidence dari rule, disebut dengan conf(x Y), sup(x Y) didefinisikan sebagai. Untuk sup(x) menemukan association rule dari sebuah transaksi diperlukan nilai batasan yaitu minimum support (minsup) dan minimum confidence (minconf).

Purwanti, Penggalian Frequent Closed Itemsets 5 Frequent Closed Itemset Menurut Liu dkk [], sebuah itemset Y adalah closed itemsets jika Y adalah frequent dan tidak terdapat superset langsung Y Y sedemikian hingga sup(y ) = sup(y). Frequent itemsets sendiri adalah itemsets yang nilai support-nya lebih besar atau sama dengan minsup yang telah ditentukan. Misalkan diketahui sebuah transaksi I = {i 1,i,i,,i d } adalah himpunan item yang ditransaksikan dan T = {t 1,t,t,,t n } adalah himpunan transaksi. Setiap transaksi t i terdiri dari item yang merupakan subset dari I. Sebuah itemset X adalah himpunan bagian tidak kosong dari I. Support dari sebuah itemset X, disimbolkan dengan sup(x), adalah jumlah transaksi yang mengandung itemset X. Sebuah itemset Y adalah closed itemset jika Y adalah frequent itemset dan tidak terdapat superset langsung Y Y sedemikian hingga sup(y ) = sup(y). Frequent closed itemset yang dapat digali dari basisdata transaksi pada Tabel 1 adalah {f, c, b, fb, cb, cp, fcam, fcamp}. FP-Growth FP-tree merupakan pengembangan dari struktur prefix-tree untuk menyimpan frequent pattern yang telah dikompres. FP-growth menggunakan struktur FP-tree untuk menemukan himpunan lengkap dari frequent pattern. Algoritma FP-growth menghasilkan jumlah kandidat yang sedikit dan jumlah pembacaan dataset yang minimal sehingga waktu responnya cepat [4]. Sebuah FP-tree terdiri dari sebuah root yang berisi null, himpunan item prefix subtree sebagai anak dari root dan sebuah tabel header berisi frequent-item. Setiap node pada prefix subtree terdiri dari item-name, count, dan nodelink. Count menunjukkan jumlah transaksi pada basisdata yang menjadi bagian prefix yang direpresentasikan oleh node, dan node-link yang menghubungkan node ke node selanjutnya pada FP-tree yang memiliki itemname sama. Tabel header terdiri dari dua field yaitu item-name dan head of node-link. FP-tree hanya berisi beberapa item yang frequent yang telah diurutkan berdasarkan nilai support-nya. Setelah FP-tree terbentuk, Algoritma FPgrowth dijalankan secara rekursif untuk membangun conditional pattern base dan conditional FP-tree untuk setiap frequent item yang selanjutnya digunakan untuk mengenerate semua frequent itemset MIS-Tree Pada MIS-tree, definisi umum dari minimum support diubah. Secara umum nilai minsup adalah sama untuk semua item, namun pada model ini setiap item dalam basisdata dapat memiliki nilai minsup-nya sendiri-sendiri yang disebut dengan minimum item support (MIS). Artinya user dapat memberikan nilai MIS yang berbeda untuk item yang berbeda. Dengan memberikan nilai MIS yang berbeda untuk setiap item, maka hal tersebut akan merefleksikan sifat alamiah dari item itu sendiri dan mengakomodasikan adanya variasi frekuensi dalam basisdata. MIS-tree adalah pengembangan dari struktur FP-tree [5]. Ia merupakan struktur pohon yang digunakan untuk menyimpan frequent item dengan multiple minimum support. Multiple Item Support Misalkan I={a 1, a,..., a m } adalah himpunan item dan MIS(a i ) menunjukkan nilai MIS untuk item a i. Maka nilai MIS dari itemset A={a 1, a,..., a k } (1 k m) adalah: min[mis(a 1 ), MIS(a ),..., MIS(a k )] [5]. Sebagai contoh dalam basisdata terdapat item bread, shoes, dan clothes. Nilai MIS ditentukan MIS(bread) = %, MIS(shoes) = 0.1%, dan MIS(clothes) = 0,%. Jika nilai support dari itemset {clothes, bread} = 0,15%, maka itemset {clothes, bread} adalah infrequent dikarenakan nilai MIS dari itemset {clothes, bread} = min[mis(clothes), MIS(bread)] = 0,% (lebih besar dari 0,15%). Tabel 1. Basisdata Transaksi. TID Item Item terurut sesuai MIS 100 a c f m p f c a m p 00 a c d f m p f c a m p d 00 a b c f g m f c a b g m 400 b f i f b i 500 b c n p c b p n

6 Jurnal Ilmiah KURSOR Vol. 5, No. 4, Juli 010, hlm. -9 Tabel. Nilai MIS Tiap Item. Item F C A B G M P D I N MIS 4 (80%) 4 (80%) root F 4 f:4 c:1 C A 4 c: b:1 b:1 B G a: p:1 M m: b:1 p: g:1 m:1 Gambar 1. MIS-Tree Lengkap dan Kompak. ALGORITMA: Frequent Closed Itemsets dengan Multiple Minimum Support (FCI_MIS) INPUT: 1. database transaksi,. nilai MIS untuk setiap item,. MIS-tree OUTPUT: himpunan lengkap frequent closed itemsets METODE: Panggil fungsi FCI_MIS(MIS-tree, null) Procedure FCI_MIS(tree, f) { for f anggota tabel header do { bangun proyeksi MIS-tree β dengan prefiks f Update tabel header //Pangkas item yang //tidak frequent dan //Merge pohon setelah //dipangkas If tree β null then Panggil Get_FCI_MIS(tree β, f, MIS(f)) }} Procedure Get_FCI_MIS(tree, f, MIS(f)) { for f anggota header tabel do { buat conditional database dengan prefiks f Update tabel header If tree β null then { Panggil Get_FCI_MIS(tree β, f, MIS(f)) If f.support f.superset.support and f bukan subset dari frequent closed itemsets yang telah ditemukan Close=true; }}} Gambar. Algoritma Penggalian Frequent Closed Itemsets.

Purwanti, Penggalian Frequent Closed Itemsets 7 Tabel. Karakteristik Dataset. Dataset # Tuples # Item Mushroom 814 10 Gazelle 59601 498 T1014D100k 100k 49169 MIS-tree dilihat dari data transaksi pada Tabel 1 dengan nilai MIS tiap item pada Tabel. Langkah pertama adalah membuat tabel header yang berisi nilai MIS tiap item. Pada MIS-tree, item-item yang infrequent tetap dimasukkan dalam tabel header, namun nantinya akan dihapus pada proses pruning. Setiap item pada tabel header dihubungkan ke node pada tree yang mempunyai nama yang sama melalui head of node-link. Setelah tabel header terbentuk langkah selanjutnya adalah membuat root dengan nilai null. Transaksi pertama dibaca dari basisdata untuk membuat cabang pertama dari MIS-tree: ((f:1), (c:1), (a:1), (m:1), (p:1)). Transaksi kedua (f, c, a, m, p, d) memiliki prefix yang sama (f, c, a, m, p) dengan jalur yang sudah ada. Sehingga count dari setiap node sepanjang prefix dinaikkan 1 dan sisa item (d) pada transaksi kedua akan dibuatkan node baru sebagai anak dari node p:, dan demikian seterusnya sampai dengan transaksi dalam basisdata habis. Oleh karena dalam tabel header masih terdapat item yang tidak frequent, maka diperlukan sebuah proses pemangkasan (pruning). Item yang tidak frequent, yaitu {d, i, n}, terjadi karena nilai support-nya lebih kecil daripada nilai MIS. Struktur pohon juga mengalami penyesuaian karena penghapusan item-item tersebut dari tabel header. Setelah proses pemangkasan, dimungkinkan node-node dari MIS-tree mempunyai nama yang sama, sehingga perlu dilakukan proses penggabungan (merge). Untuk membuat bentuk kompak dilakukan penelusuran pada pohon dan ditemukan bahwa node (m:) mempunyai dua anak dengan nama yang sama yaitu p. Dilakukan penggabungan dua node tersebut menjadi sebuah node item-name = p, dan count diisi dengan jumlah count dari kedua node tersebut. Bentuk MIS-tree yang lengkap dan kompak dapat dilihat pada Gambar 1. Algoritma CLOSET Ide dasar untuk menggali frequent closed itemsets pada Algoritma CLOSET adalah dengan menggunakan teknik devide and conquer. Caranya adalah sebagai berikut: 1. Membuat conditional pattern base dan conditional FP-Tree untuk setiap item yang frequent secara bottom up dengan mengacu pada tabel header.. Mengulangi proses pada Langkah untuk setiap conditional FP-Tree yang terbentuk sampai dengan FP-Tree kosong atau tinggal memiliki 1 jalur saja. Conditional pattern base harus dibangun untuk semua item yang terdapat pada tabel header. Berdasarkan conditional FP-tree yang terbentuk, akan ditemukan kandidat frequent closed itemsets. Algoritma penggalian frequent closed itemsets dapat dituliskan seperti pada Gambar. HASIL DAN PEMBAHASAN Algoritma penggalian frequent closed itemsets ini diimplementasikan menggunakan Bahasa Pemrograman C++. Uji coba dilakukan dengan menggunakan dataset yang biasa digunakan untuk menguji Algoritma Association Rule Mining yaitu basisdata transaksi yang terdapat secara online. Untuk data uji coba dipilih dua jenis dataset yaitu sebuah dataset kecil dan tiga buah dataset besar yang diambil dari Pei dkk [4]. Pemberian nilai MIS menggunakan formula yang terdapat pada Persamaan (1) []. M ( ai ) M ( ai ) MIN MIS(a i ) = MIN untukyanglain M ( a i ) X S ( a i ) Dimana: S ( a i ) = support dari item a i MIN = nilai MIS terkecil dari semua item (1) ( 0 1) = parameter yang mengatur relasi antara MIS dengan support sebenarnya dari item-item yang terdapat pada basisdata. Jika σ = 0, maka hanya ada satu nilai MIS untuk semua item, yaitu sama dengan Association Rule Mining dengan menggunakan single minsup. Dataset besar yang digunakan yaitu T1014D100K, Mushroom, dan Gazelle. Masing-masing dataset tersebut memiliki

8 Jurnal Ilmiah KURSOR Vol. 5, No. 4, Juli 010, hlm. -9 karakteristik yang berbeda. Karakteristik dari dataset besar ini dituliskan pada Tabel. Masing-masing dataset disimpan dalam sebuah file teks dengan ekstensi txt dan memiliki format setiap baris pada file mewakili sebuah transaksi. Sebuah transaksi terdiri dari kumpulan kode item yang dipisahkan oleh spasi. Hasil dari uji coba penggalian frequent closed itemsets terhadap ketiga dataset tersebut terlihat pada Gambar. Uji coba dilakukan dengan memasukkan beberapa nilai T dan MIN yang berbeda. Pemberian nilai T yang tinggi menunjukkan bahwa nilai MIS yang digunakan juga tinggi. Nilai σ = 0 berarti bahwa minimum support yang digunakan adalah tunggal dikarenakan semua MIS diisi dengan nilai MIN. Sedangkan nilai σ = 1 menunjukkan bahwa MIS diisi dengan support dari setiap item, kecuali untuk item yang nilai support-nya lebih kecil dari MIN. Hasil uji coba pada Gambar menunjukkan bahwa jumlah frequent closed itemsets yang berhasil digali menurun selaras dengan kenaikan nilai MIS. Jumlah frequent closed itemsets yang dihasilkan adalah tinggi pada saat T = 0, yaitu ketika digunakan single minimum support. Pada T = 1, 0,8; dan 0,7; jumlah frequent closed itemsets yang ditemukan menurun. Penurunan yang tidak terlalu signifikan hanya terjadi pada dataset Gazelle. Hal tersebut dikarenakan item yang ada tersebar secara tidak merata pada dataset Gazelle. Berkurangnya jumlah frequent closed itemsets menunjukkan bahwa penggunaan multiple minimum support mampu menaikkan efisiensi dari proses penggalian aturan asosiasi. Hasil frequent closed itemsets ini akan digunakan dalam proses penggalian aturan asosiasi selanjutnya. Untuk memfasilitasi partisipasi item yang jarang, MIS untuk item jarang harus lebih kecil daripada support-nya. Hal ini dapat dilakukan dengan mengeset nilai σ sangat rendah. Namun demikian, proses tersebut mungkin menyebabkan frequent item juga akan di-set dengan nilai MIS yang kecil, sehingga akan menghasilkan sejumlah besar frequent itemsets. Gambar. Grafik Jumlah Frequent Closed Itemsets dengan Variasi Nilai T pada Ketiga Dataset.

Purwanti, Penggalian Frequent Closed Itemsets 9 SIMPULAN Pada penelitian ini dikembangkan algoritma untuk menggali frequent closed itemsets dengan menggunakan multiple minimum support. Algoritma yang dikembangkan menggunakan struktur Multiple Item Support Tree (MIS-tree) untuk menyimpan pola yang ringkas dan penting tentang frequent pattern, dan algoritma CLOSET untuk menggali frequent closed itemsets. Simpulan yang didapatkan adalah sebagai berikut: 1. Frequent closed itemsets yang berhasil digali memiliki jumlah dan kombinasi yang sama dengan frequent closed itemsets yang berhasil digali dengan menggunakan struktur lattice.. Jumlah frequent closed itemsets yang berhasil digali menurun ketika digunakan multiple minimum support. Hasil ini menunjukkan bahwa penggunaan multiple minimum support mampu menaikkan efisiensi, yaitu berkurangnya jumlah frequent closed itemsets yang berhasil digali yang akan berpengaruh pada proses penggalian aturan asosiasi selanjutnya. Untuk pengembangan lebih lanjut dari penelitian ini dapat dititikberatkan pada pemberian nilai MIS dengan menggunakan suatu formula tertentu yang mampu mengakomodasi kepentingan item-item yang jarang. Sebagai pertimbangan, mungkin dapat juga digunakan standar deviasi dari frekuensi kemunculan data sebagai variabel yang mempengaruhi nilai MIS. DAFTAR PUSTAKA [1] Agrawal R, Imielinski T, and Swami A. Mining association rules between sets of items in large databases. In Proc. 199 ACM-SIGMOD Int. Conf. Management of Data (SIGMOD 9). 07-16. 199. [] Pasquier N, Bastide Y, Taouil R, and Lakhal L. Discovering Frequent Closed Itemsets for association Rules. In Proc. 7th Int. Conf. Database Theory (ICDT 99). 98-416. 1999. [] Liu B, Hsu W, and Ma Y. Mining Association Rules with Multiple Minimum Support. Proceedings of the ACM SIGKDD In. Conf. on Knowledge Discovery and Data Mining (KDD-99). 7-41. 1999. [4] Pei J, Han J, and Mao R. CLOSET: An efficient algorithm for mining frequent closed itemsets. Proceedings of the 000 ACM SIGMOD Workshop on Research Issues in Data Mining and Knowledge Discovery. 000. URL: http://www.cs.sfu.ca/~pei/publications-byyear.htm, diakses tanggal 1 Maret 009. [5] Hu YH and Chen YL. Mining association rules with multiple minimum supports: a new mining algorithm and a support tuning mechanism. Decision Support Systems. 4: 1-4. 006.