Perbaikan Struktur Weighted Tree dengan Metode Partisi Fuzzy dalam Pembangkitan Frequent Itemset

dokumen-dokumen yang mirip
PERBAIKAN STRUKTUR WEIGHTED TREE DENGAN METODE PARTISI FUZZY DALAM PEMBANGKITAN FREQUENT ITEMSET

PENGEMBANGAN APLIKASI PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS PADA BASIS DATA RETAIL

PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS TANPA BATASAN MINIMUM SUPPORT PADA BASIS DATA RETAIL

PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI

Mining Association Rules dalam Basis Data yang Besar

2.2 Data Mining. Universitas Sumatera Utara

Link Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3)

BAB I PENDAHULUAN 1.1 Latar Belakang

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

Cust. 1 : milk, bread, cereal. Cust. 2 : milk, bread, Sugar, eggs. Cust. 3 : milk, bread, butter

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH PADA DATA TRANSAKSI PENJUALAN OBAT

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

ANALISA PENCARIAN FREQUENT ITEMSETS MENGGUNAKAN ALGORITMA FP-MAX

Penelitian ini melakukan pencarian

BAB 2 TINJAUAN PUSTAKA

BAB II LANDASAN TEORI. Anindita Dwi Respita,2015. a. Penelitian ini menjelaskan tentang tujuan : menggunakan metode market basket analysis.

ASSOCIATION RULES PADA TEXT MINING

PENDAHULUAN TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

ALGORITMA PARALEL FP-GROWTH UNTUK PENGGALIAN KAIDAH ASOSIASI PADA JARINGAN KOMPUTER

IMPLEMENTASI ALGORITMA FP- GROWTH MENGGUNAKAN ASSOCIATION RULE PADA MARKET BASKET ANALYSIS

PENGGALIAN FREQUENT CLOSED ITEMSETS DENGAN MULTIPLE MINIMUM SUPPORT PADA BASISDATA RETAIL

PENDAHULUAN. Latar Belakang

1. BAB I PENDAHULUAN 1.1. Latar Belakang ,

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

Implementasi Algoritme Modified-Apriori Untuk Menentukan Pola Penjualan Sebagai Strategi Penempatan Barang Dan Promo

SISTEM REKOMENDASI PAKET MAKANAN DENGAN ALGORITMA FP-GROWTH PADA RESTORAN SEAFOOD XYZ

BAB III METODE PENELITIAN. Metode penelitian merupakan suatu prosedur beserta tahapan-tahapan yang

SISTEM REKOMENDASI PEMESANAN SPAREPART DENGAN ALGORITMA FP-GROWTH (STUDI KASUS PT. ROSALIA SURAKARTA)

ASSOCIATION RULES PADA TEXT MINING

ANALISIS DAN IMPLEMENTASI ALGORITMA FP-GROWTH PADA APLIKASI SMART UNTUK MENENTUKAN MARKET BASKET ANALYSIS PADA USAHA RETAIL (STUDI KASUS : PT.

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

PREDIKSI KEBUTUHAN PENOMORAN PADA JARINGAN TELEKOMUNIKASI MENGGUNAKAN METODE APRIORI

2.1 Penelitian Terkait

Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi Penentuan Frequent Itemset

Journal of Informatics and Telecommunication Engineering. Analisa Algoritma Data Mining Eclat Dan Hui Miner

PENERAPAN ALGORITMA APRIORI DALAM PERANGKAT LUNAK DATA BASE Amroni, S.Kom, M.Kom

BAB 2 TINJAUAN PUSTAKA

ASSOCIATION RULE MINING UNTUK PENENTUAN REKOMENDASI PROMOSI PRODUK

ANALISA KONSISTENSI POLA PEMINJAMAN BUKU MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus: UPT Perpustakaan Universitas Sebelas Maret)

IMPLEMENTASI ALGORITMA APRIORI UNTUK MENEMUKAN FREQUENT ITEMSET DALAM KERANJANG BELANJA

Abstrak. Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris.

PENERAPAN METODE ASOSIASI GSP DAN APRIORI UNTUK STOK DAN REKOMENDASI PRODUK

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

Analisa Data Mining Menggunakan Algoritma Frequent Pattern Growth Pada Data Transaksi Penjualan Restoran Joglo Kampoeng Doeloe Semarang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Teknologi Informasi sekarang ini telah digunakan hampir di semua aspek

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

ALGORITMA ATURAN ASOSIASI APRIORI-TID DENGAN METODE KLASTERISASI HIERARKI AGLOMERATIF. Tri Khairul I.A 1 ABSTRAK

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

ASSOCIATION RULE. Rachmat Selamet. Sekolah Tinggi Manajemen Informatika dan Komputer LIKMI Jl. Ir. H. Juanda 96 Bandung 40132

PEMBANGKITAN KAIDAH ASOSIASI DARI TOP-K FREQUENT CLOSED ITEMSET YANG DIDASARKAN PADA STRUKTUR DATA BERBASIS LATTICE

BAB III METODOLOGI PENELITIAN

Implementasi Data Mining Untuk Analisa Tingkat Pelanggaran Lalu Lintas Dengan Algoritma Association Rule

BAB I PENDAHULUAN 1.1 Latar Belakang

Penggunaan Struktur FP-Tree dan Algoritma FP- Growth dalam Rekomendasi Promosi Produk pada Situs Belanja Online

IMPLEMENTASI DATA MINING DENGAN ALGORITMA APRIORI PADA TOKO BANGUNAN UD. RUFI SENTOSA JAYA SAMBIREJO - PARE

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Pencarian Frequent Itemset pada Analisis Keranjang Belanja Menggunakan Algoritma FP-Growth

IMPLEMENTASI ALGORITMA FOLD-GROWTH PADA PEMODELAN POLA PEMBELIAN BARANG SEBAGAI PENDUKUNG PENENTUAN LETAK BARANG

DAFTAR ISI Transformasi data... 47

TINJAUAN PUSTAKA Data Mining

REKOMENDASI SOLUSI PADA COMPUTER MAINTENANCE MANAGEMENT SYSTEM MENGGUNAKAN ASSOCIATION RULE, KOEFISEN KORELASI PHI DAN CHI-SQUARE

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

PENGGUNAAN ALGORITMA APRIORI UNTUK MENENTUKAN REKOMENDASI STRATEGI PENJUALAN PADA TOSERBA DIVA SKRIPSI

ANALISIS DATA POLA PEMBELIAN KONSUMEN DENGAN ALGORITMA APRIORI PADA TRANSAKSI PENJUALAN SUPERMARKET PAMELLA YOGYAKARTA 1.

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PEMBUATAN PERANGKAT LUNAK DATA MINING UNTUK PENGGALIAN KAIDAH ASOSIASI MENGGUNAKAN METODE APRIORI

ANALISIS KERANJANG PASAR UNTUK REKOMENDASI PRODUK (CONSUMER GOOD) MENGGUNAKAN FP-GROWTH DENGAN KLASTERISASI CLARANS

PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. retail di Indonesia pada semester I 2010 telah mencapai Rp 40 triliun. Omzet perusahaan

1 st Seminar on Application and Research in Industrial Technology, SMART Yogyakarta, 27 April 2006

Prosiding Statistika ISSN:

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

BAB II TINJAUAN PUSTAKA. Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam

PENGGUNAAN ALGORITHMA APRIORI DALAM MENGANALISA PRILAKU MAHASISWA DALAM MEMILIH MATA KULIAH ( STUDI KASUS : FKIP UPI YPTK )

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

ANALISA POLA DATA HASIL PEMBANGUNAN KABUPATEN MALANG MENGGUNAKAN METODE ASSOCIATION RULE

BAB II TINJAUAN STUDI DAN LANDASAN TEORI

IMPLEMENTASI ALGORITMA APRIORI PADA APOTEK RMC DALAM MENENTUKAN PERSEDIAAN OBAT

PENERAPAN DATA MINING UNTUK MENGETAHUI POLA ASOSIASI ANTARA DATA MAHASISWA DAN TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FOLD-GROWTH

PENGEMBANGAN ALGORTIMA APRIORI UNTUK PENGAMBILAN KEPUTUSAN THE DEVELOPMENT APRIORI ALGORITHM FOR DECISION- MAKING

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah Identifikasi Masalah Masalah Umum

PENDAHULUAN TINJAUAN PUSTAKA

Lili Tanti. STMIK Potensi Utama, Jl. K.L. Yos Sudarso Km. 6,5 No. 3A Tj. Mulia Medan ABSTRACT

BAB I PENDAHULUAN 1.1. Latar Belakang

IMPLEMENTASI ALGORITMA-ALGORITMA ASSOCIATION RULES SEBAGAI BAGIAN DARI PENGEMBANGAN DATA MINING ALGORITHMS COLLECTION

PENERAPAN DATA MINING UNTUK MENGOLAH DATA IMPOR EKSPOR IKAN DENGAN MENGGUNAKAN METODE ASSOCIATION RULE

ISSN : e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6833

BAB II LANDASAN TEORI

Transkripsi:

T E S I S Perbaikan Struktur Weighted Tree dengan Metode Partisi Fuzzy dalam Pembangkitan Frequent Itemset Oleh: Budi Dwi S (5106201001) Pembimbing Daniel O. Siahaan.S.Kom. M.Sc, PD.Eng Akhmad Saikhu, S.Si, M.Kom PROGRAM STUDI PASCA SARJANA JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INFORMASI INSTITUT TEKNOLOGI SEPULUH NOVEMBER SURABAYA 2010

2. LATAR BELAKANG MASALAH Generasi Kandidat 1.Pembangkitan Frequent Itemset Struktur Data Tree Apriori ECLAT Alg.FPGrowth FPTree Weighted Tree FWFP (WT) (2009) Alg.TFP WT Pretham Kumar FP pemetaan transaksi (Aug,2008) Algoritma: Apriori Pincer- Search Max-Miner DepthProject MAFIA GenMax Perbaikan pada Apriori : -Hash Based Itemset counting -Transaction Reduction -Partitioning -Sampling -Dynamic Itemset Counting -Direct hash pruning (2008) -FCCGM -FP with gradient (2009) Association Rule (AR) 2.Penggalian Kaidah Asosiasi WT dengan fuzifikasi (2009/2010) Penelitian ini Gambar 1. Penelitian tentang Association Rule

2. LATAR BELAKANG MASALAH Penelitian Pembangkitan Frequent itemset dilakukan oleh Pretham Kumar (Kumar, 2008) dengan tujuan menurunkan jumlah node yang digunakan FP Tree Permasalahan yang muncul pada penelitian tersebut adalah apabila variasi quantity terlalu tinggi, maka jumlah node meningkat. Untuk mengatasi kelemahan tersebut, penelitian ini menambahkan Metode Partisi Fuzzy pada weighted tree Hasilnya adalah apabila variasi quantity meningkat, jumlah node yang digunakan tetap minimal. Kata kunci : Association rule, Weighted tree, Metode Partisi Fuzzy

2. PERUMUSAN MASALAH Bagaimana cara mengurangi jumlah transaksi yang akan diolah Bagaimana cara mendapatkan penurunan jumlah node Bagaimana cara membangkitkan frequent itemset Batasan masalah adalah : Data ujicoba yang digunakan SPECTF Heart Data Pembangkitan frequent itemset

3. TUJUAN PENELITIAN Tujuan penelitian adalah memperbaiki Struktur data Weighted Tree dengan harapan mendapatkan penurunan jumlah node yang lebih baik saat pembangkitan frequent itemset Kontribusi utama penelitian adalah penurunan jumlah node dan Kontribusi pendukung mendapatkan balancing

4. KAJIAN PUSTAKA & DASAR TEORI Association Rule (AR) merupakan satu metoda untuk menemukan nilai hubungan antar produk dalam database transaksi. Implementasi Association Rule adalah analisa keranjang belanja Gambar 2. Analisa Keranjang belanja

4. KAJIAN PUSTAKA & DASAR TEORI Association Rule AR meliputi dua tugas utama 1. Frequent itemset generation : menemukan semua itemset yang memenuhi batasan threshold minsup 2. Rule generation : mengekstrak semua frequent itemset menjadi rule. Gambar 3. Association Rule

4. KAJIAN PUSTAKA & DASAR TEORI Langkah menyusun Weighted Tree meliputi 1. Konstruksi awal weighted tree 2. Kurangi Transaksi yang diolah 3. Mencari sequence order terbaik 4. Pembangkitan frequent itemset 1. Konstruksi awal Weighted Tree Dataset SPECTF Konversi ke bentuk quantity ID=ID Transaksi Weight=quantity Atribut= Item Tabel Count Weight Gambar 4. Konstruksi Senarai Weighted Tree

4. KAJIAN PUSTAKA & DASAR TEORI 2.Kurangi Transaksi 3. Sequence Order Tabel count weight Seleksi variabel; Kelas biner, TopK, Min_length, Probe item, weight probe, weight_min_support Senarai Weighted Tree (Label Fuzzy) Hitung jumlah item yang berbeda tiap item Hapus Transaksi yang hanya mengandung 1 item Urutkan item berdasar nilai count different item terkecil Projected database 4. Pembangkitan Frequent Itemset Projected database Sisipkan weight satu persatu urut transaksi sesuai sequence order yang telah dicari Frequent Weight Set Frequent item Set Rule generation Gambar 5. Konstruksi Senarai Weighted Tree

4. KAJIAN PUSTAKA & DASAR TEORI Metode Partisi Fuzzy Minimum Quartile bawah Medium Quartile Atas Maksimum Gambar 6. Metode Partisi Fuzzy

4. KAJIAN PUSTAKA & DASAR TEORI Metode Partisi Fuzzy Very Low Low Medium High Very High min max A B C D E Cmin ND ND ND ND Q1L ml Q1h Q2L mh Q2H Q1 med Q2 Cmax ND=NOT DEFINE NOT USAGE Gambar 7. Membership Function

4. KAJIAN PUSTAKA & DASAR TEORI Penggalian Kaidah Asosisasi frequent closed adalah itemset yang supersetnya memiliki count yang tidak sama dengan count itemset itu sendiri frequent maksimal karena superset langsungnya tidak frequent Gambar 8. Penggalian Kaidah Asosiasi

5. METODA PENELITIAN Tabel 1. Tabel Dataset SPECTF Tabel 2. Tabel Count Item Gambar 9. Metode Penelitian

5. METODOLOGI PENELITIAN Tabel 3. Projected Database Jika ada1 transaksi hanya mengandung1 item saja, maka hapus nomor transaksi Jika weight item < weight minimum support, maka hapus quantity item

5. METODOLOGI PENELITIAN Serial Node Weighted Tree Pretham Kumar Serial Node Weighted Tree penelitian ini item Weight quantity Label Fuzzy Rute terpendek Gambar 6. Senarai Weighted Tree Senarai Weighted Tree (Label Fuzzy) Hitung jumlah LABEL item yang berbeda tiap item Urutkan item berdasar nilai count different item terkecil Gambar 10. Rute pendek

5. METODOLOGI PENELITIAN Penelitian Pretham Kumar Penelitian ini Waktu proses Gambar 11. Perbandingan penelitian

5. METODOLOGI PENELITIAN Gambar 12. Rule generation

6. UJICOBA Skenario pertama adalah Skenario ujicoba weighted tree. 1. Ujicoba Weighted Tree dengan K=4 2. Ujicoba Weighted Tree dengan K=8 3. Ujicoba Weighted Tree dengan K=10 4. Ujicoba Weighted Tree dengan K=14 Skenario kedua Analisa Perbandingan dengan hasil penelitian sebelumnya. 1. Prosentase Penurunan jumlah node partisi fuzzy terhadap jumlah node pretham kumar 2. Prosentase Penurunan jumlah node partisi fuzzy terhadap jumlah node FP Tree 3. Pengaruh K terhadap jumlah serial node. 4. Pengaruh K terhadap Jumlah Saving Node. 5. Pengaruh Minimum Length terhadap jumlah node setelah partisi fuzzy. 6. Pengaruh jumlah node saat nilai K maksimum. 7. Pengaruh K terhadap perbandingan waktu proses. Skenario ketiga Analisa Hasil Ujicoba dataset 1. Pengaruh K terhadap jumlah transaksi yang memenuhi syarat. 2. Pengaruh K terhadap jumlah serial node. 3. Pengaruh K terhadap waktu proses. 4. Pengaruh Weight Minimum support terhadap jumlah transaksi yang memenuhi syarat. 5. Pengaruh Weight Minimum support terhadap jumlah serial node. 6. Pengaruh Weight Minimum support terhadap waktu proses Karakteristik dataset SPECTF Heart Data Gambar 13. Karakteristik dataset

7. ANALISA HASIL UJICOBA Penurunan rata rata 30.7% Terhadap jumlah node Penelitian Pretham Kumar Penurunan rata rata 35.78% Terhadap FP Tree Gambar 14. Perbandingan penurunan Jumlah node

7. ANALISA HASIL UJICOBA 1.Pengaruh K terhadap jumlah transaksi yang memenuhi syarat 3.Pengaruh K terhadap waktu proses 2.Pengaruh K terhadap jumlah serial node 4.Pengaruh weight minimum support terhadap jumlah transaksi yang memenuhi syarat Gambar 15. Analisa Hasil 1

7. ANALISA HASIL UJICOBA 1.Pengaruh K terhadap jumlah node dan prosentase penurunan dari penelitian sebelumnya 3. Perbandingan jumlah node penelitian 2.Pengaruh minimum length terhadap jumlah transaksi yang memenuhi syarat 4. Perbandingan waktu proses penelitian Gambar 16. Analisa Hasil 2

7. ANALISA HASIL UJICOBA Tabel 5. Analisa Hasil Nilai penurunan jumlah node pada penelitian ini yaitu 4855 terhadap jumlah node FPTree 7729, sehingga didapatkan penurunan jumlah node pada penelitian ini (saat K maksimum) = (1-(4855 /7729))%= 37.18% Nilai penurunan jumlah node merupakan perbandingan jumlah node setelah dilakukan partisi fuzzy dan penelitian Pretham Kumar. Hasil penelitian ini dapat menaikkan prosentase penurunan jumlah node penelitian Pretham Kumar dari 13.9% menjadi 37.18% yang artinya meningkatkan efisiensi komputasi sebesar 1-(13.9/37.18) = 63%.

8. KESIMPULAN 1.Penelitian ini memberikan kontribusi berupa penurunan jumlah node karena adanya penambahan metode partisi fuzzy pada struktur data weighted tree. Adapun besarnya angka penurunan jumlah node ratarata mencapai 30.7% terhadap penelitian Pretham kumar dan 35.78% terhadap FPTree. 2.Dengan menurunkan jumlah node pada proses pembangkitan frequent itemset akan didapatkan nilai big operation yang lebih baik pada proses pembacaan dari segi perhitungan waktu dan space yang digunakan. 3.Dari hasil ujicoba dataset, didapatkan bahwa nilai weight minimum support berbanding terbalik dengan jumlah transaksi, jumlah node dan waktu proses. Artinya jika nilai weight minimum support rendah maka jumlah transaksi, jumlah node dan waktu proses meningkat. Pemilihan nilai weight minimum support yang tepat sangat diperlukan untuk mendapatkan hasil yang diinginkan pengguna. 4.Hasil uji coba adalah frequent itemset yang dibangkitkan berdasarkan nilai weight berupa quantity item pada struktur weighted tree dengan pertimbangan batasan nilai support dan confidence.

9. DAFTAR PUSTAKA 1. Anbalagan E, Mohan E, dan Puttamadappa C. (2009), Building E-shop using Incremental Association Rule Mining and transaction clustering, International journal of Computational Inteligent Research, ISSN 0973-1873, Vol. 5, No. 1, hal. 11-23. 2. Kumar P dan Ananthanarayana. (2008), Discovery of frequent itemsets using weighted tree approach, IJCSNS International Journal of Computer Science and Network Security, Vol. 8 No.8, hal. 195-200. 3. Lin, R.H., Chuang, C.L., Liou, J.H, dan Wu, G.D. (2008), An integrated method for finding customers in CRM. Expert Systems with Applications, Entry from http://www.sciencedirect.com/science). 4. Jian, W dan Ming, L.X (2008), An Effective Mining Algorithm for weighted Association Rules in Communication Network, Journal of Computers, Vol. 3, No. 10, hal. 20-27. 5. Wang, C.H dan Pang, C.T (2009), Finding Fuzzy Association Rules using FWFP Growth with Linguistic Supports and Confidences, World Academy of Science, Engineering and Technology No. 53, hal. 1139-1147. 6. Rahman, A.M, Ashkan Z, Masoud R, dan Mostafa, H.C (2006), Complete Discovery of Weighted Frequent Subtrees in Tree-StructuredDatasets, IJCSNS International Journal of Computer Science and Network Security, Vol. 6 No. 8A, hal. 188-196. 7. Absari, Dhiani Tresna (2008), Penggalian Top-K Frequent Closed Constrained Gradient itemsets pada basis data retail, Entry from http://mmt.its.ac.id/library/?p=4737.

TERIMA KASIH *

4. KAJIAN PUSTAKA & DASAR TEORI 1. Probe item merupakan item acuan untuk mengetahui tingkat asosiasi item lain, item ini adalah item terpilih karena memiliki nilai count tertinggi dan dipilih yang memiliki acuan weight quantity sama dalam tiap transaksinya. 2. Top-K item merupakan Urutan item berdasar nilai count tertinggi dan hampir selalu muncul dalam tiap transaksi. 3. Top-K Frequent item merupakan Urutan frequent item dengan nilai count tertinggi yang dihasilkan weighted tree 4. Projected database merupakan kumpulan id transaksi, nama item dan quantity yang akan dicari nilai asosiasinya. Itemnya adalah item total dikurangi probe item. 5. Minimum length merupakan batas minimum jumlah item dalam 1 transaksi yang akan dipantau tingkat asosiasinya. 6. Weight minimum support adalah batas maximum pembelanjaan yang memenuhi syarat yang telah ditentukan.

6. UJICOBA 1. Kode Biner = 1 Top K item = 04 Min length = 10 Probe Item = i67 W_MinSupp = 1 2. Senarai Weighted Tree Transaksi yang harus dihapus adalah TrID = 9, TrID = 19, TrID = 43, TrID = 53, TrID = 76, TrID = 154, i68 E->D->D->D->D->E->E->E->E->E->E->D->D->E->E->D->C->E->E->D-> i70 C->E->E->E->E->E->C->D->D->E->D->B->D->D->B->E->C->C->D->E->D->E-> i66 D->D->D->D->E->D->C->D->D->D->C->D->D->D->D->E->D->D->D-> i75 C->E->E->D->D->E->E->E->E->D->E->D->E->E-> 3. Rute Terpendek 4. Rule Generation Gambar 17. WT dengan K=4

6. UJICOBA 1, Nilai TopK=08, Min_length=10, Probeitem=i67,Weight_min_sup=1 2. Senarai Weighted tree {root} 3. Rute terpendek A:1 D:7 B:2 C:8 C:6 E:10 C:4 D:48 4. Rule generation i72,i74,i61 D:7 D:9 E:42 D:9 E:10 I68,i66,i75, i71, i65, i69 i70 Gambar 18. WT dengan K=8

6. UJICOBA 1. Kode Biner = 1 Top K item =10 Min length = 10 Probe Item = i67 W_MinSupp = 1 2. Senarai Weighted Tree i68 E->D->D->D->D->E->E->E->E->E->E->D->D->E->E->D->C->E->E->D-> i70 C->E->E->E->D->E->E->C->D->D->D->E->D->B->D->D->B->E->C->E->C->D->E->D->Ei66 D->D->D->D->E->D->D->C->D->D->D->C->D->D->D->D->E->D->D->D-> i75 C->E->E->D->D->E->E->E->E->D->E->D->E->E-> i72 D->E->E->E->D->D->E->D->D->D->E->E->E->E->D->E->E-> i71 D->E->D->C->D->D->E->E->D->D->E->E->D->C->E->D->C->E->E->E->D->E-> i65 D->D->E->D->E->D->D->D->D->E->E->D->E->E->D->E->C->E->D->D->E->E-> i69 D->C->E->C->E->D->E->C->A->C->D->E->D->E->E->D->E->D->C->E->C->E->D-> i74 E->E->E->E->E->D->E->E->D->E->D->D->D->E->E->E-> i64 E->E->D->E->D->C->D->E->D->D->E->E->E->D->D->D->E->D->D-> 3. Rule Generation Gambar 19. WT dengan K=10

6. UJICOBA 1. Kode Biner = 1 Top K item =14 Min length = 10 Probe Item = i67 W_MinSupp = 1 2. Senarai Weighted Tree dengan Count Item i68,1=>di68,8=>ei68,11=>nolf, Bi70,2=>Ci70,4=>Di70,9=>Ei70,10 Ci66,2=>Di66,16=>Ei66,2=>NoLf, Ci75,1=>Di75,4=>Ei75,9=>NoLf, Di72,7=>Ei72,11=>NoLf,=>NoLf, Ci71,3=>Di71,9=>Ei71,10=>NoLf, Ci65,1=>Di65,11=>Ei65,10=>NoLf, Ai69,1=>Ci69,6=>Di69,7=>Ei69,9 Di74,5=>Ei74,11=>NoLf,=>NoLf, Ci64,1=>Di64,10=>Ei64,8=>NoLf, Ci62,1=>Di62,8=>Ei62,4=>NoLf, Di61,8=>Ei61,11=>NoLf,=>NoLf, Ci63,2=>Di63,3=>Ei63,12=>NoLf, Ci73,4=>Di73,9=>Ei73,5=>NoLf, DE Frequent Closed 3. Rule Generation CDE Frequent Maximal Gambar 20. WT dengan K=14

Lampiran 1 Gambar 21. Penggalian Weight Frequent set

Lampiran 2 Perbandingan waktu Gambar 22. Perbandingan waktu

Lampiran 3 Perbandingan cost Gambar 23. Perbandingan cost (descendant)

Lampiran 3 Perbandingan cost {root} {root} E:9 E:10 E:50 E:21 4x1 E 1x1 D:7 D:9 D:58 D:12 4x2 D 1x2 i72, i74 C:6 C:4 C:9 3x3 C 1x3 I68,i66,i75,i71,i65,i64 A:1 B:2 2x4 A B i69 i70 29/13=2.23 14/5=2.8 Gambar 24. Perbandingan cost node

Lampiran 4 Perbandingan jumlah transaksi terhadap waktu K=20, Wmin_supp=1, Min_length=10 Gambar 25. Perbandingan waktu proses

Lampiran 5 Perbandingan waktu terhadap K Gambar 26. Perbandingan waktu proses java dan PHP

Sifat Basis Data : Sparse Database / Basis Data jarang Type KDD 1. AR 2. Classification 3. Squential Pattern 4. Pattern with Time Series 5. Categorization&Segmentation Function KDD 1. Prediction 2. Identification Pattern 3. Classification Partition 4. Optimization Istilah Market Basket Analysis Merupakan penerapan AR pada database transaksi Anbalagan,2009 Transaction Clustering Lin, 2008 start Kumpulan Itemname dan ID Transaksi Interisting Measure Penentuan batasan Minimum Support, confidence dan gradient (Fuzzy Set) Tanpa Batasan gradient minimum Support (Wang 2006) FCCGM (Wang,2006) Alg TFP Close node count saat penyisipan Descendant sum saat terbentuk ditambah formulasi query untuk Han,2005 Absari, 2008 Metode: 1. Ancor Node Descendant sum 2. Close node count Array 1.Urut Count 2.Urut Gradient Candidate generation Perbaikan Association Rule 1.Freq Item Gen Kelompok Transaksi Kumar,2008 Majeed,2008 Transaksi Beda Hari Penelusuran Apriori Dan FP Tree Pencarian Frequent ItemSet Analisa Korelasi (Causality Analysis) 1. Count Support of candidate 2. Prunning Leaf Node 3. Kriteria node, pemangkasan 4. Subset generation Improving Apriori : -Hash Based Itemset counting -Transaction Reduction -Partitioning -Sampling Dynamic Itemset Counting Absari,2008 Metode: yang ada Closet Closet+ TF2P Top-K Mining DCI Closed 2.Rule Generation Penggalian Kaidah Asosiasi (Closed) Frequent Closed And Rule Generation Frequent Closed And Rule Generation Meliputi: 1. Header Table 2. Conditional pattern base 3. Conditional weighted tree AR : 1. Freq Item gen Generate All support >=minsupp Ex:closed, brute force 2. Rule generation From freq itemset, each rule is binary partition of freq itemset Freq itemset <> AR If freq itemset=x B=X-A A->B menjadi AR jika 1. conf(a B) >=minconf 2. supp(a B)= supp(aub)=supp(x) 3. conf(a B)=supp(AUB)/supp(A) 1. Freq Closed Itemset - Urutan Top Down - Urutan Bottom Up 2. Pemangkasan daerah pencarian -Item Merging -Prefix itemset skipping 3. pemeriksaan ItemSet Closed Penggalian Itemset Frequent 1. BFS : Apriori 2. DFS : Eclat Output: 1. Frequent Closed 2. frequent Maximal Konsep penggalian TFP: 1. Inisialisasi Awal 2. Penentuan min_l dan k 3. Penyusunan Tabel Global Header 4. Pembentukan Fptree membangkitkan close count node dan descendant sum 5. Penggalian Top K Frequent Closed dengan Mine Cond FPTree secara bottomup dan rekursif Frequent Closed And Rule Generation end Kontribusi umum: 1. Meningkatkan efisiensi penelusuran dg weighted tree 2. validasi konsistensi dengan korelasi 3. Prunning dataset yang diolah Kontribusi pribadi: 1. Menggabungkan metode 2. Menggunakan dataset real 3. korelasi beda hari Gambar 27. Usulan Proposal thesis