Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi Penentuan Frequent Itemset

dokumen-dokumen yang mirip
Penggunaan Struktur FP-Tree dan Algoritma FP- Growth dalam Rekomendasi Promosi Produk pada Situs Belanja Online

SISTEM REKOMENDASI PAKET MAKANAN DENGAN ALGORITMA FP-GROWTH PADA RESTORAN SEAFOOD XYZ

2.2 Data Mining. Universitas Sumatera Utara

BAB II LANDASAN TEORI. Anindita Dwi Respita,2015. a. Penelitian ini menjelaskan tentang tujuan : menggunakan metode market basket analysis.

PENDAHULUAN TINJAUAN PUSTAKA

ALGORITMA PARALEL FP-GROWTH UNTUK PENGGALIAN KAIDAH ASOSIASI PADA JARINGAN KOMPUTER

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH PADA DATA TRANSAKSI PENJUALAN OBAT

IMPLEMENTASI ALGORITMA FP- GROWTH MENGGUNAKAN ASSOCIATION RULE PADA MARKET BASKET ANALYSIS

Implementasi Data Mining Untuk Analisa Tingkat Pelanggaran Lalu Lintas Dengan Algoritma Association Rule

SISTEM REKOMENDASI PEMESANAN SPAREPART DENGAN ALGORITMA FP-GROWTH (STUDI KASUS PT. ROSALIA SURAKARTA)

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

Association Rule Dengan FP-Tree dan FP Growth

BAB 2 TINJAUAN PUSTAKA

PENETAPAN POLA KONSUMEN MENGGUNAKAN ALGORITMA FREQUENT PATTERN GROWTH PADA CROSS MARKET ANALYSIS

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

ANALISA PENCARIAN FREQUENT ITEMSETS MENGGUNAKAN ALGORITMA FP-MAX

BAB II TINJAUAN PUSTAKA

Analisa Data Mining Menggunakan Algoritma Frequent Pattern Growth Pada Data Transaksi Penjualan Restoran Joglo Kampoeng Doeloe Semarang

BAB I PENDAHULUAN 1.1 Latar Belakang

Mining Association Rules dalam Basis Data yang Besar

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

Teknik Pembangkitan Kode Huffman

Penggunaan Algoritma Divide and Conquer Dalam Pewarnaan Graf

Penerapan strategi runut-balik dalam penyelesaian permainan puzzle geser

Pendekatan Algoritma Divide and Conquer pada Hierarchical Clustering

BAB I PENDAHULUAN. Teknologi Informasi sekarang ini telah digunakan hampir di semua aspek

Penggunaan Pohon Keputusan untuk Data Mining

Penerapan Pohon Keputusan pada Pemilihan Rencana Studi Mahasiswa Institut Teknologi Bandung

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

PENERAPAN DATA MINING UNTUK ANALISIS POLA PEMBELIAN KONSUMEN DENGAN ALGORITMA FP- GROWTH PADA DATA TRANSAKSI PENJUALAN SPARE PART MOTOR

BAB 2 TINJAUAN PUSTAKA

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

Abstrak. Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris.

BAB I PENDAHULUAN 1.1. Latar Belakang

IMPLEMENTASI ALGORITMA-ALGORITMA ASSOCIATION RULES SEBAGAI BAGIAN DARI PENGEMBANGAN DATA MINING ALGORITHMS COLLECTION

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Penggunaan Graf pada Pemetaan Genetik dan Integrasi Peta Genetik

Analisis Pola Hubungan Antara Konsumsi Listrik Dengan Temperatur dan Fitur Geografi Menggunakan Association Rule Mining

Penerapan Algoritma Branch and Bound pada Penentuan Staffing Organisasi dan Kepanitiaan

Penggunaan Pohon Huffman Sebagai Sarana Kompresi Lossless Data

2.1 Penelitian Terkait

PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS TANPA BATASAN MINIMUM SUPPORT PADA BASIS DATA RETAIL

PENERAPAN DATA MINING UNTUK MENGETAHUI POLA ASOSIASI ANTARA DATA MAHASISWA DAN TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FOLD-GROWTH

PENENTUAN LOKASI BARANG PADA A Swalayan MENGGUNAKAN ASSOCIATION RULE DENGAN ALGORITMA FP-GROWTH

BAB 1 PENDAHULUAN Latar Belakang

ANALISA POLA DATA HASIL PEMBANGUNAN KABUPATEN MALANG MENGGUNAKAN METODE ASSOCIATION RULE

BAB II LANDASAN TEORI

PENENTUAN POLA YANG SERING MUNCUL UNTUK PENERIMA KARTU JAMINAN KESEHATAN MASYARAKAT (JAMKESMAS) MENGGUNAKAN METODE FP-GROWTH

ANALISA POLA PEMILIHAN PROGRAM STUDI BAGI CALON MAHASISWA DI UNIVERSITAS ABDURRAB MENGGUNAKAN ASSOCIATION RULE

ANALISA KONSISTENSI POLA PEMINJAMAN BUKU MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus: UPT Perpustakaan Universitas Sebelas Maret)

Aplikasi Pohon Prefix pada Pencarian Kontak di

TINJAUAN PUSTAKA Data Mining

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

Jurnal Sistem Informasi (Journal of Information Systems). 2/13 (2017), DOI:

Aplikasi Pohon dan Graf dalam Kaderisasi

I. PENDAHULUAN. 1.1 Permainan Rush Hour

Cust. 1 : milk, bread, cereal. Cust. 2 : milk, bread, Sugar, eggs. Cust. 3 : milk, bread, butter

Pohon Biner Sebagai Struktur Data Heap dan Aplikasinya

Pohon Quad untuk Merepresentasikan Gambar

Implementasi Algoritma Runut Balik dalam Pengenalan Citra Wajah pada Basis Data

Aplikasi Pohon pada Pohon Binatang (Animal Tree)

ANALISIS DAN IMPLEMENTASI ALGORITMA FP-GROWTH PADA APLIKASI SMART UNTUK MENENTUKAN MARKET BASKET ANALYSIS PADA USAHA RETAIL (STUDI KASUS : PT.

PENGGALIAN TOP-K CLOSED FREQUENT ITEMSETS BERBASIS ALGORITMA PEMETAAN TRANSAKSI

Aplikasi Pohon dan Logika pada Variasi Persoalan Koin Palsu

DATA MINING UNTUK MENGGALI POLA MAHASISWA BARU MENGGUNAKAN METODE FREQUENT PATTERN GROWTH (STUDI KASUS : INSTITUT TEKNOLOGI ADHI TAMA SURABAYA)

BAB 2 TINJAUAN PUSTAKA

PERBANDINGAN ALGORITMA HUFFMAN DENGAN ALGORITMA SHANNON-FANO

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Penerapan Pengkodean Huffman dalam Pemampatan Data

METODE POHON BINER HUFFMAN UNTUK KOMPRESI DATA STRING KARAKTER

BAB 2 LANDASAN TEORI

BAB III ANALISIS. Mekanisme Penyimpanan dan Pengambilan Sequence

ANALISA POLA PEMILIHAN PROGRAM STUDI BAGI CALON MAHASISWA DI UNIVERSITAS ABDURRAB MENGGUNAKAN ASSOCIATION RULE

PENDAHULUAN. Latar Belakang

PENGEMBANGAN ALGORTIMA APRIORI UNTUK PENGAMBILAN KEPUTUSAN THE DEVELOPMENT APRIORI ALGORITHM FOR DECISION- MAKING

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

Penyandian (Encoding) dan Penguraian Sandi (Decoding) Menggunakan Huffman Coding

ASSOCIATION RULES PADA TEXT MINING

PENGEMBANGAN APLIKASI PENGGALIAN TOP-K FREQUENT CLOSED CONSTRAINED GRADIENT ITEMSETS PADA BASIS DATA RETAIL

Perbandingan Algoritma Depth-First Search dan Algoritma Hunt-and-Kill dalam Pembuatan Labirin

BAB IV HASIL DAN PEMBAHASAN. Sumber data utama yang digunakan dalam penelitian ini berasal dari data

TUGAS MAKALAH INDIVIDUAL. Mata Kuliah : Matematika Diskrit / IF2153 Nama : Dwitiyo Abhirama NIM :

Penyelesaian Permainan Sliding Puzzle 3x3 Menggunakan Algoritma Greedy Dengan Dua Fungsi Heuristik

Pembahasan Pencarian Lintasan Terpendek Menggunakan Algoritma Dijkstra dan A*

Menentukan Titik Evakuasi Selanjutnya bagi Sekelompok Regu Tim SAR dengan Algoritma Branch and Bound

DATA MINING UNTUK MENGGALI POLA MAHASISWA BARU MENGGUNAKAN METODE FREQUENT PATTERN GROWTH (STUDI KASUS : INSTITUT TEKNOLOGI ADHI TAMA SURABAYA)

Aplikasi Graf pada Persoalan Lintasan Terpendek dengan Algoritma Dijkstra

Analisis Market Basket Dengan Algoritma Apriori dan FP-Growth

PENGGALIAN FREQUENT CLOSED ITEMSETS DENGAN MULTIPLE MINIMUM SUPPORT PADA BASISDATA RETAIL

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

MODEL SISTEM PENDUKUNG KEPUTUSAN DALAM PENENTUAN MATAKULIAH PILIHAN DI JURUSAN TEKNIK INFORMATIKA UNIKOM. Oleh Dian Dharmayanti

BAB I PENDAHULUAN. frekuensi tinggi antar himpunan itemset yang disebut fungsi Association

Algoritma Heap Sort. Sekolah Teknik Elektro & Informatika Departemen Teknik Informatika, Institut Teknologi Bandung Jl. Ganesha 10, Bandung

PENGELOMPOKAN DOKUMEN MENGGUNAKAN ALGORITMA DIG (DOCUMENT INDEX GRAPH)

Penerapan Pohon dengan Algoritma Branch and Bound dalam Menyelesaikan N-Queen Problem

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA

ANALISIS KINERJA ALGORITMA FOLD-GROWTH DAN FP-GROWTH PADA PENGGALIAN POLA ASOSIASI

Transkripsi:

Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi Penentuan Frequent Itemset David Samuel/NIM :13506081 1) 1) Program Studi Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung Jl. Ganesha 10, Bandung E-mail : david_samuel@students.itb.ac.id Abstrak - Pengolahan data secara cepat, efisien dan efektif sangat diperlukan oleh manusia seiring dengan perkembangan zaman. Sedangkan di sisi lain, data mentah yang memerlukan pemrosesan jumlahnya sangat banyak sehingga tidak memungkinkan lagi dilakukan pengolahan data secara manual. Untuk mengatasi masalah tersebut, telah ditemukan beragam struktur penyimpanan data yang berusaha untuk memperbaiki efisiensi pengolahan dan penggalian data, terutama dalam membangun sebuah struktur data dan mencari frequent itemset dalam sebuah database. Beberapa studi terakhir menggunakan pendekatan paradigma apriori, yang menggunakan metode candidate set generation. Akan tetapi, untuk masukan data yang besar, paragdigma apriori dianggap belum cukup efektif dan efisien. Dalam makalah ini akan dibahas pembangunan dan aplikasi penggunaan struktur data pohon, yaitu FPtree (Frequent Pattern Tree), yang merupakan perluasan dari penggunaan pohon dalam struktur data. FP-tree digunakan bersamaan dengan algoritma FP-growth untuk menentukan frequent itemset (data yang paling sering muncul) dari sebuah database, berbeda dengan paradigma apriori yang memerlukan langkah candidate generation, yaitu dengan melakukan scanning database secara berulang-ulang untuk menentukan frequent itemset. Makalah ini juga menyajikan pembahasan mengenai perbandingan kompleksitas waktu antara algoritma FP-growth dan beberapa metode frequent pattern mining lainnya. Kata Kunci : algoritma, apriori, FP-Tree, Fp-Growth, frequent pattern mining, frequent itemset 1. PENDAHULUAN Penggalian data merupakan salah satu cara yang cukup efektif untuk mengetahui adanya serangkaian pola informasi dari sejumlah besar data yang ada. Pola informasi yang didapat akan menjadi sangat berarti apabila bersifat implisit, belum diketahui sebelumnya, dan bermanfaat. Pola asosiasi menjadi salah satu fungsionalitas yang paling menarik dalam penggalian data. Dikatakan menarik karena sudah banyak dipakai dalam kehidupan manusia sehari-hari, terutama yang berhubungan dengan data transaksi, misalnya kegiatan e-commerce. Pola asosiasi akan memberikan gambaran mengenai sejumlah atribut, atau sifat tertentu yang sering muncul bersamaan dalam kumpulan data yang diberikan. FP-Growth adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data. FP-growth menggunakan pendekatan yang berbeda dari paradigma yang selama ini sering digunakan, yaitu paradigma apriori. Paradigma apriori yang dikembangkan oleh Agrawal dan Srikan (1994), yaitu anti-monotone Apriori Heuristic: Setiap pola dengan panjang pola k yang tidak sering muncul (tidak frequent) dalam sebuah kumpulan data, maka pola dengan panjang (k+1) yang mengandung sub pola k tersebut tidak akan sering muncul pula(tidak frequent). Ide dasar paradigma apriori ini adalah dengan mencari himpunan kandidat dengan panjang (k+1) dari sekumpulan pola frequent dengan panjang k, lalu mencocokkan jumlah kemunculan pola tersebut dengan informasi yang terdapat dalam database. Adapun hal ini akan mengakibatkan algoritma apriori akan melakukan scanning database yang berulangulang, apalagi jika jumlah data cukup besar. Berbeda dengan Algoritma FP-growth yang hanya memerlukan dua kali scanning database untuk menentukan frequent itemset. Struktur data yang digunakan untuk mencari frequent itemset dengan algoritma FP-growth adalah perluasan dari penggunaan sebuah pohon prefix, yang biasa disebut adalah FP-tree. Dengan menggunakan FP-tree, algoritma FP-growth dapat langsung mengekstrak frequent Itemset dari FP tree yang telah terbentuk dengan menggunakan prinsip divide and conquer. Pada bagian 2 akan dibahas proses pembentukan FPtree dari sekumpulan data transaksi. Proses untuk menemukan Frequent Itemset dengan algoritma FPgrowth akan dibahas pada bagian 3. Bagian 4 akan ditarik kesimpulan dari penggunaan struktur FP-tree dan algoritma FP-growth untuk mendapatkan frequent itemset.

2. PEMBANGUNAN FP-TREE FP-tree merupakan struktur penyimpanan data yang dimampatkan. FP-tree dibangun dengan memetakan setiap data transaksi ke dalam setiap lintasan tertentu dalam FP-tree. Karena dalam setiap transaksi yang dipetakan, mungkin ada transaksi yang memiliki item yang sama, maka lintasannya memungkinkan untuk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan struktur data FP-tree semakin efektif. Kelebihan dari FP-tree adalah hanya memerlukan dua kali pemindaian data transaksi yang terbukti sangat efisien. Misal I= {a 1, a 2,, a n } adalah kumpulan dari item. Dan basis data transaksi DB = {T 1, T 2,, T n }, di mana T i (i [1..n]) adalah sekumpulan transaksi yang mengandung item di I. Sedangkan support adalah penghitung (counter) frekuensi kemunculan transaksi yang mengandung suatu pola. Suatu pola dikatakan sering muncul (frequent pattern) apabila support dari pola tersebut tidak kurang dari suatu konstanta ξ (batas ambang minimum support) yang telah didefinisikan sebelumnya. Permasalahan mencari pola frequent dengan batas ambang minimum support count ξ inilah yang dicoba untuk dipecahkan oleh FP- Growth dengan bantuan Struktur FP-tree. Adapun FP- tree adalah sebuah pohon dengan definisi sebagai berikut: - FP-Tree dibentuk oleh sebuah akar yang diberi label null, sekumpulan upapohon yang beranggotakan item-item tertentu, dan sebuah tabel frequent header. - Setiap simpul dalam FP-tree mengandung tiga informasi penting, yaitu label item, menginformasikan jenis item yang direpresentasikan simpul tersebut, support count, merepresentasikan jumlah lintasan transaksi yang melalui simpul tesebut, dan pointer penghubung yang menghubungkan simpul-simpul dengan label item sama antarlintasan, dintandai dengan garis panah putusputus. Contoh 1 Misalkan diberikan tabel data transaksi sebagai berikut, dengan minimum support count ξ=2 No Transaksi 1 a,b 2 b,c,d,g,h 3 a,c,d,e,f 4 a,d,e 5 a,b,z,c 6 a,b,c,d 7 a,r 8 a,b,c 9 a,b,d 10 b,c,e Tabel 2.1 Tabel data transaksi mentah Frekuensi kemunculan tiap item dapat dilihat pada tabel berikut: Item Frekuensi a 8 b 7 c 6 d 5 e 3 f 1 r 1 z 1 g 1 h 1 Tabel 2.2 Frekuensi kemunculan tiap karakter Setelah dilakukan pemindaian pertama didapat item yang memiliki frekuensi di atas support count ξ=2 adalah a,b,c,d, dan e. Kelima item inilah yang akan berpengaruh dan akan dimasukkan ke dalam FP-tree, selebihnya (r,z,g, dan h) dapat dibuang karena tidak berpengaruh signifikan. Tabel berikut mendata kemunculan item yang frequent dalam setiap transaksi, diurut berdasarkan yang frekuensinya paling tinggi. TID Item 1 {a,b} 2 {b,c,d} 3 {a,c,d,e} 4 {a,d,e} 5 {a,b,c} 6 {a,b,c,d} 7 {a} 8 {a,b,c} 9 {a,b,d} 10 {b,c,e} Tabel 2.3. Tabel DataTransaksi Gambar di bawah ini memberikan ilustrasi mengenai pembentukan FP-tree setelah pembacaan TID 1. a : 1

Gambar 2.1 Hasil pembentukan FP-tree setelah pembacaan TID 1 Gambar 2.2 Hasil Pembentukan FP Tree setelah pembacaan TID 2 a : 1 a : 2 Gambar 2.3 Hasil Pembentukan FP-Tree setelah pembacaan TID 3 terbentuknya FP Tree setiap TID dibaca. Setiap simpul pada FP-Tree mengandung nama sebuah item dan counter support yang berfungsi untuk menghitung frekuensi kemunculan item tersebut dalam tiap lintasan transaksi. FP-tree yang merepresentasikan data transaksi pada tabel 2.1 dibentuk dengan cara sebagai berikut: 1. Kumpulan data dipindai pertama kali untuk menentukan support count dari setiap item. Item yang tidak frequent dibuang, sedangkan frequent item dimasukkan dan disusun dengan urutan menurun, seperti yang terlihat pada tabel 2.1. 2. Pemindaian kedua, yaitu pembacaan TID pertama {a,b} akan membuat simpul a dan b, sehingga terbentuk lintasan transaksi a b. Support count dari setiap simpul bernilai awal 1 3. Setelah pembacaan transaksi kedua {b,c,d}, terbentuk lintasan kedua yaitu b c d. Support count masingmasing count juga bernilai awal 1. Walaupun b ada pada transaksi pertama, namun karena prefix transaksinya tidak sama, maka transaksi kedua ini tidak bisa dimampatkan dalam satu lintasan. 4. Transaksi keempat memiliki prefix transaksi yang sama dengan transaksi pertama, yaitu a, maka lintasan transaksi ketiga dapat ditimpakan di a, sambil menambah support count dari a, dan selanjutnya membuat lintasan baru sesuai dengan transaksi ketiga.(lihat gambar 2.3) 5. Proses ini dilanjutkan sampai FP-tree berhasil dibangun berdasarkan tabel data transaksi yang diberikan. 3. PENERAPAN ALGORITMA FP-GROWTH c :3 b : 5 b :2 Setelah tahap pembangunan FP-tree dari sekumpulan data transaksi, akan diterapkan algoritma FP-growth untuk mencari frequent itemset yang signifikan. Algoritma FP-growth dibagi menjadi tiga langkah utama, yaitu : 1. Tahap Pembangkitan Conditional Pattern Base Conditional Pattern Base merupakan subdatabase yang berisi prefix path (lintasan prefix) dan suffix pattern (pola akhiran). Pembangkitan conditional pattern base didapatkan melalui FP-tree yang telah dibangun sebelumnya. Gambar 2.4 Hasil Pembentukan FP-Tree setelah pembacaan TID 10 Diberikan 10 data transaksi dengan 5 jenis item seperti pada tabel di atas. Gambar 1 4 menunjukkan proses 2. Tahap Pembangkitan Conditional FP-tree Pada tahap ini, support count dari setiap item pada setiap conditional pattern base dijumlahkan, lalu setiap item yang memiliki jumlah support count lebih besar sama dengan minimum support count ξ akan

dibangkitkan dengan conditional FP-tree. 3. Tahap Pencarian frequent itemset a :8 Apabila Conditional FP-tree merupakan lintasan tunggal (single path), maka didapatkan frequent itemset dengan b : 5 melakukan kombinasi item untuk setiap conditional FP-tree. Jika bukan lintasan c : 3 tunggal, maka dilakukan pembangkitan FPgrowth secara rekursif. Ketiga tahap tersebut merupakan langkah yang akan dilakukan untuk mendapat frequent itemset, yang dapat dilihat pada algoritma berikut : Gambar 3.2 Lintasan mengandung simpul d b : 5 c : 3 Gambar 3.3 Lintasan mengandung simpul c Gambar 3.1 Algoritma FP-Growth Akan dicoba menerapkan algoritma FP-growth pada kasus contoh 1. Langkah-langkah yang harus ditempuh akan dijelaskan pada bagian berikut ini. Untuk menemukan frequent itemset dari contoh 1, maka perlu ditentukan upapohon dengan lintasan yang berakhir dengan support count terkecil, yaitu e. Berturut-turut ditentukan juga yang berakhir di d,c,b, dan a. Proses pembentukan dapat dilihat pada gambar berikut : b : 5 Gambar 3.4 Lintasan mengandung simpul b a :8 Gambar 3.1 Lintasan yang mengandung simpul e Gambar 3.5 Lintasan mengandung simpul a Algoritma FP-growth menemukan frequent itemset yang berakhiran suffix tertentu dengan menggunakan metode divide and conquer untuk memecah problem menjadi subproblem yang lebih kecil.

Contohnya, jika kita ingin menemukan semua frequent itemset yang berakhiran e. Oleh karena itu, kita harus mengecek apakah support count dari e memenuhi minimum support count ξ=2. Karena support count dari e adalah 3, dan 3 ξ, maka e adalah item yang frequent. a :2 Setelah mengetahui bahwa item e adalah item yang frequent, maka subproblem selanjutnya adalah menemukan frequent itemset dengan akhiran de, ce, be, dan ae. Dengan menggabungkan seluruh solusi dari subproblem yang ada, maka himpunan semua frequent itemset yang berakhiran item e akan didapatkan. Untuk lebih memperjelas, dapat dilihat contoh menemukan frequent itemset yang berakhiran dengan item e di bawah ini a :8 Gambar 3.6 Ada lintasan yang tidak berakhir di e, yaitu b c 1. Langkah pertama yang dilakukan adalah membangun sebuah upapohon FP-tree dengan hanya menyertakan lintasan yang berakhir di e. 2. Support count dari item e dihitung dan dibandingkan dengan minimum support count ξ=3. Karena memenuhi, maka {e} termasuk frequent itemset, karena support count=2. 3. Karena item e frequent, maka perlu dipecahkan subproblem untuk menemukan frequent itemset yang berkahiran dengan de, ce, be, dan ae. Sebelum memevahkan subproblem ini, maka upapohon FP-tree tersebut harus diubah terlebih dahulu menjadi conditional FP-tree. Conditional FPtree mirip dengan FP-tree biasa, namun conditional FP-tree dimaksudkan untuk mencari frequent itemset yang berakhiran item tertentu. 4. Conditional FP-tree dapat dibentuk dengan cara : Gambar 3.7 Semua simpul e dibuang, Support count simpul di atasnya sudah diperbaharui a. Setiap lintasan yang tidak mengandung e dibuang. Pada contoh, lintasan terkanan, terdapat lintasan yang tidak mengandung e, yaitu null b c. Lintasan ini dapat dibuang dengan cara mengurangi support count menjadi 1, sehingga lintasan tersebut hanya mengandung transaksi {b,c,e}, seperti pada gambar 3.7. b. Setelah semua lintasan berakhir di e, maka simpul e dapat dibuang, karena setiap nilai support count pada simpul orang tuanya telah mencerminkan transaksi yang berakhir di e. Subproblem selanjutnya yang harus dipecahkan adalah mencari lintasan frequent itemset yang berakhir di de, ce, be, dan ae. a :2 Gambar 3.8 Conditional FP-tree untuk e (lintasan mengandung be dihapus, karena tidak frequent). c. Karena nilai support count dari b adalah 1, yang berarti transaksi yang mengandung b dan e hanya 1 transaksi, maka berdasarkan prinsip anti-monotone heuristic, simpul b dan lintasan yang mengandung be dapat dibuang, karena jika item b tidak frequent, maka setiap transaksi yang berakhiran be juga tidak frequent. Terbentuk Conditional

FP-tree untuk e, seperti pada gambar 3.8 5. FP-tree menggunakan Conditional FP-tree untuk membangun pohon lintasan prefix untuk menemukan frequent itemset yang berakhir dengan pasangan item de,ce, dan ae. 6. Untuk Lintasa Prefix de, yang dibentuk dari Conditional FP-tree untuk item e dapat dilihat pada gambar 3.9 berikut a :2 Gambar 3.9 Pohon Prefix yang berakhir di de 7. Dengan menjumlahkan support count dari d, yang tidak lain adalah jumlah frequent itemset yang berakhir di de, didapat bahwa {d,e} juga termasuk dalam frequent itemset. 8. Selanjutnya Algoritma FP-tree akan mengulangi langkah yang sama dengan langkah ketiga, sehingga didapatkan conditional FP-tree untuk de hanya berisi satu daun, yaitu a, dengan support count 2. Sehingga {a,d,e} termasuk dalam frequent itemset. 9. Subproblem berikutnya yaitu dengan menemukan frequent itemset yang berakhiran dengan ce. Didapat {c,e} juga merupakan frequent itemset. Begitupula dengan {a,e}. Setelah memeriksa frequent itemset untuk beberapa akhiran (suffix), maka didapat hasil yang dirangkum dalam tabel berikut: Suffix Frequent Itemset e {e},{d,e},{a,d,e},{c,e},{a,e} d {d},{c,d},{b,c,d},{a,c,d},{b,d},{a,b,d},{a,d} c {c},{b,c},{a,b,c},{a,c} b {b},{a,b} a {a} Tabel 3.1 Hasil Frequent Itemset Dengan metode divide and conquer ini, maka pada setiap langkah rekursif, algoritma FP-growth akan membangun sebuah conditional FP-tree baru yang telah diperbaharui nilai support count, dan membuang lintasan yang mengandung item-item yang tidak frequent lagi. 4. KESIMPULAN Beberapa kesimpulan yang dapat ditarik dari penulisan makalah ini adalah: 1. Struktur pohon yang dipelajari pada mata kuliah matematika diskrit memiliki implementasi yang sangat beragam, khususnya dalam penyimpanan struktur data yang lebih solid, efektif, dan efisien. 2. FP-tree yang terbentuk dapat memampatkan data transaksi yang memilki item yang sama, sehingga penggunaan memori komputer lebih sedikit, dan proses pencarian frequent itemset menjadi lebih cepat. 3. Dengan menggunakan Algoritma FP Growth, maka pemindaian kumpulan data transaksi hanya dilakukan dua kali, jauh lebih efisien dibandingkan algoritma dengan paradigma apriori. 4. FP-growth merupakan salah satu algoritma yang menjadi dasar perkembangan beberapa algoritma baru yang lebih efektif, karena kelebihannya yaitu tidak melakukan pemindaian data transaksi secara berulangulang. DAFTAR REFERENSI [1] Borgelt, Christian. An Implementation of FP-Growth Algorithm osdm.ua.ac.be/papers/p1-borgelt.pdf Tanggal akses: 29 Desember 2007 Pukul: 18.00 WIB [2] Han, J., Micheline, K., Data Mining: Concept and Techniques, Simon Fraser University, Morgan Kauffman Publisher, 2000. [3] Han, J., Yin, Y., Mining Frequent Pattern Without Candidate Generation, http://wwwfaculty.cs.uiuc.edu/~hanj/pdf/sigmod00.pdf Tanggal akses: 27 Desember 2007 Pukul:21.00 WIB [4] Munir, Rinaldi, Diktat Kuliah IF2153 Matematika Diskrit, Departemen Teknik Informatika, Institut Teknologi Bandung, 2006. [5] Soelaiman,Rully. Arini, Ni Made. Analisis Kinerja Algoritma FOLD- Growth dan FP- Growth pada Pengalian Pola Asosiasi, www.si.its.ac.id/penelitian/jurnal/ Arin.pdf Tanggal akses: 27 Desember 2007 Pukul 21.00 WIB