2.1 Penelitian Terkait

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah Identifikasi Masalah Masalah Umum

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

2.2 Data Mining. Universitas Sumatera Utara

BAB II TINJAUAN PUSTAKA

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

BAB III METODE PENELITIAN

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB I PENDAHULUAN. frekuensi tinggi antar himpunan itemset yang disebut fungsi Association

Jurnal Teknologi Informasi, Volume 10 Nomor 2, Oktober 2014, ISSN

BAB III METODE PENELITIAN. Metode penelitian merupakan suatu prosedur beserta tahapan-tahapan yang

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI

Penelitian ini melakukan pencarian

II. TINJAUAN PUSTAKA

ASSOCIATION RULES PADA TEXT MINING

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB II TINJAUAN STUDI DAN LANDASAN TEORI

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

Analisa Data Mining Menggunakan Algoritma Frequent Pattern Growth Pada Data Transaksi Penjualan Restoran Joglo Kampoeng Doeloe Semarang

BAB I PENDAHULUAN Latar Belakang

PENGGUNAAN ALGORITMA APRIORI UNTUK MENENTUKAN REKOMENDASI STRATEGI PENJUALAN PADA TOSERBA DIVA SKRIPSI

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

IMPLEMENTASI DATA MINING ALGORITMA APRIORI PADA PENJUALAN SPAREPART MOTOR DI AHAS PUTRA MOTOR

TINJAUAN PUSTAKA Data Mining

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

ASSOCIATION RULES PADA TEXT MINING

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

1. BAB I PENDAHULUAN 1.1. Latar Belakang ,

Pola Kompetensi Mahasiswa Program Studi Informatika Menggunakan FP-Growth

BAB I PENDAHULUAN. Teknologi Informasi sekarang ini telah digunakan hampir di semua aspek

IMPLEMENTASI DATA MINING DENGAN ALGORITMA APRIORI PADA TOKO BANGUNAN UD. RUFI SENTOSA JAYA SAMBIREJO - PARE

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH PADA DATA TRANSAKSI PENJUALAN OBAT

Penerapan Stuktur FP-Tree dan Algoritma FP-Growth dalam Optimasi Penentuan Frequent Itemset

Assocation Rule. Data Mining

ANALISA DAN PERANCANGAN APLIKASI ALGORITMA APRIORI UNTUK KORELASI PENJUALAN PRODUK (STUDI KASUS : APOTIK DIORY FARMA)

BAB I PENDAHULUAN. 1.1 Latar Belakang

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA

BAB II LANDASAN TEORI. Anindita Dwi Respita,2015. a. Penelitian ini menjelaskan tentang tujuan : menggunakan metode market basket analysis.

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

Bab 2 Tinjauan Pustaka

Aplikasi Data Mining untuk Mengukur Tingkat Kelulusan Mahasiswa dengan Metode Apriori

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

BAB 1 PENDAHULUAN. retail di Indonesia pada semester I 2010 telah mencapai Rp 40 triliun. Omzet perusahaan

SISTEM REKOMENDASI PAKET MAKANAN DENGAN ALGORITMA FP-GROWTH PADA RESTORAN SEAFOOD XYZ

DAFTAR ISI Transformasi data... 47

Abstrak. Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris.

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB 1 PENDAHULUAN Latar Belakang

METODE PENELITIAN. Tahapan pengembangan sistem PSP (Penetapan Strategi Penjualan) 1.0 seperti pada Gambar 2 di bawah ini. Mulai

Implementasi Algoritme Modified-Apriori Untuk Menentukan Pola Penjualan Sebagai Strategi Penempatan Barang Dan Promo

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

Aplikasi Data Mining untuk meneliti Asosiasi Pembelian Item Barang di Supermaket dengan Metode Market Basket Analysis

DATA MINING UNTUK ANALISA PENJUALAN KERIPIK UD MARTOP PRATAMA MENGGUNAKAN ALGORITMA APRIORI

BAB 2 TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Journal of Informatics and Telecommunication Engineering. Analisa Algoritma Data Mining Eclat Dan Hui Miner

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

METODE CLUSTERING DENGAN ALGORITMA K-MEANS. Oleh : Nengah Widya Utami

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

PENERAPAN METODE APRIORI ASOSIASI TERHADAP PENJUALAN PRODUCT COSMETIC UNTUK MENDUKUNG STRATEGI PENJUALAN

BAB V KESIMPULAN DAN SARAN. keranjang belanja (Market basket analysis) dalam penerapan cross selling pada

BAB 2 LANDASAN TEORI

IMPLEMENTASI ALGORITMA APRIORI UNTUK MENEMUKAN FREQUENT ITEMSET DALAM KERANJANG BELANJA

ANALISA DATA PENJUALAN OBAT DENGAN MENGGUNAKAN ALGORITMA APRIORI PADA RUMAH SAKIT UMUM DAERAH H. ABDUL MANAN SIMATUPANG KISARAN

BAB IV HASIL DAN UJICOBA. Penerapan Data Mining Market Basket Analysis Terhadap Data Penjualan Produk

ABSTRAKSI Analisis keranjang pasar merupakan suatu cara untuk mengetahui kebiasaan berbelanja masyarakat disuatau tempat terhadap barang yang dibeli.

BAB 2 TINJAUAN PUSTAKA

dengan harga jual yang lebih rendah. Sedangkan diskon atau potongan harga adalah pengurangan harga langsung dari suatu produk yang dilakukan dalam

SISTEM REKOMENDASI PEMESANAN SPAREPART DENGAN ALGORITMA FP-GROWTH (STUDI KASUS PT. ROSALIA SURAKARTA)

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. yang cepat dan besar di Asia (Kartiwi, 2006). Pertumbuhan e-commerce yang

ABSTRACT Market basket analysis is a way to know the shopping habits of people in one place on goods purchased. Market basket analysis to produce an a

ANALISIS DATA POLA PEMBELIAN KONSUMEN DENGAN ALGORITMA APRIORI PADA TRANSAKSI PENJUALAN SUPERMARKET PAMELLA YOGYAKARTA 1.

PENDAHULUAN TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING PADA PENJUALAN TIKET PESAWAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus: Jumbo Travel Medan)

PENGGUNAAN CLUSTER-BASED SAMPLING UNTUK PENGGALIAN KAIDAH ASOSIASI MULTI OBYEKTIF

ANALISIS ATURAN ASOSIASI MENGGUNAKAN ALGORITMA APRIORI UNTUK MENENTUKAN INVENTORI APOTEK

PENENTUAN LOKASI BARANG PADA A Swalayan MENGGUNAKAN ASSOCIATION RULE DENGAN ALGORITMA FP-GROWTH

BAB II TINJAUAN PUSTAKA 2.1 DASAR TEORI Business Analytic

BAB I PENDAHULUAN. Keberadaan minimarket di kota-kota besar sangat dibutuhkan bagi. masyarakat khususnya di daerah perumahan. Bagi sebagian besar

PENERAPAN METODE ASOSIASI GSP DAN APRIORI UNTUK STOK DAN REKOMENDASI PRODUK

Pengenalan Pola. K-Means Clustering

Aturan assosiatif biasanya dinyatakan dalam bentuk : {roti, mentega} {susu} (support = 40%, confidence = 50%)

BAB II LANDASAN TEORI

ANALISA KONSISTENSI POLA PEMINJAMAN BUKU MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus: UPT Perpustakaan Universitas Sebelas Maret)

Pengembangan Aplikasi Market Basket Analysis Menggunakan Algoritma Generalized Sequential Pattern pada Supermarket

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA ECLAT

ANALISA POLA PEMILIHAN PROGRAM STUDI BAGI CALON MAHASISWA DI UNIVERSITAS ABDURRAB MENGGUNAKAN ASSOCIATION RULE

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Link Analysis (Superset) 3 Kategori Link Analysis (#1) 3 Kategori Link Analysis (#2) Association Rule Mining. 3 Kategori Link Analysis (#3)

BAB II TINJAUAN PUSTAKA. Bab ini menguraikan tentang teori-teori penunjang yang dipakai dalam

PENGGUNAAN ALGORITHMA APRIORI DALAM MENGANALISA PRILAKU MAHASISWA DALAM MEMILIH MATA KULIAH ( STUDI KASUS : FKIP UPI YPTK )

Transkripsi:

BAB II TINJAUAN PUSTAKA 2.1 Penelitian Terkait Penelitian yang dilakukan oleh Dinda Setiawati Devi dengan menggunakan metode Apriori untuk analisa keranjang pasar untuk 100 data transaksi dan 55 jenis barang menghasilkan 8 asosiasi data dengan parameter min-confidence >- 10% dan minsupport >- 5% [7]. Penelitian yang dilakukan oleh S.Moertini Veronica dan Yulita Marsela dengan algoritma hash-based pada data transaksi penjualan obat di apotik menyimpulkan kinerja hash-based ternyata bergantung kepada bilangan prima yang digunakan pada fungsi hashing. Semakin besar bilangan ini ( hingga di atas dan paling dekat dengan jumlah item ), semakin cepat waktu komputasinya [19]. Penelitian yang dilakukan oleh Afif Syaifullah Muhammad, melakukan implementasi data mining algoritma Apriori pada system penjualan menyimpulkan teknik data mining dengan algoritma Apriori dapat diimplementasikan pada system penjualan [1]. Penelitian yang dilakukan Erwin, melakukan analisis market basket dengan algoritma Apriori dan FP-Growth menyimpulkan bahwa algoritma Apriori membutuhkan waktu komputasi yang lama untuk mendapatkan frequent itemsets, karena berulang kali melakukan pemindahan data dan membutuhkan memori yang besar sedangkan FP-Growth hanya membutuhkan dua kali scanning database dalam mencari frequent itemsets sehingga waktu yang dbutuhkan menjadi relatif singkat dan efisien [8]. Penelitian yang dilakukan Febriana Santi Wahyuni, mencari kaidah asosiasi antar kombinasi suatu item barang dengan algoritma K-Means dan Fuzzy C-Means menyimpulkan bahwa data yang di-cluster akan menghasilkan kaidah yang mempunyai rata rata nilai confidence yang lebih tinggi, yaitu 85% pada nilai minimum support 20 dan 40, dibandingkan dengan data yang tidak melalui proses clustering. Data yang melalui proses clustering dengan K-Means menghasilkan rata 8

rata nilai confidence yang lebih tinggi dibandingkan dengan Fuzzy C-Means (83%) pada nilai minimum support 20 dan 40 [20]. Penelitian yang dilakukan oleh Andreas, Gregorius Satia Budhi, Hendra Rusly, meneliti asosiasi pembelian barang di supermarket dengan metode market basket analysis menyimpulkan [11] : Menemukan frequent itemset dan association rule yang memenuhi syarat minimum support, berdasarkan item yang ada dalam transaksi. Dapat mengetahui asosiasi barang apa saja yang sering dibeli bersamaan oleh konsumen. Semakin kecil minimum support dan confidence yang ditentukan maka semakin banyak rules yang dapat dihasilkan. Pada proses pembuatan 2 itemset candidate membutuhkan waktu yang paling lama, semakin banyak jumlah 1-itemset candidate yang memenuhi minimum support, maka semakin banyak pula jumlah 2-itemset yang harus dihasilkan. Dalam aturan asosiasi pertambangan tinjauan terbaru dari Sotiris Kotsiantis, Dimitris Kanellopoulos, menyimpulkan algoritma konvensional aturan asosiasi penemuan berlangsung dalam dua langkah. Semua itemset sering ditemukan pada langkah pertama. The Frequent itemset adalah itemset yang disertakan dalam setidaknya transaksi minimum support. Asosiasi aturan dengan kepercayaan pada minimum confidence setidaknya dihasilkan pada langkah kedua [14]. Penelitian Christian Borgelt, menyimpulkan pada tahap preprocessing dilakukan penghapusan item transaksi yang tidak sering muncul sehingga waktu lebih efisien. Implementasi algoritma FP-pertumbuhan melebihi algoritma Apriori dan algoritma Eclat [4]. Penelitian Christian Borgelt, Thorsten Meini dan Michael Berthold, menyimpulkan algoritma didasarkan pada pencarian pertama kedalaman dalam pohon substruktur, yang membuat pendekatan algoritma ini efisien adalah pemangkasan struktural yang mencoba meminimalkan jumlah pencarian [5]. 9

Penelitian Mohammad El-Hajj dan Osmar R.Zaiane, menyimpulkan pendekatan lompatan traversal secara signifikan mengurangi jumlah calon itemsets dan cocok sebagai kerangka kerja yang baik untuk pertambangan dan pemrosesan parallel, serta menunjukkan penghematan drastis dalam penggunaan memori [9]. Penelitian Xun Zhu, Hongtao Deng, Zheng Chen, menyimpulkan aturan asosiasi pertambangan pola yang sering muncul mengalami perkembangan yang cukup pesat yang telah diterapkan untuk berbagai aplikasi domain, seperti pengindeksan dan pencarian kesamaan kompleks data terstruktur, pertambangan multimedia, dan pertambangan web [2]. Tabel 2.1. Rangkuman penelitian terkait analisis data transaksi penjualan barang No Nama Peneliti dan Tahun 1 Dinda Setiawati Devi, 2009 2 S.Moertini Veronica dan Yulita Marsela, 2004 3 Afif Syaifullah Muhammad. 2009 Masalah Metode Hasil Penggalian asosiasi data transaksi penjualan. Penggalian asosiasi data transaksi penjualan. Penggalian asosiasi data transaksi penjualan. Algoritma Asosiasi Apriori, dengan 100 data transaksi penjualan. Algoritma Hash- Based Algoritma Apriori Ada 8 Asosiasi, dengan min-support 5% dan min-confidence 10% Bilangan prima yang paling efektif untuk digunakan dalam fungsi hashing adalah yang terdekat dan lebih besar dari jumlah seluruh produk. Teknik data mining dengan algoritma Apriori dapat diimplementasikan pada system penjualan. 10

Tabel 2.1 Rangkuman penelitian terkait analisis data transaksi penjualan barang (lanjutan) No Nama Peneliti dan Masalah Metode Hasil Tahun 4 Erwin,2009 Penggalian asosiasi data transaksi penjualan. Algoritma Apriori dan FP- Growth algoritma Apriori membutuhkan waktu komputasi yang lama untuk mendapatkan frequent itemsets, karena berulang kali melakukan pemindahan data dan membutuhkan memori yang besar sedangkan FP-Growth hanya membutuhkan dua kali scanning database dalam mencari frequent itemsets sehingga waktu yang dibutuhkan menjadi lebih singkat dan efisien. 5 Santi Wahyuni Febriana, 2010 Penggalian asosiasi data transaksi penjualan. Algoritma K- Means dan Fuzzy C Means Data yang di-cluster mempunyai rata rata nilai confidence lebih tinggi yaitu 85% pada nilai min-support 20 dan 40, dari pada data yang tidak melalui proses clustering. Data yang melalui proses clustering dengan K- Means menghasilkan rata rata nilai confidence yang lebih tinggi dibandingkan dengan Fuzzy C- Means ( 83%) pada nilai minimum support 20 dan 40. 11

Tabel 2.1. Rangkuman penelitian terkait analisis data transaksi penjualan barang (lanjutan) No Nama Peneliti dan Tahun 6 Andreas Handojo, Gregorius Satia Budhi, Hendra Rusli, 2004. Masalah Metode Hasil Menggali asosiasi item barang Metode Market Basket Analysis - Menemukan frequent itemset dan association rule yang memenuhi syarat minimum support, berdasarkan item yang ada dalam transaksi. - Dapat mengetahui asosiasi barang apa saja yang sering dibeli bersamaan oleh konsumen. - Semakin kecil minimum support dan confidence yang ditentukan maka semakin banyak rules yang dapat dihasilkan. - Pada proses pembuatan 2 itemset candidate membutuhkan waktu yang paling lama, semakin banyak jumlah 1- itemset candidate yang memenuhi minimum support, maka semakin banyak pula jumlah 2- itemset yang harus dihasilkan. 12

Tabel 2.1. Rangkuman penelitian terkait analisis data transaksi penjualan barang (lanjutan) No Nama Peneliti dan Tahun 7 Sotiris Kotsiantis, Dimitris Kanellopoulos,2006 8 Christian Borgelt, 2005 9 Christian Borgelt, Thorsten Meini, Michael Berthold, 2005 Masalah Metode Hasil Aturan Asosiasi Pertambangan Penambangan itemset yang sering muncul dari database transaksi. Pertambangan sub struktur molekul yang paling sering muncul dalam satu set molekul. Algoritma konvensional aturan asosiasi. Algoritma Fp- Growth, algoritma Apriori dan algoritma Eclat. Search Tree Traversal Algoritma konvensional aturan asosiasi penemuan berlangsung dalam dua langkah. Semua itemset sering ditemukan pada langkah pertama. The Frequent itemset adalah itemset yang disertakan dalam setidaknya transaksi minimum support. Asosiasi aturan dengan kepercayaan pada minimum confidence setidaknya dihasilkan pada langkah kedua. Pada tahap preprocessing dilakukan penghapusan item transaksi yang tidak sering muncul sehingga waktu lebih efisien. Implementasi algoritma FP- Growth melebihi algoritma Apriori dan algoritma Eclat. Algoritma didasarkan pada pencarian pertama kedalaman dalam pohon substruktur, yang membuat pendekatan ini efisien adalah pemangkasan struktural yang mencoba meminimalkan jumlah pencarian. 13

Tabel 2.1. Rangkuman penelitian terkait analisis data transaksi penjualan barang (lanjutan) No Nama Peneliti dan Tahun 10 El-Hajj Mohammad dan Osmar R.Zaiane, 2005 11 XunZhu, Hongtao Deng, Zheng Chen.2011 Masalah Metode Hasil Menemukan maksimal pola dengan memperkenalkan metode baru menghitung dukungan kandidat berdasarkan dukungan dari pola kandidat lainnya. Asosiasi aturan pertambangan pola yang sering muncul. Leap Traversal dengan dua pendekatan, pertama mengurangi pola pohon yang tidak sering muncul, yang kedua partisi ruang transaksi menggunakan Cofi-pohon. Algoritma Apriori, Fp- Growth, Eclat. Pendekatan lompatan traversal secara signifikan mengurangi jumlah calon itemsets dan cocok sebagai kerangka kerja yang baik untuk pertambangan dan pemrosesan parallel, serta menunjukkan penghematan drastis dalam penggunaan memori. Aturan asosiasi pertambangan pola yang sering muncul mengalami perkembangan yang cukup pesat yang telah diterapkan untuk berbagai aplikasi domain, seperti pengindeksan dan pencarian kesamaan kompleks data terstruktur, pertambangan multimedia, dan pertambangan web 2.2. Landasan Teori 2.2.1. Konsep Dasar Aturan Asosiasi Algoritma. Asosiasi aturan pertambangan untuk mencari korelasi antara item dalam dataset telah banyak mendapat perhatian terutama sejak publikasi AIS dan algoritma Apriori [2][3] yang awal penelitian sebagian besar didorong oleh analisis data keranjang pasar, hasil yang memungkinkan perusahaan lebih memahami perilaku pembelian sehingga berdampak pada pencapaian target pasar. Analisis asosiasi pertambangan 14

adalah proses dua bagian. Pertama identifikasi set item atau itemsets dalam dataset. Kedua derivasi selanjutnya dari kesimpulan dari itemsets tersebut. Sebagian besar penelitian terkait sampai saat ini difokuskan pada penemuan efisiensi itemsets sebagai tingkat kompleksitas jauh lebih besar dibandingkan generasi inferensi.[6] Selama satu dekade terakhir berbagai algoritma telah dikembangkan melalui penyempurnaan strategi pencarian, teknik pemangkasan, struktur data dan penggunaan organisasi dataset alternatif. Sementara sebagian besar algoritma fokus pada penemuan eksplisit dari semua kesimpulan untuk dataset tertentu, pertimbangan peningkatan sedang diberikan kepada algoritma khusus yang berusaha untuk meningkatkan waktu pemrosesan. Untuk mengurangi waktu pengolahan bisa dilakukan dengan teknik pemangkasan dinamis mengurangi dataset selama pengolahan, membuang item yang tidak perlu.[6] Kendala yang paling umum digunakan untuk mengurangi eksplorasi selama identifikasi itemsets adalah spesifikasi dari minsup ambang batas dukungan, dimana dukungan berkaitan dengan berapa kali itemsets akan muncul. Ini secara efektif mengurangi identifikasi itemsets dengan penemuan hanya itemsets yang melebihi minsup kemunculan dianggap sebagai itemsets yang valid.[6] Meningkatkan Apriori[6] : Mengurangi melewati scan database transaksi. Kecilkan jumlah calon / itemsets. Memfasilitasi dukungan menghitung calon. Menghapus transaksi yang jarang muncul dari k-itemset dari database untuk scan lebih lanjut. Ada dua langkah dasar yang penting untuk aturan asosiasi, dukungan ( s ) dan kepercayaan ( c ). Karena database besar dan kekhawatiran pengguna tentang barang yang sering dibeli, biasanya ambang dukungan dan kepercayaan yang telah ditetapkan oleh pengguna untuk menetapkan aturan aturan yang menarik atau berguna. Dukungan ( s ) dari suatu aturan asosiasi didefinisikan sebagai prosentasi yang berisi X U Y terhadap total jumlah record dalam database. Misalkan dukungan 15

dari item adalah 0.1%, itu berarti hanya 0,1 persen dari transaksi mengandung pembelian item ini [14]. Keyakinan atau kepercayaan adanya aturan asosiasi didefinisikan sebagai prosentasi ber transaksi yang mengandung X U Y dengan jumlah total transaksi yang mengandung X. Keyakinan adalah ukuran kekuatan aturan asosiasi, misalnya keyakinan dari aturan asosiasi X Y adalah 80%, itu berarti bahwa 80% dari transaksi yang mengandung X juga mengandung Y bersama-sama [14]. Umumnya sebuah asosiasi aturan algoritma pertambangan berisi langkah-langkah sebagai berikut [14] : Himpunan kandidat k-itemset yang dihasilkan oleh 1-ekstensi besar (k-1) itemsets dihasilkan dalam iterasi sebelumnya. Mendukung untuk calon k-itemsets yang dihasilkan dari database. Itemsets yang tidak memiliki dukungan minimal dibuang dan sisanya disebut k-itemsets. Algoritma konvensional aturan asosiasi menemukan dua langkah pertambangan asosiasi, langkah pertama menemukan semua itemset. The frequent itemset adalah itemset yang disertakan dalam setidaknya transaksi minsupport. Asosiasi aturan dengan kepercayaan pada minconfidence setidaknya dihasilkan pada langkah kedua [14]. 2.2.2. Teknik Clustering Teknik cluster termasuk teknik yang sudah cukup dikenal dan banyak dipakai dalam data mining. Usaha usaha untuk menghitung jumlah cluster yang optimal dan peng-cluster-an yang paling baik masih terus dilakukan. Dengan demikian menggunakan metode yang sekarang, kita tidak bisa menjamin hasil peng-cluster-an sudah merupakan hasil yang optimal. Namun hasil yang dicapai biasanya sudah cukup bagus dari segi praktis. [22] Tujuan utama dari metode cluster adalah pengelompokkan sejumlah data/obyek ke dalam cluster ( group ) sehingga dalam setiap cluster akan berisi data yang semirip mungkin. Dalam clustering kita berusaha untuk menempatkan obyek yang mirip ( 16

jaraknya dekat ) dalam satu cluster dan membuat jarak antar cluster sejauh mungkin. Ini berarti obyek dalam satu cluster sangat mirip satu sama lain dan berbeda dengan obyek dalam cluster cluster yang lain.[22] 2.2.3. Algoritma Klasifikasi K-Means. Algoritma klasifikasi K-Means merupakan metode clustering berbasis jarak yang mempartisi data ke sejumlah kelompok dan bekerja pada atribut numerik Algoritma ini dimulai dengan pemilihan jumlah kelompok ( k ) secara acak serta pengambilan sebagian populasi sejumlah ( k ) untuk dijadikan sebagai titik pusat awal. Salah satu metode perhitungan jarak yang bisa digunakan adalah Euclidean Distance. Perhitungan jarak menggunakan metode Euclidean dinyatakan sebagai berikut : d ( x,y ) = ( )..(1) Dimana : x ; obyek ke 1 y ; obyek ke 2 n ; banyaknya atribut obyek ke 1, obyek ke 2. Prosedur dasar clustering K-Means adalah sebagai berikut : 1. Menentukan k sebagai jumlah cluster yang ingin dibentuk. 2. Membangkitkan k centroid ( titik pusat cluster ) awal secara random. 3. Menghitung jarak setiap data ke masing masing centroids. 4. Setiap data memilih centroid yang terdekat. 5. Menentukan posisi centroid baru dengan cara menghitung nilai rata rata dari data data yang berada pada centroid yang sama. 6. Kembali ke langkah 3 jika posisi centroid baru dengan centroid lama tidak sama. 17

Ada dua pendekatan dalam clustering yaitu partisioning dan hirarki. Dalam partisioning kita mengelompokkan obyek ke dalam k cluster. Ini bisa dilakukan dengan menentukan pusat cluster awal, lalu dilakukan realokasi obyek berdasarkan kriteria tertentu sampai dicapai pengelompokkan yang optimum. Dalam cluster hirarki, kita mulai dengan membuat m cluster dimana setiap cluster beranggotakan satu obyek dan berakhir dengan satu cluster dimana anggotanya adalah m obyek. Dalam clutering hirarki kita hitung jarak masing masing obyek dengan setiap obyek yang lain. Selanjutnya kita temukan pasangan obyek yang jaraknya terdekat. Sehingga tiap obyek akan berpasangan dengan satu obyek atau kelompok obyek yang lain yang paling dekat jaraknya. Langkah langkah yang perlu dilakukan untuk melakukan clustering hirarki adalah [ 21 ] : 1. Kelompokkan setiap obyek ke dalam kelompok / clusternya sendiri. 2. Temukan pasangan paling mirip untuk dimasukkan ke dalam cluster yang sama dengan melihat data dalam matriks kemiripan. 3. Gabungkan kedua obyek dalam satu cluster. 4. Ulangi sampai tersisa hanya satu cluster. 2.2.4. Algoritma Apriori Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item. Biasanya digunakan untuk analisis pembelian barang di pasar swalayan dengan maksud untuk mengetahui berapa besar kemungkinan seorang konsumen membeli satu jenis barang bersamaan dengan jenis barang yang lainnya. Sehingga perusahaan dapat mengatur strategi promosi dengan penempatan barang yang saling berhubungan ditempatkan secara berdekatan dan menetapkan strategi harga promosi untuk barang barang tertentu yang saling berhubungan. Metodologi dasar analisis asosiasi terbagi menjadi dua tahap [15] : 1. Analisis pola frekuensi tinggi. 18

Tahap ini mencari kombinasi item yang memenuhi syarat minimum dari nilai support dalam database. Nilai support sebuah item diperoleh dengan rumus berikut : Support A = ( 2 ) Sementara itu, nilai support dari 2 item diperoleh dari rumus 2 berikut : Support ( A,B ) = P ( A B ) Support ( A,B ) =... ( 3 ) 2. Pembentukan Aturan Asosiasi Setelah semua pola frekuensi tinggi dtemukan, barulah dicari aturan asosiasi yang memenuhi syarat minimum untuk confidence dengan menghitung confidence aturan asosiatif A B. Nilai confidence dari aturan A B diperoleh dari rumus berikut : Confidence = P ( B A ) =.( 4 ) 2.2.5. Confusion Matrix Confusion Matrix menunjukkan jumlah prediksi yang benar dan salah yang dibuat oleh model klasifikasi dibandingkan dengan hasil yang sebenarnya ( nilai target ) dalam data. Matrix adalah n x n, dimana n adalah jumlah nilai target ( kelas ). Kinerja model seperti ini biasanya dievaluasi dengan menggunakan data dalam matrix. Tabel berikut menampilkan confusion matrix 2 x 2 untuk dua kelas ( positif dan negatif ).[12] 19

Confusion Matrix Tar get Positive Negative Model Positive a b Positive Predictive Value a/(a+b) Negative c d Negative Predictive Value d/(c+d) sensitivity Specificity a/(a+c) d/(b+d) Accuracy = (a+d)/(a+b+c+d) Akurasi : proporsi jumlah prediksi yang benar.[12] - Positif presisi nilai prediktif atau proporsi kasus positif yang diidentifikasi dengan benar. - Negatif prediktif value : proporsi kasus negatif yang diidentifikasi dengan benar. - Sensitivitas : proporsi kasus positif sebenarnya yang diidentifikasi dengan benar. - Kekhususan : proporsi kasus negatif yang sebenarnya yang diidentifikasi dengan benar. 20

2.3.Kerangka Pemikirian RUMUSAN MASALAH Data Transaksi Penjualan 1.Banyaknya jumlah transaksi dengan item barang yang sangat bervariasi. 2.Daya beli masyarakat setiap transaksi sangat bervariasi. Data Transaksi Penjualan 3. Belum mengetahui adanya asosiasi barang yang dijual secara umum maupun berdasarkan kemampuan daya beli. 4. Belum mengetahui nilai support dan confidence untuk masing masing asosiasi barang PENDEKATAN Cluster jenis barang dan daya beli masyarakat dengan Algoritma K- Means Asosiasi jenis barang menggunakan Algoritma Asosiasi Tools Untuk cluster jenis barang dan cluster daya beli masyarakat dengan Rapidminer sedangkan untuk Asosiasi dengan Java EVALUASI Mengevaluasi hasil eksperimen, untuk asosiasi dievaluasi nilai support dan confidence sedangkan di cluster jenis barang dievaluasi dengan confusion matrix. MANFAAT Perusahaan bisa menyediakan persediaan barang di gudang sesuai permintaan konsumen, melakukan penjualan barang secara paket dengan harga lebih murah. TUJUAN & MANFAAT TUJUAN Evaluasi cluster jenis barang, memetakan daya beli konsumen, memetakan asosiasi barang secara umum maupun sesuai cluster daya beli, mengukur nilai support dan confidence untuk masing-masing asosiasi barang dan mengukur waktu asosiasi. Bagan 2.1. Kerangka Pemikiran 21