CONTENT BASED RECOMMENDER SYSTEM MENGGUNAKAN ALGORITMA APRIORI

dokumen-dokumen yang mirip
ANALISIS PERBANDINGAN METODE PEARSON DAN SPEARMAN CORRELATION PADA RECOMMENDER SYSTEM

REKOMENDASI PAKET PEMBELIAN BARANG PADA TOKO ONLINE DENGAN COLLABORATIVE FILTERING

Royes Otpin S¹, Arie Ardiyanti Suryani², Warih Maharani³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

ANALISIS DAN IMPLEMENTASI SISTEM REKOMENDASI MENGGUNAKAN MOST-FREQUENT ITEM DAN ASSOCIATION RULE TECHNIQUE

2.2 Data Mining. Universitas Sumatera Utara

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH PADA DATA TRANSAKSI PENJUALAN OBAT

BAB I PENDAHULUAN. Data mining memungkinkan penemuan pola-pola yang menarik, informasi yang

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB I PENDAHULUAN Latar Belakang

ANALISA DAN PERANCANGAN APLIKASI ALGORITMA APRIORI UNTUK KORELASI PENJUALAN PRODUK (STUDI KASUS : APOTIK DIORY FARMA)

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Penerapan Data Mining Association Rule Menggunakan Algoritma Apriori Untuk Meningkatkan Penjualan dan Memberikan Rekomendasi Pemasaran Produk Speedy

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA FP-GROWTH UNTUK PEREKOMENDASI PADA TRANSAKSI PEMINJAMAN BUKU DI PERPUSTAKAAN UNIVERSITAS DIAN NUSWANTORO

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

APLIKASI DATA MINING UNTUK ANALISIS ASOSIASI POLA PEMBELIAN DENGAN ALGORITMA APRIORI

Penelitian ini melakukan pencarian

ANALISA POLA DATA HASIL PEMBANGUNAN KABUPATEN MALANG MENGGUNAKAN METODE ASSOCIATION RULE

Lili Tanti. STMIK Potensi Utama, Jl. K.L. Yos Sudarso Km. 6,5 No. 3A Tj. Mulia Medan ABSTRACT

SISTEM SISTEM REKOMENDASI BIDANG MINAT MAHASISWA MENGGUNAKAN METODE ASSOCIATION RULE DAN ALGORITMA APRIORI

BAB 2 TINJAUAN PUSTAKA

1 BAB I 2 PENDAHULUAN

BAB IV HASIL DAN UJICOBA. Penerapan Data Mining Market Basket Analysis Terhadap Data Penjualan Produk

DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK ANALISIS PENJUALAN

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang


DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

IMPLEMENTASI METODE MARKET BASKET ANALYSIS (MBA) PADA APLIKASI E-COMMERCE STUDI KASUS ANANDA SHOP

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah. Kata informasi telah menjadi suatu topik yang cukup menarik untuk

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

BAB II TINJAUAN PUSTAKA

BAB III METODE PENELITIAN. Metode penelitian merupakan suatu prosedur beserta tahapan-tahapan yang

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

RANCANG BANGUN SISTEM PENGAMBILAN KEPUTUSAN UNTUK PREDIKSI PEMBELIAN BARANG PADA DISTRIBUTOR LUKCY JAYA MOTOR BERBASIS WEB MENGGUNAKAN METODE APRIORI

II. TINJAUAN PUSTAKA

BAB III METODOLOGI PENELITIAN. Gambar 2. 1 Metode Penelitian

ANALISA POLA PEMILIHAN PROGRAM STUDI BAGI CALON MAHASISWA DI UNIVERSITAS ABDURRAB MENGGUNAKAN ASSOCIATION RULE

2.1 Penelitian Terkait

BAB II KAJIAN PUSTAKA

Pembentukan Temporal Association Rules Menggunakan Algoritma Apriori (Studi Kasus:Toko Batik Diyan Solo)

PENGGALIAN KAIDAH MULTILEVEL ASSOCIATION RULE DARI DATA MART SWALAYAN ASGAP

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ANALISIS DAN IMPLEMENTASI ALGORITMA FP-GROWTH PADA APLIKASI SMART UNTUK MENENTUKAN MARKET BASKET ANALYSIS PADA USAHA RETAIL (STUDI KASUS : PT.

Implementasi Algoritme Modified-Apriori Untuk Menentukan Pola Penjualan Sebagai Strategi Penempatan Barang Dan Promo

SISTEM REKOMENDASI PENYEWAAN PERLENGKAPAN PESTA MENGGUNAKAN COLLABORATIVE FILTERING DAN PENGGALIAN ATURAN ASOSIASI

Kata kunci: Sistem Informasi, poin of sale, aplikasi data mining, algoritma apriori, Borland Delphi, SQL 2000, Association rules.

Pengembangan Aplikasi Market Basket Analysis Menggunakan Algoritma Generalized Sequential Pattern pada Supermarket

Assocation Rule. Data Mining

BAB III ANALISIS DAN DESAIN SISTEM

BAB 2 TINJAUAN PUSTAKA

JURNAL IPTEKS TERAPAN Research of Applied Science and Education V10.i2 (81-85)

BAB I PENDAHULUAN 1.1. Latar Belakang

ANALISA POLA PEMILIHAN PROGRAM STUDI BAGI CALON MAHASISWA DI UNIVERSITAS ABDURRAB MENGGUNAKAN ASSOCIATION RULE

BAB II LANDASAN TEORI

APLIKASI DATA MINING UNTUK POLA PERMINTAAN DARAH DI UDD ( UNIT DONOR DARAH ) PMI KOTA SURABAYA MENGGUNAKAN METODE APRIORI

LEMBAR PENGESAHAN Batam, 21 Februari 2011 Pembimbing, Mir atul K. Mufida, S. ST NIK

PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah Identifikasi Masalah Masalah Umum

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

Sistem Rekomendasi Film menggunakan Bisecting K-Means dan Collaborative Filtering

UKDW BAB I PENDAHULUAN

IMPLEMENTASI DATA MINING DENGAN ALGORITMA APRIORI PADA TOKO BANGUNAN UD. RUFI SENTOSA JAYA SAMBIREJO - PARE

ERROR-TOLERANT FASCICLES UNTUK COLLABORATIVE FILTERING ABSTRAK

PENGGUNAAN ALGORITMA APRIORI UNTUK MENENTUKAN REKOMENDASI STRATEGI PENJUALAN PADA TOSERBA DIVA SKRIPSI

PENERAPAN ALGORITMA APRIORI UNTUK TRANSAKSI PENJUALAN OBAT PADA APOTEK AZKA

PENERAPAN ASSOCIATION RULE MINING PADA DATA NOMOR UNIK PENDIDIK DAN TENAGA KEPENDIDIKAN

Abstrak. Data Mining, Algoritma Apriori, Algoritma FP-Growth, Mata Pelajaran, Pemrograman, Web Programming, Matematika, Bahasa Inggris.

BAB I PENDAHULUAN 1.1. Latar Belakang

PREDIKSI KEBUTUHAN PENOMORAN PADA JARINGAN TELEKOMUNIKASI MENGGUNAKAN METODE APRIORI

BAB III ANALISA DAN DESAIN SISTEM

1. BAB I PENDAHULUAN 1.1. Latar Belakang ,

Journal of Informatics and Technology, Vol 2, No 2, Tahun 2013, p

SKRIPSI TI S1 FIK UDINUS 1

BAB I PENDAHULUAN A. Latar Belakang

MERANCANG SISTEM APLIKASI RULE PENGETAHUAN MENGGUNAKAN ALGORITMA APRIORI PADA TRANSAKSI SWALAYAN HARYS PERDANA NGANJUK SKRIPSI

PERBANDINGAN ALGORITMA APRIORI DAN ALGORITMA CT-Pro PADA KOMODITAS EKSPOR DAN IMPOR SKRIPSI ELISA SEMPA ARIHTA KABAN

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Penerapan Data Mining Untuk Analisis Pola Pembelian Produk Pada Clapper Movie Café Menggunakan Metode Association Rule

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

IMPLEMENTASI ALGORITMA APRIORI DALAM MENENTUKAN PERSEDIAAN OBAT

Aplikasi Data Mining untuk meneliti Asosiasi Pembelian Item Barang di Supermaket dengan Metode Market Basket Analysis

ASSOCIATION RULES PADA TEXT MINING

BAB 2 LANDASAN TEORI Sistem Rekomendasi

BAB I PENDAHULUAN. Pesatnya pertumbuhan internet saat ini berdampak pada melimpahnya

IMPLEMENTASI DATA MINING ALGORITMA APRIORI PADA PENJUALAN SPAREPART MOTOR DI AHAS PUTRA MOTOR

BAB I PENDAHULUAN. 1.1 Latar Belakang

DAFTAR ISI. BAB I PENDAHULUAN Latar Belakang Masalah Rumusan Masalah Batasan Masalah Tujuan Penelitian...

BAB I PENDAHULUAN. mahasiswa yang seringkali meminjam buku harus mencari sendiri dirak rak

IMPLEMENTASI DATA MINING MENGGUNAKAN ALGORITMA ECLAT

RANCANG BANGUN APLIKASI DATA MINING ANALISIS TINGKAT KELULUSAN MENGGUNAKAN ALGORITMA FP-GROWTH (Studi Kasus Di Politeknik Negeri Malang)

Transkripsi:

CONTENT BASED RECOMMENDER SYSTEM MENGGUNAKAN ALGORITMA APRIORI Rahma Oktoria, Warih Maharani, dan Yanuar Firdaus Fakultas Informatika Institut Teknologi Telkom, Bandung rahmaoktoria@yahoo.com, dan wrh,yfa@ittelkom.ac.id ABSTRACT A recommender system (RS) in general has many benefits that are important to the user in everyday interactions using web based applications, especially in the field of e-commerce. Users face problems related to product selection, content, movies, books, and others to meet their needs. Therefore, the ability of a recommender machine is made with the purpose of assisting users in the process of generating output system that can adapt to their needs. Recommender System based on Content Filtering combined with Apriori algorithm is one RS approach implemented in this thesis. Apriori association rule-based algorithm is easy to implement because it is simple. Priori is assigned to mine the combination of featurs. Feature film which is a representation of the item description of the MovieLens dataset used in this thesis is a film genre. Generated rule mining process is intended to classify films in which each item is preferred by users. The result which are genre package associations must be wrapped in a film and is used as a barometer of the recommendations of film items in the testing data. The test results show a good performance of the system. The precision, recall and f-measure increase to optimum and go hand in hand while using minimum support = 2%, minimum confidence = 70%, and the training data = 70%. In this position, the engine performance is not only good, but also runing fast. Keywords: Recommender System, Content Filtering, Apriori, Spearman Correlation. 1. Pendahuluan Para pengguna atau user secara terus menerus dihadapkan ke dalam situasi dimana mereka memiliki banyak pilihan terhadap sesuatu dan membutuhkan bantuan dalam penggalian atau proses pemisahan dalam berbagai kemungkinan [8]. Internet Search Engines pada umumnya berpotensi menemukan ribuan situs-situs yang relevan untuk user sesuai kebutuhan dan kepentingan mereka [8]. Recommender system dapat membantu para pengguna menemukan informasi tersebut dengan memberikannya saran secara personal [18]. Kemampuan suatu recommender system adalah menyesuaikan output-nya sesuai karateristik user tertentu, dimana hal ini menyiratkan bahwa sistem tersebut harus dapat menyimpulkan apa yang user butuhkan berdasarkan kegiatan sebelumnya atau interaksi dengan user atau pengguna serupa lainnya [12]. 1.1 Latar Belakang Masalah Terdapat 2 pendekatan recommender system dalam proses rekomendasi, yaitu content based filtering dan collaborative filtering [8]. Dalam penelitian ini diimplementasikan pendekatan berbasiskan content. Kelebihan metode ini dibandingkan dengan collaborative filtering (CF) adalah dapat merekomendasikan item baru kepada user target berdasarkan kemiripan feature yang dikandung oleh item sebelumnya yang disukai user tersebut dengan melihat positif rating item, tidak seperti collaborative filtering yang sangat bergantung dengan perhitungan rating oleh user lainnya. Untuk menganalisis polapola kombinasi item dalam penelitian ini digunakan algoritma apriori. Kelebihan asosiasi rule dengan apriori ini adalah lebih sederhana dan dapat menangani data yang besar. Sedangkan algoritma lainnya memiliki kelemahan dalam penggunaan memori saat jumlah data besar, tentunya berpengaruh terhadap banyaknya item yang diproses. Penting tidaknya aturan asosisasi dapat diketahui dengan 2 parameter, minimum support (prosentase kombinasi item dalam database) dan minimum confidence (kuatnya hubungan antar item dalam aturan asosiatif), keduanya ditentukan oleh user [9]. Penggunaan apriori ditujukan untuk menemukan asosiasi rule dalam recommender system berbasis content ini yaitu menambang keterhubungan antara feature-feature yang terkandung dalam content-content yang dinilai positif oleh seorang user. Sehingga diharapkan, mesin recommender system yang dibangun ini dapat memberikan rekomendasi yang tepat bagi seorang user tersebut terhadap munculnya item baru nantinya. 1.2 Tujuan Tujuan dari penelitian ini adalah menganalisis asosiasi rule mining dengan algoritma Apriori di dalam mencari keterhubungan feature item film yang disukai oleh seorang user pada recommender system berbasiskan content dengan berdasarkan perhitungan precision, recall dan f-measure. 1.3 Perumusan Masalah Beberapa permasalahan yang diselesaikan dalam penelitian ini adalah sebagai berikut: a. Bagaimana menggali kombinasi feature-feature content (genre) yang terkandung dalam setiap film yang disukai user. b. Bagaimana mengukur dan menganalisis performansi algoritma apriori dalam recommender system based content tersebut. 124

2. Landasan Teori 2.1 Recommender System Recommender system telah menjadi bagian penting bagi user dalam interaksinya sehari-hari dengan aplikasi berbasiskan web, khususnya dalam bidang e-commerce [12]. Bisnis telah menyadari akan potensi pribadi dan sistem adaptif ini dalam rangka untuk meningkatkan penjualan dan mempertahankan pelanggan [12]. Demikian juga yang terjadi dengan pengguna web, dimana mereka datang untuk mengandalkan sistem ini sebagai alat bantu yang efisien dalam menemukan item yang menarik di ruang informasi yang besar [12]. 2.1.1 Content Based Filtering Penelitian ini menggunakan pendekatan content based filtering. Kelebihan recommender system dengan pendekatan content based filtering adalah memiliki kemampuan merekomendasikan item (contoh: film, lagu, artikel dll) yang sifatnya baru bagi user, karena prinsip kerjanya yaitu dengan melihat diskripsi content yang dikandung oleh item yang pernah diberi nilai rating tinggi sebelumnya oleh user. Berdasarkan data training, user model menginduksikan kemungkinan sistem penyaringan untuk mengklasifikasikan item yang tidak terlihat masuk ke dalam kelas positif c (relevan untuk user) atau ke dalam kelas negatif c (tidak relevan untuk user) [18]. 2.1.2 Association Rule Mining Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan (rule) asosiatif antara suatu kombinasi item [9]. Lebih jelasnya, association rule atau analisis afinitas berkenaan dengan studi tentang apa bersama apa [16]. Ada 2 tahap metodologi dasar analisis asosiasi [9] : a. Analisis pola frekuensi tinggi, Dimana: Support (A) = Jumlah transaksi mengandung A (1) Total transaksi b. Penbentukan aturan asosiatif, Dimana Nilai confidence suatu aturan A B diperoleh dari: Confidence P (B A) = Jumlah transaksi mengandung A dan B (2) Jumlah transaksi mengandung A 2.1.3 Algoritma Apriori Apriori merupakan algoritma berbasiskan asosiasi rule yang sederhana dalam implementasinya. Ada 2 proses utama dalam algoritma Apriori tersebut [2] : a. Step penggabungan yaitu: Ck dibangun dengan menggabungkan Lk-1 dengan dirinya. Keterangan: Ck = Kandidat itemset dari ukuran k; Lk = Frequent itemsets dari ukuran k. b. Step Pemangkasan yaitu: Setiap (k-1) itemsets yang bukan frequent tidak boleh menjadi suatu subset dari suatu frequent k-itemsets. 2.1.4 Pengukuran Performansi Untuk mengukur performansi sistem, digunakan 3 parameter performansi, yaitu: Precision = correctly_recommended_item (3) total_recommended_item Recall = correctly_recommended_item (4) total_item_liked_by_user F-Measure = (2*Precision*Recall) (5) Precision+Recall 3. Metode Penelitian Metode penelitian yang dilakukan adalah sebagai berikut : 1) Studi literatur, dengan mencari referensi yang berhubungan dengan Recommender System content based filtering, data mining, asosiasi rule mining, dan algoritma apriori. 2) Pengumpulan data pengujian dari movielens. 3) Analisis dan perancangan Recommender System. 4) Pengujian dan analisis kinerja sistem berdasarkan parameter performansi. Kesimpulan, yang diperoleh berdasarkan analisis yang telah dilakukan. 4. Implementasi Sistem Sistem ini dibangun menggunakan arsitektur client-server. Untuk lebih detailnya dijelaskan pada subbab dibawah ini. 4.1 Arsitektur Sistem Sebelum memberikan rekomendasi kepada user target, mesin mengolah user profile terlebih dahulu, dimana user profile terdiri dari data latih (training set) mengenai film-film yang pernah diberi nilai atau rating tinggi oleh user target tersebut untuk kemudian disaring kombinasi genre yang terdapat di user profile itu menggunakan algoritma Apriori. Kombinasi 125

genre yang dipilih dari banyaknya kemungkinan yaitu berdasarkan 2 parameter: minimum support (minsup) dan minimum confidence (mincof) yang ditentukan oleh user, dimana hal tersebut ditempuh dengan [19] : a. Mencari semua frequent itemset yaitu itemset dengan nilai support minimum support yang merupakan ambang yang diberikan oleh user. Dimana itemset itu merupakan himpunan item yaitu kombinasi genre film. b. Mencari aturan asosiasi yang confidence dari frequent itemset yang didapat. c. Sedangkan tahap selanjutnya adalah proses rekomendasi yaitu dilakukan dengan mencari rule-rule yang sesuai dengan target user yang didapat dari proses association rule mining sebelumnya. Rule-rule yang didapat mendeskripsikan kombinasi feature film (genre) yang dijadikan pertimbangan di dalam membuat rekomendasi film untuk target user. Layak tidaknya rekomendasi diukur dengan menghitung performansi precision, recal, dan f- measure. Sistem dibangun menggunakan bahasa pemrograman PHP berbasiskan client-server. Dimana server bekerja sebagai content based filtering engine yaitu memproses penambangan kaidah asosiasi rule terhadap genre yang dikandung film yang dinilai positif oleh user menggunakan algoritma Apriori sebelum merekomendasikan film baru kepada user target tersebut. Berikut ilustrasinya: Gambar 1. Arsitektur Recommender System 4.2 Alur Kerja Algoritma Apriori Sedangkan penjelasan alur kerja algoritma Apriori yang bekerja dari sisi server adalah sebagai berikut seperti telah dijelaskan pada subbab 4: Gambar 2. Diagram Alur Algoritma Apriori 5. Analisis dan Pengujian Sistem 5.1 Data Pengujian Data yang digunakan dalam penelitian ini berasal dari http://www.grouplens.org/node/12. Setelah melalui preprocesing, data ini dibagi berdasarkan rasio default (training 70% dan testing 30%) serta beberapa rasio lainnya berdasarkan kebutuhan skenario pengujian. Data training berasal dari item film yang dirating positif oleh user target, sedangkan data testing mengandung semua skala rating. Keduanya diproses, dipilih, diambil, ditujukan dari dan untuk user target itu sendiri yaitu individual user. Item film yang terdapat dalam dataset MovieLens dapat memiliki 1 atau lebih dari 1 genre. Rata-rata terdapat 2 genre dalam 1 buah film (paling banyak). Setiap genre (dari 19 type yang ada) tidak dapat dipisahkan satu sama lain cara pandangnya dalam proses rekomendasi (saat melihat diskripsi content) karena 1 film dalam analogi 126

market basket merupakan keranjang atau tempat parsel sedangkan genre merupakan kandungan atau barang yang ada dalam satu transaksi dalam hal ini adalah film. Frekuensi rating setiap user, berkisar antara 20 sampai dengan 700 buah rating dimana skala yang diberikan dalam menilai ketertarikan user yaitu 1 sampai 5 skala dengan makna awful, fairly bad, it s ok, will enjoy, must see. 5.2 Pengujian Pengaruh Perubahan Minimum Support Terhadap Kualitas Rekomendasi Pengujian ini untuk dilakukan untuk melihat pengaruh minimum support terhadap kualitas rekomendasi item film. Performansi 100 90 80 70 60 50 40 30 20 10 0 2 4 6 8 10 Minimum Support Rule Precision Recall F Measure Gambar 3. Grafik Rata-rata Performansi Sistem terhadap Perubahan Minimum Support Dari Gambar 3, dapat dilihat bahwa pada posisi minimum support = 2%, baik precision, recall dan f-measure berhasil mencapai nilai maximum-nya. Jadi, ketiga parameter utama performansi sistem tersebut mengalami kondisi ideal yaitu sistem bekerja dengan efektif pada saat minimum support = 2% karena rasio recall dan precision mengalami progress yang sama dan secara otomatis f-measure juga mengalami hal ini. Precision mencapai nilai 92.4%, recall 46%, sedangkan f-measure 60.4%. Pada waktu besar minimum support lebih besar dari 2%, ketiga parameter performansi sistem utama tersebut mengalami penurunan, walaupun saat minimum support = 6%, baik precision, recall dan f-measure kembali mengalami kenaikan namun tidak sebesar awalnya dengan minimum support = 2%. Kondisi ini terjadi akibat rule yang dihasilkan lebih banyak. Rule tersebut digunakan untuk melihat diskripsi content berupa asosiasi genre film. Jika terdapat lebih banyak rule maka sistem mampu melihat berbagai kemungkinan diskripsi asosiasi content film yang user suka. Sehingga saat melakukan rekomendasi, sistem memiliki lebih banyak dasar pertimbangan atau pengetahuan yang cukup mengenai kombinasi genre film yang disukai user. Dengan minimum support yang semakin kecil, maka performansi sistem menjadi lebih baik karena menghasilkan kombinasi genre yang bermacam-macam walaupun tingkat dukungan data kecil (pada data training). Artinya, kombinasi genre yang jarang sekalipun memiliki kesempatan kemunculan yang sama dengan kombinasi genre yang didukung banyak data latih sehingga kemungkinan menjadi candidate rule juga semakin besar. Semakin kecil minimum support yang diberikan, maka semakin besar juga kesempatan bagi seluruh kombinasi genre menjadi candidate rule. Sehingga, jika jumlah rule yang dihasilkan semakin banyak (faktor yang paling mencolok), maka waktu eksekusi program juga semakin tinggi. Untuk minimum support = 2%, sistem memakan waktu sekitar 0.396 second (waktu paling lama). Dapat dikatakan bahwa waktu terlama sekalipun tidak terlalu besar mengingat jumlah data rating user (sekaligus user target) yang dipilih tidak besar dengan rata-rata antara 108-113 rating saja. Recall disebut juga sebagai nilai perolehan dimana nilai ini menggambarkan seberapa banyak item yang tepat dari seluruh item yang seharusnya direkomendasikan kepada user mampu dimunculkan. Dari sisi sistem memang recall sangat penting sebab berhubungan dengan kemampuan sistem dalam mengeluarkan sebesar-besarnya item yang tepat bagi user, namun telah dijelaskan sebelumnya bahwa precision lebih diutamakan. Perolehan recall memang tidak sebesar precision yang hanya dapat dicapai paling maksimal adalah 46% pada saat minimum support = 2%. Semakin kecil minimum support semakin besar recall yang diperoleh dimana sistem yang dibangun mampu mencapai nilai optimumnya dalam memperoleh item yang relevan kepada user dengan minimum support = 2%. Hal ini juga berkaitan dengan jumlah kombinasi genre (berkesempatan menjadi candidate rule) yang dihasilkan semakin banyak dan untuk itu, pada saat minimum support = 2% waktu yang dibutuhkan juga semakin tinggi pada saat pengujian. Perolehan recall yang tidak sebesar precision disebabkan karena rule yang dihasilkan, sering mengandung kombinasi genre yang sama dengan rule lainnya. Sehingga walaupun jumlah rule banyak, tidak menjamin dapat memperoleh item yang relevan semakin banyak juga sebab koleksi kombinasi genre sebagai dasar rekomendasi yang terdapat pada itemset dalam ruleset jumlahnya sedikit. Namun recall dapat diperbaiki dengan memperkecil minimum support. 127

5.3 Pengujian Pengaruh Perubahan Minimum Confidence Terhadap Kualitas Rekomendasi Pengujian ini dilakukan untuk melihat pengaruh minimum confidence terhadap kualitas rekomendasi item film. Performansi 100 90 80 70 60 50 40 30 20 10 0 70 75 80 85 90 Minimum Confidence Rule Precision Recall F Measure Gambar 4. Grafik Rata-rata Performansi Sistem terhadap Perubahan Minimum Confidence Minimum confidence sangat mempengaruhi kinerja sistem pada tahap kedua ini yaitu dapat meningkatkan nilai precision dimana telah diketahui bahwa precision sangat diutamakan dalam melihat performansi sistem yang baik. Menggunakan variabel tetap minimum support = 2% dan data training = 70%, terlihat precision merangkak naik dari mulai minimum confidence 70% sampai dengan 90%. Precision mampu mencapai angka maksimal 94.9% dan pencapaian ini lebih besar dibanding saat skenario tahap pertama. Jika diperhatikan dengan seksama, di sisi lain nilai f-measure dan recall utamanya berangsur-angsur menurun seiring meningkatnya nilai minimum confidence. Berbagai macam faktor menjadi penyebabnya. Semakin kecil nilai minimum confidence, rule yang didapat semakin banyak sebab confidence berkaitan dengan pemilihan interest rule dimana dalam kondisi seperti ini, koleksi ruleset semakin tinggi seperti pada posisi minimum confidence 70%, rule yang dihasilkan paling banyak. Artinya, kombinasi genre yang telah memenuhi ambang batas minimum support besar kemungkinan memiliki kesempatan menjadi rule yang dapat dijadikan dasar pertimbangan rekomendasi. Namun terlihat jelas dalam Gambar 4 bahwa semakin tinggi jumlah rule yang dihasilkan tidak menjamin performansi sistem yaitu precision menjadi lebih baik, karena yang terpenting adalah kualitas kombinasi genre yang terdapat di dalam tubuh rule (itemset). Walaupun rule yang diperoleh sedikit, tetap dapat menjadi dasar rekomendasi jika rule tersebut mampu mewakili banyak data dan memenuhi ambang batas minimum confidence. Di sisi lain, recall dan f-measure mengalami penurunan seiring bertambahnya minimum confidence. Hal ini disebabkan oleh semakin sedikitnya rule yang diperoleh seperti penjelasan sebelumnya dimana confidence sangat berhubungan dengan pemilihan interest rule. Recall akan meningkat jika jumlah koleksi ruleset semakin banyak seperti pada saat posisi minimum confidence = 70%. Sistem memiliki koleksi rule yang lebih banyak sebagai dasar rekomendasi. Titik optimum performansi sistem dimana precision, recall, dan f-measure mengalami puncaknya secara bersama-sama adalah pada saat minimum confidence = 70%. Maka nilai ini dijadikan sebagai variabel tetap saat pengujian skenario 1 dan 3. Jumlah rule tidak terlalu mempengaruhi masalah waktu di sini. Ada faktor lain yang lebih mempengaruhi yaitu proses penguraian kombinasi genre yang telah memenuhi ambang minimum support sebelum menuju seleksi minimum confidence sebagai calon ruleset. Penguraian kombinasi genre adalah membedah semua kemungkinan kombinasi yang ada untuk setiap large itemset L1 dan seterusnya yang akan menjadi rule. Jika jumlah kemungkinan kombinasinya banyak maka waktu yang dibutuhkan semakin tinggi walaupun pada akhirnya kombinasi yang memenuhi minimum confidence atau menjadi rule sedikit. Sehingga saat minimum confidence = 85% dengan jumlah rule 31.18 buah saja, waktu yang dibutuhkan dapat mencapai 0.576 second (tertinggi) dibandingkan dengan posisi lainnya. Hal ini disebabkan juga karena jumlah data rating yang dipilih tidak besar seperti yang telah dijelaskan pada pengujian pertama. Oleh sebab itu, waktu paling lama sekalipun tidak sampai 1 menit atau tidak memakan durasi yang panjang. 6. Kesimpulan Berdasarkan analisis pengujian yang dilakukan, diperoleh kesimpulan bahwa: a. Apriori dapat diterapkan dalam Recommender based on Content Filtering.Tetapi metode ini memiliki kelemahan yaitu tidak dapat melacak deskripsi genre pada film baru karena ruleset yang dihasilkan kemungkinan tidak mampu mengakomodirnya. b. Performansi sistem mencapai titik optimum menggunakan minimum support = 2%, minimum confidence = 70%, dan data training = 70%. c. Semakin kecil minimum support, semakin besar kemungkinan kombinasi-kombinasi genre yang ada menjadi candidate rule, dan performansi sistem semakin baik ditunjukkan dengan kenaikan yang sama pada precision, recall dan f-measure dari ketiga pengujian. d. Semakin besar minimum confidence, semakin sedikit jumlah rule yang dihasilkan, namun semakin baik tingkat precision yang diperoleh karena ruleset yang didapat untuk rekomendasi semakin interest. 128

7. Keterbatasan Penelitian dan Saran Penelitian ini terbatas pada penggunaan dataset dari movielens yang telah tersedia. Saran untuk pengembangan penelitian ini adalah dengan menggunakan dataset yang berbeda dengan jumlah yang lebih besar. Selain itu dapat dilakukan penggabungan dengan pendekatan Recommender System yang lain seperti demographic filtering dan collaborative filtering. Daftar Pustaka [1] Aulia (2007). Recommender System Review, USA. [2] Bjork, Jonas (2008). Personalized TV and Content Recommender, Scandinavia. [3] Carmegnola, F., Cena, F., Console, L., Cortassa O., Gena,C., Goy A., and Torre I.. (2008). Tag-based User Modeling for Social Multi-Device Adaptive Guides, Dipartimento Di Informatica Universita, Torino. [4] Carl, (2009). Precision, Recall and the F-Measure, USA. [5] Charu, C., Wolf, J., Wu, Kun-Lung., S. Philip (1999). Horting Hatches an egg A new graph-theoritic approach to Collaborative Filtering, San Diego, California, USA. [6] Desrosiers, C., Karypis, G. (2009). A Comprehensive Survey of Neighbourhood-based Recommendation Methods, USA [7] Giri Sucahyo, Yudho, ( 2003). Data Mining Menggali Informasi Yang Terpendam, Jakarta. [8] GroupLens, About GroupLens, http://www.grouplens.org, Terakhir akses, 30 September 2010. [9] Iperpin. (2002). Recall & Precision, USA. [10] J. Pazzani, Michael, (2003). A Framework for Collaborative, Content-Based and Demographic Filtering, California. [11] Lin, Weiyang, A.Alvearez, Sergio and Ruiz (2001). Efficient adaptive-support association rule mining form recommender system, USA. 129