ANALISIS PERBANDINGAN METODE PEARSON DAN SPEARMAN CORRELATION PADA RECOMMENDER SYSTEM

dokumen-dokumen yang mirip
CONTENT BASED RECOMMENDER SYSTEM MENGGUNAKAN ALGORITMA APRIORI

PENDAHULUAN. 1.1 Latar Belakang

Analisis dan Implementasi Imputation-Boosted Neighborhood-Based Collaborative Filtering Menggunakan Genre Film

Rancang Bangun Movie Recommender System Dengan Metode Cluster-Based Smoothing Collaborative Filtering

Analisis dan Implementasi Prediksi Rating pada Memory-based Collaborative Filtering dengan Menggunakan Smoothing

DIGITAL CAKERY DENGAN ALGORITMA COLLABORATIVE FILTERING

BAB II LANDASAN TEORI

ANALISIS DAN IMPLEMENTASI METODE ITEM-BASED CLUSTERING HYBRID PADA RECOMMENDER SYSTEM

Penerapan Algoritma Collaborative Filtering Untuk Rekomendasi Games Hardware

BAB I PENDAHULUAN. Pesatnya pertumbuhan internet saat ini berdampak pada melimpahnya

SISTEM REKOMENDASI PEMINJAMAN VCD DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

BAB I PENDAHULUAN. 1.1 Latar Belakang

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

Recommendation System

Sistem Rekomendasi Film menggunakan Bisecting K-Means dan Collaborative Filtering

Sistem Rekomendasi Bacaan Tugas Akhir Jurusan Teknik Informatika Universitas Sriwijaya menggunakan Metode Collaborative Filtering dan Naive Bayes

PERANCANGAN PARAMETER TERBAIK UNTUK PREDIKSI PRODUKSI BAN GT3 MENGGUNAKAN JARINGAN SYARAF TIRUAN RESILIENT PROPAGATION

ANALISIS DAN IMPLEMENTASI CLUSTER-SMOOTHED PADA COLLABORATIVE FILTERING ANALYSIS AND IMPLEMENTATION OF CLUSTER-SMOOTHED FOR

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II LANDASAN TEORI

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENGAMBILAN MATA KULIAH PILIHAN MENGGUNAKAN METODE HYBRID

ANALISIS DAN IMPLEMENTASI SISTEM REKOMENDASI MENGGUNAKAN MOST-FREQUENT ITEM DAN ASSOCIATION RULE TECHNIQUE

REKOMENDASI PAKET PEMBELIAN BARANG PADA TOKO ONLINE DENGAN COLLABORATIVE FILTERING

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ABSTRAK. Kata kunci: collaborative filtering, multicriteria, sistem rekomendasi, traveler. vi Universitas Kristen Maranatha

BAB III LANDASAN TEORI

Pembuatan Modul Rekomendasi pada OpenCart Menggunakan Metode Item-Based Collaborative Filtering

3.1 Analisa Kebutuhan 3.2 Perancangan Penelitian 3.3 Teknik Analisis 3.4 Jadwal Penelitian. 3.1 Analisa Kebutuhan

BAB 1 PENDAHULUAN Latar Belakang

BAB III Landasan Teori

BAB 2 TINJAUAN PUSTAKA

BAB I PENDAHULUAN. bermunculan, baik yang menggunakan franchise ataupun yang menggunakan

SISTEM REKOMENDASI PADA BUKU DENGAN MENGGUNAKAN TAGS AND LATENT FACTORS BOOK RECOMMENDATION SYSTEM USING TAGS AND LATENT FACTORS

Royes Otpin S¹, Arie Ardiyanti Suryani², Warih Maharani³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB I PENDAHULUAN. Penelitian seputar sistem rekomendasi dalam satu dekade terakhir ini

BAB II LANDASAN TEORI

Danang Setyo Nugroho¹, Yanuar Firdaus A.w.², Warih Maharani³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Item Collaborative Filtering untuk

BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. tanggal 31 Desember Kelebihan atau ledakan informasi pada jaringan internet

BAB I PENDAHULUAN A. Latar Belakang

PERBANDINGAN EFEKTIFITAS METODE USER-BASED COLLABORATIVE FILTERING DENGAN METODE USER-ITEM BASED COLLABORATIVE FILTERING

BAB I PENDAHULUAN 1.1 Latar Belakang

Analisis Perbandingan Sistem Rekomendasi dengan Faktorisasi Matriks dan Pearson Berbasis Collaborative Filtering Pada Web E-Commerce

BAB I PENDAHULUAN. kecelakaan, kehilangan, kematian, kerusakan atau sakit.

BAB III METODOLOGI PENELITIAN

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. Pada penelitian sebelumnya yang dilakukan kan oleh Zhang, L. (Zhang, L.,

BAB III ANALISIS DAN PERANCANGAN SISTEM

SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Jurusan Informatika. Disusun Oleh: WINA ISTI RETNANI NIM.

Sistem Rekomendasi Mobil Berdasarkan Demographic dan Content-Based Filtering

BAB III ANALISIS DAN PERANCANGAN SISTEM

SISTEM REKOMENDASI KREDIT PERUMAHAN RAKYAT DENGAN MENGGUNAKAN METODE COLLABORATIVE FILTERING

BAB I PENDAHULUAN. 1.1 Latar Belakang

PERANCANGAN WEB RANK MENGGUNAKAN COLLABORATIVE FILTERING BERDASARKAN KEMIRIPAN KONTEN

TESIS USER-BASED COLLABORATIVE FILTERING DENGAN MEMANFAATKAN PEARSON-CORRELATION UNTUK MENCARI NEIGHBORS TERDEKAT DALAM SISTEM REKOMENDASI

SISTEM REKOMENDASI PERSONAL PADA TOKO BUKU ONLINE MENGGUNAKAN PENDEKATAN COLLABORATIVE FILTERING DAN ALGORITMA SLOPE ONE

SISTEM REKOMENDASI MATA KULIAH PILIHAN MAHASISWA DENGAN CONTENT-BASED FILTERING DAN COLLABORATIVE FILTERING (STUDI KASUS: UNIVERSITAS BRAWIJAYA)

BAB II TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

BAB II. Tinjauan Pustaka

Aplikasi Rekomendasi Film menggunakan Pendekatan Collaborative Filtering dan Euclidean Distance sebagai ukuran kemiripan rating

oleh PRITA DEWI HUTRIANA SARI NIM. M

BAB 2 LANDASAN TEORI. Universitas Sumatera Utara

BAB I PENDAHULUAN I-1

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI DAN ANALISIS ONLINE UPDATING REGULARIZATION KERNEL MATRIX FACTORIZATION MODEL PADA SISTEM REKOMENDASI

Kata kunci : citra, pendeteksian warna kulit, YCbCr, look up table

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERDASARKAN PREFERENSI DAN KEAHLIAN DOSEN MENGGUNAKAN EUCLIDIEN DISTANCE TUGAS AKHIR

PERBANDINGAN ALGORITMA COSINE SIMILARITY DAN CONFIDENCE PADA SISTEM REKOMENDASI DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

BAB III. Landasan Teori. Bab ini akan menjelaskan mengenai dasar teori yang digunakan oleh penulis sebagai acuan dalam membuat sistem.

PROTOTYPE SISTEM REKOMENDASI RUMAH MAKAN MENGGUNAKAN METODE K-NEAREST NEIGHBOUR BERBASIS WEB

ABSTRAK. Kata Kunci : Artificial Neural Network(ANN), Backpropagation(BP), Levenberg Marquardt (LM), harga emas, Mean Squared Error(MSE), prediksi.

Komparasi Metode Decision Tree dan K-Means Clustering Dalam Mengatasi Masalah Cold-start Pengguna Baru

SKRIPSI. Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Jurusan Informatika. Disusun Oleh : YOSEFIN EVA CHRISTANTI M

BAB I PENDAHULUAN. Pengguna Internet (31 Desember 2000) Afrika 1,037,524,058 4,514, ,609,620 2,527.4%

BAB III METODOLOGI PENELITIAN

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

Sistem Rekomendasi Lowongan Pekerjaan Untuk Fresh Graduate Menggunakan Metode Weighted Product Berbasis Android

SISTEM REKOMENDASI BAHAN AJAR UNTUK ELEARNING

BAB II KAJIAN PUSTAKA

1 BAB III METODOLOGI PENELITIAN. collaborative filtering ini digambarkan pada gambar 3.1

SISTEM REKOMENDASI PEMINJAMAN BUKU PADA PERPUSTAKAAN UIN SUSKA RIAU DENGAN METODE USER-BASED COLABORATIF FILTERING TUGAS AKHIR

Perbandingan Akurasi Backpropagation Neural Network dan ANFIS Untuk Memprediksi Cuaca

BAB I PENDAHULUAN 1.1 Latar Belakang

ABSTRAK. Kata Kunci : algoritma penjadwalan, linux virtual server, network address translation, network load balancing.

Pembuatan Sistem Rekomendasi Menggunakan Decision Tree dan Clustering

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

MODEL SISTEM PENENTUAN PRIORITAS PENERIMA BEASISWA BERBASIS MULTI CRITERIA DECISION MAKING

PERBANDINGAN METODE PROFILE MATCHING DAN SIMPLE ADDITIVE WEIGHTING PADA PENENTUAN JURUSAN SISWA KELAS X SMA N 2 NGAGLIK

BAB II TINJAUAN PUSTAKA

Realisasi Optical Orthogonal Codes (OOC) dengan korelasi maksimum satu Menggunakan Kode Prima Yang Dimodifikasi

ERROR-TOLERANT FASCICLES UNTUK COLLABORATIVE FILTERING ABSTRAK

PERBANDINGAN K-NEAREST NEIGHBOR DAN NAIVE BAYES UNTUK KLASIFIKASI TANAH LAYAK TANAM POHON JATI

Kata kunci : Slant correction, jaringan saraf tiruan, multilayer perceptron, backpropagation.

PREDIKSI TIME SERIES TINGKAT INFLASI INDONESIA MENGGUNAKAN EVOLUTION STRATEGIES

PENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI

SISTEM REKOMENDASI PRODUK SEPATU DENGAN MENGGUNAKAN METODE COLLABORATIVE FILTERING

Implementasi Metode K-Nearest Neighbor Pada Aplikasi Data Penjualan PT. Multitek Mitra Sejati

Transkripsi:

ANALISIS PERBANDINGAN METODE PEARSON DAN SPEARMAN CORRELATION PADA RECOMMENDER SYSTEM Rika Sania, Warih Maharani, dan Angelina Prima K Fakultas Informatika Institut Teknologi Telkom, Bandung ran_mour@yahoo.com,wrh@ittelkom.ac.id,apk@ittelkom.ac.id. ABSTRACT The internet development causes information overload, where users have difficulties in making decisions by the presence of too much information. One solution to ease the users in finding the required information is the recommender system. Recommender system is a system that can give recommendation in terms of rating prediction of an item, based on the similarity of the user characteristic in giving information. Therefore, in this research, we implement and analyze userbased Collaborative Filtering Recommender System, which applies Pearson Correlation and Spearman Correlation. Pearson Correlation and Spearman Correlation are used to compute user s rating in giving similarity. The parameter used in the analysis is the threshold co-rated items size and the neighbourhood size, measured by Mean Absolute Error. Based on the analysis, Pearson Correlation and Spearman Correlation produce prediction accuracy that increases along with the increase of the number of co-rated items. The larger the neighbourhood size, the better the prediction accuracy is. The prediction accuracy also get better with a larger training set size. The recommendation of both correlation shows that the difference of error rates is relatively small, with the Pearson Correlation s error rate is smaller than the Spearman Correlation. Keywords: Recommender System, Collaborative Filtering, Pearson Correlation, Spearman Correlation. 1. Pendahuluan Recommender system adalah sebuah sistem yang dapat memberikan rekomendasi berupa prediksi rating terhadap suatu item (film, buku, lagu, berita, humor dan sebagainya). Teknik yang paling umum digunakan dalam memprediksi kecenderungan user dalam recommender system, adalah Collaborative filtering [1]. Collaborative filtering memberikan informasi yang melibatkan kolaborasi antara beberapa pengguna, beberapa sudut pandang dan kondisi dimana tersedia informasi history dari pengguna [8]. Untuk mencari kesamaan antar user, dilakukan perhitungan korelasi, dengan semakin tinggi nilai korelasi, mengindikasikan user yang memiliki interest yang mirip. Pearson melakukan pengukuran korelasi secara langsung dan merupakan standar pengukuran korelasi karena pengukurannya memberikan hasil korelasi yang baik antara dua variabel [5], sedangkan Spearman menggunakan perhitungan ranking dan mampu menghindari masalah normalisasi rating [4]. 1.1 Latar Belakang Masalah Saat ini terdapat dua metode umum terhadap pembangunan sistem rekomendasi, yaitu Content-Based Filtering (CB) dan Collaborative filtering (CF) [1]. Teknik yang paling umum digunakan dalam memprediksi kecenderungan user dalam recommender system, adalah Collaborative filtering [1]. Collaborative filtering memberikan informasi yang melibatkan kolaborasi antara beberapa pengguna, beberapa sudut pandang, dan kondisi dimana tersedia informasi history dari pengguna [8]. Dasar dari algoritma CF adalah merekomendasikan item kepada user berdasarkan preferensi user dengan kemiripan interest [1]. User-based Collaborative filtering mencari kesamaan di antara user untuk menghasilkan rekomendasi. Untuk mencari kesamaan antar user, dilakukan perhitungan korelasi, dengan semakin tinggi nilai, mengindikasikan user yang memiliki interest yang mirip. Pearson melakukan pengukuran korelasi secara langsung dan merupakan standar pengukuran korelasi karena pengukurannya memberikan hasil korelasi yang baik antara dua variabel [5], sedangkan Spearman menggunakan perhitungan ranking dan mampu menghindari masalah normalisasi rating [4], sehingga bisa diukur metode mana yang lebih baik diimplementasikan dalam recommender system dengan dataset yang ada. Oleh karena itu, dalam penelitian ini diimplementasikan kedua metode tersebut pada Recommender System untuk melihat akurasi hasil prediksi yang dihasilkan. Hasil yang didapat digunakan untuk mengetahui performansi kedua korelasi menggunakan dataset yang tersedia. 1.2 Tujuan Tujuan dari penelitian ini adalah membandingkan performansi Pearson Correlation dan Spearman Correlation pada sistem rekomendasi yang menggunakan Collaborative filtering. Selain itu dilakukan pengukuran dan analisis terhadap tingkat error hasil prediksi rating dengan menggunakan MAE (Mean Absolute Error) berdasarkan threshold co-rated items dan ukuran neigbourhood. 1.3 Perumusan Masalah Beberapa permasalahan yang diselesaikan dalam penelitian ini adalah sebagai berikut: a. Bagaimana menerapkan recommender system menggunakan Pearson dan Spearman Correlation. 99

b. Bagaimana mengevaluasi hasil prediksi rating sistem rekomendasi pada Pearson Correlation dan Spearman Correlation menggunakan MAE (Mean Absolute Error). 2. Landasan Teori 2.1 Recommender System Secara umum, Recommender System dapat digambarkan sebagai berikut: Gambar 1. Gambaran umum Recommender System Proses prediksi dalam user-based CF meliputi langkah-langkah, yaitu mengukur similaritas, memilih nearest neighborhood, dan prediksi item [9]. Pada user-based CF, rating active user diprediksi berdasarkan informasi mengenai active user yang dikalkulasikan dari user database. 2.1.1 User-based Collaborative Filtering Dalam membangun recommender system, dilakukan perhitungan similaritas antara active user dengan training user [5] untuk kemudian diukur nearest neighborhood [8]. Untuk mengumpulkan nearest neighbour, ada beberapa metode yang telah digunakan oleh para researcher CF. Metode untuk memilih nearest neighbourhood menggunakan threshold, yaitu dengan memilih user yang memiliki persamaan yang nilainya melebihi threshold yang ditentukan atau dengan mengambil user dengan high rank [5]. Berikutnya, adalah memberikan prediksi item untuk active user untuk item yang belum pernah dirating oleh active user [8]. 2.1.2 Pearson Correlation Pearson Correlation mengukur hubungan linear antara dua variabel dan memiliki nilai antara -1 sampai 1, dimana -1 melambangkan korelasi negatif dan 1 menunjukkan korelasi positif, mengindikasikan user yang memiliki interest kesamaan yang tinggi [8]. Pada Recommender System, Pearson Correlation bernilai minimal 0. Pearson Correlation dikalkulasikan dengan persamaan berikut [4] : Corr (u,v) = (1) Corr(u,v) adalah korelasi antara user u dengan user v adalah rating tiap item i dari user u adalah rata-rata rating user u adalah rata-rata rating user v 2.1.3 Spearman Correlation Spearman Correlation juga digunakan untuk mengukur hubungan linear antara dua variable [5]. Berbeda dengan Pearson, Spearman mempertimbangkan ranking, sehingga rating user akan diubah terlebih dahulu menjadi nilai ranking, kemudian dari hasil nilai ranking tersebut, nilai korelasi akan diukur [7]. Korelasi Spearman menghitung korelasi antara dua user u dan v dengan persamaan sebagai berikut [7] : Corr (u,v) = (2) adalah ranking tiap item i dari user u adalah rata-rata ranking user u adalah ranking tiap item i dari user v 100

2.1.4 Significance Weighting Significance Weighting adalah penambahan bobot pada similarity yang memiliki co-rated items yang sedikit [11]. Korelasi antara dua user yang memiliki co-rated items kurang dari nilai threshold yang ditentukan akan ditambahkan bobot dengan persamaan berikut: = (3) W ax adalah nilai korelasi yang telah ditambahkan significance weighting wax adalah nilai korelasi active user dengan neighbor adalah jumlah co-rated items n adalah nilai threshold co-rated items 2.1.5 Perhitungan Prediksi Prediksi dihasilkan dari weighted average dari deviasi mean neighbour active user dengan rumus sebagai berikut [1] : adalah prediksi user a terhadap item i adalah jumlah neighbour target user (4) 2.1.6 Rekomendasi Sistem Untuk evaluasi performansi, Collaborative filtering menggunakan MAE (Mean Absolute Error) [1]. MAE mengukur deviasi absolut antara prediksi rating dengan rating aktual. Semakin kecil nilai MAE, maka prediksi yang dihasilkan semakin baik [2].Untuk menghitung nilai MAE dapat menggunakan fungsi sebagai berikut: n adalah jumlah data yang akan dihitung MAE-nya fi adalah nilai dari prediksi yang dihitung yi adalah nilai actual prediksi yang terdapat pada test set (5) 3. Metode Penelitian Metode penelitian yang dilakukan adalah sebagai berikut: 1) Studi literatur, dengan mencari referensi yang berhubungan dengan Recommender System menggunakan metode Pearson dan Spearman. 2) Analisis dan perancangan Recommender System. 3) Pengujian dan analisis kinerja sistem berdasarkan parameter-parameter yang berpengaruh terhadap Recommender System. 4) Kesimpulan, yang diperoleh berdasarkan analisis yang telah dilakukan. 4. Implementasi Sistem Sistem ini dibangun menggunakan arsitektur client-server. Untuk lebih detailnya dijelaskan pada subbab dibawah ini. 4.1 Skema Sistem Skema Sistem yang akan dibangun adalah sebagai berikut: Gambar 2. Skema Implementasi Recommender System Recommender system yang dibangun adalah sistem berbasis client-server yang dibangun menggunakan Java RMI (Remote Method Invocation). Dengan menggunakan arsitektur Java RMI, dapat memungkinkan client memanggil method yang terdapat pada server melalui objek yang ada di client. Pada sisi server menggunakan aplikasi open source Tomcat, sedangkan pada sisi client menggunakan aplikasi web browser. Data yang digunakan dalam pengujian sistem adalah data 101

yang berasal dari MovieLens [http://www.grouplens.org/], yang merupakan situs yang melakukan studi riset pada recommender system. Dataset MovieLens terdiri dari 943 user yang telah memberikan rating terhadap 1682 item dengan total 100.000 rating. Pada pengujian sistem, 100.000 rating tersebut akan dibagi menjadi 2, yaitu sebagai training set dan test set. 4.1.1 Pearson Correlation Berikut ini adalah skema perhitungan Pearson Correlation: Gambar 3. Diagram Blok Pearson Correlation Berdasarkan Gambar 3, diukur korelasi antara active user dengan user lain yang memiliki co-rated items untuk kemudian dihitung rata-rata rating keduanya. Selanjutnya dilakukan perhitungan nilai kovarian dan standar deviasinya sehingga dihasilkan nilai similaritas yang akan digunakan untuk menghitung nilai prediksi [8]. 4.1.2 Spearman Correlation Pada dasarnya, proses perhitungan nilai Pearson Correlation dan Spearman Correlation prinsipnya sama. Perbedaannya adalah pada perhitungan Spearman Correlation, dilakukan pengurutan nilai rating sehingga diperoleh data rating yang terurut untuk digunakan pada proses selanjutnya. 5. Analisis dan Pengujian Sistem Pada bagian ini diujikan 2 metode correlation dalam Recommender System untuk kemudian dibandingkan keduanya dan dianalisis hasil kedua metode tersebut. 5.1 Pengujian Perbandingan Pearson dan Spearman Correlation Pengujian Pearson dan Spearman Correlation merupakan pengujian untuk mengetahui hasil korelasi jika dihadapkan pada beberapa kasus pola data rating. 5.1.1 Pengujian Kasus 1 Pengujian ini menggunakan data 2 user yang merating 10 item dimana hanya terdapat 1 perbedaan rating dari ke-10 item yang telah dirating. Gambar 4. Grafik Perbandingan Pearson dan Spearman Corelation pada Kasus 1 Kedua user memberi rating pada co-rated items dengan nilai yang sama kecuali pada satu item, yaitu item 7. Hal ini berarti nilai korelasi kedua user seharusnya tinggi. Berdasarkan pengujian, nilai korelasi yang dihasilkan Spearman lebih tinggi daripada Pearson, karena pada data rating tersebut terdapat pencilan. 5.1.2 Pengujian Kasus 2 Pengujian ini menggunakan data pola rating dimana kedua user memberi nilai rating co-rated item dengan nilai yang sama terhadap semua item, sehingga korelasi yang dihasilkan seharusnya tinggi. 102

Gambar 5. Grafik Perbandingan Pearson dan Spearman Corelation pada Kasus 1 Pola rating tersebut merupakan pola dimana kedua user memberi nilai rating co-rated item dengan nilai yang sama terhadap semua item, sehingga korelasi yang dihasilkan seharusnya tinggi. Dari tabel tersebut dapat dilihat bahwa kedua korelasi memberikan nilai yang besar, yaitu korelasi dengan nilai 1. Pearson dan Spearman nilainya sama karena normalisasi pada rating maupun ranking tidak mengalami perubahan. 5.1.3 Pengujian Kasus 3 Pengujian pada kasus ketiga dilakukan dengan menggunakan pola rating yang berdekatan. Gambar 6. Grafik Perbandingan Pearson dan Spearman Corelation pada Kasus 3 Pada pola rating tersebut, nilai korelasi seharusnya tinggi karena pattern rating dari kedua user berdekatan. Berdasarkan pengukuran yang dilakukan, diperoleh bahwa hasil Pearson lebih tinggi daripada Spearman, karena pola rating user tersebar sehingga nilai dengan menggunakan data rating asli memberikan nilai korelasi yang lebih tinggi. Substitusi rating menjadi ranking menjadikan nilai yang dihasilkan Spearman berbeda dengan Pearson. 5.2 Pengujian Berdasarkan Threshold Co-rated Items Berikut adalah hasil pengujian menggunakan MAE untuk nilai threshold co-rated items dengan menggunakan 5-cross validation yang disediakan oleh data dari MovieLens. Gambar 7. Grafik Pengaruh Threshold Co-rated Items Berdasarkan hasil pengujian, semakin besar threshold co-rated items, maka semakin kecil MAE-nya, yang berarti akurasi prediksi yang dihasilkan semakin tinggi. Hal ini terjadi karena semakin tinggi nilai threshold co-rated items, maka semakin banyak data point yang ada untuk dibandingkan dengan active user sehingga korelasi yang dihasilkan semakin berbobot. Hal ini menyebabkan prediksi rating menjadi naik. 103

5.3 Pengujian Berdasarkan Ukuran Neighbourhood Analisis ukuran neighbourhood terdiri dari pengujian berdasarkan best n neighbor dan berdasarkan nilai threshold. 5.3.1 Analisis ukuran neighbourhood dengan best n neighbour Pada pengujian ukuran neighbourhood, dataset yang dipakai adalah 5-cross validation yang disediakan oleh MovieLens dengan parameter training set berjumlah 0.8 dari jumlah dataset keseluruhan.berikut ini adalah hasil pengujian MAE untuk ukuran neighbourhood menggunakan best n-neighbour. Gambar 8. Grafik Pengaruh Ukuran Neighbourhood Dengan Best and Neighbour Semakin besar jumlah neighbor, mengakibatkan nilai MAE menjadi semakin kecil. Hal ini terjadi karena dalam penghitungan prediksi, active user hanya memilih neighbour dari kandidat neighbour sejumlah ukuran tertentu, jika ukuran neighbourhood besar maka semakin banyak user yang berkontribusi terhadap hasil prediksi, sehingga menyebabkan prediksi rating menjadi lebih baik. Secara rata-rata akurasi prediksi Pearson lebih tinggi daripada Spearman karena dalam dataset, range rating hanya memiliki sedikit nilai yang mungkin. 5.3.2 Analisis Ukuran Neighbourhood Dengan Threshold Pada pengujian analisis neighbourhood dengan batasan nilai threshold, nilai threshold yang diuji adalah 0.1 hingga 0.9 dengan ratio 0.1.Berikut adalah hasil pengujian terhadap MAE nya: Gambar 9. Grafik Pengaruh Ukuran Neighbourhood dengan Threshold Untuk pengujian pada Pearson Correlation maupun Spearman Correlation, semakin besar nilai threshold, mengakibatkan nilai MAE menjadi semakin tinggi. Hal ini terjadi karena dengan nilai threshold yang semakin besar, ukuran neighbourhood semakin kecil sehingga user yang berkontribusi terhadap hasil prediksi lebih sedikit. Hal ini menyebabkan prediksi rating menjadi turun. Perbedaan nilai Pearson dan Spearman disebabkan penghitungan Spearman Correlation yang tidak mengkomputasikan data asli secara langsung ke dalam perhitungan, sehingga menyebabkan nilai yang berbeda dengan Pearson. 6. Kesimpulan Berdasarkan analisis pengujian yang dilakukan, diperoleh kesimpulan bahwa performansi User-based Collaborative Filtering Recommender System menggunakan Pearson Correlation memberikan nilai error yang lebih kecil dibandingkan Spearman Correlation. Pearson Correlation dan Spearman Correlation akan memberikan korelasi yang sama jika dua user yang diujikan memberi rating terhadap co-rated items dengan nilai yang sama. Selain itu, semakin besar threshold co-rated items, nilai MAE yang dihasilkan semakin kecil, sehingga akurasi prediksi menjadi lebih baik. Ukuran neighborhood juga mempengaruhi akurasi prediksi, dimana semakin besar jumlah nearest neighbour, nilai MAE yang dihasilkan semakin kecil, sehingga akurasi prediksi menjadi lebih baik. 104

7. Keterbatasan Penelitian dan Saran Penelitian ini terbatas pada penggunaan metode similarity Pearson dan Spearman Correlation untuk dapat memberikan rekomendasi film kepada pengguna. Pada penelitian ini tidak mempertimbangkan konten dari item yang direkomendasikan maupun karakteristik user profilenya. Saran untuk pengembangan penelitian ini adalah pemanfaatan konten item dan karakteristik user profile untuk dapat menghasilkan rekomendasi yang lebih baik. Selain itu, dapat digunakan variance weighting pada pembobotan korelasi untuk menghindari penghitungan korelasi pada item yang terlalu popular. Daftar Pustaka [1] Bjork, Jonas. (2008). Personalized TV and Content Recommender, Lulea University of Technology, Scandinavia [2] Carmegnola, F., Cena, F., Console, L., Cortassa O., Gena, C. Goy A., Torre I. (2008). Tag-based User Modeling for Social Multi-Device Adaptive Guides, Dipartimento Di Informatica, Torino [3] Charu, C., Wolf, J., Wu, Kun-Lung., S. Philip (1999). Horting Hatches an egg A new graph-theoritic approach to Collaborative Filtering, USA. [4] Desrosiers, C., Karypis, G. (2009). A Comprehensive Survey of Neighbourhood-based Recommendation Methods, USA. [5] Herlocker, J., Konstan, J., Terveen, L., Borchers, A., Riedl, J. (1999)..An Algorithmic Framework for Performing Collaborative Filtering, Berkeley, CA, USA. [6] Herlocker, J., Konstan, J., Terveen, L., Riedl, J. ( 2001). Evaluating Collaborative Filtering Recommender System, USA. [7] Herlocker, J., Konstan, J., Riedl, J. (2002). An Empirical Analysis of Design Choices in Neighborhood-Based Collaborative Filtering Algorithms, USA. [8] Kwon, H., Lee, T., Hong, K. (2009). Improved Memory-based Collaborative Filtering using Entropy-based Similarity Measures, Hong Kong. [9] Mortensen, Magnus. (2007). Design and Evaluation of a Recommender System, USA. [10] Schafer, J.B., Frankowski, D., Herlocker, J., Shilad, Sen. (2007). Collaborative Filtering Recommender System, USA. [11] Sandvig, JJ., Mobasher, B., Burke, R. (2007). Impact of Relevance Measures on the Robustness and Accuracy of Collaborative Filtering, Regensburg, Germany. 105