BAB I PENDAHULUAN 1.1 Latar Belakang Pengguna internet di dunia mengalami peningkatan. Statistik pengguna internet berdasarkan hasil survey Nielsen Online, yaitu pada tanggal 31 Maret 2011 menunjukkan bahwa 2.095.006.005 dari 6.930.055.154 penduduk dunia menggunakan internet (Group, 2012). Dibanding dengan pengguna internet pada tahun 2000 dan 2011, peningkatan terjadi sebesar 480.4%. Untuk lebih jelasnya dapat dilihat pada tabel dibawah ini yang diadaptasi dari (Group, 2012). Tabel 1 World internet usage and population Region Dunia Populasi (2011) Pengguna Internet (31 Desember 2000) Data Terakhir Pengguna Internet Perkembangan 2000-2011 Afrika 1,037,524,058 4,514,400 118,609,620 2,527.4% Asia 3,879,740,877 114,304,000 922,329,554 706.9% Eropa 816,426,346 105,096,093 476,213,935 353.1% Timur Tengah 216,258,843 3,284,800 68,553,666 1,987.0% Amerika Utara 347,394,870 108,096,800 272,066,000 151.7% Amerika Latin 597,283,165 18,068,919 215,939,400 1,037.4% Australia 35,426,995 7,620,830 21,293,830 179.4% TOTAL (Dunia) 6,930,055,154 360,985,492 2,095,006,005 480.4% Dari sekian banyak pengguna internet, pencarian mengenai kategori Arts & Entertainment merupakan kategori yang paling banyak dicari oleh pengguna internet. Pada tahun 2011, kategori Arts & Entertainment menduduki posisi pertama sebagai kategori yang paling banyak dicari oleh pengguna internet di mesin pencari Google untuk kata kunci musik 1
BAB I Pendahuluan 2 dengan memperoleh persentase 50 75 % (Google, 2011). Dari persentase 50 75 % tersebut, 75 100 % adalah pengguna yang mencari informasi mengenai musik dan audio. Pada tahun 2011 juga, lebih dari 60.000.000 data lagu diperoleh dari aplikasi audioscrobbler semua pengguna (last.fm, 2011). Data lagu meliputi data lagu nasional dan internasional. Hal tersebut menandakan bahwa musik merupakan kata kunci yang paling banyak dicari oleh pengguna internet dan pengguna internet disediakan begitu banyak pilihan data lagu. Sebelumnya, (Wiranto, 2010) sudah menuliskan bahwa tipe pencari pertama lebih mudah mendapatkan informasi yang diinginkan karena sudah memiliki referensi yang jelas dan cukup dibantu dengan search engine, sedangkan tipe pencari kedua sulit mendapatkan informasi yang diinginkan karena hanya memiliki topik tertentu. Untuk membantu pencari tipe kedua ini dibutuhkan mesin pencari yang disertai dengan sistem yang dapat memberikan rekomendasi, yaitu sistem rekomendasi (Wiranto, 2010). Sistem rekomendasi adalah perangkat lunak dan teknik yang mengberikan saran-saran untuk item yang bermanfaat bagi pengguna (Ricci, et al., 2011). Ada beberapa metode yang digunakan untuk sistem rekomendasi seperti, collaborative filtering, content-based filtering, hybrid recommendation, dan knowledge-based recommendation (Jannach et al., 2011). Collaborative filtering merupakan metode sistem rekomendasi yang memanfaatkan data komunitas. Content-based merupakan metode sistem rekomendasi yang menganalisis dokumen atau deskripsi dari suatu item yang telah dinilai oleh seseorang sebelumnya (Ricci et al., 2011). Knowledge-based merupakan metode rekomendasi yang memanfaatkan kebutuhan seseorang dan pengetahuan mengenai domain produk (Ricci et al., 2011). Sedangkan, hybrid merupakan kombinasi dari dua atau lebih metode-metode sistem rekomendasi yang telah disebutkan sebelumnya. Maka dari itu, terdapat dua metode yang memanfaatkan data komunitas, yaitu collaborative filtering dan hybrid recommendation (apabila menggabungkan collaborative filtering dengan metode lainnya), namun metode collaborative filtering merupakan teknik yang telah sukses dan paling banyak digunakan dalam pengembangan sistem perekomendasi sampai saat ini dibandingkan metode yang lain (Konstan et al., 1997).
BAB I Pendahuluan 3 Sistem rekomendasi dengan pendekatan collaborative filtering akan bekerja dengan cara menghimpun feedback pengguna dalam bentuk eksplisit dan implisit. Feedback secara eksplisit merupakan opini yang diberikan pengguna mengenai suatu item. Sedangkan, feedback secara implisit merupakan opini berdasarkan kebiasaan pengguna. Dalam dunia nyata, kebanyakan sistem rekomendasi menggunakan feedback eksplisit dan implisit, namun feedback yang diterima akan berlebihan (Liu et al., 2010). Feedback berlebihan yang dimaksud yaitu saat sistem menerima satu feedback dari pengguna, maka pengguna tersebut mendapatkan rekomendasi, namun ketika sistem tersebut menerima feedback baik secara explicit maupun implicit, maka akan menghasilkan rekomendasi dari berdasarkan kedua feedback tersebut, sehingga hasil yang direkomendasikan akan berlebihan. Menurut hasil penelitian yang dilakukan oleh Yifan Hu, Yehuda Koren, dan Chris Volinsky (Hu et al., 2008), mereka membuat suatu pemodelan dengan menggunakan metode collaborative filtering yang hanya memanfaatkan feedback secara implisit untuk sistem rekomendasi acara televisi. Pemodelan tersebut menggunakan dua pendekatan yaitu pendekatan secara personal ( neighborhood models ) dan pendekatan secara non-personal ( latent factor models ). Ketiga orang tersebut menyimpulkan bahwa rekomendasi yang dihasilkan dengan pendekatan secara personal lebih baik dari pendekatan secara non-personal. Berdasarkan hasil kesimpulan dari penelitian Yifan Hu, Yehuda Koren, dan Chris Volinsky diatas, yaitu bahwa pendekatan secara personal lebih baik dari pendekatan secara nonpersonal maka sistem rekomendasi lagu yang akan dibuat menggunakan pendekatan personal. Dalam pendekatan personal ini sistem rekomendasi lagu akan menggunakan dua pemodelan, yaitu secara model ke tetanggaan ( neighborhood model ). 1.2 Rumusan Masalah Berdasarkan latar belakang yang diuraikan sebelumnya, maka dibuat rumusan masalah, yaitu membuktikan bahwa dengan hanya memanfaatkan implicit feedback dapat menghasilkan rekomendasi lagu secara personal.
BAB I Pendahuluan 4 1.3 Tujuan Sistem Berdasarkan hasil perumusan masalah yang diuraikan sebelumnya, maka tujuan dari sistem yang akan dibuat, yaitu membuat suatu sistem yang dapat merekomendasikan lagu secara personal dengan menerapkan metode Neighborhood Models yang hanya memanfaatkan implicit feedback, sehingga sistem dapat menghasilkan rekomendasi lagu secara personal. 1.4 Batasan Masalah Adapun batasan masalah dari sistem yang akan dibuat yaitu sebagai berikut : 1. Sistem memanfaatkan data-data implicit feedback yang sudah disediakan pada situs last.fm 2. Implicit feedback yang dimanfaatkan yaitu berapa kali pengguna mendengarkan lagu, sehingga pengguna secara tidak langsung memberikan penilaian terhadap lagu yang didengarkan. 3. Sistem hanya menampilkan hasil rekomendasi berupa daftar lagu yang memiliki nilai similarity terdekat dengan lagu yang sudah didengarkan. 1.5 Metode Pengerjaan Berikut ini merupakan tahapan kegiatan dalam pelaksanaan tugas akhir : 1. Penentuan topik, ruang lingkup, dan perumusan masalah Dalam menentukan topik dilakukan dengan cara diskusi secara berkelompok baik secara mandiri maupun dengan melibatkan pembimbing dan koordinator tugas akhir. Hasil dari diskusi ini yaitu topik yang akan dikerjakan pada tugas akhir, dengan ruang lingkup dan perumusan masalah yang mengacu pada salah satu jurnal yang didapat pada situs Pennsylvania State University dan aplikasi sejenis yang sudah ada, yaitu situs www.last.fm. 2. Studi literatur dan tinjauan pustaka Pada tahap ini dilakukan dengan mengumpulkan referensi dari baik buku ( Recommendation System, Recommender Systems Handbook, Collective Intelligence in Action, Mahout in Action ), jurnal ( Collaborative Filtering for Implicit Feedbacks
BAB I Pendahuluan 5 Datasets ), artikel, dan aplikasi sejenis ( www.last.fm ). Adapun tinjauan pustaka yang telah ditentukan yaitu sebagai berikut : 1) Sistem Rekomendasi 2) Collaborative Filtering ( neighborhood models, association rule mining ) 3. Analisis Sistem Pada tahap ini dilakukan dengan menganalisis kebutuhan dari pada sistem rekomendasi lagu, analisis sistem dilakukan berdasarkan tinjauan pustaka yang telah ditentukan sebelumnya, yaitu menganalisis metode yang ada pada sistem rekomendasi ( neighborhood models, association rule mining ), menganalisis perilaku pengguna terhadap sistem yang akan dibuat, serta menganalisis dataset yang telah didapat. 4. Perancangan Pada tahap ini dilakukan dengan merancang sistem sesuai dengan hasil analisis dan kebutuhan sistem, yaitu merancang basis data, namun rancangan tidak dilakukan dari awal karena memanfaatkan data yang sudah ada; merancang algoritma. 5. Implementasi Pada tahap ini dilakukan dengan melakukan implementasi terhadap perancangan yang sudah dibuat sebelumnya sehingga kebutuhan sistem dapat terpenuhi. 6. Pengujian Pada tahap ini dilakukan dengan memasukan dataset yang didapat dari situs last.fm, kemudian sistem memproses inputan tersebut, dari hasil yang dikeluarkan oleh sistem yaitu berupa daftar rekomendasi untuk setiap pengguna, kemudian diambil sampel 5 pengguna sebagai responden yang menilai hasil daftar rekomendasi yang dihasilkan oleh sistem. Dari penilaian responden tersebut menjadi ukuran hasil rekomendasi tersebut ukuran pendekatan keinginan pengguna.