Vo. 7 No. 1 Agustus 014 SISTEM REKOMENDASI: BUKU ONLINE DENGAN METODE COLLABORATIVE FILTERING Moh. Irfan 1, Andharini Dwi C, Fia Hastarita R. 3 1,,3 Progra Studi Teni Inforatia, Universitas Trunojoyo Madura Masu: 5 Ari 014, revisi asu : 19 Juni 014, diteria: 7 Jui 014 ABSTRACT The boo is a source of inforation regarding a aspects of ife, especiay education. However, ow interest in reading aong the pubic is a ajor issue in education today. Recoendation systes can hep recoend the reader to ore easiy obtain inforation about the boos to be read. Therefore, in this study ade an onine boo recoendation syste using Coaborative Fitering. Coaborative Fitering is one of the ethods that can be used in aing the recoendation syste. The resuts of this study showed that the average vaue of the MAE (Mean Absoute Error) on tria 1 (1.064) is saer than trias (1.1), 4 trias (,474) and test 5 (3.56). This shows that the ore the aount of data used and if there is a user who has never rate a, then the resuting syste is reativey inaccurate and generate recoendations if using Coaborative Fitering bad. Keywords: recoendation syste, Coaborative Fitering, Onine Boo. INTISARI Buu erupaan suber inforasi seua aspe ehidupan hususnya pendidian. Naun rendahnya inat baca diaangan asyaraat enjadi persoaan penting di dunia pendidian saat ini. Siste reoendasi dapat ebantu ereoendasian para pebaca agar ebih udah endapatan inforasi engenai buu yang aan dibaca. Oeh arena it pada peneitian ini dibuat siste reoendasi buu onine enggunaan etode Coaborative Fitering. Coaborative Fitering adaah saah satu etode yang dapat digunaan daa ebuat siste reoendasi. Hasi dari peneitian ini enunjuan bahwa rata-rata niai MAE (Mean Absoute Error) pada uji coba 1 (1,064) ebih eci daripada uji coba (1,1), uji coba 4 (,474) dan ujicoba 5 (3,56). Ha ini enunjuan bahwa seain banya juah data yang digunaan dan jia terdapat user yang beu pernah erating, aa siste yang dihasian reatif tida aurat dan enghasian reoendasi yang buru jia enggunaan Coaborative Fitering. Kata Kunci : Siste Reoendasi, Coaborative Fitering, Buu Onine PENDAHULUAN Buu erupaan inforasi segaa ebutuhan yang diperuan, diuai dari ipte, seni budaya, eonoi, poiti, sosia dan pertahanan eaanan dan ain-ain. Upaya ebaca buu ebua wawasan dunia intee sehingga dapat engubah asa depan serta encerdasan aa, piiran dan ian. Dengan ebaca bu seain pengetahuan aan seain bertabah, pribadi aan seain aya, yang eseuannya jeas aan enurunan efe negatif terhadap ana-ana, yani enaaan. Sedangan ana yang tida terbina inat bacanya seja dini aan enghadapi peuang yang seain eci untu engebangan pengetahuan setinggi-tingginya. Naun berdasaran aporan Ban Dunia, Indonesia erupaan negara yang eiii inat baca sangat rendah. Ha tersebut sungguh disayangan, engingat sebagai negara besar, Indonesia eiii potensi besar untu enjadi negara yang unggu. 1 irfan09017@gai.co, andharini.dwi.cahyani@gai.co 76
Vo. 7 No. 1 Agustus 014 Rendahnya inat baca di aangan asyaraat enjadi persoaan penting di dunia pendidian saat ini. Untu itu diperuan sebuah siste yang dapat ebantu ereoendasian para pebaca agar ebih udah endapatan inforasi buu-buu yang aan dibaca seanjutnya. Siste reoendasi sendiri teah digunaan secara uas oeh hapir seua area bisnis diana seorang onsuen eeruan inforasi untu ebuat suatu eputusan. Terdapat dua pendeatan yang uunya digunaan daa ebuat site reoendasi, yaitu content based fitering dan coaborative fitering. Content based fitering erupaan etode yang beerja dengan encari edeatan suatu ite yang aan direoendasian e user dengan ites yang teah diabi oeh pengguna sebeunya berdasaran eiripan antar ontennya. Naun, siste reoendasi berbasis onten ini asih eiii eeahan, yaitu arena seua inforasi dipiih dan direoendasian berdasaran onten, aa pengguna tida endapatan reoendasi pada jenis onten yang berbeda. Seain it siste reoendasi ini urang efetif untu pengguna peua, arena pengguna yang asih peua tida endapat asuan dari pengguna sebeunya. (Li, 00) Pendeatan ain untu enutup eeahan dari content based fitering diebangan, yaitu coaborative fitering. Siste coaborative fitering adaah etode yang digunaan untu epredisi egunaan ite berdasaran peniaian pengguna sebeunya. Coaborative Fitering dapat digunaan untu ebuat siste reoendasi, aan tetapi perhitungan daa agorita sangat bergantung pada hasi reoendasi. Seperti hanya senario yang digunaan daa perhitungan siiarity, antara etode pearson correation dan adjusted cosine siiarity eberian hasi yang berbeda. Berdasaran beberapa eebihan dari etode coaborative fitering, pada peneitian ini etode ini diterapaan pada pebuatan siste reoendasi buu onine enggunaan dataset buu boo crossing dengan diihat aurasinya enggunaan beberapa senario, yaitu dengan enggunaan cod start probe dan non-cod start probe pada perhitungan predisinya. METODE Siste reoendasi erupaan sebuah (web) aat personaisasi yang enyediaan pengguna sebuah inforasi daftar ite-ite yang sesuai dengan einginan asing-asing pengguna. Siste reoendasi enyipuan preferensi pengguna dengan enganaisis etersediaan data pengguna, inforasi tentang pengguna dan ingungannya. Oeh arena itu siste reoendasi aan enawaran eunginan dari penyaringan inforasi persona sehingga hanya inforasi yang sesuai dengan ebutuhan dan preferensi pengguna yang aan ditapian di siste dengan enggunaan sebuah teni atau ode reoendasi. Ada beberapa etode atau teni yang digunaan daa siste reoendasi. Setiap etode disesuaian dengan perasaahan daa enghasian sebuah inforasi yang sesuai. Metode atau pendeatan yang dipiih pada siste reoendasi bergantung pada perasaahan yang aan diseesaian, teni reoendasi yang berbeda-beda digunaan untu apiasi yang berbeda, dasar dari suatu tujuan dan objetif dari sebuah apiasi. Dari peneitian terbaru etode atau teni reoendasi eiii beberapa sejuah eunginan asifiasi. (Uyun, 011) Siste coaborative fitering adaah etode yang digunaan untu epredisi egunaan ite berdasaran peniaian pengguna sebeunya, isanya cara peberian rating terhadap suatu ite (La, 004).Metode ini ereoendasian ite-ite yang dipiih oeh pengguna ain dengan eiripan ode ite dari pengguna saat ini.waaupun daa beberapa riset coaborative fitering terbuti dapat enutupi beberapa eurangan pendeatan content based dan banya 77
Vo. 7 No. 1 Agustus 014 diipeentasian daa apiasi nyata, naun pendeatan ini eiii beberapa eurangan, antara ain: (Uyun, 011) Cod-start probe, arena pendeatan coaborative fitering eauan predisi berdasaran rating yang diberian user pada ite, aa enjadi suatu asaah etia suatu ite baru asu e daa siste dan beu di-rating saa seai oeh user. Aibatnya ite tersebut tida aan pernah direoendasian epada user. Sparsity, untu uuran data yang besar, banya ite yang baru sediit di-rating oeh user, aibatnya ite tersebut eiii niai predisi yang reatif tida aurat dan enghasian reoendasi yang buru. Saah satu etode siste reoendasi adaah coaborative fitering. Beriut ini adaah tahap-tahap eberian reoendasi enggunaan coaborative fitering. Dasar perhitungan siiarity pada ite-based coaborative fitering antara dua buah ite i dan j adaah dengan encari user ana saja yang teah eberi rating pada ite i dan j au gunaan etode perhitungan siiarity. Pada ICHM terdapat dua buah atris, atris group-rating dan atris ite-rating, aa perhitungan siiarity juga diauan untu asing-asing atris au hasinya digabungan untu perhitungan predisi. Metode pearson correationbased siiarity erupaan etode perhitungan berbasis oreasi yang paing banya diipeentasian untu perhitungan niai siiarity. Koreasi Pearson enguur seberapa besar hubungan inear antara dua variabe. Koefisien oreasi Pearson berasa dari ode regresi inier yang eiii asusi yaitu bahwa hubungan antara dua variabe harus inier, dengan esaahan harus independen dan eiii distribusi probabiitas dengan ean 0 dan varians (berdistribusi Nora (0,1). (Li, 00) Metode pearson correation-based siiarity ditunjuan oeh Persaaan si, u1 u1 R R R R R R R R u1 si(,) adaah niai siiarity antara ite dan ite adaah juah tota user yang erating ite dan ite R dan R adaah rating rata-rata pada ite dan ite R u, dan R u, adaah rating yang diberian oeh user u epada ite dan ite Adjust Cosine Siiarity. Cosine siiarity erupaan etode yang sering digunaan untu enghitung esaaan pengguna, tetapi etode ini eiii satu eurangan. Perbedaan saa rating antara berbagai pengguna aan enghasian siarity yang sangat berbeda. Sebagai contoh, user A erating buu terbai dengan rating 4 dan tida pernah eber rating 5 pada buu apapun, dan eber rating 1 pada buu terjee, tida sesuai dengan tingat standar rating yaitu. Tetapi user B seau erating sesuai dengan tingat standar, eber rating 5 pada buu terbai, dan pada buu yang jee. Jia enggunaan cosine siiarity, eduanya sangat berbeda. Adjusted cosine siiarity engatasi eeahan dari cosine siiarity. (Djaa, 010) Metode Cosine siiarity dapat ditunjuan oeh Persaaan si, u1 u1 R R R R R R R R u u u1 si(,) adaah niai siiarity antara ite dan ite adaah juah tota user yang erating ite dan ite R u adaah rating yang diberian oeh user u pada seua ite R dan R u, adaah rating yang diberian oeh user u epada ite dan ite Menghitung Predisi dengan Non Cod Start Probe. Metode weighted average of deviation yang didapat dari rata-rata ite yang teah dirating erupaan etode yang digunaan untu predisi rating pada ite yang u u 78
Vo. 7 No. 1 Agustus 014 teah dirating. Ruus beriut ini erupaan perhitungan predisi rating pada ite untu user u. n R R si(, ) 1 Pu, R n si(, ) i1 P adaah predisi rating ite untu user u n adaah juah rated ite user u R u, adaah rating dari user u untu ite R dan R adaah rating rata-rata untu ite dan ite Si(,) adaah niai siiarity antara ite dengan seuruh rated ite active user Cod Start Probe. Metode perhitungan predisi pada non cod-start probe yaitu weighted average of deviation asih urang dapat diipientasian pada asaah ite baru yang beu dirating arena R yang erupaan niai rata-rata pada ite aan berniai no (arena beu ada yang eberi rating). Oeh arena itu digunaan etode weighted su untu enghitung predisi rating pada asus ite baru. Beriut ruus perhitungannya pada persaaan n R si(, ) 1 Pu, R n si(, ) 1 P adaah predisi rating ite untu user u n adaah juah rated ite user u R u, adaah rating diberian user u epada ite Si(,) adaah niai siiarity antara ite dengan seuruh rated ite e- Aurasi siste reoendasi diihat berdasaran niai ean absoute error (MAE)., yaitu rata-rata dari error yang di absoutan. Diana error erupaan seisih dari niai rating sebenarnya dengan niai rating hasi predisi. Beriut adaah perhitungan MAE yang ditunjuan oeh Persaaan. MAE N Pu i Ru i u 1,, Diana P i adaah predisi rating user u untu ite i dan R i adaah niai rating sebenarnya yang teah diberian oeh user u untu ite i. PEMBAHASAN Daa peneitian ini diauan beberapa pengujian, hasi pengujian yang diperoeh tersebut adaah sebagai beriut: Pada uji coba 1 diauan pengujian dengan data yang digunaan sebanya 5 user dan 5 buu dengan besarnya rating yang berfariasi. Dari hasi uji coba 1 dapat disipuan bahwa hasi predisi yang dihasian oeh siste cuup aurat dan saa hasinya dengan predisi anua yang dihitung oeh Microsoft Exce, ini juga di butian oeh ecinya MAE yang diberian oeh siste. Tabe 1 Tabe rating user terhadap buu 1 3 4 5 1 3 0 8 4 5 5 8 7 3 7 Buu 3 7 4 0 7 6 4 8 7 9 9 8 5 10 3 8 3 7 Langah pertaa adaah encari niai rata-rata rating dari setiap buu. Buu N Tabe Tabe rata-rata rating 1 3 4 5 rata-rata rating 1 3 0 8 4 5 4 5 8 7 3 7 6 3 7 4 0 7 6 4,8 4 8 7 9 9 8 8, 5 10 3 8 3 7 6, Langah edua adaah encari niai rating (rata-rata rating) au diuadratan. Langah etiga adaah encari juah dari niai rating-(rata-rata rating) perbuu dan seanjutnya diaaran. Terihat seperti pada Tabe 3. 79
Vo. 7 No. 1 Agustus 014 Tabe 3 Tabe juah rating- (rata-rata rating) perbuu Su (rating- Aar Su (rata-rata rating) ) (rating-(ratarata rating) ) 34 5,83095 16 4 34,8 5,89915,8 1,6733 38,8 6,8965 Langah eepat enhitung siiariy antar buu dengan persaaan ruus dibawah. Terihat seperti pada Tabe 5. si, u1 u1 R R R R R R R R u1 Tabe 5 Hasi predisi anua uji coba 1 enggunaan M. Exce Hasi Predisi 1 3 4 5 1 3,86 1,81 6,71 3,41 4,185 5,3 7,39 7,3 3,86 6,163 Buu 3 6,03 5,0 1,55 5,49 4,8 4 8,13 6,00 9,88 8,79 8,178 5 7,83 3,43 8,60 4,6 6,85 Tabe 6 Hasi MAE siste uji coba 1 MAE Buu 1 1,07 Buu 0,57 Buu 3 1,4 Buu 4 0,48 Buu 5 0,9 si(,) adaah niai siiarity antara ite dan ite adaah juah tota user yang erating ite dan ite R dan R adaah rating rata-rata pada ite dan ite R u, dan R u, adaah rating yang diberian oeh user u epada ite dan ite Tabe 4 Tabe siiarity Si(1,1) 1 si(1,) -0,08574993 si(,3) -0,593305566 si(3,4) -0,183490 si(4,5) 0,1769415 si(1,3) -0,49419459 si(1,4) 0,8199006 si(1,5) 0,468051455 si(,4) -0,597614305 si(,5) 0,0807016 si(3,5) -0,103413708 Seteah dietahui niai dari siiarity antar bu angah seanjutnya adaah enghitung niai predisi buu terhadap user. Hasi dari predisi anua dapat diipientasi edaa Tabe 5. Gabar 1. Hasi predisi siste uji coba 1 80
Vo. 7 No. 1 Agustus 014 Pada uji coba diauan uji coba dengan data sebanya 5 user dan 5 buu dengan besarnya rating yang berfariasi dan terdapat user baru yang beu pernah erating saa seai. Dari hasi uji coba dapat disipuan bahwa hasi predisi yang dihasian oeh siste cuup aurat dan saa hasinya dengan predisi anua yang dihitung oeh Microsoft Exce, ini juga d butian oeh ecinya MAE yang diberian oeh siste. Apabia ada saah satu user yang beu pernah erating saa seai aa siste tetap aan eberian reoendasinya terhadap user tersebut berdasaran hasi dari niai rating yang diberian oeh user ain yang teah erating. Tabe 7 Tabe rating user terhadap buu uji coba Buu 1 3 4 5 1 3 0 8 4 0 5 8 7 3 0 3 7 4 0 7 0 4 8 7 9 9 0 5 10 3 8 3 0 Langah pertaa adaah encari niai rata-rata rating dari setiap buu. Terihat seperti pada Tabe 8 dibawah ini Buu Tabe 8 Tabe rata-rata rating ratarata 1 3 4 5 rating 1 3 0 8 4 0 3 5 8 7 3 0 4,6 3 7 4 0 7 0 3,6 4 8 7 9 9 0 6,6 5 10 3 8 3 0 4,8 Langah edua adaah encari niai rating (rata-rata rating) au diuadratan. Langah etiga adaah encari juah dari niai rating-(rata-rata rating) perbuu dan seanjutnya diaaran. Terihat seperti pada Tabe 9. dibawah ini Tabe 9 Tabe juah rating-(rata-rata rating) perbuu Su (rating- (rata-rata rating) ) Aar Su (rating-(ratarata rating) ) 44 6,6335 41, 6,41873 49, 7,01471 57, 7,563068 66,8 8,17317 Langah eepat enhitung siiariy antar buu dengan persaaan ruus (.1). Terihat seperti pada tabe 4.10 si, u1 u1 R R R R R R R R u1 si(,) adaah niai siiarity antara ite dan ite adaah juah tota user yang erating ite dan ite R dan R adaah rating rata-rata pada ite dan ite R u, dan R u, adaah rating yang diberian oeh user u epada ite dan ite si 1, (3 3)(5 4,6) (0 3)(8 4,6) (8 3)(7 4,6) (4 3)(3 4,6) (0 3)(0 4,6) ((3 3) (0 3) (8 3) (4 3) (0 3)) ((5 4,6) (8 4,6) (7 4,6) (3 4,6) (0 4,6) (0) ( 10,) (1) ( 1,6) (13,8) si1, ( (0) ( 3) (5) (1) ( 3))( ((0,4) (3,4) (,4) ( 1,6) ( 4,6)) 14 14 si1, si1, 44 41, 6,6335 6,4187 si 1, 0, 3881611 ) 81
Vo. 7 No. 1 Agustus 014 Tabe 10 Tabe siiarity Si(1,1) 1 si(1,) 0,3881611 si(,3) 0,115497394 si(3,4) 0,531579889 si(4,5) 0,67987635 - si(1,3) 0,107463533 si(1,4) 0,657793514 si(1,5) 0,67139777 si(,4) 0,704497544 si(,5) 0,545166541 si(3,5) 0,89559158 Seteah dietahui niai dari siiarity antar bu angah seanjutnya adaah enghitung niai predisi buu terhadap user. Dapat diipientasi edaa Tabe 11 Tabe 11 Hasi predisi anua uji coba enggunaan M. Exce Tabe 1 Hasi MAE dari uji coba MAE Buu 1 1,37 Buu 1,3 Buu 3 1,1 Buu 4 0,96 Buu 5 1,46 Pada uji coba 3 diauan pengecean terhadap siste dengan enggunaan perbandingan terhadap perhitungan anua pada Microsoft Exce. Data yang digunaan sebanya 5 user dan 6 buu dengan besarnya rating yang berfariasi dan terdapat buu baru yang beu pernah dirating saa seai. Dari hasi uji coba 3 dapat disipuan bahwa apabia terdapat buu baru dan beu pernah dirating saa seai oeh user aa buu tersebut tida aan direoendasian oeh siste. Hasi Predisi Buu 1 3 4 5 1 4,450 1,974 6,587 3,05-1,17 6,31 5,5 7, 4,537-0,35 3 6,386 3,994,789 4,836-0,659 4 8,559 6,550 8,736 7,308 1,8456 5 7,14 4,339 7,41 4,97 0,119 \\ Gabar. Hasi predisi site uji coba Gabar 3. Buu baru tida pernah dirating 8
Vo. 7 No. 1 Agustus 014 Pada uji coba 4 diauan pengecean terhadap siste dengan enggunaan data yang digunaan sebanya 10 user dan 5 buu dengan besarnya rating yang berfariasi. Dari hasi uji coba 4 dapat disipuan bahwa seain banya user yang enggunaan siste aa hasi dari predisi yang dihasian urang aurat. Gabar 5 Hasi MAE uji coba 1,,3,4 dan 5 Gabar 4 Hasi predisi urang aurat Pada uji coba 5 diauan pengecean terhadap siste dengan enggunaan data yang digunaan sebanya 5 user dan 10 buu dengan besarnya rating yang berfariasi. Pada Tabe 4.7 digabaran besarnya rating yang diberian oeh user terhadap 5 buah buu. Dari hasi uji coba 5 dapat disipuan bahwa seain banya data, daa ha ini adaah buu yang digunaan sebanya 10 dan jia dibandingan dengan percobaan 1 yaitu 5 buu aa hasi reoendasi yang dihasian urang bai. KESIMPULAN Metode coaborative fitering dapat diipeentasian daa pebuatan siste reoendasi buu dengan eihat edeatan buu berdasaran niai rating. Metode ini eah etia diipeentasian pada buu baru yang beu pernah dirating saa seai. Hasi predisi rating setiap buu untu asing-asing user dengan enggunaan etode coaborative fitering urang bai. Ha ini ditunjuan berdasaran rata-rata niai MAE (Mean Absoute Error) buu pada uji coba 1 yani 1,064 ebih eci dari pada uji coba yani 1,1, uji coba 4 yani,474 dan ujicoba 5 yani 3,56. Ha ini enunjuan bahwa seain banya juah data yang digunaan dan jia terdapat user yang beu pernah erating, aa siste yang dihasian reatif tida aurat dan enghasian reoendasi yang buru. Oeh arena itu pada peneitian seanjutnya, etode coaborative fitering diharapan agar diipeentasian pada data yang eiii ite yang banya dirating oeh user. Apabia terdapat data yang banya dan eiii ite baru yang sediit dirating oeh user, aa diharapan enggunaan etode yang ebih bai dari coaborative fitering, isanya adaah ICHM (Ite-Based Custering Hybrid Method). ICHM (Ite-Based Custering Hybrid Method) adaah saah satu etode yang enggunaan pendeatan hybrid atau enggabungan edua pendeatan yaitu Content Based Fitering dan Coaborative Fitering. DAFTAR PUSTAKA Djaa, A Rhaadanus. Maharani, Warih dan Kurniati, Angeina 83
Vo. 7 No. 1 Agustus 014 Pria (010). Anaisis dan Ipeentasi Metode Ite- Based Custering Hybrid Pada Recoender Syte. La, S. And Ried, J. (004). Shiing recoender systes for fun and profit. In Proceedings of the 13th InternationaWWW Conference. New Yor.. Li, Qing and Ki, Byeong Man 00. An Approach for Cobining Content-based and Coaborative Fiters. Departeent of Coputer Sciences, Kuoh Nationa Institute of Technoogy. Sarwar, Badru et a. 001. Ite-based Coaborative Fitering Recoender Syste Agorith. GroupLens Research Group/Ary HPC Research Center, Departent of Coputer Science and Engineering, University of Minnesota. Mienneapois. Uyun, S. Fahrurrozi, I. dan Muyanto, A. 011. Ite Coaborative Fitering untu Reoendasi Pebeian Buu secara Onine. JUSI, Vo. 1, No. 1 ISSN 087-8737 84