Rekomendasi Pengambilan Mata Kliah Pilihan Menggnakan Recrsive Elimination Satrio Prasojo (st.prasojo@gmail.com), Shafiah, ST., MT (fi@telkomniversity.ac.id), Hetti Hidayati, S.Kom., MT (htt@telkomniversity.ac.id), Telkom University Abstrak Pada proses perkliahan, setiap mahasiswa pada proses registrasi wajib melakkan tahapan perwalian. Mahasiswa biasanya mengajkan mata kliah apa saja yang akan diambilnya kepada dosen wali, setelah it dosen wali akan memberikan saran terkait mata kliah apa saja yang sebaiknya diambil, tertama mata kliah pilihan. Demi memdahkan proses tersebt, dibatlah sebah sistem yang menangani perekomendasian. Sistem ini memanfaatkan teknik data mining menggnakan algoritma Recrsive Elimination (Relim). Data yang diproses akan dipadatkan menggnakan parameter minimm spport. Implementasi yang dilakkan terbkti dapat menghasilkan rekomendasi mata kliah pilihan dengan atran asosiasi yang menggnakan nilai spport dan confidence sebagai acannya. Kata knci : rekomendasi, Relim, minimm spport, spport, confidence Abstract Every college stdent at the registration stage shold have a consltation with their lectrer. The stdent sally sbmit their corse plan for the next semester to their lectrer, then the lectrer wold give a recommendation especially for the certain corses. To make it simple, we will bild a system that cold give a corse recommendation. The data mining techniqe, that called Recrsive Elimination will be planted in the system. Processed data will be denser becase of minimm spport parameter. This implementation proves can prodce a corse recommendation sing association rles with spport and confidence vale as a reference. Keywords : recommendation, Relim, minimm spport, spport, confidence 1. Pendahlan Rencana stdi seorang mahasiswa dalam sat semester ke depan sangat ditentkan oleh pengambilan mata kliah yang dilakkannya. Bagi mahasiswa tingkat akhir, tidak hanya mata kliah wajib saja yang perl diambil, namn jga mata kliah pilihan sebagai dasar pengerjaan Tgas Akhir nantinya. Pada jrsan Teknik Informatika IT Telkom terdapat 3 bah Kelompok Keahlian (KK), yait SIDE, ICM, dan Telematik. Tiap kelompok keahlian memiliki mata kliah pennjang yang berbeda sat sama lain. Di sinilah sering terjadi permasalahan dimana mahasiswa terkadang mengambil mata kliah pilihan tanpa melihat riwayat nilai mata kliah wajib pendkngnya. Contohnya adalah saat seorang mahasiswa mengambil Jaringan Kompter Lanjt (Jarkomlan) padahal nilai mata kliah Jarkom pada semester sebelmnya krang memaskan. Dosen wali seharsnya dapat mencegahnya pada saat proses perwalian, namn kejadian seperti it seringkali lolos begit saja. Sistem yang ada saat ini masih berpa perwalian manal, di mana seorang dosen wali memeriksa riwayat nilai mahasiswanya sat per sat terlebih dl, barlah ia dapat memberi rekomendasi mata kliah pilihan apa saja yang sebaiknya diambil. Sistem seperti ini jelas mengras wakt dan tenaga. Kendala lain dihadapi para mahasiswa yang hars kembali dari daerah asalnya hanya sekedar ntk bertatap mka dengan dosen wali. Seperti yang kita ketahi, jadwal perwalian biasanya dilakkan pada saat libr semester. Mengingat pekerjaan seorang dosen wali tidak mdah, karena rata-rata seorang dosen wali memiliki setidaknya 40 anak wali, diperlkan sebah Page 1
sistem yang dapat merekomendasikan mata kliah pilihan secara otomatis. Sistem yang dibangn akan memanfaatkan teknik data mining yang telah terbkti dalam beberapa tahn terakhir dapat menangani jmlah data yang begit besar, seperti pada analisis pasar, deteksi penipan, pengendalian prodksi, dan masih banyak lagi [1]. Salah sat topik terpenting dalam data mining yait association rles / atran asosiasi yang sangat penting bagi pengambilan keptsan [2]. Berdasarkan stdi literatr, atran asosiasi telah terbkti dapat menyelesaikan beberapa masalah perekomendasian, seperti pada jrnal yang ditlis oleh Ngroho Wandy, Rlly Hendrawan, dan Akhmad Mkhlason berjdl Pengembangan Sistem Rekomendasi Penelsran Bk dengan Penggalian Association Rle Menggnakan Algoritma Apriori (stdi Kass Badan Perpstakaan dan Kearsipan Provinsi Jawa Timr). Metode dan algoritma tersebt menghasilkan transaksitransaksi peminjaman bk dengan strong association (keterkaitan kat) antar bk dalam transaksi yang dignakan sebagai rekomendasi peminjaman bk. Algoritma asosiasi yang dignakan pada Tgas Akhir ini yait algoritma Recrsive Elimination (Relim) karena kesederhanaan strktrnya dengan langsng memproses transaksi. Pada dasarnya, selrh pekerjaan pemrosesan transaksi dilakkan dalam sat fngsi rekrsif sederhana, yang ckp ditlis dengan beberapa baris kode saja [3]. Diharapkan sistem yang bar ini nantinya akan dapat memberi rekomendasi mata kliah pilihan dengan cepat dan tepat sehingga dapat menghemat wakt dan tenaga baik dosen wali mapn mahasiswa. 2. Landasan Teori 2.1 Data Mining Berdasarkan jrnal Seminar Nasional Informatika 2009 yang ditlis oleh Azhari dan Anshori dari FMIPA UGM dengan jdl Pendekatan Atran Asosiasi ntk Analisis Pergerakan Saham, data mining adalah eksplorasi dan analisis terhadap sejmlah data dengan tjan ntk menemkan pola dan atran yang sangat penting (Dnham, 2003; Trban, dkk. 1988). Menrt Han, dkk. (2001), data mining merpakan penerapan bidang ilm interdisipliner, statistik, database, machine learning, pattern recognition, kecerdasan batan, dan visalisasi. Bidang-bidang tersebt memiliki peranan yang saling berhbngan, sehingga sangat slit ntk memberikan batasan yang jelas diantara masing-masing disiplin ilm tersebt dengan data mining [2]. 2.2 Association Rles Mining Masih berdasarkan jrnal Azhari dan Anshori dari FMIPA UGM Pendekatan Atran Asosiasi ntk Analisis Pergerakan Saham, association rles mining (atran mining assosiasi) berfngsi ntk menemkan asosiasi antar variabel, korelasi ata sat strktr diantara item ata objek-objek didalam database transaksi, database relasional, mapn pada penyimpanan informasi lainnya (Agrawal dan Srikant, 1994; Tan dkk., 2006). Sebah atran asosiasi adalah implikasi dari X=>Y, dimana X I, Y I, dan X Y =. Atran X=>Y berada di dalam himpnan transaksi D dengan kepercayaan (confidence) c, jika c% dari transaksi dalam D yang ada X terdapat jga Y. Atran X=>Y memiliki dkngan (spport) s di dalam set transaksi D, jika s% transaksi dalam D terdapat X Y (1). Spport item set (1) adalah jmlah transaksi T yang didalamnya terdapat (1). Confidence mengkr seberapa besar ketergantngan sat item dengan item yang lainnya. Freqent item set adalah item set yang memiliki nilai spport lebih ata sama besar dengan nilai minimm spport yang ditentkan (2). Dimisalkan sat atran R : X=>Y, maka: Spport (X=>Y) = spport ({X} (1) Confidence (X=>Y) = (2) [ ] { } { } {Y}) Sebah atran (rle) biasanya terdiri dari da bagian, yait kondisi (condition) dan hasil (reslt), biasanya disajikan dalam pernyataan sebagai berikt : Jika kondisi maka hasil (If condition then reslt) (3) Page 2
2.3 FP-Growth Algorithm Menrt Christian Borgelt dalam jrnalnya yang berjdl Keeping Things Simple: Finding Freqent Item Sets by Recrsive Elimination, algoritma FP-Growth merpakan inspirasi dari algoritma Relim. FPgrowth adalah salah sat alternatif algoritma yang dapat dignakan ntk menentkan himpnan data yang paling sering mncl (freqent itemset) dalam sebah kmplan data. FP-growth menggnakan pendekatan yang berbeda dari paradigma yang dignakan pada algoritma Apriori [7]. 2.3.1 Analisis Pola Frekensi Tinggi dengan Algoritma FP-Growth Pada penentan freqent itemset terdapat 2 tahap proses yang dilakkan yait: pembatan FP-tree dan penerapan algoritma FP-growth ntk menemkan freqent itemset. Strktr data yang dignakan ntk mencari freqent itemset dengan algoritma FP-growth adalah perlasan dari penggnaan sebah pohon prefix, yang biasa disebt adalah FP-tree. Dengan menggnakan FP-tree, algoritma FPgrowth dapat langsng mengekstrak freqent itemset dari FP-tree yang telah terbentk dengan menggnakan prinsip divide and conqer. 2.3.2 Pembentkan FP-Tree FP-tree merpakan strktr penyimpanan data yang dimampatkan. FP-tree dibangn dengan memetakan setiap data transaksi ke dalam setiap lintasan tertent dalam FP-tree. Karena dalam setiap transaksi yang dipetakan, mngkin ada transaksi yang memiliki item yang sama, maka lintasannya memngkinkan ntk saling menimpa. Semakin banyak data transaksi yang memiliki item yang sama, maka proses pemampatan dengan strktr data FP-tree semakin efektif. Adapn FP- tree adalah sebah pohon dengan definisi sebagai berikt: a. FP-tree dibentk oleh sebah akar yang diberi label nll, sekmplan sb-tree yang beranggotakan item-item tertent, dan sebah tabel freqent header. b. Setiap simpl dalam FP-tree mengandng tiga informasi penting, yait label item, menginformasikan jenis item yang direpresentasikan simpl tersebt, spport cont, merepresentasikan jmlah lintasan transaksi yang melali simpl tesebt, dan pointer penghbng yang menghbngkan simpl-simpl dengan label item sama antar-lintasan, ditandai dengan garis panah pts-pts. 2.3.3 Penerapan Algoritma FP-Growth Setelah tahap pembangnan FP-tree dari sekmplan data transaksi, akan diterapkan algoritma FP-growth ntk mencari freqent itemset yang signifikan. Algoritma FP-growth dibagi menjadi tiga langkah tama, yait: 1. Tahap Pembangkitan Conditional Pattern Base Conditional Pattern Base merpakan sbdatabase yang berisi prefix path (lintasan prefix) dan sffix pattern (pola akhiran). Pembangkitan conditional pattern base didapatkan melali FP-tree yang telah dibangn sebelmnya. 2. Tahap Pembangkitan Conditional FP-tree Pada tahap ini, spport cont dari setiap item pada setiap conditional pattern base dijmlahkan, lal setiap item yang memiliki jmlah spport cont lebih besar sama dengan minimm spport cont akan dibangkitkan dengan conditional FP-tree. 3. Tahap Pencarian Freqent itemset Apabila Conditional FP-tree merpakan lintasan tnggal (single path), maka didapatkan freqent itemset dengan melakkan kombinasi item ntk setiap conditional FP-tree. Jika bkan lintasan tnggal, maka dilakkan pembangkitan FP-growth secara rekrsif. Page 3
2.4 Recrsive Elimination Algorithm (Relim) Algoritma Recrsive Elimination (Relim) merpakan salah sat algoritma asosiasi yang pertama kali diperkenalkan oleh Christian Borgelt dari Department of Knowledge Processing and Langage Engineering Universitas Magdebrg di Jerman sekitar tahn 2005. Algoritma ini terinspirasi dari teknik asosiasi lainnya, yait FP-growth dan H-mine, berfngsi ntk menemkan freqent item sets. Relim bekerja tanpa memerlkan prefix trees atapn strktr data yang rmit, dengan kata lain algoritma ini langsng mengekseksi transaksi [3]. 2.4.1 Preprocessing Pada tahap ini, dilakkan penghitngan frekensi tiap item transaksi. Minimm spport yang diinginkan kita tentkan, sehingga selanjtnya kita dapat menghilangkan item yang infreqent. Gambar 0.2 Sorted Transaction Terbentklah initial database yang nantinya akan dilakkan recrsive elimination terhadapnya. Freqent item dissn dari yang berjmlah kecil ke besar seperti pada gambar 2.2. Saat ini, posisi pointer berada pada item e. Gambar 0.3 Initial Database Selanjtnya dilakkan eliminasi terhadap prefix e, pointer berpindah ke item setelah prefix e. Item-item yang semla ber-prefix e kemdian bergabng dengan item set yang memiliki prefix sama. Proses ini berlangsng ters meners hingga hanya tersisa 1 bah item set saja. Gambar 0.1 Database transaksi (kiri), frekensi item (tengah), dan database yang telah diredksi (kanan) 2.4.2 Recrsive Processing Pada tahap ini dimlailah pemrosesan secara rekrsif terhadap database yang telah diredksi tadi. Langkah pertama adalah dengan menghitng jmlah freqent item yang terdapat pada prefix (awalan) dari selrh item set. Page 4
3. Perancangan Sistem 3.1 Deskripsi Umm Sistem Pada jrnal ini akan dirancang sat sistem yang memdahkan perwalian, khssnya dalam proses pengambilan mata kliah pilihan oleh mahasiswa. Sistem akan membaca mata kliah beserta nilai tiap mahasiswa yang tersimpan dalam database. Selanjtnya data tersebt akan dipreprocessing agar memenhi minimm spport sekaligs menghilangkan mata kliah yang tidak relevan dengan mata kliah pilihan yang ada. Algoritma Relim dignakan ntk mendapatkan freqent itemset yang akan dicari rle-nya. Rle inilah yang nantinya akan dignakan dignakan ntk perekomendasian. 3.2 Perancangan Proses Perancangan proses dari sistem yang dibat dalam bentk flowchart dapat dilihat pada gambar 3.1 berikt. RELIM Minimm Spport START Data MK Asli Preprocessing RElim Berikt ini adalah contoh data mentah yang didapat. Tabel 0.1 Contoh Data Mentah NIL AI KODE KULIAH THN AJARAN SEMES TER NIL AI NIM 46895 82 A CS3113 1112 2 A 46895 82 A CS3243 1112 2 A b3915 6826 C DU2002 1011 2 C b3915 6826 C SE2423 1011 2 C.................. N............... Dari tabel di atas terlihat bahwa masih ada mata kliah yang bkan merpakan mata kliah informatika, yait DU2002 (Pengling). Mata kliah yang tidak relevan inilah yang akan dihilangkan. Selain it, ntk memdahkan pembacaan data, NIM yang berpa kode enkripsi tersebt dibah ke dalam format 0, 1, dan setersnya Setelah it dilakkan tahapan preprocessing selanjtnya, yait mengeliminasi data yang tidak memenhi minimm spport. Sebelmnya dilakkan inisiasi terlebih dahl terhadap data yang sdah diolah sebelmnya. Hal ini bertjan ntk menjadikan kode mata kliah dan nilai sebah item Data Perwalian REKOMENDASI Freqent Itemset Pembentkan Atran Asosiasi Cek Atran Asosiasi MK Pilihan END Gambar 0.2 Gambaran Umm Sistem Atran Asosiasi 3.3 Deskripsi Kass 3.3.1 Preprocessing Tahap ini berpa data cleaning, data integration, data transformation, dan data redction ntk menghilangkan noise dan inkonsistensi, serta meredksi kran data agar lebih sesai dengan kebthan sistem. Data mentah didapat dari UPT Sisfo IT Telkom (sekarang Telkom University). Tabel 0.2 Contoh Data Akademik yang Telah Diinisiasi NIM 0 1 2 3 4 5 6 7 8 9 Mata Kliah & Nilai CDG4I3- CSG2A3- B B 713-C CS3113- CSG2A3- B B CS1113-A 333- CSG2A3- A B CDG4I3- CSG2A3- B 333-A CS3113-B B 333- A CS3113-B CDG4I3- CSG2A3- B 333-A B 333- CSG2A3- A B CS1113-A 333- A CS3113-B CS1113-A 383-C CS3113- CSG2A3- B B 713-C CDG4I3- CSG2A3- B 333-A B. Gna memdahkan penlisan di bk, penlis lal melakkan inisiasi kembali Page 5
terhadap mata kliah dan nilai. Inisiasi yang dilakkan dapat dilihat pada tabel 3.3 berikt. Tabel 0.3 Hasil Inisiasi NIM Mata Kliah & Nilai 0 A D F 1 C D E 2 B D 3 A B C D 4 B C 5 A B D 6 B D E 7 B C E G 8 C D F 9 A B D Tentkan nilai minimm spport ntk menghilangkan infreqent item. Pada contoh berikt ditentkan bahwa minsp=3. Tabel 0.4 Frekensi Item Makni Spport G 1 F 2 E 3 A 4 C 5 B 7 D 8 Setelah menghilangkan infreqent items, dibentklah redced database dengan menysn kembali NIM serta mata kliah dan nilai seperti semla namn dengan rtan item set yang berbeda. Item set dissn secara ascending, yait mlai dari item berfrekensi terendah hingga tertinggi. Item yang tidak memenhi minimm spport tidak disertakan kembali. Tabel 0.4 Data Akademik yang Telah Diredksi NIM 0 A D Mata Kliah & Nilai 1 E C D 2 B D 3 A C B D 4 C B 5 A B D 6 E B D 7 E C B 8 C D 9 A B D 3.3.2 Recrsive Processing Pada tahap ini akan dilakkan pengolahan terhadap data akademik bar yang tadi dibentk menggnakan algoritma Relim. Tjannya yait ntk menemkan freqent itemset. Data akademik tersebt dapat dibentk ke dalam initial database berpa array sebagai berikt. Tabel 0.5 Initial Database E A C B D 3 4 2 1 0 CD D B D BD CBD D CB BD BD Recrsive elimination dilakkan dengan mengeliminasi prefix sat per sat mlai dari kiri ke kanan array. Pada kass ini, yang pertama dieliminasi adalah prefix E. Gambar 3.2 berikt mennjkkan proses eliminasi yang terjadi. Conter pada prefix yang dieliminasi akan mennjkkan angka 0, sedangkan item-item yang mengiktinya akan di-reassign ke dalam prefix-prefix yang letaknya di kanan. Conter akan mennjkkan jmlah item yang di-reassign tadi. Gambar 0.3 Eliminasi Prefix E Page 6
D C AB D AD B Gambar 0.4 Eliminasi Prefix A BD A Gambar 0.5 Eliminasi Prefix C Gambar 0.6 Eliminasi Prefix B Akhirnya didapat selrh freqent itemset yait E, A, C, B, D, AB, AD, CB, CD, BD, dan ABD. Freqent itemset ini akan dignakan pada proses selanjtnya, yait pencarian atran asosiasi. 3.3.3 Mencari Atran Asosiasi Setelah freqent itemset diketahi, kita bisa mencari atran asosiasinya. Setiap atran asosiasi harslah berbentk R : X=>Y, maka kita dapat menghilangkan freqent itemset yang hanya terdiri dari 1 bah item saja, yait E, A, C, B, dan D, sehingga tersisa AB, AD, CB, CD, BD, dan ABD. Untk contoh kass ini penlis mengambil contoh 3 bah freqent itemset saja, yait AB, CD, dan ABD. Tabel 0.6 Pencarian Atran Asosiasi Kandidat Confidence Atran A B B A C D 3.3.4 Proses Rekomendasi Proses rekomendasi dilakkan dengan terlebih dahl menyaring atran yang merekomendasikan hanya mata kliah pilihan. Pada kass di atas terdapat 2 atran yang memberi rekomendasi mata kliah pilihan, yait A B dan AD B. mata kliah pilihan dengan kode inisiasi B tersebt yait 333-A (Data Mining). Mata kliah yang telah diambil oleh mahasiswa selanjtnya dimaskkan ke dalam atran-atran tersebt. Misal seorang mahasiswa telah mengambil mata kliah A (CDG4I3-B / AUSI) dan D (CSG2A3-A / Alstrkdat) maka dia akan mendapat rekomendasi mata kliah pilihan 333 (Data Mining). 4. Pengjian dan Analisis Sistem 4.1 Data Set Data set yang dignakan pada pengjian ini adalah data akademik mahasiswa IT Telkom angkatan 2008 s/d 2011. Di dalam data ini terdapat 1532 NIM mahasiswa dan 592 jenis kombinasi mata kliah dan nilai. Nantinya data ini akan dibagi menjadi data training dan data testing di dalam sistem. 4.2 Pengjian Sistem Pada tahap ini dilakkan beberapa skenario pengjian ntk mengetahi kapabilitas sitem yang telah dibangn. Adapn tjan dari scenario pengjian ini adalah sebagai berikt. 1. Mengetahi pengarh nilai minimm spport dan pembagian data training serta testing terhadap wakt ekseksi, jmlah freqent itemset serta jmlah atran asosiasi yang dihasilkan. 2. Mengetahi pengarh nilai minimm spport dan pembagian data training serta Page 7
testing terhadap akrasi berdasarkan spport dan confidence-nya. 3. Menenetkan nilai minimm spport dan pembagian data yang optimal ntk sistem ini. Untk mencapai tjan di atas, dilakkanlah beberapa skenario pengjian sebagai berikt. 1. Menganalisis pengarh nilai minimm spport dan pembagian data training serta testing terhadap wakt ekseksi, jmlah freqent itemset dan atran asosiasi yang dihasilkan serta akrasi. Selrh data akademik mahasiswa akan diji dengan nilai minimm spport antara 20 hingga 100 dan persentase data training antara 30% hingga 90%. Melali pengjian tersebt nantinya akan didapat perbedaan hasil wakt ekseksi dan jmlah freqent itemset serta atran asosiasi yang terbentk. 2. Melakkan analisis nilai minimm spport dan persentase data training yang optimal ntk sistem. Nilai optimal yang dimaksd yait di mana kombinasi keda nilai maskan tersebt dapat menghasilkan tingkat akrasi yang paling besar. 4.3 Analisis Hasil Pengjian 4.3.1 Pengjian dengan Nilai Minimm Spport dan Persentase Data Training Berbah 4.3.1.1 Pengjian Terbentknya Atran Asosiasi Pengjian ini dilakkan gna menganalisis pengarh perbahan nilai minimm spport terhadap wakt terbentknya atran asosiasi. Adapn hasil pengjiannya dapat dilihat pada tabel dan grafik di bawah berikt ini. M i n s p 2 Tabel 0.2 Terbentknya Atran Asosiasi dengan Data Training 30% ksi 30% ksi 40% ksi 50% ksi 60% 76.3 0 ksi 70% 390. 18 ksi 80% 880. 63 13.1 6 ksi 90% 2133.40 53.1 5 0 0.07 1.76 8.76 3 0 0.01 0.05 0.24 0.98 5.47 4 0 0.00 0.01 0.04 0.09 0.41 1.13 2.36 5 0.00 0.00 0.01 0.02 0.09 0.14 0.38 0 6 0 0.00 0.00 0.01 0.01 0.02 0.07 0.10 7 0 0.00 0.00 0.00 0.01 0.01 0.02 0.04 8 0 0.00 0.00 0.00 0.00 0.01 0.01 0.01 9 0 0.00 0.00 0.00 0.00 0.01 0.01 0.01 1 0 0 0.00 0.00 0.00 0.00 0.00 0.01 0.01 2500.00 2000.00 1500.00 1000.00 500.00 0.00 1 2 3 4 5 6 7 8 9 ksi 30% ksi 40% ksi 50% ksi 60% ksi 70% ksi 80% ksi 90% Gambar 0.7 Grafik Terbentknya Atran Asosiasi Setelah melihat tabel di atas beserta dengan grafiknya yang mennjkkan pengarh minimm spport terhadap lamanya wakt terbentk atran asosiasi, kita dapat menarik kesimplan bahwa semakin besar nilai minimm spport, maka wakt komptasi yang dibthkan ntk membentk atran asosiasi semakin kecil. Nilai minimm spport yang semakin besar mengakibatkan semakin banyak pla itemset yang tereliminasi sehingga hanya menyisakan freqent itemset saja. Dengan jmlah freqent itemset yang makin sedikit inilah, atran asosiasi yang Page 8
20 40 60 80 100 Jmlah Rekomendasi Pengambilan Mata Kliah Pilihan Menggnakan Recrsive Elimination dihasilkan pn semakin sedikit sehingga wakt komptasi yang dibthkan semakin cepat. 4.3.1.2 Pengjian Jmlah Freqent Itemset dan Atran Asosiasi yang Terbentk Pengjian ini dilakkan ntk mengetahi pengarh nilai minimm spport terhadap jmlah freqent itemset serta atran asosiasi yang dihasilkan. Adapn hasil pengjiannya dapat dilihat pada tabel grafik berikt ini. Tabel 0.2 Jmlah Freqent itemset dan Atran Asosiasi yang Terbentk dengan Data Training 50% Mins p Jmlah Freq. Itemset Jmlah Atran Asosiasi 20 20324 1578 30 3173 209 40 915 37 50 279 6 60 94 3 70 32 0 80 4 0 90 1 0 100 0 0 25000 20000 15000 10000 5000 0 Minimm Spport Jmlah Freq. Itemset Jmlah Atran Asosiasi Gambar 0.2 Grafik Jmlah Freqent itemset dan Atran Asosiasi yang Terbentk dengan Data Training 50% Dari hasil pengjian yang ditnjkkan oleh tabel dan grafik di atas mennjkkan bahwa nilai minimm spport berpengarh terhadap jmlah freqent itemset yang dihasilkan. Semakin besar nilai minimm spport, maka akan semakin sedikit freqent itemset yang dihasilkan. Sedangkan jmlah freqent itemset yang dihasilkan berpengarh terhadap jmlah atran asosiasi yang terbentk. Semakin sedikit jmlah freqent itemset, maka akan semakin sedikit pla atran asosiasi yang terbentk. 4.3.1.3 Pengjian Akrasi Pengjian ini dilakkan dengan membandingkan kecocokan antara mata kliah pilihan yang telah diambil mahasiswa dengan mata kliah pilihan yang direkomendasikan sistem. Hasil pengjiannya adalah sebagai berikt. Tabel 4.3 Akrasi pada Data Training 50% Mins p Akrasi Spport (%) Akrasi Confidence (%) 20 71.79 73.48 30 71.71 72.68 40 68.93 69.97 50 54.11 54.11 60 34.48 34.48 70 0.00 0.00 80 0.00 0.00 90 0.00 0.00 100 0.00 0.00 80.00 60.00 40.00 20.00 0.00 20 40 60 80 100 Akrasi Spport (%) Akrasi Confidence (%) Gambar 4.3 Grafik Akrasi pada Data Training 50% 4.3.1.4 Analisis Nilai Minimm Spport dan Persentase Data Training yang Optimal Nilai minimm spport dan persentase data training yang optimal dilihat dari kombinasi dari da variabel tersebt yang menghasilkan tingkat akrasi/kecocokan yang paling besar. Dapat dilihat pada sb-bab 4.3.1.3 mengenai pengjian akrasi bahwa nilai minimm spport terendah (20) selal menghasilkan akrasi yang paling besar. Tabel 0.4 Akrasi Tertinggi Tiap Pengjian Data Mins p Training (%) Akrasi Spport (%) Akrasi Confidence (%) Page 9
20 30 73.72 72.04 20 40 71.31 71.71 20 50 71.79 73.48 20 60 71.71 72.20 20 70 71.63 73.08 20 80 71.71 72.76 20 90 71.63 72.76 Sedangkan ntk persentase data training, tidak ditemkan selisih yang siginifikan ntk menentkan salah sat nilai persentase data training sebagai yang paling optimal. Namn, pada pengjian diketahi bahwa data training sebesar 50% dapat mencakp mata kliah pilihan paling banyak dibanding lainnya. 383 IS4 453 573 603 633 643 323 713 723 102-B CS3214-C CS3214-C CS3623-B 7.02 41.18 6.69 31.25 SE3773-B 7.02 16.94 CS1911-B 9.90 40.82 SE3414-C SE2423-C CS2223-B 5.83 63.64 CS2223 10.00 20.34 SE3773-B CS2223-B CS2624-C IS3013-B CS2624-C 102-A CS3931-A CS1931-A 6.69 57.14 18.60 63.16 5.56 22.73 4.4 Rekomendasi Berdasarkan pengjian yang telah dilakkan pada sb-bab sebelmnya, dihasilkan nilai minimm spport yang dianggap sebagai nilai paling optimal. Data atran asosiasi yang akan dignakan adalah yang memiliki minimm spport 20 dan dengan persentase data training sebanyak 50%. Hal ini dikarenakan kondisi tersebt dapat mencakp mata kliah pilihan paling banyak yait sebanyak 13 dari 15 mata kliah pilihan. Dari data atran asosiasi yang dihasilkan, terdapat mata kliah wajib yang diambil mahasiswa dengan mata kliah pilihan tertent. Artinya, mahasiswa yang telah mengambil mata kliah wajib dengan nilai tertent jga akan mengambil mata kliah pilihan tertent. Adapn beberapa atran asosiasi didapat yang dari pengjian yang nantinya akan dijadikan acan ntk rekomendasi adalah sebagai berikt. Tabel 0.5 Rekomendasi Mata Kliah Pilihan 113 333 343 363 MK yang Telah Diambil Sppo rt (%) Confide nce (%) 002-A 7.02 32.31 MA1223-A 102-A CS1911-A CS3243-A 10.40 77.78 002-B 10.42 41.67 002-A MA2713-C 6.69 71.43 Tabel 4.5 di atas merpakan beberapa atran rekomendasi yang mengac pada atran asosiasi pada tabel sebelmnya. Untk memhami tabel di atas, dengan contoh kass apabila seorang mahasiswa mengambil mata kliah dengan kode 002 dengan nilai A, maka ia direkomendasikan ntk mengambil mata kliah pilihan dengan kode 113. Pada tabel tersebt, tidak sema mata kliah pilihan dapat direkomendasikan. Hal ini bergantng pada kemnclan mata kliah pilihan yang terdapat pada saat pembentkan atran asosiasi. Untk mata kliah 313 dan 613 tidak dapat ditemkan atran asosiasi yang memiliki nsr item rekomendasi dikarenakan keda mata kliah tersebt memiliki itemset yang sangat sedikit sehingga tidak terbentk pada pola atran asosiasi. 5. Kesimplan dan Saran 5.1 Kesimplan Berdasarkan pengjian dan analisis yang telah dilakkan pada Bab 4, maka didapatkan beberapa kesimplan sebagai berikt. 1. Algoritma Recrsive Elimination (Relim) dapat dignakan ntk menyelesaikan masalah perekomendasian mata kliah pilihan informatika. Atran asosiasi yang dihasilkan algoritma ini berpa mata kliah wajib beserta nilainya dan mata kliah pilihan yang telah diambil mahasiswa beserta nilainya. 2. Nilai minimm spport pada kaitannya dengan wakt ekseksi, tidak memiliki Page 10
pengarh signifikan terhadap drasi preprocessing, namn berpengarh terhadap wakt terbentknya atran asosiasi. Semakin besar nilai minimm spport, maka wakt yang dibthkan ntk menghasilkan atran asosiasi semakin kecil karena freqent itemset yang semakin berkrang. 3. Jmlah freqent itemset yang dihasilkan berhbngan erat dengan atran asosiasi yang terbentk. Semakin sedikit freqent itemset-nya, maka semakin sedikit pla jmlah atran asosiasi karena berkrangnya jmlah itemset yang dapat dissn ke dalam atran asosiasi. 4. Nilai minimm spport paling optimal yait 20, karena merpakan nilai yang dapat menghasilkan persentase akrasi terbesar. Sedangkan ntk persentase data training, tidak terlihat salah sat nilai yang ckp menonjol ntk dijadikan nilai optimal. 5.2 Saran Adapn saran yang diperlkan ntk perbaikan jrnal ini adalah sebagai berikt. 1. Sistem dapat diakses secara online ntk memdahkan penggnanya, kapanpn dan dimanapn. 2. Proses rekomendasi tidak hanya ntk jrsan Informatika saja, tapi jga mencakp jrsan lain di Telkom University. 3. Menggnakan data mahasiswa yang akrat, yait mahasiswa hanya mengambil mata kliah pilihan dalam sat kelompok keahlian. Daftar Pstaka [1] Jiawei Han and Micheline Kamber. 2006. Data Mining Concepts and Techniqes, Second Edition [2] Farrah Hanna Al-Zawaidah, Yosef Hasan Jbara, and Marwan Al-Abed Ab-Zanona. 2011. An Improved Algorithm for Mining Association Rles in Large Databases. World of Compter Science and Information Technology Jornal [3] Borgelt, Christian. Keeping Things Simple: Finding Freqent Item Sets by Recrsive Elimination. University of Magdebrg, Germany [4] Borgelt, Christian. Simple Algorithms for Freqent Item Set Mining. Eropean Center for Soft Compting, Spain [5] Azhari and Anshori. 2009. Pendekatan Atran Asosiasi Untk Analisis Pergerakan Saham. Intelligent System Research Grop, Compter Science, FMIPA UGM [6] Dbey, Pallavi. 2012. Association Rle Mining on Distribted Data [7] Goldie Gnadi and Dana Indra Sensse. Maret 2012. Penerapan Metode Data Mining Market Basket Analysis terhadap Data Penjalan Prodk Bk dengan Menggnakan Algoritma Apriori dan Freqent Pattern Growth (FP-Growth) : Stdi Kass Percetakan PT. Gramedia. Jrnal TELEMATIKA MKOM Vol.4 No.1 [8] Ksrini dan Emha Tafiz Lthfi. 2009. Algoritma Data Mining. Yogyakarta : CV ANDI OFFSET (Penerbit ANDI) [9] Widodo, 21-23 Mei 2008, Prediksi Mata Kliah Pilhan dengan Atran Asosiasi, Jrsan Teknik Elektro Fakltas Teknik Universitas Negeri Jakarta, Konferensi dan Tem Nasional Teknologi Informasi dan Komnikasi ntk Indonesia, Jakarta [10] Raden Selamet. 2008. Association Rle. Media Informatika volme 7 no. 1 [11] R. Agrawal and R.Srikant.Sept,1994. Fast Algorithms for Mining Association rles. In Proc. Of the 20th Int l Conf. On Very Large Databases, Santiago,Chile [12] http://www.ittelkom.ac.id/pl gins/file/file_download/institusi/b P% 202011.pdf (Date : 30/11/12) Page 11