BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan merupakan tempat dimana seseorang mendapatkan pengetahuan, informasi atau hiburan dengan jumlah kategori yang bervarian seperti ilmiah, non fiksi, komedi, animasi, romance dan lainnya. Peminjam baik anggota maupun non anggota sebelum mereka memutuskan untuk meminjam buku, terlebih dahulu mereka ingin mengetahui beberapa informasi mengenai buku tersebut, seperti ketersediaan buku, pengaran, penerbit, tahun terbit dan rak penyimpanan buku selain itu dengan begitu banyaknya judul, varian, kategori yang ada pada perpustakaan terkadang peminjam mengalami kesulitan atau kebingungan ketika akan meminjam, sehingga membutuhkan beberapa alternative buku lain untuk dipinjam. Oleh karena itu selain memerlukan informasi tentang masing-masing buku diperlukan pula suatu fitur tambahan berupa recommender system, fitur recommender ini dapat diterapkan dengan menerapkan salah satu teknik data mining yaitu association rules, salah satu pengaplikasiannya adalah market basket analysis. Mengacu pada penelitian [4] tujuan market basket analysis adaah untuk menemukan bagaimana menemukan item yang dibeli oleh pelanggan dalam supermarket atau toko saling berhubungan.. Penelitian ini merupakan pengembangan penelitian sebelumnya yang mengacu pada [8] yaitu Pembangunan Fitur Book Recommender System Menggunakan Algoritma Apriori Studi Kasus Pada Sistem Informasi Perpustakaan Universitas Widyatama, dan disebutkan bahwa kelemahan metode apriori adalah runtime waktu ketika proses pruning memakan waktu yang lama sehingga algoritma yang digunakan pada penelitian ini adalah Frequent Pattern Growth guna untuk menguji keakuratan algoritma fp-growth yang akan diterapkan pada aplikasi yang akan dibangun dari awal, dan penelitian ini diberi judul, Penerapan Market Basket Analysis pada Book I-1
I-2 Recommender System Menggunakan Algoritma Frequent Pattern Growth dengan studi kasus di perpustakaan Universitas Widyatama. Berdasarkan [1], algoritma FP-growth adalah salah satu alternatif algoritma yang dapat digunakan untuk menentukan himpunan data yang paling sering muncul (frequent itemset) dalam sebuah kumpulan data berdasarkan data history transaksi beberapa waktu sebelumnya. FP-growth menggunakan pendekatan yang berbeda dari paradigma yang digunakan pada algoritma Apriori. Berbeda dengan paradigma Apriori yang memerlukan langkah candidate generation, yaitu dengan melakukan scanning database secara berulang-ulang untuk memenuhi syarat minimum untuk support dan syarat minimum untuk confidence sedangkan menggunakan algoritma FP-growth, dapat dilakukan pencarian frequent itemset tanpa harus melalui candidate generation. Fp growth menggunakan struktur data FP-Tree sehingga cara kerja dari algoritma ini adalah melalui scan database yang dilakukan hanyadua kali Aplikasi yang akan dirancang nantinya adalah aplikasi finder book yang dilengkapi dengan fitur tambahan book recommender. Aplikasi ini akan membantu memberikan informasi detail mengenai buku yang dicarikan pada keyword serta diharapkan para pengunjung perpustakaan memperoleh alternatif judul buku untuk dipinjam secara bersamaan. Selain itu hasil penelitian ini bermanfaat bagi pustakawan untuk mengatur tata letak buku karena tata letak buku mempengaruhi seseorang untuk melakukan peminjaman. 1.2 Rumusan Masalah Dari latar belakang di atas dapat dirumuskan beberapa masalah yaitu : 1. Bagaimana membangun suatu aplikasi yang dapat merekomendasikan pilihan buku kepada pengunjung untuk dipinjam berdasarkan transaksi sebelumnya? 2. Apakah struktur data pada data transaksi tersebut sesuai untuk dilakukan penerapan algoritma FP-Growth? 3. Bagaimana cara mengkonstruksikan rekomendasi buku berdasarkan frequent itemset?
I-3 1.3 Batasan Masalah Agar pembahasan mencapai sasaran sesuai dengan yang diharapkan maka dalam penelitian ini perlu dibatasi ruang lingkup pembahasan yang meliputi: 1. Aplikasi yang dibangun merupakan mesin pencarian buku dengan fitur tambahan book recommender, dan bukan merupakan pengembangan aplikasi yang sudah ada. 2. Rekomendasi buku tidak mencakup rekomendasi jurnal, tugas akhir, skripsi dan thesis. 3. Data transaksi yang digunakan adalah data transaksi peminjaman yang dilakukan oleh mahasiswa Universitas Widyatama yang diperoleh dari data transaksi peminjaman 1.4 Tujuan Penelitian Tujuan dari penelitian ini, antara lain : 1. Membangun aplikasi yang dapat merekomendasikan pilihan buku dengan judul lain kepada pengunjung berdasarkan transaksi peminjaman perpustakaan Universitas Widyatama 2. Melakukan analisis terhadap struktur data flat file dari transaksi Perpustakaan Universitas Widyatama apakah sesuai untuk dilakukan penerapan algoritma Fp-Growth. 3. Membangun sistem pencarian buku yang dapat merekomendasikan buku berdasarkan hasil algoritma FP-Growth berupa frequent itemset. 1.5 Metodologi Metode yang digunakan untuk membangun sistem adalah metode terstruktur, sedangkan metode penelitian yang digunakan adalah CRISP-DM[ (CRoss - Industry Standard Proses for Data Mining) yaitu standar proses dalam data mining yang dapat diaplikasikan dalam berbagai sektor industri. Metode CRISP-DM ini memiliki enam tahapan dalam pengembangan data mining (Chapman, 2000) yaitu
I-4 1. Business Understanding Tahap pertama adalah memahami tujuan dan kebutuhan dari sudut pandang bisnis, kemudian menterjemakan pengetahuan ini ke dalam pendefinisian masalah dalam data mining. Selanjutnya akan ditentukan rencana dan strategi untuk mencapai tujuan tersebut. 2. Data Understanding Tahap ini dimulai dengan pengumpulan data yang kemudian akan dilanjutkan dengan proses untuk mendapatkan pemahaman yang mendalam tentang data, mengidentifikasi masalah kualitas data, atau untuk mendeteksi adanya bagian yang menarik dari data yang dapat digunakan untuk hipotesa untuk informasi yang tersembunyi. 3. Data Preparation Tahap ini meliputi semua kegiatan untuk membangun dataset akhir (data yang akan diproses pada tahap pemodelan/modeling) dari data mentah. Tahap ini dapat diulang beberapa kali. Pada tahap ini juga mencakup pemilihan tabel, record, dan atributatribut data, termasuh proses pembersihan dan transformasi data untuk kemudian dijadikan masukan dalam tahap pemodelan (modeling). 4. Modeling Dalam tahap ini akan dilakukan pemilihan dan penerapan berbagai teknik pemodelan dan beberapa parameternya akan disesuaikan untuk mendapatkan nilai yang optimal. Secara khusus, ada beberapa teknik berbeda yang dapat diterapkan untuk masalah data mining yang sama. Di pihak lain ada teknik pemodelan yang membutuhan format data khusus. Sehingga pada tahap ini masih memungkinan kembali ke tahap sebelumnya. 5. Evaluation Pada tahap ini, model sudah terbentuk dan diharapkan memiliki kualitas baik jika dilihat dari sudut pandang analisa data. Pada tahap ini akan dilakukan evaluasi terhadap keefektifan dan kualitas model sebelum digunakan dan menentukan apakah model dapat mencapat tujuan yang ditetapkan pada fase awal (Business Understanding).
I-5 Kunci dari tahap ini adalah menentukan apakah ada masalah bisnis yang belum dipertimbangkan. Di akhir dari tahap ini harus ditentukan penggunaan hasil proses data mining. 6. Deployment Pada tahap ini, pengetahuan atau informasi yang telah diperoleh akan diatur dan dipresentasikan dalam bentuk khusus sehingga dapat digunakan oleh pengguna. Tahap deployment dapat berupa pembuatan laporan sederhana atau mengimplementasikan proses data mining yang berulang dalam perusahaan. Dalam banyak kasus, tahap deployment melibatkan konsumen, di samping analis data, karena sangat penting bagi konsumen untuk memahami tindakan apa yang harus dilakukan untuk menggunakan model yang telah dibuat. Gambar 1.1 Siklus CRISP-DM Menurut Chapman
I-6 1.6 Sistematika Penulisan BAB I Pendahuluan, pada bab ini akan dibahasa rumusan masalah penelitian, batasan masalah, tujuan penelitian, dan metode penelitian. BAB II Tinjauan Pustaka, pada bab ini berisi teori-teori pendukung penelitian, yang meliputi metode penelitian, algoritma yang digunakan dan teori pendukung lainnya yang berhubungan dengan perancangan sistem. BAB III Analisis Sistem, pada bab ini berisi tentang analisis sistem yang sedang berjalan serta tahapan-tahapan penelitian yang dimulai dari business understanding dan data understanding. BAB IV Perancangan Sistem, pada bab ini akan membahas tahapan data preparation dan modeling aplikasi yang akan dibuat. Bab ini akan membahas alur sistem yang akan dibuat dan implementasi antar muka. BAB V Implementasi dan Pengujian Sistem pada bab ini akan membahas pengujian algoritma yang telah diterapkan pada fitur book recommender. BAB VI Kesimpulan dan Saran, pada bab ini akan dibahas hasil temuan dari penelitian serta saran untuk pengembangan sistem selanjutnya.