BAB III Landasan Teori

dokumen-dokumen yang mirip
PENDAHULUAN. 1.1 Latar Belakang

SISTEM REKOMENDASI PEMILIHAN KERJA UNTUK MAHASISWA UNIVERSITAS ATMAJAYA YOGYAKARTA MENGGUNAKAN METODE CONTENT-BASED FILTERING

BAB III LANDASAN TEORI

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. bermunculan, baik yang menggunakan franchise ataupun yang menggunakan

BAB II. Tinjauan Pustaka

BAB 2 LANDASAN TEORI Sistem Rekomendasi

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

ROCCHIO CLASSIFICATION

FRAMEWORK SISTEM REKOMENDASI BERITA BERBAHASA INDONESIA BERDASARKAN PILIHAN MINAT BACA PERSONAL

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

SISTEM TEMU KEMBALI INFORMASI

BAB 3 LANDASAN TEORI

Recommendation System

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. Pesatnya pertumbuhan internet saat ini berdampak pada melimpahnya

KONSEP MULTICRITERIA COLLABORATIVE FILTERING UNTUK PERBAIKAN REKOMENDASI

BAB II LANDASAN TEORI

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

TEKNIK VECTOR SPACE MODEL (VSM) DALAM PENENTUAN PENANGANAN DAMPAK GAME ONLINE PADA ANAK

BAB I PENDAHULUAN 1.1 Latar Belakang

FRAMEWORK SISTEM REKOMENDASI BERITA BERBAHASA INDONESIA BERDASARKAN PILIHAN MINAT BACA PERSONAL

BAB II TINJAUAN PUSTAKA

PERANCANGAN DAN IMPLEMENTASI SISTEM REKOMENDASI PENGAMBILAN MATA KULIAH PILIHAN MENGGUNAKAN METODE HYBRID

BAB II TINJAUAN PUSTAKA

PEMBANGUNAN SISTEM REKOMENDASI PENELUSURAN BUKU MENGGUNAKAN METODE PROBABILITAS BERBASIS WEB

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi

Information Retrieval

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

BAB 3 LANDASAN TEORI

Recommender System di Perpustakaan Universitas Kristen Petra menggunakan Rocchio Relevance Feedback dan Cosine Similarity

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA

BAB III LANDASAN TEORI

ANALISIS SKEMA-SKEMA KEMIRIPAN VEKTOR PADA SISTEM PENILAIAN UJIAN ESSAY ONLINE

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II KAJIAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

Pembuatan Sistem Rekomendasi Menggunakan Decision Tree dan Clustering

BAB I PENDAHULUAN. 1.1 Latar Belakang

Sistem Rekomendasi Mobil Berdasarkan Demographic dan Content-Based Filtering

SISTEM REKOMENDASI BAHAN AJAR UNTUK ELEARNING

BAB II TINJAUAN PUSTAKA

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB I PENDAHULUAN A. Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL

DIGITAL CAKERY DENGAN ALGORITMA COLLABORATIVE FILTERING

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING

BAB III. Landasan Teori. Bab ini akan menjelaskan mengenai dasar teori yang digunakan oleh penulis sebagai acuan dalam membuat sistem.

BAB II TINJAUAN PUSTAKA

PROGRAM BANTU PEMILIHAN LAGU PUJIAN BERDASARKAN TEMA KEBAKTIAN DENGAN MENGGUNAKAN METODE COSINUS SIMILARITY Studi Kasus: GKI Ngupasan

BAB I PENDAHULUAN. tanggal 31 Desember Kelebihan atau ledakan informasi pada jaringan internet

ANALISIS DAN IMPLEMENTASI CLUSTER-SMOOTHED PADA COLLABORATIVE FILTERING ANALYSIS AND IMPLEMENTATION OF CLUSTER-SMOOTHED FOR

Sistem Rekomendasi Bacaan Tugas Akhir Jurusan Teknik Informatika Universitas Sriwijaya menggunakan Metode Collaborative Filtering dan Naive Bayes

ANALISIS KLASTERING LIRIK LAGU INDONESIA

JURNAL ITSMART Vol 4. No 2. Desember 2015 ISSN :

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN

IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI

BAB 2 LANDASAN TEORI. Universitas Sumatera Utara

DAFTAR ISI. SKRIPSI... ii

BAB 1 PENDAHULUAN. 1 Universitas Kristen Maranatha

BAB I PENDAHULUAN 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

BAB I PENDAHULUAN. kecelakaan, kehilangan, kematian, kerusakan atau sakit.

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

SKRIPSI SISTEM REKOMENDASI WISATA KULINER DI YOGYAKARTA MENGGUNAKAN METODE KOLABORATIF (COLLABORATIVE METHOD)

Pemanfaatan Aljabar Vektor Pada Mesin Pencari

Sistem Deteksi Plagiarisme Dokumen Bahasa Indonesia Menggunakan Metode Vector Space Model

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

ANALISIS DAN IMPLEMENTASI SISTEM REKOMENDASI MENGGUNAKAN MOST-FREQUENT ITEM DAN ASSOCIATION RULE TECHNIQUE

BAB II LANDASAN TEORI

Hybrid Recommendation System Memanfaatkan Penggalian Frequent Itemset dan Perbandingan Keyword

Aplikasi Rekomendasi Buku pada Katalog Perpustakaan Universitas Multimedia Nusantara Menggunakan Vector Space Model

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. dilakukan. Dengan demikian, pengembang mendapatkan rujukan pendukung,

Sistem Temu-Kembali Informasi Pengantar Perkuliahan

SISTEM REKOMENDASI PEMINJAMAN VCD DENGAN METODE ITEM BASED COLLABORATIVE FILTERING

BAB III LANDASAN TEORI

PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency

BAB I PENDAHULUAN. tidak akan ditinggalkan oleh mahluk hidup khususnya umat manusia, dari dulu

BAB II TINJAUAN PUSTAKA

Klasifikafi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour. Information Retrieval Document Classified with K-Nearest Neighbor

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

Transkripsi:

BAB III Landasan Teori 3.1 Sistem Rekomendasi Sistem rekomendasi merupakan suatu aplikasi untuk menyediakan dan merekomendasikan suatu item dalam membuat suatu keputusan yang diinginkan oleh pengguna (Ungkawa, et al., 2013). Penerapan rekomendasi didalam sebuah sistem biasanya melakukan prediksi suatu item, seperti rekomendasi film, musik, buku, berita dan lain sebagainya yang menarik user. Sistem ini berjalan dengan mengumpulkan data dari user secara langsung maupun tidak (Fadlil & Mahmudy, 2010). Pengumpulkan data secara langsung dapat dilakukan sebagai berikut : 1. Meminta user untuk melakukan rating pada sebuah item. 2. Meminta user untuk melakukan rangking pada item favorit setidaknya memilih satu item favorit. 3. Memberikan beberapa pilihan item pada user dan memintanya memilih yang terbaik. 4. Meminta user untuk mendaftar item yang paling disukai atau item yang tidak disukainya. Pengumpulan data dengan tidak langsung berhubungan dengan seorang user, dilakukan dengan cara mengamati item yang dilihat oleh seorang user pada sebuah web e- commerce. Dari data hasil yang dikumpulkan tersebut, kemudian diolah dengan menggunakan algoritma tertentu. Setelah itu, hasilnya tersebut dikembalikan lagi kepada 9

user sebagai sebuah rekomendasi item dengan parameter dari user tersebut. Sistem rekomendasi juga merupakan salah satu alternatif sebagai mesin pencari suatu item yang dicari oleh user. Dalam pembangunan sistem rekomendasi, ada beberapa macam metode untuk menyelesaikan permasalahan, antara lain user-based collaborative filtering, content-based filtering, dan hybrid. Namun beberapa peneliti menambahkan metode baru, yaitu knowledge based recommendation. Secara umum, Metode user-based collaborative filtering menggunakan feedback, ulasan dan rating untuk mendapatkan hasil rekomendasi. Metode content-based memberikan rekomendasi dengan membangun profile pengguna. Metode hybrid-based menggabungkan dua atau lebih metode. Penggabungan dilakukan dengan tujuan saling melengkapi kekurang dari metode yang digunakan. Sedangkan metode knowledge-based menggunakan pola pengetahuan untuk memberikan hasil rekomendasi. 3.2 Content-Based Filtering Ada berbagai macam metode pendekatan yang digunakan untuk menyelesaikan permasalahan pada sistem rekomendasi, antara lain user-based collaborative filtering, contentbased filtering dan hybrid. Dalam kasus pemilihan pekerjaan untuk mahasiswa program sudi Teknik Informatika UAJY, metode yang digunakan adalah metode content-based filtering. Content-based filtering memberikan suatu rekomendasi berdasarkan hasil analisa kemiripan item yang telah dinilai oleh penggunanya (Adi, 2010) Content-Based 10

Filtering membentuk profil penggunanya berdasarkan atribut pembentuk suatu item. Cosine Similarity yang tertinggi yang akan menjadi hasil rekomendasi. Content-Based Filtering membentuk profil penggunanya berdasarkan atribut pembentuk suatu item. Sebagai contoh untuk suatu dokumen, atribut pembentuknya adalah katakata yang terdapat pada dokumen tersebut. Parameter pembentuk profil pengguna ini juga diberi nilai bobot berdasarkan kriteria tertentu. Adapun langkah langkah algoritmanya : 1. Suatu item barang dibagi-bagi berdasarkan suatu vektor komponen pembentuknya. 2. Sistem akan membuat profil pengguna berdasarkan bobot vektor komponen pembentuk suatu item. Pembuatan profil pengguna dapat menggunakan algoritma TF-IDF (term frequency-invers document frequency). TF adalah jumlah term dalam suatu dokumen. Sedangkan nilai IDF dapat dihitung menggunakan rumus:...(3.1) n merupakan jumlah semua dokumen sedangkan df adalah jumlah dokumen yang memiliki term i. 3. Berdasarkan profil pengguna tersebut, sistem akan memperkirakan penilaian suka atau tidak suka suatu item berdasarkan analisis kemiripan profil pengguna dengan vektor komponen pembentuk item. Jika sistem memperkirakan bahwa item tersebut akan disukai oleh 11

pengguna maka item tersebut akan direkomendasikan ke pengguna. 3.3 Cosine Similarity Menurut Manning, Raghavan, dan Schutze (2009), cosine similarity digunakan untuk mengukur kedekatan antara dua vektor. Selain menggunakan cosine, untuk mengukur kedekatan antar vektor dengan menggunakan fungsi similaritas. Beberapa fungsi similaritas yang sering dijumpai adalahah Jaccard, Overlap, Assimmetric, Minowski Distance, Pearson Corrlation, dan Cosine. Untuk tujuan klastering yang baik adalah Cosine Similarity. Berikut adalah persamaan dari metode Cosine Similarity :...(3.2) dimana : x dan y adalah vector yang berbeda. xi = term i yang ada pada vector x yi = term I yang ada pada vector y Pada hasil perhitungan cosine similarity, hasil pehitungan tertinggi yang menjadi vektor yang terdekat dan vektor yang ingin dibandingkan. Pada kasus SIREP, nilai tertinggi adalah rekomendasi pekerjaan yang akan berikan kepada user. 12

3.4 Sum Square Error (SSE) Sum Square Error adalah proses perhitungan yang bertujuan untuk menghitung seberapa besar error kemungkinan yang bisa terjadi pada sistem. Berikut adalah rumus perhitungan SSE :...(3.3) dimana: Xi = nilai yang akan dihitung seberapa besar errornya _ X = nilai rata-rata dalam satu cluster dimana Xi berada Pada hasil perhitungan SSE semakin kecil nilai SSE-nya akan semakin baik. Sebaliknya, semakin besar nilai SSEnya, maka semakin buruk. 3.5 Dunn Index Dunn index adalah salah satu pengukuran cluster validity yang diajukan oleh J.C.Dunn. Cluster validity ini berlandaskan pada fakta bahwa klaster yang terpisah itu biasanya memiliki jarak antar klaster yang besar dan diameter intra klaster yang kecil (Gita & Saikhu, n.d.). Hasil perhitungan dunn index, semakin besar semakin baik....(3.4) 13

3.6 Silhouette Silhouette merupakan validasi yang digunakan untuk menentukan baik atau buruknya klaster yang dibentuk. Dalam silhouette memiliki rentang -1 sampai 1. Dikatakan klaster itu baik, apabila hasil perhitungan silhouette semakin mendekati 1. Sebaliknya, klaster dikatakan buruk, apabila silhouette mendekati -1 (Gita & Saikhu, n.d.)....(3.5) Nilai a adalah rata-rata dari jarak objek i ke objekobjek lain yang berada pada satu klaster. Sedangkan nilai b adalah minimal dari rata-rata 6 jarak objek i ke objekobjek lain yang berada pada klaster yang berbeda. 3.7 Structured Query Language SQL (Structured Query Language) adalah sebuah bahasa yang dipergunakan untuk mengakses data dalam basis data relasional. Bahasa ini secara de facto merupakan bahasa standar yang digunakan dalam manajemen basis data relasional. Saat ini hampir semua server basis data yang ada mendukung bahasa ini untuk melakukan manajemen datanya (Adelia & Setiawan, 2011). 14