BAB II LANDASAN TEORI

dokumen-dokumen yang mirip
BAB I PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI HYBRID-BASED RECOMMENDATION DIDALAM SISTEM REKOMENDASI PENCARIAN PEKERJAAN BERBASIS WEB

PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI Sistem Rekomendasi

Recommendation System

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. Universitas Sumatera Utara

BAB 1 PENDAHULUAN Latar Belakang

BAB III Landasan Teori

DIGITAL CAKERY DENGAN ALGORITMA COLLABORATIVE FILTERING

DATA MINING. Pertemuan 1. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II KAJIAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 3 LANDASAN TEORI

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING

BAB I PENDAHULUAN. (compact disc). Teknologi ini memang praktis baik dari segi biaya maupun

BAB I PENDAHULUAN. 1.1 Latar Belakang

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

BAB I PENDAHULUAN. Pengguna Internet (31 Desember 2000) Afrika 1,037,524,058 4,514, ,609,620 2,527.4%

BAB I PENDAHULUAN. Pesatnya pertumbuhan internet saat ini berdampak pada melimpahnya

BAB III LANDASAN TEORI

Item Collaborative Filtering untuk


UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. yang cepat dan besar di Asia (Kartiwi, 2006). Pertumbuhan e-commerce yang

BAB II TINJAUAN PUSTAKA

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN I-1

Sistem Basis Data Lanjut DATA MINING. Data Mining 1/12

BAB I PENDAHULUAN. Pengambilan keputusan adalah proses pemilihan, diantara berbagai alternatif aksi

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB 3 LANDASAN TEORI

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN. 1.1 Latar Belakang

KLASIFIKASI DATA MINING DENGAN METODE POHON KEPUTUSAN MENGGUNAKAN ID3

BAB I PENDAHULUAN. 1.1 Latar Belakang

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB 2 TELAAH PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

BAB 2 LANDASAN TEORI

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

MODUL 12 Model Prediktif

BAB I PENDAHULUAN. pendukung keputusan atau Decision Support System merupakan suatu sistem

BAB II. Tinjauan Pustaka

ANALISIS DAN IMPLEMENTASI CLUSTER-SMOOTHED PADA COLLABORATIVE FILTERING ANALYSIS AND IMPLEMENTATION OF CLUSTER-SMOOTHED FOR

ALGORITMA NEAREST NEIGHBOR

BAB 2 TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB 1 PENDAHULUAN. 1 Universitas Kristen Maranatha

DAFTAR ISI... LEMBAR PENGESAHAN PEMBIMBING... LEMBAR PENGESAHAN PENGUJI... HALAMAN PERSEMBAHAN... HALAMAN MOTTO... KATA PENGANTAR...

1. BAB I PENDAHULUAN 1.1. Latar Belakang ,

BAB I PENDAHULUAN A. Latar Belakang

PERANCANGAN SISTEM PENDUKUNG KEPUTUSAN (SPK) UNTUK MENENTUKAN KELAIKLAUTAN KAPAL ABSTRAK

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA. Turban mendefinisikan Decision Support System sebagai sekumpulan

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. kecelakaan, kehilangan, kematian, kerusakan atau sakit.

BAB III TEORI DASAR SISTEM PAKAR DAN SISTEM KONTROL BERBASIS SISTEM PAKAR 20 BAB III TEORI DASAR SISTEM PAKAR DAN SISTEM KONTROL BERBASIS SISTEM PAKAR

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA

Metode Analisis Rekomendasi Pada Sistem Rekomendasi (Contoh Kasus Pemanfaatan Pada Biro Wisata) Oleh ARI PURWANTO

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

SISTEM REKOMENDASI PAKET MAKANAN DENGAN ALGORITMA FP-GROWTH PADA RESTORAN SEAFOOD XYZ

ROCCHIO CLASSIFICATION

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. Teknologi Informasi sekarang ini telah digunakan hampir di semua aspek

SISTEM REKOMENDASI MATA KULIAH PILIHAN MAHASISWA DENGAN CONTENT-BASED FILTERING DAN COLLABORATIVE FILTERING (STUDI KASUS: UNIVERSITAS BRAWIJAYA)

BAB I PENDAHULUAN 1.1 Latar Belakang

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

TINJAUAN PUSTAKA. Definisi Data Mining

BAB III LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

Transkripsi:

BAB II LANDASAN TEORI Di dalam landasan teori ini, akan dibahas tentang teori teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1 Basis Data (Database) Basis data diperlukan dalam pembuatan sebuah sistem sebagai inti dari sistem tersebut. Beberapa definisi lain tentang basis data adalah sebagai berikut: 1. Basis data adalah sebuah model dari beberapa aspek realitas pada sebuah organisasi (Kent, 1978). 2. Menurut Connolly dan Begg (2002), basis data adalah kumpulan dari data yang sering digunakan oleh sebuah sistem pada suatu organisasi. 3. Basis data menurut Sutanta (2004) adalah pengorganisasian sebuah kumpulan data yang saling terkait atau berhubungan sehingga memudahkan memperoleh informasi. 4. Database adalah sebuah struktur repositori dari suatu data. Basis data diciptakan untuk mengoperasikan infomasi dalam skala besar. Fungsi dari basis data seperti memasukkan data, menyimpan data, mengambil data dan mengelola data tersebut. Dari definisi yang telah dijabarkan, maka dapat disimpulkan bahwa Pengertian dari database adalah koleksi dari berbagai macam data yang terorganisir di dalam satu unit atau tempat.

2.1.1 Database Management System (DBMS) Database management system (DBMS) adalah sebuah set dari fasilitas yang terorganisir untuk mengakses dan mempertahankan satu atau banyak basis data. Penggunaan DBMS dilakukan di dalam integrasi dari suatu sistem yang menggunakan data tersebut dalam sebuah perangkat lunak (Beynon-Davies, 2004). Menurut Beynon-Davies, DBMS dibagi atas 4 jenis yaitu: 1. Data definition : fungsinya yaitu pendefinisian struktur data baru yang masuk ke dalam sebuah database, menghapus struktur data dasi sebuah basis data dan memodifikasi struktur dari data yang sudah ada. 2. Data maintenance : fungsinya yaitu menyisipkan data baru, memperbaharui data dan menghapus data pada sebuah data struktur yang telah ada. 3. Data retrival : fungsinya yaitu, melakukan query pada data yang telah ada dan mengambil data untuk digunakan pada sebuah sistem. 4. Data Control : fungsinya yaitu, menciptakan dan memonitoring user dari basis data, membatasi akses data, dan memonitoring performa database. 2.2 Sistem Rekomendasi (Recommender System) Ada beberapa macam definisi dari sistem rekomendasi. Menurut Mahmood dan Ricci, Sistem Rekomendasi adalah peralatan perangkat lunak dan teknik yang menyediakan saran untuk items yang bisa digunakan oleh user. Secara general sistem rekomendasi didefinisikan sebagai sistem pendukung yang membantu user untuk mencari informasi, produk dan servis (buku, film, music dll) dengan menggabungkan dan menganalisa saran dari user lain, yang berarti meninjau dari beberapa pihak dan user atribut (Frias-Martinex, 2006). Sistem rekomendasi menjadi sebuah penelitian bidang yang penting sejak munculnya makalah pertama tentang collaborative-filtering pada pertengahan 1990an (Herlocker, 2001). Tujuan dari sistem rekomendasi adalah menghasilkan rekomendasi yang berguna kepada user untuk items atau produk yang paling menguntukan bagi

user (Melville dan Sindhwani, 2010). Sistem Rekomendasi menurut Melville dan Sindhwani, terbagi atas 3 jenis, yaitu: 1. Content-based Filtering 2. Collaborative Filtering 3. Hybrid-based Filtering 2.2.1 Content Based Filtering Content-based filtering adalah sistem yang belajar untuk memberikan rekomendasi item yang sama kepada user baru dengan membandingkan user yang terdahulu (Mahmod dan Ricci, 2009). Yang dimaksud dengan user yang baru dan user yang lama di sini adalah user baru sebagai data yang baru masuk dan user lama sebagai data yang telah masukkan dan sudah tersimpan di dalam database. Teknik teknik yang digunakan dalam content-based seperti Bayesian Classifiers, Cluster analysis, decision trees dan artificial neural networks. Teknik teknik tersebut dapat mengestimasi probabilitas perbandingan data lama dengan data baru. 2.2.2 Collaborative Filtering Implementasi termudah dan original dari pendekatan rekomendasi ini untuk user aktif yang mempunyai kesamaan dengan user yang terdahulu (Schafer dkk, 2007). Kesamaan data pada 2 user dikalkulasi berdasarkan kesamaan history dari user. Metode ini membandingkan koleksi data yang sama ataupun tidak sama dengan data yang baru dan kemudian dikalkulasi agar dapat diberikannya rekomendasi kepada user. Teknik teknik yang sering dipakai dalam metode ini adalah teknik tf-idf, nearest neighbor dan pearson Correlation. 2.2.3 Hybrid Based Filtering Sistem rekomendasi ini berdasarkan oleh kombinasi dari content-based filtering dan collaborative filtering (Mahmod dan Ricci, 2009). Sistem hybrid yang

menggabungkan metode content-based filtering dengan collaborative filtering mencoba menggunakan keunggulan dari content-based filtering untuk mengatasi masalah dari kekurangan collaborative filtering ataupun sebaliknya. Contohnya seperti pada metode content-based filtering hanya dapat mengklasifikasikan data. Tetapi sistem ingin memberikan rangking kepada user untuk rekomendasi item. Maka dari itu sistem menggunakan metode collaborative filtering untuk mendapatkan perhitungan agar menghasilkan sebuah rangking rekomendasi yang dapat diberikan kepada user. Sehingga dengan menggabungkan dua metode tersebut, sistem akan memberikan hasil yang lebih baik dan lebih memuaskan kepada user. 2.3 Metode Nearest Neighbor Metode nearest neighbor langsung mengeksploitasi jarak antara data sampel untuk melakukan klasifikasi. Nearest neighbor secara independen mengevaluasi jarak antara data yang satu dengan data yang lain (Xu, Y. 2012). Rules nearest neighbor mengidentifikasi katagori dari data poin yang baru (kasus baru) berdasarkan nearest neighbor dari data (kasus lama) yang telah diketahui nilainya (Vaidehi dan Vasuhi, 2008). Rule ini digunakan pada sistem pengenalan pattern (pattern recognition), pengkatagorian text (text catagorization), model rangking, pengenalan objek (object recognition) dan event recognition (Bhatia dan Vandana, 2010).

Gambar 2.1 Kedekatan kasus Pada gambar 2.1 dapat dilihat bahwa terdapat dua kasus lama, yaitu kasus A dan kasus B. Pada saat kasus baru muncul, solusi yang digunakan untuk memcahkan kasus baru tersebut adalah dengan kasus lama A dikarenakan jarak 1 yaitu kasus baru dengan kasus A lebih dekat dibandingkan jarak 2 yaitu jarak kasus baru dengan kasus B. Maka diambil kesimpulan bahwa kasus baru dipecahkan oleh kasus A. Untuk memperoleh rangking pada nearest neighbor, sistem melakukan perhitungan kedekatan (similarity) antara 2 kasus. Berikut adalah rumus dari yang digunakan di dalam metode nearest neighbor. Dimana : T : Kasus baru S : Kasus yang ada dalam memori/basisdata (kasus lama) n : Jumlah atribut dalam setiap kasus i : atribut variabel antara 1 s/d n f : fungsi similarity atribut i antara kasus T dan kasus S w : bobot yang diberikan pada atribut ke-i Penentuan kedekatan biasanya berada pada nilai antara 0 s/d 1. Nilai 0 berarti bahwa kedua kasus mutlak tidak memiliki kesamaan, sebaliknya untuk nilai 1, berarti kasus tersebut mutlak memiliki kesamaan. 2.4 Metode Decision Tree

Klasifikasi data bisa dideskripsikan sebagai pengawas dari sebuah learning algoritm di dalam proses mesin pembelajaran. Decision tree adalah sebuah representasi dari prosedur keputusan untuk menentukan kelas dan dikonstruksikan menjadi algoritma non-incremental tree-induction atau algoritma incremental tree-induction (Utgoff, 1989). dalam sistem pengambilan keputusan dan proses pembelajaran sistem yang menggunakan teknik prediksi modeling yang digunakan di dalam klasifikasi. Decision tree menggunakan teknik divide-conquer untuk memisahkan masalah menjadi bagian bagian. Struktur dari Decision tree dibuat dari node awal (root), pilihan (internal) dan node hasil (leaf nodes). Struktur pohon ini digunakan untuk mengklasifikasikan data yang belum diketahui record-nya. Pada gambar 2.2 berikut, akan digambarkan struktur pohon keputusan yang akan digunakan pada skripsi ini.

Gambar 2.2 Decision Tree 2.5 Penelitian terdahulu Di bagian ini akan dijabarkan beberapa penelitian terdahulu. Sistem rekomendasi telah banyak digunakan pada penelitian terdahulu. Seperti sistem rekomendasi pada bursa telepon genggam (2008) yang menggunakan content-based filtering dan sistem rekomendasi untuk sistem informasi toko film digital (2007) menggunakan metode user item.

Untuk metode Hybrid-based filtering telah digunakan oleh (2010) pada sistem rekomendasi berita berbahasa indonesia yang menggunakan gabungan metode clustering dan algoritma tf-dif. Kemudian digunakan juga oleh (2012) untuk memperoleh rekomendasi minat bakat siswa yang menggunakan metode Association Rule dan algoritma Apriori. Untuk lebih jelasnya, pada tabel 2.1 Berikut akan dijelaskan penelitian penelitian yang telah dibuat sebelumnya. Tabel 2.1 Penelitian terdahulu No. Judul Tahun Metode yang Keterangan digunakan 1 Pembangunan Perangkat Lunak Sistem Rekomendasi Bursa Elektronis Telepon Genggam. 2008 content-based filtering Kelemahan : ketidakmampuan sistem memberikan rekomendasi suatu informasi yang baru karena rekomendasi berdasarkan data yang lalu. 2 Metode Analisis Rekomendasi Pada Sistem Rekomendasi (Contoh kasus 2009 knowledgebased, utility based user-based Berdasarkan kepuasan pelanggan (user satisfaction) pemodelan sistem rekomendasi collaborative Pemanfaatan pada biro memiliki domain dan filtering, itembased wisata) wilayahnya masing-masing collaborative filtering, dan dalam penyelesaian masalah penentuan rekomendasi association rules Tabel 2.1 Penelitian terdahulu (lanjutan) No. Judul Tahun Metode yang Keterangan digunakan 3 Model Sistem Informasi Toko Film Digital Dengan Recommender System 2007 Collaborative Filtering metode user item Keuntungan : dinamis dan sederhana dalam perhitungan rekomendasi Kelemahan : masalah skalabilitas dan sparsity

4 Studi Multi Criteria Decision Making (MCDM) untuk Recommender System Bursa Tenaga Kerja 5 Implementasi Sistem Rekomendasi Berita Berbahasa Indonesia Berbasis Pilihan Personal Menggunakan Algoritma Hybrid Filtering 6 Sistem Rekomendasi Bidang Minat Mahasiswa menggunakan Metode Association Rule dan Algoritma Apriori 2008 Multi Criterian Decision Making (MCDM) 2010 Algoritma clustering dan algoritma tf-dif 2012 metode Association Rule dan algoritma Apriori akibat terlalu banyak item. Kelebihan : metode sederhana dan sesuai, permasalahan pemilihan alternatif yang jumlahnya terbatas dan telah diketahui sebelumnya. Algoritma clustering digunakan untuk klasifikasi berita Keuntungan tf-dif : pemberian bobot pada term sehingga dapat mengetahui term yang sering muncul dalam dokumen secara individu, namum jarang dijumpai pada dokumen lain Aturan yang telah diinput sebelumnya menjadi acuan rekomendasi terhadap minat user sehingga sistem dapat memberika rekomendasi Tabel 2.1 Penelitian terdahulu (lanjutan) No. Judul Tahun Metode yang Keterangan digunakan 7 Perancangan Sistem Pendukung Keputusan (SPK) untuk menentukan 2010 Metode Decision tree menggunakan algoritma ID3 Kelemahan ID3 : ketidakstabilan dalam melakukan klasifikasi data apabila terjadi sedikit

Kelaiklautan Kapal. 8 Penerapan Data Mining untuk menganalisa kemungkinan pengunduran diri calon mahasiswa bar 9 Metode HYBRID (Content dan Collaborative based) Nearest Neighbour untuk sistem rekomendasi pariwisata 10 Sistem rekomendasi pembelian mobil berbasis metode Neuro- Fuzzy Classification 11 Perbandingan metode Nearest neigbor dan algoritma C.45 untuk menganalisis kemungkinan pengunduran diri calon mahasiswa di STMIK Yogyakarta 2011 Algoritma Decision tree menggunakan algoritma ID3 2011 Algoritma Nearest Neighbor dan algoritma Euclidean - metode Neuro- Fuzzy Classification 2009 Algoritma Nearest Neighbor dan algoritma C4.5 perubahan pada data. Kelebihan : dapat menganalisa fungsi target yang bernilai diskrit ID3 merupakan algoritma dasar dalam decision tree sehingga algoritma tersebut lebih mudah dimengerti dan digunakan Menanggulangi kelemahan dari motede hybrid(content dan collaborative) dengan pendekatan baru yaitu Algoritma Nearest Neighbor Penggabungan fuzzy logic dengan neural network untuk menanggulangi kekurangan dari rule fuzzy logic Algoritma Nearest Neighbor: tidak lebih akurat dari C.45 tetapi pada saat pengklasifikasian data algoritma C.45 membutuhkan waktu yang lebih lama dan proses yang lebih panjang