BAB 3 LANDASAN TEORI

dokumen-dokumen yang mirip
BAB II LANDASAN TEORI

BAB 3 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PERTEMUAN 14 DATA WAREHOUSE

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. dengan lingkungan sosialnya pengguna social media seringkali menceritakan

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. komunikasi yang sangat efektif bagi umat manusia di dunia. Pengguna internet dapat melakukan

BAB II TINJAUAN PUSTAKA

PEMANFAATAN TEKNOLOGI INFORMASI JEJARING SOSIAL TWITTER UNTUK PROMOSI BAGI USAHA KECIL MENENGAH

PROGRAM BANTU PENEMPATAN PERSEDIAAN BARANG SANITER PADA DUA TOKO DENGAN METODE NAÏVE BAYES

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

Abidah Elcholiqi, Beta Noranita, Indra Waspada

ANALISIS SENTIMEN JASA EKSPEDISI BARANG MENGGUNAKAN METODE NAÏVE BAYES

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

PENERAPAN DATA MINING UNTUK MEMPREDIKSI KRITERIA NASABAH KREDIT

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II LANDASAN TEORI

3.1 Metode Pengumpulan Data

ANALISIS SENTIMEN PADA JASA OJEK ONLINE MENGGUNAKAN METODE NAÏVE BAYES

UNTUK TOPIC DETECTION AND TRACKING PADA MICROBLOG TWITTER

PENINGKATAN PERFORMA ALGORITMA APRIORI UNTUK ATURAN ASOSIASI DATA MINING

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang

Agus Soepriadi, 2 Meta Permata. Jurusan Teknik Informatika, STMIK Bandung, Bandung, Indonesia

BAB II KAJIAN PUSTAKA. pola seperti teknik statistic dan matematika (Larose, 2005).

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

BAB I PENDAHULUAN 1.1 Latar Belakang

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

BAB I PENDAHULUAN 1.1 Latar Belakang

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1-1

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA

BAB 3 METODE PENELITIAN

PEMBANGUNAN TWEET AGGREGATOR DENGAN MENGGUNAKAN METODE NAÏVE BAYES

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II. Landasan Teori

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN I - 1

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

KLASIFIKASI SPAM MENGGUNAKAN NAÏVE BAYES

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN 1.1 Latar Belakang

Implementasi Data Mining dengan Metode Klastering untuk Meramalkan Permintaan Pasar (Studi Kasus PT. Nutrifood Indonesia )

BAB I PENDAHULUAN. bersaing. Dalam dunia bisnis yang dinamis dan penuh persaingan. Seiring dengan

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI)

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB I PENDAHULUAN Latar Belakang

BAB II LANDASAN TEORI

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

KLASIFIKASI PADA TEXT MINING

BAB I PENDAHULUAN A. Latar Belakang

KLASIFIKASI PADA TEXT MINING

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB II LANDASAN TEORI

Prosiding SENTIA 2015 Politeknik Negeri Malang Volume 7 ISSN:

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

BAB I PENDAHULUAN. Dalam menjalani kehidupannya sehari-hari manusia tentunya tidak bisa

Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

ANALISIS SPAM DENGAN MENGGUNAKAN NAÏVE BAYES

BAB II TINJAUAN PUSTAKA

KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN METODE TEXT MINING DAN NAIVE BAYES CLASSIFIER

Transkripsi:

BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan keuntungan, memperkecil biaya pengeluaran, atau bahkan keduanya. Secara teknis, data mining disebut sebagai proses untuk menemukan pola dari ratusan atau ribuan field dari sebuah relasional database yang besar (Ginanjar & Lubis, 2012). Istilah data mining dan knowledge discovery in databases (KDD) seringkali digunakan untuk menjelaskan proses penggalian informasi yang tersembunyi dalam suatu database yang besar, kedua istilah tersebut memiliki konsep berkaitan satu sama lain yaitu salah satu tahapan dalam keseluruhan proses KDD adalah data mining. Ada pun proses-prosesnya diuraikan sebagai berikut (R & H., 2008) : a. Data Selection : Seleksi data dilakukan pada sekumpulan data operasional. Seleksi data perlu dilakukan sebelum tahap penggalian informasi dimulai. Data hasil seleksi tersebut akan digunakan untuk proses data mining, disimpan dalam suatu berkas, dan terpisah dari data operasional. 12

b. Pre-processing / Cleaning : Proses cleaning atau pembersihan pada data menjadi fokus KDD. Proses cleaning mencakup antara lain membuang duplikasi data, memeriksa data yang inkonsisten, dan memperbaiki kesalahan pada data, seperti kesalahan cetak. c. Transformation : Proses transformasi dilakukan pada data yang telah dipilih melalui proses coding, sehingga data tersebut nantinya sesuai untuk proses data mining. Proses coding dalam KDD merupakan proses kreatif yaitu sangat tergantung pada jenis atau pola informasi yang akan dicari dalam basis data. d. Data mining : Proses mencari pola atau informasi yang menarik didalam data yang sudah diseleksi atau dipilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining bermacam-macam. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD secara keseluruhan. e. Interpretation/ Evaluation : Tahap ini mencakup pemeriksaan atau perbandingan apakah pola atau informasi yang ditemukan bertolak belakang dengan fakta atau hipotesa yang ada sebelumnya. Pola informasi yang dihasilkan dari proses data 13

mining sebelumnya, perlu ditampilkan dalam bentuk yang mudah agar dimengerti oleh pihak yang berkepentingan. Adapun proses yang diperlukan dalam tahap preprocessing yaitu Stemming. Stemming dilakukan untuk mengenali setiap kata yang dimasukkan, proses pemetaan dan penguraian berbagai bentuk dari suatu kata menjadi bentuk kata dasarnya atau conflation. Proses stemming secara luas sudah digunakan di dalam kegiatan Information retrieval (pencarian informasi) untuk meningkatkan kualitas informasi yang didapatkan. Cara kerja stemming dapat dilakukan dengan merujuk ke kamus kata dasar maupun menggunakan aturan-aturan imbuhan (Indriyono, Utami, & Sunyoto, 2015). Dalam penelitian ini untuk mendukung proses preprocessing digunakan algoritma stemming Nazief & Adriani. Algoritma ini mengubah setiap kata yang ditemukan menjadi kata dasar dan akan mengecek ketersediaannya dalam kamus. 3.2. Analisis Sentimen Pada tahun 2001 sejarah analisis sentimen muncul pada jurnal karya dari Das, Chen, dan Tong. Bahasan yang mereka angkat yaitu menganalisis sentimen pasar. Analisis sentimen sendiri adalah cara untuk mengekstraksi pendapat, sentimen, evaluasi, dan emosi orang mengenai suatu topik tertentu yang tertulis dan menggunakan teknik pemrosesan bahasa alami. Adapun sejumlah karya-karya besar lainnya melakukan analisis sentimen yang fokus mengklasifikasikan mengenai sifat yang berlawanan yaitu 14

antara positif dan negatif. Dari pengertian tersebut, jadilah sebuah fakta yang menyebabkan beberapa penulis berpendapat bahwa istilah analisis sentimen mengacu pada tugas yang sempit atau spesifik. Namun saat ini banyak juga yang menafsirkan istilah analisis sentimen lebih luas, yang berarti cara pengkomputasian pendapat, sentimen, dan subjektifitas pada teks (Sentiaji & Bachtiar, 2014). 3.3. Metode Naïve Bayes Classifier Naïve Bayes Classifier merupakan teknik prediksi berbasis probabilistik sederhana yang berdasarkan pada penerapan teorema atau aturan bayes, dengan asumsi independensi yang kuat pada fitur. Artinya bahwa sebuah fitur pada sebuah data tidak berkaitan dengan ada atau tidaknya fitur lain dalam data yang sama. Naive Bayes Classifier dapat digunakan untuk memprediksi probabilitas keanggotaan suatu class. Naive Bayes Classifier memiliki kemampuan klasifikasi serupa dengan decision tree dan neural network. Naive Bayes Classifier terbukti memiliki akurasi dan kecepatan yang tinggi pada saat diaplikasikan ke dalam database dengan data yang besar (Indriyono, Utami, & Sunyoto, 2015). Penjelasan mengenai metode Naïve Bayes Classifier adalah sebagai berikut (Wikanargo, 2016): P(C i X)=...(1) Persamaan (1) diatas yaitu P(Ci X) merupakan probabilitas Ci terjadi jika X sudah terjadi, P(Ci) 15

adalah probabilitas Ci dalam data dengan sifat independent terhadap X, X adalah kumpulan atribut, P(X Ci) adalah probabilitas X terjadi jika Ci sudah terjadi berdasarkan data training. Dengan P(X) konstan maka didapat penyederhanaan sebagai berikut: P(Ci X)=P(X Ci)P(Ci)...(2) Persamaan (2) digunakan untuk mencari posisi probabilitas nilai dari data yang dicari berdasarkan data training. Model tersebut menunjukkan bahwa posisi probabilitas didapat dari nilai kemiripan data dibagi nilai data yang dicari dikalikan dengan nilai bukti dari data training. P(X Ci)= Ci)xP(x1 Ci) x P(x2 Ci) x x P(xn Ci)...(3) Persamaan model (3) digunakan untuk mendapatkan nilai probabilitas X, yang terjadi jika Ci sudah terjadi adalah dapat dilakukan dengan mengalikan nilai posisi probabilitas masing-masing kelas yang mendukung kelas tujuan. Nilai-nilai tersebut akan dihitung nilai posisi probabilitas data yang dicari masuk ke kelas tujuan. Nilai yang didapatkan dari persamaan ini digunakan untuk mendapatkan nilai akhir Ci terjadi jika X sudah terjadi pada persamaan (2). Posisi probabilitas Ci terjadi jika X sudah terjadi pada model (2), yang terbesar adalah hasil yang diambil untuk menunjukkan kelasnya. 16

3.4. Jejaring Sosial Twitter Twitter adalah sebuah situs web yang dioperasikan oleh Twitter Inc, Twitter merupakan jejaring sosial mikroblogging sehingga memungkinkan penggunanya untuk mengirim dan membaca pesan yang biasa disebut kicauan (tweets). Tweets merupakan teks tulisan yang terdiri atas 140 karakter dan ditampilkan pada halaman profil pengguna. Tweets bisa dilihat secara umum, namun pengirim yang memiliki tweets dapat membatasi pengiriman pesan ke daftar teman-teman mereka saja atau tertentu. Pengguna dapat juga melihat tweets dari penulis lain yang dikenal dengan pengikut (follower). Semua pengguna dapat menerima dan mengirim kicauan melalui situs Twitter, telepon seluler, atau dengan pesan singkat (SMS) tergantung ketersediaannya di negara-negara tertentu. Situs ini pertama kali dibuat di San Bruno, California dekat San Francisco dan berbasis disana juga. Sedangkan kantor dan server Twitter berada di San Antonio, Texas dan Boston, Massachusetts. Twitter dibentuk pada tahun 2006 oleh Jack Dorsey dan telah mendapatkan popularitas di seluruh dunia. Saat ini Twitter memiliki lebih dari 100 juta pengguna. Hal ini kadang-kadang digambarkan sebagai "SMS dari internet". Logo Twitter sendiri berupa seekor burung berwarna biru yang bernama "Larry the "Bird". Kelebihan Twitter dibandingkan dengan jejaring sosial lainnya yaitu (Supriyono, 2013) : 17

1. Twitter saat ini menjadi salah satu situs jejaring sosial yang paling sering dikunjungi di dunia setelah Google dan Facebook. 2. Pengguna Twitter yang terus mengalami pertumbuhan dan bahkan Indonesia tergolong dalam lima besar negara dengan pengguna Twitter terbesar. 3. Pembuatan akun Twitter gratis. 4. Hampir semua kalangan dapat menggunakan Twitter dan bisa mengoperasikannya. 5. Twitter membuat penggunanya untuk selalu aktif dan bebas untuk melakukan tweets. 6. Teknologi Twitter tersedia dalam mobile yang membuat Twitter dapat dipantau secara fleksibel setiap waktu, kapan saja dan di mana saja. 7. Selain itu Twitter juga memungkinkan penggunanya untuk menyambungkan akunnya dengan media sosial lain seperti Facebook, Instagram, Soundcloud, Tumblr, dan lain-lain. 18