BAB 2 TINJAUAN PUSTAKA

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN UKDW

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI TEXT MINING PADA MESIN PENCARIAN TWITTER UNTUKMENGANALISISTOPIK TOPIK TERKAIT KPK dan JOKOWI

BAB I PENDAHULUAN. tahunnya (Radev et al, 2000). Pada bulan Juli 2011, jumlah host yang diiklankan di

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN Latar Belakang

REKOMENDASI TAG PADA BERITA ONLINE MENGGUNAKAN TF-IDF DAN COLLABORATIVE TAGGING SKRIPSI SALMAN ALL FARIZI

BAB 1 PENDAHULUAN Latar Belakang

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN Latar Belakang

UNTUK TOPIC DETECTION AND TRACKING PADA MICROBLOG TWITTER

BAB I PENDAHULUAN. masyarakat tanpa kertas (paperless society) (Hernawati, 2005). Berdasarkan buku

BAB I PENDAHULUAN 1.1. Latar Belakang

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

PEMBANGUNAN APLIKASI REKOMENDASI BERITA BERBASIS PREFERENSI PENGGUNA TWITTER

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN. ilmu tertentu dengan menggunakan kaidah-kaidah yang berlaku dalam bidang

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

ANALISIS KECENDERUNGAN INFORMASI DENGAN MENGGUNAKAN METODE TEXT MINING

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

1.2. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Perkembangan informasi di era modern ini sudah sangat pesat. Untuk

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat

BAB I 1. PENDAHULUAN

BAB I PENDAHULUAN. era informasi, di mana volume pertumbuhan informasi tidak akan bisa dicerna

BAB I PENDAHULUAN. beberapa tahun terakhir (Dave Chaffey, 2016). Media jejaring sosial seperti Twitter,

1.5 Metode Penelitian

BAB I PENDAHULUAN. Dari tahun ke tahun sudah tidak dapat dipungkiri bahwa teknologi informasi

BAB 1 PENDAHULUAN 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN Latar Belakang

APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA

BAB I. Pendahuluan. 1. Latar Belakang Masalah

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Pesatnya pertumbuhan internet saat ini berdampak pada melimpahnya

DAFTAR ISI. PERNYATAAN... Error! Bookmark not defined. KATA PENGANTAR... Error! Bookmark not defined.

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN I-1

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN

BAB II TINJAUAN PUSTAKA

PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

Simulasi Ujian Nasional Tingkat Sekolah Dasar Berbasis Web menggunakan Framework CodeIgniter

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. komputer ataupun perangkat mobile mereka dari manapun dan kapanpun. Setelah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. melalui ringkasan pemahaman penyusun terhadap persoalan yang dibahas. Hal-hal

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang. Mikroblog adalah salah satu bentuk blog yang memungkinkan

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang. Perkembangan teknologi yang sangat pesat saat ini membawakan pengaruh yang

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN. berlangganan berita kepada situs web yang menyediakan feed RSS, umumnya

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB 1 PENDAHULUAN. namun juga di negara berkembang salah satunya Indonesia. internet. Internet (singkatan dari interconnected networking)

1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar belakang

Analisis Sentimen Terhadap ISP Pada Twitter Dengan Klasifikasi Naive Bayes

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

Transkripsi:

BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini akan membahas tentang penelitian berita yang menggunakan Text Mining, metode TF-IDF, dan. Yang mana penelitian ini akan mengulas secara lengkap tentang pengaplikasian Text Mining, metode TF-IDF, dan. Mengapa penulis menggunakan metode TF-IDF karena dalam penelitian Tugas Akhir (Musa, et al., 2012) menunjukan bahwa pembobotan ITF mampu menghasilkan performasi yang lebih baik jika di bandingkan dengan skema pembobotan TF-IDF ketika menggunakan 25%, 50%, dan 75% dataset dari setiap kelas untuk masing-masing topik. Sedangkan pada saat menggunakan 100% dataset, TF-IDF menghasilkan performasi yang lebih baik dibandingkan dengan skema pembobotan ITF. Tugas Akhir (Ma'arif, 2015) dalam penelitianya tentang Penerapan Algoritma TF-IDF Untuk Pencarian Karya Ilmiah bertujuan untuk menerapkan metode TF-IDF yang dapat digunakan untuk mencari karya ilmiah sebagai pengukur tingkat similaritas antara dokumen dengan kata kunci yang didapat dari ekstraksi teks pada dokumen menggunakan text mining. Dengan melakukan proses penambangan data yaitu kata pada dokumen lalu didapatkan hasil ekstraksi yang selanjutnya dilakukan pembobotan menggunakan metode TF-IDF, maka didapatkan data yang terurut dari yang kemiripannya atau tingkat similaritasnya paling tinggi sehingga pencarian karya 7

ilmiah menjadi lebih efisien sebagai informasi yang relevan. Begitu juga dengan penelitian Tugas Akhir (All Farizi, 2015) yang berjudul Rekomendasi Tag Pada Berita Online Menggunakan TF-IDF dan Collaborative Tagging penelitian ini bertujuan untuk merekomendasikan tag pada suatu artikel berbahasa Indonesia menggunakan metode TF- IDF dan Collaborative tagging. Dengan perkembangan teknologi internet yang sangat pesat menyebabkan semakin tingginya arus informasi dan semakin meningkatkannya jumlah berita yang terpublikasikan secara online. Dengan teknologi social tagging dapat mempermudah proses pencarian berita online dan pengaturan arsip berita berdasarkan kesamaan informasi tag. Dalam penelitian ini, sistem autotag dikembangkan menggunakan metode TF-IDF dan Collaborative tagging dimana tahapannya diawali dengan text preprocessing kemudian feature selection dan proses menghitung bobot TF-IDF. Kemudian diterapkan metode Collaborative tagging yaitu pengukuran kesamaan dengan menghitung persentase kemiripan tag hasil ekstraksi TF-IDF dengan tag-tag berita yang telah dipublikasikan sebelumnya. Penelitian ini menunjukkan bahwa metode TF-IDF dapat digunakan untuk memberikan rekomendasi tag secara otomatis dengan relevansi tag terhadap isi berita yaitu 79,97% dan 80,6% untuk relevansi rata rata menggunakan Collaborative Tagging. Suatu berita akan bermanfaat jika berita yang di baca sesuai dengan topik berita yang diinginkan oleh pembaca. Berita merupakan sumber informasi yang sangat dinantikan oleh manusia setiap harinya (Ambarwati & 8

Winarko, 2014). Bisa dikatakan berita telah menjadi kebutuhan sehari-hari bagi manusia untuk mendapatkan informasi tentang perkembangan jaman. Di jaman modern ini berita telah tersedia di berbagai situs berita online maupun di media sosial. Fenomena jejaring sosial yang kian menjamur memudahkan seseorang untuk mengetahui informasi terbaru, berinteraksi dengan banyak orang, dan meningkatkan kualitas diri dalam segi teknologi komunikasi dan informasi (Triyono, 2014). Salah satu media sosial yang saat ini populer dan banyak penggunanya adalah, media sosial sekarang semakin banyak penggunanya termasuk publik figur dan interaksi yang banyak pula di dalamya sangat beragam isinya (Noorfaik & Novianto, 2014). Termasuk berisi tentang opini maupun berita yang saat ini tersebar di masyarakat. Setiap hari jutaan tweets di share oleh berbagai pengguna didunia (Setiawan, 2015). Banyaknya kegiatan yang dapat dilakukan menggunakan, maka tidak dipungkiri akan menghasilkan kumpulan data yang besar. Hal tersebut ditunjukkan dari hasil survei bahwa setiap detiknya pada saat kehidupan normal rata-rata jumlah tweet yang ada dalam adalah 600 tweets menurut (Adiyana & Hakim, 2015), oleh sebab itu diperlukan suatu metode khusus untuk menganalisa data pada sehingga tidak terdapat suatu kondisi yang disebut Rich of Data but Poor of Information. Menerapkan metode text mining pada data tweets bisa didapatkan beberapa informasi yang bermanfaat seperti keseringan penggunaan kata-kata menurut aturan asosiasi yang menyertai kata konteks pada berita. Dengan kondisi 9

tersebut maka dapat digunakan sebagai pendekatan untuk mencari kebutuhan berita yang di butuhkan oleh pengguna dari kebiasaan tweets yang dilakukan setiap hari. Pada era teknologi informasi seperti saat ini berita sudah cenderung tersimpan dalam format digital karena mudah dan cepat dalam penyimpanan. Terlalu banyak dokumen teks yang tersimpan dalam komputer maupun internet, membuat pencarian informasi menjadi sulit. Kesulitan dalam pencarian informasi yang sesuai dengan kebutuhan seringkali menjadi penghambat proses pembelajaran dan proses mendapatkan informasi yang aktual (Suliantoro, 2012). Pengelompokan data menjadi salah satu solusi untuk mengorganisasi dokumen-dokumen berita digital yang berjumlah banyak. Metode pengelompokan dan penambangan data atau biasa disebut text mining, dipadukan dengan pembobotan TF-IDF yang diimplementasikan ke dalam sebuah aplikasi rekomendasi berita dapat melakukan proses pengelompokan berita secara otomatis sehingga menghemat waktu untuk mencari berita secara manual. Pada tabel 2.1, dapat dilihat perbandingan penelitian tentang pembangunan aplikasi yang menggunakan text mining, metode TF-IDF, dan. Tabel 2.1. Perbandingan Penelitian No Pembanding Ma arif All Farizi Adiyana & Hakim Surya (2016) 1 Platform Web Web Sofware R Web 2 Bahasa Pemrograman PHP PHP PHP PHP dengan Framework CI 10

3 Sasaran Pengguna 4 Metode 5 Aplikasi 6 7 oauth API Aktifitas Log User Mahasiswa Umum - Umum Text Mining dan TF-IDF Rekomendasi Tag Berita Text Mining dan TF- IDF Pencarian Karya Ilmiah Text Mining dan TF- IDF Pencarian Analisis Topik KPK dan Jokowi Text Mining dan TF-IDF Rekomendasi Berita Berbasis Preferensi Pengguna X X X X X X 8 Share Berita X X X Beberapa penelitian diatas dapat disimpulkan bahwa text mining dan metode pembobotan TF-IDF telah banyak di implementasikan dalam pembobotan serta scoring kata konteks pada dokumen maupun berita. Oleh sebab itu penulis akan mengimplementasikan kembali text mining dan metode pembobotan metode TF-IDF sebagai scoring kata konteks yang terdapat pada tweets sebagai kunci perekomendasian berita. Penelitian ini akan menghasilkan aplikasi baru yang dikembangkan dengan CodeIgniter serta menambahkan hal-hal baru yang belum di implementasikan pada penelitian yang sebelum-sebelumnya seperti menggunakan oauth API. Dengan adanya aplikasi dari hasil penelitian ini diharapkan pembaca berita mendapatkan rekomendasi berita sesuai kebutuhan dan waktu yang dibutuhkan dalam membaca berita lebih efektif tanpa memakan waktu lama untuk mencari berita yang sesuai kebutuhan. 11