BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

BAB I PENDAHULUAN 1.1. Latar Belakang

RANCANG BANGUN PENCARIAN TUGAS AKHIR DENGAN METODE HILL CLIMBING AUTOMATIC CLUSTER TUGAS AKHIR

BAB I PENDAHULUAN. 1.1 Latar Belakang

ANALISIS KLASTERING LIRIK LAGU INDONESIA

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1. Latar Belakang

WEB MINING UNTUK PENCARIAN DOKUMEN BAHASA INGGRIS MENGGUNAKAN HILL CLIMBING AUTOMATIC CLUSTER

BAB I PENDAHULUAN 1.1 Latar Belakang

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN Latar Belakang

UNTUK TOPIC DETECTION AND TRACKING PADA MICROBLOG TWITTER

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

UKDW BAB I PENDAHULUAN

BAB 3 LANDASAN TEORI

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

BAB I PENDAHULUAN. masyarakat tanpa kertas (paperless society) (Hernawati, 2005). Berdasarkan buku

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN I-1

IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

PENDAHULUAN. 1.1 Latar Belakang

Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Kata kunci : Data mining, text mining, clustering, agglomerative hierarchical clustering, single linkage, summarize

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. komponen penting dalam hal memajukan kualitas PT tersebut. Apabila sistem

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB 1 PENDAHULUAN. mudah berpartisipasi, berbagi, dan menciptakan isi meliputi blog, jejaring sosial, wiki,

ANALISIS CLUSTER PADA DOKUMEN TEKS

BAB I PENDAHULUAN 1.1 Latar Belakang

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. signifikan terhadap proses bisnis di setiap organisasi. Sebagai contoh, dengan

SISTEM TEMU KEMBALI INFORMASI PENENTUAN LOKASI DOKUMEN DENGAN CLUSTER DAN ALGORITMA CRAWLER

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODOLOGI PENELITIAN

ISSN : e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 2182

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV PREPROCESSING DATA MINING

BAB I PENDAHULUAN. Hadirnya teknologi informasi berdampak pada banyak sektor, termasuk

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

UKDW BAB 1 PENDAHULUAN

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

@UKDW BAB 1 PENDAHULUAN Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

BAB III METODOLOGI PENELITIAN

JURNAL PENERAPAN COMPLETE AND AVERAGE LINKAGE PADA PEMBENTUKAN RESEARCH GROUP DOSEN

BAB I PENDAHULUAN. 1.1 Latar belakang

IDENTIFIKASI PARAFRASA BAHASA INDONESIA MENGGUNAKAN NAÏVE BAYES

UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. menerima tanggapan atau orang yang menerima respon. Selain itu kurang adanya

BAB 1 PENDAHULUAN. Latar Belakang

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. sangat pesat, salah satunya adalah internet. Manfaat internet saat ini sangat

Penerapan Algoritma K-Means untuk Clustering

BAB II LANDASAN TEORI

ANALISIS CLUSTER PADA DOKUMEN TEKS

1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

1.5 Metode Penelitian

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV ANALISA DAN PERANCANGAN

Panduan Tutorial Online Untuk Mahasiswa

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

RANCANG BANGUN MODUL PENGKATEGORIAN TOPIK DAN PENGELOMPOKKAN TOPIK DENGAN KLUSTER DARI APLIKASI FORUM phpbb3 SECARA OTOMATIS.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Perbandingan Silhouette Coeficient untuk Fitur Tfidf dan Perhitungan Kesamaan Pada Clustering Teks Bahasa Indonesia

Latar Belakang. Pencari Acara. Gambar I.1 Grafik Pencari Acara 10% 26% 64% Mahasiswa Alumni Masyarakat Umum

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

BAB II TINJAUAN PUSTAKA

ANALISIS ALGORITMA CLHM DAN METODE HILL CLIMBING PADA PENGKLASTERAN KOMENTAR DI FORUM DISKUSI ONLINE TUGAS AKHIR. Oleh JONI ISKANDAR

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

BAB I PENDAHULUAN. secara manual dari suatu kumpulan data. Defenisi lain data mining adalah sebagai

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Teknologi informasi yang semakin berkembang dari masa ke masa telah membuktikan akan kebutuhan manusia pada informasi itu sendiri. Berbagai situs, portal berita, website, blog dan berbagai media online lainnya semakin berkembang pesat sebagai dampak dari perkembangan tersebut. Khusus di Indonesia, berdasarkan hasil penelitian oleh Asosiasi Penyelenggara Jasa Internet Indonesia (APJII), pengguna internet pada tahun 2014 mencapai 88,1 juta orang, dan dengan pencapaian itu Indonesia menduduki peringkat ke-8 dunia (APJII, 2014). Peningkatan jumlah tersebut juga memicu ketersedian fitur-fitur yang mendukung peningkatan kualitas informasi yang disajikan. Pada beberapa media informasi yang telah ada, selain menyediakan konten yang berkualitas dan bermanfaat juga dituntut meyediakan beberapa layanan yang memudahkan pembaca atau pengguna, seperti salah satu fitur yang sering ditemui pada beberapa media tersebut, yaitu fitur F.A.Q ( Frequentially Asking Question) yang digunakan untuk memprediksi pertanyaan yang mungkin akan ditanyakan pengunjung berdasarkan data history pertanyaan pengunjung sebelumnya. Khususnya pada forum-forum diskusi yang berbasis website (Kaskus, Quora, Indowebster, Portal Berita Islam dan lainnya), ketersedian fitur yang mampu meningkatkan kualitas informasi merupakan suatu keharusan yang harus dipenuhi agar informasi sepenuhnya diterima partisipan. Objek pada penelitian ini adalah fitur komentar yang terdapat pada forum diskusi tersebut yang merupakan sarana interakasi diskusi antar partisipan dan administor. Pada umumnya setiap website atau situs membatasi jumlah komentar yang ditampilkan pada halaman utama dan menampilkan sejumlah tertentu dari komentar terbaru, seperti Forum Indowebster dan Bersosial.com yang membatasi 20 komentar perhalamannya. Pada beberapa website tersebut, ditemui ketika

pengunjung ingin mengetahui rincian dari topik yang dibahas maka pengunjung akan memberikan pertanyaan atau tanggapan pada kolom komentar, tanpa melihat atau mengamati komentar-komentar yang terdapat pada awal atau pertengahan diskusi jika terdapat suatu diskusi panjang atau keseluruhan komentar tidak ditampilkan pada halaman utama website, sehingga kemungkinan terjadi pengulangan komentar akan sangat berpeluang dan tentunya akan mengurangi efektifitas suatu diskusi. Kemudian jika terjadi pengulangan pertanyaan atau komentar dengan komentar-komentar sebelumnya bagaimana sistem memproses untuk mengelompokkan komentar tersebut berdasarkan kemiripannya. Untuk menanggapi kemungkinan terjadi pengulangan komentar diperlukan sebuah pemrosesan teks yang dapat mengenali kemiripan pertanyaan atau komentar tersebut. Sehubungan dengan penelitian ini pengunaan text mining dan metode cluster telah suskses dalam menemukan berbagai pola dan koneksi yang tidak terlihat oleh sekilas mata pada berbagai data berbasis teks baik yang bersifat semi terstruktur atau tidak terstruktur. Hal itu didukung dengan telah banyaknya metode tersebut diterapkan pada beberapa pelitian terkait, diantaranya adalah Mesin Pencari Dokumen Dengan Pengclusteran Otomatis (Martiana dkk, 2010), Perbandingan Algoritma Stemming Porter dengan Algoritma Nazief & Adriani untuk Stemming Dokumen Teks Bahasa Indonesia (Agusta, 2009). Web Mining Untuk Pencarian Dokumen Bahasa Inggris Menggunakan Hill Climbing Automatic Cluster (Eldira dkk, 2013), Coments-Oriented Document Summarization: Understanding Documents with Reader s Feedback (Hu dkk, 2007). Berdasarkan beberapa kesimpulan dari penilitian di atas penerapan Algoritma Centroid Linkage Hierarchical Method (CLHM) telah berhasilkan diterapkan dalam proses pengelompokan data berbasis teks. Untuk membentuk cluster secara otomatis terdapat dua metode yang dapat menganalisa pola varian dari cluster yaitu metode Valley-tracing dan metode Hill-climbing. Metode Hillclimbing memerlukan waktu yang lebih cepat dalam melakukan analisa jumlah cluster jika dibandingkan dengan metode Valey-tracing serta sesuai untuk pencarian dokumen dalam jumlah besar dan dengan kata kunci/ komentar yang I-2

panjang (Eldira dkk, 2013). Sehingga penelitian ini terfokus pada pemanfaatan algoritma CLHM dan metode Hill-Climbing dalam mengelompokkan komentar yang memiliki kemiripan tersebut, kemudian secara otomatis sistem akan mengelompokkan komentar/ pertanyaan terbaru sesuai tingkat kemiripannya. 1.2 Rumusan Masalah 1. Bagaimana menerapkan proses text mining dan algoritma centroid linkage hierarchical method (CLHM) dengan pengukuran jarak euclidean distance dan cosine similarity untuk pengelompokan ( clustering) komentar serta menerapkan metode Hill-climbing untuk membentuk kelompok ( cluster) komentar secara otomatis pada sebuah Forum Diskusi Online? 2. Bagaimana mengelompokkan pertanyaan/ komentar partisipan dalam cluster tertentu berdasarkan tingkat kemiripannya? 1.3 Batasan Masalah Agar penelitian ini menjadi lebih terarah, penelitian ini menitik beratkan pada beberapa aspek, diantaranya adalah : 1. Forum diskusi pada penelitian ini adalah forum diskusi online berupa website. 2. Penelitan ini hanya mengelola pengelompokan komentar partisipan website berdasarkan topik yang dibahas. Jadi setiap topik yang dibahas di dalam forum memiliki kelompok-kelompok komentar tersendiri. 3. Penelitian ini belum melibatkan keterkaitan komentar berdasarkan sinonim kata dan persamaan makna dari kata kunci. 4. Pengukuran jarak kemiripan dokumen/ komentar menggunakan pengukuran jarak cosine similarity dan euclidean. 1.4 Tujuan Penelitian Tujuan dari penelitian ini adalah menerapkan Algoritma CLHM dengan pengukuran jarak euclidean distance dan cosine similarity dan metode Hillclimbing dalam meng-cluster komentar pada Forum Diskusi Online, serta untuk I-3

mengetahui akurasi dari algoritma berdasarkan parameter ukur nilai separated cluster, precision, recall dan F-measure. well 1.5 Sistematika Penulisan Penulisan dalam penelitian ini terdiri dari 6 Bab yang diperinci sebagai berikut: BAB I PENDAHULUAN Berisi tentang deskripsi secara umum dari penelitian ini, yang terdiri dari latar belakang masalah, rumusan masalah, batasan masalah, tujuan penelitian dan sistematika penulisan. BAB II LANDASAN TEORI Memuat penjelasan mengenai teori-teori umum pada text mining, metode cluster Centroid Linkage Hierarchical Method, analisa pola varian cluster dengan metode Hill-climbing untuk membentuk cluster secara otomatis. BAB III METODOLOGI PENELITIAN Memuat mengenai tahap-tahap yang dilakukan pada penelitian berupa teknik pengumpulan data, analisa sistem, perancangan, implementasi, pengujian, kesimpulan dan saran penulis. BAB IV ANALISA DAN PERANCANGAN Memuat pembahasan mengenai analisa dan perancangan untuk membangun aplikasi dengan menerapkan metode text mining dan pembentukan cluster secara otomatis dengan algoritma CLHM dan metode Hill-climbing. BAB V IMPLMENTASI DAN PENGUJIAN Memuat implementasi dari hasil analisa dan perancangan serta pengujian metode yang telah diterapkan pada sistem yang telah dibangun. BAB VI PENUTUP I-4

Memuat kesimpulan dari hasil penelitian yang telah diimplementasikan dan diuji serta saran untuk penelitian lebih lanjut I-5

6