BAB I PENDAHULUAN 1.1. Latar Belakang

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN. Universitas Muhammadiyah Surakarta merupakan salah satu dari beberapa instansi

BAB I PENDAHULUAN 1.1. Latar Belakang

IMPLEMENTASI GABUNGAN METODE HIERARCHY DAN ALGORITMA K-MEANS DALAM CLUSTER DOKUMEN BERITA TUGAS AKHIR

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

BAB I PENDAHULUAN 1.1 Latar Belakang


BAB I PENDAHULUAN. pesat terutama perkembangan internet. Dengan adanya internet dapat

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. perkembangan teknologi yaitu pengolahan data yang bisa dilakukan secara tepat,

BAB I PENDAHULUAN. dari pemikiran-pemikiran manusia yang semakin maju, hal tersebut dapat. mendukung bagi pengembangan penyebaran informasi.

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB 3 ANALISA SISTEM

BAB IV HASIL DAN UJICOBA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

IMPLEMENTASI ALGORITMA K-MEANS CLUSTERING UNTUK MENENTUKAN PENJURUSAN KELAS IPA, IPS, DAN SASTRA

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. internet yang kini menjadi peranan penting. Kebutuhan user yang semakin

PENERAPAN ALGORITMA K-MEANS PADA PENGELOMPOKAN DATA SISWA BARU BERDASARKAN JURUSAN DI SMK NEGERI 1 KOTA JAMBI BERBASIS WEB.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

Bab 3 Metode Penelitian

BAB V IMPLEMENTASI DAN PENGUJIAN

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. alam dengan bantuan data spasial dan non spasial. sebagai sarana untuk meningkatkan pelayanan umum, diantaranya para pengguna

BAB I PENDAHULUAN. dan efisien sangat dibutuhkan oleh setiap orang. Perkembangan teknologi yang semakin

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. usaha jasa perjalanan wisata di Bali. Perusahaan ini melayani pelanggan

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

BAB I PENDAHULUAN. informasi yang dimiliki tidak cukup bila informasi tersebut tidak digunakan

BAB 1 PENDAHULUAN. Dengan kemajuan teknologi informasi sekarang ini, kebutuhan akan

BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB I PENDAHULUAN

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

BAB I PENDAHULUAN. metode transaksi yang di lakukan secara online mulai berkembang pesat,

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Rahmandani, 2012 Implementasi Algoritma Apriori Pada Mobile Commerce Usaha Mikro Kecil Dan Menengah

BAB I PENDAHULUAN. informasi-informasi itu diolah oleh komputer, dan hasilnya berupa peta digital.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. jenis bisnis dalam meningkatkan efisiensi dan efektivitas proses bisnis,

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. ditemukan beberapa kelemahan dalam hal pengelolaan tersebut, yaitu teknologi

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV PREPROCESSING DATA MINING

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB I PENDAHULUAN. diperlukan pula kecepatan dalam memperoleh informasi. Salah satu sektor

BAB I PENDAHULUAN. sebuah kreasi baru, yang memiliki makna baru. dilakukan dengan mudah, yaitu dengan memilih objek (sasaran) pada sumber

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah 1.2. Perumusan Masalah

IMPLEMENTASI ALGORITMA K-MEANS UNTUK KLASTERISASI MAHASISWA BERDASARKAN PREDIKSI WAKTU KELULUSAN SKRIPSI

BAB I PENDAHULUAN. (compact disc). Teknologi ini memang praktis baik dari segi biaya maupun

PENGELOMPOKAN KOLEKSI BUKU PERPUSTAKAAN BERDASARKAN LAMA PEMINJAMAN BUKU MENGGUNAKAN K-MEANS

yang menunjang dalam pengembangan program cluster. Aplikasi cluster ini dikembangkan pada laptop, dengan spesifikasi terdapat

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I. PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. berupa fisik dan statis, melainkan berupa digital dan mobile. Dengan berbentuk digital

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Di era yang serba modern ini, penggunaan teknologi informasi sebagai

BAB I PENDAHULUAN. sangatlah pesat, ini dapat dilihat dari kemunculan berbagai aplikasi-aplikasi yang

BAB I PENDAHULUAN. sangatlah pesat, ini dapat dilihat dari kemunculan berbagai aplikasi-aplikasi

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Pengantar Pendahuluan 1.2 Latar Belakang Masalah

BAB I PENDAHULUAN. Di Sekolahan Teknologi Informasi disamping merupakan salah satu. Materi Pelajaran, sekaligus juga merupakan media, sarana prasarana

BAB I PENDAHULUAN. lebih tinggi yaitu Kecamatan, maka diperlukan langkah-langkah

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. Teknologi komputer di era saat ini sangat membantu brainware untuk

Jl. Raya Dukuhwaluh Purwokerto )

BAB I PENDAHULUAN I-1

PENGELOMPOKAN TINGKAT KELULUSAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

BAB III METODOLOGI PENELITIAN. Desain penelitian adalah tahapan atau gambaran yang akan dilakukan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN. dari beberapa kelurahan, dan setiap bulannya masing-masing kelurahan wajib

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Perkembangan ilmu pengetahuan dan teknologi saat ini sudah cukup maju,

BAB 1 PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. instansi serta jenis usaha yang lain telah menggunakan teknologi komputer.

BAB I PENDAHULUAN. Sekarang ini penelitian sering kali melibatkan beberapa variabel

Transkripsi:

BAB I PENDAHULUAN 1.1. Latar Belakang Penyimpanan dokumen secara digital berkembang dengan pesat seiring meningkatnya teknologi. Kondisi tersebut memunculkan masalah untuk mengakses informasi yang diinginkan secara akurat dan cepat. Oleh karena itu, walaupun sebagian besar dokumen digital tersimpan dalam bentuk teks dan berbagai algoritma yang efisien untuk pencarian teks telah dikembangkan, teknik pencarian dan penataan terhadap seluruh isi dokumen yang tersimpan bukanlah solusi yang tepat mengingat pertumbuhan ukuran data yang tersimpan umumnya. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi dokumen karena jumlah informasi yang semakin besar jumlahnya. Data mining sebagai proses untuk mendapatkan informasi yang berguna dari gudang basis data yang besar. Salah satu teknik yang dibuat dalam data mining adalah bagaimana menelusuri data yang ada untuk membangun sebuah model, kemudian menggunakan model tersebut agar dapat mengenali pola data yang lain yang tidak berada dalam basis data yang tersimpan. Dalam data mining, clustering atau pengelompokan data juga bisa dilakukan. Tujuannya adalah agar kita dapat mengetahui pola universal data-data yang ada. Sampai saat ini, masih terus dilakukan berbagai usaha untuk melakukan perbaikan model cluster yang optimal sehingga dapat dihasilkan cluster yang paling baik. Menurut struktur, clustering dibagi menjadi dua, yaitu metode Hierarchy dan metode Partition. Dalam metode Hierarchy, satu data tunggal bisa dianggap sebuah kelompok, dua atau lebih kelompok kecil dapat bergabung menjadi sebuah kelompok besar dan begitu seterusnya hingga semua data dapat bergabung menjadi sebuah kelompok. Metode Hierarchy merupakan satu-satunya metode yang masuk kategori ini. Di sisi lain, metode Partititon seperti K-Means membagi set data ke dalam sejumlah kelompok yang tidak tumpang-tindih (tidak overlap) antara satu kelompok dengan kelompok yang lain. Artinya, setiap data hanya menjadi anggota satu kelompok (Eko, 2012). 1

K-Means merupakan salah satu metode pengelompokan data non-hierarchy (sekatan) yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Metode ini mempartisi data ke dalam kelompok sehingga data berkarakteristik sama dimasukkan ke dalam satu kelompok yang sama dan data yang berkarakteristik berbeda dikelompokkan ke dalam kelompok yang lain (Eko, 2012). K-Means bermasalah ketika cluster-cluster berbeda ukuran, kepadatan, tidak berbentuk bola dan ketika data berisi outlier (Universitas Kristen Duta Wacana, 2014). Hasil cluster yang terbentuk dari metode K-Means ini sangat tergantung pada inisiasi nilai pusat awal cluster yang diberikan. Hal ini menyebabkan hasil cluster-nya berupa solusi yang sifatnya local optimal (Budi, 2007). Untuk itu, K-Means dikolaborasikan dengan metode Hierarchy untuk penentuan pusat awal cluster. Metode Hierarchy yang akan dicoba diterapkan dalam Tugas Akhir ini. Dari proses pengelompokan ini nantinya diharapkan akan diketahui kemiripan atau kedekatan antar dokumen sehingga dapat dikelompokkan ke dalam beberapa cluster, di mana antar anggota cluster memiliki tingkat kemiripan yang tinggi. Dokumen yang digunakan dalam penelitian ini adalah dokumen teks, di mana data set berupa dokumen berita berbahasa Indonesia. Sehingga dalam Tugas Akhir ini nantinya akan dijelaskan bagaimana mengelompokkan berita. Metode yang digunakan adalah metode document clustering dengan K-Means dan Hierarchy. 1.2. Rumusan Masalah Berdasarkan latar belakang yang telah dipaparkan, maka rumusan masalah yang dapat dikemukakan sebagai berikut: 1. Bagaimana menganalisis pola varian yang memenuhi metode Hierarchy dan K-Means dapat mengelompokkan dokumen dengan centroid secara tepat? 2. Bagaimana mengimplementasikan fungsi metode document clustering sebagai sarana untuk menambang data yang mewakili isi dari dokumen? 1.3. Tujuan Penelitian Tugas Akhir yang berjudul Implementasi Gabungan Metode Hierarchy dan Algoritma K-Means dalam Cluster Dokumen Berita ini dirancang bertujuan 2

untuk membuat sebuah aplikasi clustering dengan bahasa pemrogram PHP yang dapat mengelompokkan dokumen dengan centroid yang tepat dan menampilkan hasil klasterisasi dokumen. 1.4. Batasan Masalah Adapun batasan masalah pada Tugas Akhir ini adalah sebagai berikut : 1. Data set berupa dokumen berita berbahasa Indonesia yang diambil dari detik.com 2. Penggunaan aplikasi dengan bahasa pemrograman PHP 3. Dokumen yang akan diolah oleh cluster diambil dari web atau ringkasan dari setiap dokumen web. 4. Kata kunci yang digunakan diambil sekitar 300 kata dalam sinopsis berita yang bersangkutan. 5. Domain berita yang diambil dari domain detiknews, detikfinance, detiksport, detiki-net, detikoto, detikfood, dan detikhealth 6. Berita diambil secara acak namun dengan jumlah yang hampir sama 1.5. Metodologi Untuk memudahkan dalam pengerjaan Tugas Akhir ini maka penulis menerapkan beberapa metodologi pengerjaan sebagai berikut: 1.5.1. Studi Pustaka Studi pustaka dilakukan guna mendapatkan bahasan yang lengkap mengenai materi-materi tentang metode Hierarchy, K-Means, document clustering dan segala hal yang berhubungan dengan Tugas Akhir ini melalui buku referensi, paper, dan jurnal. Hal tersebut dilakukan dengan harapan agar mendapatkan pemahaman yang cukup untuk melakukan tahap-tahap strategis selanjutnya. 1.5.2. Analisis Kebutuhan Pada tahapan ini terlebih dahulu akan dibuat sebuah sistem yang dapat menambang sebuah kalimat yang berupa keyword berita. Selanjutnya akan diolah dalam sebuah algoritma untuk dilakukan klasterisasi dokumen berita 3

berdasarkan jenisnya. Penganalisisan teks guna mencari informasi yang bermanfaat akan diterapkan pada document clustering, sedangkan untuk klasterisasinya akan digunakan metode Hierarchy. Sehingga dari hal tersebut didapat suatu sistem yang dapat melakukan klasterisasi secara otomatis. Kemudian dalam penerapannya user memasukkan ringkasan dan data penting dari suatu dokumen berita, semisal judul atau isi berita untuk diolah dengan sistem yang ada. Untuk selanjutnya user akan mendapatkan output dari data dokumen berita yang telah terklaster berdasakan jenisnya. 1.5.3. Perancangan Sistem Melakukan perancangan sistem yang terdiri dari perancangan model algoritma document clustering serta metode Hierarchy dan K-Means untuk melakukan pengklasteran pada web atau ringkasan dokumen berita dengan acuan keyword dokumen. Dan juga melakukan desain sistem dengan menggunakan diagram diagram UML yang nantinya dapat lebih memperjelas dalam perancangannya. 1.5.4. Implementasi Program Sistem klasterisasi ini akan diimplementasikan berdasarkan perancangan dan desain sistem yang telah dilakukan sebelumnya menjadi sebuah perangkat lunak dengan melakukan coding program. Dalam implementasinya ini digunakan bahasa pemrograman PHP yang akan digabungkan dengan basisdata MySQL. 1.5.5. Pengujian Sistem Adapun pengujian yang dilakukan adalah analisis terhadap pengujian efisiensi waktu pada proses klasterisasi metode Hierarchy dan K-Means yang dihitung dari hubungan antara jumlah data, jumlah cluster dengan waktu peng-cluster-an, dalam hal ini jumlah data tidak akan dirubah rubah untuk mengetahui waktu peng-cluster-an dengan jumlah data yang sama. Dapat juga disertakan melakukan perhitungan terhadap 4

variasi jumlah cluster, karena dalam pengujian jumlah cluster ini juga dapat mempengari dari metode Hierarchy dan K-Means itu sendiri, seperti halnya centroid dari algoritma itu sendiri. Sehingga besar harapan dengan adanya data yang didapat tersebut nantinya dapat memaksimalkan dalam sistem klasterisasi. 1.5.6. Penyusunan Laporan Penyusunan laporan merupakan tahapan akhir dalam proses Tugas Akhir ini. Laporan tersebut digunakan sebagai media yang akan menjelaskan dari keseluruhan proses yang telah dilakukan dalam pembangunan sistem. 1.6. Sistematika Penulisan Penulisan Tugas Akhir ini terdiri dari atas lima bagian pembahasan, yaitu Pendahuluan, Landasan Teori, Analisa dan Perancangan Sistem, Implementasi dan Pengujian, serta Penutup. Kelima bagian tersebut adalah sebagai berikut: BAB I. Pendahuluan Bab ini membahas latar belakang penelitian, rumusan masalah, batasan masalah, tujuan, metodologi dan sistematika penulisan Tugas Akhir dengan judul Implementasi Gabungan Metode Hierarchy Dan Algoritma K-Means Dalam Cluster Dokumen Berita. BAB II. Landasan Teori Bab ini membahas teori-teori yang menjadi dasar acuan atas pembahasan permasalahan yang ditulis dalam laporan Tugas Akhir. BAB III. Analisa dan Perancangan Sistem Bab ini membahas rancangan sistem sesuai judul yang telah dibuat, rumusan masalah serta batasan masalah yang ditentukan. Perancangan sistem ini meliputi document clustering, algoritma Centroid Linkage Hierarchy Method (CLHM), algoritma K-Means, dan pembuatan aplikasi. 5

BAB IV. BAB V. Implementasi dan Testing Bab ini membahas tentang implementasi atau penerapan dan pengujian dari rancangan sistem yang telah dibuat. Penutup Bab ini berisi kesimpulan dan saran tentang hasil perancangan dan implementasi terhadap aplikasi yang telah dibuat. 6