BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).

dokumen-dokumen yang mirip
BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN I - 1

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN Pengantar

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN Latar Belakang Masalah

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN I-1

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB 1 PENDAHULUAN. Di tengah-tengah pesatnya kemajuan teknologi, semakin banyak orang yang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW. Bab 1 PENDAHULUAN

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODOLOGI PENELITIAN

MILIK UKDW BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN. Sekolah Tinggi Manajemen Informatika dan Teknik Komputer Surabaya

BAB I PENDAHULUAN. tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor,

BAB IV HASIL DAN PEMBAHASAN

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN. globalisasi pada saat sekarang ini, penggunaan komputer yang baik juga berperan. penting pada siklus penyusunan laporan akuntansi.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. beresiko rusak, membutuhkan waktu yang lama dan hilang.

BAB III METODOLOGI PENELITIAN

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

1.2. Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Perkembangan teknologi yang sedemikian pesat membuat manusia

BAB I PENDAHULUAN. Perkembangan ilmu pengetahuan dan Teknologi Informasi (TI) hampir

BAB IV PREPROCESSING DATA MINING

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. ilmu tertentu dengan menggunakan kaidah-kaidah yang berlaku dalam bidang

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB I PENDAHULUAN. mengelola data, menyiapkan data, melakukan perhitungan perhitungan dan

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

Bab I PENDAHULUAN. I.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. efektivitas dan efisiensi kerja tercapai. STIKOM Surabaya merupakan salah

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

1.5 Metode Penelitian

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

BAB I PENDAHULUAN. pengkomunikasian untuk masalah semi-terstruktur. Secara khusus, SPK

BAB I PENDAHULUAN. Peminatan atau bidang peminatan adalah sebuah jurusan yang harus di

BAB 1 PENDAHULUAN. Perkembangan sistem komputerisasi tidak terlepas dari perkembangan teknologi yang

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB IV HASIL DAN PEMBAHASAN

1. Pendahuluan. 1.1 Latar belakang

BAB I PENDAHULUAN 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI)

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Di era modern ini, macam-macam makanan sangatlah banyak dan beragam.

BAB I PENDAHULUAN. bagi kehidupan manusia, cara kerja computer lebih cepat dibandingkan dengan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Komputer merupakan salah satu sarana yang wajib dimiliki oleh semua

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. peralatan mesin, sehingga aktifitas penanaman dapat lebih cepat di laksanakan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. dikurangi penyusutan dan beban-beban dari tahun buku yang bersangkutan. Maka

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada sekarang ini ketersediaan informasi berbentuk dokumen teks sebagian besar sudah berbentuk elektronik (softcopy). Kemungkinan penyimpanan media teks ke dalam bentuk elektronik tersebut akan mengalami perkembangan yang sangat besar pada masa yang mendatang. Salah satu hal yang perlu dilakukan adalah penggolongan dokumen-dokumen yang berada dalam satu kumpulan dokumen (corpus) ke dalam kelompok-kelompok kategori yang sasuai dengan isi dokumen-dokumen yang berada didalam corpus. Proses penggolongan dokumen yang berasal dari suatu corpus ke dalam kategori-kategori yang telah ditentukan tersebut disebut juga dengan proses dokumen klasifikasi. Tujuan dari pengelompokkan dokumen adalah untuk mempermudah pencarian informasi sesuai dengan kategori yang dimiliki oleh setiap dokumen. Proses pengklasifikasian dokumen sulit dilakukan jika menggunakan query biasa, karena dengan menggunakan query yang kurang spesifik dapat mengakibatkan membanjirnya beberapa dokumen yang tidak relevan. 1

2 Feature selection adalah suatu bentuk upaya peningkatan algoritma pembelajaran yang digunakan untuk menggolongkan dokumen ke dalam kategori-kategori tertentu dengan cara menemukan suatu bentuk pola yang relevan (minimal satu buah pola). Tujuan dari dilakukannya proses feature selection di dalam proses dokumen kelasifikasi adalah untuk meningkatkan skalabilitas, efisiensi dan akurasi. Feature adalah seluruh kata yang muncul dalam training set. Set ini biasanya sangat besar yaitu satu dimensi untuk setiap kata unik. Hal inilah yang membuat klasifikasi dokumen menjadi sulit, karena dimensi yang dimiliki oleh feature space sangat besar. Penyeleksian seluruh kata yang muncul di dalam training set dapat dilakukan dengan cara mereduksi dimensi pada feature space dengan jalan memilih kata-kata yang paling informative bagi dokumen yang akan diklasifikasikan. Informasi yang berkualitas merupakan salah satu ciri dari bentuk penurunan berdasarkan pola dan kecenderungan tertentu yang dapat diperoleh melalui statistical pattern learning. Menghadapi permasalahan demikian, maka dibutuhkan suatu metode yang efisien untuk melakukan proses feature selection. Metode feature selection yang digunakan pada penelitian ini adalah Chi Squared. Sedangkan metode klasifikasi dokumen yang digunakan adalah metode Naïve Bayes (NBC) yang memang telah sering digunakan untuk memecahkan permasalahan yang berhubungan dengan proses klasifikasi.

3 1.2 Rumusan Masalah Permasalahan yang menjadi fokus penelitian ini adalah : Bagaimana system dapat melakukan proses pengenalan pola dokumen dari corpus yang umumnya tidak terstruktur menjadi data yang terstruktur?. Bagaimana system dapat mengkategorikan corpus kedalam kategori-kategori yang sudah ditentukan yang bertujuan untuk mempermudah pencarian informasi sesuai dengan kategori yang dimiliki oleh setiap dokumen?. 1.3 Batasan Masalah Permasalahan yang akan dibahas di dalam penulisan tugas akhir ini dibatasi sebagai berikut : 1. Dokumen yang digunakan sebagai inputan adalah dokumen berbahasa Indonesia dengan ekstensi *.txt dan bersifat plain text. 2. Proses Stemming dan Stopword hanya berlaku pada katakata ber-bahasa Indoensia saja. 3. Proses Stemming hanya dilakukan pada proses prefiks dan sufiks. 4. Parameter yang digunakan untuk melakukan pengujian hanya menggunakan parameter precision.

4 5. Metode yang digunakan di dalam melakukan pengujian proses Feature Selection adalah metode Chi Squared. 6. Metode yang digunakan di dalam proses dokumen klasifikasi adalah metode Naïve Bayes Classifier. 7. Dokumen yang digunakan diambil dari www.bolanews.com, www.kompas.com, www.detik.com dan bahan yang digunakan untuk penelitian hanya digolongkan ke dalam tiga kategori, yaitu olahraga, ekonomi dan komputer. Dengan adanya hal ini, maka akan dimungkinkan munculnya outlier (dokumen yang tidak masuk ke dalam kategori manapun). 1.4 Tujuan Penelitian Tujuan dari penulisan Tugas Akhir ini adalah 1. Untuk memudahkan dalam melakukan pengarsipan dokumen dalam skala yang besar. 2. Meningkatkan skalabilitas, efisiensi dan akurasi dalam pengkategorian dokumen dari kumpulan dokumen teks yang besar (corpus) kedalam kategori-kategori yang telah ditentukan. 3. Untuk mempermudah pencarian informasi sesuai dengan kategori yang dimiliki oleh setiap dokumen.

5 1.5 Metodologi / Pendekatan Adapun metode yang digunakan dalam melakukan penelitian ini adalah sebagai berikut : 1. Studi Pustaka Dengan memperlajari buku-buku literatur yang berkaitan dengan penelitian dengan tujuan mendapatkan sumber pemahaman yang membantu mengatasi masalah-masalah yang muncul selama penelitian. 2. Pengumpulan data lewat Internet Data yang dikumpulkan melalui internet berupa artikel, jurnal ilmiah, dan data-data lainnya yang mendukung penelitian. 3. Perancangan o Perancangan Database dalam penelitian dengan menggunakan SQL Server 2000. o Perancangan User Interface untuk aplikasi ini menggunakan Visual Basic 6.0

6 1.6 Sistematika Penulisan Sistematika penulisan dari skripsi ini adalah sebagai berikut : Bab I : Pendahuluan yang berisi Latar Belakang Masalah, Perumusan Masalah, Batasan Masalah, Tujuan Penelitian, Metode/Pendekatan, Sistematika Penulisan Bab II Bab III : Landasan Teori yang berisi teori-teori yang mendasari penelitian. : Sistem yang berisi tahap perancangan lengkap dari program yang akan dibuat. Bab IV : Implementasi dan Analisis Sistem yang akan menjelaskan informasi tentang implementasi sistem dari perancangan sistem yang telah dibuat pada bab 3, meliputi cara kerja program, input dan output, realisasi sistem, kelebihan dan kekurangannya. Bab V : Kesimpulan dan Saran berisikan kesimpulan akhir dan saran-saran untuk pengembangan sistem.