BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

1.5 Metode Penelitian

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. tahunnya (Radev et al, 2000). Pada bulan Juli 2011, jumlah host yang diiklankan di

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB 1 PENDAHULUAN. Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB I PENDAHULUAN Latar Belakang Latar Belakang

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

BAB I PENDAHULUAN. jenis bisnis dalam meningkatkan efisiensi dan efektivitas proses bisnis,

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB II TINJAUAN PUSTAKA

ABSTRAK. Kata kunci : Informasi, Information Retreival, Ant Colony Optimization, Graph, Fitur dokumen. vii

BAB I PENDAHULUAN. dengan menerapkan teknologi tepat guna, namun dalam mengembangkan sistem

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB I PENDAHULUAN. pesat terutama perkembangan internet. Dengan adanya internet dapat

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

@UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar belakang

1.2. Latar Belakang Masalah

BAB IV ANALISA DAN PERANCANGAN

BAB 1 PENDAHULUAN Latar Belakang

Berikut langkah-langkah penelitian yang dilakukan: 1. Menentukan kebutuhan data yang akan digunakan.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB 1 PENDAHULUAN UKDW

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. canggih dan pesat dari waktu ke waktu, dengan berkembangnya teknologi

BAB 1 PENDAHULUAN. Internet bukanlah hal yang baru bagi masyarakat. Setiap anggota masyarakat kini

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

BAB III METODELOGI PENELITIAN

BAB IV HASIL DAN UJI COBA

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

BAB I 1. PENDAHULUAN

BAB I PENDAHULUAN. pinus. Dengan banyaknya desa yang telah disalurkan bantuan bibit pohon pinus

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III METODOLOGI PENELITIAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PERINGKASAN TEKS BERITA SECARA OTOMATIS MENGGUNAKAN TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) SKRIPSI DANDUNG TRI SETIAWAN

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

BAB III METODOLOGI PENELITIAN

DAFTAR ISI PHP... 15

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Permasalahan

BAB I PENDAHULUAN. pendidikan tinggi berbasis Information and Communications Technology (ICT)

BAB III METODOLOGI PENELITIAN

UKDW BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari

BAB 1 PENDAHULUAN. kehidupan manusia membuat manusia yang dalam hal ini sebagai user. menggunakan model ataupun pengarsipan secara manual.

BAB I PENDAHULUAN. teknologi informasi di bidang geografis, informasi dapat ditampilkan dengan lebih

BAB 3 LANDASAN TEORI

BAB I PENDAHULUAN. Kehidupan manusia tidak lepas dari penggunaan internet, dikarenakan akses internet era sekarang penggunaannya cukup mudah.

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN 1.1. Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Perkembangan teknologi informasi dapat dimanfaatkan untuk meningkatkan kinerja dan

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN Pengantar

BAB 3. METODOLOGI PENELITIAN

BAB I PENDAHULUAN. dalam arti yang lebih sempit, adalah sistem komputer yang memiliki kemampuan

BAB I PENDAHULUAN 1.1 Latar Belakang

1BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III PERANCANGAN. Tabel 3.1 Detil Tabel mpage

BAB I PENDAHULUAN 1.1. Latar Belakang

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Media massa memiliki berbagai jenis media penyiaran seperti televisi dan radio dan media cetak seperti surat kabar, majalah dan tabloid. Namun, dengan kemajuan teknologi saat ini penyebaran berita dilakukan melalui media online. Sejak tahun 1990-an, teknologi internet menjadi media penyebaran berita kepada khayalak ramai (Arifin dkk, 2008). Berita yang disebarkan melalui media online merupakan artikel berita tekstual yang dikemas dengan bahasa tulis yang lugas dan informatif. Terdapat sembilan (9) kategori berita pada setiap media online antara lain olahraga, seni, hiburan, keluarga, politik, kesehatan, ekonomi, pemerintahan dan kriminal (Djuraid, 2007). Salah satu berita yang sering diberitakan di media online adalah berita kriminal. Berita kriminal merupakan berita atau laporan mengenai kejahatan yang diperoleh dari pihak kepolisian. Berbagai laporan kepolisian menyebutkan kriminalitas disebabkan atau dipicu dari persolan ekonomi, sosial, konflik, dan rendahnya kesadaran hukum masyarakat. Dilain hal tindakan kriminal tidak jarang dipicu oleh persoalan-persoalan sepele. Hal tersebut menjadi kontribusi pada peningkatan angka kriminalitas. Seperti yang disebutkan BPS pada laporan statistika kriminal (2014), selama periode 2013 setiap 1 menit 32 detik terjadi tindak kriminal di Indonesia. Polri memantau dan mengevaluasi perkembangan kriminalitas sebanyak 11 (sebelas) jenis kriminal. Kesebelas tindak kriminal tersebut meliputi pencurian dengan pemberatan, pencurian kendaraan bermotor, penganiayaan berat, narkoba, perjudian, pencurian dengan kekerasan, pemerasan, pencurian kayu, penggunaan senjata api dan bahan peledak, penyelundupan dan korupsi. Secara garis besar, kriminalitas tersebut dibagi menjadi lima kategori yaitu kejahatan narkoba contohnya perdagangan barang-barang terlarang, kejahatan politik yakni korupsi, kolusi, nepotisme; kejahatan kesusilaan contoh: pemerkosaan dan pencabulan dan kejahatan terhadap nyawa yakni pembunuhan, 1

2 penganiayaan sedangkan kejahatan terhadap harta benda seperti pencurian, perampokan (Kartono, 2003). Meningkatnya berita mengenai kriminal, maka berdampak pada meningkatnya jumlah berita yang disuguhkan kepada masyarakat. Hal tersebut juga berdampak pada meningkatnya volume berita, sehingga dibutuhkan sebuah ringkasan. Ringkasan merupakan teks yang dihasilkan dari sebuah kumpulan teks yang mengandung informasi penting dengan panjang teks tidak lebih dari setengah teks aslinya (Radev et al., 2002). Dalam ilmu komputer, teknik peringkasan dikenal dengan peringkas teks otomatis atau automatic text summarization. Automatic Text Summarization (ATS) adalah sebuah aplikasi yang dijalankan pada komputer untuk membuat versi berita yang lebih singkat dari berita aslinya. Selain merubah berita menjadi lebih singkat, peringkasan juga dapat digunakan untuk mempermudah proses klasifikasi. Proses kinerja klasifikasi dokumen menjadi tidak optimal dapat dipengaruhi oleh banyaknya term sebuah dokumen (Yu et al., 2009). Klasifikasi merupakan sebuah proses untuk menyatakan suatu objek ke salah satu kategori yang sudah didefinisikan sebelumnya (Gupta, 2012). Kategori yang sudah terdefinisi disebut data latih. Data latih digunakan untuk memprediksi data yang belum diketehui kelasnya. Sebelum proses klasifikasi data dilakukan, data tersebut harus melalui tahapan preprocessing. Tahapan preprocessing yang dilakukan secara umum yakni tokenizing, stopwords, dan stemming. Tujuan preprocessing ini untuk mendapatkan spesifikasi data input yang sesuai. Salah satu pendekatan sistematis untuk membangun sekumpulan data input dokumen teks adalah pendekatan Decision Tree Induction. Algoritma yang menggunakan pendekatan ini antara lain ID3, C45 dan CART. Dalam penelitian ini algoritma yang digunakan adalah algoritma Iterative Dichotomiser (ID3). Algoritma ini melakukan pencarian secara rakus/menyeluruh (Greedy) pada semua kemungkinan pohon keputusan. Algoritma ini digunakan pada suatu kasus dengan atribut yang bersifat kategorikal dan juga diterapkan pada kasus dokumen teks. Hasil algoritma Iterative Dichotomiser (ID3) memiliki akurasi yang lebih baik daripada metode decision tree yang lain (Bashir et al.,

3 2014). Proses klasifikasi dalam penilitian ini yakni klasifikasi berita dengan atribut berdasarkan isi dokumen. Semakin banyak volume dokumen dapat menyebabkan suatu permasalahan pada klasifikasi dokumen. Banyaknya term terdapat pada dokumen bisa menyebabkan proses klasifikasi lambat (Yu et al, 2009). Oleh karena itu, dokumen yang digunakan pada penelitian ini berupa ringkasan berita kriminal. Metode yang digunakan untuk peringkas dokumen yaitu metode Maximum Marginal Relevance (MMR). Metode ini menghitung kesamaan antar kalimat dan kesamaan setiap kalimat terhadap judul dari konten berita. Peringkas dokumen yang memperhatikan keterkaitan kalimat tersebut diharapkan dapat menghasilkan ringkasan kalimat dengan baik sehingga dapat meningkatkan proses kerja klasifikasi dokumen artikel berita kriminal. 1.2 Rumusan Masalah Berdasarkan penjelasan pada latar belakang, rumusan masalah yang dibahas pada penelitian ini yaitu : 1. Bagaimana menentukan jenis kriminal yang terdapat pada artikel berita. 2. Bagaimanakah pengaruh peringkasan dokumen otomatis pada kinerja klasifikasi dokumen teks. 1.3 Batasan Masalah Batasan masalah pada penelitian adalah sebagai berikut : 1. Data yang digunakan yaitu data berupa artikel berita dari portal berita kompas.com dan detik.com. 2. Artikel berita hanya dibagi dalam lima kelas yaitu kejahatan ekonomi, kejahatan politik, kejahatan kesusilaan, kejahatan terhadap jiwa dan kejahatan terhadap harta benda. 3. Peringkasan yang dilakukan hanya untuk dokumen tunggal. 4. Algoritma Maximum Marginal Relevance (MMR) digunakan untuk melakukan proses ringkasan dari dokumen artikel berita kriminal. 5. Algoritma ID3 digunakan untuk melakukan klasifikasi jenis kejahatan berdasarkan ringkasan berita yang telah dilakukan sebelumnya.

4 1.4 Tujuan Penelitian Berdasarkan latar belakang dan rumusan masalah di atas, maka tujuan dari penelitian ini adalah menerapkan metode klasifikasi pada ringkasan berita kriminal menggunakan Algoritma Iterative Dichotomiser Tree. Ringkasan bertujuan untuk mereduksi dokumen menjadi lebih singkat dengan tetap menjaga informasi penting dokumen asli yang dapat mempengaruhi kinerja klasifikasi. 1.5 Manfaat Penelitian Output dari hasil rancang bangun ini diharapkan dapat memudahkan pengguna untuk mengetahui berita kriminal secara ringkas yang dilengkapi dengan kelas kategori kriminal pada berita tersebut. 1.6 Keaslian Penelitian Berdasarkan referensi yang dimiliki, penelitian mengenai klasifikasi berita kriminal menggunakan Algoritma Iterative Dichotomiser Tree (ID3) berdasarkan peringkasan teks otomotis dengan metode Maximum Marginal Relevance (MMR) ini belum pernah dilakukan. Walaupun demikian, terdapat penelitian terdahulu tentang topik dan metode sejenis yang dipaparkan pada tinjuan pustaka dalam penelitian ini. 1.7 Metode Penelitian Tahapan-tahapan dalam melakukan penelitian terbagi menjadi beberapa tahap seperti Gambar 1.1 berikut: Gambar 1. 1 Tahapan metodologi penelitian 1. Studi Pustaka Studi pustaka dilakukan dengan membaca dan mempelajari literatur terkait permasalahan dalam penelitian ini. Literatur yang didapatkan dari jurnal ilmiah, e-book dan hasil laporan penelitian dan buku. Literatur yang dipelajari berkaitan

5 dengan konsep peringkasan teks otomatis (automatic text summarization), pembobotan Term Frequency-Inverse Document Frequency (TF-IDF), metode Maximum Marginal Relevance (MMR) dan metode Iterative Dichotomiser (ID3). 2. Pengumpulan Data Tahapan pengumpulan data dilakukan dengan melakukan penyaringan artikel-artikel berita online khusus berita dengan kasus kriminal. Hasil dari tahapan ini yang akan dijadikan data input pada sistem untuk proses klasifikasi jenis kriminal dalam berita tersebut. 3. Analisis kebutuhan sistem Tahapan ini merupakan tahapan yang dilakukan untuk menggambarkan kebutuhan model sistem yang akan dibangun. Pada tahap ini akan dihasilkan spesifikasi model prototype program untuk melakukan klasifikasi kategori kejahatan kriminal berdasarkan peringkasan berita. 4. Perancangan model sistem Pada tahap ini dilakukan rancangan arsitektur model sistem, perancangan proses bisnis, perancangan basis data dan perancangan antarmuka aplikasi. Proses perancangan ini dilakukan dengan mendeskripsikan secara tekstual maupun dengan menggunakan diagram permodelan. 5. Implementasi Tahapan implementasi adalah menuliskan kode program dengan menggunakan tools pemrograman. Tahapan implementasi diharapkan bisa sesuai seperti yang telah dirancang pada tahapan rancangan model sistem. Perangkat lunak yang digunakan adalah software XAMPP yang mendukung web server Apache, bahasa pemrograman PHP dan MYSQL yang digunakan untuk implementasi database. 6. Pengujian Pengujian yang dilakukan dalam penelitian ini yaitu pengujian terhadap fungsional dari sistem yang telah dibangun atau biasa disebut dengan pengujian black box. Hasil pengujian dilakukan analisa apakah menunjukkan performansi yang sesuai dengan spesifikasi yang telah dirancang. Penilaian performansi akan menggunakan perhitungan recall, precision, F-measure dan accuracy.

6 1.8 Sistematika Penulisan Sistematika penulisan merupakan gambaran seara umum pada setiap bab terkait penulisan penelitian. Adapun sistematika penulisan dalam penelitian ini adalah sebagai berikut : BAB I PENDAHULUAN Pendahuluan berisi uraian singkat mengenai latar belakang masalah, rumusan masalah, batasan masalah, tujuan penelitian, manfaat penelitian, keaslian penelitian, metode penelitian, dan sistematika penulisan tesis. BAB II TINJAUAN PUSTAKA Tinjauan pustaka membahas tentang penelitian-penelitian terdahulu yang terkait dengan penelitian ini. Selain itu, pada bab ini juga diuraikan tentang perbandingan fokus dan tujuan dari metode yang diterapkan antara penelitian ini dengan penelitian yang telah ada sebelumnya. BAB III LANDASAN TEORI Landasan teori memuat tentang teori-teori dasar terkait dengan penelitian yang dilakukan dan menjadi dasar dalam memecahkan masalah dalam penelitian ini. BAB IV ANALISIS DAN SISTEM Bab ini menerangkan tentang analisis sistem dan sistem yang akan dibangun. Uraian pada bab ini mencakup rancangan arsitektur model sistem, perancangan proses bisnis, perancangan basis data dan perancangan antarmuka sistem. BAB V IMPLEMENTASI Bab ini mengurasikan tentang implementasi yang diterapkan berdasar rancangan sistem pada bab sebelumnya. Implementasi dilakukan dengan menggunakan bahasa pemrograman PHP dan basis data MySQL. BAB VI HASIL DAN PEMBAHASAN Bab ini membahas hasil implementasi penelitian yang dilakukan. Hasil penelitian berupa ringkasan berita dan klasifikasi ringkasan berita tersebut. Dari hasil pengujian dapat diketahui tingkat pencapaian keakuratan dari model sistem

7 klasifikasi ringkasan berita menggunakan Algoritma Iterative Dichotomiser Tree (ID3). BAB VII PENUTUP Bab ini berisi kesimpulan dan saran dari hasil penelitian yang telah dilakukan. Kesimpulan diambil berdasarkan hasil dan pembahasan pada bab sebelumnya. Selanjutnya, kekurangan yang ada pada sistem dimasukkan ke dalam saran untuk pengembangan penelitian di masa yang akan datang.