PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING
|
|
|
- Sri Hardja
- 9 tahun lalu
- Tontonan:
Transkripsi
1 PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING 1 Arrummaisha Adrifina 2 Juwita Utami Putri 3 I Wayan Simri W 1 [email protected] 2 [email protected] 3 [email protected] ABSTRAK Seiring pesatnya perkembangan internet, semakin banyak pula bermunculan situs atau blog yang menyediakan berbagai macam artikel berita secara online. Sebuah artikel, sebelum dapat diterbitkan, awalnya dikirim oleh wartawan ke editor untuk dipilah. Pemilahan jenis berita relatif mudah dilakukan oleh manusia, tetapi jika kasus ini dibawa ke level pemilahan secara otomasi dengan komputer akan membawa permasalahan tersendiri, walaupun untuk berita yang lebih pendek. Text mining adalah salah satu cara yang diharapkan dapat mengatasi permasalahan di atas. Dengan text mining, dapat dicari kata-kata yang dapat mewakili isi dari artikel berita, lalu ditentukan kategorinya berdasarkan frekuensi kata-kata yang terdapat di dalamnya. Tahapan yang penulis lakukan pada penelitian ini adalah: (i) pembuatan database vector untuk keyword, (ii) pemilahan sumber berita berdasarkan database dari langkah (i). Paper ini diharapkan dapat membantu sistem redaksi elektronik untuk dapat memilah atau mengetahui kategori dari sebuah artikel berita tanpa memerlukan seorang editor sehingga menghemat waktu dan biaya dalam menjalankan bisnis pada model kantor berita elektronik on-line berbasis internet. Kata Kunci: clustering, data mining, text mining. 1. PENDAHULUAN Pada akhir-akhir ini, berbagai perkembangan yang terjadi memang cukup menakjubkan, khususnya dalam bidang teknologi informasi dan komunikasi. Salah satu teknologi informasi dan komunikasi yang berkembang pesat adalah internet. Internet saat ini menjadi kebutuhan bagi banyak orang karena dengan internet kita bisa mengakses dan menemukan segala informasi di seluruh dunia dengan cepat dan mudah, karena banyak situs-situs di internet yang menyediakan informasi yang kita butuhkan, baik berupa dokumen, maupun artikel berita. Sebuah artikel, sebelum dapat diterbitkan di sebuah koran, majalah, atau website tertentu, artikel tersebut terlebih dahulu di edit kembali oleh seorang editor, lalu berita yang akan diterbitkan dipilah serta dikategorikan. Dengan berkembang pesatnya teknologi, proses yang biasanya dilakukan oleh editor tersebut, dapat dilakukan oleh komputer. Bila proses tersebut dilakukan oleh manusia, bukanlah hal yang sulit. Tetapi apabila dilakukan oleh sebuah komputer, akan terdapat sebuah masalah baru, dapatkah komputer menetukan kategori artikel tersebut? Text mining adalah salah satu cara yang diharapkan dapat mengatasi 176 Pemilihan Artikel Berita
2 permasalahan di atas. Text mining atau sering disebut text data mining [3] merupakan proses pengambilan datadata berupa teks dari sebuah sumber. Dengan text mining, dapat dicari katakata yang dapat mewakili isi dari artikel berita, lalu dianalisis apakah artikel berita tersebut tersebut termasuk ke dalam kategori olah raga, kesehatan, selebriti, kriminal, ekonomi, politik atau yang lain, dicocokkan dengan database kata kunci yang sebelumnya telah dibuat. Sehingga diharapkan dapat membantu sistem redaksi elektronik untuk dapat memilah atau mengetahui kategori dari sebuah artikel berita tanpa memerlukan seorang editor. Hal ini akan menghemat waktu dan biaya dalam menjalankan bisnis pada model kantor berita elektronik on-line berbasis internet. 2. TINJAUAN PUSTAKA Pada tinjauan pustaka yang kami lakukan, ternyata banyak sekali penelitian-penelitian tentang data mining dan text mining. Diantaranya paper berjudul Applying data mining technique in text Analysis yang ditulis Helena Ahonen, Oskari Heinonen, Mika Klemettinen, dan A. Inkeri Verkamo. Paper ini menjelaskan pengaplikasian teknik data mining dalam proses text analisis [1]. Paper lain yang membahas tentang text mining adalah sebuah paper yang berjudul Text Mining Knowdlege Extraction From Unstructured Textual Data. Martin Rajman dan teamnya melakukan proses ekstraksi kata dari sebuah kumpulan data mereka yang tidak terstruktur dengan menggunakan teori probabilitas frekuensi kemunculan kata kunci. Pada paper ini penulis mencoba sebuah metode yang serupa dengan metode yang dilakukan oleh Martin Rajman, yaitu menggunakan keyword atau kata kunci. Tetapi kata kunci yang digunakan penulis pada penelitian ini didapat dari melakukan ekstraksi dari beberapa artikel yang temanya sudah diketahui. 3. METODE PENELITIAN Proses pemilahan berita yang penulis lakukan terdiri dari beberapa proses, yaitu: 1. Pembuatan Database Pembuatan database merupakan tahap awal dari proses text mining yang akan dilakukan, database ini akan menentukan keakuratan pemilahan berita yang dilakukan pada proses akhir. Proses pembuatan database yang penulis lakukan adalah seperti gambar berikut: Pemilihan Artikel Berita 177
3 Tokenizing dan word counting Filtering Insert Kata kunci Artikel sumber Database Gambar 1. Proses pembuatan database Pada artikel sumber yang telah diketahui kategorinya pertama-tama dilakukan proses tokenizing dan word counting. Proses ini berguna untuk memecah kata-kata yang terdapat pada artikel sekaligus dilakukan perhitungan frekuensi dari setiap kata. Proses ini dilakukan pada setiap artikel sumber dari masing-masing kategori. Setelah kata-kata tersebut telah terpecah menjadi token-token, selanjutnya dilakukan proses filtering atau proses penghapusan kata-kata. Kata-kata yang dihapus adalah kata-kata yang tidak memiliki arti yang penting, seperti: kata hubung, kata sambung, kata depan, serta nama-nama hari dan bulan. Proses ini dilakukan untuk mengurangi jumlah kata-kata karena selain tidak memiliki arti yang berpengaruh pada kategori berita, penghapusan kata-kata ini juga menghemat tempat penyimpanan database. Setelah proses filtering selesai maka akan didapat kumpulan kata kunci, lalu akan disimpan ke dalam database. Kata kunci ini akan digunakan pada langkah III. Pada penelitian ini pemilahan berita dibatasi pada 4 kategori, yaitu: ekonomi, olah raga, kesehatan, dan entertainment. Pada pembuatan database vector kata kunci digunakan 15 artikel berita untuk setiap kategori. Artikel-artikel berita yang digunakan diambil dari beberapa situs berita di internet. Serta digunakan beberapa kriteria, yaitu: panjang artikel berkisar antara kata, penggunaan kata-kata pada artikel sesuai kaedah bahasa Indonesia yang baik dan benar, dan artikel termasuk ke dalam salah satu tema dari 4 tema yang telah ditetapkan. Pembuatan database hanya dilakukan sekali saja. 178 Pemilihan Artikel Berita
4 2. Pemilahan Berita Untuk mengetahui kategori dari sebuah artikel berita, dilakukan proses seperti gambar 2. Matching Tokenizing dan word counting Filtering Database Hasil Artikel sumber Gambar 2. Proses pemilahan berita Proses tokenizing dan filtering yang dilakukan ini pada dasarnya sama seperti proses tokenizing dan filtering pada pembuatan database, hanya saja proses tokenizing dan filtering sekarang dilakukan pada artikel yang akan dicari tahu kategori beritanya. Selanjutnya dilakukan pencocokan kata-kata hasil filtering dengan kata-kata yang tersedia pada database yang telah dibuat pada langkah I. Bila ada kata yang sama antara artikel dengan database, nilai counter setiap kategori akan bertambah. Misalnya terdapat kata pasien dalam artikel. Sebelumnya, kata pasien telah dimasukkan dalam database, dengan kategori kesehatan. Pada saat dicocokan, nilai counter kategori kesehatan akan bertambah 1. Kategori dengan nilai counter tertinggi akan ditentukan sebagai kategori artikel berita tersebut. 4. HASIL DAN PEMBAHASAN Sumber berita yang diuji coba adalah artikel berita yang diambil secara acak dari internet sebanyak 20 berita. Lalu dibandingkan dengan hasil bila dilakukan secara manual. Penulis melakukan beberapa percobaan dengan menentukan nilai batasan kecocokan kata dalam artikel dengan database, yaitu sebesar 3, 5 dan 10 kata yang sama dalam satu kategori. Pemilihan Artikel Berita 179
5 Namun hasil terbaik yang didapat adalah dengan nilai batasan minimum 5 kata yang sama dalam satu kategori. Berikut adalah hasil percobaan yang dilakukan dengan batasan kecocokan 5 kata. Tabel 1. Hasil Percobaan Berita Dengan Tools Manual 1 Ekonomi Ekonomi 2 Ekonomi Ekonomi 3 Ekonomi Ekonomi 4 Ekonomi Ekonomi 5 Tidak ada dalam database Agama 6 Tidak ada dalam database Politik 7 Tidak ada dalam database Kriminal 8 Tidak ada dalam database Politik 9 Kesehatan Kesehatan 10 Kesehatan Kesehatan 11 Ekonomi Pendidikan 12 Ekonomi Olahraga 13 Entertainment Entertainment 14 Tidak ada dalam database Teknologi 15 Tidak ada dalam database Psikologi 16 Entertainment Entertainment 17 Entertainment Entertainment 18 Olahraga Olahraga 19 Kesehatan Kesehatan 20 Olahraga Olahraga Dari tabel hasil percobaan di atas dapat diketahui bahwa proses text mining yang dilakukan oleh komputer hasilnya sebagian besar sama dengan yang dilakukan secara manual (dengan membaca artikel tersebut terlebih dulu). Namun ada beberapa artikel yang tidak diketahui kategorinya (artikel 5, 6, 7, 8, 14, 15) karena memang penulis membatasi kategori yang dapat ditentukan hanya 4 buah ketegori, yaitu ekonomi, kesehatan, olahraga, dan entertainment, sehingga artikel tentang kategori lain belum dapat ditentukan. Ada juga 2 buah artikel yang hasilnya tidak sesuai (artikel 11 dan 12), karena saat dicocokkan dengan database, terdapat lebih dari 5 kata pada artikel yang termasuk dalam bidang ekonomi. 5. KESIMPULAN DAN SARAN Dari hasil percobaan yang kami lakukan, dapat disimpulkan bahwa pemilahan berita dapat dilakukan dengan menggunakan pendekatan kata kunci. Dengan metode kata kunci proses text mining dapat dilakukan dengan baik, hanya tingkat keakuratan dari proses text mining ditentukan oleh database vektor yang menjadi acuan. Apabila database vector kata kunci tidak akurat, maka hasil yang didapat pun tidak akan akurat, begitu pula sebaliknya. Untuk pengembangan penelitian berikutnya, kami menyarankan 180 Pemilihan Artikel Berita
6 penggunaan lebih banyak artikel sebagai sumber pembuatan vektor database kata kunci dan penambahan kategori-kategori berita sehingga hasil yang didapat akan lebih akurat. Pendekatan yang digunakan pada penelitian dapat pula diganti dengan pendekatan latent semantic. Yaitu membandingkan langsung suatu dokumen artikel dengan dokumen lain yang sudah diketahui kategorinya. 6. DAFTAR PUSTAKA Ahonen, Helena, O. Heinonen, M. Klemettinen, dan A. I. Verkamo Applying Data Mining Techniques in Text Analysis. Technical Report C , University of Helsinki, Department of Computer Science. Harlian, Milkha Text Mining. Lecture Notes. kuliah/dm/6text%20mining.pdf. Akses Mei Hearst, M. A Text data mining: Issues, techniques, and the relationship to information access. Presentation notes for UW/MS workshop on data mining, July Rajman, Martin dan R. Besancon Text mining - knowledge extraction from unstructured textual data. In Proceedings of the 6th Conference of International Federation of Classification Societies. Schütze, Hinrich Open Source Text Mining. Keynote on SIAM International Conference on Data Mining. Pemilihan Artikel Berita 181
APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA
APLIKASI PENGKATEGORIAN DOKUMEN DAN PENGUKURAN TINGKAT SIMILARITAS DOKUMEN MENGGUNAKAN KATA KUNCI PADA DOKUMEN PENULISAN ILMIAH UNIVERSITAS GUNADARMA Adhit Herwansyah Jurusan Sistem Informasi, Fakultas
PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING
PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING Agustoni 1 Fitri Maya Sari 2 e-mail : [email protected],[email protected]. Diterima : 25 Oktober 2011 / Disetujui : 31 Oktober 2011 ABSTRACT With the
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang
BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang
BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sumber opini teks saat ini tersedia berlimpah di internet akan tetapi belum sepenuhnya dimanfaatkan karena masih kurangnya tool yang ada, sedangkan perkembangan
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik
BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang
58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan
ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI)
ARTIKEL KLASIFIKASI KONTEN BERITA SURAT KABAR BERDASARKAN JUDUL DENGAN TEXT MINING MENGGUNAKAN METODE NAÏVE BAYES (STUDI KASUS : RADAR KEDIRI) Oleh: Enggal Suci Febriani 3..3..35 Dibimbing oleh :. Irwan
BAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang
KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN METODE TEXT MINING DAN NAIVE BAYES CLASSIFIER
KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN METODE TEXT MINING DAN NAIVE BAYES CLASSIFIER Ira Anggraeni Setiawan 1), Tacbir Hendro P 2), Dian Nursantika 3) 1),2),3 ) Informatika, Universitas Jenderal Achmad
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama
BAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk
Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Informasi telah menjadi kebutuhan utama dalam kehidupan manusia. Informasi bisa dikatakan sebagai pengetahuan yang didapatkan dari pembelajaran, pengalaman, atau instruksi.
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering
Analisis dan Implementasi Graph Clustering pada Berita Digital Menggunakan Algoritma Star Clustering Aufa Bil Ahdi P 1, Kemas Rahmat Saleh W, S.T., M.Eng 2, Anisa Herdiani, S.T., M.T 3 1.2.3 Teknik Informatika,
STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011
STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI
BAB I PENDAHULUAN. perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar
1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan data mining yang pesat tidak dapat lepas dari perkembangan teknologi informasi yang memungkinkan data dalam jumlah besar terakumulasi. Perkembangan internet
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 [email protected]
BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini perkembangan ilmu pengetahuan dan teknologi informasi semakin berkembang pesat, banyak teknologi baru yang telah diciptakan dan digunakan oleh masyarakat
BAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi informasi, maka proses dan media penyimpanan data pun semakin berkembang. Dengan adanya personal computer (PC), orang dapat menyimpan,
STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR
STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP
KATA PENGANTAR Syukur Alhamdulillah, puji dan syukur kami panjatkan kehadirat Allah SWT, karena dengan limpah dan rahmat dan karunia-nya penulis dapat menyelesaikan penyusunan laporan tugas akhir APLIKASI
PENERAPAN TEXT MINING DAN VECTOR SPACE MODEL PADA WEB-BASE KNOWLEDGE MANAGEMENT SYSTEM ( STUDI KASUS TEKNIK INFORMATIKA UPN ) TUGAS AKHIR
PENERAPAN TEXT MINING DAN VECTOR SPACE MODEL PADA WEB-BASE KNOWLEDGE MANAGEMENT SYSTEM ( STUDI KASUS TEKNIK INFORMATIKA UPN ) TUGAS AKHIR Disusun Oleh : VIVIN SOFI AMALIAH NPM. 0534010296 JURUSAN TEKNIK
APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIA DENGAN METODE N-GRAM
APLIKASI PREDICTIVE TEXT BERBAHASA INDONESIA DENGAN METODE N-GRAM Silvia Rostianingsih 1), Sendy Andrian Sugianto 2), Liliana 3) 1, 2, 3) Program Studi Teknik Informatika Fakultas Teknologi Industri Universitas
BAB 1 PENDAHULUAN. Universitas Sumatera Utara
1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan
JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER
JURNAL SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER SENTIMENT ANALYSIS POLITICAL LEADERS IN TWITTER Oleh: AGUNG PRAMONO PUTRO 12.1.03.03.0276 Dibimbing oleh : 1. NURSALIM, S.Pd,. MH 2. ARIE NUGROHO, S.Kom.,
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas
Implementasi Algoritma Term Frequency Inverse Document Frequency dan Vector Space Model untuk Klasifikasi Dokumen Naskah Dinas A. Achmad 1, A. A. Ilham 2, Herman 3 1 Program Studi Teknik Elektro, Jurusan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks
BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen
BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi
ALGORITMA UNTUK EKSTRAKSI TABEL HTML DI WEB
No Makalah : 128 ALGORITMA UNTUK EKSTRAKSI TABEL HTML DI WEB Detty Purnamasari 1, I Wayan Simri Wicaksana 2, Syamsi Ruhama 3 1,2 Teknologi Informasi, 3 Sistem Informasi, 1,2 Fakultas Pascasarjana, 3 Fakultas
BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
1.5 Metode Penelitian
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam perkembangan teknologi internet yang semakin maju ini kita dapat mengakses dokumen, buku dan majalah mulai dari bahasa asing sampai bahasa daerah yang
BAB I PENDAHULUAN I.1. Latar Belakang Masalah
BAB I PENDAHULUAN I.1. Latar Belakang Masalah Dalam era teknologi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung
BAB IV IMPLEMENTASI DAN PENGUJIAN
90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Bahasa Indonesia adalah bahasa resmi dari Negara Indonesia. Berdasarkan ketentuan UU Nomor 24 tahun 2009 (Pasal 3) tujuan dari penggunaan Bahasa Indonesia sebagai bahasa
BAB 1 PENDAHULUAN. dari pendayagunaan teknologi khususnya teknologi informasi. Penjualan elektronik atau yang akrab di sebut e-commerce ( electronic
BAB 1 PENDAHULUAN 1.1. Latar Belakang Di dalam dunia bisnis penjualan dan pemasaran merupakan bagian yang sangat penting sehingga banyak cara yang ditempuh oleh perusahaan besar atau perusahaan kecil untuk
BAB 1 PENDAHULUAN. dapat mencapai jutaan pendengar, namun cara penyampaiannya. ditujukannya pada pendengar secara perorangan, dan komunikasi tersebut
BAB 1 PENDAHULUAN A. Latar Belakang Aktivitas penyiaran semata-mata bukan hanya merupakan kegiatan ekonomi, tetapi juga memiliki peran sosial yang tinggi sebagai media komunikasi. Menurut Ben H. Henneke,
Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram
Jurnal Ilmiah Teknologi dan Informasia ASIA (JITIKA) Vol.10, No.1, Februari 2016 ISSN: 0852-730X Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram Denny Nathaniel
ISSN: Akhmad Pandhu Wijaya 1, Heru Agus Santoso 2
48 ISSN: 1978-1520 Naive Bayes Classification pada Klasifikasi Dokumen Untuk Identifikasi Konten E-Government Naïve Bayes Classification on Document Classification to Identify E-Government Content Akhmad
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet
PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL
PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL Nur Rosyid M, Entin Martiana, Damitha Vidyastana, Politeknik Elektronika
BAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)
BAB I PENDAHULUAN. canggih dan pesat dari waktu ke waktu, dengan berkembangnya teknologi
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi pada saat sekarang ini semakin canggih dan pesat dari waktu ke waktu, dengan berkembangnya teknologi informasi maka kebutuhan
Aplikasi Algoritma Stringmatching pada Analisa Teks (Text Analysis) untuk Decision Support System
Aplikasi Algoritma Stringmatching pada Analisa Teks (Text Analysis) untuk Decision Support System Hanif Lyonnais Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi
ROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Di era banjir informasi ini, masyarakat mulai meninggalkan media tradisional seperti televisi dan koran. Mobilitas aktivitas yang tinggi mengakibatkan masyarakat
BAB I PENDAHULUAN I - 1
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dunia pendidikan merupakan dunia yang memerlukan perhatian khusus karena pendidikan merupakan faktor yang sangat mempengaruhi kualitas para calon penerus bangsa
SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER
SENTIMENT ANALYSIS TOKOH POLITIK PADA TWITTER Agung Pramono 1, Rini Indriati 2, Arie Nugroho 3, 1,2,3 Sistem Informasi, Fakultas Teknik, Universitas Nusantara PGRI Kediri E-mail: 1 [email protected],
Bandung, Indonesia Bandung, Indonesia
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Bab I. PENDAHULUAN Latar Belakang
Bab I. PENDAHULUAN 1.1. Latar Belakang Modernisasi ini banyak dari berbagai kalangan masyarakat ingin mengetahui informasi yang terjadi di luar sana banyak penyampaian informasi melalui media masa elektronik
EMBANGKITAN ATURAN KLIFIKASI MENGGUNAKAN ALGORITMA MOBILE BLOG UNTUK CITIZEN JOURNALISM DENGAN PENGKATEGORIAN BERITA MENGGUNAKAN METODE INNER PRODUCT
EMBANGKITAN ATURAN KLIFIKASI MENGGUNAKAN ALGORITMA MOBILE BLOG UNTUK CITIZEN JOURNALISM DENGAN PENGKATEGORIAN BERITA MENGGUNAKAN METODE INNER PRODUCT Yuliana Setiowati, Afrida Helen, Lilik Istianah Politeknik
BAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pada zaman sekarang perkembangan ilmu pengetahuan dan teknologi sangatlah pesat, salah satunya pada bidang komputer. Komputer memegang peranan penting dalam mempermudah
Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Adi Radili 1, Suwanto Sanjaya 2 1,2 Teknik Informatika UIN Sultan Syarif Kasim Riau Jl. H.R. Soebrantas no. 155 KM. 18
WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR
WEB CONTENT MINING MENGGUNAKAN PARTITIONAL CLUSTERING K-MEANS PADA NEWS AGGREGATOR Achmad Thoriq B, Nelly Indriani W Abstract News aggregator is one type of aggregator system (collector) which collects
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi
ANALISIS SKEMA-SKEMA KEMIRIPAN VEKTOR PADA SISTEM PENILAIAN UJIAN ESSAY ONLINE
ANALISIS SKEMA-SKEMA KEMIRIPAN VEKTOR PADA SISTEM PENILAIAN UJIAN ESSAY ONLINE Trisna Ari Roshinta 1, Faisal Rahutomo 2, Deddy Kusbianto 3 1,2,3 Teknik Informatika, Teknologi Informasi, Politeknik Negeri
BAB 1 PENDAHULUAN. yang sudah maju seperti Amerika, Eropa, Jepang dan lain sebagainya.
BAB 1 PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan zaman yang sangat pesat khususnya dinegaranegara yang sudah maju seperti Amerika, Eropa, Jepang dan lain sebagainya. Negara-negara tersebut
BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad
1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal
APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING
APLIKASI WORDNET INDONESIA BERDASARKAN KAMUS THESAURUS BAHASA INDONESIA MENGGUNAKAN ALGORITMA RULE BASED TEXT PARSING Dzulfie Zamzami 1, Dr.Eng.Faisal Rahutomo,ST.,M.Kom 2., Dwi Puspitasari, S.Kom., M.Kom.
SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL
SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu
Saat ini Web merupakan sumber informasi dengan volume yang besar.
TUGAS AKHIR Sistem Ekstraksi Informasi Web Menggunakan Metode Pencarian Pola Otomatis Berbasis Pencocokan Pohon Sigit Dewanto 05/186213/PA/10559 http://nuevasystem.com PENDAHULUAN Latar Belakang Masalah
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan jumlah situs web (website) di Internet berdasarkan hasil survey dari Netcraft (2013) menunjukkan peningkatan pesat dari 18 juta website pada tahun 2000
Mardi Siswo Utomo Fakultas Teknologi Informasi Universitas Stikubank Semarang
! " #! " $ # % " & % % '! ( $ ) $ * # ) # +, - - - - - - - - - -. / 0 % $ 1 " 2 ' $ " 3 4 ' 5 6 % 7 + )!, $ 5 & % - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
HASIL DAN PEMBAHASAN. Praproses
5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk
UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Berkembangnya teknologi telah membuat banyak informasi bermunculan. Informasi-informasi tersebut tertuang dalam bentuk dokumen terutama dokumen digital. Semakin
BAB 1. Pendahuluan. 1.1 Latar Belakang
BAB 1 Pendahuluan 1.1 Latar Belakang Pada masa sekarang ini, kebutuhan masyarakat untuk mendapatkan informasi sangatlah besar. Informasi secara tidak langsung harus didapatkan dengan cepat dan tepat, sehingga
BAB I PENDAHULUAN. metode transaksi yang di lakukan secara online mulai berkembang pesat,
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Seiring dengan hadirnya internet akhir-akhir ini yaitu salah satunya metode transaksi yang di lakukan secara online mulai berkembang pesat, bahkan sampai pada
BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN
28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi
DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS
DETEKSI WEB BERKONTEN PORNO DENGAN METODE BAYESIAN FILTERING DAN PRINCIPAL COMPONENT ANALYSIS SKRIPSI Diajukan untuk Memenuhi Sebagian Persyaratan Mendapatkan Gelar Strata Satu Program Studi Informatika
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Basis data saat ini sudah berkembang menjadi sangat besar secara cepat ke dalam ukuran terabyte. Di dalam tumpukan data tersebut mungkin terdapat informasiinformasi
IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB
IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi
Analisa Log Router Untuk Meningkatkan Keamanan Jaringan
Analisa Log Router Untuk Meningkatkan Keamanan Jaringan 1 Andreas Hadiyono 2 Sutresna Wati 3 I. Wayan Simri Wicaksana 1,2,3 Universitas Gunadarma, Jakarta 1 [email protected] 2 [email protected]
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun
Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia
Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung [email protected] Abstrak.Tujuan penelitian ini adalah meringkas
JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 6 NO. 2 September 2013
KLASIFIKASI DOKUMENT TEKS MENGGUNAKAN ALGORITMA NAIVE BAYES DENGAN BAHASA PEMOGRAMAN JAVA Silfia Andini 1 ABSTRACT The development of technology nowadays has brought some effects to the sophisticated communication
KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER
1 KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER Amalia Anjani A. 1, Arif Djunaidy 2, Renny P. Kusumawardani 3 Jurusan Sistem Informasi,
BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Banyak informasi terbaru tentang olahraga sepak bola di Indonesia menjadikan sepak
1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Banyak informasi terbaru tentang olahraga sepak bola di Indonesia menjadikan sepak bola membutuhkan media penyampai informasi. Telah banyak tercipta berbagai kompetisi
BAB 1 PENDAHULUAN. Komputer adalah kekuatan yang dominan di dalam masyarakat. Penggunaannya terus saja
BAB 1 PENDAHULUAN 1.1 Latar Belakang Komputer adalah kekuatan yang dominan di dalam masyarakat. Penggunaannya terus saja berkembang dari tahun ke tahun yang mulanya hanya sebagai mesin pengolah informasi
BAB III PERANCANGAN. Tabel 3.1 Detil Tabel mpage
BAB III PERANCANGAN Bab ini menjelaskan mengenai perancangan sistem peringkas berita otomatis pada media massa online berbasis GVSM. Perancangan dibagi dalam beberapa bagian antara lain perancangan database,
SISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera.
SISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera Oleh : Benisius Sejumlah penelitian terhadap mesin pencari (search engine)
Panduan Pengelolaan Web Berbasis WordPress IICACS
Panduan Pengelolaan Web Berbasis WordPress IICACS 1 Fransisca Pramesti, S.Si, M.Eng. UPT. Teknologi Informasi dan Komunikasi Institut Seni Indonesia Surakarta A. Web Berbasis WordPress Web dibangun menggunakan
SISTEM INFORMASI PERPUSTAKAAN MENUJU ERA PERPUSTAKAAN DIGITAL
SISTEM INFORMASI PERPUSTAKAAN MENUJU ERA PERPUSTAKAAN DIGITAL sekti dot com information technology consulting Laboratorium Komputer dan Informatika Jurusan Teknik Elektro Fakultas Teknik UNDIP Telpon (024)
