Klasifikasi Teks Menggunakan k-nn Contoh Soal

dokumen-dokumen yang mirip
Klasifikasi Teks Menggunakan k-nn sebuah contoh

Cosine Similarity (Tf-idf) Denny Setyo R ( ) STBI Kelas C

Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB II TINJAUAN PUSTAKA

PENGUKUR SEMANTIC SIMILARITY PADA ARTIKEL WEB DALAM UPAYA PENCEGAHAN PLAGIARISME

TERANCAMNYA KONVENSI DEMOKRAT: DARI HERO KE ZERO-KAH NASIB DEMOKRAT? Lingkaran Survei Indonesia November 2013

BEREBUT DUKUNGAN DI 5 KANTONG SUARA TERBESAR. Lingkaran Survei Indonesia Mei 2014

BAB V KESIMPULAN DAN SARAN

BAB II LANDASDAN TEORI

BAB VI PENUTUP. sebelumnya, dapat disimpulkan bahwa : Faktor Kemenangan koalisi Suharsono-Halim dalam

BAB V PENUTUP. masyarakat yang diberikan pada kandidat-kandidat partai politik.

BAB I PENDAHULUAN 1.1. Latar Belakang

DI BALIK POLITIK PENCITRAAN. Oleh. Yoseph Andreas Gual

BAB I PENDAHULUAN. secara langsung sejak sistem otonomi daerah diterapkan. Perubahan mekanisme

PASKA MUNASLUB: Golkar Perlu Branding Baru? LSI DENNY JA Analis Survei Nasional, Mei 2016

BAB III METODE PENELITIAN. penelitian dikarenakan dari 4 Kabupaten/Kota di DIY. yang memiliki basis masa tidak sebanyak partai pesaingnya.

Head to Head Jokowi-JK Versus Prabowo Hatta Dan Kampanye Negatif. Mei 2014

BAB I PENDAHULUAN. dimana adanya pemberian kebebasan seluas-luasnya. untuk berpendapat dan membuat kelompok. Pesatnya

BAB I PENDAHULUAN. rakyat indonesia yang berdasarkan pancasila dan undang undang dasar negara

3 Sukses LSI di Pilpres 2014

Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi

Publik Menilai SBY Sebagai Aktor Utama Kemunduran Demokrasi Jika Pilkada oleh DPRD

PILKADA OLEH DPRD DINILAI PUBLIK SEBAGAI PENGHIANATAN PARTAI

MODEL C 1 DPR UKURAN PLANO

SISTEM TEMU KEMBALI INFORMASI

2014 : PEMERINTAHAN GOLKAR ATAU PEMERINTAHAN PDIP? Lingkaran Survei Indonesia Februari 2014

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

Pilpres Siapa yang Menang? Bisakah ada dua pemenang di Pilpres? Tidak mungkin. Pemenang Pilpres hanya satu, kalau bukan Prabowo- Hatta ya Jokowi- JK.

PUBLIK MAKIN KHAWATIR DENGAN KINERJA KABINET DI TAHUN POLITIK

PENGENALAN PUBLIK TENTANG PARTAI POLITIK: BAGAIMANA KUALITAS PILEG 2014?

2. Usia Responden : tahun tahun tahun ke atas

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

BAB I PENDAHULUAN. praktek politik masa lalu yang kotor. Terlepas dari trauma masa lalu itu, praktek

KAMPANYE NEGATIF DAN PREDIKSI HASIL PILEG Lingkaran Survei Indonesia April 2014

DAFTAR ISI. Halaman Daftar isi... i Daftar Tabel... iv Daftar Gambar... v

STRATEGI PEMENANGAN PASANGAN CALON BUPATI DAN WAKIL BUPATI CAMPURAN PURI DAN NONPURI DI GIANYAR

BAB I PENDAHULUAN. pemerintahan yang digunakan dalam suatu negara. Indonesia adalah salah satu

SISTEM PENILAIAN ESAI OTOMATIS PADA E-LEARNING DENGAN METODE COSINE SIMILARITY

Headline Berita Hari Ini Periode: 30/05/2014 Tanggal terbit: 30/05/2014

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

Blunder Politik Demokrat???? Kasus Nazaruddin dan Perubahan Dukungan Partai. Analisis Survei Nasional Lingkaran Survei Indonesia (LSI) Juni 2011

BAB 3 METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Dunia perpolitikan di Indonesia mengalami perkembangan pesat bila ditinjau dari segi

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

PT. Universal Broker Indonesia 1 MARKET OUTLOOK MEI: PILPRES. Oleh: Satrio Utomo PT. Universal Broker Indonesia. 26 April 2014

BAB I PENDAHULUAN. langsung oleh rakyat. Pemilihan umum adalah proses. partisipasi masyarakat sebanyak-banyaknya dan dilaksanakan

II. TINJAUAN PUSTAKA DAN KERANGKA PEMIKIRAN

BAB III METODOLOGI PENELITIAN

I. PENDAHULUAN. memilih sebuah partai politik karena dianggap sebagai representasi dari agama

ROCCHIO CLASSIFICATION

Klasifikafi Dokumen Temu Kembali Informasi dengan K-Nearest Neghbour. Information Retrieval Document Classified with K-Nearest Neighbor

Implementasi Metode K-Nearest Neighbor dengan Decision Rule untuk Klasifikasi Subtopik Berita

BAB I PENGANTAR. keterlibatan masyarakat dalam berpartisipasi aktif untuk menentukan jalannya

Mayoritas Publik Ingin DPR Tandingan Segara Bubarkan Diri. LSI DENNY JA November 2014

BAB I PENDAHULUAN. Latar Belakang Penulisan

BAB I PENDAHULUAN. Pada Juni 2005, rakyat Indonesia melakukan sebuah proses politik yang

BAB 3 LANDASAN TEORI

IMPLEMENTASI METODE K-NEAREST NEIGHBOUR DENGAN PEMBOBOTAN TF.IDF.ICF UNTUK KATEGORISASI IDE KREATIF PADA PERUSAHAAN

I. PENDAHULUAN. melalui lembaga legislatif atau Dewan Perwakilan Rakyat Daerah (DPRD).

BAB 5 SIMPULAN DAN SARAN. Dalam bab ini disarikan kesimpulan penelitian Analisis Wacana Kritis

BAB I PENDAHULUAN. konsep suci penyelenggaran Negara telah membawa perubahan bagi

BAB I PENDAHULUAN. wakil presiden dipilih oleh MPR dan anggota-anggotanya dipilih melalui

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

DAFTAR ISI. ABSTRAK... i KATA PENGANTAR... ii UCAPAN TERIMAKASIH... iv DAFTAR ISI... v DAFTAR TABEL... vii DAFTAR GAMBAR... viii DAFTAR GRAFIK...

BAB I PENDAHULUAN. daerah (pemilukada) diatur dalam Undang-Undang Nomor 15 Tahun 2011 tentang

Penerapan Algoritma Cosine Similarity dan Pembobotan TF-IDF pada Sistem Klasifikasi Dokumen Skripsi

BAB 7 PENUTUP. dalam studi ini berikut argumentasinya. Saya juga akan membingkai temuantemuan

INDEKS CAPRES PEMILU 2014 : CAPRES RIIL VERSUS CAPRES WACANA. Lingkaran Survei Indonesia Oktober 2013

BAB I PENDAHULUAN. 1.1 Latar Belakang. Pemilihan Umum (Pemilu) adalah salah satu cara dalam sistem

BAB II TINJAUAN PUSTAKA

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

PENGUNAAN METODE COSINESIMILARITY PADA SISTEM PENGELOMPOKAN KERJA PRAKTEK, TUGAS AKHIR DAN SKRIPSI

KRISIS CAPRES DAN CAWAPRES PARTAI ISLAM : SIAPAKAH PASANGAN CAPRES- CAWAPRES TERKUAT PEMILU 2014? Lingkaran Survei Indonesia Maret 2013

BAB I PENDAHULUAN. dan DPRD sebagai penyalur aspirasi politik rakyat serta anggota DPD. sebagai penyalur aspirasi keanekaragaman daerah sebagaimana

MUNAS GOLKAR DI MATA PUBLIK. LSI DENNY JA Desember 2014

BAB I PENDAHULUAN. Presiden dan kepala daerah Pilihan Rakyat. Pilihan ini diambil sebagai. menunjukkan eksistensi sebagai individu yang merdeka.

BAB II LANDASAN TEORI

BAB 3 ANALISA DAN PERANCANGAN

BAB I PENDAHULUAN. Pemilihan Kepala Daerah secara langsung merupakan sarana pelaksanaan

BAB IV KESIMPULAN DAN SARAN. Pemilihan kepala daerah secara langsung merupakan bagaian dari impact dari

3 METODE. Implementasi Document Index Graph. Penetapan nilai jarak intercluster. Penetapan nilai jarak intracluster. Stemming Penetapan jumlah dokumen

KOMISI PEMILIHAN UMUM

BAB 4 IMPLEMENTASI DAN EVALUASI

ISU KOALISI PARTAI DI MEDIA INDONESIA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Pemilihan presiden merupakan momen penting bagi setiap negara, salah satunya

Lima Rapor Merah Satu Rapor Biru

BAB I PENDAHULUAN. Sejak reformasi, masyarakat berubah menjadi relatif demokratis. Mereka

BAB I PENDAHULUAN. penentuan strategi komunikasi, jika tidak ada strategi komunikasi yang baik efek

JK: Tradisi Golkar di Pemerintahan

BAB I PENDAHULUAN. ini didukung dengan berdirinya bermacam-macam partai politik. Diawali

MAYORITAS PUBLIK INGIN CAPRES SIAP TERIMA KEKALAHAN. Konpers LSI Juli 2014

BAB VII PENUTUP. pendeskripsian, uji Chi-square dan uji koefisien kontingensi maka peneliti dapat

BAB I PENDAHULUAN. politiknya bekerja secara efektif. Prabowo Effect atau ketokohan mantan

KOMISI PEMILIHAN UMUM KABUPATEN TANAH LAUT KEPUTUSAN KOMISI PEMILIHAN UMUM KABUPATEN TANAH LAUT. Nomor 11/Kpts/ /III/2014

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN

Sistem Deteksi Plagiarisme Dokumen Bahasa Indonesia Menggunakan Metode Vector Space Model

BAB I PENDAHULUAN. 1.1 Latar Belakang. Dalam kehidupan bernegara, politik merupakan kegiatan yang dekat

BAB III METODOLOGI PENELITIAN

BAB 1 PENDAHULUAN. Universitas Pendidikan Indonesia repository.upi.edu perpustakaan.upi.edu

Transkripsi:

Klasifikasi Teks Menggunakan k-nn Contoh Soal Diketahui terdapat 8 dokumen ( D1 s.d D8 ) sebagai berikut : D1. Tokoh politik dari berbagai partai mengadakan rapat untuk membahas koalisi baru menjelang pemilu 2014 dan beberapa pilkada 2012 dan 2013. D2. Partai politik sudah tidak dapat dipercaya. Sebagian besar partai mengutamakan kepentingan partai daripada kebutuhan rakyat D3. Partai demokrat memenangkan pemilu 2009 karena figur SBY. Partai Golkar berusaha menang pada 2012. Pertandingan 2 partai ini akan seru. D4. Pertandingan pertama antara Persema dan Persebaya diadakan di Malang. Ini akan menguntungkan tuan rumah D5. Sebagian besar wasit di Indonesia sulit dipercaya. Beberapa pertandingan sepakbola sering tidak adil. Tim nasional perlu pembenahan Total. D6. Suap menyuap sudah lazim di negeri Ini. Pemilu ada suap. Pilkada juga suap. Mungkin pula saat Pilpres. D7. Beberapa pertandingan sepakbola yang dilakoni persebaya pada masa kampanye Pilkada 2010 Kota surabaya akan ditunda. D8. Sepakbola Indonesia memang belum bangkit. Manajemen tim, pertandingan dan tiket perlu ditingkatkan, bukan hanya fokus pada kemenangan tim. Jika dokumen-dokumen teks tersebut dikelompokkan ( classification ) ke dalam dua kelas, C1 ( Politik ) dan C2 ( Olahraga ), menggunakan kecerdasan manusia, misalnya tiap kelas hanya boleh beranggotakan 3 dokumen, maka kita dapat memperoleh hasil sebagai berikut: C1 akan beranggotakan D1, D2 dan D3 C2 akan beranggotakan D4, D7 dan D8 Pada k-nn, fase ini dinamakan fase manual atau training. Kita memilih beberapa dokumen contoh ( sample ) dan mengelompokkannya secara manual ke dalam kelas-kelas yang telah didefinisikan.

Pertanyaan. Menggunakan k-nn, tentukan kelas dari dokumen D6? ( Penentuan Kelas dari D5 telah dibahas pada contoh sebelumnya ) Langkah 1. Preprocessing terhadap semua (terdapat 7) dokumen yang terlibat, yaitu D6, D1, D2, D3, D4, D7 dan D8.2 Langkah 1a : Lakukan tokenisasi, stop words removal dan stemming. Hasilnya diperlihatkan pada tabel berikut : Dokumen D6 Term yang mewakili dokumen suap suap lazim negeri pemilu suap pilkada suap pilpres D1 tokoh politik partai rapat bahas koalisi baru jelang pemilu 2014 pilkada 2012 2013 D2 D3 D4 D7 D8 partai politik percaya besar partai utama penting partai butuh rakyat partai demokrat menang pemilu 2009 figur sby partai golkar usaha menang 2012 tanding partai seru tanding pertama persema persebaya malang untung rumah tanding sepakbola persebaya kampanye pilkada 2010 kota surabaya tunda sepakbola indonesia bangkit manajemen tim tanding tiket tingkat fokus menang tim Langkah 1b. Tentukan bobot untuk setiap term dari 7 dokumen yang terlibat. Total dokumen ada 8. Dokumen yang telah terklasifikasi ada 6 dan yang akan diklasifikasikan (D6) sehingga total yang terlibat adalah 7. Dokuman D5 tidak dilibatkan, karena telah terklasifikasi pada pembahasan Contoh 1.

Langkah 2 : Hitung kemiripan vektor dokumen D6 dengan setiap dokumen yang telah terklasifikasi ( D1, D2, D3, D4, D7 dan D8 ). Kemiripan antar dokumen dapat menggunakan cosine similarity.

Langkah 2a : Hitung hasil perkalian skalar antara D6 dan 6 dokumen yang telah terklasifikasi. Hasilnya perkalian dari setiap dokumen dengan D6 dijumlahkan. Rumusnya adalah sebagai berikut : Langkah 2b : Hitung panjang setiap dokumen, termasuk D6. Caranya, kuadratkan bobot setiap term dalam setiap dokumen, jumlahkan nilai kuadrat tersebut dan kemudian akarkan.sisi kiri dari tabel berikut ini mewakili langkah 2a dan sisi kanan memperlihatkan langkah 2b.

Langkah 2c : Terapkan rumus cosine similarity. Hitung kemiripan D6 dengan D1, D2 dan seterusnya sampai dengan D8. Hasil perhitungan tersebut diperlihatkan tabel berikut: Langkah 3 : Ambil sebanyak k ( k = 4 ) yang paling tinggi tingkat kemiripannya dengan D6 dan tentukan kelas dari D6. Hasilnya : C1 akan beranggotakan D1, D2 dan D3 ( Politik ) C2 akan beranggotakan D4, D7 dan D8 ( Olahraga ) Dokumen D6 terklasifikasi ke dalam kelas? Pilih kelas yang paling banyak kemunculannya! Apakah C1? Atau C2? Ternyata, untuk k = 4, C1 diwakili oleh D1 D2 dan D3, sedangkan C2 hanya diwalikili oleh D7. Kemanakah D6 berlabuh? D6 terklasifikasi ke kelas C1 ( Politik ).