dimana δ C, C adalah jarak anggota tiap klaster dan adalah jarak antar pusat klaster. TEKNIK VISUALISASI

Ukuran: px
Mulai penontonan dengan halaman:

Download "dimana δ C, C adalah jarak anggota tiap klaster dan adalah jarak antar pusat klaster. TEKNIK VISUALISASI"

Transkripsi

1 Visualisasi Data Teks Twitter Berbasis Bahasa Indonesia Menggunakan Teknik Pengklasteran Heru Susanto 1, Dr. Surya Sumpeno, ST., M.Sc. 2, Reza Fuad Rachmadi, ST., MT. 2 1 Mahasiswa S1 Teknik Elektro Institut Teknologi Sepuluh Nopember 2 Staf Pengajar, Teknik Elektro Institut Teknologi Sepuluh Nopember Jurusan Teknik Elektro Fakultas Teknologi Industri Institut Teknologi Sepuluh Nopember Kampus ITS Sukolilo, Surabaya 60111, Indonesia ABSTRAK : Kebutuhan pengelompokan sentimen didorong oleh suatu pemikiran bahwa informasi berupa sentimen dari suatu data merupakan hal yang penting dan dibutuhkan. Pengklasteran terhadap data sentimen ini akan memberikan gambaran tentang pola komunikasi di masyarakat. Seringkali hasil pengolahan data tersebut masih belum mampu ditafsirkan oleh pengguna karena model visualisasi yang kurang komunikatif. Visualisasi ini merupakan hal yang penting untuk pengambilan keputusan selanjutnya, karena di dalamnya dapat dilihat pola data yang sedang diteliti apakah berkecenderungan positif atau negatif. Perkembangan jejaring sosial Twitter dapat memberikan informasi mengenai sentimen ini. Penelitian ini menggunakan topik isu Pemilu 2014 sebanyak tweet. Algoritma pengklasteran yang digunakan adalah K-Means, Cascade K-Means dan Self-Organizing Map Kohonen. Hasil yang didapat menunjukkan bahwa Cascade K-Means mampu menghasilkan nilai konvergensi kelompok terkecil SSE sebesar 7073 dan Dunn Index 0,67 dengan distribusi sentimen positif berjumlah tweet, negatif berjumlah 7912 tweet, dan netral berjumlah tweet. Visualisasi menggunakan grafik dua dimensi dengan evaluator Analisa Komponen Utama (PCA) pada variabel korelasi input 0,95. Kata kunci : Visualisasi, Twitter, Pengklasteran, K-Means, Cascade K-Means, Self-Organizing Map Kohonen. I. PENDAHULUAN Media jejaring sosial memberikan peran yang sangat besar bagi perkembangan teknologi khususnya pada teknologi komunikasi dan informasi. Salah satu dampak yang paling terlihat adalah manusia menjadi lebih terbuka dalam menyatakan pendapat. Twitter yang merupakan salah satu media jejaring sosial sudah menjadi bagian dari pola komunikasi masyarakat. Media ini dikenal sangat populer terutama pada jumlah pengguna dan posting tweet yang tergolong besar pada setiap harinya. Media jejaring sosial ini erat kaitannya dengan sentimen pengguna. Sentimen tersebut didapat ketika pengguna melakukan tweet. Sentimen berhubungan dengan penilaian terhadap suatu konteks atau wacana. Sentimen positif menyatakan pemberian nilai yang baik pada konteks dalam teks dan sentimen negatif menyatakan kebalikannya. Pengelompokan sentimen diaplikasikan untuk mengelompokkan sentimen positif, negatif dan netral. Pola data tweet yang besar tersebut memiliki kecenderungan sifat yang berbeda-beda. Untuk melihat pola data yang ada maka harus digunakan teknik visualisasi. Secara visual, pengguna akan mendapatkan kemudahan untuk melihat kecenderungan data berkorelasi positif atau negatif serta informasi pada setiap kategori tersebut sehingga mempercepat dan mempermudah tugas organisasi untuk memantau dan mengevaluasi kinerjanya. Visualisasi data tweet tersebut tidak hanya berdasarkan pola kemiripan data semata, namun yang tidak kalah penting adalah mengenai pola sentimen regional. Sentimen regional dimaksud adalah sentimen-sentimen pengguna yang dikelompokkan berdasarkan lokasi tempat tweet tersebut dikirim. Lokasi ini menggambarkan sentimen kewilayahan terhadap isu-isu tertentu tersebut. Pada penelitian ini, penulis mengambil studi kasus pada situs jejaring sosial Twitter dengan topik sentimen Pemilu Tweet dapat berisi sentimen maupun kalimat berita biasa. Data tweet ini kemudian akan divisualisasikan berdasarkan pola sentimen dan lokasinya sehingga akan terlihat pola data sesungguhnya secara cepat dan tepat menggunakan teknik pengelompokan data. II. DESAIN SISTEM Alur visualisasi data twitter dalam Tugas akhir ini secara umum ditunjukkan pada Gambar 1 di bawah ini : Pengumpulan Data Tweet Pra Pemrosesan Data Tweet Pengklasteran Data Tweet Visualisasi Data Tweet Gambar 1 Gambaran Umum Sistem Dari Gambar 1 diatas, terlihat bahwa sistem dibagi menjadi 4 (empat) tahap besar yaitu; tahap pengumpulan data tweet, tahap pra perosesan data tweet, tahap pengklasteran data tweet dan tahap visualisasi data tweet. Keseluruhan dari tahap tersebut dibangun dengan menggunakan dibuat dengan menggunakan bahasa pemrograman Java pada platform Java Development Kit dan IDE Netbeans 6.7. Sistem pengumpulan data tweet pada Tugas Akhir ini menganut sistem scrapping dengan menggunakan web scrapper yaitu scrapperwiki.com. Prosesnya didahului dengan registrasi pengguna lalu dapat diperoleh fasilitas mencari dan menyimpan data tweet tersebut sesuai dengan kata kunci yang dimasukkan. Dengan menggunakan web scrapper, data tweet akan secara otomatis tersimpan pada server web tersebut dari waktu ke waktu sampai pengguna mengakses dan mengunduhnya. Dari sisi pengguna, berikut

2 blok diagram pada Gambar 2 tentang penggunaan scrapperwiki.com dalam mengumpulkan data tweet : Gambar 2 Sistem Pengumpulan Data Tweet Secara umum, tahap pra pemrosesan data tweet tampak pada Gambar 3 (a) dan proses pengklasteran data tweet pada Gambar 3 (b) dapat dilihat pada diagram alir di bawah ini : berkaitan dengan isu yang dibahas dalam Tugas Akhir ini yakni Pemilu Data hashtag paling sering muncul, merupakan data hashtag atau kata kunci dari tweet yang didahului karakter tanda pagar (#) atau hash yang paling sering digunakan para pengguna twitter dalam posting mereka. 3. Data volume tweet, merupakan data jumlah tweet yang dihitung dalam kurun waktu bulanan berdasarkan data kolom created_at. 4. Data pengguna paling sering di-mention, merupakan data pengguna yang dalam posting tweet-nya mencantumkan nama pengguna lain sebagai bentuk mention agar orang atau user yang di-mention tersebut tahu dan membacanya. Para pengguna yang di-mention oleh pengguna lain ini ditampilkan dalam format grafik. (a) (b) (a) (b) Gambar 3 Diagram Alir Sistem Pra Pemrosesan dan Pengklasteran Data Tweet Sistem visualisasi dibagi menjadi dua macam yaitu visualisasi data tweet asli dan visualisasi data tweet hasil pengklasteran. Berikut blok diagram beserta penjelasan masing-masing tipe visualisasi yang digunakan : Gambar 4 Blok Diagram Visualisasi Data Tweet Asli Dari Gambar 4 di atas, visualisasi tipe pertama adalah visualisasi dengan menggunakan data tweet asli. Data tweet asli yang dimaksud adalah data asli hasil pengunduhan langsung dari scraperwiki.com. Berikut penjelasan masingmasing data yang digunakan : 1. Data pengguna paling aktif, merupakan data pengguna twitter yang paling banyak melakukan post tweet (c) Gambar 5 Desain Antarmuka Visualisasi Data Hasil Pengklasteran Dari Gambar 5 di atas, visualisasi tipe kedua adalah visualisasi dengan menggunakan data hasil pengklasteran. Secara umum, visualisasi jenis ini dibagi dalam tiga sesi yaitu sesi scatter diagram, sesi peta geografi dan sesi evaluasi klaster. Pada sesi scatter diagram berdasarkan Gambar 5 (a), data hasil klaster yang terdiri dari ratusan fitur menyebabkan dimensi data menjadi sangat tinggi. Dimensi data yang tinggi tersebut harus direduksi menggunakan fungsi seleksi atribut dengan evaluator Analisa Komponen Utama. Analisa ini akan menghasilkan pemeringkatan atribut-atribut utama yang akan diambil. Pada sesi peta geografi berdasarkan Gambar 5 (c), setiap data tweet yang memiliki nilai untuk kolom lat dan lng dapat dilakukan plotting pada peta. Tidak semua tweet memiliki data lat dan lng tersebut karena data ini biasanya akan dikirim ketika pengguna melakukan posting tweet dari sebuah mobile gadget seperti handphone atau smartphone. Dari sesi scatter diagram dan peta geografi, nilai klaster akan direpresentasikan melalui sebuah word cloud berdasarkan Gambar 5 (b). Word cloud merupakan kumpulan kata yang merepersentasikan atau mewakili makna dari klaster. Teknik ini sudah juga sering digunakan dalam melakukan tweet statistic.

3 III. TEKNIK PENGKLASTERAN A. Algoritma K-Means K-Means merupakan salah satu metode pengelompokan data nonhierarki yang berusaha mempartisi data yang ada ke dalam bentuk dua atau lebih kelompok. Tujuan pengelompokan data ini adalah meminimalkan fungsi objektif yang diset dalam proses pengelompokan, yang pada umumnya berusaha meminimalkan variasi di dalam suatu kelompok dan memaksimalkan variasi antarkelompok [2]. Berikut merupakan algoritma dari k-means : 1. Menentukan jumlah klaster k 2. Menentukan titik pusat klaster (centroid) secara acak. 3. Menemukan centroid terdekat setiap dataset dengan menghitung jarak setiap data pada masing-masing centroid. Persamaannya adalah: D(x 1,x 2 ) = x 2 -x 1 2 = x x (1) 4. Hitung kembali objek pada pusat klaster dengan anggota klaster yang baru. 5. Ulangi lagi sampai menemukan pusat klaster yang tidak berubah. B. Algoritma Cascade K-Means Algoritma Cascade K-Means pada dasarnya tidak berbeda dengan algoritma K-Means sebelumnya. Nilai K akan diperoleh melalui hasil perulangan algoritma K-Means pada data sehingga akan dicari variasi kelompok K terbaik menggunakan sistem skor Calinski-Harabasz dengan persamaan sebagai berikut : CH = () () (2) Keterangan dari persamaan 2 adalah : k : nomor kluster N : angka Observasi m i : centroid dari cluster i x : data poin c i : cluster ke-i C. Algoritma Self-Organizing Map Kohonen Self-Organizing Map (SOM) merupakan perluasan dari jaringan kompetitif yang sering disebut sebagai jaringan Kohonen. Adapun prosedur yang ditempuh dalam melakukan clustering dengan SOM adalah sebagai berikut [2] : 1. Tentukan weight dari input data secara random. 2. Pilih salah satu input data. 3. Hitung tingkat kesamaan (dengan Eucledian) antara input data dan weight dari input data tersebut, dan pilih input data yang memiliki kesamaan dengan weight yang ada. 4. Perbaharui weight dari input data dengan mendekatkan weight tersebut ke BMU dengan rumus: Wv(t+1) = Wv(t) + Theta(v, t) x Alpha(t) x (D(t) Wv(t)) (3) Dimana : Wv(t) : Weight pada saat ke-t Theta (v, t) : Fungsi neighbourhood yang tergantung pada Lattice distance antara BMU dengan neuron v. Umumnya bernilai 1 untuk neuron yang cukup dekat dengan BMU, dan 0 untuk yang sebaliknya. Penggunaan fungsi Gaussian juga memungkinkan. Alpha (t) : Learning Coefficient yang berkurang secara monotonic D(t) : Input data 5. Tambah nilai t, sampai t < Lambda, dimana Lambda adalah jumlah iterasi. Kinerja pada setiap cluster diukur dengan menghitung SSE (Sum Squared Error). Error merupakan jarak tiap titik diukur ke cluster yang terdekat. Semakin kecil SSE menunjukkan instance lebih seragam pada klaster yang dikelompokan. Nilai SSE dapat dirumuskan sebagai berikut ini [8] : SSE = dist (m, x) (4) Nilai dist diperoleh dengan menghitung rata jarak anggota atribut cluster ke pusat cluster. Selain SSE, evaluasi kualitas klaster juga diukur menggunakan Dunn Index (DI). Prinsip kerja metode ini adalah dengan mengukur perbandingan kerapatan data interklaster (diameter) dan jarak antarklaster data., DI = min min, (5) dimana δc, C adalah jarak anggota tiap klaster dan adalah jarak antar pusat klaster. IV. TEKNIK VISUALISASI Gambar 6 Proses Reduksi Dimensi Data [10] Dari Gambar 6 di atas, data set dapat memiliki sejumlah besar fitur. Pada sekumpulan dokumen yang setiap dokumennya direpresentasikan oleh sebuah vektor memiliki komponen berupa frekuensi kata yang muncul dalam dokumen. Dalam kasus demikian, terdapat ribuan atau bahkan puluhan ribu atribut (komponen). Analisa Komponen Utama atau Principal Component Analysis (PCA) adalah teknik yang digunakan untuk menyederhanakan suatu data, dengan cara mentransformasi linier sehingga terbentuk sistem koordinat baru dengan variansi maksimum. PCA dapat digunakan untuk mereduksi dimensi suatu data tanpa mengurangi karakteristik data tersebut secara signifikan. Diberikan dataset matrik X berukuran (n X) yang terdiri dari n observasi x (i {1,2,, n}) dengan D dimensi. Algoritma dari analisis komponen utama adalah sebagai berikut [12] : 1. Hitung vektor rata-rata x (j {1,2,, n}) dengan x = (6) 2. Hitung matriks kovariansi C atau cov(x) dengan C = covx, x = ( )( ) (7) 3. Hitung nilai eigen λ dan vektor eigen V yang memenuhi persamaan: C λi = 0 (8) (C λi)v = 0 (9) 4. Vektor eigen yang didapatkan merupakan komponen utama untuk membentuk variabel baru. Variabel-variabel baru merupakan perkalian antara vektor eigen V dengan

4 matriks X a, yaitu matriks X yang telah dinormalisasi (adjusted) yang dihitung dengan rumus : x = ( ) (10) 5. Sedangkan variansi yang dapat dijelaskan oleh variabel baru ke-i tergantung persentase kontribusi p i dari masingmasing nilai eigen, yang dihitung dengan rumus : p = x100% (11) Sedangkan penentuan jumlah variabel baru yang digunakan tergantung persentase kontribusi kumulatif dari kumulatif nilai eigen yang telah diurutkan dari nilai yang terbesar. Nilai persentase kontribusi kumulatif sampai komponen ke r dihitung dengan rumus : pk = x100% dengan λ > λ > λ > λ (12) membaca tweet bersangkutan. Pada panel tersebut ditampilkan 5 (lima) nama pengguna yang paling sering dimention @suaramerdeka (1%) (1%). Panel antarmuka keempat menunjukkan jumlah data tweet yang diunduh berdasarkan satuan waktu bulan. Pada penelitian ini, penulis melakukan pengunduhan data tweet pada bulan Juli 2013 sampai Oktober 2013 pada situs scraperwiki.com menggunakan kata kunci Pemilu 2014, dan data dengan ukuran tweet. Untuk bulan Juli sejumlah tweet, bulan Agustus tweet, bulan September tweet dan bulan Oktober tweet. B. Hasil Visualisasi Pengklasteran Data Tweet V. PENGUJIAN DAN ANALISA A. Hasil Visualisasi Data Tweet Asli Gambar 8 Hasil Visualisasi Data dengan K-Means Gambar 7 Antarmuka Visualisasi Data Tweet Asli Pada Gambar 7 di atas terdapat 4 buah grafik visualisasi hasil pembacaan data tweet asli yaitu data pengguna paling aktif, data hashtag paling sering muncul, data volume tweet dan data pengguna paling sering di-mention. Panel antarmuka pertama menunjukkan pengguna dengan adalah pengguna yang paling aktif melakukan tweet tentang pemilu 2014 yakni sebanyak 5238 tweet. Disusul oleh sebanyak 3711 tweet sebanyak 1126 tweet sebanyak 842 tweet. Data pada panel ini ditampilkan sebanyak 10 nama pengguna yang paling aktif. Panel antarmuka kedua menunjukkan data hashtag atau topik yang sering muncul dalam tweet pengguna. Hashtag dengan nama #Pemilu2014 menempati jumlah tertinggi yakni 1250 tweet. Disusul oleh #Pemilu sebanyak 569 tweet dan #politik berjumlah 379 tweet. Untuk #Tuit sebanyak 249 tweet dan #SEBHEUPDATE sebanyak 197 tweet. Pada panel ini ditampilkan 5 hashtag teratas dengan ukuran huruf menggambarkan dominasi atau jumlah sebenarnya. Panel antarmuka ketiga menunjukkan persentase data pengguna paling sering di-mention. Dalam suatu tweet dimungkinkan pengguna dapat melakukan mention agar pengguna yang di-mention tersebut mengetahui dan Gambar 9 Hasil Visualisasi dengan Cascade K-Means Gambar 10 Hasil Visualisasi Data dengan SOM Kohonen Sistem pengklasteran data pada data uji coba sebanyak tweet dilakukan dengan menggunakan algoritma K- Means (gambar 8), Cascade K-Means (gambar 9) dan Self-

5 Organizing Map (SOM) Kohonen (gambar 10). Data uji coba tersebut sebelumnya telah dilakukan pra pemrosesan yang meliputi proses case folding, filtering, pembakuan kata (KBBI), stopword removal dan stemming. Percobaan diawali dengan menghitung vektor kata pada setiap kalimat tweet menggunakan metode pembobotan TF-IDF. Hasilnya kemudian digunakan sebagai data masukan proses pengklasteran. Tabel 1 Hasil perbandingan cluster Tweet dengan variasi algoritma pengelompokan Algoritma K-Means Cascade K-Means SOM Kohonen Full Data (100%) (100%) (100%) Data Hasil Pra Pemrosesan 0 ( ) 1 ( ) 2 () 3 () 4 ( ) 271 (0,47%) (45,96%) (41,34%) (59,30%) 7912 (13,81%) 7907 (13,80%) (40,23) (40,23%) 2520 (0,23%) (4,40%) (40,23%) C. Hasil Visualisasi Pengklasteran Data Tweet Pada Peta Gambar 11 Hasil Visualisasi Pada Peta dengan Algoritma K-Means Tabel 2 Hasil perbandingan evaluasi hasil klaster Evaluasi Klaster Algoritma SSE Dunn Index (Sum of Squared Error) K-Means ,16 Cascade K-Means ,67 SOM Kohonen ,46 Berdasarkan Tabel 1 dan Tabel 2 di atas, dapat diketahui bahwa pada percobaan menggunakan Algoritma Cascade K- Means didapat nilai SSE terkecil yakni 7073 dengan rincian cluster 0 sebesar tweet, cluster 1 sebesar 7912 tweet dan cluster 2 sebesar tweet. Variasi percobaan dengan menggunakan algoritma SOM dengan learning rate 0.02 ternyata dihasilkan 5 buah cluster meski hasil SSE-nya tidak menunjukkan kualitas cluster yang relatif baik yakni 9843 jika dibandingkan dengan algoritma Cascade K-Means. Hasil evaluasi kualitas klaster yang sama juga ditunjukkan melalui pengukuran internal Dunn Index pada Tabel 2 Percobaan menghasilkan nilai tertinggi yakni 0,67 pada variasi algoritma Cascade K-Means. Hal ini menunjukkan kualitas terbaik diantara dua variasi algoritma lainnya. Tabel 3 Hasil perbandingan jenis sentimen cluster Tweet dengan variasi algoritma pengelompokan Sentimen Algoritma K-Means Positif Positif Netral - - Cascade K-Means SOM Kohonen Positif Negatif Netral - - Positif Positif Negatif Negatif Netral Penafsiran analisa sentimen pada Tabel 3 di atas adalah hasil dari visualisasi word cloud sebagai vektor kata pembentuk cluster. Penafsiran positif berarti kata-kata yang muncul pada word cloud berkategori positif, dan sebaliknya. Pada sentimen netral, kata-kata yang membentuk cluster tidak dijumpai fitur sentimen yang telah ditentukan. Gambar 12 Hasil Visualisasi Pada Peta dengan Algoritma Cascade K-Means Gambar 13 Hasil Visualisasi Pada Peta dengan Algoritma SOM Dari total seluruh data tersebut, sebanyak 384 tweet memiliki nilai lat dan lng. Gambar 11, 12 dan 13 merupakan hasil visualisasi pada peta terhadap hasil pengklasteran dengan pola warna titik seperti pada Tabel 4 menggunakan algoritma K-Means, Cascade K-Means dan SOM Kohonen. Tabel 4 Hasil perbandingan jumlah Tweet pada Peta untuk Setiap cluster dengan variasi algoritma pengelompokan Jumlah Tweet pada Peta Algoritma ( ) ( ) ( ) ( ) ( ) K-Means Cascade K- Means SOM Kohonen

6 Berdasarkan wilayah tweet di-posting, analisa sentimen dapat dilakukan pada setiap bagian daerah. Analisa sentimen ini untuk mengetahui isu kewilayahan terkait topik yang diteliti yaitu Pemilu Gambar 14 Visualisasi Data Tweet Wilayah Kota Jakarta Pada Gambar 14 di atas, panel visualisasi menunjukkan sentimen wilayah kota Jakarta pada 142 tweet dengan pilihan kata fitur utama yang bermuatan positif pada kata pilih, ok dan cinta dengan total persentase kemunculan sebesar 79%. Berikut Tabel 5 yang menunjukkan data teknis fitur kata wilayah kota Jakarta. Tabel 5 Fitur Kata Sentimen Wilayah Kota Jakarta No Fitur Kata Bobot Kemunculan ( % ) 1. pilih ok cinta buka sesuai cocok dukun bingung dukung salam Berdasarkan analisa sentimen daerah terhadap isu nasional Pemilu 2014, berikut hasil rekap data tweet pada beberapa wilayah di Indonesia dalam Tabel 6. Tabel 6 Rekap Analisa Sentimen Berdasarkan Wilayah No. Kota Jumlah Tweet Sentimen 1. Jakarta 142 Positif 2. Bandung 109 Positif 3. Semarang 6 Negatif 4. Yogyakarta 45 Positif 5. Surabaya 12 Positif 6. Denpasar 10 Negatif VI. KESIMPULAN Berdasarkan aplikasi yang telah dibuat dan hasil uji coba yang telah dilakukan, maka dapat ditarik beberapa kesimpulan sebagai berikut: 1. Cascade K-Means menghasilkan nilai SSE terkecil yaitu 7073 dan nilai Dunn Index tertinggi yaitu 0,67 sehingga algoritma ini menghasilkan cluster terbaik dengan perolehan sentimen positif berjumlah 26332, negatif berjumlah 7912, dan netral berjumlah SOM menghasilkan nilai SSE 9843 yang terbilang masih lebih tinggi daripada Cascade K-Means, hal yang sama juga ditunjukkan pada pengukuran Dunn Index yang menunjukkan nilai 0,46 meskipun memiliki jumlah cluster yang lebih banyak yaitu 5 cluster. 3. Hasil visualisasi data tweet terhadap hasil pengklasteran pada 3 variasi algoritma telah berhasil diimplementasikan pada diagram scatter menggunakan konfigurasi evaluator Analisa Komponen Utama dengan variabel korelasi pada parameter input sebesar 0.95 dan penyertaan seluruh attribut dengan nilai -1 pada variabel attributes include. DAFTAR PUSTAKA [1] Sumpeno, Surya, Destuardi Klasifikasi Emosi Untuk Teks Bahasa Indonesia Menggunakan Metode Naive Bayes. Seminar Nasional Pascasarjana ITS. Surabaya. [2] Prasetyo, Eko Data Mining : Konsep dan Aplikasi menggunakan Matlab. Andi : Yogyakarta. [3] Santoso, Budi Text Mining dan Web Mining. Fakultas Teknik Informatika UKDW : Yogyakarta. [4] Santoso, Budi StudiEM : Sebuah Program Mining. Diakses pada tanggal 3 Juni [5] Asian, Jelita Effective Techniques for Indonesian Text Retrieval. PhD thesis School of Computer Science and Information Technology RMIT University Australia. [6] Nurfalah, Adiyasa Analisis Sentimen Pada Opini Berbahasa Indonesia Menggunakan Pendekatan Lexicon-Based. Fakultas Pascasarjana Intitut Teknologi Telkom. Bandung. [7] Mahendra, I Putu Adhi Kerta Penggunaan Algoritma Semut dan Confix Stripping Stemmer Untuk Klasifikasi Dokumen Berita Berbahasa Indonesia. Tugas Akhir. ITS. Surabaya. [8] R.A. Johnson & D.W. Wichern Applied Multivariate Statistical Analysis. Prentice Hall. USA. [9] Salton G., Automatic Text Processing. Cornell University Chapter 9. [10] Midshipman David G Exploring Dimensionality Reduction For Text Mining. United States Naval Academy Annapolis. Maryland. [11] Sri Mulyana, Edi Winarko Teknik Visualisasi Dalam Data Mining. Seminar Nasional Informatika. Yogyakarta. [12] Ronny Susetyoko, Elly Purwantini Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil. Jurnal. PENS. [13] Harianja, Henri Visualisasi K-Means ing Pada Data Potensi Pertanian Desa Di Bogor Menggunakan Mapserver. Skripsi. Institut Pertanian Bogor. [14] Indrawati, Nur Natural Language Processing (NLP) Bahasa Indonesia Sebagai Preprocessing Pada Text Mining. Jurnal Institut Tinggi Teknologi Telkom. Bandung. [15] Adiwijaya, Igg Texi Mining dan Knowledge Discovery. Komunitas Data mining Indonesia & Softcomputing Indonesia.

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT.

HERU SUSANTO Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. HERU SUSANTO 2209 105 030 Dosen Pembimbing : 1. Dr. Surya Sumpeno, ST., M.Sc. 2. Reza Fuad Rachmadi, ST., MT. LATAR BELAKANG Peran media jejaring sosial pada perkembangan teknologi komunikasi dan informasi;

Lebih terperinci

Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil

Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil Ronny Susetyoko, Elly Purwantini Politeknik Elektronika Negeri Surabaya

Lebih terperinci

PERBANDINGAN KINERJA BEBERAPA METODE KLASIFIKASI HASIL REDUKSI DATA BERDIMENSI TINGGI

PERBANDINGAN KINERJA BEBERAPA METODE KLASIFIKASI HASIL REDUKSI DATA BERDIMENSI TINGGI ISSN 1858-4667 JURNAL LINK Vol 16/No. 1/Februari 212 PERBANDINGAN KINERJA BEBERAPA METODE KLASIFIKASI HASIL REDUKSI DATA BERDIMENSI TINGGI Ronny Susetyoko 1, Elly Purwantini 2 1,2 Departemen Teknik Elektro,

Lebih terperinci

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS Muhammad Toha, 1), I Ketut Edy Purnama 2) dan Surya Sumpeno 3) 1) Bidang Keahlian Telematika (Konsentrasi CIO) Jurusan Teknik Elektro

Lebih terperinci

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL

TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL TEMU KEMBALI INFORMASI BERDASARKAN LOKASI PADA DOKUMEN YANG DIKELOMPOKKAN MENGGUNAKAN METODE CENTROID LINKAGE HIERARCHICAL Nadia Damayanti 1, Nur Rosyid Mubtada i, S.Kom, M.Kom 2, Afrida Helen S.T, M.Kom

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

ANALISIS KLASTERING LIRIK LAGU INDONESIA

ANALISIS KLASTERING LIRIK LAGU INDONESIA ANALISIS KLASTERING LIRIK LAGU INDONESIA Afdilah Marjuki 1, Herny Februariyanti 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank e-mail: 1 bodongben@gmail.com,

Lebih terperinci

Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia

Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia Perbandingan Teknik Pengklasteran Dalam Visualisasi Data Teks Bahasa Indonesia Praditya Kurniawan 1, Ema Utami 2, Andi Sunyoto 3 1,2,3 STMIK AMIKOM Yogyakarta e-mail: * 1 pradityakurniawan@gmail.com, 2

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

PEMETAAN SEBARAN MUTU PENDIDIKAN DASAR MENGGUNAKAN METODE SELF ORGANIZING MAPS

PEMETAAN SEBARAN MUTU PENDIDIKAN DASAR MENGGUNAKAN METODE SELF ORGANIZING MAPS PEMETAAN SEBARAN MUTU PENDIDIKAN DASAR MENGGUNAKAN METODE SELF ORGANIZING MAPS Ahmad Mulla Ali Basthoh 1, Surya Sumpeno 2, dan I Ketut Eddy Purnama 3 Jurusan Teknik Elektro FTI, ITS, Surabaya Kampus ITS

Lebih terperinci

JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI)

JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI) JURNAL PENGELOMPOKAN SKRIPSI MENGGUNAKAN SELF ORGANIZING MAPS CLUSTERING (STUDI KASUS : PRODI TEKNIK INFORMATIKA UNIVERSITAS NUSANTARA PGRI KEDIRI) CLASSIFICATION OF THESIS USING SELF ORGANIZING MAPS CLUSTERING

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

P E N D A H U L U A N Latar Belakang

P E N D A H U L U A N Latar Belakang KLASIFIKASI KEKERAPAN KUNJUNGAN LOKASI BERBASIS LOCATION BASED SERVICE (LBS) MENGGUNAKAN SELF-ORGANIZING MAP (SOM) Oleh : Dhanang Fitra Riaji (NRP : 2208205737) PROGRAM MAGISTER JURUSAN TEKNIK INDUSTRI

Lebih terperinci

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER

SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER SENTIMENT ANALYSIS DENGAN NAIVE BAYES UNTUK MELIHAT PERSEPSI MASYARAKAT TERHADAP BATIK PADA JEJARING SOSIAL TWITTER Anindya Apriliyanti P. Departemen Statistika FMIPA Universitas Padjadjaran a.apriliyanti.p@gmail.com

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini akan diuraikan mengenai landasan teori yang akan digunakan dalam bab selanjutnya. 2.1 Matriks Sebuah matriks, biasanya dinotasikan dengan huruf kapital tebal seperti A,

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL Nur Rosyid M, Entin Martiana, Damitha Vidyastana, Politeknik Elektronika

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut Liu opini merupakan pernyataan subyektif yang mencerminkan sentimen orang atau persepsi tentang entitas dan peristiwa [1]. Opini atau pendapat orang lain terhadap

Lebih terperinci

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk

Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Analisis Sentimen Pada Data Twitter dengan Menggunakan Text Mining terhadap Suatu Produk Eka Retnawiyati 1, Fatoni, M.M.,M.Kom 2., Edi Surya Negara, M.Kom 3 1) Mahasiswa Informatika Universitas Bina Darma

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430

JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-430 JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-430 VISUALISASI SIMILARITAS TOPIK PENELITIAN DENGAN PENDEKATAN KARTOGRAFI MENGGUNAKAN SELF- ORGANIZING MAPS (SOM) Budi Pangestu,

Lebih terperinci

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi

Lebih terperinci

Oleh: ARIF DARMAWAN NIM

Oleh: ARIF DARMAWAN NIM APLIKASI PENGKLASIFIKASIAN DOKUMEN INFO PADA TWITTER MENGGUNAKAN ALGORITMA NAIVE BAYES TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang

Lebih terperinci

TUGAS AKHIR. Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang. Oleh :

TUGAS AKHIR. Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang. Oleh : APLIKASI PENDETEKSI DUPLIKASI DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA WINNOWING SERTA PENGELOMPOKAN DOKUMEN DENGAN MENGGUNAKAN ALGORITMA FUZZY C-MEANS TUGAS AKHIR Sebagai Persyaratan Guna Meraih

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 1.1. Rancangan Penelitian Rancangan penelitian adalah rencana dan struktur penyelidikan yang disusun sedemikian rupa sehingga penelitian akan memperoleh jawaban untuk pertanyaan-pertanyaan

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini menjelaskan tentang analisa data, rancangan sistem, dan skenario pengujian. Bagian analisa data meliputi data penelitian, analisis data, data preprocessing.

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN

PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN PERBANDINGAN METODE CLUSTERING MENGGUNAKAN METODE SINGLE LINKAGE DAN K - MEANS PADA PENGELOMPOKAN DOKUMEN Rendy Handoyo 1, R. Rumani M 2, Surya Michrandi Nasution 3 1,2,3 Gedung N-203, Program Studi Sistem

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

APLIKASI SISTEM REKOMENDASI TOPIK SKRIPSI PROGRAM STUDI TEKNIK INFORMATIKA DENGAN METODE SELF ORGANIZING MAP(SOM)

APLIKASI SISTEM REKOMENDASI TOPIK SKRIPSI PROGRAM STUDI TEKNIK INFORMATIKA DENGAN METODE SELF ORGANIZING MAP(SOM) APLIKASI SISEM REKOMENDASI OPIK SKRIPSI PROGRAM SUDI EKNIK INFORMAIKA DENGAN MEODE SELF ORGANIZING MAP(SOM) ARIKEL SKRIPSI Diajukan Untuk Memenuhi Salah Satu Syarat Guna Memperoleh Gelar Sarjana Komputer

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB 3 Metodologi 3.1 Kerangka Berpikir

BAB 3 Metodologi 3.1 Kerangka Berpikir BAB 3 Metodologi 3.1 Kerangka Berpikir Kerusakan bangunan akibat gempa bumi menjadi salah satu penyebab dominan jatuhnya korban jiwa. Dibutuhkan suatu upaya untuk meminimalisasikan kerusakan bangunan akibat

Lebih terperinci

PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK

PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK PEMANFAATAAN BIOMETRIKA WAJAH PADA SISTEM PRESENSI MENGGUNAKAN BACKPROPAGATION NEURAL NETWORK Program Studi Matematika FMIPA Universitas Negeri Semarang Abstrak. Saat ini, banyak sekali alternatif dalam

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini akan membahas tentang penelitian berita yang menggunakan Text Mining, metode TF-IDF, dan. Yang mana penelitian ini akan mengulas secara lengkap tentang

Lebih terperinci

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang ahsan@unikama.ac.id ABSTRAK. Universitas Kanjuruhan Malang

Lebih terperinci

DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR

DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR DETEKSI PLAGIARISME DENGAN ALGORITMA RABIN KARP DAN ALGORITMA KLASTERISASI SUFFIX TREE PADA TEKS DOKUMEN TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas

Lebih terperinci

KOMPRESI CITRA DIGITAL DENGAN MENGGUNAKAN HEBBIAN BASED PRINCIPAL COMPONENT ANALYSIS

KOMPRESI CITRA DIGITAL DENGAN MENGGUNAKAN HEBBIAN BASED PRINCIPAL COMPONENT ANALYSIS KOMPRESI CITRA DIGITAL DENGAN MENGGUNAKAN HEBBIAN BASED PRINCIPAL COMPONENT ANALYSIS 1 Sofyan Azhar Ramba 2 Adiwijaya 3 Andrian Rahmatsyah 12 Departemen Teknik Informatika Sekolah Tinggi Teknologi Telkom

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

Model Klasifikasi Trafik Untuk Jaringan 3G Menggunakan Metode Discriminant Analysis

Model Klasifikasi Trafik Untuk Jaringan 3G Menggunakan Metode Discriminant Analysis Model Klasifikasi Trafik Untuk Jaringan 3G Menggunakan Metode Discriminant Analysis Fitri Puspitasari Putri, Mieke Yuliana, ST.MT, Ronny Susetyoko Ssi.Msi Jurusan Teknik Telekomunikasi - Politeknik Elektronika

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Salah satu faktor penting penunjang globalisasi ialah internet. Semakin majunya teknologi internet menyebabkan banyaknya pengembang perangkat lunak membuat berbagai

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN

PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN PENGENALAN POLA BENTUK BUNGA MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS DAN K-NN Herfina 1) 1) Program Studi Ilmu Komputer, FMIPA Universitas Pakuan Jl. Pakuan PO BOX 452, Ciheuleut Bogora email : herfinario@yahoo.com

Lebih terperinci

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster Analisis Cluster Analisis Cluster adalah suatu analisis statistik yang bertujuan memisahkan kasus/obyek ke dalam beberapa kelompok yang mempunyai sifat berbeda antar kelompok yang satu dengan yang lain.

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM : PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kehadiran teknologi web yang interaktif telah merubah cara orang mengekspresikan pandangan dan opininya. Saat ini pengguna dapat menulis ulasan suatu produk pada situs

Lebih terperinci

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan

Lingkungan Implementasi Clustering Menggunakan SOM HASIL DAN PEMBAHASAN Pengumpulan Data Perkembangan Anak Validasi Cluster Menggunakan sehingga dapat diproses dengan SOM. Pada tahap seleksi data, dipilih data perkembangan anak berdasarkan kategori dan rentang usianya. Kategori perkembangan tersebut merupakan perkembangan kognitif, motorik

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN :

Prosiding Seminar Sains dan Teknologi FMIPA Unmul Vol. 1 No. 2 Desember 2015, Samarinda, Indonesia ISBN : Clustering Data Status Tugas Belajar Dan Ijin Belajar Menggunakan Metode Fuzzy C-Means (Studi Kasus : Di Lingkungan Pemerintah Provinsi Kalimantan Timur) Fevin Triyas Rantika 1, Indah Fitri Astuti, M.Cs

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

Training. Level Transformasi Wavelet. Banyak Fitur. Ukuran Dimensi. 0 40x x30 600

Training. Level Transformasi Wavelet. Banyak Fitur. Ukuran Dimensi. 0 40x x30 600 Citra asli Citra ya Inisialisasi: Topologi jaringan, Bobot awal, Lebar tetangga, Nilai laju awal pembelajaran Kriteria pemberhentian Training Error> -6 Epoch< 4 Alpha> HASIL DAN PEMBAHASAN Pada penelitian

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK KLASIFIKASI OPINI PADA DATA TWITTER DENGAN EKSPASI QUERY MENGGUNAKAN PENDEKATAN SINONIM Laporan Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA Penelitian terdahulu sangat penting bagi penulis untuk mengetahui referensi dan hubungan antara penelitian terdahulu dengan penelitian yang dilakukan saat ini, sehingga hal duplikasi

Lebih terperinci

BAB I PENDAHULUAN I.1. Latar Belakang Masalah

BAB I PENDAHULUAN I.1. Latar Belakang Masalah BAB I PENDAHULUAN I.1. Latar Belakang Masalah Dalam era teknologi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung

Lebih terperinci

CLUSTERING UNTUK DATA KOMPETENSI WIDYAISWARA MENGGUNAKAN ALGORITMA KMEANS

CLUSTERING UNTUK DATA KOMPETENSI WIDYAISWARA MENGGUNAKAN ALGORITMA KMEANS CLUSTERING UNTUK DATA KOMPETENSI WIDYAISWARA MENGGUNAKAN ALGORITMA KMEANS Diana Triastuty, I Ketut Eddy Purnama, dan Surya Sumpeno Jurusan Teknik Elektro FTI, ITS, Surabaya Kampus ITS Keputih, Sukolilo,

Lebih terperinci

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS

PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS PENENTUAN NILAI PANGKAT PADA ALGORITMA FUZZY C- MEANS WULAN ANGGRAENI wulangussetiyo@gmail.com Program Studi Pendidikan Matematika Universitas Indraprasta PGRI Abstract. The purpose of this study was to

Lebih terperinci

Minggu XI ANALISIS KOMPONEN UTAMA. Utami, H

Minggu XI ANALISIS KOMPONEN UTAMA. Utami, H Minggu XI ANALISIS KOMPONEN UTAMA Utami, H Outline 1 Pendahuluan 2 Tujuan 3 Analisis Komponen Utama 4 Contoh Utami, H Minggu XIANALISIS KOMPONEN UTAMA 2 / 16 Outline 1 Pendahuluan 2 Tujuan 3 Analisis Komponen

Lebih terperinci

Algoritma Kohonen dalam Mengubah Citra Graylevel Menjadi Citra Biner

Algoritma Kohonen dalam Mengubah Citra Graylevel Menjadi Citra Biner Jurnal Ilmiah Teknologi dan Informasia ASIA (JITIKA) Vol.9, No.2, Agustus 2015 ISSN: 0852-730X Algoritma Kohonen dalam Mengubah Citra Graylevel Menjadi Citra Biner Nur Nafi'iyah Prodi Teknik Informatika

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Masalah kemiskinan merupakan hal yang sangat kompleks. Di wilayah Kecamatan Bantul, seorang warga disebut sebagai keluarga miskin berdasarkan beberapa aspek seperti

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Sistem Rekomendasi 2.1.1 Pengantar Sistem Rekomendasi Proses memberitahukan kepada seseorang atau lebih bahwa sesuatu yang dapat dipercaya, dapat juga merekomendasikan diartikan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

Pengelompokan Data Guru Untuk Pemilihan Calon Pengawas Satuan Pendidikan Menggunakan Metode Fuzzy C-Means dan Kohonen Self Organizing Maps

Pengelompokan Data Guru Untuk Pemilihan Calon Pengawas Satuan Pendidikan Menggunakan Metode Fuzzy C-Means dan Kohonen Self Organizing Maps Pengelompokan Data Guru Untuk Pemilihan Calon Pengawas Satuan Pendidikan Menggunakan Metode Fuzzy C-Means dan Kohonen Self Organizing Maps Muslem 1, Eko Mulyanto Yuniarno 2, I Ketut Eddy Purnama 3 Magister

Lebih terperinci

Aplikasi Algoritma Competitive Network Untuk Clustering Minat Mahasiswa Terhadap Topik-Topik Penelitian

Aplikasi Algoritma Competitive Network Untuk Clustering Minat Mahasiswa Terhadap Topik-Topik Penelitian Aplikasi Algoritma Competitive Network Untuk Clustering Minat Mahasiswa Terhadap Topik-Topik Penelitian Wiji Lestari, Singgih Purnomo STMIK Duta Bangsa Surakarta ABSTRAK Clustering adalah suatu metode

Lebih terperinci

BAB IV PREPROCESSING DATA MINING

BAB IV PREPROCESSING DATA MINING BAB IV PREPROCESSING DATA MINING A. Konsep Sebelum diproses data mining sering kali diperlukan preprocessing. Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data mentah untuk mempersiapkan

Lebih terperinci

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI

PENGGUNAAN METODE PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI PENGGUNAAN PENGKLASTERAN UNTUK MENENTUKAN BIDANG TUGAS AKHIR MAHASISWA TEKNIK INFORMATIKA PENS BERDASARKAN NILAI Entin Martiana S.Kom,M.Kom, Nur Rosyid Mubtada i S. Kom, Edi Purnomo Jurusan Teknik Informatika

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH

KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH KLUSTER K-MEANS DATA MAHASISWA BARU TERHADAP PROGRAM STUDI YANG DIPILIH Citra Arum Sari dan Dwi Sukma D Program Studi Teknik Industri, FTI-UPN Jatim ABSTRAK Besarnya peminat dari setiap program studi di

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1. BAB I PENDAHULUAN 1.1 Latar Belakang website adalah salah satu layanan yang bisa digunakan untuk melakukan pencarian berbagai informasi, sehingga sangat dibutuhkan untuk keperluan pengguna dalam pencarian

Lebih terperinci

IDENTIFIKASI KEMATANGAN BUAH TOMAT MENGGUNAKAN SOM (SELF ORGANIZING MAPS) ARTIKEL SKRIPSI

IDENTIFIKASI KEMATANGAN BUAH TOMAT MENGGUNAKAN SOM (SELF ORGANIZING MAPS) ARTIKEL SKRIPSI IDENTIFIKASI KEMATANGAN BUAH TOMAT MENGGUNAKAN SOM (SELF ORGANIZING MAPS) ARTIKEL SKRIPSI Diajukan Untuk Memenuhi Sebagian Syarat Guna Memperoleh Gelar Sarjana Komputer (S.Kom.) Pada Program Studi Teknik

Lebih terperinci

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Twitter bagian dari Social Networking website yang memperbolehkan pengguna untuk mengirim dan membaca 140 karakter, atau sering disebut tweets[1]. Berdasarkan survey

Lebih terperinci

IMPLEMENTASI SELF ORGANIZING MAP DALAM KOMPRESI CITRA DIGITAL

IMPLEMENTASI SELF ORGANIZING MAP DALAM KOMPRESI CITRA DIGITAL IMPLEMENTASI SELF ORGANIZING MAP DALAM KOMPRESI CITRA DIGITAL Hisar M. Simbolon (1) Sri Suwarno (2) Restyandito (3) hisarliska@gmail.com sswn@ukdw.ac.id dito@ukdw.ac.id Abstraksi Kompresi citra digital

Lebih terperinci

PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE

PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE PENGENALAN WAJAH MENGGUNAKAN ALGORITMA EIGENFACE DAN EUCLIDEAN DISTANCE Widodo Muda Saputra, Helmie Arif Wibawa, S.Si, M.Cs, dan Nurdin Bahtiar, S.Si, M.T Fakultas Sains dan Matematika, Jurusan Ilmu Komputer

Lebih terperinci

BAB 2 Landasan Teori

BAB 2 Landasan Teori BAB 2 Landasan Teori Pengenalan manusia secara otomatis menggunakan mesin merupakan masalah yang menantang dan telah menjadi banyak perhatian selama beberapa tahun terakhir. (Jawad, Syed, dan Farrukh,

Lebih terperinci

Perbandingan Antara Metode Kohonen Neural Network dengan Metode Learning Vector Quantization Pada Pengenalan Pola Tandatangan

Perbandingan Antara Metode Kohonen Neural Network dengan Metode Learning Vector Quantization Pada Pengenalan Pola Tandatangan Jurnal Sains & Matematika (JSM) ISSN Kajian 0854-0675 Pustaka Volume14, Nomor 4, Oktober 2006 Kajian Pustaka: 147-153 Perbandingan Antara Metode Kohonen Neural Network dengan Metode Learning Vector Quantization

Lebih terperinci

PEMBUATAN PETA SIMILARITAS KOTA DI PROVINSI JAWA TENGAH MENGGUNAKAN SELF-ORGANIZING MAPS (SOM)

PEMBUATAN PETA SIMILARITAS KOTA DI PROVINSI JAWA TENGAH MENGGUNAKAN SELF-ORGANIZING MAPS (SOM) Pembuatan Peta Similaritas Kota di Provinsi Jawa Tengah... (Palgunadi dkk.) PEMBUATAN PETA SIMILARITAS KOTA DI PROVINSI JAWA TENGAH MENGGUNAKAN SELF-ORGANIZING MAPS (SOM) Sarngadi Palgunadi, Risalatul

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi

Lebih terperinci

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING)

CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) CLUSTERING MENGGUNAKAN K-MEANS ALGORITHM (K-MEANS ALGORITHM CLUSTERING) Nur Wakhidah Fakultas Teknologi Informasi dan Komunikasi Universitas Semarang Abstract Classification is the process of organizing

Lebih terperinci

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 4, No. 1, Tahun Vol. 4, No. 1, Tahun 2015 28 Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Website : https://jurnal.pcr.ac.id/index.php/jakt/about/index Email : pustaka@pcr.ac.id Visualisasi Pengembangan Judul

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait Penelitian terkait dengan topik analisis sentimen cukup banyak, berikut beberapa penelitian yang tekait dengan analisa sentimen yang menggunakan seleksi

Lebih terperinci