OPTIMALISASI IKLAN DENGAN SISTEM KONTRAK MENGGUNAKAN METODE CONTEXTUAL ADVERTISING PADA PORTAL BERITA ONLINE

Ukuran: px
Mulai penontonan dengan halaman:

Download "OPTIMALISASI IKLAN DENGAN SISTEM KONTRAK MENGGUNAKAN METODE CONTEXTUAL ADVERTISING PADA PORTAL BERITA ONLINE"

Transkripsi

1 OPTIMALISASI IKLAN DENGAN SISTEM KONTRAK MENGGUNAKAN METODE CONTEXTUAL ADVERTISING PADA PORTAL BERITA ONLINE Enda Esyudha Pratama 1, Suhardi 2 Magister Teknologi Informasi Sekolah Teknik Elektro dan Informatika (STEI) Institut Teknologi Bandung, Jl Ganesha 10 Bandung Jawa Barat Indonesia. endaesyudha@students.itb.ac.id 1, suhardi@stei.itb.ac.id 2 Abstrak Penelitian ini mengamati tentang permasalahan yang dihadapai oleh penyedia portal berita online dalam hal manajemen iklannya. Umunya iklan berbasis kontrak yang ditampilkan masih secara acak atau random. Belum berdasarkan dengan relevansi berita yang sedang dibaca. Dengan adanya metode contextual advertising dalam bidang online advertising, akan sangat membantu advertiser maupun publisher dalam menampilkan iklan yang sesuai. Dengan melakukan Information Retrieval di dalam suatu berita, akan didapat informasi penting didalamnya. Informasi itulah yang digunakan oleh sistem untuk menentukan dan menampilkan iklan yang relevan. Berdasarkan hasil pengujian yang dilakukan dari 50 dokumen berita dari 5 macam kategori, nilai relevansi yang diperoleh menunjukan metode contextual advertising dapat bekerja secara baik dalam hal menampilkan iklan yang relevan terhadap suatu berita. Kata Kunci : Portal Berita Online, Iklan, Contextual Advertising, Information Retrieval, Relevan 1. Pendahuluan 1.1 Identifikasi Masalah Portal berita online masih menjadi primadona model usaha online saat ini. Baik itu yang memang mendirikan secara langsung maupun yang melakukan duplikasi dari media cetak ke media onlinenya. Tak terkecuali portal berita online Jika dibandingkan dengan media cetaknya yang memiliki pendapatan dari penjualan dan pemasangan iklan, sumber income utama berita online pikiran-rakyat.com masih sama seperti media-media online lainnya, yaitu dari iklan online atau lebih sering dikenal dengan online advertising. Bentuk model bisnis online yang paling sederhana diaplikasikan di sini, yaitu memberikan content kepada mayoritas pengunjung, dengan sejumlah kecil (minoritas) lain membayar agar jasanya terlihat oleh mayoritas tersebut. Beberapa jenis iklan lain sudah pernah dicoba, misalnya Google AdSense maupun ad network, namun setelah dievaluasi, ternyata masih lebih menguntungkan memasarkan iklan sendiri yang umumnya masih berdasarkan sistem kontrak. Sistem kontrak umumnya masih menggunakan cara yang tradisional yaitu dengan menampilkan banner ads. Iklan akan ditayangkan di space (tempat) yang telah ditentukan selama 24 jam selama masa kontrak. Traffic log report akan dikirim melalui pengiklan. Keunggulan sistem kerja sama ini adalah bentuknya yang sederhana dan pengiklan tidak perlu secara realtime mengontrol performa iklan yang ditayangkan. Di sisi lain, publisher dapat lebih pasti dalam pemasukan iklan terutama untuk jangka waktu tertentu.

2 Namun, pada sistem iklan berbasis kontrak ini masih memiliki beberapa kelemahan. Selain iklan yang ditampilkan dikelompokan berdasarkan kategori atau kanal berita, iklan lain yang ditampilkan masih secara random atau acak. Belum berdasarkan berita yang sedang dibaca pengunjung. Dapat dilihat pada source code berikut: saja. Beberapa space lainnya digunakan untuk iklan dari google adsense Gambar 1.1 Iklan di Gambar 1.1 Source code untuk menampilkan iklan di yang masih menggunakan teknik random atau acak Metode ini memang terkadang efektif namun dirasa masih kurang optimal. Berdasarkan data survey yang diperoleh, rata-rata pengunjung jarang tertarik pada iklan yang tidak ada kaitannya dengan berita yang dibaca. 1.2 Rumusan Masalah Bentuk iklan online dengan sistem kontrak masih memiliki kelemahan terutama dalam hal optimasi. Apabila suatu iklan dipasang pada kanal berita tertentu, maka hal tersebut dapat mengurangi potensi user untuk melihat iklan tersebut jika sedang tidak berada pada kanal yang dimaksud. Padahal setiap user memiliki potensi untuk tertarik pada setiap iklan apa saja. Jika setiap iklan ingin dipasang pada halaman utama, tentunya itu akan menyulitkan untuk pihak penyedia portal dalam menyediakan space dan mengganggu kenyamanan user dalam membaca berita. Selain itu, portal berita belum memaksimalkan space iklan yang ada pada setiap halaman berita yang sedang dibaca. Berdasarkan pengamatan yang dilakukan untuk satu halaman berita yang sedang dibuka, hanya terdapat satu jenis iklan Dari uraian di atas, dapat dirumuskan masalah yaitu: selain iklan yang ditampilkan dikelompokan berdasarkan kategori berita dan secara random atau acak, bagaimana menambah dan mengoptimalkan space iklan berbasis kontrak berdasarkan halaman berita yang sedang dibaca oleh pengunjung. Iklan yang ditampilkan pada halaman yang sedang dibaca diurutkan berdasarkan tingkat relevansinya meskipun tidak memiliki kesesuaian dengan kategori berita yang dibaca. 1.3 Hasil dan Keluaran Melalui studi ini, akan dilakukan pemrosesan terhadap teks suatu berita untuk kemudian diambil informasi penting didalamnya yang dapat digunakan untuk melakukan perhitungan relevansi terhadap iklan yang ditampilkan. Simulasi akan dilakukan menggunakan data sekunder dengan menggunakan berbagai asumsi yang relevan jika diperlukan. Dari proses yang telah dilakukan, diharapkan iklan berbasis kontrak yang terdapat pada situs pikiran-rakyat.com dapat dioptimalkan penayangannya dan tentunya menarik lebih banyak pengunjung di sisi pemasang iklan atau advertiser. Tingkat pengukuran matriks yang dilihat terletak pada dua aspek yaitu tingkat relevansi iklan dan pegaruh positif iklan yang ditampilkan terhadap pengungjung pikiran-rakyat.com

3 2. Landasan Teori 2.1 Computational Advertising Computational Advertising (CA), biasa dikenal dengan Online advertising atau Web advertising, yang mengacu untuk mencari sebuah ads yang paling relevan dan sesuai dengan context tertentu pada sebuah web yang memiliki masalah utama yaitu bagaimana menampilkan satu set ads yang paling cocok diantara keyword yang telah diberikan oleh user dengan konteks yang ditampilkan dan menampilkan iklan yang sesuai. Berdasarkan pada konteks, CA bisa dibagi menjadi 3 bagian: a. Sponsored Search, mengacu pada penempatan ads pada halaman hasil pencarian (search engine) seperti Google, dan Yahoo. Iklan ditampilkan berdasarkan aturan bidding. b. Contextual Advertising, mengacu pada penempatan ads yang sesuai dengan web pages yang dibuka. c. Social Advertising, mengacu pada penempatan ads pada home pages pribadi disuatu social network tertentu. 2.2 Contextual Advertising Teknologi periklanan di media online semakin beragam. Salah satu yang saat ini jadi primadona adalah contextual advertising, sistem yang mampu mendeteksi tampilnya iklan, baik teks maupun gambar, menurut relevansi content di halaman web. Iklan kontekstual kadangkala disebut juga Content Targeting. Cara kerja sederhana dari sistem ini adalah mencari keyword dari halaman web dan ads yang akan ditampilkan kemudian mengukur tingkat kecocokan dan relevansinya. Selain itu sistem ini juga mampu menampilkan iklan menurut target tertentu seperti wilayah, kategori, kata kunci. Contextual advertising berkembang pesat seiring tuntutan pengelolaan iklan yang cepat, otomatis dan akurat. Metode ini dianggap paling sesuai untuk memecahkan masalah iklan di pikiran-rakyat.com khusunya dalam hal menampilkan iklan yang sesuai dengan isi berita. 2.3 Metode Klasifikasi Teks Pengklasifikasian teks sangat dibutuhkan dalam berbagai macam aplikasi, terutama aplikasi yang jumlah dokumennya bertambah dengan cepat. Ada dua cara dalam penggolongan teks, yaitu clustering teks dan klasifikasi teks. Clustering teks berhubungan dengan menemukan sebuah struktur kelompok yang belum kelihatan (tak terpandu atau unsupervised) dari sekumpulan dokumen. Sedangkan pengklasifikasian teks dapat dianggap sebagai proses untuk membentuk golongangolongan (kelas-kelas) dari dokumen berdasarkan pada kelas kelompok yang sudah diketahui sebelumnya (terpandu atau supervised). Banyak metode yang dapat digunakan untuk pengklasifikasian teks [Yang, 1999], antara lain adalah Naıve Bayes, k-nearest neighbor [Yavuz, 1998], Support Vector Machines (SVM), boosting, algoritma pembelajaran aturan (rule learning algorithms) dan Maximum Entropy (MaxEnt). Dalam makalah ini mengggunakan dua metode yaitu : Naïve Bayes. Metode Naïve Bayes dikenal dengan algoritma klasifikasi simple Bayesian. Algoritma ini banyak digunakan karena terbukti efektif untuk kategorisasi teks, sederhana, cepat dan akurasi tinggi. Klasifikasi atau kategorisasi teks merupakan suatu proses penempatan suatu dokumen ke suatu kategori atau kelas sesuai dengan karakteristik dari dokumen tersebut. Klasifikasi termasuk pembelajaran jenis supervised learning. Jenis lain adalah unsupervised learning atau dikenal sebagai clustering. Pada supervised learning, data latihan mengandung pasangan data input (biasanya vektor) dan output yang diharapkan, sedangkan pada unsupervised learning belum terdapat target output yang harus diperoleh.

4 Proses klasifikasi teks dapat dibagi ke dalam dua fase, yaitu: 1. Fase information retrieval (IR) untuk mendapatkan data numerik dari dokumen teks. Dalam IR ini sendiri, terdapat beberapa proses lagi untuk mengubah data yang tidak terstruktur dari suatu dokumen menjadi sebuah informasi penting. Proses yang terjadi diantaranya, preproccesing, tokenizing, filtering, dan stemming 2. Fase klasifikasi utama ketika suatu algoritma memroses data numerik tersebut untuk memutuskan ke kategori mana teks ditempatkan. Terdapat beberapa algoritma klasifikasi yang merupakan kajian di bidang statistika dan machine learning yang dapat diterapkan pada fase ini, di antaranya adalah Naive Bayesian, Rocchio, Decision Tree, k- Nearest Neighbor, Neural Network, dan Support Vector Machines. Teknik-teknik tersebut berbeda dalam mekanisme pembelajaran dan representasi model yang dipelajari. Klasifikasi klasifikasi Bayes adalah klasifikasi statistik yang dapat memprediksi kelas suatu anggota probabilitas. Untuk klasifikasi Bayes sederhana yang lebih dikenal sebagai naïve Bayesian Classifier dapat diasumsikan bahwa efek dari suatu nilai atribut sebuah kelayang diberikan adalah bebas dari atribut-atribut lain. Asumsi ini disebut class conditional independence yang dibuat untuk memudahkan perhitungan - perhitungan pengertian ini dianggap naive, dalam bahasa lebih sederhana naïve itu mengasumsikan bahwa kemunculan suatu term kata dalam suatu kalimat tidak dipengaruhi kemungkinan katakata yang lain dalam kalimat padahal dalam kenyataanya bahwa kemungkinan kata dalam kalimat sangat dipengaruhi kemungkinan keberadaan kata-kata yang dalam kalimat. Dalam Naïve Bayes di asumsikan prediksi atribut adalah tidak tergantung pada kelas atau tidak dipengaruhi atribut laten. Gambar 2.2. Klasifikasi Naïve Bayes sebagai jaringan bayes dengan atribut prediksi (P1,P2,.Pk) dan kelas (C) C adalah adalah anggota kelas dan X adalah variabel acak sebuah vektor sebagai atribut nilai yang diamati. c mewakili nilai label kelas dan x mewakili nilai atribut vector yang diamati. Jika diberikan sejumlah x tes untuk klasifikasi maka probablitas tiap kelas untuk atribut prediksi vektor yang diamati adalah Gambar 2.1. Dua Fase Klasifikasi Teks X = x adalah mewakili kejadian dari 2.4 Algoritma Naive Bayes Algoritma Naive Bayes sangat berbeda dengan algoritma rule-based learning. Naïve Bayes adalah sebuah algoritma analisa statistik, yang bekerja dengan mengolah data numerik. Metode ini menggunakan probabilitas Bayesian. Tentunya untuk mendapatkan probabilitas dari tiap kata, filter harus terlebih dahulu melakukan pembelajaran terhadap setiap kata-kata dan probabilitasnya. Naive Bayes merupakan teknik klasifikasi yang sederhana dan cepat. Teknik ini bekerja dengan baik dengan representasi statistik.

5 3. Metode Penelitian 3.1 Himpunan Data Peneletian Pada penelitian ini, himpunan data yang akan diuji adalah kumpulan artikel-artikel yang disadur dari lima macam kategori/kanal berita di pikiran-rakyat.com Dari tiap kategori dipilih 10 berita secara acak sehingga total artikel yang diuji sebanyak 50 artikel. Adapun kategori berita yang dipilih yaitu: 1. Politik, 2. Olahraga, 3. Pendidikan, 4. Showbiz, 5. Otomotif. Kemudian dipilih juga 10 macam iklan dari berbagai jenis kategori iklan seperti teknolgi, kesehatan, event, makanan minuman, dan otomotif. Dari beberapa iklan tersebut, lima macam iklan sedang tampil di pikiranrakyat.com dan 5 iklan lainnya menggunakan data sampling dengan menyesuiakan jenis iklan yang belum terdapat di pikiranrakyat.com. Pada tiap iklan tersebut ditambahkan data description atau keyword yang menjelaskan tentang produk yang diiklankan. Tabel 3.1 Data iklan dari pikiran rakyat dan sumber lain sebagai data sampling No Nama Iklan Kategori Sumber 1 Nokia Lumia 2 Axis Teknologi 3 Skin Care Produk wanita 4 Nutrion Susu Kids Produk anak 5 Bii Bank / Ekonomi 6 Pilkada Jabar Politik 7 Philips Pisau Cukur Produk Pria 8 Shell Oil Otomotif 9 Nike Running Shoes Produk Olahraga 10 Swinburne Univ Pendidikan pikiranrakyat.com Sumber lain (data sampling) 3.2 Pengolahan Data Langkah selanjutnya adalah melakukan pemrosesan pada data-data tersebut. Inforamtion Retrieval (IR) dilakukan pada tiap berita. Informasi penting yang terdapat didalamnya akan diukur tingkat relevansinya oleh sistem dengan cara mengukur frekuensi kemunculan kata yang sesuai dengan keyword tiap iklan. Sistem akan mengurutkan peringkat iklan berdasarkan tingkat relevansinya. Iklan yang kata kuncinya memiliki frekuensi kemunculan paling banyak pada suatu berita dianggap paling relevan. Selanjutnya iklan tersebut yang nantinya akan ditampilkan pada berita yang sedang diproses tersebut. Untuk pengujian kali ini, iklan yang ditampilkan hanya yang berada pada peringkat satu. 3.3 Perancangan dan Pembuatan Aplikasi Sebagai alat pemrosesan data dirancang dan dibuat suatu aplikasi berbasis web menggunakan bahasa pemograman PHP. Basis data sebagai storage untuk menyimpan data berita iklan dan berbagai data lain yang diperlukan. Aplikasi mendapat masukan berupa berita dalam file.txt yang kemudian mengahsilkan keluaran berupa informasi data teks yang telah diproses dan iklan mana yang paling relevan. MULAI Data Berita Information Retrieval & Preproccesing Keyword Berita Tidak

6 Perhitungan nilai relevansi terhadap iklan yang ada Score relevansi >0 Ya Tidak Gambar 4.2. Tampilan Perangkat Lunak Dalam Memproses dan Menentukan Iklan yang Relevan Terhadap Berita yang Dibaca Iklan yang relevan SELESAI Gambar 3.1. Flowchart Program 4 Implementasi dan Pengujian Pengujian dilakukan untuk melihat kinerja dari algoritma Naïve Bayes dalam menentukan iklan yang relevan terhadap suatu berita. Setiap sepuluh berita dari suatu kategori, akan dicatat iklan dari kategori mana saja yang muncul. Kemudian akan dihitung akurasi rataratanya dari tiap kategori iklan yang tersedia. Sistem membutuhkan masukan dau macam data yaitu berupa data iklan beserta kata kuncinya dan data berita atau dokumen yang disimpan dalam bentuk file.txt. Setiap berita yang akan diproses terlebih dahulu harus disimpan dalam file.txt tersebut. Selanjutnya sistem akan memproses dan menghasilkan keluaran berupa informasi iklan mana yang paling relevan dan kata-kata yang diproses dalam suatu berita atau dokumen. Tabel 4.1 Data frekuensi kemunculan iklan pada tiap kategori berita Iklan Politik Olahraga Pendidikan Showbiz Otomotif Hasil Pengujian dan Analisa Dari pengujian yang dilakukan didapatkan hasil sebagai berikut: Gambar 4.1. Tampilan Perangkat Lunak Untuk Memasukan Data Iklan Pada kategori politik, iklan yang muncul pada setiap berita yang dijadikan data uji memiliki relevansi yang tinggi dengan nilai rata-rata 0,8. Iklan yang muncul mengenai pemilihan gubernur Jawa Barat.

7 Pada kategori olahraga, terdapat dua kategori iklan yang dianggap paling relevan oleh sistem yaitu iklan tentang produk olahraga dan pisau cukur. Masing-masing kategori tersebut memiliki nilai relevansi rata-rata 0,7 dan 0,3. Pada kategori pendidikan, memiliki kemiripan dengan pola pada kategori olahraga. Kategori iklan yang sering muncul berasal dari kategori pendidikan dan produk anak. Tetapi untuk iklan tentang pendidikan nilai relevansinya jauh lebih tinggi disbanding dengan produk anak. Nilai relevansi iklan kategori pendidikan sebesar 0,9, sedangkan untuk produk anak hanya 0,1 Pada kategori showbiz, tidak ada iklan khusus yang memiliki kategori yang sama dengan kategori berita. Persebaran iklan pada kategori berita ini sangat beragam dan tentunya bergantung dari berita yang diproses. Kategori iklan yang muncul berasal dari kategori teknologi, produk wanita, produk pria, bank, produk olahraga, dan pendidikan. Masingmasing kategori memiliki nilai relevansi 0,2, 0,2, 0,1, 0,2 0,1 dan 0,2. Pada kategori otomotif, kategori iklan yang muncul terdiri dari empat macam yaitu: produk wanita, produk anak, minyak/oli, dan pendidikan. Nilai relevansinya 0,1, 0,1, 0,5, 0,3. Untuk kategori otomotif ini, iklan yang ada kaitannya dengan kategori tersebut adalah produk bbm. Namun nilai relevansinya cukup rendah yaitu 0,5. Iklan yang relevan juga sangat menarik minat pembaca untuk membukanya. Berdasarkan data hasil kuesioner yang telah dilakuan dengan melibatkan 50 peserta, 60% pembaca menyukai iklan yang relevan terhadap suatu berita yang sedang mereka baca. Sebesar 26% kadang tertarik namun kadang mengabaikan. Dan sisanya sekitar 14% tidak pernah memperhatikan iklan yang tampil. 13 Data Hasil Kuesioner Mengenai Iklan yang Relevan 7 Gambar 5.1. Grafik Data Hasil Kuesioner Jika dibandingkan dengan data kuesioner sebelumnya dimana pikiran-rakyat.com menampilkan iklan secara acak, maka dapat dilihat beberapa perubahan yang terjadi pada perlaku pengunjung terhadap suatu iklan. Pada saat iklan ditampilkan secara acak, jumlah pengunjung yang memilih pilihan kadang tertarik kadang tidak cenderung lebih banyak daripada yang tertarik. Persentasenya bisa mencapai 50%. Sedangkan untuk yang tertarik dan yang tidak persentasenya masingmasing 30% dan 20%. 30 Tertarik Tidak Selalu Mengabaikan Berdasarkan data hasil uji tersebut dapat dilihat tingkat relevansi suatu kategori berita terhadap iklan yang ditampilkan. Apabila suatu iklan memiliki kategori yang sama dengan kategori berita yang ditampilkan maka nilai relevansinya akan sangat tinggi Random Contextual Pada kasus lain, pada kategori berita bersifat umum atau tidak bersesuaian dengan jenis atau kategori iklan yang tersedia, sistem akan menampilkan iklan sesuai dengan berita yang sedang dibuka. Pada kategori berita showbiz, dapat dilihat iklan yang ditampilkan hampir merata untuk setiap kategorinya. Tentunya hal ini akan ssangat efisien dibandingkan harus menampilkan iklan secara acak atau random. Gambar 5.2. Grafik Perbandingan Menampilkan Iklan secara random dengan contextual

8 6. Kesimpulan dan Saran Setelah menerapkan metode contextual advertising dengan menggunakan algoritma Naïve Bayes untuk menampilkan iklan yang relevan terhadap suatu berita, didapat beberapa kesimpulan yaitu: 1. Metode contextual advertising dengan algortima Naïve Bayes dapat bekerja secara baik dalam hal menampilkan iklan yang relevan terhadap suatu berita. Nilai akurasi rata-ratanya lebih dari 75% untuk data uji sebanyak 40 berita. Kategori berita yang digunakan memiliki kemiripan dengan kategori iklan yang tersedia. 2. Pada kategori berita yang bersifat umum, algoritma Naïve Bayes akan menampilkan iklan yang relevan sesuai dengan berita. Rata-rata kemunculan tiap kategori iklan sebanyak satu kali dengan data uji sebanyak 10 macam berita. Pada pengujian kali ini, kategori berita yang digunakan adalah kategori showbiz atau dunia hiburan. 3. Berdasarkan survei yang dilakukan dengan melibatkan 50 responden, data hasil kuesioner menunjukan pembaca berita lebih tertarik dengan iklan yang relevan terhadap suatu berita dibandingkan dengan yang ditampilkan secara acak. 60% pembaca tertarik untuk melihat iklan yang relevan, 26% terkadang melihat, sedangkan sisanya 14% tidak memperhatikan iklan yang ditampilkan. Daftar Pustaka A. J. M. Abu Afza, Dewan Md. Farid, and Chowdhury Mofizur Rahman, A Hybrid Classifier using Boosting, Clustering, and Naïve Bayesian Classifier, World of Computer Science and Information Technology Journal (WCSIT) ISSN: Vol. 1, No. 3, , Anonim. Retrieved Oktober 7, 2012, from Digital Library Telkom Institute of Technology: =com_content&view=article&id=486:naivebayes-classifier&catid=11:sistemkomunikasi&itemid=14 Dave, Kushel. Computational Advertising: Leveraging User Interaction & Contextual Factors for Improved Ad Retrieval & Ranking, International Institute of Information Technology Hyderabad, India, David D. Lewis. Naive (bayes) at forty: The independence assumption in Information retrieval. pages Springer Verlag,1998. Fabrizio Sebastiani and Consiglio Nazionale Delle Ricerche. Machine learning in automated text categorization. ACM Computing Surveys, 34:1 47, Rish Irina, "An empirical study of the naive Bayes classifier", IJCAI 2001 Workshop on Empirical Methods in Artificial Intelligence. S. M. Kamruzzaman, Farhana Haider and Ahmed Ryadh Hasan. Text Classification using Association Rule with a Hybrid Concept of Naive Bayes Classifier and Genetic Algorithm. Department of Computer Science and Engineering International Islamic University Chittagong, Bangladesh. Yiming Yang. An evaluation of statistical approaches to text categorization. Journal of Information Retrieval, 1:67 88, Sebagai langkah perbaikan untuk penelitian yang akan datang, dapat dipertimbangkan beberapa hal antara lain: 1. Penambahan jumlah iklan, baik itu untuk kategori iklannya maupun iklan dalam suatu kategori yang sama. Penggunaan keyword iklan dapat lebih detail. 2. Penggunaan data uji dalam hal ini dokumen atau berita yang lebih beragam baik itu untuk kateegorinya maupun isi atau content berita

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta  ABSTRAK Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

PEMANFAATAN TEKNIK SUPERVISED UNTUK KLASIFIKASI TEKS BAHASA INDONESIA

PEMANFAATAN TEKNIK SUPERVISED UNTUK KLASIFIKASI TEKS BAHASA INDONESIA ISSN 1858-4667 JURNAL LINK Vol 16/No. 1/Februari 2012 PEMANFAATAN TEKNIK SUPERVISED UNTUK KLASIFIKASI TEKS BAHASA INDONESIA Cahyo Darujati 1, Agustinus Bimo Gumelar 2 1,2 Sistem Informasi, Fakultas Ilmu

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

BAB IV PREPROCESSING DATA MINING

BAB IV PREPROCESSING DATA MINING BAB IV PREPROCESSING DATA MINING A. Konsep Sebelum diproses data mining sering kali diperlukan preprocessing. Data preprocessing menerangkan tipe-tipe proses yang melaksanakan data mentah untuk mempersiapkan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang

Lebih terperinci

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK

KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie / JUPITER Volume XV No.2 (2016) 109 KLASIFIKASI DOKUMEN REPOSITORY SECARA OTOMATIS MENGGUNAKAN METODE BAYESIAN NETWORK Lukman Syafie Staf Pengajar Teknik Informatika, Fakultas Ilmu Komputer

Lebih terperinci

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS Yudis Anggara Putra Chastine Fatichah Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut

Lebih terperinci

PENDAHULUAN. I.1 Latar Belakang

PENDAHULUAN. I.1 Latar Belakang I PENDAHULUAN I.1 Latar Belakang Internet sebagai jaringan komputer skala global telah mendorong pertambahan jumlah informasi digital. Pada sistem yang bersifat terbuka seperti internet, pertambahan informasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

Sistem Rekomendasi Bacaan Tugas Akhir Jurusan Teknik Informatika Universitas Sriwijaya menggunakan Metode Collaborative Filtering dan Naive Bayes

Sistem Rekomendasi Bacaan Tugas Akhir Jurusan Teknik Informatika Universitas Sriwijaya menggunakan Metode Collaborative Filtering dan Naive Bayes Sistem Rekomendasi Bacaan Tugas Akhir Jurusan Teknik Informatika Universitas Sriwijaya menggunakan Metode Collaborative Filtering Naive Bayes Riri Intan Aprilia 1 Teknik Informatika Fakultas Ilmu Komputer

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat BAB I PENDAHULUAN 1.1 Latar Belakang Donor darah adalah proses pengambilan darah dari seseorang secara sukarela untuk disimpan di bank darah untuk kemudian dipakai pada transfusi darah [1]. Seleksi donor

Lebih terperinci

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah Bab 1 PENDAHULUAN 1.1 Latar Belakang Masalah Semakin hari semakin banyak inovasi, perkembangan, dan temuan-temuan yang terkait dengan bidang Teknologi Informasi dan Komputer. Hal ini menyebabkan semakin

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP

KATA PENGANTAR. menyelesaikan penyusunan laporan tugas akhir APLIKASI KLASIFIKASI ARTIKEL TEKNOLOGI INFORMASI PADA MAJALAH CHIP KATA PENGANTAR Syukur Alhamdulillah, puji dan syukur kami panjatkan kehadirat Allah SWT, karena dengan limpah dan rahmat dan karunia-nya penulis dapat menyelesaikan penyusunan laporan tugas akhir APLIKASI

Lebih terperinci

Bandung, Indonesia Bandung, Indonesia

Bandung, Indonesia Bandung, Indonesia ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve

Lebih terperinci

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA Erik Hadi Saputra 1), Burhan Alfironi Muktamar 2) 1), 2) Teknik Informatika

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini media sosial seperti Twitter telah berkembang pesat. Data global menyebut pada akhir Desember 2014 Twitter memiliki 284 juta pengguna aktif. Dick Costolo

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Berkembangnya teknologi telah membuat banyak informasi bermunculan. Informasi-informasi tersebut tertuang dalam bentuk dokumen terutama dokumen digital. Semakin

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Situs belanja online sering disebut juga dengan situs e-commerce yaitu suatu proses membeli dan menjual produk-produk secara elektronik oleh konsumen dan dari perusahaan

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini dijelaskan landasan teori dan metode yang digunakan pada tugas akhir ini dalam pengklasifikasian dokumen teks. Pembahasan dimulai dengan penjelasan mengenai klasifikasi

Lebih terperinci

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO

IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO IMPLEMENTASI METODE BAYESIAN DALAM PENJURUSAN DI SMA BRUDERAN PURWOREJO STUDI KASUS: SMA BRUDERAN PURWOREJO Sendy Winanta Yetli Oslan, Gunawan Santoso Abstrak Penjurusan siswa kelas X SMA yang akan naik

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen

Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen Metoda Naïve Bayes Classifier dan Penggunaannya pada Klasifikasi Dokumen Samuel Natalius / 18209031 Program Studi Sistem dan Teknologi Informasi Sekolah Teknik Elektro dan Informatika Institut Teknologi

Lebih terperinci

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk Spam Filtering

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk  Spam Filtering Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk E-mail Spam Filtering Proposal Tugas Akhir KBK: Rekayasa Perangkat Lunak dan Data (RPLD) Moh. Mahsus 113060088

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Banyak kemudahan yang kita dapat dari teknologi informasi. Penggunaan internet sebagai media komunikasi, penyebaran informasi dan banyaknya layanan penyedia email membuat

Lebih terperinci

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL

PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL PENENTUAN KEMIRIPAN TOPIK PROYEK AKHIR BERDASARKAN ABSTRAK PADA JURUSAN TEKNIK INFORMATIKA MENGGUNAKAN METODE SINGLE LINKAGE HIERARCHICAL Nur Rosyid M, Entin Martiana, Damitha Vidyastana, Politeknik Elektronika

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang 3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang

Lebih terperinci

Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier

Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier Implementasi Pengembangan Smart Helpdesk di UPT TIK UNS Menggunakan Algoritma Naive Bayes Classifier Wachid Daga Suryono 1, Ristu Saptono 2, Wiranto 3 Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan Perkembangan volume dan keragaman informasi yang tersedia di internet saat ini sangat pesat sehingga mendorong tumbuhnya media pemberitaan online.

Lebih terperinci

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN)

KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST NEIGHBORS (K-NN) Klasifikasi Helpdesk Universitas Jenderal Achmad ni... (Herawan dkk.) KLASIFIKASI HELPDESK UNIVERSITAS JENDERAL ACHMAD YANI MENGGUNAKAN CONCEPT FREQUENCY-INVERSE DOCUMENT FREQUENCY (CF-IDF) DAN K-NEAREST

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

1. Introduction. tertentu memegang peran penting dalam. Abstract

1. Introduction. tertentu memegang peran penting dalam. Abstract Perbandingan Metode Latent Semantic Analysis, Syntactically Enhanced Latent Semantic Analysis, dan Generalized Latent Semantic Analysis dalam Klasifikasi Dokumen Berbahasa Inggris Gilbert Wonowidjojo Bina

Lebih terperinci

BABI PENDAHULUAN. 1.1 Latar Belakang

BABI PENDAHULUAN. 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Named entity recognition(ner) merupakan salah satu bagian domain Information Extraction(IE) pada sistem Natural Language Processing(NLP). Sistem NER bertujuan untuk

Lebih terperinci

( ) ( ) (3) II-1 ( ) ( )

( ) ( ) (3) II-1 ( ) ( ) BAB II LANDASAN TEORI 2.1 Naïve Bayes Classifier 2.1.1 Teorema Bayes Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang berdasar pada penerapan teorema Bayes (atau aturan Bayes) dengan

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Analisa Masalah Pemilihan dosen pembimbing Tugas Akhir pada jurusan Teknik Informatika Universitas Muhammadiyah Malang dilakukan mahasiswa secara mandiri, hal

Lebih terperinci

BAB V EKSPERIMEN TEXT CLASSIFICATION

BAB V EKSPERIMEN TEXT CLASSIFICATION BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

PENERAPAN FOCUSED CRAWLING PADA SITUS BERITA ONLINE

PENERAPAN FOCUSED CRAWLING PADA SITUS BERITA ONLINE PENERAPAN FOCUSED CRAWLING PADA SITUS BERITA ONLINE Aad Miqdad Muadz Muzad 1, Faisal Rahutomo 2, Imam Fahrur Rozi 3 1,2,3 Teknik Informatika, Teknologi Informasi, Politeknik Negeri Malang 1 aadmiqdad@gmail.com,

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram

Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram Jurnal Ilmiah Teknologi dan Informasia ASIA (JITIKA) Vol.10, No.1, Februari 2016 ISSN: 0852-730X Klasifikasi Berita Lokal Radar Malang Menggunakan Metode Naïve Bayes Dengan Fitur N-Gram Denny Nathaniel

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Perkembangan internet mendorong tumbuhnya media pemberitaan online, sehingga menjadikan media online (portal berita) tidak lagi hanya menjadi media sekunder tetapi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang BAB I PENDAHULUAN 1.1 Latar belakang Dalam beberapa tahun terakhir teknologi informasi dan telekomunikasi berkembang dengan pesat. Masyarakat mendapatkan manfaat dari tekonologi informasi dan telekomunikasi

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN METODE TEXT MINING DAN NAIVE BAYES CLASSIFIER

KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN METODE TEXT MINING DAN NAIVE BAYES CLASSIFIER KLASIFIKASI ARTIKEL BERITA MENGGUNAKAN METODE TEXT MINING DAN NAIVE BAYES CLASSIFIER Ira Anggraeni Setiawan 1), Tacbir Hendro P 2), Dian Nursantika 3) 1),2),3 ) Informatika, Universitas Jenderal Achmad

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputasi dan komunikasi telah menghasilkan masyarakat yang haus akan informasi (Witten, et al. 2011). Meningkatnya penggunaan teknologi komputer dalam

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE

PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE Vol 2, No 3 Juni 2012 ISSN 2088-2130 PEMILIHAN FITUR OPTIMAL UNTUK TUGAS AKHIR MAHASISWA DENGAN METODE SUPPORT VECTOR MACHINE Devie Rosa Anamisa 1), Eka Mala Sari Rochman 2) 1,2 Teknik Informatika, Fakultas

Lebih terperinci

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN

Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Klasifikasi Teks Bahasa Indonesia Pada Corpus Tak Seimbang Menggunakan NWKNN Achmad Ridok 1), Retnani Latifah 2) Filkom

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya perkembangan teknologi dewasa ini telah menyebabkan aliran informasi begitu lancar

Lebih terperinci

KLASSIFIKASI DOKUMEN TEKS BERBAHASA ARAB MENGGUNAKAN ALGORITMA NAÏVE BAYES 1 Abdur Rozaq 2 Agus Zainal Arifin 3 Diana Purwitasari

KLASSIFIKASI DOKUMEN TEKS BERBAHASA ARAB MENGGUNAKAN ALGORITMA NAÏVE BAYES 1 Abdur Rozaq 2 Agus Zainal Arifin 3 Diana Purwitasari KLASSIFIKASI DOKUMEN TEKS BERBAHASA ARAB MENGGUNAKAN ALGORITMA NAÏVE BAYES 1 Abdur Rozaq 2 Agus Zainal Arifin 3 Diana Purwitasari Jurusan Teknik Informatika, Fakultas Teknologi Informasi, Institut Teknologi

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

BAB 1 PENDAHULUAN. Universitas Sumatera Utara 1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP)

FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) FEATURE SELECTION UNTUK KLASIFIKASI TEKS DENGAN MEKANISME WITHIN CLASS POPULARITY(WCP) Ratna Pertiwi¹, Deni Saepudin², Intan Nurma Yulita³ ¹Teknik Informatika,, Universitas Telkom Abstrak Berkembangnya

Lebih terperinci

PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING

PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING PEMILAHAN ARTIKEL BERITA DENGAN TEXT MINING 1 Arrummaisha Adrifina 2 Juwita Utami Putri 3 I Wayan Simri W 1 arroem@student.gunadarma.ac.id 2 nony_juwita@student.gunadarma.ac.id 3 iwayan@staff.gunadarma.ac.id

Lebih terperinci

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari

BAB I PENDAHULUAN. Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari BAB I PENDAHULUAN 1.1 Latar Belakang Seiring makin pesatnya perkembangan internet, dokumen-dokumen dari internet ataupun milik pribadi juga semakin berkembang. Permasalahan utama adalah bagaimana memperoleh

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen

Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Adi Radili 1, Suwanto Sanjaya 2 1,2 Teknik Informatika UIN Sultan Syarif Kasim Riau Jl. H.R. Soebrantas no. 155 KM. 18

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN Bab ini berisikan tentang alasan peneliti mengambil permasalahan ini. Pada bab ini poin-poin yang akan dipaparkan antara lain Latar Belakang, Perumusan Masalah, Batasan Masalah, Tujuan

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI

BAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat

Lebih terperinci

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier Octia Nuraeni 55410244 Teknik Informatika Pembimbing : Dr. Riza Adrianti

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Seiring dengan perkembangan zaman, kemajuan dalam bidang ilmu pengetahuan dan teknologi informasi berkembang sangat pesat. Maka informasi juga semakin banyak dan membuat

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #8 Text Classification (Manning, Ch.13, p.288/253) Ad Hoc Retrieval vs Standing Query User mencari informasi dengan memberikan satu atau lebih query terhadap koleksi

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pengembangan teknologi diharapkan menghasilkan berbagai hal yang berguna untuk memenuhi kebutuhan masyarakat serta memberi kemudahan dan kenyamanan pada pengguna

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi internet memunculkan berbagai metode komunikasi yang mudah, murah, dan cepat. Salah satu media yang paling populer dan sangat cepat berkembang

Lebih terperinci

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA. Tugas Akhir IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK EKSTRAKSI KALIMAT OPINI PADA ARTIKEL BERBAHASA INDONESIA Tugas Akhir Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah

Lebih terperinci

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK PERBANDINGAN KLASIFIKASI KNN DAN NAIVE BAYESIAN SERTA PERBANDINGAN CLUSTERING SIMPLE K-MEANS YANG MENGGUNAKAN DISTANCE FUNCTION MANHATTAN DISTANCE DAN EUCLIDIAN DISTANCE PADA DATASET Dresses_Attribute_Sales

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Sistem Rekomendasi 2.1.1 Pengantar Sistem Rekomendasi Proses memberitahukan kepada seseorang atau lebih bahwa sesuatu yang dapat dipercaya, dapat juga merekomendasikan diartikan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 40 BAB III METODOLOGI PENELITIAN 3.1 DESAIN PENELITIAN Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian

Lebih terperinci

PLUG-IN CLASSIFIER DENGAN BAYESIAN STATISTICS UNTUK MENDETEKSI SITUS WEB PALSU

PLUG-IN CLASSIFIER DENGAN BAYESIAN STATISTICS UNTUK MENDETEKSI SITUS WEB PALSU PLUG-IN CLASSIFIER DENGAN BAYESIAN STATISTICS UNTUK MENDETEKSI SITUS WEB PALSU Anisah, Sapto W. Indratno Jurusan Matematika FMIPA ITB Abstrak Meningkatnya penipuan melalui situs web palsu mendorong orang

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011

STMIK GI MDP. Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 STMIK GI MDP Program Studi Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 20010/2011 PENERAPAN METODE CLUSTERING HIRARKI AGGLOMERATIVE UNTUK KATEGORISASI DOKUMEN PADA WEBSITE SMA NEGERI

Lebih terperinci