BAB V EKSPERIMEN TEXT CLASSIFICATION
|
|
- Budi Pranoto
- 7 tahun lalu
- Tontonan:
Transkripsi
1 BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan feature selection. Tujuan dilakukan eksperimen text classification ini adalah untuk menentukan algoritma dan pendekatan feature selection yang memberikan performansi maksimum dalam menyelesaikan permasalahan text classification. 5.1 Lingkungan Eksperimen Eksperimen dilakukan menggunakan perangkat-perangkat sebagai berikut: 1. Laptop dengan processor Intel Pentium M 1.83 GHz dan memory 1 GB DDR2. 2. Sistem operasi Windows XP. 3. Java Runtime Environment 5 4. Weka SVM Light Data Data set yang digunakan tahap pembelajaran terdiri dari dua sumber data sesuai dengan kelas targetnya. Untuk kelas target course dan project, data set yang digunakan adalah dokumen-dokumen web yang dikumpulkan dari situs departemen Computer Science Universitas Cornell, Universitas Washington, Universitas Texas, dan Universitas Wisconsin. Data set tersebut dapat diakses pada situs Untuk kelas target co-author, data set yang digunakan adalah makalah-makalah ilmiah yang dikumpulkan dari situs Jumlah total data set yang digunakan dalam tahap pembelajaran adalah 400 dokumen, dengan perincian 244 dokumen memiliki kelas target course, 86 dokumen memiliki kelas target project, dan 70 dokumen memiliki kelas target co-author. Dari total data set tersebut, sebanyak 267 dokumen akan digunakan sebagai training set dan 133 dokumen digunakan sebagai test set. Dengan demikian perbandingan training set : test set sebesar 1:2 [MIT97]. V-1
2 V-2 Pada tahap klasifikasi, dokumen yang akan diklasifikasikan merupakan dokumendokumen web yang dihasilkan oleh query terhadap pasangan nama individu. Hal ini sesuai dengan fungsi GoogleTop( X Y,k) pada Algoritma II-5. Nilai k yang digunakan sebesar Prosedur Eksperimen Eksperimen text classification dilakukan dengan memanfaatkan dua buah algoritma klasifikasi, yaitu Naïve Bayes dan SVM. Algoritma Naïve Bayes disediakan oleh kakas Weka versi Weka merupakan perangkat lunak pembelajaran mesin yang dibangun menggunakan bahasa pemrograman Java ( Perangkat lunak ini mengimplementasikan banyak algoritma pembelajaran mesin dari berbagai macam paradigma. Sedangkan algoritma SVM disediakan oleh kakas SVM Light versi SVM Light merupakan perangkat lunak berbasis teks yang mengimplementasikan teknik SVM dengan menggunakan bahasa pemrograman C ( People/tj/svm_light/ index.html). Secara garis besar, eksperimen text classification dilakukan dengan langkah-langkah sebagai berikut: 1. Melakukan preprocessing pada data set, dengan langkah-langkah sebagai berikut: a. Membuang semua tag html yang terdapat dalam dokumen web. b. Membuang semua kata tidak penting dan baris kosong dalam dokumen web. Kata-kata tidak penting adalah kata-kata yang terdapat dalam daftar stopword atau merupakan bilangan. Daftar stopword diambil dari sistem text retrieval freewais-sf dan dapat dilihat pada Lampiran D. c. Menerapkan stemming pada dokumen yang dihasilkan oleh langkah sebelumnya. Penggunaan stemming dimaksudkan untuk meningkatkan performansi [JOA04]. Stemming yang digunakan adalah Porter Stemming karena tidak memerlukan kamus dan memiliki waktu komputasi yang cepat. d. Membentuk representasi dokumen menjadi vektor kata, baik untuk dokumendokumen yang tidak dikenakan proses stemming (langkah 1.b) maupun untuk dokumen-dokumen yang telah dikenakan proses stemming (langkah 1.c). 2. Menerapkan feature selection melalui pembentukan kelompok kata. Feature selection dilakukan dengan menggunakan pendekatan term frequency, mutual information, dan term frequency-index document frequency. Ketika pendekatan
3 V-3 tersebut diterapkan baik pada dokumen yang dikenakan proses stemming, maupun dokumen yang tidak dikenakan proses stemming. 3. Membangun arsip masukan untuk kakas weka dan kakas SVM Light. 4. Membagi setiap dokumen menjadi training set dan test set secara acak. 5. Melakukan tahap pembelajaran dengan menggunakan algoritma Naïve Bayes dan SVM. 6. Mengimplementasikan Multi Class SVM dengan teknik one-against-one. Kakas SVM Light versi 6.01 hanya ditujukan untuk mengklasifikasikan data set yang hanya memiliki dua kelas target. Karena itu, perlu dibangun program tambahan yang mengimplementasikan Multi Class SVM dengan teknik one-against-one. Program tambahan ini juga mengimplementasikan model klasifikasi yang dihasilkan oleh SVM Light. 7. Mengimplementasikan model klasifikasi yang dihasilkan oleh algoritma Naïve Bayes untuk memprediksi data yang baru. 8. Mengumpulkan dokumen-dokumen web yang akan diklasifikasikan dengan melakukan query ke search engine Google. Dokumen-dokumen tersebut merupakan dokumen yang dihasilkan oleh fungsi GoogleTop( X Y,k) dengan X dan Y adalah kombinasi pasangan individu yang mungkin dan nilai k= Mengimplementasikan algoritma ClassifyRelation yang terdapat pada Algoritma II-5. Langkah ini merupakan tahap klasifikasi data yang baru dengan menggunakan model klasifikasi yang memiliki performansi maksimum. Jenis-jenis eksperimen yang dilakukan untuk algoritma Naïve Bayes dan SVM pada tahap pembelajaran adalah sebagai berikut: 1. Algoritma Naïve Bayes Eksperimen text classification dengan menggunakan algoritma Naïve Bayes dibagi menjadi tiga jenis, yaitu: a. Dokumen direpresentasikan sebagai pasangan atribut dan nilai seperti pada Tabel III-1. Untuk representasi dokumen tersebut, pendekatan feature selection yang digunakan adalah term frequency, mutual information, dan term frequencyindex document frequency baik untuk dokumen yang dikenakan proses stemming, maupun dokumen yang tidak dikenakan proses stemming.
4 V-4 b. Dokumen direpresentasikan sebagai boolean-featured-vector. Pada jenis eksperimen ini atribut pada dokumen adalah n kata yang memiliki bobot tertinggi dari setiap kelompok kata ditambah dengan atribut SameLine dari Tabel III-1. Sedangkan nilai atribut adalah ada tidaknya kata tersebut pada keseluruhan dokumen. Atribut SameLine tetap digunakan karena berdasarkan eksperimen yang dilakukan [MAT06], atribut tersebut merupakan pengklasifikasi yang signifikan. Pada eksperimen ini, n yang digunakan sebesar 50 untuk setiap kelompok kata. Berdasarkan hasil eksperimen sebelumnya (1.a), maka atribut yang digunakan pada eksperimen 1.b merupakan kata-kata pada kelompok kata yang dihasilkan oleh pendekatan term frequency tanpa stemming dan mutual information dengan stemming. Hal ini dikarenakan perolehan akurasi maksimum untuk klasifikasi dokumen tanpa stemming dicapai oleh pendekatan term frequency, sedangkan untuk klasifikasi dokumen dengan stemming dicapai oleh pendekatan mutual information. c. Dokumen direpresentasikan sebagai boolean-featured-vector pada n baris pertama dokumen. Eksperimen ini dilakukan untuk menguji hipotesis bahwa kata-kata yang paling mendeskripsikan suatu kelas target tertentu terletak di baris-baris awal dokumen. Implikasi dari hipotesis ini adalah semakin kecil nilai n, semakin tinggi akurasi yang dicapai. Pada eksperimen ini, n yang digunakan adalah 25%, 50%,75%, dan 100% baris dari keseluruhan jumlah baris pada dokumen. Pada eskperimen sebelumnya (1.a dan 1.b), akurasi maksimum dicapai oleh pendekatan term frequency tanpa stemming. Karena itu, dengan memperhatikan hasil eksperimen sebelumnya, maka pada eksperimen ini atribut yang digunakan adalah kata-kata pada kelompok kata yang dihasilkan dengan pendekatan term frequency tanpa stemming. 2. Algoritma SVM Eksperimen text classification dengan menggunakan algoritma SVM dibagi menjadi tiga jenis, yaitu: a. Dokumen direpresentasikan sebagai pasangan atribut dan nilai seperti pada Tabel III-1.
5 V-5 Dengan memperhatikan akurasi yang dicapai pada eksperimen 1.a, maka pada eksperimen ini pendekatan feature selection yang digunakan adalah term frequency tanpa stemming dan mutual information dengan stemming. b. Dokumen direpresentasikan sebagai boolean-featured-vector Dengan memperhatikan akurasi yang dicapai pada eskperimen sebelumnya 2.a, maka atribut yang digunakan pada eksperimen ini merupakan kata-kata pada kelompok kata yang dihasilkan oleh pendekatan term frequency tanpa stemming. Hal ini dikarenakan perbedaan akurasi yang cukup signifikan untuk pendekatan term frequency tanpa stemming dan mutual information dengan stemming pada eksperimen 2.a. c. Dokumen direpresentasikan sebagai boolean-featured-vector pada n baris pertama dokumen. Seperti halnya pada eksperimen 1.c, eksperimen ini bertujuan untuk menguji hipotesis bahwa kata-kata yang paling mendeskripsikan suatu kelas target tertentu terletak di baris-baris awal dokumen. Nilai n yang digunakan adalah 25%,50%,75%, dan 100% baris dari keseluruhan jumlah baris pada dokumen. Dengan memperhatikan akurasi yang dicapai pada eskperimen sebelumnya (2.b), maka pada eksperimen ini atribut yang digunakan adalah kata-kata pada kelompok kata yang dihasilkan dengan pendekatan term frequency tanpa stemming. 5.4 Pengukuran Performansi Performansi yang diukur dalam eksperimen ini adalah ketepatan atau akurasi algoritma klasifikasi dalam mengklasifikasikan test set berdasarkan model klasifikasi yang dihasilkan. Akurasi dihitung melalui perbandingan jumlah dokumen yang diklasifikasikan dengan benar dengan jumlah seluruh dokumen pada test set. Semakin tinggi nilai akurasi suatu algoritma, berarti semakin bagus performansi algoritma tersebut dalam mengklasifikasikan suatu data yang baru, yang dalam hal ini adalah jenis relasi antar sepasang individu. 5.5 Hasil Hasil eksperimen menggunakan algoritma Naïve Bayes dan SVM dirangkum berdasarkan jenis eksperimen yang telah dijelaskan pada 5.3. Tabel V-1 merangkum hasil eksperimen
6 V-6 nomor 1.a dan 2.a, Tabel V-2 merangkum hasil eksperimen nomor 1.b dan 2.b, sedangkan Tabel V-3 merangkum hasil eksperimen nomor 1.c dan 2.c. Tabel V-1 Hasil Eksperimen Text Classification (a) Pendekatan Feature Selection Non-Stemming Stemming Naïve Bayes SVM Naïve Bayes SVM Term Frequency 91.18% 82.71% 87.50% - Term Frequency-Inverse Document Frequency 76.47% % - Mutual Information 38.24% % 69.92% Tabel V-2 Hasil Eksperimen Text Classification (b) Pendekatan Feature Selection Naïve Bayes SVM Term Frequency (non stemming) % 93.98% Mutual Information (stemming) % - Tabel V-3 Hasil Eksperimen Text Classification (c) Algoritma n=25% n=50% n=75% n=100% Naïve Bayes 93.38% 91.18% 88.97% 88.97% SVM 92.48% 90.23% 86.45% 93.99% 5.6 Diskusi Pengaruh Pendekatan Feature Selection Dari Tabel V-1, feature selection dengan pendekatan term frequency memberikan akurasi tertinggi dibandingkan dua pendekatan lainnya pada Naïve Bayes. Sedangkan pada SVM, pendekatan term frequency juga memberikan akurasi tertinggi dibandingkan dengan pendekatan mutual information.
7 V % 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 91.18% 87.50% 89.34% 76.47% 80.15% 75.00% 75.74% 59.20% 38.24% Non Stemming Stemming Rata-Rata Pendekatan Feature Selection TF TF-IDF MI Gambar V-1 Grafik Eksperimen Pendekatan Feature Selection pada Naïve Bayes Untuk membandingkan performansi ketiga pendekatan feature selection, diambil hasil eksperimen dengan menggunakan Naïve Bayes baik pada dokumen yang telah dikenakan proses stemming, maupun dokumen yang tidak dikenakan proses stemming. Gambar V-1 menunjukkan perbedaan akurasi dari ketiga pendekatan yang digunakan pada eksperimen. Secara rata-rata, pendekatan mutual information memberikan akurasi minimum. Rendahnya akurasi yang dicapai oleh pendekatan mutual information menunjukkan bahwa data set yang digunakan memiliki perbedaan frekuensi kemunculan kata yang sangat tinggi. Akibatnya kata yang jarang muncul akan memiliki bobot mutual information yang jauh lebih tinggi daripada kata yang sering muncul [YAN97]. Hal ini juga diperkuat oleh akurasi yang dicapai oleh pendekatan term frequency-inverse document frequency. Seperti halnya mutual information, inverse document frequency akan memberikan bobot yang tinggi untuk kata-kata yang jarang muncul. Namun, pada pendekatan term frequency-inverse document frequency, bobot inverse document frequency akan dikalikan dengan bobot term frequency sehingga bobotnya akan berada di antara bobot term frequency dan mutual information. Sebagai akibatnya, akurasinya pun berada di antara akurasi yang dicapai oleh pendekatan term frequency dan pendekatan mutual information. Dilihat dari rata rata, perbedaan akurasi pendekatan term frequency dan term frequencyinverse document frequency adalah sebesar 13,61%, sedangkan perbedaan akurasi pendekatan term frequency dan mutual information adalah sebesar 30,15%. Hal ini menunjukkan bahwa akurasi pendekatan term frequency mengungguli dua pendekatan
8 V-8 lainnya walaupun pendekatan term frequency tergolong pendekatan yang sangat sederhana. Berdasarkan diskusi di atas, dapat disimpulkan bahwa performansi pendekatan feature selection tergantung pada karakteristik data set yang digunakan. Dilihat dari akurasinya, pendekatan mutual information tidak cocok jika digunakan untuk data set yang memiliki perbedaan frekuensi kemunculan kata yang tinggi. Sebaliknya, pendekatan term frequency sangat cocok diterapkan pada data set yang memiliki perbedaan frekuensi kemunculan kata yang tinggi Pengaruh Penggunaan Stemming % 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 91.18% 87.50% 76.47% 80.15% 80.88% 75.00% 68.63% 38.24% TF TF-IDF MI Rata-Rata Non Stemming Stemming Gambar V-2 Grafik Eksperimen Pengaruh Stemming pada Naïve Bayes Pengaruh penggunaan stemming pada Naïve Bayes dapat dilihat pada Gambar V-2. Penggunaan stemming ternyata menurunkan akurasi pada pendekatan term frequency dan term frequency-inverse document frequency. Namun penurunan akurasi tersebut tidak terlalu signifikan, yaitu sebesar 3,68% untuk pendekatan term frequency dan 1,47% untuk pendekatan term frequency-inverse document frequency. Dengan demikian pengaruh penggunaan stemming untuk kedua pendekatan tersebut masih sebanding. Akan tetapi, penggunaan stemming ternyata menaikkan akurasi yang sangat signifikan pada pendekatan mutual information, yaitu sebesar 41,91%. Hal ini disebabkan karena
9 V-9 penggunaan stemming akan menurunkan perbedaan frekuensi kemunculan kata pada data set sehingga cocok untuk pendekatan mutual information. Dilihat dari rata-rata akurasinya, dapat disimpulkan bahwa penggunaan stemming menurunkan akurasi. Walaupun demikian penggunakan stemming ternyata menaikkan akurasi yang sangat signifikan pada feature selection dengan pendekatan mutual information Pengaruh Lingkup Dokumen Pengaruh banyaknya jumlah baris yang disertakan pada proses klasifikasi terhadap akurasi dapat dilihat pada Tabel V-3. Pada Naïve Bayes, jumlah baris ternyata berpengaruh terhadap akurasi. Semakin sedikit jumlah baris ternyata menaikkan akurasi. Hal ini membuktikan kebenaran hipotesis awal bahwa kata-kata yang paling mendeskripsikan suatu kelas target tertentu terletak di baris-baris awal dokumen. Akibatnya, semakin sedikit jumlah baris yang diambil, semakin tinggi akurasi yang dihasilkan. Namun, banyaknya jumlah baris yang disertakan pada proses klasifikasi ternyata tidak berpengaruh pada SVM. Hal ini dapat dilihat dari variasi akurasi yang dicapai untuk setiap jumlah baris pada Tabel V-3. Pada SVM, akurasi maksimum dicapai jika seluruh baris dokumen disertakan pada proses klasifikasi. Dengan demikian dapat disimpulkan bahwa hipotesis awal hanya berlaku pada algoritma Naïve Bayes Pengaruh Algoritma Klasifikasi Berdasarkan eksperimen yang telah dilakukan, baik Naive Bayes maupun SVM memberikan akurasi maksimum untuk representasi dokumen sebagai boolean featuredvector, proses feature selection menggunakan pendekatan term frequency serta tanpa proses stemming untuk data set yang digunakan. Perbedaan Naive Bayes dan SVM terletak pada lingkup dokumen yang digunakan. Pada Naive Bayes, akurasi maksimum didapatkan jika digunakan 25% dari baris pertama pada dokumen, sedangkan pada SVM, akurasi maksimum didapatkan jika digunakan keseluruhan dokumen. Berdasarkan Tabel V-3, akurasi maksimum Naive Bayes adalah 93,38% sedangkan akurasi maksimum SVM adalah 93,99%. Dengan demikian, perbedaan akurasi maksimum Naive Bayes dan SVM tidak signifikan, yaitu sebesar 0,61%. Dengan demikian dapat dinyatakan bahwa kedua algoritma tersebut sebanding. Hal ini juga diperkuat oleh hasil eksperimen yang dilakukan oleh [JOA04] dengan data set yang sama.
10 V-10 Karena akurasi kedua algoritma tersebut sebanding, maka dilakukan implementasi model klasifikasi yang dihasilkan oleh kedua algoritma tersebut untuk memprediksi data yang baru. Hasil prediksi adalah jenis relasi antara sepasang individu. Cuplikan hasil prediksi tersebut dapat dilihat pada Lampiran E. Dari hasil prediksi yang telah dilakukan, Naive Bayes cenderung mengklasifikasikan setiap dokumen ke dalam kelas target course karena kelas target course memiliki prior probability yang tinggi sebagai akibat banyaknya dokumen yang memiliki kelas target course dibandingkan dengan dokumen-dokumen yang memiliki kelas target lainnya pada tahap pembelajaran. Hal ini berarti ketepatan Naive Bayes dalam memprediksi data yang baru tergantung dari komposisi dokumendokumen dengan kelas target tertentu pada tahap pembelajaran. Sebaliknya, hasil prediksi SVM lebih variatif karena SVM tidak bergantung pada jumlah dokumen dengan kelas target tertentu pada tahap pembelajaran. Berdasarkan hasil diskusi di atas, dapat disimpulkan bahwa akurasi algoritma klasifikasi konvensional seperti Naïve Bayes sangat tergantung pada proses preprocessing, lingkup dokumen, dan komposisi dokumen dengan kelas target tertentu pada tahap pembelajaran. Sebaliknya, algoritma SVM merupakan teknik pembelajaran baru yang lebih tangguh daripada teknik konvensional karena tidak tergantung pada parameter-parameter di atas. Selain itu, akurasi SVM juga melebihi akurasi Naïve Bayes. Dengan demikian SVM merupakan algoritma yang memberikan performansi maksimum untuk permasalahan text classification.
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciBAB III METODE PEMBANGUNAN SOCIAL NETWORK
BAB III METODE PEMBANGUNAN SOCIAL NETWORK Pada bab tiga ini dibahas mengenai pembangunan social network dari dokumen web. Pembahasan meliputi analisis teknik SNE, algoritma lintasan terpendek, dan contoh
Lebih terperinciBAB IV EKSPERIMEN. 4.1 Tujuan
BAB IV EKSPERIMEN Pada bab ini dibahas mengenai eksperimen penggunaan SVM dalam pendeteksian intrusi pada jaringan. Pembahasan ini meliputi tujuan yang ingin dicapai melalui eksperimen ini, parameter evaluasi
Lebih terperinciBAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine
BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan
Lebih terperinciBAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
Lebih terperinciBAB III METODOLOGI PENELITIAN
28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian
Lebih terperinciBAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya perkembangan teknologi dewasa ini telah menyebabkan aliran informasi begitu lancar
Lebih terperinci1. Pendahuluan. 1.1 Latar belakang
1. Pendahuluan 1.1 Latar belakang Pada saat ini, kebutuhan setiap individu terhadap Internet semakin meningkat. Hal ini terlihat dari semakin banyaknya fasilitas yang ditawarkan dari dunia Internet itu
Lebih terperinciUKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN
BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review
Lebih terperinciUKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah
1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciGambar 1.1 Proses Text Mining [7]
1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision
Lebih terperinciBAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah
BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu
Lebih terperinciBAB III ANALISIS DAN PENYELESAIAN MASALAH
BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciPENDAHULUAN. 1.1 Latar Belakang
DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 1.1. Rancangan Penelitian Rancangan penelitian adalah rencana dan struktur penyelidikan yang disusun sedemikian rupa sehingga penelitian akan memperoleh jawaban untuk pertanyaan-pertanyaan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database
Lebih terperinciBAB IV IMPLEMENTASI DAN PENGUJIAN
90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada
Lebih terperinciSocial Network Extraction dan Social Network Analysis dari Web
Social Network Extraction dan Social Network Analysis dari Web LAPORAN TUGAS AKHIR Disusun sebagai syarat kelulusan tingkat sarjana oleh : Maria Helena Iwo / 13503088 PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH
Lebih terperinciStudi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine
Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,
Lebih terperinciBAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.
BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium
Lebih terperinci1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
Lebih terperinciIMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA
IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
Lebih terperinciROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Lebih terperinciSISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak
SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciIMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS
IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat mempermudah akses terhadap informasi tekstual yang sangat besar jumlahnya, baik yang terdapat pada Internet maupun pada koleksi dokumen
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciKLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR
KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR Persyaratan Guna Meraih Gelar Sarjana Strata I Teknik Informatika Universitas Muhammadiyah Malang Nama : Ayu
Lebih terperinciBAB IV EKSPERIMEN. 4.1 Tujuan Eksperimen. 4.2 Lingkungan Eksperimen
BAB IV EKSPERIMEN 4.1 Tujuan Eksperimen Terdapat beberapa hal yang menjadi tujuan eksperimen, yaitu: 1. Membandingkan performansi hasil eksperimen dengan hasil penelitian [LI05a], menggunakan dataset dan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem
Lebih terperinciPengujian Kerelevanan Sistem Temu Kembali Informasi
Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem
Lebih terperinciIntegrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction
Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Musik memiliki peran yang penting bagi kehidupan manusia. Selain sebagai media hiburan, musik juga merupakan media bantu diri untuk menangani perasaan emosi
Lebih terperinciKLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA
KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinci1 BAB I PENDAHULUAN. 1.1 Latar Belakang
1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh
Lebih terperinciBAB 4 IMPLEMENTASI DAN EVALUASI
BAB 4 IMPLEMENTASI AN EVALUASI Pada bab ini, disajikan spesifikasi sistem yang digunakan, pengujian program serta hasil pengujian. Pengujian dilakukan dengan melakukan pencarian kata kunci terhadap sejumlah
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciPENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA.
PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA Gunawan 1, Devi Dwi Purwanto, Herman Budianto, dan Indra Maryati 1 Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN Pada bab ini dijelaskan latar belakang dari penelitian klasifikasi dokumen teks. Tujuan dan ruang lingkup dari tugas akhir memberikan penjelasan mengenai hasil yang ingin diketahui dan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
Lebih terperinciBab I Pendahuluan. 1.1 Latar Belakang
Bab I Pendahuluan 1.1 Latar Belakang Klasifikasi merupakan task dari data mining yang bertujuan untuk memberikan label kelas terhadap suatu data. Pemberian label kelas ini dilakukan oleh classifier. Suatu
Lebih terperinciBAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen
BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan
Lebih terperinciSTUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR
STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak
Lebih terperinciBAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada sekarang ini ketersediaan informasi berbentuk dokumen teks sebagian besar sudah berbentuk elektronik (softcopy). Kemungkinan penyimpanan media teks ke
Lebih terperinciIMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB
IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi
Lebih terperinciBAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN
28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi
Lebih terperinciBAB I PENDAHULUAN Latar Belakang Masalah
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun
Lebih terperinciDETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW
DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW Nia Meliana Umi Proboyekti, Jong Jek Siang Abstrak Pembuatan tugas akhir mahasiswa diharapkan sesuai
Lebih terperinciStemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Lebih terperinciBAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga
1 BAB I PENDAHULUAN A. Latar Belakang Dalam era teknologi informasi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung
Lebih terperinciBAB II TINJAUAN PUSTAKA
7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan
Lebih terperinciSistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)
Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15
Lebih terperinciBAB I PENDAHULUAN I-1
BAB I PENDAHULUAN 1.1 Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas merupakan sebuah bukti nyata bahwa informasi sangat diperlukan bagi pencari informasi [16]. Dengan munculnya
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review
Lebih terperinciSISTEM TEMU KEMBALI INFORMASI
SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik
Lebih terperinciBAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang
Lebih terperinciANALISA KECENDERUNGAN KARAKTER BERDASARKAN KEYWORD DALAM SHORT MESSAGE SERVICE BERBASIS PROTOTYPE ANDROID SOFTWARE APPLICATION
Jurnal Penelitian Pendidikan Indonesia (JPPI) ISSN 2477-2240 (Media Cetak). 2477-3921 (Media Online) ANALISA KECENDERUNGAN KARAKTER BERDASARKAN KEYWORD DALAM SHORT MESSAGE SERVICE BERBASIS PROTOTYPE ANDROID
Lebih terperinciBAB 1 PENDAHULUAN 1.1. Latar belakang
BAB 1 PENDAHULUAN 1.1. Latar belakang Dengan adanya perkembangan dan pertumbuhan yang secara cepat dalam hal informasi elektronik sangat diperlukan suatu proses untuk menyelesaikan suatu permasalahan itu
Lebih terperinci4 BAB 4 IMPLEMENTASI DAN PENGUJIAN
4 BAB 4 IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Implementasi adalah penerapan hasil perancangan yang telah dilakukan pada tahap analisis dan perancangan sistem. Hasil perancangan diterapkan menjadi
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN Bab ini berisikan tentang alasan peneliti mengambil permasalahan ini. Pada bab ini poin-poin yang akan dipaparkan antara lain Latar Belakang, Perumusan Masalah, Batasan Masalah, Tujuan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciUNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester
Lebih terperinciDocument Indexing dan Term Weighting. M. Ali Fauzi
Document Indexing dan Term Weighting M. Ali Fauzi Document Indexing Setelah melakukan preprocessing, kita akan mendapatkan sebuah set term yang bisa kita jadikan sebagai indeks. Indeks adalah perwakilan
Lebih terperinciKLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO
F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan
Lebih terperinciPerbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor
Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik
Lebih terperinciEKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN
EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik
Lebih terperinciAplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)
Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) IF3 Aljabar Geometri Oleh: Rinaldi Munir Program Studi Informatika, STEI-ITB Rinaldi Munir - IF3 Aljabar Geometri
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1. Desain Penelitian Gambar 3. 1 Desain Penelitian Pemilihan Mahasiswa Berprestasi 28 29 3.2. Metode Penelitian 1.2.1. Metode Pengumpulan Data Metode pengumpulan data yang
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE
PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE OLGA CERIA SARI NRP 5106 100 618 DOSEN PEMBIMBING: Sarwosri,S.Kom,MT. Umi Laili Yuhana, S.Kom, M.Sc LATAR BELAKANG Kebutuhan
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Masalah Setiap tahunnya, DPP Infokom selaku panitia Pelatihan Aplikasi Teknologi dan Informasi (PATI) Universitas Muhammadiyah Malang menerima ribuan
Lebih terperinciBAB II TINJAUAN PUSTAKA
digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter
Lebih terperinciPemanfaatan Aljabar Vektor Pada Mesin Pencari
Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia
Lebih terperinciBAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk
Lebih terperinciPEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS
PEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS J.B. Budi Darmawan Dosen Program Studi Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Weblog, atau yang sering disebut sebagai Blog, merupakan bagian tak terpisahkan dalam perkembangan dunia teknologi informasi berbasis Web. Berbagai jenis informasi
Lebih terperinciIMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan berkembangnya Internet, banyak informasi tersedia dalam World Wide Web yang dapat diakses di seluruh negara. Pada saat pencarian informasi menggunakan search
Lebih terperinci