BAB V EKSPERIMEN TEXT CLASSIFICATION

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB V EKSPERIMEN TEXT CLASSIFICATION"

Transkripsi

1 BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan feature selection. Tujuan dilakukan eksperimen text classification ini adalah untuk menentukan algoritma dan pendekatan feature selection yang memberikan performansi maksimum dalam menyelesaikan permasalahan text classification. 5.1 Lingkungan Eksperimen Eksperimen dilakukan menggunakan perangkat-perangkat sebagai berikut: 1. Laptop dengan processor Intel Pentium M 1.83 GHz dan memory 1 GB DDR2. 2. Sistem operasi Windows XP. 3. Java Runtime Environment 5 4. Weka SVM Light Data Data set yang digunakan tahap pembelajaran terdiri dari dua sumber data sesuai dengan kelas targetnya. Untuk kelas target course dan project, data set yang digunakan adalah dokumen-dokumen web yang dikumpulkan dari situs departemen Computer Science Universitas Cornell, Universitas Washington, Universitas Texas, dan Universitas Wisconsin. Data set tersebut dapat diakses pada situs Untuk kelas target co-author, data set yang digunakan adalah makalah-makalah ilmiah yang dikumpulkan dari situs Jumlah total data set yang digunakan dalam tahap pembelajaran adalah 400 dokumen, dengan perincian 244 dokumen memiliki kelas target course, 86 dokumen memiliki kelas target project, dan 70 dokumen memiliki kelas target co-author. Dari total data set tersebut, sebanyak 267 dokumen akan digunakan sebagai training set dan 133 dokumen digunakan sebagai test set. Dengan demikian perbandingan training set : test set sebesar 1:2 [MIT97]. V-1

2 V-2 Pada tahap klasifikasi, dokumen yang akan diklasifikasikan merupakan dokumendokumen web yang dihasilkan oleh query terhadap pasangan nama individu. Hal ini sesuai dengan fungsi GoogleTop( X Y,k) pada Algoritma II-5. Nilai k yang digunakan sebesar Prosedur Eksperimen Eksperimen text classification dilakukan dengan memanfaatkan dua buah algoritma klasifikasi, yaitu Naïve Bayes dan SVM. Algoritma Naïve Bayes disediakan oleh kakas Weka versi Weka merupakan perangkat lunak pembelajaran mesin yang dibangun menggunakan bahasa pemrograman Java ( Perangkat lunak ini mengimplementasikan banyak algoritma pembelajaran mesin dari berbagai macam paradigma. Sedangkan algoritma SVM disediakan oleh kakas SVM Light versi SVM Light merupakan perangkat lunak berbasis teks yang mengimplementasikan teknik SVM dengan menggunakan bahasa pemrograman C ( People/tj/svm_light/ index.html). Secara garis besar, eksperimen text classification dilakukan dengan langkah-langkah sebagai berikut: 1. Melakukan preprocessing pada data set, dengan langkah-langkah sebagai berikut: a. Membuang semua tag html yang terdapat dalam dokumen web. b. Membuang semua kata tidak penting dan baris kosong dalam dokumen web. Kata-kata tidak penting adalah kata-kata yang terdapat dalam daftar stopword atau merupakan bilangan. Daftar stopword diambil dari sistem text retrieval freewais-sf dan dapat dilihat pada Lampiran D. c. Menerapkan stemming pada dokumen yang dihasilkan oleh langkah sebelumnya. Penggunaan stemming dimaksudkan untuk meningkatkan performansi [JOA04]. Stemming yang digunakan adalah Porter Stemming karena tidak memerlukan kamus dan memiliki waktu komputasi yang cepat. d. Membentuk representasi dokumen menjadi vektor kata, baik untuk dokumendokumen yang tidak dikenakan proses stemming (langkah 1.b) maupun untuk dokumen-dokumen yang telah dikenakan proses stemming (langkah 1.c). 2. Menerapkan feature selection melalui pembentukan kelompok kata. Feature selection dilakukan dengan menggunakan pendekatan term frequency, mutual information, dan term frequency-index document frequency. Ketika pendekatan

3 V-3 tersebut diterapkan baik pada dokumen yang dikenakan proses stemming, maupun dokumen yang tidak dikenakan proses stemming. 3. Membangun arsip masukan untuk kakas weka dan kakas SVM Light. 4. Membagi setiap dokumen menjadi training set dan test set secara acak. 5. Melakukan tahap pembelajaran dengan menggunakan algoritma Naïve Bayes dan SVM. 6. Mengimplementasikan Multi Class SVM dengan teknik one-against-one. Kakas SVM Light versi 6.01 hanya ditujukan untuk mengklasifikasikan data set yang hanya memiliki dua kelas target. Karena itu, perlu dibangun program tambahan yang mengimplementasikan Multi Class SVM dengan teknik one-against-one. Program tambahan ini juga mengimplementasikan model klasifikasi yang dihasilkan oleh SVM Light. 7. Mengimplementasikan model klasifikasi yang dihasilkan oleh algoritma Naïve Bayes untuk memprediksi data yang baru. 8. Mengumpulkan dokumen-dokumen web yang akan diklasifikasikan dengan melakukan query ke search engine Google. Dokumen-dokumen tersebut merupakan dokumen yang dihasilkan oleh fungsi GoogleTop( X Y,k) dengan X dan Y adalah kombinasi pasangan individu yang mungkin dan nilai k= Mengimplementasikan algoritma ClassifyRelation yang terdapat pada Algoritma II-5. Langkah ini merupakan tahap klasifikasi data yang baru dengan menggunakan model klasifikasi yang memiliki performansi maksimum. Jenis-jenis eksperimen yang dilakukan untuk algoritma Naïve Bayes dan SVM pada tahap pembelajaran adalah sebagai berikut: 1. Algoritma Naïve Bayes Eksperimen text classification dengan menggunakan algoritma Naïve Bayes dibagi menjadi tiga jenis, yaitu: a. Dokumen direpresentasikan sebagai pasangan atribut dan nilai seperti pada Tabel III-1. Untuk representasi dokumen tersebut, pendekatan feature selection yang digunakan adalah term frequency, mutual information, dan term frequencyindex document frequency baik untuk dokumen yang dikenakan proses stemming, maupun dokumen yang tidak dikenakan proses stemming.

4 V-4 b. Dokumen direpresentasikan sebagai boolean-featured-vector. Pada jenis eksperimen ini atribut pada dokumen adalah n kata yang memiliki bobot tertinggi dari setiap kelompok kata ditambah dengan atribut SameLine dari Tabel III-1. Sedangkan nilai atribut adalah ada tidaknya kata tersebut pada keseluruhan dokumen. Atribut SameLine tetap digunakan karena berdasarkan eksperimen yang dilakukan [MAT06], atribut tersebut merupakan pengklasifikasi yang signifikan. Pada eksperimen ini, n yang digunakan sebesar 50 untuk setiap kelompok kata. Berdasarkan hasil eksperimen sebelumnya (1.a), maka atribut yang digunakan pada eksperimen 1.b merupakan kata-kata pada kelompok kata yang dihasilkan oleh pendekatan term frequency tanpa stemming dan mutual information dengan stemming. Hal ini dikarenakan perolehan akurasi maksimum untuk klasifikasi dokumen tanpa stemming dicapai oleh pendekatan term frequency, sedangkan untuk klasifikasi dokumen dengan stemming dicapai oleh pendekatan mutual information. c. Dokumen direpresentasikan sebagai boolean-featured-vector pada n baris pertama dokumen. Eksperimen ini dilakukan untuk menguji hipotesis bahwa kata-kata yang paling mendeskripsikan suatu kelas target tertentu terletak di baris-baris awal dokumen. Implikasi dari hipotesis ini adalah semakin kecil nilai n, semakin tinggi akurasi yang dicapai. Pada eksperimen ini, n yang digunakan adalah 25%, 50%,75%, dan 100% baris dari keseluruhan jumlah baris pada dokumen. Pada eskperimen sebelumnya (1.a dan 1.b), akurasi maksimum dicapai oleh pendekatan term frequency tanpa stemming. Karena itu, dengan memperhatikan hasil eksperimen sebelumnya, maka pada eksperimen ini atribut yang digunakan adalah kata-kata pada kelompok kata yang dihasilkan dengan pendekatan term frequency tanpa stemming. 2. Algoritma SVM Eksperimen text classification dengan menggunakan algoritma SVM dibagi menjadi tiga jenis, yaitu: a. Dokumen direpresentasikan sebagai pasangan atribut dan nilai seperti pada Tabel III-1.

5 V-5 Dengan memperhatikan akurasi yang dicapai pada eksperimen 1.a, maka pada eksperimen ini pendekatan feature selection yang digunakan adalah term frequency tanpa stemming dan mutual information dengan stemming. b. Dokumen direpresentasikan sebagai boolean-featured-vector Dengan memperhatikan akurasi yang dicapai pada eskperimen sebelumnya 2.a, maka atribut yang digunakan pada eksperimen ini merupakan kata-kata pada kelompok kata yang dihasilkan oleh pendekatan term frequency tanpa stemming. Hal ini dikarenakan perbedaan akurasi yang cukup signifikan untuk pendekatan term frequency tanpa stemming dan mutual information dengan stemming pada eksperimen 2.a. c. Dokumen direpresentasikan sebagai boolean-featured-vector pada n baris pertama dokumen. Seperti halnya pada eksperimen 1.c, eksperimen ini bertujuan untuk menguji hipotesis bahwa kata-kata yang paling mendeskripsikan suatu kelas target tertentu terletak di baris-baris awal dokumen. Nilai n yang digunakan adalah 25%,50%,75%, dan 100% baris dari keseluruhan jumlah baris pada dokumen. Dengan memperhatikan akurasi yang dicapai pada eskperimen sebelumnya (2.b), maka pada eksperimen ini atribut yang digunakan adalah kata-kata pada kelompok kata yang dihasilkan dengan pendekatan term frequency tanpa stemming. 5.4 Pengukuran Performansi Performansi yang diukur dalam eksperimen ini adalah ketepatan atau akurasi algoritma klasifikasi dalam mengklasifikasikan test set berdasarkan model klasifikasi yang dihasilkan. Akurasi dihitung melalui perbandingan jumlah dokumen yang diklasifikasikan dengan benar dengan jumlah seluruh dokumen pada test set. Semakin tinggi nilai akurasi suatu algoritma, berarti semakin bagus performansi algoritma tersebut dalam mengklasifikasikan suatu data yang baru, yang dalam hal ini adalah jenis relasi antar sepasang individu. 5.5 Hasil Hasil eksperimen menggunakan algoritma Naïve Bayes dan SVM dirangkum berdasarkan jenis eksperimen yang telah dijelaskan pada 5.3. Tabel V-1 merangkum hasil eksperimen

6 V-6 nomor 1.a dan 2.a, Tabel V-2 merangkum hasil eksperimen nomor 1.b dan 2.b, sedangkan Tabel V-3 merangkum hasil eksperimen nomor 1.c dan 2.c. Tabel V-1 Hasil Eksperimen Text Classification (a) Pendekatan Feature Selection Non-Stemming Stemming Naïve Bayes SVM Naïve Bayes SVM Term Frequency 91.18% 82.71% 87.50% - Term Frequency-Inverse Document Frequency 76.47% % - Mutual Information 38.24% % 69.92% Tabel V-2 Hasil Eksperimen Text Classification (b) Pendekatan Feature Selection Naïve Bayes SVM Term Frequency (non stemming) % 93.98% Mutual Information (stemming) % - Tabel V-3 Hasil Eksperimen Text Classification (c) Algoritma n=25% n=50% n=75% n=100% Naïve Bayes 93.38% 91.18% 88.97% 88.97% SVM 92.48% 90.23% 86.45% 93.99% 5.6 Diskusi Pengaruh Pendekatan Feature Selection Dari Tabel V-1, feature selection dengan pendekatan term frequency memberikan akurasi tertinggi dibandingkan dua pendekatan lainnya pada Naïve Bayes. Sedangkan pada SVM, pendekatan term frequency juga memberikan akurasi tertinggi dibandingkan dengan pendekatan mutual information.

7 V % 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 91.18% 87.50% 89.34% 76.47% 80.15% 75.00% 75.74% 59.20% 38.24% Non Stemming Stemming Rata-Rata Pendekatan Feature Selection TF TF-IDF MI Gambar V-1 Grafik Eksperimen Pendekatan Feature Selection pada Naïve Bayes Untuk membandingkan performansi ketiga pendekatan feature selection, diambil hasil eksperimen dengan menggunakan Naïve Bayes baik pada dokumen yang telah dikenakan proses stemming, maupun dokumen yang tidak dikenakan proses stemming. Gambar V-1 menunjukkan perbedaan akurasi dari ketiga pendekatan yang digunakan pada eksperimen. Secara rata-rata, pendekatan mutual information memberikan akurasi minimum. Rendahnya akurasi yang dicapai oleh pendekatan mutual information menunjukkan bahwa data set yang digunakan memiliki perbedaan frekuensi kemunculan kata yang sangat tinggi. Akibatnya kata yang jarang muncul akan memiliki bobot mutual information yang jauh lebih tinggi daripada kata yang sering muncul [YAN97]. Hal ini juga diperkuat oleh akurasi yang dicapai oleh pendekatan term frequency-inverse document frequency. Seperti halnya mutual information, inverse document frequency akan memberikan bobot yang tinggi untuk kata-kata yang jarang muncul. Namun, pada pendekatan term frequency-inverse document frequency, bobot inverse document frequency akan dikalikan dengan bobot term frequency sehingga bobotnya akan berada di antara bobot term frequency dan mutual information. Sebagai akibatnya, akurasinya pun berada di antara akurasi yang dicapai oleh pendekatan term frequency dan pendekatan mutual information. Dilihat dari rata rata, perbedaan akurasi pendekatan term frequency dan term frequencyinverse document frequency adalah sebesar 13,61%, sedangkan perbedaan akurasi pendekatan term frequency dan mutual information adalah sebesar 30,15%. Hal ini menunjukkan bahwa akurasi pendekatan term frequency mengungguli dua pendekatan

8 V-8 lainnya walaupun pendekatan term frequency tergolong pendekatan yang sangat sederhana. Berdasarkan diskusi di atas, dapat disimpulkan bahwa performansi pendekatan feature selection tergantung pada karakteristik data set yang digunakan. Dilihat dari akurasinya, pendekatan mutual information tidak cocok jika digunakan untuk data set yang memiliki perbedaan frekuensi kemunculan kata yang tinggi. Sebaliknya, pendekatan term frequency sangat cocok diterapkan pada data set yang memiliki perbedaan frekuensi kemunculan kata yang tinggi Pengaruh Penggunaan Stemming % 90.00% 80.00% 70.00% 60.00% 50.00% 40.00% 30.00% 20.00% 10.00% 0.00% 91.18% 87.50% 76.47% 80.15% 80.88% 75.00% 68.63% 38.24% TF TF-IDF MI Rata-Rata Non Stemming Stemming Gambar V-2 Grafik Eksperimen Pengaruh Stemming pada Naïve Bayes Pengaruh penggunaan stemming pada Naïve Bayes dapat dilihat pada Gambar V-2. Penggunaan stemming ternyata menurunkan akurasi pada pendekatan term frequency dan term frequency-inverse document frequency. Namun penurunan akurasi tersebut tidak terlalu signifikan, yaitu sebesar 3,68% untuk pendekatan term frequency dan 1,47% untuk pendekatan term frequency-inverse document frequency. Dengan demikian pengaruh penggunaan stemming untuk kedua pendekatan tersebut masih sebanding. Akan tetapi, penggunaan stemming ternyata menaikkan akurasi yang sangat signifikan pada pendekatan mutual information, yaitu sebesar 41,91%. Hal ini disebabkan karena

9 V-9 penggunaan stemming akan menurunkan perbedaan frekuensi kemunculan kata pada data set sehingga cocok untuk pendekatan mutual information. Dilihat dari rata-rata akurasinya, dapat disimpulkan bahwa penggunaan stemming menurunkan akurasi. Walaupun demikian penggunakan stemming ternyata menaikkan akurasi yang sangat signifikan pada feature selection dengan pendekatan mutual information Pengaruh Lingkup Dokumen Pengaruh banyaknya jumlah baris yang disertakan pada proses klasifikasi terhadap akurasi dapat dilihat pada Tabel V-3. Pada Naïve Bayes, jumlah baris ternyata berpengaruh terhadap akurasi. Semakin sedikit jumlah baris ternyata menaikkan akurasi. Hal ini membuktikan kebenaran hipotesis awal bahwa kata-kata yang paling mendeskripsikan suatu kelas target tertentu terletak di baris-baris awal dokumen. Akibatnya, semakin sedikit jumlah baris yang diambil, semakin tinggi akurasi yang dihasilkan. Namun, banyaknya jumlah baris yang disertakan pada proses klasifikasi ternyata tidak berpengaruh pada SVM. Hal ini dapat dilihat dari variasi akurasi yang dicapai untuk setiap jumlah baris pada Tabel V-3. Pada SVM, akurasi maksimum dicapai jika seluruh baris dokumen disertakan pada proses klasifikasi. Dengan demikian dapat disimpulkan bahwa hipotesis awal hanya berlaku pada algoritma Naïve Bayes Pengaruh Algoritma Klasifikasi Berdasarkan eksperimen yang telah dilakukan, baik Naive Bayes maupun SVM memberikan akurasi maksimum untuk representasi dokumen sebagai boolean featuredvector, proses feature selection menggunakan pendekatan term frequency serta tanpa proses stemming untuk data set yang digunakan. Perbedaan Naive Bayes dan SVM terletak pada lingkup dokumen yang digunakan. Pada Naive Bayes, akurasi maksimum didapatkan jika digunakan 25% dari baris pertama pada dokumen, sedangkan pada SVM, akurasi maksimum didapatkan jika digunakan keseluruhan dokumen. Berdasarkan Tabel V-3, akurasi maksimum Naive Bayes adalah 93,38% sedangkan akurasi maksimum SVM adalah 93,99%. Dengan demikian, perbedaan akurasi maksimum Naive Bayes dan SVM tidak signifikan, yaitu sebesar 0,61%. Dengan demikian dapat dinyatakan bahwa kedua algoritma tersebut sebanding. Hal ini juga diperkuat oleh hasil eksperimen yang dilakukan oleh [JOA04] dengan data set yang sama.

10 V-10 Karena akurasi kedua algoritma tersebut sebanding, maka dilakukan implementasi model klasifikasi yang dihasilkan oleh kedua algoritma tersebut untuk memprediksi data yang baru. Hasil prediksi adalah jenis relasi antara sepasang individu. Cuplikan hasil prediksi tersebut dapat dilihat pada Lampiran E. Dari hasil prediksi yang telah dilakukan, Naive Bayes cenderung mengklasifikasikan setiap dokumen ke dalam kelas target course karena kelas target course memiliki prior probability yang tinggi sebagai akibat banyaknya dokumen yang memiliki kelas target course dibandingkan dengan dokumen-dokumen yang memiliki kelas target lainnya pada tahap pembelajaran. Hal ini berarti ketepatan Naive Bayes dalam memprediksi data yang baru tergantung dari komposisi dokumendokumen dengan kelas target tertentu pada tahap pembelajaran. Sebaliknya, hasil prediksi SVM lebih variatif karena SVM tidak bergantung pada jumlah dokumen dengan kelas target tertentu pada tahap pembelajaran. Berdasarkan hasil diskusi di atas, dapat disimpulkan bahwa akurasi algoritma klasifikasi konvensional seperti Naïve Bayes sangat tergantung pada proses preprocessing, lingkup dokumen, dan komposisi dokumen dengan kelas target tertentu pada tahap pembelajaran. Sebaliknya, algoritma SVM merupakan teknik pembelajaran baru yang lebih tangguh daripada teknik konvensional karena tidak tergantung pada parameter-parameter di atas. Selain itu, akurasi SVM juga melebihi akurasi Naïve Bayes. Dengan demikian SVM merupakan algoritma yang memberikan performansi maksimum untuk permasalahan text classification.

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB III METODE PEMBANGUNAN SOCIAL NETWORK

BAB III METODE PEMBANGUNAN SOCIAL NETWORK BAB III METODE PEMBANGUNAN SOCIAL NETWORK Pada bab tiga ini dibahas mengenai pembangunan social network dari dokumen web. Pembahasan meliputi analisis teknik SNE, algoritma lintasan terpendek, dan contoh

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan

BAB IV EKSPERIMEN. 4.1 Tujuan BAB IV EKSPERIMEN Pada bab ini dibahas mengenai eksperimen penggunaan SVM dalam pendeteksian intrusi pada jaringan. Pembahasan ini meliputi tujuan yang ingin dicapai melalui eksperimen ini, parameter evaluasi

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya

BAB I PENDAHULUAN. Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Pesatnya perkembangan teknologi dewasa ini telah menyebabkan aliran informasi begitu lancar

Lebih terperinci

1. Pendahuluan. 1.1 Latar belakang

1. Pendahuluan. 1.1 Latar belakang 1. Pendahuluan 1.1 Latar belakang Pada saat ini, kebutuhan setiap individu terhadap Internet semakin meningkat. Hal ini terlihat dari semakin banyaknya fasilitas yang ditawarkan dari dunia Internet itu

Lebih terperinci

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN

UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1.2 Hipotesis BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Setiap matakuliah memiliki silabus perkuliahan yang berisi materi-materi mengenai matakuliah tersebut. Silabus disusun berdasarkan buku-buku referensi utama

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tes Secara harfiah kata tes berasal dari kata bahasa prancis kuno: testum yang berarti piring untuk menyisihkan logam-logam mulia, dalam bahasa Indonesia diterjemahkan dengan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penelitian Terkait 2.1.1. Implementasi Opinion Mining Pernah dilakukan penelitian tentang opinion mining membahas tentang ekstraksi data opini publik pada perguruan tinggi.

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

Gambar 1.1 Proses Text Mining [7]

Gambar 1.1 Proses Text Mining [7] 1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Analisis sentimen merupakan proses dalam mengolah, memahami, dan mengekstrak data dalam bentuk teks terhadap suatu topik, kejadian ataupun individu untuk mendapatkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang DAFTAR TABEL Tabel 3-1 Dokumen Term 1... 17 Tabel 3-2 Representasi... 18 Tabel 3-3 Centroid pada pengulangan ke-0... 19 Tabel 3-4 Hasil Perhitungan Jarak... 19 Tabel 3-5 Hasil Perhitungan Jarak dan Pengelompokkan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 1.1. Rancangan Penelitian Rancangan penelitian adalah rencana dan struktur penyelidikan yang disusun sedemikian rupa sehingga penelitian akan memperoleh jawaban untuk pertanyaan-pertanyaan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB IV IMPLEMENTASI DAN PENGUJIAN

BAB IV IMPLEMENTASI DAN PENGUJIAN 90 BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Sistem Tahap ini merupakan tahap dari implementasi program serta implementasi dari setiap proses tahap penelitian. 4.1.2 Persiapan Arsitektur Pada

Lebih terperinci

Social Network Extraction dan Social Network Analysis dari Web

Social Network Extraction dan Social Network Analysis dari Web Social Network Extraction dan Social Network Analysis dari Web LAPORAN TUGAS AKHIR Disusun sebagai syarat kelulusan tingkat sarjana oleh : Maria Helena Iwo / 13503088 PROGRAM STUDI TEKNIK INFORMATIKA SEKOLAH

Lebih terperinci

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine

Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA Erik Hardiyanto 1, Faisal Rahutomo 2, Dwi Puspitasari 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

ROCCHIO CLASSIFICATION

ROCCHIO CLASSIFICATION DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi

Lebih terperinci

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak

SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas

Lebih terperinci

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR YANG BERDASARKAN ONE PASS CLUSTERING UNTUK KATEGORISASI TEKS Andreas Daniel Arifin 1, Isye Arieshanti 2, Agus Zainal Arifin 3 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat mempermudah akses terhadap informasi tekstual yang sangat besar jumlahnya, baik yang terdapat pada Internet maupun pada koleksi dokumen

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR

KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR KLASIFIKASI TEKS BERBASIS ONTOLOGI UNTUK DOKUMEN TUGAS AKHIR BERBAHASA INDONESIA TUGAS AKHIR Persyaratan Guna Meraih Gelar Sarjana Strata I Teknik Informatika Universitas Muhammadiyah Malang Nama : Ayu

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan Eksperimen. 4.2 Lingkungan Eksperimen

BAB IV EKSPERIMEN. 4.1 Tujuan Eksperimen. 4.2 Lingkungan Eksperimen BAB IV EKSPERIMEN 4.1 Tujuan Eksperimen Terdapat beberapa hal yang menjadi tujuan eksperimen, yaitu: 1. Membandingkan performansi hasil eksperimen dengan hasil penelitian [LI05a], menggunakan dataset dan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem

Lebih terperinci

Pengujian Kerelevanan Sistem Temu Kembali Informasi

Pengujian Kerelevanan Sistem Temu Kembali Informasi Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam wibowo@polibatam.ac.id Abstrak Sistem

Lebih terperinci

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction

Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Integrasi Peringkas Dokumen Otomatis Dengan Penggabungan Metode Fitur dan Metode Latent Semantic Analysis (LSA) Sebagai Feature Reduction Junta Zeniarja 1, Abu Salam 2, Ardytha Luthfiarta 3, L Budi Handoko

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Musik memiliki peran yang penting bagi kehidupan manusia. Selain sebagai media hiburan, musik juga merupakan media bantu diri untuk menangani perasaan emosi

Lebih terperinci

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA

KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA KLASIFIKASI DOKUMEN BAHASA INDONESIA MENGGUNAKAN ADAPTIVE CLASSIFIER COMBINATION (ACC) MUTHIA AZIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

1 BAB I PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan infrastruktur teknologi informasi dan penggunaannya berdampak luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah dalam memperoleh

Lebih terperinci

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB 4 IMPLEMENTASI DAN EVALUASI BAB 4 IMPLEMENTASI AN EVALUASI Pada bab ini, disajikan spesifikasi sistem yang digunakan, pengujian program serta hasil pengujian. Pengujian dilakukan dengan melakukan pencarian kata kunci terhadap sejumlah

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA.

PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA. PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA Gunawan 1, Devi Dwi Purwanto, Herman Budianto, dan Indra Maryati 1 Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN Pada bab ini dijelaskan latar belakang dari penelitian klasifikasi dokumen teks. Tujuan dan ruang lingkup dari tugas akhir memberikan penjelasan mengenai hasil yang ingin diketahui dan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &

Lebih terperinci

Bab I Pendahuluan. 1.1 Latar Belakang

Bab I Pendahuluan. 1.1 Latar Belakang Bab I Pendahuluan 1.1 Latar Belakang Klasifikasi merupakan task dari data mining yang bertujuan untuk memberikan label kelas terhadap suatu data. Pemberian label kelas ini dilakukan oleh classifier. Suatu

Lebih terperinci

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen

BAB III PERANCANGAN. Fitur. Reduksi & Pengelompokan. Gambar 3.1. Alur Pengelompokan Dokumen BAB III PERANCANGAN Pada bab ini akan delaskan tahapan yang dilalui dalam melakukan perancangan penelitian yang akan dilakukan dalam tugas akhir ini. Tahapan tersebut meliputi perancangan implementasi

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan

Lebih terperinci

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR Erik Hardiyanto 1), Faisal Rahutomo 1) 1 Jurusan Teknologi Informasi, Program Studi Teknik Informatika,

Lebih terperinci

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak

Lebih terperinci

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy). BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada sekarang ini ketersediaan informasi berbentuk dokumen teks sebagian besar sudah berbentuk elektronik (softcopy). Kemungkinan penyimpanan media teks ke

Lebih terperinci

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB

IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB IMPLEMENTASI METODE TERM FREQUENCY INVERSED DOCUMENT FREQUENCE (TF-IDF) DAN VECTOR SPACE MODEL PADA APLIKASI PEMBERKASAN SKRIPSI BERBASIS WEB Abdul Rokhim 1), Achmad ainul yaqin 2) 1) Program Studi/Prodi

Lebih terperinci

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN 28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang Masalah BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun

Lebih terperinci

DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW

DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW DETEKSI KESESUAIAN BIDANG MINAT TERHADAP PROPOSAL TUGAS AKHIR MAHASISWA STUDI KASUS : MAHASISWA SI UKDW Nia Meliana Umi Proboyekti, Jong Jek Siang Abstrak Pembuatan tugas akhir mahasiswa diharapkan sesuai

Lebih terperinci

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi

Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic

Lebih terperinci

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga

BAB I PENDAHULUAN. penyimpanan dan cepat. Tuntutan dari gerakan anti global warming juga 1 BAB I PENDAHULUAN A. Latar Belakang Dalam era teknologi informasi seperti saat ini, informasi berupa teks sudah tidak lagi selalu tersimpan dalam media cetak seperti kertas. Orang sudah mulai cenderung

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Penelitian-penelitian yang pernah dilakukan di bidang information retrieval telah memunculkan berbagai metode pembobotan dan clustering untuk mengelompokkan

Lebih terperinci

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi)

Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Sistem Informasi Tugas Akhir Menggunakan Model Ruang Vektor (Studi Kasus: Jurusan Sistem Informasi) Wahyudi,MT Laboratorium Sistem Informasi Fakultas Sains dan Teknologi UINSUSKA RIAU Jl.HR.Subrantas KM.15

Lebih terperinci

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN I-1 BAB I PENDAHULUAN 1.1 Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas merupakan sebuah bukti nyata bahwa informasi sangat diperlukan bagi pencari informasi [16]. Dengan munculnya

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

SISTEM TEMU KEMBALI INFORMASI

SISTEM TEMU KEMBALI INFORMASI SISTEM TEMU KEMBALI INFORMASI ROCCHIO CLASSIFICATION Badrus Zaman, S.Si., M.Kom Doc. 1..???? Doc. 2..**** Doc. 3. #### Doc. 4..@@@ 081211633014 Emilia Fitria Fahma S1 Sistem Informasi Pengertian Teknik

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Information age atau computer age adalah suatu era dimana kebutuhan seseorang akan informasi menjadi suatu hal yang sangat penting. Pada saat era informasi ini seseorang

Lebih terperinci

ANALISA KECENDERUNGAN KARAKTER BERDASARKAN KEYWORD DALAM SHORT MESSAGE SERVICE BERBASIS PROTOTYPE ANDROID SOFTWARE APPLICATION

ANALISA KECENDERUNGAN KARAKTER BERDASARKAN KEYWORD DALAM SHORT MESSAGE SERVICE BERBASIS PROTOTYPE ANDROID SOFTWARE APPLICATION Jurnal Penelitian Pendidikan Indonesia (JPPI) ISSN 2477-2240 (Media Cetak). 2477-3921 (Media Online) ANALISA KECENDERUNGAN KARAKTER BERDASARKAN KEYWORD DALAM SHORT MESSAGE SERVICE BERBASIS PROTOTYPE ANDROID

Lebih terperinci

BAB 1 PENDAHULUAN 1.1. Latar belakang

BAB 1 PENDAHULUAN 1.1. Latar belakang BAB 1 PENDAHULUAN 1.1. Latar belakang Dengan adanya perkembangan dan pertumbuhan yang secara cepat dalam hal informasi elektronik sangat diperlukan suatu proses untuk menyelesaikan suatu permasalahan itu

Lebih terperinci

4 BAB 4 IMPLEMENTASI DAN PENGUJIAN

4 BAB 4 IMPLEMENTASI DAN PENGUJIAN 4 BAB 4 IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Implementasi adalah penerapan hasil perancangan yang telah dilakukan pada tahap analisis dan perancangan sistem. Hasil perancangan diterapkan menjadi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN Bab ini berisikan tentang alasan peneliti mengambil permasalahan ini. Pada bab ini poin-poin yang akan dipaparkan antara lain Latar Belakang, Perumusan Masalah, Batasan Masalah, Tujuan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian ini ada beberapa tahapan penelitian yang akan dilakukan seperti terlihat pada gambar 3.1 berikut : Mulai Identifikasi Masalah Pengumpulan Data Analisa Aplikasi

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

Document Indexing dan Term Weighting. M. Ali Fauzi

Document Indexing dan Term Weighting. M. Ali Fauzi Document Indexing dan Term Weighting M. Ali Fauzi Document Indexing Setelah melakukan preprocessing, kita akan mendapatkan sebuah set term yang bisa kita jadikan sebagai indeks. Indeks adalah perwakilan

Lebih terperinci

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO

KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO F.15 KLASIFIKASI DATA PENGADUAN MASYARAKAT PADA LAMAN PESDUK CIMAHI MENGGUNAKAN ROCCHIO Khusnul Khuluqiyah *, Tacbir Hendro Pudjiantoro, Agung Wahana Program Studi Informatika, Fakultas Matematika dan

Lebih terperinci

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor

Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik

Lebih terperinci

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN

EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN EKSTRAKSI FITUR SITUS BERITA ONLINE UNTUK KALEIDOSKOP BERITA TAHUNAN Afri Yosela Putri 1, Faisal Rahutomo 2, Ridwan Rismanto 3 1, 2, 3 Jurusan Teknologi Informasi, Program Studi Teknik Informatika, Politeknik

Lebih terperinci

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System)

Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) Aplikasi Aljabar Vektor pada Sistem Temu-balik Informasi (Information Retrieval System) IF3 Aljabar Geometri Oleh: Rinaldi Munir Program Studi Informatika, STEI-ITB Rinaldi Munir - IF3 Aljabar Geometri

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN 3.1. Desain Penelitian Gambar 3. 1 Desain Penelitian Pemilihan Mahasiswa Berprestasi 28 29 3.2. Metode Penelitian 1.2.1. Metode Pengumpulan Data Metode pengumpulan data yang

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE

PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE PERANCANGAN DAN PEMBUATAN APLIKASI UNTUK PENCARIAN WEB SERVICE MENGGUNAKAN LUCENE OLGA CERIA SARI NRP 5106 100 618 DOSEN PEMBIMBING: Sarwosri,S.Kom,MT. Umi Laili Yuhana, S.Kom, M.Sc LATAR BELAKANG Kebutuhan

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III ANALISIS DAN PERANCANGAN SISTEM BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Masalah Setiap tahunnya, DPP Infokom selaku panitia Pelatihan Aplikasi Teknologi dan Informasi (PATI) Universitas Muhammadiyah Malang menerima ribuan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA digilib.uns.ac.id BAB II TINJAUAN PUSTAKA 2.1. Landasan Teori 2.1.1. Twitter API Twitter API terdiri dari dua komponen yang berbeda, REST dan SEARCH API. REST API memungkinkan pengembang/developer Twitter

Lebih terperinci

Pemanfaatan Aljabar Vektor Pada Mesin Pencari

Pemanfaatan Aljabar Vektor Pada Mesin Pencari Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk

Lebih terperinci

PEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS

PEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS PEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS J.B. Budi Darmawan Dosen Program Studi Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Weblog, atau yang sering disebut sebagai Blog, merupakan bagian tak terpisahkan dalam perkembangan dunia teknologi informasi berbasis Web. Berbagai jenis informasi

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan berkembangnya Internet, banyak informasi tersedia dalam World Wide Web yang dapat diakses di seluruh negara. Pada saat pencarian informasi menggunakan search

Lebih terperinci