HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.
|
|
- Widya Santoso
- 7 tahun lalu
- Tontonan:
Transkripsi
1 4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai kueri. Contohnya adalah: 1 SIAPA 2 Score(S) += WordMatch(Q,S) 3 If ~contains(q, {NAME, ORGANIZATION}) and contains (Q, {NAME, ORGANIZATION}) 4 then score(s) += slam_dunk 1 KAPAN 2 Score(S) += WordMatch(Q,S)) 3 If contains(s, {DATE, TIME} and contains (S,{saat,ketika,kala,semenjak,sejak, waktu, setelah, sebelum}) 4 then Score(S) += slam_dunk 5 If contains(s, {DATE, TIME}) then Score(S) += good_clue 6 If contains(s,{saat, ketika, kala, semenjak, sejak, waktu, setelah, sebelum}) then Score(S) +=clue 1 DI MANA 2 Score(S) += WordMatch(Q,S) 3 If contains(s, LOCATION) and contains (S,{dalam,dari, pada}) then Score(S) += slam_dunk 4 If contains(s, LOCATION) then Score(S) += good_clue 5 If contains(s,{dalam, dari, pada}) then Score(S) += clue Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan. Lingkungan Pengembangan Lingkungan pengembangan yang digunakan pada penelitian ini adalah: Prosesor Intel Core i5 2500K 3.3 GHz. RAM 4 GB DDR3. Windows 7 64 bit. Harddisk 2 TB. HASIL DAN PEMBAHASAN Pemrosesan Dokumen Dokumen yang terkumpul diberikan penamaan entitas (tagging) menggunakan hasil penelitian Citraningputra (2009). Hal ini diperlukan sebagai penanda entitas jawaban sesuai dengan pertanyaan yang diberikan. Entitas yang digunakan dalam tagging ialah NAME, ORGANIZATION, DATE, TIME, NUMBER, CURRENCY, dan LOCATION. Kata yang terdeteksi oleh aplikasi tagging akan diapit oleh notasi <TAG> sesuai dengan jenis entitas katanya. Sebagai contoh jika terdapat entitas tanggal seperti 1998, setelah diproses oleh aplikasi hasil penelitian Citraningputra akan menjadi <DATE>1988</DATE>. 1 BERAPA 2 Score(S) +=WordMatch (Q,S) 3 If contains(q, {NUMBER, CURRENCY})and contains (S, {NUMBER, CURRENCY}) then Score(S) += slam_dunk 4 If contains(s, {NUMBER, CURRENCY})then Score(S) += confident Ekstraksi Jawaban Proses ekstraksi jawaban akan mengolah top passage untuk mendapatkan entitas jawaban. Entitas jawaban dihitung dengan mencari selisih jarak entitas dengan semua kueri. Entitas yang memiliki jarak terpendek menjadi entitas jawaban. Evaluasi Hasil Percobaan Tahap evaluasi dilakukan secara objektif dengan cara: Membandingkan jawaban dengan hasil penelitian milik Sanur (2011). Membandingkan dua metode retrieval BM25 dan Proximity yang tersedia pada Sphinx. Pembentukan Passage Pembentukan passage dilakukan menggunakan dua metode. Metode pertama membentuk passage sebelum indexing dan metode kedua membentuk passage sesudah indexing. Passage dibentuk berdasarkan jumlah kata dan kalimat serta sifat overlapping dan non-overlapping. Semua kombinasi jenis passage dilakukan untuk mendapatkan jenis passage yang terbaik. Penentuan jenis passage dapat dilihat di antarmuka pada Lampiran 1. Dokumen tersebut akan dipecah menjadi passage berdasarkan jenisnya. Untuk jenis overlapping passage dua kalimat, passage pertama berisi kalimat pertama dan kedua. Passage kedua berisi kalimat kedua dan ketiga. Kalimat kedua terdapat pada passage pertama dan kedua karena menggunakan tipe overlapping passage. Jika yang digunakan adalah non- overlapping passage, kalimat kedua hanya berada pada passage pertama saja. Passage yang sudah terbentuk akan diproses lebih lanjut untuk mendapatkan entitas jawaban sesuai dengan tipe pertanyaannya. Berikut adalah pembentukan overlapping passage
2 5 menggunakan dua kalimat. Semua informasi dokumen pada passage yang berada dalam satu dokumen memiliki isi yang sama kecuali bagian content. Bagian content adalah bagian yang akan dibentuk passage untuk proses ekstraksi jawaban. Sebagai contohnya dokumen awal sebagai berikut: 5 <content>kuala LUMPUR - Menteri Luar Negeri (Menlu) Australia Alexander Downer menegaskan, kapasitas kelompok militan Asia berhubungan dengan jaringan Al- Qaeda bisa berkembang baik dan walaupun jumlah mereka tidak bertambah. Sikap ekstremisme mereka merupakan suatu ancaman. "Ini merupakan suatu masalah besar bagi kawasan ini," ujar Menlu Downer di sela-sela pertemuan Forum Ekonomi Dunia di Kuala Lumpur, Senin,7/10. Passage pertama: 5 <content>kuala LUMPUR - Menteri Luar Negeri (Menlu) Australia Alexander Downer menegaskan, kapasitas kelompok militan Asia berhubungan dengan jaringan Al- Qaeda bisa berkembang baik dan walaupun jumlah mereka tidak bertambah. Sikap ekstremisme mereka merupakan suatu ancaman. Passage kedua: 5 <content> Sikap ekstremisme mereka merupakan suatu ancaman. "Ini merupakan suatu masalah besar bagi kawasan ini," ujar Menlu Downer di sela-sela pertemuan Forum Ekonomi Dunia di Kuala Lumpur, Senin,7/10. Terdapat juga passage yang dibentuk menggunakan jumlah kata. Berikut adalah contoh overlapping passage yang menggunakan jumlah 30 kata pada dokumen yang sama. Passage pertama: 5 <content>kuala LUMPUR - Menteri Luar Negeri (Menlu) Australia Alexander Downer menegaskan, kapasitas kelompok militan Asia berhubungan dengan jaringan Al- Qaeda bisa berkembang baik dan walaupun jumlah mereka tidak bertambah. Sikap ekstremisme Passage kedua: 5 <content> mereka merupakan suatu ancaman. "Ini merupakan suatu masalah besar bagi kawasan ini," ujar Menlu Downer di sela-sela pertemuan Forum Ekonomi Dunia di Kuala Lumpur, Senin,7/10. Pemrosesan kueri Jenis pertanyaan yang digunakan dalam penelitian ini adalah SIAPA, KAPAN, BERAPA, dan DI MANA. Untuk setiap tipe pertanyaan diberikan sepuluh macam pertanyaan. Lampiran 2 untuk daftar pertanyaan Siapa, Lampiran 3 untuk daftar pertanyaan Kapan, Lampiran 4 untuk daftar pertanyaan Di mana, dan Lampiran 5 untuk daftar pertanyaan Berapa. Untuk menentukan tipe
3 6 pertanyaannya, kalimat tanya akan dilakukan proses parsing. Proses ini memisah kalimat menjadi kata-kata yang disimpan dalam sebuah array. Kata dengan indeks ke-0 akan menentukan jenis pertanyaannya. Jenis pertanyaan ini akan menentukan tag entitas yang akan dicari saat menentukan jawaban pertanyaan seperti pada Tabel 1. Contohnya untuk kueri Kapan dilakukan penelitian di rumah kaca Balittro?. Kata Kapan akan ditempatkan pada indeks ke-0. Kata tersebut menentukan jenis target entitas jawabannya. Kata Kapan berdasarkan Tabel 1 merujuk pada tag <DATE> dan <TIME> sehingga entitas dengan tag tersebut yang akan dicari dalam passage. Sisa kata akan ditempatkan pada indeks selanjutnya. Kata penelitian, rumah, kaca dan balittro akan ditempatkan berurutan dalam indeks array. Kata dilakukan dan kata di tidak termasuk kueri karena dianggap sebagai stopwords. Semua kata akan diubah ke huruf kecil untuk normalisasi saat pencarian. Semua kata pada array, kecuali kata pertama, akan menjadi kueri untuk mendapatkan dokumen atau passage yang relevan. Perolehan Top Passage Proses retrieval pada penelitian ini menggunakan dua metode yang telah tersedia pada Sphinx, yaitu BM25 dan Proximity. BM25 menggunakan metode statistik, sedangkan Proximity menggunakan metode dengan memeriksa urutan kata pada dokumen atau passage berdasarkan kueri. Contoh ialah kueri Siapa Marty Natalegawa?. Kata Marty dan Natalegawa akan menjadi kueri. Pada retrieval yang menggunakan BM25, setiap kata dicari bobotnya untuk masing-masing dokumen. Setiap bobot kueri pada dokumen dijumlahkan untuk mendapatkan bobot keseluruhan untuk dokumen. Bobot tersebut setelah dinormalisasi nilainya dikalikan berdasarkan bobot setiap field untuk meranking dokumennya. Proses perhitungannya dapat dilihat pada Tabel 2. Nilai BM25 final adalah nilai bobot terakhir dokumen terhadap kueri. Setelah itu, bobot tersebut di-ranking berdasarkan mode yang ditelah ditentukan pada konfigurasi Sphinx. Penelitian ini menggunakan mode SPH_RANK_BM25 yang menggunakan rumus: 1 field_weights = 0 2 foreach (field in matching_fields){ 3 field_weights += user_weight(field)} 4 weight = field_weights* integer(doc_bm25*999) Tabel 2 Contoh proses perhitungan BM25 Variabel / Kueri Marty Natalegawa n N k idf tf BM25 (awal) BM BM25 Final FIELD_WEIGHT adalah field yang mengandung kueri. Kata Marty Natalegawa hanya terdapat pada field CONTENT, sehingga nilai FIELD_WEIGHT ialah 1. Bobot yang memiliki nilai tertinggi untuk kueri Siapa Marty Natalegawa ialah dokumen republika txt dengan nilai bobot Metode yang menggunakan Proximity dilihat urutan katanya untuk semua dokumen atau passage yang mengandung kueri. Sebagai contoh, untuk kueri Di mana terjadi masalah sempitnya lahan pertanian, inefisiensi, produktivitas rendah, dan fluktuasi harga produk pertanian?, kata yang menjadi kueri setelah dihilangkan stopwords-nya ialah masalah, sempitnya, lahan, pertanian, inefisiensi, produktivitas, fluktuasi, harga, produk. Dari kueri tersebut, dokumen kompas txt memiliki bobot 5 karena di dalam dokumen terdapat kalimat yang cocok dengan kueri secara berurutan, yaitu sempitnya lahan pertanian, inefisiensi, produktivitas. Proses retrieval di atas tidak memperhatikan passage yang memiliki target entitas jawaban. Passage yang relevan tidak semuanya mengandung entitas jawaban. Passage tersebut disaring berdasarkan entitas jawaban yang diperlukan sesuai jenis pertanyaannya. Jika pertanyaannya adalah Kapan, entitas yang dibutuhkan adalah tag <DATE> dan tag <TIME>. Passage yang tidak memiliki entitas jawaban tidak akan masuk ke proses selanjutnya. Sistem akan mencari passage yang hanya memiliki tag sesuai dengan tipe pertanyaan. Setelah terkumpul passage yang memiliki calon entitas jawaban, dilakukan proses pembobotan passage untuk menentukan passage yang memiliki kemungkinan tertinggi memiliki jawaban.
4 7 Pembobotan Rule Based Pembobotan Rule Based mengacu pada rule yang terdapat dalam Riloff dan Thelen (2000) serta penelitian Sianturi (2008) dan Sanur (2011). Terdapat dua fungsi yang digunakan dalam pembobotan Rule Based yaitu wordmatch dan contain. WordMatch adalah nilai banyaknya kata yang sama pada kueri dalam passage. Algoritme WordMatch dilakukan dengan cara menghitung banyaknya semua token kueri pada setiap passage. Hasilnya disimpan dalam variabel WordMatch. Contain adalah nilai pembobotan berdasarkan kata pada passage yang mencirikan passage tersebut sesuai jenis target entitasnya. Nilai bobot passage yang memiliki kata yang terdapat dalam daftar kamus HUMAN, akan bertambah. Kamus terdiri atas empat macam sesuai dengan banyaknya tipe pertanyaan yang ada dalam penelitian. Berikut adalah contoh algoritme rule-based yang digunakan sebagai acuan dalam penelitian ini untuk jenis pertanyaan KAPAN : 1 KAPAN 2 Score(S) += WordMatch(Q,S)){ 3 If contains(s, {DATE, TIME} and contains (S,{saat,ketika,kala,semenjak,sejak, waktu, setelah, sebelum}) then Score(S) += slam_dunk 4 If contains(s, {DATE, TIME}) then Score(S) += good_clue 5 If contains(s,{saat, ketika, kala, semenjak, sejak, waktu, setelah, sebelum}) then Score(S) += good_clue Fungsi dan notasi yang digunakan dalam rules tersebut adalah: Notasi S = sentence (kalimat dokumen / passage). Notasi Q = query (kalimat kueri). Fungsi contains adalah fungsi untuk memeriksa kata dalam passage apakah memiliki kata dalam kamus atau tidak. Fungsi WordMatch adalah fungsi untuk menghitung frekuensi kueri pada dokumen. Fungsi score adalah fungsi penjumlahan nilai bobot pada passage. Setelah diperoleh nilai dari Wordmatch dan pembobotan rule-based, bobot setiap passage dihitung. Passage yang memiliki bobot terbesar akan menjadi top passage. Sebagai contoh, dari kueri Kapan dilakukan penelitian di rumah kaca Balittro? diperoleh 10 passage dari 3 dokumen teratas dan yang menjadi top passage adalah passage dengan id ke-8 dari dokumen wartapenelitian txt. Isi passage tersebut adalah: Untuk itu telah dilakukan penelitian di rumah kaca Balittro Bogor pada tahun 1997/1998 dan dilanjutkan penelitian di lapang di IP Sukamulya (Sukabumi) pada tahun 1998/1999. Pada percobaan rumah kaca, tujuh jenis bakteri antagonis baik secara sendirisendiri maupun gabungan yang diformulasikan dalam suatu pembawa, yaitu bakteri antagonis P. Passage tersebut memiliki 2 kata penelitian, 2 kata rumah, 2 kata kaca, dan 1 kata balittro sehingga score wordmatch-nya ialah 7. Langkah selanjutnya adalah memeriksa kata pada kueri dengan kata dalam passage yang terdapat dalam kamus DATE & TIME. Kamus DATE & TIME ditentukan secara manual. Semakin rinci isi kamus DATE & TIME, kemungkinan mendapatkan passage yang relevan semakin besar. Kamus DATE & TIME berupa file.txt yang berisi kata-kata yang mengandung DATE & TIME. Contohnya januari, senin, tahun, dan bulan. Dalam contoh ini, kamus DATE & TIME dan passage memiliki kata tahun sehingga score bertambah 4 karena salah satu syarat dalam rule dan mengakibatkan penambahan nilai variabel good_clue pada total bobot passage sehingga jumlah bobot passage menjadi 11. Dari 10 passage yang relevan, passage ini memiliki bobot paling tinggi sehingga menjadi top passage. Ekstraksi Jawaban Ekstraksi jawaban dilakukan setelah sistem mendapatkan top passage. Top passage akan dipecah menjadi kata-kata, kecuali entitas yang memiliki tag, maka pemecahannya berdasarkan tag. Hasil pemisahan tersebut disimpan dalam sebuah array untuk dihitung jarak antara entitas kueri dan entitas jawaban. Sebagai contoh, dari kueri Kapan dilakukan penelitian di rumah kaca Balittro? diperoleh 10 passage dari 3 dokumen teratas dan yang menjadi top passage ialah passage dengan id ke-8 dari dokumen wartapenelitian txt. Sistem akan mencari kandidat jawaban sesuai dengan tipe pertanyaannya. Untuk contoh ini tipe pertanyaan adalah KAPAN, sehingga tipe entitas yang dicari adalah entitas <DATE> dan <TIME>. Dari top passage, terdapat dua buah entitas yang bertipe tersebut, yaitu: [DATE]1997/1998[/DATE] [DATE]1998/1999[/DATE]
5 8 1997/1998 memiliki nilai paling rendah (1.57) sehingga kata tersebut menjadi jawaban. Gambar 5 Kinerja passage terbaik mode BM25. Gambar 6 Kinerja passage terbaik mode Proximity. Kandidat tersebut akan dihitung jaraknya dengan kueri yang terdapat dalam passage. Kueri dalam pertanyaan ini ialah kata penelitian, rumah, kaca, dan balittro sehingga kata tersebut menjadi acuan untuk mencari selisih jarak dengan kandidat jawaban. Kandidat jawaban dalam contoh ini adalah entitas dengan indeks array nomor 12 dan 24. Dihitunglah jarak untuk masing-masing entitas jawaban terhadap entitas kueri yang berada dalam passage. Jarak yang terkecil akan menjadi jawabannya. Kandidat jawaban Hasil Percobaan Hasil percobaan dilakukan dengan membandingkan hasil penelitian yang didapat dari hasil penelitian Sanur (2011) dengan menggunakan dua metode retrieval pada sphinx, yaitu BM25 dan Proximity. Perbandingan dilakukan dengan melihat ketepatan jawaban yang ditemukembalikan dengan menggunakan pembobotan rule-based dan 10 dokumen atau passage teratas. Dokumen yang digunakan dalam penelitian ini berjumlah 1000 dokumen dan menggunakan 40 kueri dengan 10 kueri untuk masing-masing jenis pertanyaannya. Semua pertanyaan dicoba ke semua kombinasi jenis passage. Setiap hasil pertanyaan dicatat ke dalam tabel dan dikoreksi apakah jawaban right, wrong, unsupported, atau null. Perbandingan kinerja passage terbaik menggunakan mode retrieval BM25 dapat dilihat pada Gambar 5 dan lebih jelasnya pada Lampiran 6. Perbandingan kinerja passage terbaik untuk mode retrieval Proximity dapat dilihat pada Gambar 6 dan lebih jelasnya pada Lampiran 7. Gambar 5 dan Gambar 6 adalah banyaknya jawaban yang berhasil dijawab dengan benar berdasarkan jenis pertanyaan Siapa, Kapan, Di mana, dan Berapa. Untuk setiap jenis pertanyaan, diberikan 10 pertanyaan yang berbeda. Passage yang memiliki nilai terbaik pada mode BM25 kinerjanya mencapai 80%, yaitu 20 kata overlap dan yang mencapai 77.5% yaitu 30 kata overlap dengan anggapan satu tag adalah satu kata. Untuk mode Proximity, kinerjanya mencapai 77.5% untuk overlapping passage dua kalimat, nonoverlapping dua kalimat, dan overlapping 20 kata dengan satu tag satu kata. Semua passage tersebut dibentuk setelah proses indexing. Passage yang menggunakan Proximity memiliki kinerja yang lebih baik pada pertanyaan Siapa dan Kapan. Pada Gambar 5, terlihat tiga passage terbaik untuk mode proximity dapat menjawab semua pertanyaan dengan benar. Hanya overlapping passage 20 kata satu tag satu kata saja yang salah menjawab satu pertanyaan untuk tipe pertanyaan Siapa, sedangkan passage yang menggunakan mode BM25 memiliki kinerja yang baik pada tipe pertanyaan Di mana. Passage dengan kinerja terbaik untuk mode BM25 dapat menjawab semua pertanyaan dengan benar untuk tipe pertanyaan Di mana. Hanya overlapping passage dua kalimat saja
6 9 yang tidak menjawab semua pertanyaan dengan benar. Tipe pertanyaan Berapa kinerja kedua mode memiliki hasil yang tidak baik. Hal ini disebabkan tag NUMBER banyak digunakan tidak hanya sebagai kata, tetapi juga sebagai penulisan jika ingin menyebutkan sesuatu berdasarkan urutan. Hal ini mengakibatkan banyaknya tag NUMBER yang bukan entitas jawaban. Semakin banyak target entitas yang terambil, kinerja pengukuran kedekatan jarak dengan kueri akan semakin berkurang. Ada beberapa pertanyaan yang hanya dapat dijawab oleh passage tertentu. Faktor-faktor yang memengaruhi hasil ekstraksi jawaban pada sistem ini adalah relevansi passage yang terambil, jarak antara kandidat jawaban dengan kueri, dan terpotongnya kata pada tag untuk jenis passage yang berdasarkan jumlah kata. Faktor terpotongnya jumlah kata dapat diatasi dengan cara menganggap satu tag sebagai satu kata. Teknik tersebut membuat kandidat entitas jawaban dalam tag tidak terpotong oleh banyaknya kata pada passage yang dibentuk berdasarkan jumlah kata. Contoh untuk Tabel 3 Perbandingan pertanyaan yang memiliki jawaban yang berbeda Pertanya an/ Jenis passage Siapa menteri pertanian? Siapa Marty Natalega wa? Di mana pengolaha n sagu skala industri berkemba ng? Di mana terjadi penuruna n produksi tanaman tembakau? Berapa luas areal sagu Dunia? 50 kata overlapping passage A Hatta Radjasa Departemen Luar Negeri Republik Indo-nesia NULL Nanggro Aceh Darussa-lam Juta ha 2 kalimat overlapping passage B Hatta Radjasa Departemen Luar Negeri Republik Indonesia Maluku dan Irian Jaya Sumatra 2 kalimat nonoverlapping passage C Hatta Radjasa KBRI Maluku dan Irian Jaya Sumatra 5 5 mengetahui jenis kasus pertanyaan beserta faktor yang memengaruhi ektstraksi jawaban pada sistem dapat dilihat pada Tabel 3. Pada pertanyaan Siapa menteri pertanian? passage A, B, dan C memiliki jawaban yang salah karena entitas jawaban yang benar memiliki jarak yang jauh. Entitas jawaban yang salah memiliki jarak terdekat dengan kueri sehingga entitas jawaban yang terambil adalah jawaban yang salah. Sebagai contoh pada passage A terdapat tujuh entitas jawaban beserta nomor indeks katanya, yaitu: [0] => [NAME]Megawati Soekarnoputri[/NAME] (2) [1] => [NAME]Taufik Kiemas[/NAME] (3) [2] => [NAME]Taufik Kiemas[/NAME] (26) [3] => [NAME]Hatta Radjasa[/NAME] (30) [4] => [NAME]Rini Suwandi[/NAME] (32) [5] => [NAME]Prakosa[/NAME] (34) [6] => [NAME]Rokhmin Dahuri[/NAME] (39) [7] =>[NAME]Bungaran Saragih[/NAME](43) Top passage memiliki lima kata yang sama dengan kueri. Kata-kata tersebut berada pada indeks ke: 6, 23, 35, 41, dan 42. Dari indeks kata tersebut, dihitung jaraknya terhadap entitas kandidat jawaban berdasarkan nomor indeks array-nya. Setelah dihitung, ketujuh entitas tersebut memiliki nilai jarak dengan rata-rata: [0] => 27.4 [1] => 26.4 [2] => 3.4 [3] => 0.6 [4] => 2.6 [5] => 4.6 [6] => 9.6 [7] => 13.6 Nilai yang terkecil dimiliki oleh entitas jawaban dengan indeks ke-3, yaitu Hatta Radjasa. Hal ini yang menyebabkan jawaban pertanyaan pada passage A salah. Hasil ini menjelaskan bahwa jarak entitas kandidat jawaban terhadap kueri adalah faktor yang memengaruhi ekstraksi jawaban. Pada pertanyaan Siapa Marty Natalegawa?, passage C memiliki jawaban yang salah karena passage yang ditemukembalikan memang tidak relevan terhadap pertanyaan. Sama seperti pertanyaan Di mana terjadi penurunan produksi tanaman tembakau? dan Berapa luas areal sagu Dunia?, top passage yang diperoleh oleh passage B dan passage C adalah passage yang
2. Ketepatan untuk setiap jawaban.
dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen
6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat
Lebih terperinciIdentifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN
5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret
Lebih terperinciLingkungan Pengembangan HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Pengolahan Query
5 Lingkungan Pengembangan Perangkat lunak yang digunakan dalam penelitian ialah: Sistem Operasi Windows 7. Sphinx Search. XAMPP versi 1.7.3. Named Entity Tagger bahasa Indonesia. Perangkat keras yang digunakan
Lebih terperinciPEMILIHAN DEPARTEMEN FAKULTAS
PEMILIHAN PASSAGES DALAM QUESTION ANSWEING SYSTEM UNTUK DOKUMEN BEBAHASA INDONESIA SUCI AMELIA SANU DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIANN BOGO BOGO 2011
Lebih terperinciGambar 4 Ilustrasi bagian dokumen yang digunakan untuk pemrosesan.
6 pada akhir, seperti newsipb11111-2.txt yang berarti data berasal dari berita IPB dan diterbitkan pada tanggal 11 bulan Januari tahun 211 urutan ke-2. Dokumen memiliki ukuran terkecil 1 KB dan terbesar
Lebih terperinciHASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.
beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j
3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA
ANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010 1 ANALISIS
Lebih terperinciIMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA BANYAK DOKUMEN BERBAHASA INDONESIA ROMAIDA DOLAROSA SIANTURI
IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA BANYAK DOKUMEN BERBAHASA INDONESIA ROMAIDA DOLAROSA SIANTURI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciQUESTION ANSWERING SYSTEM MENGGUNAKAN N-GRAM TERM WEIGHT MODEL DEBBY PUSPA BAHRI
QUESTION ANSWEING SYSTEM MENGGUNAKAN N-GAM TEM WEIGHT MODEL DEBBY PUSPA BAHI DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIAN BOGO BOGO 2013 QUESTION ANSWEING SYSTEM
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciHASIL DAN PEMBAHASAN. sim(, )=
4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i
Lebih terperinciPEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI
PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
Lebih terperinciBAB 3 METODE PENELITIAN
19 BAB 3 METODE PENELITIAN 3.1. Tahap Pembentukan Knowledge Graph Sekumpulan kata-kata dalam suatu dokumen tidak akan terepresentasi sepenuhnya ke dalam graf. Bagian inti dokumen yang akan menyebabkan
Lebih terperinciIMPLEMENTASI QUESTION ANSWERING SYSTEM PADA DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE N-GRAM FANDI RAHMAWAN
IMPLEMENTASI QUESTION ANSWERING SYSTEM PADA DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE N-GRAM FANDI RAHMAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database
Lebih terperinciTabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita
6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional
Lebih terperinciIMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED UNTUK TEMU KEMBALI INFORMASI BERBAHASA INDONESIA. Oleh: NAFI IKHSANI G
IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED UNTUK TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Oleh: NAFI IKHSANI G64102016 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciIMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA TERJEMAHAN AL QUR AN SURAT AL BAQARAH MEYNAR DWI ANGGRAENY G
IMPLEMENTASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED PADA TERJEMAHAN AL QUR AN SURAT AL BAQARAH MEYNAR DWI ANGGRAENY G64103038 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciHASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:
2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka
Lebih terperinciBAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM
BAB 4 IMPLEMENTASI DAN PENGUJIAN SISTEM 4.1 Implementasi Sistem Tahap implementasi sistem merupakan tahap pembangunan perangkat lunak, tahap lanjut dari tahap perancangan sistem. Tahap yang dilakukan untuk
Lebih terperinciEkspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciIII METODOLOGI PENELITIAN
13 III METODOLOGI PENELITIAN 3.1 Kerangka Penelitian Penelitian dilakukan dalam lima tahapan utama, yaitu ekstraksi frame video, ekstraksi fitur SIFT dari seluruh frame, pembentukan kantong kata visual
Lebih terperincidengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan
dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan Gambar 8 Struktur PNN. 1. Lapisan pola (pattern layer) Lapisan pola menggunakan 1 node untuk setiap data pelatihan yang digunakan.
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN Pada bab ini dipaparkan latar belakang penelitian, rumusan masalah, tujuan penelitian, ruang lingkup penelitian, tahapan penelitian, dan sistematika penulisan laporan. 1.1 Latar Belakang
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinci1. PENDAHULUAN 1.1 Latar belakang Masalah
1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.
Lebih terperinciBAB 4 HASIL PENELITIAN DAN PEMBAHASAN. Berikut ini adalah contoh tampilan hasil dari kueri:
BAB 4 HASIL PENELITIAN DAN PEMBAHASAN 4.1 Proses Retrival Berikut ini adalah contoh tampilan hasil dari kueri: 1. Kategori Gajah Gambar 4.1 Hasil kueri kategori gajah dengan histogram biasa 48 Gambar 4.2
Lebih terperinciTUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA
TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN
BAB IV HASIL DAN PEMBAHASAN Pada bab ini akan diuraikan mengenai pelaksanaan terhadap hasil perancangan yang telah diperoleh sebelumnya. Hasil perancangan pada tahap perancangan akan diimplemetasikan menjadi
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
Lebih terperinciBAB 3 PERANCANGAN SISTEM
BAB 3 PERANCANGAN SISTEM Bab ini menguraikan perancangan sistem yang dikembangkan meliputi arsitektur sistem, perancangan pembuat unit pengindeksan dan perancangan antarmuka. 3.1 Arsitektur Sistem Gambar
Lebih terperinciBAB I PENDAHULUAN 1.1 LATAR BELAKANG
BAB I PENDAHULUAN Pada bab ini akan dibahas latar belakang penelitian, perumusan masalah, tujuan penelitian, manfaat penelitian dan batasan masalah. 1.1 LATAR BELAKANG Perkembangan penggunaan informasi
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciAPLIKASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED QUESTION ANSWERING SYSTEM PADA ALKITAB
APLIKASI QUESTION ANSWERING SYSTEM DENGAN METODE RULE-BASED QUESTION ANSWERING SYSTEM PADA ALKITAB Andreas Handojo 1, Erwin Lie 2, dan Rolly Intan 3 1,2,3 Program Studi Teknik Informatika, Fakultas Teknologi
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard
Lebih terperinciBAB I PENDAHULUAN. Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI
BAB I PENDAHULUAN I.1 Latar Belakang Informasi yang terdapat dalam Laporan Hasil Pemeriksaan (LHP) BPK RI saat ini belum di-manaje dengan baik secara digital. Informasi yang terdapat dalam LHP yang terdapat
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk
Lebih terperinci(bytes) Ukuran rata-rata dokumen Ukuran dokumen keseluruhan Ukuran dokumen terbesar Ukuran dokumen terkecil 412
Pengujian dan Evaluasi Sistem Pengujian dilakukan sebanyak 60 kali menggunakan dua jenis kueri (kueri biasa dan kueri khusus) dan dua jenis kesalahan (kesalahan konteks dan kesalahan Damerau). Evaluasi
Lebih terperinciIII. METODOLOGI PENELITIAN
III. METODOLOGI PENELITIAN 3.1. Kerangka Pemikiran Penelitian Informasi merupakan suatu unsur kunci yang penting di dalam suatu sistem konseptual. Suatu informasi dapat terbentuk melalui berbagai cara
Lebih terperinciHASIL DAN PEMBAHASAN. B fch a. d b
7 dengan nilai σ yang digunakan pada tahap pelatihan sebelumnya. Selanjutnya dilakukan perhitungan tingkat akurasi SVM terhadap citra yang telah diprediksi secara benar dan tidak benar oleh model klasifikasi.
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pertumbuhan jumlah situs web (website) di Internet berdasarkan hasil survey dari Netcraft (2013) menunjukkan peningkatan pesat dari 18 juta website pada tahun 2000
Lebih terperinciSearch Engine pada Dokumen RDF Tanaman Obat Menggunakan Sesame dan Lucene
Makalah Seminar Program S1 Ilmu Komputer Alih Jenis Departemen Ilmu Komputer, FMIPA-IPB 7 Februari 2015 Search Engine pada Dokumen RDF Tanaman Obat Menggunakan Sesame dan Lucene Search Engine on RDF Document
Lebih terperinciUKDW BAB 1 PENDAHULUAN Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Saat ini banyak metode pembelajaran yang bisa diterapkan untuk menambah ilmu pengetahuan seseorang. Salah satu metode pembelajaran yang bisa dilakukan yaitu
Lebih terperinciAplikasi Question Answering System dengan Metode Rule-Based Question Answering System pada Alkitab
Aplikasi Question Answering System dengan Metode Rule-Based Question Answering System pada Alkitab Andreas Handojo, Erwin Lie, Rolly Intan Jurusan Teknik Informatika Fakultas Teknologi Industri Universitas
Lebih terperinciBAB I PENDAHULUAN! 1.1 Latar Belakang
1.1 Latar Belakang BAB I PENDAHULUAN Untuk dapat tetap bisa menjalankan proses bisnisnya dengan baik, suatu instansi harus memenuhi suatu standar dalam melayani keinginan konsumen atau yang biasa dikenal
Lebih terperinciCode shift Asumsi-asumsi Pengaburan Kode Lingkungan Pengembangan HASIL DAN PEMBAHASAN Karakteristik Dokumen Perlakuan ( Treatment
6 dengan FF. Jenis karakter substitusi dapat dilihat pada Tabel 6. Code shift Karakter yang dibuang dari lima bit kode dalam penelitian ini adalah karakter ke dua. Hal ini dengan pertimbangan pengucapan
Lebih terperinciMETODE PENELITIAN. Gambar 2 Metodologi penelitian.
4 penelitian i, kata diasosiasikan dengan anotasi citra (kata) dan dokumen diasosiasikan dengan citra. Matriks kata-citra tersebut didekomposisi meadi : A USV T dengan A adalah matriks kata-citra, matriks
Lebih terperinciUKDW BAB 1 PENDAHULUAN
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Toko Rudi Music merupakan salah satu toko alat musik di kota Magelang yang menjual berbagai macam alat musik. Toko ini tidak buka cabang dan merupakan toko
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN
BAB 3 ANALISIS DAN PERANCANGAN 3.1 Analisis Penggunaan citra yang semakin meningkat menimbulkan kebutuhan retrival citra yang juga semakin meningkat. Diperlukan suatu metode retrival citra yang efektif
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian 3.1.1 Alat Penelitian Dalam melakukan penelitian ini, berikut alat dan bahan penelitian yang digunakan: 1. Dari sisi perangkat keras, spesifikasi
Lebih terperinciLAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer
LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.
Lebih terperinciLingkungan Pengembangan HASIL DAN PEMBAHASAN
aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam
Lebih terperinciBAB III METODE PENELITIAN
21 BAB III METODE PENELITIAN 3.1 Desain Penelitian Pada bab ini akan dipaparkan skema umum penelitian yang dilakukan untuk mempermudah dalam melakukan penelitian. Dalam penelitian ini terdapat dua tahapan
Lebih terperinciBAB III PERANCANGAN. Tabel 3.1 Detil Tabel mpage
BAB III PERANCANGAN Bab ini menjelaskan mengenai perancangan sistem peringkas berita otomatis pada media massa online berbasis GVSM. Perancangan dibagi dalam beberapa bagian antara lain perancangan database,
Lebih terperinciSearch Engine pada Dokumen RDF Tanaman Obat Menggunakan Sesame dan Lucene
Makalah Seminar Program S1 Ilmu Komputer Alih Jenis Departemen Ilmu Komputer, FMIPA-IPB 7 Februari 2015 Search Engine pada Dokumen RDF Tanaman Obat Menggunakan Sesame dan Lucene Search Engine on RDF Document
Lebih terperinciII TINJAUAN PUSTAKA. * adalah operasi konvolusi x dan y, adalah fungsi yang merepresentasikan citra output,
5 II INJAUAN PUSAKA.1 Fitur Scale Invariant Feature ransform (SIF) Fitur lokal ditentukan berdasarkan pada kemunculan sebuah objek pada lokasi tertentu di dalam frame. Fitur yang dimaksudkan haruslah bersifat
Lebih terperinciHASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.
5 Mulai HASIL DAN PEMBAHASAN Kromosom P = rand [0,1] Ya P < Pm R = random Gen(r) dimutasi Selesai Tidak Gambar 7 Diagram alur proses mutasi. Hasil populasi baru yang terbentuk akan dievaluasi kembali dan
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Sumatera Utara
1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan
Lebih terperinciUKDW BAB 1 PENDAHULUAN
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah SMA Negeri Sumatera Selatan merupakan salah satu SMA yang menjadi pusat perhatian bagi siswa SMP di provinsi Sumatera Selatan. SMA yang berdiri dibawah naungan
Lebih terperinciBAB III METODOLOGI PENELITIAN
28 BAB III METODOLOGI PENELITIAN 3.1 Pendefinisian Sistem Sistem pendukung keputusan seleksi penerimaan karyawan yang dibangun merupakan sistem yang mengolah proses penilaian karyawan sampai diputusakan
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciHASIL DAN PEMBAHASAN. Data
dengan menggunakan model Bayesian Network. Nilai kemiripan dapat dihitung dengan Persamaan 21. P(I j Q)=n[1-(1-P(CS j CS)) x(1-p(ct j CT))] (21) dengan n adalah jumlah citra pada basis data, P(CS j CS)
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Bab ini akan membahas tentang analisa dan perancangan aplikasi source detection pada kasus plagiarisme dokumen menggunakan biword winnowing dan retrieval berbasis Okapi BM25.
Lebih terperinciQUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK
QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut
Lebih terperinciBAB III METODOLOGI PENELITIAN
3.1 Alat dan Bahan Penelitian BAB III METODOLOGI PENELITIAN 3.1.1 Alat Alat yang digunakan dalam penelitian ini adalah: a. Hardware a. Prosesor : Intel Core i5-3230m CPU @ 2.60GHz b. Memori : 4.00 GB c.
Lebih terperinciBAB 4 HASIL PENELITIAN DAN PEMBAHASAN. Berikut ini adalah contoh tampilan hasil dari kueri:
BAB 4 HASIL PENELITIAN DAN PEMBAHASAN 4.1 Proses Retrival Berikut ini adalah contoh tampilan hasil dari kueri: 1. Kategori Buah Gambar 4.1 Hasil kueri kategori buah dengan metode histogram warna 55 56
Lebih terperinciBAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
Lebih terperinciPENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI
PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI
Lebih terperinciContoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor
Contoh Perhitungan Kemiripan Cosinus pada Model Ruang Vektor Persoalan 1: Ada 4 dokumen (D1 s.d D4): D1: dolar naik harga naik penghasilan turun D2: harga naik harusnya gaji juga naik D3: Premium tidak
Lebih terperinciPENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI
18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. karterputung@gmail.com,
Lebih terperinciBAB 3 PEMBAHASAN. 3.1 Sistem Absensi Berbasis Webcam
BAB PEMBAHASAN.1 Sistem Absensi Berbasis Webcam Sistem absensi berbasis webcam adalah sistem yang melakukan absensi karyawan berdasarkan input citra hasil capture webcam. Sistem akan melakukan posting
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : wibowo@polibatam.ac.id Abstrak
Lebih terperinciMETODE PENELITIAN HASIL DAN PEMBAHASAN
METODE PENELITIAN Proses Dasar Sistem Proses dasar pengembangan sistem secara umum terdiri dari tahapan sebagai berikut: 1 Praproses. Pada tahap ini dilakukan persiapan yang meliputi seleksi data, transformasi
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan
Lebih terperinciBAB IV HASIL DAN UJI COBA
BAB IV HASIL DAN UJI COBA IV.1. Tampilan Hasil Berikut ini dijelaskan mengenai tampilan hasil dari perancangan sistem pakar penentuan grade ikan pada Sistem Pendukung Keputusan Pemilihan Mahasiswa Penerima
Lebih terperinciBAB III METODE PENELITIAN. Matematika dan Ilmu Pengetahuan Alam, Universitas Lampung. Waktu
BAB III METODE PENELITIAN 3.1 Tempat dan Waktu Penelitian Peneliti melakukan penelitian ini di Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Lampung. Waktu penelitian
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN SISTEM
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Sistem Analisis sistem ialah proses identifikasi mengenai hal-hal yang dibutuhkan dan harus ada pada sistem, agar sistem tersebut dapat berjalan sesuai
Lebih terperinciImplementasi Rancangan Aplikasi Ekstraksi Ciri Citra Digital berbasis Client-Server
Implementasi Rancangan Aplikasi Ekstraksi Ciri Citra Digital berbasis Client-Server Fredy Windana Program Studi Teknik Informatika, STT STIKMA Internasional Jl. Panji Suroso 91A Malang fredywind@gmail.com
Lebih terperinciBAB V IMPLEMENTASI DAN PENGUJIAN
BAB V IMPLEMENTASI DAN PENGUJIAN Bab kelima ini berisi uraian hasil implementasi dan pengujian terhadap perangkat lunak yang dibuat pada tugas akhir ini. 5.1 Implementasi Sub bab ini mendeskripsikan hasil
Lebih terperinciPERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH
PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN SISTEM
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Masalah Indera pendengaran manusia tidak dapat mengetahui secara pasti jenis nada apa yang didengar olehnya, terkecuali para pemusik profesional. Hal
Lebih terperinciAnalisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian 3.1.1 Alat Penelitian 1) Sistem komputer dengan spesifikasi sebagai berikut : - Processor Intel Core i5 2.4 GHz. - RAM 2 GB. - 250 GB hard disk
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN MULTIDOKUMEN FADILA ANDRE MULYANTO
COSS LANGUAGE QUESTION ANSWEING SYSTEM MENGGUNAKAN PEMBOBOTAN HEUISTIC DAN MULTIDOKUMEN FADILA ANDE MULYANTO DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIAN BOGO
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciBAB IV IMPLEMENTASI DAN PENGUJIAN. simulasi untuk mengetahui bagaimana performanya dan berapa besar memori
BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Algoritma yang telah dirancang, akan diimplementasikan dalam program simulasi untuk mengetahui bagaimana performanya dan berapa besar memori yang dibutuhkan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
Lebih terperinci