Lingkungan Pengembangan HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Pengolahan Query
|
|
- Ratna Sugiarto
- 6 tahun lalu
- Tontonan:
Transkripsi
1 5 Lingkungan Pengembangan Perangkat lunak yang digunakan dalam penelitian ialah: Sistem Operasi Windows 7. Sphinx Search. XAMPP versi Named Entity Tagger bahasa Indonesia. Perangkat keras yang digunakan dalam penelitian ini ialah: Prosesor AMD C50 (2 CPU) 1.0 GHz. RAM 2 GB. Hard disk 300 GB. HASIL DAN PEMBAHASAN Koleksi Dokumen Pengujian Dokumen uji yang digunakan merupakan koleksi 100 buah dokumen berita sambung jaring (online news) yang memiliki jangka terbit tahun Topik dokumen meliputi politik, pertanian dan berita olahraga. Dokumen berita sambung jaring dipilih karena mengandung informasi temporal. Setiap dokumen memiliki struktur XML yang sama berupa tag dengan berbagai fungsi. Pada baris pertama terdapat tag DOC yang berfungsi membedakan satu dokumen dengan dokumen lainnya, diikuti tag DOCNO, AUTHOR, TITLE, PUBLISHED, dan TEXT, yang masingmasing menunjukkan nama dokumen, penulis dokumen, judul dokumen, waktu dokumen diterbitkan, dan isi dokumen. Sebagai contoh: 1 <DOC> 2 <DOCNO>detiknews </DOCNO> 3 <AUTHOR> Indra Subagja detiknews </AUTHOR> 4 <TITLE> Mentan Suswono Siap Bantu Tingkatkan Kesejahteraan Petani</TITLE> 5 <PUBLISHED>2009/10/21 23:44 </PUBLISHED> 6 <TEXT>Jakarta - Menteri Pertanian Suswono </TEXT> 7 </DOC> Dokumen-dokumen berstruktur XML diberi tag kemudian ditempatkan ke dalam berkas tunggal dan disesuaikan mengikuti struktur XML varian Sphinx dengan menambahkan elemen <sphinx:document> (Aksyonoff 2011). Proses tagging dilakukan terhadap entitas penamaan (named entity) pada dokumen uji menggunakan Named Entity Tagger bahasa Indonesia hasil penelitian Citraningputra (2009). Tag yang digunakan terdiri atas NAME, ORGANIZATION, LOCATION, DATE, TIME, NUMBER, dan CURRENCY. Perlakuan khusus diberikan pada tag DATE dan TIME, yaitu dengan menyesuaikan penamaan secara manual dengan temporal tagging pada penelitian Mani dan Wilson (2000), serta pada tag NUMBER dengan memberikan tag pada lambang bilangan yang dinyatakan dengan huruf. Tag entitas penamaan digunakan untuk proses perolehan kandidat jawaban sesuai dengan jenis pertanyaan. Berkas tunggal yang berisi kumpulan dokumen ditempatkan ke sebuah direktori khusus untuk diolah lebih lanjut. Berikut ini merupakan contoh potongan dokumen pada berkas tunggal yang telah dilakukan proses tagging: 1 <sphinx:document id="3"> 2 <docno> detiknews txt </docno> 3 <author> Indra Subagja-detikNew </author> 4 <title> Mentan Suswono Siap Bantu Tingkatkan Kesejahteraan Petani </title> 5 <published>2009/10/21 23:44 </published> 6 <content> Jakarta - Menteri Pertanian (Mentan) [NAME]Suswono[/NAME] </content> 7 </sphinx:document> Pengolahan Query Query yang digunakan pada penelitian ini berupa bahasa alami berbentuk kalimat yang diawali dengan kata tanya dan diakhiri dengan tanda tanya (?), dengan setiap kata penyusun dipisahkan oleh whitespace atau spasi. Kata tanya yang digunakan pada penelitian ini dibatasi pada siapa, kapan, di mana, dan berapa. Total query pertanyaan yang digunakan ialah 80 query, dengan 5 query pertanyaan untuk 4 jenis pertanyaan temporal dari setiap kata tanya yang disusun mengikuti isi serta susunan kalimat pada dokumen acuan (Lampiran 1-4). Query kemudian didekomposisi untuk mendapatkan bentuk pertanyaan yang lebih sederhana. Dekomposisi terdiri atas 3 tahap, yaitu identifikasi dan normalisasi ekspresi temporal, identifikasi tipe pertanyaan, dan pemenggalan pertanyaan (question splitting). Identifikasi dan normalisasi ekspresi temporal berfungsi untuk mendapatkan ekspresi temporal yang terdapat dalam query dan menormalisasinya menjadi bentuk yang eksplisit. Proses normalisasi menghasilkan bentuk ekspresi temporal yang dapat dipahami sesuai format baku numerik tanggal atau periode, yaitu YYYY/MM/DD. Ekspresi temporal diawali dengan 4 digit tahun Y, 2 digit bulan M, dan diakhiri 2 digit hari D, masing-masing dipisahkan dengan garis miring (/) seperti yang ditunjukkan pada Tabel 3.
2 6 Tabel 3 Contoh normalisasi ekspresi temporal Ekspresi Normalisasi Value 1 Value /01/ /12/31 17 Agustus /08/17 Null 90-an 1990/01/ /12/31 abad ke /01/ /12/31 Identifikasi tipe pertanyaan bertujuan mengelompokkan query menjadi 4 tipe pertanyaan dengan menyadur taksonomi pertanyaan temporal Saquete et al. (2009), yaitu: 1 Kejadian tunggal (single event) tanpa ekspresi temporal. Pertanyaan jenis ini dibentuk oleh kejadian tunggal dan dapat dipecahkan secara langsung dengan Question Answering System. Contohnya Kapan diadakan Pemilihan Presiden?. 2 Kejadian tunggal dengan ekspresi temporal. Pertanyaan kejadian tunggal tetapi terdapat satu atau beberapa ekspresi temporal yang perlu dianalisis. Sebagai contoh, pertanyaan Siapa yang memenangkan Pemilihan Presiden pada tahun 2004? memiliki ekspresi temporal tahun Kejadian jamak (multi-event) tanpa ekspresi temporal. Pertanyaan yang terdiri dari dua atau lebih kejadian yang terhubung dengan sebuah temporal signal. Signal tersebut menandakan urutan kejadian pada sebuah pertanyaan. Sebagai contoh, pertanyaan Siapa yang terpilih menjadi presiden setelah Pemilihan Presiden berakhir? memiliki temporal signal setelah, dan dapat didekomposisi menjadi (1) Siapa yang terpilih menjadi presiden? (2) Kapan Pemilihan Presiden berakhir?. 4 Kejadian jamak dengan ekspresi temporal. Pertanyaan kejadian jamak dan terdapat satu atau beberapa ekspresi temporal yang perlu dianalisis. Sebagai contoh, pertanyaan Di mana Susilo Bambang Yudhoyono kuliah sebelum diadakan Pemilihan Presiden tahun 2004? memiliki temporal signal sebelum, dan ekspresi temporal tahun Pertanyaan tersebut dapat didekomposisi menjadi (1) Di mana Susilo Bambang Yudhoyono kuliah? (2) Kapan diadakan Pemilihan Presiden?. Terdapat penyesuaian penentuan urutan tipe dengan jenis pertanyaan jamak pada Saquete et al. (2009). Tipe 3 pada penelitian ditentukan sebagai Tipe 4, sebaliknya Tipe 4 ditentukan sebagai Tipe 3. Hal ini dilakukan untuk mempermudah implementasi sistem tanpa TIDAK Tipe 1 Gambar 2 TIDAK Signal YA Pertanyaan Analisis Pertanyaan Ekspresi TIDAK Signal Tipe 3 Tipe 2 Tipe 4 Pohon keputusan untuk indentifikasi tipe pertanyaan temporal. mengubah perlakuan terhadap masing-masing tipe pertanyaan. Sebuah query tanpa ekspresi temporal akan dikategorikan sebagai Tipe 1 jika tanpa signal, dan Tipe 3 jika terdapat signal. Sementara itu, sebuah query yang memiliki ekspresi temporal akan dikategorikan sebagai Tipe 2 jika tanpa signal, dan Tipe 4 jika terdapat signal. Proses identifikasi dilakukan karena setiap tipe memiliki skenario perlakuan yang berbeda. Query dengan Tipe 1 dan Tipe 2 dapat diolah secara langsung tanpa perlu dilakukan pemenggalan query awal, sedangkan Tipe 3 dan Tipe 4 lebih kompleks dan perlu dilakukan penyederhanaan. Proses identifikasi tipe dilakukan dengan menggunakan pohon keputusan (decision tree) seperti yang ditunjukkan pada Gambar 2. Selain menggunakan pohon keputusan yang menyadur taksonomi pertanyaan temporal, identifikasi dilakukan dengan memeriksa keberadaan sub-pertanyaan pada pertanyaan yang memiliki ekspresi temporal. Hal tersebut berguna dalam identifikasi query pertanyaan seperti Siapa Presiden Indonesia setelah tahun 2009? agar tidak dikategorikan sebagai pertanyaan jamak, meskipun memiliki temporal signal dan ekspresi temporal. Pemenggalan pertanyaan hanya dilakukan pada query pertanyaan jamak (Tipe 3 dan Tipe 4). Pada tahap ini, pertanyaan akan dipenggal menjadi 2 sub-pertanyaan, yaitu Q-Focus dan Q- Restriction. Tiap sub-pertanyaan akan saling berelasi. Q-Focus biasanya diikuti signal dan YA YA
3 7 menghasilkan keluaran berupa deret (list) jawaban, sedangkan Q-Restriction selalu diubah bentuk menjadi query dengan kata tanya kapan dan akan selalu menghasilkan keluaran berupa ekspresi tanggal. Signal yang terdapat pada query menunjukkan hubungan waktu antarkejadian yang terkait. Hasil dekomposisi query berupa Q-Focus dan Q-Restriction diubah perhurufannya menjadi huruf kecil (case folding) kemudian diparse. Pada proses parsing, kata-kata pada query yang termasuk stopwords akan dihilangkan dan selanjutnya digunakan pada tahap temu kembali dokumen. Berikut ini merupakan contoh hasil dekomposisi untuk query Siapa Presiden Indonesia setelah Pemilihan Presiden? : 1 <QUESTION> siapa presiden indonesia setelah pemilihan presiden? </QUESTION> 2 <TYPE> 3 </TYPE> 3 <Q-Focus> siapa presiden indonesia? </Q-Focus> 4 <Q-Restriction> kapan pemilihan presiden? </Q-Restriction> 5 <SIGNAL> setelah </SIGNAL> Pengolahan Dokumen Pada tahap awal pengolahan dokumen, dilakukan konfigurasi pengindeksan pada sistem Sphinx. Hasil pengindeksan disimpan dalam sebuah berkas yang akan digunakan untuk proses pencarian n dokumen teratas. Banyaknya n pada dokumen teratas ditentukan maksimal 10 buah. Hal ini dilakukan untuk mempermudah proses pembentukan kalimat dan passage. Query yang telah di-parse kemudian diberi bobot. Kata pada query kecuali kata tanya dicocokkan dengan dokumen teratas. Hasil temu kembali berupa kumpulan n dokumen teratas yang terurut mulai dari bobot tertinggi sampai terendah, dan disimpan dalam variabel larik (array) dokumen teratas. Pemeringkatan yang digunakan pada penelitian ini ialah pemeringkatan BM25 dan Proximity yang diterapkan secara terpisah. Berikut ini merupakan contoh hasil pemeringkatan BM25 untuk query Siapa Presiden Indonesia?, dengan indeks weight menunjukkan bobot dokumen: 1 [matches] => Array ( 2 [0] => Array ( 3 [id] => 15 4 [weight] => [attrs] => Array ( 6 [docno] => detiknews txt 7 [author] => Muhammad Nur Hayid 8 [title] => Beras Amburadul, Reshuffle Mentan Wewenang Presiden 9 [content] => Jakarta pemerintah kembali impor beras. Kebijakan ini 10 [published] => Kamis, 15/02/ :13 WIB ) 11 ) ) Pada pemeringkatan Proximity, dokumen dianalisis berdasarkan posisi keyword pada dokumen. Dokumen yang memiliki sub-frase yang cocok dengan query akan diberi nilai sesuai jumlah kecocokan kata. Contoh hasil pemeringkatan Proximity untuk query Siapa Presiden Indonesia? sebagai berikut: 1 [matches] => Array ( 2 [0] => Array ( 3 [id] => 14 4 [weight] => 2 5 [attrs] => Array ( 6 [docno] => detiknews txt 7 [author] => Anwar Khumaini 8 [title] => Susunan Kabinet Indonesia Bersatu II 9 [content] => Jakarta Usai sudah rangkaian audisi yang dilakukan Presiden 10 [published] => Rabu, 21/10/ :26 WIB ) 11 ) ) Pembentukan Kalimat Dokumen teratas yang telah ditemukembalikan oleh sistem kemudian dibagi per kalimat. Kalimat yang dibentuk dimulai dengan huruf kapital dan diakhiri dengan titik (.), tanda tanya (?), atau tanda seru (!). Kalimatkalimat tersebut disimpan dalam variabel array hasil pembentukan kalimat. Ilustrasi pembentukan kalimat sebagai berikut: 2 [doc1] => Array( 3 [0] => Kalimat ke-1. 4 [1] => Kalimat ke-2. 5 [2] => Kalimat ke-3. 6 ) ) Pembentukan Passage Pembentukan passage dilakukan dengan cara menggabungkan 2 kalimat dari masingmasing dokumen secara saling meliputi (overlap) dengan kalimat sebelumnya dan kalimat sesudahnya. Dengan demikian, dari 1 kalimat akan terbentuk 2 passage, namun hal ini tidak berlaku pada kalimat pertama dan terakhir. Hasil proses ini disimpan dalam variabel array hasil pembentukan passage, dengan indeks asosiatif berupa nama dokumen. Ilustrasi pembentukan passage sebagai berikut: 2 [doc1] => Array( 3 [0] => Kalimat ke-1. Kalimat ke-2. 4 [1] => Kalimat ke-2. Kalimat ke-3. 5 ) )
4 8 Pengolahan Passage Pada proses pembobotan, hanya passage yang mengandung tag entitas penamaan yang digunakan. Passage disimpan dalam variabel array passage berentitas penamaan, kemudian diseleksi berdasarkan pasangan kata tanya dan entitas penamaan. Pembobotan passage dilakukan menggunakan metode heuristic (Ballesteros & Li 2007) dengan mengikuti tahapan pada penelitian Umriadi (2011). Ketentuan perhitungan bobot pada metode heuristic berdasarkan kecocokan kata, urutan kata dan kedekatan kata. Tujuan dari pembobotan passage ialah memperoleh n passage dengan bobot tertinggi. Kandidat jawaban dan hasil temu kembali jawaban akan didapatkan dari n passage teratas. Banyaknya n ditentukan maksimal 10 buah. Berikut ini merupakan contoh hasil pembobotan passage untuk Q-Focus Siapa Presiden Indonesia?, dengan bobot passage ditunjukkan pada indeks score_passage: 3 [docno] => radarlampung txt 4 [selected_passage] => Ini tentu melegakan. Sebab 5 [score_passage] => ) 6 ) ) Perolehan Kandidat Jawaban Kandidat jawaban diperoleh dari passage teratas dengan menyeleksi kata yang memiliki tag entitas penamaan sesuai dengan kata tanya. Hasil seleksi disimpan dalam variabel array kandidat jawaban. Indeks pada array kandidat jawaban digunakan untuk menghitung jarak antara kandidat jawaban dan kata-kata penyusun query. Perolehan Entitas Jawaban Entitas jawaban diperoleh dengan menghitung bobot jarak antara kata yang sesuai dengan query pada n passage teratas dan kandidat jawaban. Kandidat jawaban dengan jarak terkecil menjadi entitas jawabannya. Berikut ini merupakan tahap perolehan jarak tiap kandidat jawaban pada passage teratas untuk Q-Focus Siapa Presiden Indonesia? : i Pengambilan bobot jarak kandidat jawaban berdasarkan indeks kata yang merepresentasikan posisi kata pada kalimat, seperti yang ditunjukkan pada array kandidat jawaban berikut ini: 3 [6] =>[NAME] Susilo Bambang Yudhoyono [/NAME]) 4 5 [3] => Array( 6 [5] =>[NAME] Megawati Soekarnoputri[/NAME]) 7 ) ii Pengambilan bobot jarak kata-kata penyusun query (keyword) yang terdapat pada passage teratas. Indeks pada tiap kata menunjukkan posisi kata pada kalimat, seperti berikut: 3 [4] => Presiden 4 [5] => Indonesia 5 [10] => Indonesia) 6 7 [3] => Array( 8 [4] => Presiden 9 [27] => Indonesia) 10 ) iii Perhitungan bobot jarak antara kandidat jawaban dan keyword pada passage, yaitu dengan menghitung jumlah total setiap jarak antara kandidat jawaban dan keyword yang terdapat pada passage dibagi dengan jumlah keyword. Hasil perhitungan disimpan pada array entitas jawaban, dengan indeks score menunjukkan hasil perhitungan jarak, serta text dan docno masing-masing menunjukkan kandidat jawaban dan nama dokumen, seperti berikut: 3 [docno] => radarlampung txt 4 [text] => Susilo Bambang Yudhoyono 5 [score] => 3.5) 6 7 [6] => Array( 8 [docno] =>kompas txt 9 [text] =>Megawati Soekarnoputri 10 [score] => 11.5) 11 ) Entitas jawaban yang memiliki jarak antara kandidat jawaban dan keyword pada passage dengan bobot terkecil akan dikembalikan sebagai jawaban. Rekomposisi Jawaban Tujuan utama rekomposisi jawaban ialah menghasilkan jawaban akhir atas pertanyaan kompleks menggunakan variabel masukkan hasil dekomposisi dan entitas jawaban yang dikembalikan. Rekomposisi jawaban terbagi atas 2 tahap, yaitu penyaringan jawaban (individual answer filtering) serta pembandingan dan penyusunan jawaban (answer comparision and composition), mengacu pada arsitektur temporal layer (Saquete et al. 2009). Contoh kinerja temporal layer untuk query Siapa Presiden Indonesia
5 9 Siapa Presiden Indonesia setelah Pemilihan Presiden? Q-Focus: Siapa Presiden Indonesia? Jawaban: Megawati ( ) Yudhoyono ( ) Signal: setelah Compatible Answer: Yudhoyono ( ) Q-Restriction: Kapan Pemilihan Presiden? Jawaban: 2004 Gambar 3 Contoh kinerja temporal layer. setelah Pemilihan Presiden? ditunjukkan pada Gambar 3. Penyaringan jawaban dilakukan untuk menyaring deret (list) jawaban dari Q-Focus dan jawaban dari Q-Restriction. Hanya jawaban yang memiliki ekspresi waktu yang dikembalikan. Pengambilan ekspresi waktu pada tiap jawaban dilakukan dengan menghitung jarak terkecil antara entitas jawaban dan ekpresi waktu pada dokumen yang mengandung jawaban tersebut. Ekspresi waktu yang terdekat dikembalikan sebagai informasi temporal jawaban. Berikut ini merupakan contoh jawaban yang memiliki informasi temporal untuk Q- Focus Siapa Presiden Indonesia? : 3 [docno] => radarlampung txt 4 [text] => Susilo Bambang Yudhoyono 5 [score] => [VALUE1] => 2009/12/18) 7 8 [6] => Array( 9 [docno] => kompas txt 10 [text] => Megawati Soekarnoputri 11 [score] => [VALUE1] => 2002/08/12) ) Pada tahap pembandingan dan penyusunan jawaban, hasil penyaringan jawaban yang memiliki informasi temporal dibandingkan berdasarkan ketetapan signal dan ordering key. Hasil pembandingan kemudian disusun dan dikembalikan sebagai jawaban akhir yang mengandung informasi temporal (temporal compatible answer). Evaluasi Hasil Percobaan Pada tahap evaluasi, sistem diberi 20 query pertanyaan yang mewakili kata tanya siapa, kapan, di mana, dan berapa untuk setiap tipe pertanyaan temporal, sehingga terdapat total 80 query pertanyaan yang dievaluasi (Lampiran 5-20). Evaluasi dilakukan dengan menghitung nilai Right (R), Wrong (W), dan Unsupported (U) dari hasil rekomposisi dan jawaban yang dikembalikan oleh sistem. Persentase nilai jawaban dari setiap kata tanya untuk jenis pertanyaan kejadian tunggal (Tipe 1 dan Tipe 2) serta kejadian jamak (Tipe 3 dan Tipe 4) dengan menggunakan mode pemeringkatan BM25 ditunjukkan pada Tabel 4, dan pemeringkatan Proximity ditunjukkan pada Tabel 5. Tabel 6 menunjukkan hasil temu kembali Question Answering System umum untuk query pertanyaan factoid hasil penelitian Umriadi (2011). Sistem diberikan query dan dokumen yang sama, namun tanpa dilakukan penyesuaian temporal tagging terlebih dahulu karena sistem dibangun tanpa fungsi pengolahan informasi temporal. Evaluasi dilakukan pada sistem yang memiliki perbedaan metode pengembangan, sehingga ketika diberikan pertanyaan, terdapat kemungkinan sistem tidak menghasilkan jawaban apapun (null) yang tidak sesuai dengan kriteria penilaian. Untuk itu, pada hasil evaluasi dilakukan pendekatan dengan menetapkan jawaban null sebagai jawaban salah (bernilai Wrong). Evaluasi Pertanyaan Kejadian Tunggal (Tipe 1 dan 2) Pada pertanyaan kejadian tunggal, kinerja sistem dalam pengolahan query pertanyaan temporal Tipe 1 dengan menggunakan pemeringkatan BM25 maupun Proximity cukup baik, ditunjukkan dengan persentase kedua pemeringkatan yang menghasilkan nilai Right tertinggi untuk kata tanya siapa sebesar 100%, sedangkan kata tanya kapan, di mana dan berapa sebesar 80%. Pada tipe pertanyaan ini, jawaban yang dikembalikan sistem tidak dibatasi oleh waktu tertentu, sehingga satu pertanyaan dapat memiliki beberapa jawaban yang relevan. Kekurangan sistem pada tipe pertanyaan ini disebabkan ketika proses ekstraksi jawaban, sistem mengembalikan jawaban dengan jarak terdekat, namun kemudian dianggap salah atau tidak relevan. Pada pertanyaan temporal Tipe 2, sistem telah mampu mengolah ekspresi temporal dan menormalisasi ke dalam bentuk ekspresi tanggal baku. Persentase nilai jawaban Right yang menggunakan pemeringkatan BM25, untuk kata
6 10 Tabel 4 Kata Tanya Persentase perolehan jawaban untuk pertanyaan temporal menggunakan pemeringkatan BM25 Tipe 1 (%) Tipe 2 (%) Tipe 3 (%) Tipe 4 (%) R W U R W U R W U R W U Siapa Kapan Di mana Berapa R: Right, W: Wrong, U: Unsupported. Tabel 5 Kata Tanya Persentase perolehan jawaban untuk pertanyaan temporal menggunakan pemeringkatan Proximity Tipe 1 (%) Tipe 2 (%) Tipe 3 (%) Tipe 4 (%) R W U R W U R W U R W U Siapa Kapan Di mana Berapa R: Right, W: Wrong, U: Unsupported. Tabel 6 Kata Tanya Persentase perolehan jawaban untuk pertanyaan temporal menggunakan Question Answering System umum (Umriadi 2011) Tipe 1 (%) Tipe 2 (%) Tipe 3 (%) Tipe 4 (%) R W U R W U R W U R W U Siapa Kapan Di mana Berapa R: Right, W: Wrong, U: Unsupported. tanya kapan mencapai 100%, siapa sebesar 80%, sedangkan kata tanya di mana dan berapa memiliki persentase nilai Right terkecil, yaitu sebesar 60%. Kekurangan tersebut disebabkan pada saat proses rekomposisi, kandidat jawaban yang relevan tidak dikembalikan sebagai jawaban akhir karena tidak memiliki relasi waktu yang memenuhi ketentuan, akibatnya sistem mengembalikan jawaban lain berupa jawaban berperingkat teratas. Perolehan nilai Right Tipe 2 dengan menggunakan pemeringkatan Proximity untuk kata tanya kapan sebesar 100%, di mana sebesar 80%, sedangkan siapa dan berapa memiliki nilai sebesar 60%. Hal tersebut disebabkan adanya kandidat jawaban yang saling berdekatan, sehingga memungkinkan pengembalian jawaban yang tidak relevan. Secara keseluruhan, rata-rata nilai Right untuk pertanyan kejadian tunggal (Tipe 1 dan Tipe 2) dengan menggunakan pemeringkatan BM25 maupun Proximity mencapai 80%. Evaluasi Pertanyaan Kejadian Jamak (Tipe 3 dan 4) Pada jenis pertanyaan kejadian jamak, terdapat proses rekomposisi untuk menghasilkan jawaban yang sesuai urutan kejadian. Metode pendeteksian temporal signal dan pemenggalan pertanyaan yang digunakan untuk jenis pertanyaan ini telah mampu menyederhanakan pertanyaan yang lebih kompleks, terlihat dari persentase nilai jawaban Right yang diperoleh. Persentase nilai Right untuk pertanyaan temporal Tipe 3 dengan menggunakan pemeringkatan BM25 memiliki kinerja baik, yaitu menghasilkan nilai Right untuk kata tanya siapa, kapan dan di mana sebesar 100%, sedangkan berapa sebesar 80%. Hasil berbeda
7 11 Nilai Right (%) Gambar 4 Hasil pemeringkatan BM25 dan Proximity untuk pertanyaan temporal. ditunjukkan dengan menggunakan pemeringkatan Proximity. Persentase nilai Right yang diperoleh untuk kata tanya kapan dan di mana mencapai 100%, siapa sebesar 80%, sedangkan berapa sebesar 60%. Kekurangan sistem dalam mengolah kata tanya berapa, khususnya menggunakan pemeringkatan Proximity disebabkan mode pemeringkatan tersebut memungkinkan pengembalian passage yang hanya memiliki salah satu keyword di frase, sehingga berpengaruh pada proses ekstraksi jawaban. Selain itu, adanya kandidat jawaban yang saling berdekatan juga memungkinkan pengembalian jawaban salah atau tidak relevan. Proses rekomposisi pada pertanyaan temporal Tipe 4 jauh lebih kompleks, karena selain terdapat signal yang menentukan urutan kejadian juga terdapat ekspresi temporal. Persentase nilai jawaban Right dengan menggunakan pemeringkatan BM25 untuk masing-masing kata tanya siapa, kapan dan di mana sebesar 80%. Nilai lebih rendah dihasilkan untuk kata tanya berapa sebesar 60%. Sementara itu, menggunakan pemeringkatan Proximity persentase kata tanya siapa, kapan, di mana dan berapa masing-masing sebesar 80%. Jawaban salah yang dikembalikan oleh sitem untuk jenis pertanyaan kejadian jamak disebabkan terdapat perbedaan periode waktu yang berelasi pada kandidat jawaban (Q-Focus) dan pada jawaban yang berasosiasi waktu (Q- Restriction) yang umumnya berupa ekspresi tanggal. Sebagai contoh kasus, diberikan pertanyaan yang meminta nama presiden yang menjabat pada tahun Berdasarkan relevansi data, diketahui bahwa periode jabatan Presiden Yudhoyono adalah tahun Akan tetapi, sistem menetapkan relasi waktu pada entitas Yudhoyono adalah tahun Pada kasus tersebut, entitas Yudhoyono Tipe 1 Tipe 2 Tipe 3 Tipe 4 BM25 Proximity dengan relasi waktu 2005 dianggap sudah benar berdasarkan periode waktu yang relevan tahun , namun entitas tidak dikembalikan sebagai jawaban akhir karena tidak memenuhi waktu yang telah ditentukan, yaitu tahun Kekurangan tersebut disebabkan jumlah dokumen yang digunakan dapat memengaruhi sebaran atau granulasi waktu yang menentukan relasi waktu kandidat jawaban. Rata-rata nilai Right untuk jenis pertanyaan kejadian jamak (Tipe 3 dan Tipe 4) menggunakan pemeringkatan BM25 sebesar 85%, lebih tinggi dibandingkan menggunakan pemeringkatan Proximity sebesar 82.50%. Gambar 4 menunjukkan hasil pengolahan setiap tipe pertanyaan temporal menggunakan pemeringkatan BM25 dan Proximity. Pada Tipe 1 dan Tipe 2, kedua mode pemeringkatan menghasilkan rata-rata nilai Right yang sama, yaitu sebesar 85% dan 75%. Pada Tipe 3, penggunaan pemeringkatan BM25 untuk pertanyaan temporal menghasilkan rata-rata nilai Right lebih baik, yaitu sebesar 95%, dibandingkan dengan pemeringkatan Proximity sebesar 85%. Sementara itu, pada Tipe 4, penggunaan pemeringkatan BM25 menghasilkan rata-rata nilai Right lebih rendah, yaitu sebesar 75%, dibandingkan dengan pemeringkatan Proximity sebesar 80%. Pembandingan Sistem Pembandingan sistem dilakukan pada Question Answering System (QAS) umum untuk query pertanyaan factoid hasil penelitian Umriadi (2011). Sistem diberikan query dan dokumen yang sama, namun tanpa dilakukan penyesuaian temporal tagging terlebih dahulu karena sistem tersebut dibangun tanpa fungsi pengolahan informasi temporal. Pengolahan pertanyaan temporal untuk Tipe 1, Tipe 2, Tipe 3, dan Tipe 4 menghasilkan nilai Right masing-masing hanya sebesar 60%, 55%, 60%, dan 40%. Rata-rata nilai Right keseluruhan pengolahan pertanyaan temporal sebesar 53.75%. Hasil tersebut jauh lebih rendah dibandingkan dengan hasil pengolahan pertanyaan temporal pada sistem yang telah dibangun, yaitu dengan rata-rata nilai Right sebesar 82.50% menggunakan BM25 dan 81.25% mengunakan Proximity. Kekurangan pengolahan pertanyaan temporal pada QAS umum (Umriadi 2011) disebabkan query diolah langsung oleh sistem tanpa dilakukan proses identifikasi ekspresi temporal dan temporal signal yang berguna dalam menentukan urutan kejadian dan skenario perlakuan query. Perbandingan hasil pengolahan pertanyaan temporal menggunakan
HASIL DAN PEMBAHASAN. Menggunakan nilai Mean Reciprocal Rank (MRR) untuk melihat kinerja sistem dalam mengambil passage yang relevan.
4 dan Thelen (2000) karena disesuaikan terhadap kaidah bahasa Indonesia. Rule yang dibuat Sianturi (2008) dan digunakan oleh Sanur (2011) memiliki notasi S sebagai sentence atau passage serta Q sebagai
Lebih terperinci2. Ketepatan untuk setiap jawaban.
dikembalikan sebagai top passage dari kueri pertanyaan yang diberikan. 5. Ekstraksi Jawaban Top passages yang diperoleh dilakukan perhitungan terhadap jarak kata. Entitas yang memiliki jarak terpendek
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen
6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat
Lebih terperinciIdentifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN
5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciHASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.
beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j
3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)
Lebih terperinciPEMILIHAN DEPARTEMEN FAKULTAS
PEMILIHAN PASSAGES DALAM QUESTION ANSWEING SYSTEM UNTUK DOKUMEN BEBAHASA INDONESIA SUCI AMELIA SANU DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIANN BOGO BOGO 2011
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciBAB 3 PERANCANGAN SISTEM
BAB 3 PERANCANGAN SISTEM Bab ini menguraikan perancangan sistem yang dikembangkan meliputi arsitektur sistem, perancangan pembuat unit pengindeksan dan perancangan antarmuka. 3.1 Arsitektur Sistem Gambar
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database
Lebih terperinciANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA
ANALISIS PERTANYAAN BERBAHASA INDONESIA PADA QUESTION ANSWERING SYSTEM (QAS) KARTINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010 1 ANALISIS
Lebih terperinciQUESTION ANSWERING SYSTEM MENGGUNAKAN N-GRAM TERM WEIGHT MODEL DEBBY PUSPA BAHRI
QUESTION ANSWEING SYSTEM MENGGUNAKAN N-GAM TEM WEIGHT MODEL DEBBY PUSPA BAHI DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIAN BOGO BOGO 2013 QUESTION ANSWEING SYSTEM
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciIMPLEMENTASI QUESTION ANSWERING SYSTEM PADA DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE N-GRAM FANDI RAHMAWAN
IMPLEMENTASI QUESTION ANSWERING SYSTEM PADA DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE N-GRAM FANDI RAHMAWAN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciBAB III ANALISIS PERMASALAHAN
BAB III ANALISIS PERMASALAHAN Hal-hal yang dianalisis pada bab ini meliputi: 1. Aspek waktu yang akan digunakan. 2. Fungsi agregasi pada relasi bitemporal. 3. Jenis query retrieval yang mengandung fungsi
Lebih terperinciBAB III ANALISA DAN PERANCANGAN SISTEM
BAB III ANALISA DAN PERANCANGAN SISTEM III.1 Analisis Sistem Analisis sistem merupakan penguraian dari suatu sistem yang utuh kedalam bagian-bagian komponennya dengan maksud untuk mengidentifikasikan dan
Lebih terperinciBAB 3 ANALISIS MASALAH DAN PERANCANGAN
BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN Pada bab ini dipaparkan latar belakang penelitian, rumusan masalah, tujuan penelitian, ruang lingkup penelitian, tahapan penelitian, dan sistematika penulisan laporan. 1.1 Latar Belakang
Lebih terperinciGambar 4 Ilustrasi bagian dokumen yang digunakan untuk pemrosesan.
6 pada akhir, seperti newsipb11111-2.txt yang berarti data berasal dari berita IPB dan diterbitkan pada tanggal 11 bulan Januari tahun 211 urutan ke-2. Dokumen memiliki ukuran terkecil 1 KB dan terbesar
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey
Lebih terperincidengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan
dengan metode penelitian yang dapat dilihat pada Gambar 9. Data Citra Tumbuhan Gambar 8 Struktur PNN. 1. Lapisan pola (pattern layer) Lapisan pola menggunakan 1 node untuk setiap data pelatihan yang digunakan.
Lebih terperinciTabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita
6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional
Lebih terperinciHASIL DAN PEMBAHASAN. sim(, )=
4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i
Lebih terperinciBAB III PERANCANGAN. Tabel 3.1 Detil Tabel mpage
BAB III PERANCANGAN Bab ini menjelaskan mengenai perancangan sistem peringkas berita otomatis pada media massa online berbasis GVSM. Perancangan dibagi dalam beberapa bagian antara lain perancangan database,
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN
BAB 3 ANALISIS DAN PERANCANGAN 3.1 Analisis Masalah Penelitian yang sudah pernah membuat sistem ini berhasil menciptakan pembangkitan pertanyaan non-factoid secara otomatis dengan menggunakan tiga jenis
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciBAB III METODE PENELITIAN. Penelitian ini dilakukan di Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu
BAB III METODE PENELITIAN 3.1 Tempat dan Waktu Penelitian Penelitian ini dilakukan di Jurusan Ilmu Komputer, Fakultas Matematika dan Ilmu Pengetahuan Alam, Universitas Lampung. Waktu penelitian dilakukan
Lebih terperinciBAB IV PERANCANGAN 4.1 Perancangan Arsitektur Sistem Kebutuhan Perangkat Lunak Tabel 4.1
BAB IV PERANCANGAN 4.1 Perancangan Arsitektur Sistem Perancangan sistem untuk aplikasi pencarian resep masakan ini menggunakan UML. Unified Modelling Language(UML) adalah himpunan struktur dan teknik untuk
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
Lebih terperinciHASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.
5 Mulai HASIL DAN PEMBAHASAN Kromosom P = rand [0,1] Ya P < Pm R = random Gen(r) dimutasi Selesai Tidak Gambar 7 Diagram alur proses mutasi. Hasil populasi baru yang terbentuk akan dievaluasi kembali dan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai
Lebih terperinciStruktur Data. PDE - Struktur Data 1
Struktur Data Copyright@Ihsan Jatnika PDE - Struktur Data 1 Objektif Mengetahui maksud struktur data dan menjelaskan penggunaannya dalam pemrograman Mengetahui operasi yang terkait dengan struktur data
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciUKDW BAB 1 PENDAHULUAN Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Saat ini banyak metode pembelajaran yang bisa diterapkan untuk menambah ilmu pengetahuan seseorang. Salah satu metode pembelajaran yang bisa dilakukan yaitu
Lebih terperinciRANCANG BANGUN PENCARIAN JUDUL TESIS BERBASIS TEKNOLOGI WEB SEMANTIK
RANCANG BANGUN PENCARIAN JUDUL TESIS BERBASIS TEKNOLOGI WEB SEMANTIK Ahmad Chusyairi 1), Ema Utami 2) 1,2) Magister Teknik Informatika Program Pascasarjana STMIK AMIKOM Yogyakarta Jl Ring Road Utara, Condongcatur,
Lebih terperinciPengenalan Script. Definisi HTML
1 Pengenalan Script Pada bab ini akan dibahas bahasa script yang dapat digunakan untuk membuat halaman web. Untuk dapat membuat halaman web bahasa script pertama yang harus anda kenal adalah HTML. HTML
Lebih terperinciPengenalan Algoritma & Struktur Data. Pertemuan ke-1
Pengenalan Algoritma & Struktur Data Pertemuan ke-1 Apa itu Struktur Data? PROGRAM ALGO RITMA STRUKTUR DATA Algoritma.. deskripsi langkah-langkah penyelesaian masalah yang tersusun secara logis 1. Ditulis
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN Dalam penelitian ini diperlukan sebuah desain dan metode penelitian agar dalam pelaksanaaannya dapat menjadi lebih teratur dan terurut. 3.1. Desain Penelitian Bentuk dari desain
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM Bab ini menjelaskan mengenai tahapan analisis dan perancangan sistem yang akan dikembangkan, yaitu Sistem Identifikasi Buron. Bab ini terbagi atas 5 bagian yang
Lebih terperinciBAB IV IMPLEMENTASI DAN PENGUJIAN
BAB IV IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Setelah tahap analisis dan perancangan dilakukan pada bab III, maka tahap berikutnya adalah implementasi. Pada bab ini akan dibahas mengenai implementasi
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciBAB II LANDASAN TEORI
4 BAB II LANDASAN TEORI 2.1 Definisi Sistem Sistem merupakan kumpulan elemen elemen yang saling berkaitan, bekerja sama untuk mencapai suatu tujuan. (Jogiyanto, 1999, hlm 1). Suatu sistem terdiri atas
Lebih terperinciBAB 1 PENDAHULUAN. Universitas Sumatera Utara
1 BAB 1 PENDAHULUAN 1.1. Latar Belakang Kata kunci (keyword) merupakan kata-kata singkat yang dapat menggambarkan isi suatu artikel ataupun dokumen (Figueroa,et al. 2014). Kata kunci memberikan kemudahan
Lebih terperinci4 HASIL DAN PEMBAHASAN
24 4 HASIL DAN PEMBAHASAN 4.1 Data Korpus Data korpus berisi berita-berita nasional berbahasa Indonesia dari tanggal 11 Maret 2002 sampai 11 April 2002. Berita tersebut berasal dari berita online harian
Lebih terperinciBAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang
BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang
Lebih terperinciBAB 4 Hasil dan Pembahasan
BAB 4 Hasil dan Pembahasan 4.1. Spesifikasi Sistem Dalam pengerjaan program aplikasi ini, penulis menggunakan jenis hardware dan software sebagai berikut : 4.1.1. Hardware Dalam perancangan program aplikasi
Lebih terperinciBAB IV ANALISIS DAN PERANCANGAN SISTEM. sistem dengan cara menguraikan sistem tersebut kedalam elemen yang
BAB IV ANALISIS DAN PERANCANGAN SISTEM 4.1 Analisis Sistem Yang Berjalan Tahapan yang diperlukan pada pembuatan suatu program yaitu menganalisa sistem yang telah ada mengenai kelebihan dan kekurangan sistem
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU
CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciBAB 3 ANALISA DAN PERANCANGAN
BAB 3 ANALISA AN PERANCANGAN 3.1 Gambaran Umum Pada masa sekarang ini, proses pencarian dokumen dalam web seperti Google, Yahoo, dan sebagainya dilakukan dengan menginput query yang diinginkan pada kotak
Lebih terperinciBAB II LANDASAN TEORI. Antrian sering dijumpai dalam kehidupan sehari-hari contohnya dalam
BAB II LANDASAN TEORI 2.1 Antrian (Queue) Antrian sering dijumpai dalam kehidupan sehari-hari contohnya dalam sistem pembelian karcis kereta api atau bioskop, dimana orang yang datang pertama akan diberi
Lebih terperinciBAB 4 IMPLEMENTASI DAN EVALUASI
BAB 4 IMPLEMENTASI AN EVALUASI Pada bab ini, disajikan spesifikasi sistem yang digunakan, pengujian program serta hasil pengujian. Pengujian dilakukan dengan melakukan pencarian kata kunci terhadap sejumlah
Lebih terperinciBAB III ANALISA DAN PERANCANGAN
BAB III ANALISA DAN PERANCANGAN Pada bagian ini penulis akan menganalisa kebutuhan kebutuhan dalam membuat aplikasi ini. Setelah semua kebutuhan selesai dianalisa, maka penulis akan melanjutkan ke tahap
Lebih terperinciBAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM
BAB III ANALISIS MASALAH DAN RANCANGAN PROGRAM III.1. Analisis Masalah Pencarian (searching) merupakan proses yang sering digunakan dalam pengolahan data. Proses Pencarian ini biasanya di lakukan dengan
Lebih terperinciBAB 2 LANDASAN TEORI. 2.1 Pengertian Text Mining
13 BAB 2 LANDASAN TEORI 2.1 Pengertian Text Mining Text Mining dapat juga diartikan sebagai penambangan data berupa teks yang bersumber dari dokumen untuk mencari karta-kata yang merupakan perwakilan isi
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka
Lebih terperinciBAB III METODOLOGI PENELITIAN
28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian
Lebih terperinciBAB II ANALISI DAN PERANCANGAN. Komponen komponen yang diperlukan untuk menganalisis. kebutuhan dari obyek yang dibangun antara lain sistem pendukung,
BAB II ANALISI DAN PERANCANGAN 2.1 Analisi Kebutuhan Komponen komponen yang diperlukan untuk menganalisis kebutuhan dari obyek yang dibangun antara lain sistem pendukung, pengguna (user) dan fungsinya.
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Document summarization adalah proses pengambilan teks dari sebuah dokumen dan membuat sebuah ringkasan yang mempunyai informasi yang lebih berguna bagi user
Lebih terperinciPERANCANGAN BASIS DATA. Alif Finandhita, S.Kom
PERANCANGAN BASIS DATA Alif Finandhita, S.Kom Proses perancangan basis data, terlepas dari masalah yang ditangani dibagi menjadi 3 tahapan : Perancangan basis data secara konseptual Merupakan upaya untuk
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM Proses analisis dan perancangan sistem merupakan suatu prosedur yang dilakukan untuk pemeriksaan masalah dan penyusunan alternatif pemecahan masalah yang timbul
Lebih terperinciTES. Pustakawan Dalam Pengelolaan Database. Atas bantuan Bapak/Ibu/Sdr saya. 2. Nama BapakIbu/Sdr tidak perlu dicantumkan.
LAMPIRAN 1 TES Dengan hormat, Dengan segala kerendahan hati, saya mohon bantuan Bapak/Ibu/Sdr untuk mengisi tes ini yang berkaitan dengan judul penelitian saya Analisis Kemampuan Pustakawan Dalam Pengelolaan
Lebih terperinciMANUAL PENGGUNAAN FILE EXCEL
MANUAL PENGGUNAAN FILE EXCEL 1. Untuk mendapatkan berkas pengisian parpol, setip parpol dapat mengekstrak format file " NAMA_PARTAI.ZIP " ke dalam media penyipanan lokal tertentu (local storage) dengan
Lebih terperinciInteger (Bilangan Bulat) Yang dimaksud bilangan bulat adalah, -1, -2, -3, 0, 1, 2, 3, 4 dan lain lain yang bukan merupakan bilangan pecahan.
Struktur Data Struktur Data Setiap data memiliki tipe data, apakah merupakan angka bulat, angka pecahan, atau berupa karakter, dan sebagainya. Jadi, tipe data adalah pengelompokan data berdasarkan isi
Lebih terperinciLAPORAN PRAKTIKUM PENGANTAR TEKNOLOGI INFORMASI DATABASE
LAPORAN PRAKTIKUM PENGANTAR TEKNOLOGI INFORMASI DATABASE Disusun oleh : Cephi Prasintasari KOMSI E (12/332452/DPA/01167) Fakultas SV MIPA Universitas Gadjah Mada Yogyakarta 2012 TABLE OF CONTENT I. PENDAHULUAN
Lebih terperinciChapter 2. Tipe Data dan Variabel
Chapter 2 Tipe Data dan Variabel Pada prinsipnya suatu program computer memanipulasi data untuk dijadikan informasi yang berguna. Komputer memanipulasi berbagai macam data, bukan hanya angka, tetapi juga
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Membaca adalah salah satu aktifitas yang dilakukan oleh seseorang untuk mendapatkan intisari dari sebuah teks, misalnya teks berita. Untuk mendapatkan intisari dari
Lebih terperinciBab 3 Metode Perancangan
Bab 3 Metode Perancangan 3.1 Metode Perancangan dan Desain Sistem Metode rekayasa perangkat lunak yang digunakan dalam pembuatan skripsi ini adalah metode prototyping. Metode prototyping adalah metode
Lebih terperinciPemrosesan data sebelum adanya basis data Perancangan sistemnya masih didasarkan pada kebutuhan individu pemakai, bukan kebutuhan sejumlah pemakai
Basis Data Pemrosesan data sebelum adanya basis data Perancangan sistemnya masih didasarkan pada kebutuhan individu pemakai, bukan kebutuhan sejumlah pemakai Duplikasi data Data yg sama terletak pada
Lebih terperinciPenerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen
Penerapan Metode Winnowing Fingerprint dan Naive Bayes untuk Pengelompokan Dokumen Adi Radili 1, Suwanto Sanjaya 2 1,2 Teknik Informatika UIN Sultan Syarif Kasim Riau Jl. H.R. Soebrantas no. 155 KM. 18
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
Lebih terperinciBAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM
BAB IV IMPLEMENTASI DAN PENGUJIAN SISTEM Pada bab ini akan membahas tahap implementasi dan pengujian sistem. Tahap implementasi merupakan tahap pelaksanaan atau penerapan dari perancangan. Sedangkan pengujian
Lebih terperinciBab IV Perancangan. Aplikasi Visualisasi Dashoard
Bab IV Perancangan Perancangan merupakan salah satu tahap yang memiliki peranan penting pada pembangunan suatu aplikasi. Perancangan dilakukan berdasarkan hasil analisis dan penentuan kebutuhan. Pada perancangan
Lebih terperinci1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Basis data adalah Kumpulan data yang menggambarkan entitas-entitas beserta relasi-relasinya dari suatu organisasi, yang diorganisir dan disimpan dalam suatu
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN MULTIDOKUMEN FADILA ANDRE MULYANTO
COSS LANGUAGE QUESTION ANSWEING SYSTEM MENGGUNAKAN PEMBOBOTAN HEUISTIC DAN MULTIDOKUMEN FADILA ANDE MULYANTO DEPATEMEN ILMU KOMPUTE FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PETANIAN BOGO
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA Pada bab ini menjelaskan topik taksonomi yang merupakan pengorganisasian informasi yang penting karena merupakan dasar dalam memahami suatu informasi. Taksonomi membantu memahami
Lebih terperinciBAB 3 METODOLOGI PENELITIAN
25 BAB 3 METODOLOGI PENELITIAN 3.1. Analisis Permasalahan Pada regresi berganda terdapat beberapa masalah yang dapat terjadi sehingga dapat menyebabkan estimasi koefisien regresi menjadi tidak stabil.
Lebih terperinciBAB I PENDAHULUAN. Teknologi Informasi saat ini mengalami perkembangan yang signifikan.
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Teknologi Informasi saat ini mengalami perkembangan yang signifikan. Beragam aspek kehidupan sangat terbantu dengan perkembangan teknologi informasi ini. Hal
Lebih terperinciBASIS DATA MODEL BASIS DATA
BASIS DATA MODEL BASIS DATA APA ITU MODEL BASIS DATA? Model database menunjukkan struktur logis dari suatu basis data, termasuk hubungan dan batasan yang menentukan bagaimana data dapat disimpan dan diakses.
Lebih terperinci3.1 Ganesha Digital Library
BAB III ANALISIS Dalam bab ini akan dibahas mengenai analisis perangkat lunak yang akan dibangun. Analisis dilakukan pada sistem lama dan sistem baru. Analisis pada sistem lama meliputi penerapan folksonomy,
Lebih terperinci6. Kumpulan data yang diorganisir menggunakan metode tertentu sehingga menghasilkan informasi yang berguna bagi pemakainya, pengertian dari: JAWAB:
1. Jelaskan pengertian dari basis data dan berikan contohnya? 2. Sebutkan dari konsep dasar basis data? 3. Sebutkan 4 komponen pokok dari sistem basis data? 4. Sebutkan 3 jenis data pada sistem basis data,
Lebih terperinciUKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Berkembangnya teknologi telah membuat banyak informasi bermunculan. Informasi-informasi tersebut tertuang dalam bentuk dokumen terutama dokumen digital. Semakin
Lebih terperinciBAB III LANDASAN TEORI
BAB III LANDASAN TEORI Dalam bab ini akan dijelaskan landasan teori yang digunakan untuk mendukung penyusunan laporan kerja praktek ini. Landasan teori yang akan dibahas meliputi permasalahan-permasalahan
Lebih terperinciBAB 4 IMPLEMENTASI DAN EVALUASI. Untuk menjalankan alat bantu normalisasi ini dibutuhkan sarana perangkat keras
BAB 4 IMPLEMENTASI DAN EVALUASI 4.1 Implementasi 4.1.1 Spesifikasi Sistem Untuk menjalankan alat bantu normalisasi ini dibutuhkan sarana perangkat keras dan piranti lunak sebagai berikut : Spesifikasi
Lebih terperinciBAB III METODOLOGI PENELITIAN
60 BAB III METODOLOGI PENELITIAN 1.1 Desain Penelitian Desain penelitian adalah tahapan atau gambaran yang akan dilakukan dalam penelitian. Desain penelitian dibuat untuk memudahkan pelaksanaan tahaptahap
Lebih terperinciDAFTAR ISI. Halaman Judul. Halaman Pengesahan. Halaman Pernyataan. Halaman Persembahan. Halaman Motto INTISARI
DAFTAR ISI Halaman Judul Halaman Pengesahan Halaman Pernyataan Halaman Persembahan Halaman Motto PRAKATA INTISARI ABSTRACT ii iii iv v vi vii xv xvi I PENDAHULUAN 1 1.1 Latar Belakang.............................
Lebih terperinciPERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA
PERBANDINGAN DECISION TREE, MAXIMUM ENTROPY, DAN ASSOCIATION RULES PADA RESOLUSI KOREFERENSI UNTUK BAHASA INDONESIA Astria Kurniawan Sumantri 1, Indra Budi 2, Heri Kurniawan 2 1,2,3 Fakultas Ilmu Komputer,Universitas
Lebih terperinciBAB 9 DATA MODELLING 9.1 DATA MODEL
BAB 9 DATA MODELLING 9.1 DATA MODEL Data model adalah cara formal untuk menggambarkan data yang digunakan dan diciptakan dalam suatu sistem bisnis. Model ini menunjukkan orang, tempat atau benda dimana
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat
Lebih terperinciBAB 1 PENDAHULUAN. Latar Belakang
BAB 1 PENDAHULUAN Latar Belakang Berita pada media massa online bertambah banyak setiap waktu karena selalu ada sesuatu yang patut untuk diberitakan kepada khalayak. Hal ini membuat pembaca harus menyiapkan
Lebih terperinciABSTRAK. Kata kunci: Sistem Tanya Jawab, Semantic Web, Ontology, domain terbatas. v Universitas Kristen Maranatha
ABSTRAK Informasi telah menjadi bagian yang sangat penting didalam pertumbuhan masyarakat modern. Dengan meningkatnya kebutuhan informasi ini, maka banyak orang memerlukan mesin pencari informasi yang
Lebih terperinciBAB 1 PENDAHULUAN 1.1. Latar belakang
BAB 1 PENDAHULUAN 1.1. Latar belakang Dengan berkembangnya teknologi dewasa ini, segala sesuatu harus dilakukan secara cepat, begitu juga dengan pembaca yang ingin secara cepat mengetahui keseluruhan infomasi
Lebih terperinci