MESIN PENCARI SMS BERBASIS ANDROID DENGAN MENGGUNAKAN METODE N-GRAM RIZKY UTAMA PRAMUDIA
|
|
- Yanti Lie
- 7 tahun lalu
- Tontonan:
Transkripsi
1 MESIN PENCARI SMS BERBASIS ANDROID DENGAN MENGGUNAKAN METODE N-GRAM RIZKY UTAMA PRAMUDIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
2 MESIN PENCARI SMS BERBASIS ANDROID DENGAN MENGGUNAKAN METODE N-GRAM RIZKY UTAMA PRAMUDIA Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
3 ABSTRACT RIZKY UTAMA PRAMUDIA. Search Engine SMS based on Android using N-gram Method. Supervised by JULIO ADISANTOSO. Search engines Short-Messaging Service (SMS) on mobile devices are still using the exact match method. This method can only find SMS containing words, which one exact matches of the query. Therefore, a method to correct the spelling of the text is needed. Trigram similarity measure method is one of spelling correction methods developed which gives a relatively good performance. Therefore, this study applied the method of N-gram with bigram models and trigram models for SMS in Indonesian. The result of this research is a search engine with an average precision (AVP) 49.6% for bigram models and 80.8% for trigram models. Keyword : SMS, N-gram, bigram, trigram, spelling correction, search engine
4 Judul Skripsi Nama NRP : Mesin Pencari SMS berbasis Android dengan Menggunakan Metode N-gram : Rizky Utama Pramudia : G Menyetujui: Pembimbing Ir. Julio Adisantoso, M.Kom NIP Mengetahui: Ketua Departemen Ilmu Komputer Dr. Ir. Agus Buono, M.Si, M.Kom NIP Tanggal Lulus :
5 KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Allah subhanahu wata ala yang telah memberikan rahmat dan karunia-nya sehingga penulis dapat menyelesaikan tugas akhir dengan judul Mesin Pencari SMS berbasis Android dengan Menggunakan Metode N-gram. Penulis juga menyampaikan terima kasih kepada seluruh pihak yang telah berperan dalam tugas akhir ini, yaitu: Ayahanda H.Safrudin, Ibunda Fitriana Wulandari, serta keluarga besar penulis yang selalu memberikan doa, nasihat, semangat, dan kasih sayang yang luar biasa kepada penulis. Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir yang memberikan bimbingan, ide, dukungan, semangat serta kesabaran dalam pengerjaan tugas akhir ini. Bapak Ahmad Ridha, S.Kom, MS dan Bapak Sony H. Wijaya, S.Kom, M.Kom selaku dosen penguji yang telah memberi masukan dan saran pada tugas akhir penulis. Rekan satu bimbingan Susi Handayani, Fania R K, Meri Marlina, Meriska Defriani, Anita, Hafidzhia Dzikrul A, Alfa Nugraha, Putri Dewi Purnama Sari, dan Nofel Saputra. Terima kasih atas bantuan, kebersamaan dan semangatnya dalam menyelesaikan tugas akhir ini. Tri Lugina Kusumaningtias, Anjar Hafidhun, Satria Wardana, Rian Senja dan Aida Ratna Juwita. Terima kasih atas semangat dan dukungannya yang telah diberikan kepada penulis. Semoga kita bisa berjumpa kembali kelak sebagai orang-orang sukses. Seluruh keluarga besar PONDOK AA (Uda Roni, Bang Aad, Bang Aan, Bang Bono, Wido, Rilan, dan rekan-rekan lain) yang selalu memberikan semangat kepada penulis selama melaksanakan tugas akhir ini. Seluruh rekan-rekan Ilmu Komputer angkatan 45 atas segala kebersamaan, bantuan, canda tawa, dan kenangan indah serta semangat bagi penulis slama masa studi. Semoga kita semua bisa berjumpa kembali kelak sebagai orang-orang sukses. Penulis berharap tugas akhir ini dapat memberikan manfaat, khususnya bagi bidang temu kembali informasi. Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat kekurangan dalam berbagai hal. Penulis berharap adanya masukan yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Bogor, Januari 2013 Rizky Utama Pramudia
6 RIWAYAT HIDUP Rizky Utama Pramudia dilahirkan di Jakarta pada tanggal 19 September 1990 dari pasangan Bapak H Safrudin dan Ibu Fitriana Wulandari. Pada tahun 2008, penulis lulus dari SMA Negeri 106 Jakarta dan menjadi mahasiswa di Departemen Ilmu Komputer Institut Pertanian Bogor (IPB) melalui Undangan Seleksi Masuk IPB (USMI). Selama menjadi mahasiswa, penulis menjadi asisten praktikum mata kuliah Komputer Grafik pada tahun Pada bulan Juli hingga Agustus 2011, penulis melaksanakan Praktik Kerja Lapangan di Bank Indonesia, Jakarta.
7 DAFTAR ISI Halaman DAFTAR TABEL... vi DAFTAR GAMBAR... vi DAFTAR LAMPIRAN... vi PENDAHULUAN... 1 Latar Belakang... 1 Tujuan... 1 Ruang Lingkup... 1 Praproses Dokumen... 2 Pemrosesan Kueri... 2 Pemeringkatan Dokumen... 2 Evaluasi Sistem... 2 Lingkungan Implementasi... 3 HASIL DAN PEMBAHASAN... 3 Dokumen Pengujian... 3 Pemrosesan dokumen... 3 Pemrosesan Kueri... 4 Ukuran Kesamaan... 4 Pengujian Kinerja Sistem... 4 Pengembangan Sistem... 7 SIMPULAN DAN SARAN... 7 Simpulan... 7 Saran... 7 DAFTAR PUSTAKA... 7 LAMPIRAN... 9 v
8 DAFTAR TABEL Halaman 1 Relevant dan retrieved dokumen Contoh daftar hasil pencarian untuk kueri Q Contoh hasil keluaran sistem trec_eval trigram Perbandingan nilai AVP sepuluh kueri pada sistem... 6 DAFTAR GAMBAR Halaman 1 Tahapan pembangunan sistem Format dokumen uji SMS (.xml) Grafik recall precision bigram dan trigram dengan threshold Grafik recall precision bigram dan trigram dengan threshold Grafik recall precision bigram dan trigram dengan threshold DAFTAR LAMPIRAN Halaman 1 Daftar kueri uji dan dokumen yang relevan Contoh dokumen SMS pengujian Hasil keluaran sistem trec_eval bigram Hasil keluaran sistem trec_eval trigram Hasil keluaran sistem trec_eval bigram Hasil keluaran sistem trec_eval trigram Hasil keluaran sistem trec_eval bigram Daftar AVP pada pengujian model bigram dengan threshold Daftar AVP pada pengujian model trigram dengan threshold Daftar AVP pada pengujian model bigram dengan threshold Daftar AVP pada pengujian model trigram dengan threshold Daftar AVP pada pengujian model bigram dengan threshold Daftar AVP pada pengujian model trigram dengan threshold Antarmuka halaman utama sistem pencarian SMS Antarmuka hasil pencarian Antarmuka read SMS Antarmuka reply SMS Antarmuka forward SMS vi
9 1 Latar Belakang PENDAHULUAN Sistem temu kembali informasi sangat erat kaitannya dengan sistem pencarian (search engine). Sistem pencarian membutuhkan masukan berupa kueri untuk memperoleh suatu informasi yang diinginkan. Kadangkala, informasi yang ditemukembalikan kurang relevan dengan kebutuhan pengguna (Rahmawan 2011). Saat ini pengembangan sistem pencarian short message service (SMS) menggunakan perangkat mobile belum banyak dikembangkan. Sistem pencarian SMS yang terdapat pada perangkat mobile saat ini masih menggunakan metode exact match. Sistem pencarian SMS menggunakan metode exact match telah diterapkan pada perangkat mobile berbasis Android. Android adalah sistem operasi untuk perangkat mobile yang berbasis Linux. Android menyediakan platform terbuka bagi para pengembang untuk menciptakan aplikasi mereka sendiri untuk digunakan oleh bermacam perangkat mobile yang berbasis Android. Sistem pencarian SMS pada Android hanya bisa mencari SMS dengan kueri yang tepat sama dengan kata yang ada pada SMS. Sistem ini tidak bisa mengatasi bila pengguna salah ejaan kata pada saat memasukkan kueri. Berbagai metode telah dikembangkan untuk program pengoreksi ejaan berbahasa Inggris dan hasilnya cukup memuaskan. Untuk Bahasa Indonesia, metode tersebut masih merupakan bahan kajian yang harus diteliti dan dikembangkan lebih lanjut terutama pada dokumen berbentuk SMS (Wahyudin 1999). Menurut Damerau (1964) dalam Peterson (1980) 80% kesalahan ejaan merupakan variasi dari empat hal, yaitu penggantian satu huruf, penyisipan satu huruf, penghilangan satu huruf, dan transposisi dua huruf berdekatan. Algoritme ukuran kesamaan trigram adalah salah satu metode pengoreksi ejaan yang dikembangkan oleh Angell et al. (1983) di Inggris yang memberikan kinerja cukup baik, yaitu antara 75%-90% koreksi kesalahan ejaan dengan kamus sebanyak kata. Algoritme ini digunakan untuk mengukur kesamaan dua string yang tidak tepat sama. Pada kenyataannya, SMS sering ditulis dengan tidak benar sehingga sulit dicari dengan metode kesamaan string tepat sama. Oleh karena itu, pada penelitian ini akan dikembangkan sistem pencarian SMS berbasis Android menggunakan metode N-gram sehingga sistem diharapkan dapat mencari SMS menggunakan kueri yang tidak tepat sama. Tujuan Tujuan dari penelitian ini adalah: 1 Mengimplementasikan sistem mesin pencari SMS berbasis Android. 2 Menganalisis kinerja sistem yang akan dibangun dengan mengembalikan dokumen SMS yang relevan dari banyak dokumen SMS yang tidak hanya menggunakan bahasa baku. Ruang Lingkup Ruang lingkup dalam penelitian ini adalah: 1 Dokumen yang digunakan dalam penelitian adalah dokumen SMS berbahasa Indonesia. 2 Dokumen yang relevan dengan kueri uji, ditentukan berdasarkan penulis. METODE Penelitian ini dilaksanakan dalam beberapa tahapan, yaitu: pengumpulan koleksi dokumen SMS, perhitungan metode N-gram, perhitungan ukuran kesamaan antara dokumen dan kueri, pemeringkatan dokumen, dan perhitungan evaluasi hasil temu-kembali sistem. Tahapan-tahapan tersebut dapat dilihat pada Gambar 1. Gambar 1 Tahapan pembangunan sistem.
10 2 Koleksi Dokumen Dokumen yang digunakan sebagai dokumen uji adalah dokumen SMS yang berasal dari penulis. Dokumen berjumlah 661 SMS inbox dan sent item dan kueri uji berjumlah 10 kueri dengan daftar dokumen yang relevan (Lampiran 1). Praproses Dokumen Tahapan penelitian dimulai dengan melakukan pembersihan data terhadap dokumen SMS di dalam sebuah kumpulan SMS. Terdapat dua tahapan praproses yang digunakan pada penelitian. Tahapan pertama adalah pembersihan data. Pembersihan data adalah suatu proses pembuangan separator yang dianggap kurang representatif dalam proses selanjutnya. Hal ini dilakukan dengan cara menghapus semua karakter tanda baca yang terdapat pada dokumen SMS dan mengubah semua huruf menjadi lowercase. Penelitian ini tidak menggunakan pembobotan melainkan dokumen SMS yang sudah dilakukan pembersihan data diproses menggunakan metode N-gram. Tahapan yang kedua yaitu proses N-gram. N-gram (Markov Chain) adalah rangkaian karakter (alfabet) atau kata yang diekstrak dari sebuah teks. N-gram dapat dibedakan menjadi dua kategori, yaitu basis karakter dan basis kata. Sebuah karakter N-gram merupakan rangkaian dari n karakter yang berurutan. Tujuan utama pendekatan ini adalah menentukan kata-kata yang mirip dengan rangkaian N-gram secara umum (Majumder et al 2002). Pada umumnya N-gram mengekstrak dokumen atau kata-kata menjadi dua atau tiga rangkaian yang terurut (sering disebut bigrams dan trigrams). Sebagai contoh susunan bigrams dari kata computer adalah CO, OM, MP, PU, UT, TE, dan ER. Pemrosesan Kueri Pemrosesan pada tahap ini sama halnya dengan praproses dokumen SMS, yaitu dilakukan tokenisasi, pembuangan tanda baca, dan spasi terhadap kueri. Kueri yang dimasukkan akan dilakukan proses dengan metode N-gram yang kemudian akan diperoleh array kueri yang dapat digunakan dalam proses perhitungan ukuran kesamaan. Pemeringkatan Dokumen Hasil pemrosesan dengan metode N-gram yang diperoleh dari dokumen SMS dan kueri kemudian diperiksa kesamaan dokumennya menggunakan ukuran kesamaan Dice. Nilai pengukuran kesamaan pada sistem akan mengembalikan dokumen relevan menurut sistem. Persamaan (1) menunjukkan proses penghitungan ukuran kesamaan dari N-gram dengan metode dice coefficient dari dua buah kata. 2 x X Y Dice =.. (1) X + Y dengan X adalah string dari N-gram X dan Y adalah string dari N-gram Y. Semakin tinggi nilai kesamaan dice menunjukkan bahwa dokumen tersebut memiliki tingkat kemiripan yang besar dengan kueri yang diberikan. Ukuran lain yang bisa digunakan untuk menghitung ukuran kesamaan adalah jaccard coefficient. Jaccard coefficient dari dua buah kata adalah: Jaccard = X Y... (2) X Y Dalam penelitian ini digunakan ukuran kesamaan dice coefficient untuk mengukur kesamaan dua string hasil N-gram. Evaluasi Sistem Pada proses evaluasi hasil temu-kembali dilakukan menggunakan ukuran recallprecision untuk menentukan tingkat keefektifan proses temu-kembali. Dua ukuran utama untuk keefektifan penemukembalian yang telah digunakan sejak lama adalah recall dan precision (Salton 1989). Recall adalah perbandingan jumlah dokumen relevan yang ditemukembalikan terhadap jumlah dokumen yang relevan, sedangkan precision adalah perbandingan jumlah dokumen relevan yang ditemukembalikan terhadap jumlah dokumen yang ditemukembalikan. Berdasarkan Tabel 1, recall (R) dan precision (P) dapat dinyatakan sebagai persamaan sebagai berikut: P = tp tp+fp dan R = tp tp+fn (3) Average precision (AVP) dihitung pada 11 standard recall levels, yaitu 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% dengan menggunakan interpolasi maksimum (Baeza-Yates & Ribeiro-Neto 1999).
11 3 Tabel 1 Relevant dan retrieved dokumen Retrieved Non retrieved Relevant True positive (tp) False negative (fn) Lingkungan Implementasi Non relevant False positive (fp) True negative (tn) Lingkungan implementasi yang digunakan adalah sebagai berikut: 1 Perangkat lunak: a Sistem operasi Windows 8 Professional sebagai sistem operasi, b Java rule-based Android sebagai bahasa pemrograman c Android SDK Windows, d Eclipse IDE e Trec_eval, dan f Microsoft Office 2007 sebagai aplikasi yang digunakan untuk melakukan perhitungan dalam evaluasi sistem. 2 Perangkat keras: a Processor Intel Core i GHz b RAM 4 GB c Harddisk dengankapasitas 500 GB HASIL DAN PEMBAHASAN Dokumen Pengujian Penelitian ini menggunakan 661 dokumen SMS yang berasal dari SMS penulis yang terbagi menjadi 394 dokumen SMS inbox dan 267 dokumen SMS sent item. Dokumen SMS yang digunakan berformat XML yang diexport dari perangkat mobile. Dokumen tersebut di-import ke dalam emulator Android agar bisa digunakan dalam implementasi sistem dengan menggunakan aplikasi pendukung di Android. Contoh format dokumen uji yang digunakan dapat dilihat pada Gambar 2. Koleksi ini dibuat sesuai struktur tag XML pada masing-masing dokumen. Tag XML yang digunakan dalam koleksi dokumen pertanian, yaitu: <SMSes/></SMSes>, mewakili jumlah dokumen SMS yang berhasil di-export. <SMS></SMS>, mewakili keseluruhan dokumen. Di dalamnya terdapat attribute lain yang mendeskripsikan isi dokumen secara lebih jelas. Jumlah kueri uji yang akan digunakan dalam penelitian ini adalah 10 kueri uji dokumen SMS yang berasal penulis (Lampiran 1). <? xmlversion='1.0 'encoding='utf-8' standalone='yes'?> <?xml-stylesheet type="text/xsl" href="sms.xsl"?> <SMSes count="1028"> <SMS protocol="0" address=" " date=" " type="1" subject="null" body="ki, pinjemin kalkulator dong, gw lupa ih" toa="null" sc_toa="null" service_center=" " read="1" status="-1" locked="0" date_sent="null" readable_date="oct 17, :04:18 AM" contact_name="laras_ilkom" /><SMSes> Gambar 2 Format dokumen uji SMS (.xml). Pemrosesan dokumen Pemrosesan dokumen dilakukan melalui beberapa tahapan, yaitu pembersihan data dan proses N-gram. Tahap normalisasi dilakukan dengan pembacaan karakter per karakter. Tujuannya untuk membedakan karakterkarakter yang bersifat separator. Separator yang dihilangkan yaitu: karakter pemisah indeks istilah (whitespace), karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representasif dalam mencirikan suatu dokumen. Dalam hal ini pembuangan spasi, karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representatif bertujuan untuk menaikkan nilai ukuran kesamaan. Karena jika karakter tersebut tidak dihilangkan maka akan menambah panjang string dari proses N- gram yang menyebabkan turunnya nilai ukuran kesamaan yang berdampak juga pada turunnya kinerja sistem. Karena semakin panjang string yang dihasilkan dari proses N- gram, nilai dari ukuran kesamaan antara kueri dan dokumen SMS juga semakin kecil. Hal ini disebakkan oleh rumus ukuran kesamaan dice coefficient yang membagi banyaknya karakter yang sama dari dua string N-gram dengan penjumlahan dari panjang dua string tersebut. Setelah dilakukan pembersihan data tahap selanjutnya adalah proses N-gram. Untuk semua SMS yang telah telah melewati proses pembersihan data akan dilakuakan proses N- gram yang pada penelitian kali ini menggunakan model bigram dan trigram.
12 4 Hasil dari proses N-gram tersebut menjadi kumpulan array SMS dari setiap dokumen SMS. Pemrosesan Kueri Pemrosesan pada tahap ini sama halnya dengan pemrosesan dokumen SMS, yaitu kueri dilakukan normalisasi, pembuangan tanda baca, dan spasi. Kueri yang dimasukkan akan dilakukan proses dengan metode N-gram yang akan menghasilkan array kueri yang dapat digunakan dalam proses perhitungan ukuran kesamaan. Ukuran Kesamaan Hasil proses N-gram dokumen digunakan untuk menghitung kemiripan kueri dengan dokumen. Kemiripan yang digunakan untuk menghitung bobot antara dokumen dan kueri adalah dice coefficient. Hasil dari similarity akan diurutkan berdasarkan dokumen yang memunyai kemiripan terbesar sampai terkecil. Pengujian Kinerja Sistem Proses evaluasi dalam penelitian ini dilakukan pada 661 koleksi dokumen SMS. Proses evaluasi pada koleksi dokumen SMS menggunakan 10 kueri uji yang berasal dari penulis. Pencarian dengan kueri uji ini dilakukan dengan melakukan pengukuran recallprecision dari sistem. Recall adalah rasio dokumen relevan yang ditemukembalikan dan precision adalah dokumen relevan yang ditemukembalikan. Perhitungan recall dan precision menggunakan persamaan (3). Hasil dari evaluasi recall precision masing-masing kueri diinterpolasi maksimum untuk mencari nilai average precision (AVP) dan digambarkan dalam bentuk grafik serta tabel. Proses perhitungan recall dan precision pada penelitian ini menggunakan aplikasi - trec_eval. Trec_eval adalah aplikasi standar yang digunakan oleh Text Retrieval Conference (TREC) untuk menguji kinerja suatu sisem temukembali informasi (Manning et al. 2008). Aplikasi trec_eval sendiri hanya dapat dijalankan pada sistem operasi Linux dengan menggunakan perintah di command line. Untuk menggunakannya, perlu disediakan daftar kueri serta dokumen yang seharusnya relevan dan daftar hasil cari dari sistem. Contoh daftar hasil pencarian dari sistem dapat dilihat pada Tabel 2. Pada Tabel 3 dapat dilihat hasil uji kinerja sistem temu kembali informasi pada model trigram dengan nilai threshold 0.1 dan hasil uji lainnya dapat dilihat pada Lampiran 3, 4, 5, 6, dan 7. Pada program trec_eval perhitungan nilai interpolasi menggunakan rumus interpolasi maksimum. Hasil keluaran program trec_eval nilai-nilai dari interpolasi, yaitu: 1 Num_q, menunjukkan jumlah kueri yang di uji pada program trec_eval. 2 Num_ret, menunjukkan jumlah dokumen yang berhasil di-retrieve oleh program trec_eval. 3 Num_rel, menunjukkan jumlah kueri yang relevance. 4 Num_rel_ret, menunjukan banyak dokumen relevance yang berhasil diretrieve. 5 Map, menunjukkan nilai dari Mean Average Precision dari sistem. 6 Gm_ap, menunjukkan nilai dari Average_Precision. 7 R-prec, menunjukkan nilai dari R- precision. 8 Bpref, menunjukkan nilai dari Binary Preferance. 9 Recip_rank, menunjukkan nilai Recipricial Rank pada dokumen yang relevance. 10 Ircl_prn, menunjukkan nilai interpolasi dari 11 standar nilai recall dari sistem yang diuji. Nilai-nilai ircl_prn tersebut adalah nilai yang digunakan untuk membuat kurva recal precision untuk membandingkan antara model bigram dengan model trigram. Pada tahap evaluasi penelitian ini, dilakukan beberapa perbandingan hasil temu kembali pada kueri uji, yaitu perbandingan proses N-gram antara model bigram dengan model trigram dan menggunakan tiga nilai threshold yaitu 0.1, 0.05, dan 0.0. Pada penelitian ini, dapat dikatakan hasil proses model trigram lebih tinggi dari model bigram. Perbandingan nilai AVP dari proses bigram dengan trigram dapat dilihat dari grafik pada Gambar 3, 4, dan 5
13 Precision 5 Tabel 2 Contoh daftar hasil pencarian untuk kueri Q1 Qid Docno Similarity Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Pada Gambar 3 dapat dilihat metode trigram lebih baik dari bigram pada nilai threshold 0.1. metode trigram dapat meningkatkan nilai precision pada titik recall kemudian jatuh pada titik recall selanjutnya. Hal tersebut tidak terjadi pada metode bigram yang hanya mampu meningkatkan nilai precision pada titik recall yang kemudiam jatuh pada titik recall selanjutnya. Pada Gambar 4, dengan nilai threshold 0.05, kedua metode menghasilkan grafik yang lebih baik dari grafik sebelumya. Penurunan nilai precision kedua metode tersebut tidak setajam pada grafik dengan threshold 0.1 walaupun hanya dapat meningkatkan nilai precision pada titik recall rendah. Tabel 3 Contoh hasil keluaran sistem trec_eval trigram 0.1 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi Pada Gambar 5 grafik dengan nilai threshold 0.0 menghasilkan hasil lebih baik untuk metode trigram bila dibandingkan dengan dua grafik recall-precision sebelumnya. Pada metode trigram dapat dilihat bahwa dengan nilai threshold 0.0 dapat meningkatkan nilai precision yang stabil sampai titik recall tertinggi. Meskipun terdapat penurunan, penurunan tersebut tidak terlalu signifikan. Pada metode bigram menghasilkan nilai yang sedikit menurun. Hal tersebut disebabkan oleh penurunan nilai precision pada titik recall 0.8 bila dibandingkan dengan grafik pada Gambar BIGRAM TRIGRAM Recall Gambar 3 Grafik recall precision bigram dan trigram dengan threshold 0.1.
14 Precision Precision BIGRAM TRIGRAM Recall Gambar 4 Grafik recall precision bigram dan trigram dengan threshold BIGRAM TRIGRAM Recall Gambar 5 Grafik recall precision bigram dan trigram dengan threshold 0.0. Tabel 4 Perbandingan nilai AVP sepuluh kueri pada sistem Kueri Bigram 0.1 Trigram 0.1 Bigram 0.05 Trigram 0.05 Bigram 0.0 Trigram 0.0 Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Average precision (AVP)
15 7 Berdasarkan Tabel 4 model trigram memiliki hasil pencarian lebih baik dari model bigram pada setiap nilai threshold. Namun terdapat kueri dari model bigram yang memiliki nilai AVP lebih baik dari model trigram pada nilai threshold 0.1. Kueri tersebut adalah kripto. Hal tersebut disebabkan oleh jumlah elemen dari array yang dibentuk oleh model bigram dan trigram pada dokumen SMS dari kueri tersebut sedikit. Jumlah elemen array yang sedikit berakibat pada pula hasil perhitungan ukuran kesamaan dice coefficient yang melihat jumlah elemen array yang sama antara dokumen SMS dan kueri. Selain itu panjang array SMS dan kueri juga sangat mempengaruhi karena jumlah elemen array yang sama antar SMS dan kueri akan dibagi dengan panjang array SMS dan kueri. Semakin sedikit jumlah elemen array yang sama dan panjang array SMS dan kueri semakin panjang maka ukuran kesamaan yang dihasilkan semakin kecil. Penggunaan nilai threshold yang berbeda juga berpengaruh terhadap kinerja sistem. Hal tersebut disebabkan karena nilai threshold yang semakin kecil akan menampilkan hasil pencarian yang lebih banyak dimana terdapat beberapa dokumen yang relevan yang memiliki nilai kecil mendekati 0.0 yang disebabkan oleh panjang dokumen SMS. Hal ini menyebabkan kinerja sistem menurun pada nilai threshold yang semakin besar. Pengembangan Sistem Pada tahap pengembangan sistem ini, seluruh tahapan dari mulai normalisasi, proses N-gram, perhitungan dice coefficient, dan pemeringkatan dokumen diadopsi dan diimplementasikan menggunakan bahasa pemrograman Android. Dalam implementasinya, sistem ini tidak hanya mampu mencari SMS sesuai dengan kueri yang diberikan, namun juga terdapat beberapa fitur tambahan, yaitu: 1 Read, pengguna dapat melihat isi dari SMS dari hasil pencarian secara keseluruhan dengan menekan layar pada device yang terkait dengan SMS yang ingin dilihat. Sistem akan mengeluarkan tampilan dialog box yang berisi isi SMS tersebut yang terlihat pada Lampiran Reply & forward SMS, setelah melihat isi SMS secara keseluruhan, pengguna juga dapat membalas atau meneruskan SMS tersebut. Dengan menekan tombol reply atau forwad yang ada pada dialog box seperti pada Lampiran 12 dan Lampiran Send SMS, pengguna dapat mengirim SMS setelah membalas atau meneruskan isi SMS dengan menekan tombol send pada dialog box. Simpulan SIMPULAN DAN SARAN Berdasarkan penelitian yang telah dilakukan, dapat disimpulkan bahwa sistem mesin pencari SMS berhasil menerapkan metode N-gram yang menggunakan model bigram dan trigram. Akurasi hasil model trigram lebih besar dibanding model bigram untuk 661 dokumen SMS yang terbagi menjadi 364 dokumen SMS inbox dan 297 dokumen SMS sent item, dengan model bigram 49.6% dan model trigram 80.8%. Saran Pada peneletian ini belum menggunakan indexing pada kueri dan dokumen SMS dan hanya menggunakan metode N-gram dan ukuran kesamaan dice coefficient, maka pada penelitian selanjutnya disarankan : 1 Menggunakan metode ukuran kesamaan yang lain seperti soundex atau Dameraulevenstein-Metric serta ukuran kesamaan jaccard coefficient untuk melihat berbagai perbandingan dari metode ukuran kesamaan pada sistem pencarian SMS. 2 Diharapkan adanya proses indexing dan penggunaan stopword serta pemakaian karakter spasi, koma, titik, dan karakter lainnya yang pada penelitian ini dianggap kurang representatif untuk melihat perbandingan kinerja sistem dari penelitian sebelumnya. DAFTAR PUSTAKA Angell RC, Freund GE, Willett P Automatic spelling correction using a trigram similarity Measure. Information Processing & Management.19(4): Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. New York: Addison Wesley. Damerau FJ A Technique for Computer Detection and Correction of
16 8 Spelling Errors. Communications of the ACM. 7: Majumder P, Mitra M, Chaudhuri BB N-gram: A Language Indpendent Approach to IR and NLP. International Conference on Universal Knowledge and Language (ICUKL). 1:1-7. Manning CD, Raghavan P, Schutze H Introduction to Information Retrieval. Cambridge: Cambridge University Press Peterson JL Computer program for detecting and correcting spelling erorrs. Communications of the ACM. 23: Rahmawan F Implementasi Question Answering System pada dokumen bahasa Indonesia menggunakan metode N-gram. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Salton G Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. Boston: Addison-Wesley. Wahyudin A Algoritme trigram untuk mengoreksi ejaan. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.
17 LAMPIRAN 9
18 10 Lampiran 1 Daftar kueri uji dan dokumen yang relevan Kueri Uji Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Dokumen Relevan dok52, dok55, dok81, dok90, dok96, dok172, dok208, dok239,dok243,dok247, dok291, dok292, dok297, dok303, dok325, dok347, dok384, dok387, dok388,dok391, dok399, dok404,dok408, dok437, dok463, dok467, dok504,dok505, dok520, dok549, dok 659 dok52,dok55,dok69,dok70,dok238,dok242,dok243,dok244,dok292,dok336,dok34 7,dok384,dok399,dok400,dok482,dok517,dok518,dok520,dok528 dok102,dok123,dok129,dok142,dok225,dok325,dok370,dok391,dok482,dok494 dok3,dok4,dok7,dok206,dok208,dok386,dok481,dok482,dok493,dok504 dok53,dok54,dok93,dok94,dok297,dok304,dok348,dok357,dok358,dok378,dok37 9,dok381,dok467,dok547,dok549 dok3,dok4,dok172,dok289,dok298,dok299,dok326,dok482,dok496,dok511,dok51 2,dok567,dok578,dok608,dok620,dok626 dok36,dok208,dok228,dok259,dok265,dok267,dok280 dok74,dok82,dok83,dok131,dok137,dok176,dok183,dok185,dok286,dok288,dok2 90,dok472,dok486,dok538,dok555 dok19,dok20,dok27,dok30,dok66,dok68,dok87,dok88,dok114,dok187,dok236,dok 237,dok257,dok279,dok339,dok344,dok353,dok374,dok389,dok410,dok414,dok4 16,dok447,dok450,dok462,dok506,dok554,dok576,dok605,dok606,dok609,dok62 1,dok623,dok639,dok640 dok333,dok334,dok395,dok479,dok513,dok531,dok543,dok564,dok565,dok571,d ok580,dok589,dok590,dok591,dok596,dok630,dok642
19 11 Lampiran 2 Contoh dokumen SMS pengujian <SMSes count="661"> <SMS protocol="0" address=" " date=" " type="2" subject="null" body="iyah dah prnah baca gw,,bisa klo ada ios nya mah hahaha" toa="null" sc_toa="null" service_center="null" read="1" status="0" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="1" subject="null" body="kagak bisa ngoding di ipad kiiiii huwaaaa" toa="null" sc_toa="null" service_center=" " read="1" status="-1" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="2" subject="null" body="gadein ipad lw buat beli macbook lalalalala" toa="null" sc_toa="null" service_center="null" read="1" status="0" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="1" subject="null" body="aaaaaaak" toa="null" sc_toa="null" service_center=" " read="1" status="-1" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="2" subject="null" body="lw SMS apa mank ras?" toa="null" sc_toa="null" service_center="null" read="1" status="0" locked="0" date_sent="null" /> </SMSes>
20 12 Lampiran 3 Hasil keluaran sistem trec_eval bigram 0.1 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi
21 13 Lampiran 4 Hasil keluaran sistem trec_eval trigram 0.05 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi
22 14 Lampiran 5 Hasil keluaran sistem trec_eval bigram 0.05 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi
23 15 Lampiran 6 Hasil keluaran sistem trec_eval trigram 0.0 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi
24 16 Lampiran 7 Hasil keluaran sistem trec_eval bigram 0.0 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi
25 17 Lampiran 8 Daftar AVP pada pengujian model bigram dengan threshold 0.1 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.471
26 18 Lampiran 9 Daftar AVP pada pengujian model trigram dengan threshold 0.1 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.581
27 19 Lampiran 10 Daftar AVP pada pengujian model bigram dengan threshold 0.05 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.496
28 20 Lampiran 11 Daftar AVP pada pengujian model trigram dengan threshold 0.05 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.714
29 21 Lampiran 12 Daftar AVP pada pengujian model bigram dengan threshold 0.0 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.496
30 22 Lampiran 13 Daftar AVP pada pengujian model trigram dengan threshold 0.0 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.714
31 23 Lampiran 14 Antarmuka halaman utama sistem pencarian SMS Lampiran 16 Antarmuka read SMS Lampiran 15 Antarmuka hasil pencarian Lampiran 17 Antarmuka reply SMS
32 Lampiran 18 Antarmuka forward SMS 24
HASIL DAN PEMBAHASAN. sim(, )=
4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j
3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan
Lebih terperincibeberapa tag-tag lain yang lebih spesifik di dalamnya.
metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista
Lebih terperinciRata-rata token unik tiap dokumen
Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk
Lebih terperinciHASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.
beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium
Lebih terperinciTUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA
TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013
Lebih terperinciHASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:
2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.
Lebih terperinciCROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU
CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciPenerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia
Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas
Lebih terperinciKATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA
KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciPEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI
PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012
Lebih terperinciTEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH
TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING
Lebih terperinciKONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :
Lebih terperinciKOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN
KOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN Utis Sutisna 1), Julio Adisantoso 2) 1,2 Departemen Ilmu Komputer, Institut Pertanian Bogor Kampus Darmaga, Wing 20 Level
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciQUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK
QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut
Lebih terperinciTabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita
6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio
Lebih terperinciAPLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL
APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan
Lebih terperinciHASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen
6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat
Lebih terperinciEKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI
EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciLAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer
LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciPERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR
PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN
Lebih terperinciMETODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA
METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciPENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB
PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA
Lebih terperinciXML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI
XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN
Lebih terperinciPENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI
PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciEkspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
Lebih terperinciBernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract
IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very
Lebih terperinciMEN BAHASA INDONESIA MENGGUNAKAN SE EMANTIC SMOOTHING
KLASIFIKASII DOKUMEN BAHASA INDONESIA MENGGUNAKAN SEMANTIC SMOOTHING DENGAN EKSTRAKSI CIRI CHI-SQUARE NOFEL SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMA ATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIANN
Lebih terperinciKLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR
KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL
Lebih terperinciANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM
ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming
Lebih terperinciUNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka
Lebih terperinciKINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO
KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 KINERJA
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi Proses Temu-Kembali KULIAH #5 Evaluasi IR query : sby query: flu burung Evaluasi IR Indikator yang dapat diukur: Seberapa cepat dia meng-indeks Banyaknya dokumen/jam Terkait
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciBAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama
Lebih terperinciPenerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi
Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:
Lebih terperinciEVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA
EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id
Lebih terperinciTEMU KEMBALI INFORMASI
Pendahuluan JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 PENDAHULUAN Pendahuluan Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi Kode Mata Kuliah : KOM431 Koordinator : Julio
Lebih terperinciEKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA
EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT
Lebih terperinciTEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI
TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI
Lebih terperinciAPLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL
APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,
Lebih terperinciABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha
ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan
Lebih terperinciSTUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH
STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciPENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI
PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciPENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI
PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI
Lebih terperinciHASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.
5 Mulai HASIL DAN PEMBAHASAN Kromosom P = rand [0,1] Ya P < Pm R = random Gen(r) dimutasi Selesai Tidak Gambar 7 Diagram alur proses mutasi. Hasil populasi baru yang terbentuk akan dievaluasi kembali dan
Lebih terperinciSISTEM TEMU KEMBALI NAMA ILMIAH DENGAN MENGGUNAKAN ALGORITME FONETIK WAHYU DIAS HARSOWIYONO
SISTEM TEMU KEMBALI NAMA ILMIAH DENGAN MENGGUNAKAN ALGORITME FONETIK WAHYU DIAS HARSOWIYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN
Lebih terperinciRELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR
RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Julio Adisantoso, Ahmad Ridha, Andika Wahyu Agusetyawan Staf Departemen Ilmu Komputer, Fakultas Matematika
Lebih terperinciSearch Engines. Information Retrieval in Practice
Search Engines Information Retrieval in Practice All slides Addison Wesley, 2008 Search Engine Architecture Arsitektur dari mesin pencari ditentukan oleh 2 persyaratan efektivitas (kualitas hasil) efisiensi
Lebih terperinciMAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA
MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email
Lebih terperinci1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 4 TOLERANCE RETRIEVAL Tugas Extended Boolean Pelajari Extended Boolean Mengapa dikembangkan model ini? Bagaimana prinsip dasar model ini? Bagaimana
Lebih terperinciTUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL
TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL MICHAEL SENNA SAPUTRA NIM. 1008605062 PROGRAM STUDI TEKNIK
Lebih terperinciCode shift Asumsi-asumsi Pengaburan Kode Lingkungan Pengembangan HASIL DAN PEMBAHASAN Karakteristik Dokumen Perlakuan ( Treatment
6 dengan FF. Jenis karakter substitusi dapat dilihat pada Tabel 6. Code shift Karakter yang dibuang dari lima bit kode dalam penelitian ini adalah karakter ke dua. Hal ini dengan pertimbangan pengucapan
Lebih terperinciSistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN
Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza
Lebih terperinciMETODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI
METODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciSISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL
SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu
Lebih terperinci4 HASIL DAN PEMBAHASAN
4 HASIL DAN PEMBAHASAN Penelitian ini dibuat menggunakan bahasa pemrograman PHP untuk tahapan praproses data, implementasi algoritme DIG dan pembangkitan metafile penyusun struktur digraf. Representasi
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciPERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA
PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciRDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN
RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN
Lebih terperinciHASIL DAN PEMBAHASAN. Praproses
5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk
Lebih terperinciPELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI
PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian menjelaskan bagaimana langkah-langkah atau tahapan-tahapan yang akan dilakukan dalam penelitian agar rumusan masalah penelitian dapat terselesaikan.
Lebih terperinciCLUSTERING DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN FUZZY C-MEANS ISNA MARIAM
CLUSTERING DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN FUZZY C-MEANS ISNA MARIAM DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 CLUSTERING DOKUMEN
Lebih terperinciBAB V IMPLEMENTASI. Bab ini membahas mengenai implementasi dan hasil dari pengujian sistem.
BAB V IMPLEMENTASI Bab ini membahas mengenai implementasi dan hasil dari pengujian sistem. 5. Lingkungan Implementasi Implementasi merupakan tahapan dimana hasil perancangan yang telah dibangun mulai diterapkan
Lebih terperinciPSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA
PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009
Lebih terperinciIdentifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN
5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret
Lebih terperinciBAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi
67 BAB 4 HASIL DAN BAHASAN 4.1 Hasil Penelitian dan Evaluasi 4.1.1 Hasil Penelitian Berikut disajikan beberapa data hasil query dari penelitian yang dilakukan dengan melampirkan tabel data precision dan
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciIMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas
Lebih terperinciPERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH
PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015
Lebih terperinci1. PENDAHULUAN 1.1 Latar belakang Masalah
1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.
Lebih terperinciQUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL
QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen
Lebih terperinciFM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015
SILABUS MATAKULIAH Revisi : - Tanggal Berlaku : Januari 2015 A. Identitas 1. Nama Matakuliah : A11. 54823 / 2. Program Studi : Teknik Informatika-S1 3. Fakultas : Ilmu Komputer 4. Bobot sks : 3 SKS 5.
Lebih terperinciBAB 3 ANALISIS DAN PERANCANGAN SISTEM
BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Sistem Analisis sistem ialah proses identifikasi mengenai hal-hal yang dibutuhkan dan harus ada pada sistem, agar sistem tersebut dapat berjalan sesuai
Lebih terperinciPENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciBAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang
58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan
Lebih terperinciJULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #1 Kontrak Perkuliahan Pendahuluan Matakuliah Nama Matakuliah : Temu Kembali Informasi Kode Matakuliah : KOM431 Beban Kredit : 3(3-0) Semester : Gasal, 2009/2010 Koordinator
Lebih terperinciRELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE
RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin
Lebih terperinciRANCANG BANGUN APLIKASI PENGAMANAN SMS DENGAN METODE ALGORITMA VIGENERE CIPHER DAN TRANSPOSISI BERBASIS ANDROID
RANCANG BANGUN APLIKASI PENGAMANAN SMS DENGAN METODE ALGORITMA VIGENERE CIPHER DAN TRANSPOSISI BERBASIS ANDROID YAYAT SUYATNA 41512110051 PROGRAM STUDI INFORMATIKA FAKULTAS ILMU KOMPUTER UNIVERSITAS MERCU
Lebih terperinciEVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT
J. Sains MIPA, Desember 2010, Vol. 16, No. 3, Hal.: 155-162 ISSN 1978-1873 EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT Didik Kurniawan Jurusan Matematika
Lebih terperinciBAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey
Lebih terperinciInera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom
IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL
Lebih terperinci4 HASIL DAN PEMBAHASAN
24 4 HASIL DAN PEMBAHASAN 4.1 Data Korpus Data korpus berisi berita-berita nasional berbahasa Indonesia dari tanggal 11 Maret 2002 sampai 11 April 2002. Berita tersebut berasal dari berita online harian
Lebih terperinciEVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE
EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,
Lebih terperinci