MESIN PENCARI SMS BERBASIS ANDROID DENGAN MENGGUNAKAN METODE N-GRAM RIZKY UTAMA PRAMUDIA

Ukuran: px
Mulai penontonan dengan halaman:

Download "MESIN PENCARI SMS BERBASIS ANDROID DENGAN MENGGUNAKAN METODE N-GRAM RIZKY UTAMA PRAMUDIA"

Transkripsi

1 MESIN PENCARI SMS BERBASIS ANDROID DENGAN MENGGUNAKAN METODE N-GRAM RIZKY UTAMA PRAMUDIA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2 MESIN PENCARI SMS BERBASIS ANDROID DENGAN MENGGUNAKAN METODE N-GRAM RIZKY UTAMA PRAMUDIA Skripsi Sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

3 ABSTRACT RIZKY UTAMA PRAMUDIA. Search Engine SMS based on Android using N-gram Method. Supervised by JULIO ADISANTOSO. Search engines Short-Messaging Service (SMS) on mobile devices are still using the exact match method. This method can only find SMS containing words, which one exact matches of the query. Therefore, a method to correct the spelling of the text is needed. Trigram similarity measure method is one of spelling correction methods developed which gives a relatively good performance. Therefore, this study applied the method of N-gram with bigram models and trigram models for SMS in Indonesian. The result of this research is a search engine with an average precision (AVP) 49.6% for bigram models and 80.8% for trigram models. Keyword : SMS, N-gram, bigram, trigram, spelling correction, search engine

4 Judul Skripsi Nama NRP : Mesin Pencari SMS berbasis Android dengan Menggunakan Metode N-gram : Rizky Utama Pramudia : G Menyetujui: Pembimbing Ir. Julio Adisantoso, M.Kom NIP Mengetahui: Ketua Departemen Ilmu Komputer Dr. Ir. Agus Buono, M.Si, M.Kom NIP Tanggal Lulus :

5 KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Allah subhanahu wata ala yang telah memberikan rahmat dan karunia-nya sehingga penulis dapat menyelesaikan tugas akhir dengan judul Mesin Pencari SMS berbasis Android dengan Menggunakan Metode N-gram. Penulis juga menyampaikan terima kasih kepada seluruh pihak yang telah berperan dalam tugas akhir ini, yaitu: Ayahanda H.Safrudin, Ibunda Fitriana Wulandari, serta keluarga besar penulis yang selalu memberikan doa, nasihat, semangat, dan kasih sayang yang luar biasa kepada penulis. Bapak Ir. Julio Adisantoso, M.Kom selaku dosen pembimbing tugas akhir yang memberikan bimbingan, ide, dukungan, semangat serta kesabaran dalam pengerjaan tugas akhir ini. Bapak Ahmad Ridha, S.Kom, MS dan Bapak Sony H. Wijaya, S.Kom, M.Kom selaku dosen penguji yang telah memberi masukan dan saran pada tugas akhir penulis. Rekan satu bimbingan Susi Handayani, Fania R K, Meri Marlina, Meriska Defriani, Anita, Hafidzhia Dzikrul A, Alfa Nugraha, Putri Dewi Purnama Sari, dan Nofel Saputra. Terima kasih atas bantuan, kebersamaan dan semangatnya dalam menyelesaikan tugas akhir ini. Tri Lugina Kusumaningtias, Anjar Hafidhun, Satria Wardana, Rian Senja dan Aida Ratna Juwita. Terima kasih atas semangat dan dukungannya yang telah diberikan kepada penulis. Semoga kita bisa berjumpa kembali kelak sebagai orang-orang sukses. Seluruh keluarga besar PONDOK AA (Uda Roni, Bang Aad, Bang Aan, Bang Bono, Wido, Rilan, dan rekan-rekan lain) yang selalu memberikan semangat kepada penulis selama melaksanakan tugas akhir ini. Seluruh rekan-rekan Ilmu Komputer angkatan 45 atas segala kebersamaan, bantuan, canda tawa, dan kenangan indah serta semangat bagi penulis slama masa studi. Semoga kita semua bisa berjumpa kembali kelak sebagai orang-orang sukses. Penulis berharap tugas akhir ini dapat memberikan manfaat, khususnya bagi bidang temu kembali informasi. Penulis menyadari bahwa dalam penulisan tugas akhir ini masih terdapat kekurangan dalam berbagai hal. Penulis berharap adanya masukan yang bersifat membangun dari pembaca demi kesempurnaan tugas akhir ini. Bogor, Januari 2013 Rizky Utama Pramudia

6 RIWAYAT HIDUP Rizky Utama Pramudia dilahirkan di Jakarta pada tanggal 19 September 1990 dari pasangan Bapak H Safrudin dan Ibu Fitriana Wulandari. Pada tahun 2008, penulis lulus dari SMA Negeri 106 Jakarta dan menjadi mahasiswa di Departemen Ilmu Komputer Institut Pertanian Bogor (IPB) melalui Undangan Seleksi Masuk IPB (USMI). Selama menjadi mahasiswa, penulis menjadi asisten praktikum mata kuliah Komputer Grafik pada tahun Pada bulan Juli hingga Agustus 2011, penulis melaksanakan Praktik Kerja Lapangan di Bank Indonesia, Jakarta.

7 DAFTAR ISI Halaman DAFTAR TABEL... vi DAFTAR GAMBAR... vi DAFTAR LAMPIRAN... vi PENDAHULUAN... 1 Latar Belakang... 1 Tujuan... 1 Ruang Lingkup... 1 Praproses Dokumen... 2 Pemrosesan Kueri... 2 Pemeringkatan Dokumen... 2 Evaluasi Sistem... 2 Lingkungan Implementasi... 3 HASIL DAN PEMBAHASAN... 3 Dokumen Pengujian... 3 Pemrosesan dokumen... 3 Pemrosesan Kueri... 4 Ukuran Kesamaan... 4 Pengujian Kinerja Sistem... 4 Pengembangan Sistem... 7 SIMPULAN DAN SARAN... 7 Simpulan... 7 Saran... 7 DAFTAR PUSTAKA... 7 LAMPIRAN... 9 v

8 DAFTAR TABEL Halaman 1 Relevant dan retrieved dokumen Contoh daftar hasil pencarian untuk kueri Q Contoh hasil keluaran sistem trec_eval trigram Perbandingan nilai AVP sepuluh kueri pada sistem... 6 DAFTAR GAMBAR Halaman 1 Tahapan pembangunan sistem Format dokumen uji SMS (.xml) Grafik recall precision bigram dan trigram dengan threshold Grafik recall precision bigram dan trigram dengan threshold Grafik recall precision bigram dan trigram dengan threshold DAFTAR LAMPIRAN Halaman 1 Daftar kueri uji dan dokumen yang relevan Contoh dokumen SMS pengujian Hasil keluaran sistem trec_eval bigram Hasil keluaran sistem trec_eval trigram Hasil keluaran sistem trec_eval bigram Hasil keluaran sistem trec_eval trigram Hasil keluaran sistem trec_eval bigram Daftar AVP pada pengujian model bigram dengan threshold Daftar AVP pada pengujian model trigram dengan threshold Daftar AVP pada pengujian model bigram dengan threshold Daftar AVP pada pengujian model trigram dengan threshold Daftar AVP pada pengujian model bigram dengan threshold Daftar AVP pada pengujian model trigram dengan threshold Antarmuka halaman utama sistem pencarian SMS Antarmuka hasil pencarian Antarmuka read SMS Antarmuka reply SMS Antarmuka forward SMS vi

9 1 Latar Belakang PENDAHULUAN Sistem temu kembali informasi sangat erat kaitannya dengan sistem pencarian (search engine). Sistem pencarian membutuhkan masukan berupa kueri untuk memperoleh suatu informasi yang diinginkan. Kadangkala, informasi yang ditemukembalikan kurang relevan dengan kebutuhan pengguna (Rahmawan 2011). Saat ini pengembangan sistem pencarian short message service (SMS) menggunakan perangkat mobile belum banyak dikembangkan. Sistem pencarian SMS yang terdapat pada perangkat mobile saat ini masih menggunakan metode exact match. Sistem pencarian SMS menggunakan metode exact match telah diterapkan pada perangkat mobile berbasis Android. Android adalah sistem operasi untuk perangkat mobile yang berbasis Linux. Android menyediakan platform terbuka bagi para pengembang untuk menciptakan aplikasi mereka sendiri untuk digunakan oleh bermacam perangkat mobile yang berbasis Android. Sistem pencarian SMS pada Android hanya bisa mencari SMS dengan kueri yang tepat sama dengan kata yang ada pada SMS. Sistem ini tidak bisa mengatasi bila pengguna salah ejaan kata pada saat memasukkan kueri. Berbagai metode telah dikembangkan untuk program pengoreksi ejaan berbahasa Inggris dan hasilnya cukup memuaskan. Untuk Bahasa Indonesia, metode tersebut masih merupakan bahan kajian yang harus diteliti dan dikembangkan lebih lanjut terutama pada dokumen berbentuk SMS (Wahyudin 1999). Menurut Damerau (1964) dalam Peterson (1980) 80% kesalahan ejaan merupakan variasi dari empat hal, yaitu penggantian satu huruf, penyisipan satu huruf, penghilangan satu huruf, dan transposisi dua huruf berdekatan. Algoritme ukuran kesamaan trigram adalah salah satu metode pengoreksi ejaan yang dikembangkan oleh Angell et al. (1983) di Inggris yang memberikan kinerja cukup baik, yaitu antara 75%-90% koreksi kesalahan ejaan dengan kamus sebanyak kata. Algoritme ini digunakan untuk mengukur kesamaan dua string yang tidak tepat sama. Pada kenyataannya, SMS sering ditulis dengan tidak benar sehingga sulit dicari dengan metode kesamaan string tepat sama. Oleh karena itu, pada penelitian ini akan dikembangkan sistem pencarian SMS berbasis Android menggunakan metode N-gram sehingga sistem diharapkan dapat mencari SMS menggunakan kueri yang tidak tepat sama. Tujuan Tujuan dari penelitian ini adalah: 1 Mengimplementasikan sistem mesin pencari SMS berbasis Android. 2 Menganalisis kinerja sistem yang akan dibangun dengan mengembalikan dokumen SMS yang relevan dari banyak dokumen SMS yang tidak hanya menggunakan bahasa baku. Ruang Lingkup Ruang lingkup dalam penelitian ini adalah: 1 Dokumen yang digunakan dalam penelitian adalah dokumen SMS berbahasa Indonesia. 2 Dokumen yang relevan dengan kueri uji, ditentukan berdasarkan penulis. METODE Penelitian ini dilaksanakan dalam beberapa tahapan, yaitu: pengumpulan koleksi dokumen SMS, perhitungan metode N-gram, perhitungan ukuran kesamaan antara dokumen dan kueri, pemeringkatan dokumen, dan perhitungan evaluasi hasil temu-kembali sistem. Tahapan-tahapan tersebut dapat dilihat pada Gambar 1. Gambar 1 Tahapan pembangunan sistem.

10 2 Koleksi Dokumen Dokumen yang digunakan sebagai dokumen uji adalah dokumen SMS yang berasal dari penulis. Dokumen berjumlah 661 SMS inbox dan sent item dan kueri uji berjumlah 10 kueri dengan daftar dokumen yang relevan (Lampiran 1). Praproses Dokumen Tahapan penelitian dimulai dengan melakukan pembersihan data terhadap dokumen SMS di dalam sebuah kumpulan SMS. Terdapat dua tahapan praproses yang digunakan pada penelitian. Tahapan pertama adalah pembersihan data. Pembersihan data adalah suatu proses pembuangan separator yang dianggap kurang representatif dalam proses selanjutnya. Hal ini dilakukan dengan cara menghapus semua karakter tanda baca yang terdapat pada dokumen SMS dan mengubah semua huruf menjadi lowercase. Penelitian ini tidak menggunakan pembobotan melainkan dokumen SMS yang sudah dilakukan pembersihan data diproses menggunakan metode N-gram. Tahapan yang kedua yaitu proses N-gram. N-gram (Markov Chain) adalah rangkaian karakter (alfabet) atau kata yang diekstrak dari sebuah teks. N-gram dapat dibedakan menjadi dua kategori, yaitu basis karakter dan basis kata. Sebuah karakter N-gram merupakan rangkaian dari n karakter yang berurutan. Tujuan utama pendekatan ini adalah menentukan kata-kata yang mirip dengan rangkaian N-gram secara umum (Majumder et al 2002). Pada umumnya N-gram mengekstrak dokumen atau kata-kata menjadi dua atau tiga rangkaian yang terurut (sering disebut bigrams dan trigrams). Sebagai contoh susunan bigrams dari kata computer adalah CO, OM, MP, PU, UT, TE, dan ER. Pemrosesan Kueri Pemrosesan pada tahap ini sama halnya dengan praproses dokumen SMS, yaitu dilakukan tokenisasi, pembuangan tanda baca, dan spasi terhadap kueri. Kueri yang dimasukkan akan dilakukan proses dengan metode N-gram yang kemudian akan diperoleh array kueri yang dapat digunakan dalam proses perhitungan ukuran kesamaan. Pemeringkatan Dokumen Hasil pemrosesan dengan metode N-gram yang diperoleh dari dokumen SMS dan kueri kemudian diperiksa kesamaan dokumennya menggunakan ukuran kesamaan Dice. Nilai pengukuran kesamaan pada sistem akan mengembalikan dokumen relevan menurut sistem. Persamaan (1) menunjukkan proses penghitungan ukuran kesamaan dari N-gram dengan metode dice coefficient dari dua buah kata. 2 x X Y Dice =.. (1) X + Y dengan X adalah string dari N-gram X dan Y adalah string dari N-gram Y. Semakin tinggi nilai kesamaan dice menunjukkan bahwa dokumen tersebut memiliki tingkat kemiripan yang besar dengan kueri yang diberikan. Ukuran lain yang bisa digunakan untuk menghitung ukuran kesamaan adalah jaccard coefficient. Jaccard coefficient dari dua buah kata adalah: Jaccard = X Y... (2) X Y Dalam penelitian ini digunakan ukuran kesamaan dice coefficient untuk mengukur kesamaan dua string hasil N-gram. Evaluasi Sistem Pada proses evaluasi hasil temu-kembali dilakukan menggunakan ukuran recallprecision untuk menentukan tingkat keefektifan proses temu-kembali. Dua ukuran utama untuk keefektifan penemukembalian yang telah digunakan sejak lama adalah recall dan precision (Salton 1989). Recall adalah perbandingan jumlah dokumen relevan yang ditemukembalikan terhadap jumlah dokumen yang relevan, sedangkan precision adalah perbandingan jumlah dokumen relevan yang ditemukembalikan terhadap jumlah dokumen yang ditemukembalikan. Berdasarkan Tabel 1, recall (R) dan precision (P) dapat dinyatakan sebagai persamaan sebagai berikut: P = tp tp+fp dan R = tp tp+fn (3) Average precision (AVP) dihitung pada 11 standard recall levels, yaitu 0%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100% dengan menggunakan interpolasi maksimum (Baeza-Yates & Ribeiro-Neto 1999).

11 3 Tabel 1 Relevant dan retrieved dokumen Retrieved Non retrieved Relevant True positive (tp) False negative (fn) Lingkungan Implementasi Non relevant False positive (fp) True negative (tn) Lingkungan implementasi yang digunakan adalah sebagai berikut: 1 Perangkat lunak: a Sistem operasi Windows 8 Professional sebagai sistem operasi, b Java rule-based Android sebagai bahasa pemrograman c Android SDK Windows, d Eclipse IDE e Trec_eval, dan f Microsoft Office 2007 sebagai aplikasi yang digunakan untuk melakukan perhitungan dalam evaluasi sistem. 2 Perangkat keras: a Processor Intel Core i GHz b RAM 4 GB c Harddisk dengankapasitas 500 GB HASIL DAN PEMBAHASAN Dokumen Pengujian Penelitian ini menggunakan 661 dokumen SMS yang berasal dari SMS penulis yang terbagi menjadi 394 dokumen SMS inbox dan 267 dokumen SMS sent item. Dokumen SMS yang digunakan berformat XML yang diexport dari perangkat mobile. Dokumen tersebut di-import ke dalam emulator Android agar bisa digunakan dalam implementasi sistem dengan menggunakan aplikasi pendukung di Android. Contoh format dokumen uji yang digunakan dapat dilihat pada Gambar 2. Koleksi ini dibuat sesuai struktur tag XML pada masing-masing dokumen. Tag XML yang digunakan dalam koleksi dokumen pertanian, yaitu: <SMSes/></SMSes>, mewakili jumlah dokumen SMS yang berhasil di-export. <SMS></SMS>, mewakili keseluruhan dokumen. Di dalamnya terdapat attribute lain yang mendeskripsikan isi dokumen secara lebih jelas. Jumlah kueri uji yang akan digunakan dalam penelitian ini adalah 10 kueri uji dokumen SMS yang berasal penulis (Lampiran 1). <? xmlversion='1.0 'encoding='utf-8' standalone='yes'?> <?xml-stylesheet type="text/xsl" href="sms.xsl"?> <SMSes count="1028"> <SMS protocol="0" address=" " date=" " type="1" subject="null" body="ki, pinjemin kalkulator dong, gw lupa ih" toa="null" sc_toa="null" service_center=" " read="1" status="-1" locked="0" date_sent="null" readable_date="oct 17, :04:18 AM" contact_name="laras_ilkom" /><SMSes> Gambar 2 Format dokumen uji SMS (.xml). Pemrosesan dokumen Pemrosesan dokumen dilakukan melalui beberapa tahapan, yaitu pembersihan data dan proses N-gram. Tahap normalisasi dilakukan dengan pembacaan karakter per karakter. Tujuannya untuk membedakan karakterkarakter yang bersifat separator. Separator yang dihilangkan yaitu: karakter pemisah indeks istilah (whitespace), karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representasif dalam mencirikan suatu dokumen. Dalam hal ini pembuangan spasi, karakter angka, titik, koma, dan karakter lainnya yang dianggap kurang representatif bertujuan untuk menaikkan nilai ukuran kesamaan. Karena jika karakter tersebut tidak dihilangkan maka akan menambah panjang string dari proses N- gram yang menyebabkan turunnya nilai ukuran kesamaan yang berdampak juga pada turunnya kinerja sistem. Karena semakin panjang string yang dihasilkan dari proses N- gram, nilai dari ukuran kesamaan antara kueri dan dokumen SMS juga semakin kecil. Hal ini disebakkan oleh rumus ukuran kesamaan dice coefficient yang membagi banyaknya karakter yang sama dari dua string N-gram dengan penjumlahan dari panjang dua string tersebut. Setelah dilakukan pembersihan data tahap selanjutnya adalah proses N-gram. Untuk semua SMS yang telah telah melewati proses pembersihan data akan dilakuakan proses N- gram yang pada penelitian kali ini menggunakan model bigram dan trigram.

12 4 Hasil dari proses N-gram tersebut menjadi kumpulan array SMS dari setiap dokumen SMS. Pemrosesan Kueri Pemrosesan pada tahap ini sama halnya dengan pemrosesan dokumen SMS, yaitu kueri dilakukan normalisasi, pembuangan tanda baca, dan spasi. Kueri yang dimasukkan akan dilakukan proses dengan metode N-gram yang akan menghasilkan array kueri yang dapat digunakan dalam proses perhitungan ukuran kesamaan. Ukuran Kesamaan Hasil proses N-gram dokumen digunakan untuk menghitung kemiripan kueri dengan dokumen. Kemiripan yang digunakan untuk menghitung bobot antara dokumen dan kueri adalah dice coefficient. Hasil dari similarity akan diurutkan berdasarkan dokumen yang memunyai kemiripan terbesar sampai terkecil. Pengujian Kinerja Sistem Proses evaluasi dalam penelitian ini dilakukan pada 661 koleksi dokumen SMS. Proses evaluasi pada koleksi dokumen SMS menggunakan 10 kueri uji yang berasal dari penulis. Pencarian dengan kueri uji ini dilakukan dengan melakukan pengukuran recallprecision dari sistem. Recall adalah rasio dokumen relevan yang ditemukembalikan dan precision adalah dokumen relevan yang ditemukembalikan. Perhitungan recall dan precision menggunakan persamaan (3). Hasil dari evaluasi recall precision masing-masing kueri diinterpolasi maksimum untuk mencari nilai average precision (AVP) dan digambarkan dalam bentuk grafik serta tabel. Proses perhitungan recall dan precision pada penelitian ini menggunakan aplikasi - trec_eval. Trec_eval adalah aplikasi standar yang digunakan oleh Text Retrieval Conference (TREC) untuk menguji kinerja suatu sisem temukembali informasi (Manning et al. 2008). Aplikasi trec_eval sendiri hanya dapat dijalankan pada sistem operasi Linux dengan menggunakan perintah di command line. Untuk menggunakannya, perlu disediakan daftar kueri serta dokumen yang seharusnya relevan dan daftar hasil cari dari sistem. Contoh daftar hasil pencarian dari sistem dapat dilihat pada Tabel 2. Pada Tabel 3 dapat dilihat hasil uji kinerja sistem temu kembali informasi pada model trigram dengan nilai threshold 0.1 dan hasil uji lainnya dapat dilihat pada Lampiran 3, 4, 5, 6, dan 7. Pada program trec_eval perhitungan nilai interpolasi menggunakan rumus interpolasi maksimum. Hasil keluaran program trec_eval nilai-nilai dari interpolasi, yaitu: 1 Num_q, menunjukkan jumlah kueri yang di uji pada program trec_eval. 2 Num_ret, menunjukkan jumlah dokumen yang berhasil di-retrieve oleh program trec_eval. 3 Num_rel, menunjukkan jumlah kueri yang relevance. 4 Num_rel_ret, menunjukan banyak dokumen relevance yang berhasil diretrieve. 5 Map, menunjukkan nilai dari Mean Average Precision dari sistem. 6 Gm_ap, menunjukkan nilai dari Average_Precision. 7 R-prec, menunjukkan nilai dari R- precision. 8 Bpref, menunjukkan nilai dari Binary Preferance. 9 Recip_rank, menunjukkan nilai Recipricial Rank pada dokumen yang relevance. 10 Ircl_prn, menunjukkan nilai interpolasi dari 11 standar nilai recall dari sistem yang diuji. Nilai-nilai ircl_prn tersebut adalah nilai yang digunakan untuk membuat kurva recal precision untuk membandingkan antara model bigram dengan model trigram. Pada tahap evaluasi penelitian ini, dilakukan beberapa perbandingan hasil temu kembali pada kueri uji, yaitu perbandingan proses N-gram antara model bigram dengan model trigram dan menggunakan tiga nilai threshold yaitu 0.1, 0.05, dan 0.0. Pada penelitian ini, dapat dikatakan hasil proses model trigram lebih tinggi dari model bigram. Perbandingan nilai AVP dari proses bigram dengan trigram dapat dilihat dari grafik pada Gambar 3, 4, dan 5

13 Precision 5 Tabel 2 Contoh daftar hasil pencarian untuk kueri Q1 Qid Docno Similarity Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Q1 Dok Pada Gambar 3 dapat dilihat metode trigram lebih baik dari bigram pada nilai threshold 0.1. metode trigram dapat meningkatkan nilai precision pada titik recall kemudian jatuh pada titik recall selanjutnya. Hal tersebut tidak terjadi pada metode bigram yang hanya mampu meningkatkan nilai precision pada titik recall yang kemudiam jatuh pada titik recall selanjutnya. Pada Gambar 4, dengan nilai threshold 0.05, kedua metode menghasilkan grafik yang lebih baik dari grafik sebelumya. Penurunan nilai precision kedua metode tersebut tidak setajam pada grafik dengan threshold 0.1 walaupun hanya dapat meningkatkan nilai precision pada titik recall rendah. Tabel 3 Contoh hasil keluaran sistem trec_eval trigram 0.1 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi Pada Gambar 5 grafik dengan nilai threshold 0.0 menghasilkan hasil lebih baik untuk metode trigram bila dibandingkan dengan dua grafik recall-precision sebelumnya. Pada metode trigram dapat dilihat bahwa dengan nilai threshold 0.0 dapat meningkatkan nilai precision yang stabil sampai titik recall tertinggi. Meskipun terdapat penurunan, penurunan tersebut tidak terlalu signifikan. Pada metode bigram menghasilkan nilai yang sedikit menurun. Hal tersebut disebabkan oleh penurunan nilai precision pada titik recall 0.8 bila dibandingkan dengan grafik pada Gambar BIGRAM TRIGRAM Recall Gambar 3 Grafik recall precision bigram dan trigram dengan threshold 0.1.

14 Precision Precision BIGRAM TRIGRAM Recall Gambar 4 Grafik recall precision bigram dan trigram dengan threshold BIGRAM TRIGRAM Recall Gambar 5 Grafik recall precision bigram dan trigram dengan threshold 0.0. Tabel 4 Perbandingan nilai AVP sepuluh kueri pada sistem Kueri Bigram 0.1 Trigram 0.1 Bigram 0.05 Trigram 0.05 Bigram 0.0 Trigram 0.0 Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Average precision (AVP)

15 7 Berdasarkan Tabel 4 model trigram memiliki hasil pencarian lebih baik dari model bigram pada setiap nilai threshold. Namun terdapat kueri dari model bigram yang memiliki nilai AVP lebih baik dari model trigram pada nilai threshold 0.1. Kueri tersebut adalah kripto. Hal tersebut disebabkan oleh jumlah elemen dari array yang dibentuk oleh model bigram dan trigram pada dokumen SMS dari kueri tersebut sedikit. Jumlah elemen array yang sedikit berakibat pada pula hasil perhitungan ukuran kesamaan dice coefficient yang melihat jumlah elemen array yang sama antara dokumen SMS dan kueri. Selain itu panjang array SMS dan kueri juga sangat mempengaruhi karena jumlah elemen array yang sama antar SMS dan kueri akan dibagi dengan panjang array SMS dan kueri. Semakin sedikit jumlah elemen array yang sama dan panjang array SMS dan kueri semakin panjang maka ukuran kesamaan yang dihasilkan semakin kecil. Penggunaan nilai threshold yang berbeda juga berpengaruh terhadap kinerja sistem. Hal tersebut disebabkan karena nilai threshold yang semakin kecil akan menampilkan hasil pencarian yang lebih banyak dimana terdapat beberapa dokumen yang relevan yang memiliki nilai kecil mendekati 0.0 yang disebabkan oleh panjang dokumen SMS. Hal ini menyebabkan kinerja sistem menurun pada nilai threshold yang semakin besar. Pengembangan Sistem Pada tahap pengembangan sistem ini, seluruh tahapan dari mulai normalisasi, proses N-gram, perhitungan dice coefficient, dan pemeringkatan dokumen diadopsi dan diimplementasikan menggunakan bahasa pemrograman Android. Dalam implementasinya, sistem ini tidak hanya mampu mencari SMS sesuai dengan kueri yang diberikan, namun juga terdapat beberapa fitur tambahan, yaitu: 1 Read, pengguna dapat melihat isi dari SMS dari hasil pencarian secara keseluruhan dengan menekan layar pada device yang terkait dengan SMS yang ingin dilihat. Sistem akan mengeluarkan tampilan dialog box yang berisi isi SMS tersebut yang terlihat pada Lampiran Reply & forward SMS, setelah melihat isi SMS secara keseluruhan, pengguna juga dapat membalas atau meneruskan SMS tersebut. Dengan menekan tombol reply atau forwad yang ada pada dialog box seperti pada Lampiran 12 dan Lampiran Send SMS, pengguna dapat mengirim SMS setelah membalas atau meneruskan isi SMS dengan menekan tombol send pada dialog box. Simpulan SIMPULAN DAN SARAN Berdasarkan penelitian yang telah dilakukan, dapat disimpulkan bahwa sistem mesin pencari SMS berhasil menerapkan metode N-gram yang menggunakan model bigram dan trigram. Akurasi hasil model trigram lebih besar dibanding model bigram untuk 661 dokumen SMS yang terbagi menjadi 364 dokumen SMS inbox dan 297 dokumen SMS sent item, dengan model bigram 49.6% dan model trigram 80.8%. Saran Pada peneletian ini belum menggunakan indexing pada kueri dan dokumen SMS dan hanya menggunakan metode N-gram dan ukuran kesamaan dice coefficient, maka pada penelitian selanjutnya disarankan : 1 Menggunakan metode ukuran kesamaan yang lain seperti soundex atau Dameraulevenstein-Metric serta ukuran kesamaan jaccard coefficient untuk melihat berbagai perbandingan dari metode ukuran kesamaan pada sistem pencarian SMS. 2 Diharapkan adanya proses indexing dan penggunaan stopword serta pemakaian karakter spasi, koma, titik, dan karakter lainnya yang pada penelitian ini dianggap kurang representatif untuk melihat perbandingan kinerja sistem dari penelitian sebelumnya. DAFTAR PUSTAKA Angell RC, Freund GE, Willett P Automatic spelling correction using a trigram similarity Measure. Information Processing & Management.19(4): Baeza-Yates R, Ribeiro-Neto B Modern Information Retrieval. New York: Addison Wesley. Damerau FJ A Technique for Computer Detection and Correction of

16 8 Spelling Errors. Communications of the ACM. 7: Majumder P, Mitra M, Chaudhuri BB N-gram: A Language Indpendent Approach to IR and NLP. International Conference on Universal Knowledge and Language (ICUKL). 1:1-7. Manning CD, Raghavan P, Schutze H Introduction to Information Retrieval. Cambridge: Cambridge University Press Peterson JL Computer program for detecting and correcting spelling erorrs. Communications of the ACM. 23: Rahmawan F Implementasi Question Answering System pada dokumen bahasa Indonesia menggunakan metode N-gram. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Salton G Automatic Text Processing: The Transformation, Analysis, and Retrieval of Information by Computer. Boston: Addison-Wesley. Wahyudin A Algoritme trigram untuk mengoreksi ejaan. [Skripsi]. Bogor: Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor.

17 LAMPIRAN 9

18 10 Lampiran 1 Daftar kueri uji dan dokumen yang relevan Kueri Uji Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Dokumen Relevan dok52, dok55, dok81, dok90, dok96, dok172, dok208, dok239,dok243,dok247, dok291, dok292, dok297, dok303, dok325, dok347, dok384, dok387, dok388,dok391, dok399, dok404,dok408, dok437, dok463, dok467, dok504,dok505, dok520, dok549, dok 659 dok52,dok55,dok69,dok70,dok238,dok242,dok243,dok244,dok292,dok336,dok34 7,dok384,dok399,dok400,dok482,dok517,dok518,dok520,dok528 dok102,dok123,dok129,dok142,dok225,dok325,dok370,dok391,dok482,dok494 dok3,dok4,dok7,dok206,dok208,dok386,dok481,dok482,dok493,dok504 dok53,dok54,dok93,dok94,dok297,dok304,dok348,dok357,dok358,dok378,dok37 9,dok381,dok467,dok547,dok549 dok3,dok4,dok172,dok289,dok298,dok299,dok326,dok482,dok496,dok511,dok51 2,dok567,dok578,dok608,dok620,dok626 dok36,dok208,dok228,dok259,dok265,dok267,dok280 dok74,dok82,dok83,dok131,dok137,dok176,dok183,dok185,dok286,dok288,dok2 90,dok472,dok486,dok538,dok555 dok19,dok20,dok27,dok30,dok66,dok68,dok87,dok88,dok114,dok187,dok236,dok 237,dok257,dok279,dok339,dok344,dok353,dok374,dok389,dok410,dok414,dok4 16,dok447,dok450,dok462,dok506,dok554,dok576,dok605,dok606,dok609,dok62 1,dok623,dok639,dok640 dok333,dok334,dok395,dok479,dok513,dok531,dok543,dok564,dok565,dok571,d ok580,dok589,dok590,dok591,dok596,dok630,dok642

19 11 Lampiran 2 Contoh dokumen SMS pengujian <SMSes count="661"> <SMS protocol="0" address=" " date=" " type="2" subject="null" body="iyah dah prnah baca gw,,bisa klo ada ios nya mah hahaha" toa="null" sc_toa="null" service_center="null" read="1" status="0" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="1" subject="null" body="kagak bisa ngoding di ipad kiiiii huwaaaa" toa="null" sc_toa="null" service_center=" " read="1" status="-1" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="2" subject="null" body="gadein ipad lw buat beli macbook lalalalala" toa="null" sc_toa="null" service_center="null" read="1" status="0" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="1" subject="null" body="aaaaaaak" toa="null" sc_toa="null" service_center=" " read="1" status="-1" locked="0" date_sent="null" /> <SMS protocol="0" address=" " date=" " type="2" subject="null" body="lw SMS apa mank ras?" toa="null" sc_toa="null" service_center="null" read="1" status="0" locked="0" date_sent="null" /> </SMSes>

20 12 Lampiran 3 Hasil keluaran sistem trec_eval bigram 0.1 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi

21 13 Lampiran 4 Hasil keluaran sistem trec_eval trigram 0.05 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi

22 14 Lampiran 5 Hasil keluaran sistem trec_eval bigram 0.05 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi

23 15 Lampiran 6 Hasil keluaran sistem trec_eval trigram 0.0 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi

24 16 Lampiran 7 Hasil keluaran sistem trec_eval bigram 0.0 Variabel output num_q num_ret num_rel num_rel_ret map gm_ap R-prec bpref recip_rank ircl_prn.0.00 ircl_prn.0.10 ircl_prn.0.20 ircl_prn.0.30 ircl_prn.0.40 ircl_prn.0.50 ircl_prn.0.60 ircl_prn.0.70 ircl_prn.0.80 ircl_prn.0.90 ircl_prn.1.00 Nilai Interpolasi

25 17 Lampiran 8 Daftar AVP pada pengujian model bigram dengan threshold 0.1 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.471

26 18 Lampiran 9 Daftar AVP pada pengujian model trigram dengan threshold 0.1 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.581

27 19 Lampiran 10 Daftar AVP pada pengujian model bigram dengan threshold 0.05 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.496

28 20 Lampiran 11 Daftar AVP pada pengujian model trigram dengan threshold 0.05 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.714

29 21 Lampiran 12 Daftar AVP pada pengujian model bigram dengan threshold 0.0 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.496

30 22 Lampiran 13 Daftar AVP pada pengujian model trigram dengan threshold 0.0 Kueri Uji Titik Recall Jarkom Kripto Ppcd Analgor Basket Tki Makrab Transfer Kosan Kolokium Rata-rata interpolasi maksimum AVP 0.714

31 23 Lampiran 14 Antarmuka halaman utama sistem pencarian SMS Lampiran 16 Antarmuka read SMS Lampiran 15 Antarmuka hasil pencarian Lampiran 17 Antarmuka reply SMS

32 Lampiran 18 Antarmuka forward SMS 24

HASIL DAN PEMBAHASAN. sim(, )=

HASIL DAN PEMBAHASAN. sim(, )= 4 untuk dianggap relevan dengan istilah-istilah kueri tertentu dibandingkan dokumendokumen yang lebih pendek. Sehinggavektor dokumen perlu dinormalisasi. Ukuran kesamaan antara kueri Q dan dokumen D i

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j 3 p( i j ) adalah peluang kata i dalam dokumen setelah j diketahui (Adisantoso 1996). Hitung Relevansi Kata Pada tahap ini, dilakukan proses perhitungan setiap kata yang dinilai relevan dan tidak relevan

Lebih terperinci

beberapa tag-tag lain yang lebih spesifik di dalamnya.

beberapa tag-tag lain yang lebih spesifik di dalamnya. metode mana yang lebih baik digunakan untuk memilih istilah ekspansi yang akan ditambahkan pada kueri awal. Lingkungan Implementasi Perangkat lunak yang digunakan untuk penelitian yaitu:. Windows Vista

Lebih terperinci

Rata-rata token unik tiap dokumen

Rata-rata token unik tiap dokumen Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk

Lebih terperinci

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya. beberapa kata. Menurut Baeza-Yates dan Ribeiro-Neto (1999), tidak semua kata dapat digunakan untuk merepresentasikan sebuah dokumen secara signifikan Pemrosesan teks yang dilakukan dalam penelitian ini

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium

Lebih terperinci

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA

TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA TUNING PARAMETER DALAM FUNGSI OKAPI BM25 PADA MESIN PENCARI TEKS BAHASA INDONESIA TEDY SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

PENDAHULUAN. Latar belakang

PENDAHULUAN. Latar belakang Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.

Lebih terperinci

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU

CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU CROSS LANGUAGE QUESTION ANSWERING SYSTEM MENGGUNAKAN PEMBOBOTAN HEURISTIC DAN RULE BASED SELAMET SUBU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA

KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA KATEGORISASI TEKS MENGGUNAKAN N-GRAM UNTUK DOKUMEN BERBAHASA INDONESIA Oleh: YUDHA PERMADI G64102064 DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2008

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI

PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI PEMBENTUKAN PASSAGE DALAM QUESTION ANSWERING SYSTEM UNTUK DOKUMEN BAHASA INDONESIA SYAHRUL FATHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012

Lebih terperinci

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH

TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH TEMPORAL QUESTION ANSWERING SYSTEM BAHASA INDONESIA ADI DARLIANSYAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 TEMPORAL QUESTION ANSWERING

Lebih terperinci

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431

KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :

Lebih terperinci

KOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN

KOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN KOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN Utis Sutisna 1), Julio Adisantoso 2) 1,2 Departemen Ilmu Komputer, Institut Pertanian Bogor Kampus Darmaga, Wing 20 Level

Lebih terperinci

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK

QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA ABSTRAK QUERY-SENSITIVE SIMILARITY MEASURE DALAM TEMU KEMBALI DOKUMEN BERBAHASA INDONESIA Sri Nurdiati 1, Julio Adisantoso 1, Adam Salnor Akbar 2 1 Staf Departemen Ilmu Komputer, Fakultas Matematika dan IPA, Institut

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio

Lebih terperinci

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan

Lebih terperinci

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen

HASIL DAN PEMBAHASAN. Tabel 1 Struktur tabel tb_dokumen 6 Lingkungan Implementasi Lingkungan implementasi yang digunakan adalah sebagai berikut : Perangkat lunak : Sistem operasi Windows XP Professional Microsoft Visual Basic.NET 2005 SQL Srever 2000 Perangkat

Lebih terperinci

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI

EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI EKSPANSI KUERI MENGGUNAKAN KAMUS KEDOKTERAN PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA ENENG MARYANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer

LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer LAPORAN AKHIR HIBAH PENELITIAN dalam Rangka Kegiatan SP4 Departemen Ilmu Komputer CORPUS DOKUMEN TEKS BAHASA INDONESIA UNTUK PENGUJIAN EFEKTIVITAS TEMU KEMBALI INFORMASI Oleh: Ir. Julio Adisantoso, M.Kom.

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR

PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR PERBANDINGAN EFISIENSI MODEL RUANG VEKTOR PADA SISTEM TEMU KEMBALI INFORMASI ARI ALKAUTSAR DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 1 PERBANDINGAN

Lebih terperinci

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA

METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA METODE PEMILIHAN FITUR DOKUMEN BAHASA INDONESIA YANG TERKELOMPOK PADA MESIN PENCARI FITRIA RAHMADINA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB

PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB PENGEMBANGAN WORDNET BAHASA INDONESIA BERBASIS WEB RIYAN ADI LESMANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 PENGEMBANGAN WORDNET BAHASA

Lebih terperinci

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI

XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI XML RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA MARYAM NOVIYANA BAHI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 XML RETRIEVAL UNTUK DOKUMEN

Lebih terperinci

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI

PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI PENGUKURAN KEMIRIPAN CITRA BERBASIS WARNA, BENTUK, DAN TEKSTUR MENGGUNAKAN BAYESIAN NETWORK RIZKI PEBUARDI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal

Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem

Lebih terperinci

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract

Bernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very

Lebih terperinci

MEN BAHASA INDONESIA MENGGUNAKAN SE EMANTIC SMOOTHING

MEN BAHASA INDONESIA MENGGUNAKAN SE EMANTIC SMOOTHING KLASIFIKASII DOKUMEN BAHASA INDONESIA MENGGUNAKAN SEMANTIC SMOOTHING DENGAN EKSTRAKSI CIRI CHI-SQUARE NOFEL SAPUTRA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMA ATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIANN

Lebih terperinci

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR

KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL

Lebih terperinci

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM

ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM ANALISIS PENGGUNAAN ALGORITMA STEMMING VEGA PADA INFORMATION RETRIEVAL SYSTEM Lusianto Marga Nugraha¹, Arie Ardiyanti Suryani², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Stemming

Lebih terperinci

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI

UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO

KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO KINERJA PROTOKOL ROUTING DALAM KOMUNIKASI REAL-TIME PADA JARINGAN BERKABEL DAMAS WIDYATMOKO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 KINERJA

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi Proses Temu-Kembali KULIAH #5 Evaluasi IR query : sby query: flu burung Evaluasi IR Indikator yang dapat diukur: Seberapa cepat dia meng-indeks Banyaknya dokumen/jam Terkait

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama

Lebih terperinci

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi

Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:

Lebih terperinci

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA

EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA EVALUASI PENGGUNAAN SIMILARITY THESAURUS TERHADAP EKSPANSI KUERI DALAM SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA Fridolin Febrianto Paiki Universitas Papua, Jl. Gunung Salju, Amban, Manokwari ff.paiki@unipa.ac.id

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI Pendahuluan JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 PENDAHULUAN Pendahuluan Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi Kode Mata Kuliah : KOM431 Koordinator : Julio

Lebih terperinci

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA

EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA EKSPANSI KUERI PADA SISTEM TEMU KEMBALI INFORMASI BERBAHASA INDONESIA MENGGUNAKAN ANALISIS KONTEKS LOKAL LARAS MUTIARA DIVA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI

TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI TEMU KEMBALI INFORMASI DOKUMEN XML DENGAN PEMBOBOTAN PER KONTEKS RINA KURNIAWATI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI

Lebih terperinci

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL

APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL APLIKASI SEGMENTASI TEKS DALAM BAHASA MANDARIN DENGAN METODE RULE-BASED DAN STATISTICAL Rudy Adipranata 1), Meliana Ongkowinoto 2), Rolly Intan 3) Jurusan Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha ABSTRAK Information retrieval (IR) system adalah sistem yang secara otomatis melakukan pencarian atau penemuan kembali informasi yang relevan terhadap kebutuhan pengguna. Kebutuhan pengguna, diekspresikan

Lebih terperinci

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH

STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH STUDI KOMPARATIF PEMBOBOTAN KATA UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA HAFIZHIA DHIKRUL ANUGRAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI

PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI PENGGUNAAN OPERATOR BELIEF REVISION PADA TEMU KEMBALI DOKUMEN BAHASA INDONESIA MODEL BOOLEAN MERISKA DEFRIANI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI

PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI PENCARIAN TEKS BAHASA INDONESIA PADA MESIN PENCARI BERBASIS SOUNDEX EDO APRIYADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN MENGENAI

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi.

HASIL DAN PEMBAHASAN. Gambar 7 Diagram alur proses mutasi. 5 Mulai HASIL DAN PEMBAHASAN Kromosom P = rand [0,1] Ya P < Pm R = random Gen(r) dimutasi Selesai Tidak Gambar 7 Diagram alur proses mutasi. Hasil populasi baru yang terbentuk akan dievaluasi kembali dan

Lebih terperinci

SISTEM TEMU KEMBALI NAMA ILMIAH DENGAN MENGGUNAKAN ALGORITME FONETIK WAHYU DIAS HARSOWIYONO

SISTEM TEMU KEMBALI NAMA ILMIAH DENGAN MENGGUNAKAN ALGORITME FONETIK WAHYU DIAS HARSOWIYONO SISTEM TEMU KEMBALI NAMA ILMIAH DENGAN MENGGUNAKAN ALGORITME FONETIK WAHYU DIAS HARSOWIYONO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013 PERNYATAAN

Lebih terperinci

RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR

RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR RELEVANCE FEEDBACK PADA TEMU-KEMBALI TEKS BERBAHASA INDONESIA DENGAN METODE IDE-DEC-HI DAN IDE-REGULAR Julio Adisantoso, Ahmad Ridha, Andika Wahyu Agusetyawan Staf Departemen Ilmu Komputer, Fakultas Matematika

Lebih terperinci

Search Engines. Information Retrieval in Practice

Search Engines. Information Retrieval in Practice Search Engines Information Retrieval in Practice All slides Addison Wesley, 2008 Search Engine Architecture Arsitektur dari mesin pencari ditentukan oleh 2 persyaratan efektivitas (kualitas hasil) efisiensi

Lebih terperinci

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA

MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email

Lebih terperinci

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah 1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari

Lebih terperinci

TEMU KEMBALI INFORMASI

TEMU KEMBALI INFORMASI JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 4 TOLERANCE RETRIEVAL Tugas Extended Boolean Pelajari Extended Boolean Mengapa dikembangkan model ini? Bagaimana prinsip dasar model ini? Bagaimana

Lebih terperinci

TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL

TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL MICHAEL SENNA SAPUTRA NIM. 1008605062 PROGRAM STUDI TEKNIK

Lebih terperinci

Code shift Asumsi-asumsi Pengaburan Kode Lingkungan Pengembangan HASIL DAN PEMBAHASAN Karakteristik Dokumen Perlakuan ( Treatment

Code shift Asumsi-asumsi Pengaburan Kode Lingkungan Pengembangan HASIL DAN PEMBAHASAN Karakteristik Dokumen Perlakuan ( Treatment 6 dengan FF. Jenis karakter substitusi dapat dilihat pada Tabel 6. Code shift Karakter yang dibuang dari lima bit kode dalam penelitian ini adalah karakter ke dua. Hal ini dengan pertimbangan pengucapan

Lebih terperinci

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza

Lebih terperinci

METODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI

METODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI METODE PEMBOBOTAN KATA BERBASIS SEBARAN UNTUK TEMU KEMBALI INFORMASI DOKUMEN BAHASA INDONESIA PUTRI DEWI PURNAMA SARI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu

Lebih terperinci

4 HASIL DAN PEMBAHASAN

4 HASIL DAN PEMBAHASAN 4 HASIL DAN PEMBAHASAN Penelitian ini dibuat menggunakan bahasa pemrograman PHP untuk tahapan praproses data, implementasi algoritme DIG dan pembangkitan metafile penyusun struktur digraf. Representasi

Lebih terperinci

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik

Lebih terperinci

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN PEMBOBOTAN FITUR KALIMAT YOZI SUKMATUL AHDA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN

RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN RDF RETRIEVAL UNTUK DOKUMEN BAHASA INDONESIA DENGAN PEMBOBOTAN PER KONTEKS REZA KEMAL ZAEN DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI

PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI PELABELAN OTOMATIS CITRA MENGGUNAKAN FUZZY C MEANS UNTUK SISTEM TEMU KEMBALI CITRA MARSANI ASFI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian menjelaskan bagaimana langkah-langkah atau tahapan-tahapan yang akan dilakukan dalam penelitian agar rumusan masalah penelitian dapat terselesaikan.

Lebih terperinci

CLUSTERING DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN FUZZY C-MEANS ISNA MARIAM

CLUSTERING DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN FUZZY C-MEANS ISNA MARIAM CLUSTERING DOKUMEN BERBAHASA INDONESIA MENGGUNAKAN FUZZY C-MEANS ISNA MARIAM DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011 CLUSTERING DOKUMEN

Lebih terperinci

BAB V IMPLEMENTASI. Bab ini membahas mengenai implementasi dan hasil dari pengujian sistem.

BAB V IMPLEMENTASI. Bab ini membahas mengenai implementasi dan hasil dari pengujian sistem. BAB V IMPLEMENTASI Bab ini membahas mengenai implementasi dan hasil dari pengujian sistem. 5. Lingkungan Implementasi Implementasi merupakan tahapan dimana hasil perancangan yang telah dibangun mulai diterapkan

Lebih terperinci

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA

PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA PSEUDO-RELEVANCE FEEDBACK PADA TEMU-KEMBALI MENGGUNAKAN SEGMENTASI DOKUMEN ELENUR DWI ANBIANA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2009

Lebih terperinci

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN

Identifikasi Tipe Pertanyaan Asumsi Pengelompokan Tipe Jawaban Lingkungan Implementasi Temu Kembali Jawaban HASIL DAN PEMBAHASAN 5 Identifikasi Tipe Pertanyaan Ada beberapa tipe pertanyaan yang digunakan dalam Bahasa Indonesia, yaitu: 1 APA, yang menanyakan suatu pengertian, tujuan, manfaat, kata benda, baik abstrak maupun konkret

Lebih terperinci

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi

BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi 67 BAB 4 HASIL DAN BAHASAN 4.1 Hasil Penelitian dan Evaluasi 4.1.1 Hasil Penelitian Berikut disajikan beberapa data hasil query dari penelitian yang dilakukan dengan melampirkan tabel data precision dan

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN

IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas

Lebih terperinci

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH

PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH PERINGKASAN DOKUMEN BAHASA INDONESIA MENGGUNAKAN METODE MAXIMUM MARGINAL RELEVANCE LUTFIA AFIFAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015

Lebih terperinci

1. PENDAHULUAN 1.1 Latar belakang Masalah

1. PENDAHULUAN 1.1 Latar belakang Masalah 1. PENDAHULUAN 1.1 Latar belakang Masalah Bahasa Indonesia adalah alat yang mampu menjembatani penduduk Indonesia yang terdiri dari berbagai suku dan bahasa untuk dapat berkomunikasi satu sama lainnya.

Lebih terperinci

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL

QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL QUERY EXPANSION DENGAN MENGGABUNGKAN METODE RUANG VEKTOR DAN WORDNET PADA SISTEM INFORMATION RETRIEVAL Susetyo Adi Nugroho () Abstrak: Salah satu metode yang sering digunakan dalam mengukur relevansi dokumen

Lebih terperinci

FM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015

FM-UDINUS-BM-08-04/R0 SILABUS MATAKULIAH. Silabus: Information Retrieval Hal: 1 dari 5. Revisi : - Tanggal Berlaku : Januari 2015 SILABUS MATAKULIAH Revisi : - Tanggal Berlaku : Januari 2015 A. Identitas 1. Nama Matakuliah : A11. 54823 / 2. Program Studi : Teknik Informatika-S1 3. Fakultas : Ilmu Komputer 4. Bobot sks : 3 SKS 5.

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB 3 ANALISIS DAN PERANCANGAN SISTEM BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Sistem Analisis sistem ialah proses identifikasi mengenai hal-hal yang dibutuhkan dan harus ada pada sistem, agar sistem tersebut dapat berjalan sesuai

Lebih terperinci

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL

PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,

Lebih terperinci

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus

Lebih terperinci

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang

BAB 3 METODE PENELITIAN. pengelolaan dokumen yang efektif agar kita dapat me-retrieve informasi yang 58 BAB 3 METODE PENELITIAN 3.1 Analisis Masalah Seiring dengan perkembangan zaman, jumlah informasi yang disimpan dalam betuk digital semakin bertambah, sehingga dibutuhkan cara pengorganisasian dan pengelolaan

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #1 Kontrak Perkuliahan Pendahuluan Matakuliah Nama Matakuliah : Temu Kembali Informasi Kode Matakuliah : KOM431 Beban Kredit : 3(3-0) Semester : Gasal, 2009/2010 Koordinator

Lebih terperinci

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE

RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE RELEVANCE FEEDBACK PADA INFORMATION RETRIEVAL DENGAN SUPPORT VECTOR MACHINE Sri Ulinar Romatua N B¹, Yanuar Firdaus A.w.², Warih Maharani³ ¹Teknik Informatika,, Universitas Telkom Abstrak Dengan semakin

Lebih terperinci

RANCANG BANGUN APLIKASI PENGAMANAN SMS DENGAN METODE ALGORITMA VIGENERE CIPHER DAN TRANSPOSISI BERBASIS ANDROID

RANCANG BANGUN APLIKASI PENGAMANAN SMS DENGAN METODE ALGORITMA VIGENERE CIPHER DAN TRANSPOSISI BERBASIS ANDROID RANCANG BANGUN APLIKASI PENGAMANAN SMS DENGAN METODE ALGORITMA VIGENERE CIPHER DAN TRANSPOSISI BERBASIS ANDROID YAYAT SUYATNA 41512110051 PROGRAM STUDI INFORMATIKA FAKULTAS ILMU KOMPUTER UNIVERSITAS MERCU

Lebih terperinci

EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT

EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT J. Sains MIPA, Desember 2010, Vol. 16, No. 3, Hal.: 155-162 ISSN 1978-1873 EVALUASI SISTEM TEMU KEMBALI INFORMASI MODEL RUANG VEKTOR DENGAN PENDEKATAN USER JUDGEMENT Didik Kurniawan Jurusan Matematika

Lebih terperinci

BAB I. Pendahuluan. 1. Latar Belakang Masalah

BAB I. Pendahuluan. 1. Latar Belakang Masalah BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Twitter Twiter adalah sebuah layanan media sosial yang memungkinkan penggunanya untuk menulis maksimal 140 karakter, yang dikenal sebagai Tweet. Twitter didirikan oleh Jack Dorsey

Lebih terperinci

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom IMPLEMENTASI MODEL RUANG VEKTOR SEBAGAI PENERJEMAH QUERY PADA CROSS-LANGUAGE INFORMATION RETRIEVAL SISTEM IMPLEMENTATION OF VECTOR SPACE MODEL AS QUERY TRANSLATION FOR CROSS-LANGUAGE INFORMATION RETRIEVAL

Lebih terperinci

4 HASIL DAN PEMBAHASAN

4 HASIL DAN PEMBAHASAN 24 4 HASIL DAN PEMBAHASAN 4.1 Data Korpus Data korpus berisi berita-berita nasional berbahasa Indonesia dari tanggal 11 Maret 2002 sampai 11 April 2002. Berita tersebut berasal dari berita online harian

Lebih terperinci

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE

EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE EVALUASI EFEKTIFITAS METODE MACHINE-LEARNING PADA SEARCH-ENGINE Rila Mandala Kelompok Keahlian Informatika, Sekolah Teknik Elektro dan Informatika, Institut Teknologi Bandung Jalan Ganesha 10 Bandung,

Lebih terperinci