BAB II TINJAUAN PUSTAKA
|
|
|
- Sudomo Darmali
- 8 tahun lalu
- Tontonan:
Transkripsi
1 11 BAB II TINJAUAN PUSTAKA 2.1 Sistem Temu Kembali Informasi Temu Kembali informasi (IR) adalah Proses, metode, dan prosedur yang digunakan untuk menyeleksi informasi yang relevan yang tersimpan dalam database.kebutuhan akan IR datang saat koleksi dokumen mencapai ukuran dimana teknik katalog tradisional tidak lagi memadai (Sanderson, M. Croft, W.B. 2012). Banyak pihak menggunakan IR untuk menyediakan informasi ke organisasinya sendiri atau publik, informasi tersebut bisa berupa buku, jurnal ataupun dokumen lain. Banyak sistem IR yang mengkomputasikan nilai numerik untuk tiap object di databasenya, tentang seberapa cocoknya object dengan query yang diberi oleh user, dan merankingkan hasil tersebut sesuai nilai yang didapat. Dalam perpustakaan dan arsip, temu kembali informasi biasanya untuk dokumen yang diketahui atau untuk informasi mengenai subyek tertentu, dan file biasanya katalog atau indeks, atau penyimpanan informasi berbasis komputer dan sistem pencarian, seperti katalog online atau Database bibliografi.dalam merancang sistem tersebut, keseimbangan harus dicapai antara kecepatan, akurasi, biaya, kenyamanan, dan efektivitas. Gambar 2.1 Ilustrasi Sistem Temu Kembali Informasi 11
2 12 Dari ilustrasi yang ada (gambar 2.1), tergambar jelas bagaimana cara kerja dari sistem temu kembali 1. Pengguna akan memberikan query yang merupakan apa yang ingin di cari oleh pengguna, query tersebut bisa berisi 1 term atau lebih, namun tidak boleh kosong. 2. query tersebut akan selanjutnya di proses yang meliputi pemilihan katakata dalam query maupun dokumen dalam pentransformasian dokumen atau query menjadi terms index.perubahan ini bisa berupa proses stemming atau proses lainnya. 3. Namun sebelum itu, sebelum dilakukan proses pencarian oleh user, dokumen terlebih dahulu di proses oleh sistem, melalui proses indexing, tiap kata di dokumen akan di index dan dikumpulkan menjadi kumpulan index. 4. kumpulan index inilah yang akan dicocokkan dengan term index,kemudian menggunakan sebuah metode perankingan tertentu akan didapatkan dokumen-dokumen dengan nilai terbaik sesuai dengan metode perankingan, dokemen inilah yang akan diberikan kepada User. Penjelasan di atas memberikan gambaran kerja dari Sistem Temu Kembali Informasi, dimana terdapat banyak subsistem yang harus bekerja dengan baik supaya sistem mampu menghasilkan output yang sesuai dengan keinginan pengguna, salah satu subsistem yang penting tersebut ialah proses indexing. Indexing sendiri merupakan sebuah teknik mengindeks atau menata katakata dari dokumen yang disimpan supaya pada proses pencarian nanti, hal ini akan memangkas waktu pencarian dan meringankan beban komputasi sistem. Hal ini dikarenakan sistem tidak usah membandingkan query user dengan dokumen satu-persatu melainkan cukup dengan mencari apakah query yang dicari terdapat di indeks atau tidak. Contohnya, sebuah index dari ratusan dokumen bisa diquery hanya dalam beberapa detik, namun pencarian satu persatu terhadap 100 dokumen akan menghabiskan waktu berjam-jam
3 13 Gambar 2.2 Indexing dokumen Seperti pada gambar 2, proses indexing akan mengambil seluruh kata dari dokumen yang diterima dan membuat sebuah list yang berisi kata-kata dari dokumen yang ada beserta dengan dari mana kata tersebut berasal. Informasi ini akan meningkatkan keefesienan dari waktu query sistem (Christopher, 2008). 2.2 BM25 (Best Matching 25) BM25 merupakan sebuah metode perangkingan yang digunakan oleh search engine untuk merankingkan dokumen sesuai dengan kerelevanannya dengan query yang diterima. BM25 merupakan teknik perankingan yang didesign oleh Stephen E. Robertson, BM merupakan singkatan dari Best Match (Kecocokan terbaik). Proses perangkingan BM25 berdasarkan jumlah query yang muncul di dokumen. Sehingga term-frequency dan juga inverse dokumen frequency digunakan dalam penghitungan BM25.Term Frequency (tf) adalah penentuan bobot term pada suatu dokumen berdasarkan jumlah kemunculannya dalam dokumen tersebut. sehingga semakin besar jumlah kemunculan suatu term (tf tinggi) dalam dokumen, semakin besar pula bobotnya dalam dokumen atau akan memberikan nilai kesesuian yang semakin besar.inverse Document Frequency (idf) adalah pengurangan dominansi term yang sering muncul di berbagai dokumen.hal ini diperlukan karena term yang banyak muncul di berbagai dokumen, dapat dianggap sebagai term umum (common term) sehingga tidak penting nilainya.sebaliknya faktor kejarangmunculan kata (term scarcity) dalam koleksi dokumen harus diperhatikan dalam pemberian bobot.
4 14 Berikut merupakan rumus perankingan BM25 (Anne, 2014) Dimana idf (qi) adalah inverse document frequency, dimana dihitung sebagai berikut idf(qi) = log ( N df (q i )+ 0,5 df (q i )+ 0,5 ), dimana N adalah jumlah total dokumen di koleksi dan df (qi) adalah jumlah dokumen yang memiliki term qi paling tidak 1 buah. -tf (qi, q) adalah term frequency yang merupakan berapa kali term qi muncul di dokumen d -qtf(qi,q) adalah query term frequency yang merupakan jumlah kemunculan term qi dari query q d avgdl adalah panjang dokumen d, dinormalisasi oleh panjang rata-rata dari seluruh dokumen di koleksi k1, b dan k3, adalah parameter bebas dari BM25, biasanya k1 di set nilainya antara 1 hingga 3, b di set sekitar 0.8, dan k3 di set menjadi 0. Contoh penggunaan rumus diatas, ialah sebagai berikut Contoh sebuah query dimasukkan oleh pengguna yang berupa satu buah term, dimana term tersebut terdapat di 30 dokumen, dan disalah satu dokumen memiliki panjang 250 kata, terdapat 50 kali term diulangi di dokumen tersebut, dimana seluruh dokumen berjumlah 100 dan jumlah rata-rata kata di dokumen tersebut ialah 200 kata. maka nilai BM25 untuk term pada dokumen tersebut ialah Nilai idf = log( , ,5 ), = 0,363
5 15 BM25 (q,d) = BM25 (q,d) = = , (0+1) (1 0,8 + 0, ) 0+1 Maka nilai BM25 di dokumen tersebut untuk term yang digunakan ialah 0,29. Nilai tersebut merupakan nilai untuk satu term, apabila digunakan 2 term maka akan dilakukan 2 kali penghitungan seperti itu dimana yang dibedakan ialah nilai idf dan tf dan hasil keduanya akan ditambahkan. Hal ini merupakan penghitungan untuk nilai perangkingan satu dokumen, apabila diperlukan penghitungan akan dilakukan ke lebih banyak dokumen sesuai dengan ada tidaknya term yang dicari pada dokumen-dokumen yang ada. 2.3 Stemming Porter Stemming Dalam lingkungan temu kembali, index memiliki banyak kata didalamnnya. Beberapa term dalam index terkadang memiliki arti yang sama namun tercatat sebagai term-term yang berbeda, sebagai contohnya CONNECT CONNECTED CONNECTING CONNECTION CONNECTIONS Term-term seperti diatas apabila di gabung menjadi 1 term akan meningkatkan performa dari temu kembali (Porter, 1997). Sehingga teknik stemming dilakukan pada temu kembali untuk menghindari term-term bermakna sama. Porter Stemming merupakan Algoritma penghilangan imbuhan pada kata berbahasa Inggris, yang digunakan untuk proses normalisasi kata yang biasanya dilakukan saat preprocessing Sistem Temu Kembali.Algoritma porter pertama akan mengidentifikasi kata berdasarkan huruf konsonan(k) dan vokal(v). Huruf a,
6 16 i, u, e, o dan y akan dianggap sebagai huruf vocal dan selain huruf-huruf tersebut dianggap konsonan. Sebuah kata yang memiliki huruf konsonan dengan panjang lebih dari 0 akan dianggap sebagai c begitu juga dengan kata yang memiliki huruf konsonan dengan panjang lebih dari 0 akan dianggap sebagai v. Contoh: TREE = C(TR) V(EE) = CV COMPUTER = C(C) V(O) C(MP) V(U) C(T) V(E) C(R) = CVCVCVC Dalam algortimanya digunakan penghitungan "m" yang merupakan jumlah pengulangan VC pada tiap kata, dimana tiap kata akan diawali dengan C dan diakhiri dengan V. Jika awal dan akhir kata bukan C dan V, maka akan ditambahkan tanpa mengindahkan susunan kata, namun jika ada maka C dan V dari kata tersebut akan digunakan dalam penghitungan, berikut penghitungannya: COMPUTER = [C] VCVCVC [V] ; m = 3 Kata COMPUTER memiliki susunan kata CVCVCVC, sehingga C awal digunakan sebagai penanda penghitungan awal. setelah itu VC terulang sebanyak 3 kali. Karena susunan diakhiri dengan huruf Konsonan (C), maka ditambahkan V penutup. (Jika huruf terakhir adalah V, Maka V tersebut yang digunakan sebagai penutup).kemudia aturan dari algoritma porter akan ditulis berikut SSES -> SS. Hal ini berarti jika imbuhan sebuah kata adalah SSES, imbuhan tersebut akan diubah menjadi SS.Algoritma Porter sendiri memiliki 5 tahap yaitu: 1. Tahap Pertama Adalah penghilangan plural dan past participle kata bahasa Inggris, dimana dilakukan hal berikut Tabel 2.1 Tabel Aturan 1a Porter Aturan Contoh SSES -> SS caresses -> caress IES -> I ponies -> poni SS -> SS caress -> caress S -> cats -> cat
7 17 Tahap pertama memiliki beberapa langkah, diatas merupakan langkah a, selanjtunya dilakukan langkah b, berikut aturannya: Tabel 2.2 Tabel Aturan 1b Porter aturan contoh (m>0) EED -> EE agreed -> agree (ada V) ED -> plastered -> plaster (ada V) ING -> motoring -> motor Apabila aturan kedua dan ketiga dari aturan 1b terpenuhi, maka aturan berikut dijalankan Tabel 2.3 Tabel Aturan tambahan 1b Porter aturan contoh AT -> ATE conflat(ed) -> conflate BL -> BLE troubl(ed) -> trouble IZ -> IZE siz(ed) -> size -> E fil(ing) -> file Setelah itu dilakukan langkah terakhir seperti berikut 2. Tahap Kedua Tabel 2.4 Tabel Aturan 1c Porter aturan contoh (ada V) Y -> I happy Tabel 2.5 Tabel Aturan 2 Porter -> happi aturan contoh (m>0) ATIONAL -> ATE relational -> relate (m>0) TIONAL -> TION conditional -> condition (m>0) ENCI -> ENCE valenci -> valence (m>0) ANCI -> ANCE hesitanci -> hesitance (m>0) IZER -> IZE digitizer -> digitize (m>0) ABLI -> ABLE conformabli -> conformable (m>0) ALLI -> AL radicalli -> radical (m>0) ENTLI -> ENT differentli -> different (m>0) ELI -> E vileli - > vile (m>0) OUSLI -> OUS analogousli -> analogous (m>0) IZATION -> IZE vietnamization -> vietnamize (m>0) ATION -> ATE predication -> predicate (m>0) ATOR -> ATE operator -> operate (m>0) ALISM -> AL feudalism -> feudal (m>0) IVENESS -> IVE decisiveness -> decisive (m>0) FULNESS -> FUL hopefulness -> hopeful (m>0) OUSNESS -> OUS callousness -> callous (m>0) ALITI -> AL formaliti -> formal (m>0) IVITI -> IVE sensitiviti -> sensitive (m>0) BILITI -> BLE sensibiliti -> sensible
8 18 3. Tahap Ketiga 4. Tahap Keempat Tabel 2.6 Tabel Aturan 3 Porter Aturan Contoh (m>0) ICATE -> IC triplicate -> triplic (m>0) ATIVE -> formative -> form (m>0) ALIZE -> AL formalize -> formal (m>0) ICITI -> IC electriciti -> electric (m>0) ICAL -> IC electrical -> electric (m>0) FUL -> hopeful -> hope (m>0) NESS -> goodness -> good Tabel 2.7 Tabel Aturan 4 Porter aturan contoh (m>1) AL -> revival -> reviv (m>1) ANCE -> allowance -> allow (m>1) ENCE -> inference -> infer (m>1) ER -> airliner -> airlin (m>1) IC -> gyroscopic -> gyroscop (m>1) ABLE -> adjustable -> adjust (m>1) IBLE -> defensible -> defens (m>1) ANT -> irritant -> irrit (m>1) EMENT -> replacement -> replac (m>1) MENT -> adjustment -> adjust (m>1) ENT -> dependent -> depend (m>1) ION -> adoption -> adopt (m>1) OU -> homologou -> homolog (m>1) ISM -> communism -> commun (m>1) ATE -> activate -> activ (m>1) ITI -> angulariti -> angular (m>1) OUS -> homologous -> homolog (m>1) IVE -> effective -> effect (m>1) IZE -> bowdlerize -> bowdler 5. Tahap Kelima Tabel 2.8 Tabel Aturan 5a Porter Aturan contoh (m>1) E -> probate -> probat Aturan pada tabel 2.8 akan dilakukan apabila kata yang dimaksud tidak diakhiri dengan susunan kata CVC.Aturan tabel 2.9 pun dilakukan bila diakhir dengan 2 C
9 19 Aturan Tabel 2.9 Tabel Aturan 5b Porter contoh (m > 1) -> 1 huruf controll -> control Tala Stemming Stemmer Tala (Tala, 2003), adalah pengembangan dari algoritma stemmer porter yang merupakan algoritma stemming bahasa Inggris. Stemmer ini akan mengecek imbuhan kata dan melakukan penghilangan imbuhan tersebut untuk mendapatkan kata dasar kata tersebut. Stemmer ini dievaluasi dengan stemmer bahasa indonesia lain yaitu Nazief, dimana stemmer Tala mampu memiliki nilai presisi yang sedikit lebih baik dari Nazief. Turunan-turunan kata yang mungkin terjadi pada kata berbahasa Indonesia menurut Tala adalah : 1. Akhiran lah, -kah, -pun, -tah. Contoh : siapa + kah = siapakah, kamu + lah = kamulah 2. Akhiran ku, -mu, -nya. Contoh : buku + ku = bukuku, tv + mu = tvmu 3. Kata yang meliputi awalan + akhiran dan kombinasi dari keduanya. ber-, di-, ke-, meng-, peng-, per-, ter-. Contoh : ber + kembang = berkembang di + puji = dipuji ke + luar = keluar meng + usik = mengusik peng + gila = penggila per + kecil = perkecil ter + lukis = terlukis 4. Turunan akhiran -i, -kan dan -an. Contoh : kipas + i = kipasi minum + an = minuman beri + kan = berikan 5. Turunan akhiran dan awalan. Contoh : per + luas + an = perluasan ke + kalah + an = kekalahanan ber + lari + an = berlarian meng + adil + i = mengadili
10 HTML5 HTML 5 merupakan bahasa yang digunakan untuk menstrukturkan dan merepresentasikan konten untuk web, dan merupakan teknologi yang digunakan di internet secara luas.html 5 merupakan revisi ke 5 dari standard HTML. HTML 5 dirancang untuk meningkatkan dukungan HTML terhadap multimedia dan juga membuatnya tetap mudah dimengerti oleh Manusia(T.N.Sharma, 2012). HTML5 akan digunakan dalam penelitian ini karena, HTML 5 merupakan "state-of-the-art"dari bahasa pemprograman yang digunakan untuk pemprograman web. HTML 5 sendiri memiliki banyak peningkatan dibanding dengan HTML sebelumnnya seperti berikut: Audio dan video adalah bagian integral dari spesifikasi HTML 5 Cache aplikasi, Database SQL web dan penyimpanan web ada sebagai penyimpanan di sisi client. Channel Komunikasi full duplex bisa di lakukan dengan server menggunakan soket web. Javascript bisa dijalankan di background. DOCTYPE dibutuhkan unutk mengaktifkan mode standard untuk dokumen HTML. namun untuk HTML 5 hal ini di singkat hanya dengan menambahkan <!DOCTYPE html> 2.5 Teknik Pengujian Sistem Pengujian sistem dilakukan pada saat sistem telah selesai dibuat, tujuan pengujian ini adalah untuk mengetes kualitas dari sistem yang telah dibuat.terdapat 4 jenis pengujian(everett, 2007), yaitu: Pengujian Statis (Static Testing) Sekitar 85% kecacatan perangkat lunak bisa dilihat pada fase design dari pengembangan (Software Testin, Testing Across the Entire Software Development Life Cycle), sehingga diperlukan sebuah pengujian pada fase design tersebut untuk mengurangi cacat yang ada.
11 21 Pengujian tersebut tidak dilakukan dengan memperbaiki coding yang ada, karena code dilakukan pada tahap pemprograman nantinya.namun dengan melakukan tes dokumentasi, dikarenakan dokumentasi telah dibuat baik pada saat pengembangan dimulai, berlanjut, bahkan berakhir.pengetesan Dokumentasi dilakukan dengan inspeksi, presentasi, walkthrough, dan pengecekkan. Seluruh teknik tersebut akan mengecek kebenaran dan kelengkapan dari dokumen yang dites. Apabila ditemukan, maka kecacatan dalam dokumen harus segera dicek untuk dikoreksi Blackbox Testing Blackbox Testing adalah test yang dilakukan saat tester tidak memiliki source code, hanya code yang bisa dijalankan. Testing blackbox dilakukan dengan menjalankan aplikasi dan melakukan apa yang bisa dikerjakan oleh aplikasi, apa yang dilakukan dan bagaimana hasil yang diberikan aplikasi adalah hal yang diteliti. Hal penting yang harus dilakukan pada testing ini adalah, apakah tester mengetahui hasil (benar) apa yang diharapkan dan apakah tester melakukan test dengan benar. Dari kedua hal tersebut maka bisa dilihat apabila terjadi kesalahan, apakah kesalah tersebut dikarenakan kesalahan aplikasi atau kesalahan implementasi. Dalam testing ini akan digunakan 2 metode evaluasi yaitu precision,recall dan DCG (Discounted Cumulative Gain). Precision dan Recall Precision dan recall adalah penghitungan dasar untuk mengevaluasi sistem pencarian. Recall adalah rasio dari jumlah data relevan yang terambil terhadap jumlah data relevan di database. Sedangkan Precision adalah rasio dari jumlah data relevan terhadap jumlah data relevan dan tak relevan yang terambil. Kedua nilai tersebut biasanya diekspresikan dalam persen. Sebagai contoh, sebuah database menyimpan 80 data akan sebuah topik. Sebuah pencarian data dilakukan akan topik tersebut dan 60 data terambil. Dari 60 data tersebut, 45 diantaranya relevan. Dari contoh diatas maka: A =Total data relevan terambil = 45
12 22 B=Total data relevan yang tak terambil = 35 (80-45) C=Total data tak relevan yang terambil = 15 (60-45) Recall = (45 / ( )) * 100% => 45/80 * 100% = 56% Precision = (45 / ( )) * 100% => 45/60 * 100% = 75% Discounted Cumulative Gain (DCG) DCG adalah teknik penghitungan kualitas perangkingan. Dalam sitem temu kembali, DCG digunakan untuk menghitung keefektifan dari algoritma temu kembali, dimana dilakukan penghitungan nilai berdasarkan posisi dokumen di hasil pencarian (Jarvelin, 2002). Aturan DCG adalah apabila dokumen yang relevan muncul di urutan belakang pada list pencarian, maka akan berdampak negative terhadap nilai DCG. Berikut merupakan rumus dari DCG Dimana reli adalah nilai urutan dari posisi i. Untuk lebih jelasnya, sebagai contoh sebuah pencarian menghasilkan 6 dokumen, dan dilakukan penilaian kerelevanan dari 6 dokumen tersebut dengan nilai 0-3. Nilai 3 berarti dokumen tersebut sangat relevan. Nilai 1-2 berarti "berada di tengah-tengah". Dan nilai 0 berarti tidak relevan. Dimulai dari urutan teratas hingga terbawah, penilaian menghasilkan nilai 3, 2, 3, 0, 1, 2. Yang berarti dokumen 1 memiliki nilai 3, dokumen 2 nilai 2 dan seterusnya. Sehingga nilai DCG seperti yang ditampilkan di tabel Tabel 2.10 Penghitungan DCG
13 23 Sehingga nilai DCG6 adalah seperti berikut Nilai diatas jika dibandingkan dengan hasil pencarian lain, akan menghasilkan hasil yang berbeda karena ditiap pencarian bisa menghasilkan hasil yang lebih panjang atau lebih pendek. Karena itu hasil dari DCG harus dinormalisasikan menggunakan perhitungan Normalisasi DCG (ndcg). Nilai IDCG didapat dengan mengurutkan nilai kerelevanan dari DCG yang akan dinormalisasikan, karena nilai kerelevanan contoh sebelumnnya adalah 3, 2, 3, 0, 1, 2. Jika diurutkan akan menjadi 3,3,2,2,1,0. Sehingga nilai ideal DCG(iDCG) adalah Jadi nilai ndcg pencarian tersebut adalah 8.10/8.69 = Whitebox Testing Whitebox testing merupakan sebuah pengetesan yang dilakukan saat source code dimiliki untuk di test, source code itu sendiri biasanya tidak berikan oleh developer kepada user atau pihak lain karena source code tersebut merupakan rahasia developer. Testing whitebox dilakukan oleh developer dengan cara mengetest tiap line dalam code satu-persatu. Namun Hal ini akan memakan banyak waktu untuk mengetest masingmasing line, terutama jika line mencapai ribuan hingga puluhan ribu, sehingga developer terkadang harus membuat rencana testing yang mengetest kebanyakan source code secara metodis. Testing seperti inipun lebih condong ke pengujian logika karena dominannya analisis jalur logika bagaimana input yang dimasukkan di proses oleh perangkat lunak menjadi hasil-hasil yang akan diproses hingga menjadi hasil yang diinginkan. Salah satu metode whitebox yang digunakan adalah pengujian jalur/path dari logika sistem, atau disebut dengan Cyclomatic Complexity (Bray, 2007).
14 Pengujian Performa (Performance Testing) Testing performa merupakan testing yang dilakukan apabila perangkat lunak telah berjalan dengan benar.pengetesan ini dilakukan bukan untuk mengetes kebenaran dari sistem namun hasil dan waktu respon dari perangkat lunak.pengetesan performa dilakukan dengan menyiapkan peralatan test. Pengetestsan menguji aplikasi mulai dari saat ia tidak bekerja (idle) hingga kesaat sedang puncak sibuk bekerja. Pengujian performa ini berbeda dengan whitebox ataupun blackbox testing, apabila kecacatan ditemukan oleh testing whitebox atau blackbox maka akan dilakukan koreksi program, namun Pengujian performa akan lebih memeriksa aplikasi untuk kemampuannya terhadap hardware, dimana kecacacatan dalam test performa akan membuat developer menyarankan pembelian hardware yang lebih memadai untuk aplikasinya. 2.6 Tinjauan Studi Penelitian lain yang terkait yang pernah dilakukan mengenai pembuatan Sistem temu kembali antara lain: i. Implementasi Metode Term Frequency Inverse Document Frequency (TF-IDF) Pada Sistem Temu Kembali Informasi (Atika Zafikri, 2010) Pada penelitian ini, penulis merancang pembuatan sistem temu kembali informasi dengan menggunakan tf-idf sebagai metode perankingan dokumennya.metode tf yang digunakan oleh penulis merupakan tf murni.sistem yang dibangun menggunakan perangkat lunak Borland Delphi 7.0.Metodologi untuk membentuk sistem menggunakan pendekatan model air terjun. Tahapan yang penulis lakukan untuk melakukan proses pembentukan sistem tersebut meliputi tahapan analisis permasalahan, perancangan aplikasi yang melibatkan diagram alir data, algoritma dan flowchart beserta desain antar muka aplikasi, sehingga aplikasi yang terbentuk menjadi mudah dipergunakan dan memiliki fungsi yang optimal.
15 25 ii. Implementasi Teknik Peringkasan Semantic Virtual Dokumen Pada Pengelompokkan Hasil Pencarian Halaman Web (Rahmani Dwiastuti, 2012) Pada Jurnal Penelitian ini, penulis membuat sebuah sistem temu kembali yang memiliki fungsi peringkasan dokumen.dalam penelitian ini, teknik peringkasan dokumen yang digunakan ialahmetode Semantic Virtual Document (SVD) untuk melakukan peringkasan, teknik klasterisasi berbasis hirarki Single Linkage untuk melakukan pengelompokkan. Karena membuat sebuah sistem temu kembali informasi maka penulis melakukan uji coba terhadap beberapa metode perangkingan yang akan digunakan dalam aplikasinya, terdapat 4 Kandidat metode perankingan dalam penelitian tersebut yaitu tf-idf, Mutual Information (MI), BM25, dan LTU. Dari hasil penelitiannya BM25 merupakan salah satu metode pembobotan terbaik, yang memiliki nilai threshold yang cukup tinggi.
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Information Retrieval (IR) 2.1.1 Pengertian IR Beberapa ahli mendefinisikan Information Retrieval sebagai berikut: Manning(2007), mendefinisikan bahwa Information Retrieval adalah
BAB 2 LANDASAN TEORI
BAB LANASAN EORI. Kerangka eori.. Algoritma Lingo Sebelum masuk dalam pembahasan teori lebih dalam tentang algoritma Lingo, analisis akan dilakukan terhadap website yang menyediakan fasilitas search engine
BAB I PENDAHULUAN 1.1 Latar Belakang
1 BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan yang berada di universitas merupakan sumber referensi yang bagus untuk digunakan mahasiswa selama proses pembelajarannya, baik untuk referensi Tugas
BAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Sistem Temu Kembali Informasi Sistem temu kembali informasi (information retrieval system) digunakan untuk menemukan kembali (retrieve) informasi-informasi yang relevan terhadap
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Sumber informasi atau referensi sudah merupakan hal yang tidak asing lagi bagi seorang peneliti, terutamanya bagi para mahasiswa yang sedang melakukan penelitian untuk
KLASIFIKASI JURNAL BERBAHASA INGGRIS BERDASARKAN ABSTRAK DENGAN ALGORITMA ROCCHIO SKRIPSI MISBAH HASUGIAN
KLASIFIKASI JURNAL BERBAHASA INGGRIS BERDASARKAN ABSTRAK DENGAN ALGORITMA ROCCHIO SKRIPSI MISBAH HASUGIAN 121402017 PROGRAM STUDI S1 TEKNOLOGI INFORMASI FAKULTAS ILMU KOMPUTER DAN TEKNOLOGI INFORMASI UNIVERSITAS
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL
TUGAS AKHIR PERANCANGAN DAN IMPLEMENTASI SISTEM PENCARIAN BUKU RUANG BACA ILMU KOMPUTER UDAYANA BERBASIS WEB DENGAN METODE BM25 KOMPETENSI RPL MICHAEL SENNA SAPUTRA NIM. 1008605062 PROGRAM STUDI TEKNIK
Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25
54 Widiasri, M., dkk.: Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Jurnal Integrasi, vol. 6, no. 1, 2014, 21-25 ISSN: 2085-3858 (print version) Article History Received 10 February 2014 Accepted 11 March 2014 Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi
Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem emu Kembali Informasi Ari Wibowo Program Studi eknik Multimedia dan Jaringan, Politeknik Negeri Batam E-mail : [email protected] Abstrak
Pengujian Kerelevanan Sistem Temu Kembali Informasi
Pengujian Kerelevanan Sistem Temu Kembali Informasi Ari Wibowo / 23509063 Jurusan Teknik Informatika, Politeknik Negeri Batam Jl. Parkway No 1 Batam Center, Batam [email protected] Abstrak Sistem
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
PERSETUJUAI\ ARTIKEL ILMIAH. Mashar Eka Putra Dai. S1-Sistem Informasi. Teknik Informatika. Teknik. Penerapan Metode Document Frequency
PERSETUJUAI\ ARTIKEL ILMIAH Artikel ilmiah hasil penelitian mahasiswa: Nama NIM Mashar Eka Putra Dai 53 1409036 Program Studi S1-Sistem Informasi Jurusan Teknik Informatika Fakultas Teknik Judul Karya
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Sistem Temu Kembali Informasi Sistem Temu Kembali Informasi atau Information Retrieval (IR) adalah kegiatan untuk menemukan suatu material (dokumen) dari data yang tidak terstruktur
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan
BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Di era globalisasi seperti sekarang ini, perkembangan teknologi komputer berpengaruh besar pada tingkat kebutuhan manusia di berbagai bidang seperti bidang
BAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Algoritma Rabin-Karp Algoritma Rabin-Karp adalah suatu algoritma pencarian string yang diciptakan Michael O. Rabin dan Richard M. Karp pada tahun 1987 yang menggunakan fungsi
BAB I. Pendahuluan. 1. Latar Belakang Masalah
BAB I Pendahuluan 1. Latar Belakang Masalah Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan
BAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
BAB I PENDAHULUAN I-1
BAB I PENDAHULUAN 1.1 Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas merupakan sebuah bukti nyata bahwa informasi sangat diperlukan bagi pencari informasi [16]. Dengan munculnya
BAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
BAB 3 LANDASAN TEORI
BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih
SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF. Abstrak
SISTEM PENCARIAN PASAL-PASAL PADA KITAB UNDANG-UNDANG HUKUM PIDANA DENGAN MENGGUNAKAN METODE TF-IDF Muh. Alfarisi Ali¹, Moh. Hidayat Koniyo², Abd. Aziz Bouty³ ¹Mahasiswa Teknik Informatika Universitas
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
BAB I PENDAHULUAN. Dalam suatu basis data, pendekatan model data relasional masih banyak dimanfaatkan untuk penyimpanan data dan informasi terhadap
BAB I PENDAHULUAN 1. 1 Latar Belakang Sistem informasi merupakan serangkaian prosedur normal dimana data dikumpulkan, diproses menjadi sebuah informasi yang valid dan kemudian didistribusikan ke para pengguna
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks
Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita
6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional
BAB V EKSPERIMEN TEXT CLASSIFICATION
BAB V EKSPERIMEN TEXT CLASSIFICATION Pada bab ini akan dibahas eksperimen untuk membandingkan akurasi hasil text classification dengan menggunakan algoritma Naïve Bayes dan SVM dengan berbagai pendekatan
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bagi perusahaan yang bergerak dalam industri manufaktur, sistem informasi produksi yang efektif merupakan suatu keharusan dan tidak lepas dari persoalan persediaan
Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
BAB I PENDAHULUAN Latar Belakang Masalah
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun
PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA
PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA Ledy Agusta Fakultas Teknologi Informasi Universitas Kristen Satya Wacana [email protected]
JULIO ADISANTOSO - ILKOM IPB 1
KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Information Retrieval System Sistem temu kembali informasi ( information retrieval system) merupakan sistem yang dapat digunakan untuk menemukan informasi yang relevan dengan
DAFTAR ISI. SKRIPSI... ii
DAFTAR ISI SKRIPSI... i SKRIPSI... ii HALAMAN PENGESAHAN... ii PERNYATAAN... iii HALAMAN MOTO DAN PERSEMBAHAN... iv PRAKATA... v DAFTAR ISI... vii DAFTAR GAMBAR... x DAFTAR TABEL... xiii INTISARI... xiv
INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Pemanfaatan Aljabar Vektor Pada Mesin Pencari
Pemanfaatan Aljabar Vektor Pada Mesin Pencari Anwar Ramadha 13514013 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jl. Ganesha 10 Bandung 40132, Indonesia
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Tinjauan Penelitian Terdahulu Penelitian sebelumnya dilakukan oleh Rahmatulloh (2016). Penelitian yang berjudul Rancang Bangun Sistem Informasi Pencarian Benda Hilang Lost &
BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
1. Pendahuluan. 1.1 Latar belakang
1. Pendahuluan 1.1 Latar belakang Pada saat ini, kebutuhan setiap individu terhadap Internet semakin meningkat. Hal ini terlihat dari semakin banyaknya fasilitas yang ditawarkan dari dunia Internet itu
BAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama
PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL
Vol. 2, 2017 PENCARIAN FULL TEXT PADA KOLEKSI SKRIPSI FAKULTAS TEKNIK UHAMKA MENGGUNAKAN METODE VECTOR SPACEMODEL Miftahul Ari Kusuma 1*, Mia Kamayani 2, Arry Avorizano 3 Program Studi Teknik Informatika,
BAB III ANALISIS DAN PERANCANGAN SISTEM
BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Masalah Setiap tahunnya, DPP Infokom selaku panitia Pelatihan Aplikasi Teknologi dan Informasi (PATI) Universitas Muhammadiyah Malang menerima ribuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal
UKDW. 1.1 Latar Belakang BAB 1 PENDAHULUAN
BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi komputer yang pesat pada masa kini menjadi perhatian utama bagi manusia. Kemajuan teknologi komputer yang pesat ini menimbulkan bermacam-macam
PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Weblog, atau yang sering disebut sebagai Blog, merupakan bagian tak terpisahkan dalam perkembangan dunia teknologi informasi berbasis Web. Berbagai jenis informasi
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi komputer khususnya di jaringan Internet telah berkembang dengan sangat cepat. Semua orang dapat saling bertukar dan mendapatkan informasi
BAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada era ini perkembangan teknologi informasi sangat pesat. Hal ini ditandai dengan semakin populernya penggunaan internet dan perangkat lunak komputer sebagai
Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi
Pemanfaatan Metode Vector Space Model dan Metode Cosine Similarity pada Fitur Deteksi Hama dan Penyakit Tanaman Padi Ana Triana Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami
SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL
Sistem Informasi Pengelolaan Arsip Statis... SISTEM INFORMASI PENGELOLAAN ARSIP STATIS PADA BADAN ARSIP DAN PERPUSTAKAAN PROVINSI JAWA TENGAH MENGGUNAKAN VECTOR SPACE MODEL Silmi Kafatan, Djalal Er Riyanto,
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Berdasarkan data dari Kementerian Komunikasi dan Informasi Indonesia yang diperoleh dari Lembaga Riset Pasar E-Marketer, populasi pengguna internet tanah air pada tahun
STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER
STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER Dony Yudha Lestiyanto, A12.2009.03537 Sistem Informasi S1 Universitas Dian Nuswantoro Semarang 2014 Abstrak Stemming
BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI
IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik
PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI
18 PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI Karter D. Putung, Arie Lumenta, Agustinus Jacobus Teknik Informatika Universitas Sam Ratulangi Manado, Indonesia. [email protected],
Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine
Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,
APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL
APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Jurusan
BAB I PENDAHULUAN. internet yang kini menjadi peranan penting. Kebutuhan user yang semakin
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Teknologi Informasi telah mengalami perkembangan pesat khususnya internet yang kini menjadi peranan penting. Kebutuhan user yang semakin beragam dalam Teknologi
BAB I PENDAHULUAN. informasi yang berbeda-beda. Berita yang dipublikasi di internet dari hari ke hari
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang semakin maju dan maraknya penggunaan internet saat ini, tidak sedikit lembaga media mendistribusikan informasi berita secara online. Tidak
ABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document
Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani
BAB 1 PENDAHULUAN. 1.1 Latar Belakang Permasalahan
BAB 1 PENDAHULUAN 1.1 Latar Belakang Permasalahan Teknik Struktur Data dan Data Mining merupakan salah satu ilmu komputer yang penting dan menarik perhatian teori informatika. Saat ini teknik ini sudah
BAB 4 HASIL DAN BAHASAN. dengan melampirkan tabel data precision dan recall serta diagram-diagramnya Precision Recall Interpolasi
67 BAB 4 HASIL DAN BAHASAN 4.1 Hasil Penelitian dan Evaluasi 4.1.1 Hasil Penelitian Berikut disajikan beberapa data hasil query dari penelitian yang dilakukan dengan melampirkan tabel data precision dan
PENDAHULUAN. Latar belakang
Latar belakang PENDAHULUAN Indonesia merupakan negara megabiodiversity yang memiliki kekayaan tumbuhan obat. Indonesia memiliki lebih dari 38.000 spesies tanaman (Bappenas 2003). Sampai tahun 2001 Laboratorium
BAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan pesat dalam bidang teknologi informasi telah mempengaruhi berbagai bidang dalam kehidupan manusia, tidak terkecuali dalam bidang pendidikan. Perkembangan
Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System
Implementasi Metode Document Oriented Index Pruning pada Information Retrieval System Hendri Priyambowo 1, Yanuar Firdaus A.W. S.T, M.T 2, Siti Sa adah S.T. M.T 3 123 Program Studi S1 Teknik Informatika,
BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN
28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Salah satu faktor penting penunjang globalisasi ialah internet. Semakin majunya teknologi internet menyebabkan banyaknya pengembang perangkat lunak membuat berbagai
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Tahap Awal Tahap Analisis Merumuskan Masalah Studi Literatur Data Penelitian Tahap Perancangan Desain Sistem Implementasi TOPSIS 1. Matriks Keputusan
BAB I PENDAHULUAN. Dengan menggunakan kecerdasan buatan maka tidaklah mustahil akan ada mesin yang benar-benar mampu berpikir layaknya manusia.
BAB I PENDAHULUAN 1.1 Latar Belakang Informasi merupakan bagian penting yang tidak dapat dipisahkan dari kehidupan sehari-hari, sehingga manusia berupaya membuat alat bantu agar informasi yang disampaikan
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara
Latent Semantic Analysis dan. Similarity untuk Pencarian. oleh : Umi Sa adah
Metode Latent Semantic Analysis dan Algoritma Weighted Tree Similarity untuk Pencarian berbasis b Semantik oleh : Umi Sa adah 5109201030 Pembimbing : Prof. Drs.Ec. Ir. Riyanarto Sarno, M.Sc, Ph.D Umi Laili
BAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen
IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN
Seminar Nasional Informatika 205 IMPLEMENTASI VECTOR SPACE MODEL UNTUK MENINGKATKAN KUALITAS PADA SISTEM PENCARIAN BUKU PERPUSTAKAAN Dedi Leman, Khusaeri Andesa 2 Teknik Informasi, Magister Komputer, Universitas
1 BAB I PENDAHULUAN. 1.1 Latar Belakang
1 BAB I PENDAHULUAN 1.1 Latar Belakang Penerimaan siswa baru merupakan salah satu proses yang ada di instansi pendidikan seperti sekolah yang berguna untuk menyaring calon siswa yang terpilih sesuai kriteria
Jurnal String Vol.1 No.2 Tahun 2016 ISSN :
PERBANDINGAN ALGORITMA STEMMING PORTER DENGANARIFIN SETIONO UNTUK MENENTUKAN TINGKAT KETEPATAN KATA DASAR Dian Novitasari Program Studi Teknik Informatika, Universitas Indraprasta PGRI Emai : [email protected]
BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Information Retrieval (pencarian Informasi) adalah proses pemisahan dokumen-dokumen dari sekumpulan dokumen yang ada untuk memenuhi kebutuhan pengguna. Jumlah
PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)
PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir
BAB 1 PENDAHULUAN Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Kebutuhan informasi dan perkembangan teknologi yang semakin tinggi meningkatkan jumlah artikel atau berita yang terpublikasikan, terutama pada media online. Untuk
BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
BAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian menjelaskan bagaimana langkah-langkah atau tahapan-tahapan yang akan dilakukan dalam penelitian agar rumusan masalah penelitian dapat terselesaikan.
BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era
BAB I PENDAHULUAN 1.1 Latar Belakang Information retrieval atau disingkat dengan IR adalah menemukan bahan (dokumen) dari dokumen terstruktur (biasanya teks) yang memenuhi kebutuhan informasi pada ruang
BAB II LANDASAN TEORI. produk itu baik atau rusak ataupun untuk penentuan apakah suatu lot dapat diterima
BAB II LANDASAN TEORI 2.1 Inspeksi Menurut Kamus Besar Bahasa Indonesia (KBBI) dan hasil studi lapangan (wawancara) Inspeksi adalah suatu kegiatan penilaian terhadap suatu produk, apakah produk itu baik
Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information
Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information Ratnadira Widyasari 13514025 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi
Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
Bab 1 PENDAHULUAN 1.1 Latar Belakang Masalah Semakin hari semakin banyak inovasi, perkembangan, dan temuan-temuan yang terkait dengan bidang Teknologi Informasi dan Komputer. Hal ini menyebabkan semakin
