INDEXING. Tujuan 4/2/13. Budi Susanto (v1.01)
|
|
- Ratna Lesmana
- 7 tahun lalu
- Tontonan:
Transkripsi
1 Text dan Web Mining - Budi Susanto TI UKDW 1 INDEXING Budi Susanto (v1.01) Text dan Web Mining - Budi Susanto TI UKDW 2 Tujuan Memaham pengertian dari information retrieval Memahami pembentukan struktur inverted index Memahami tentang kebutuhan index terhadap adanya query frase Memahami kebutuhan index terhadap query wildcard 1
2 Text dan Web Mining - Budi Susanto TI UKDW 3 Buku Acuan Manning, C. D., Raghavan, P., Chutze, H. (2008). Introduction to Information Retrieval. Cammbridge University Press, New York, Chapter 1, 2, dan 3. Text dan Web Mining - Budi Susanto TI UKDW 4 Definisi IR Information Retrieval (IR) is finding material (usually documents) of an unstructured nature (usually text) that satisfies an information need from within large collections (usually stored on computers). - Manning (2008) IR dapat mencakup bentuk masalah data dan informasi selain disebutkan pada definisi di atas. Misalnya beberapa format dokumen memiliki suatu struktur header, body, dan footer. Sering disebut dengan semistructure data. 2
3 Text dan Web Mining - Budi Susanto TI UKDW 5 Contoh Masalah IR Terdapat sekumpulan dokumen berita dari berbagai macam kelompok berita. Kemudian ingin ditemukan dokumen berita apa saja yang berisi kata badai AND topan AND NOT tsunami. Solusi: Cara paling sederhana adalah melakukan pemindaian secara linier terhadap seluruh dokumen. Proses ini sering disebut sebagai grepping. Apa masalahnya? Text dan Web Mining - Budi Susanto TI UKDW 6 Contoh Masalah IR Dengan kemampuan komputer saat ini, ada kebutuhan yang lebih terhadap pencarian: mampu memproses kumpulan dokumen sangat besar secara cepat; memungkinkan operasi-operasi pencocokan yang fleksibel; Memungkinkan melakukan pemeringkatan terhadap hasil pencarian. Salah satu cara untuk menghindari pemindaian linier adalah membuat sebuah index terhadap seluruh dokumen. 3
4 Text dan Web Mining - Budi Susanto TI UKDW 7 Contoh incidence matrix Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser if play contains word, 0 otherwise Text dan Web Mining - Budi Susanto TI UKDW 8 Contoh pencarian Sehingga untuk menemukan dokumen terhadap query: Brutus AND Caesar AND NOT Calpurnia Dilakukan operasi boolean: AND AND =
5 Text dan Web Mining - Budi Susanto TI UKDW 9 Model Pencarian Klasik TASK Info Need Verbal form Query Misconception? Mistranslation? Misformulation? Get rid of mice in a politically correct way Info about removing mice without killing them How do I trap mice alive? mouse trap SEARCH ENGINE Query Refinement Results Corpus Text dan Web Mining - Budi Susanto TI UKDW 10 Terminologi Kebutuhan informasi Topik dimana ingin diketahui lebih oleh pemakai Query Sesuatu yang pemakai sampaikan kepada komputer dalam rangka mencoba untuk mengkomunikasikan kebutuhan informasi. Dokumen Relevan Dikatakan relevan ketika pemakai mempersepsikan bahwa dokumen tersebut mengandung informasi yang berkaitan dengan kebutuhan informasi mereka. 5
6 Text dan Web Mining - Budi Susanto TI UKDW 11 Dasar Evaluasi IR Untuk menilai efektifitas sebuah sistem IR (kualitas hasil pencarian), pada umumnya digunakan: Precision Berapa bagian dari hasil kembalian adalah relevan dengan kebutuhan informasi? Recall Berapa bagian dari dokumen relevan dalam koleksi yang dikembalikan oleh sistem? Text dan Web Mining - Budi Susanto TI UKDW 12 Dasar Inverted Index Daripada menyimpan secara biner (slide 6) untuk semua term (vocabulary kumpulan term), sebaiknya cukup disimpan dokumen apa saja yang mengandung masingmasing term. Brutus Caesar Calpurnia Dictionary Postings 6
7 Text dan Web Mining - Budi Susanto TI UKDW 13 Struktur Data untuk Dictionary Array. Contoh: char* Postings[50]; dimana Postings berupa struct atau class Text dan Web Mining - Budi Susanto TI UKDW 14 Struktur Data untuk Dictionary Hashtables Setiap term di-hash menjadi sebuah integer. Contoh fungsi hash: /* Peter Weinberger's */ int hashpjw(char *s) { char *p; unsigned int h, g; h = 0; for(p=s; *p!='\0'; p++){ h = (h<<4) + *p; if (g = h&0xf ) { h ^= g>>24; h ^= g; } } return h % 211; } 7
8 Text dan Web Mining - Budi Susanto TI UKDW 15 Struktur Data untuk Dictionary Binary Search Tree a-m Root n-z a-hu hy-m n-sh si-z aardvark! huygens! sickle! 15 zygot! Text dan Web Mining - Budi Susanto TI UKDW 16 Struktur Data untuk Dictionary B+ Tree a-hu hy-m n-z 8
9 Text dan Web Mining - Budi Susanto TI UKDW 17 Pembentukan Inverted Index Kompulan dokumen Tokenisasi Normalisasi Inverted index harus disimpan dalam struktur list yang dinamis. Indexer Inverted index Text dan Web Mining - Budi Susanto TI UKDW 18 Contoh Indexer Tokenisasi dan Normalisasi Doc 1 Doc 2 I did enact Julius Caesar I was killed i' the Capitol; Brutus killed me. So let it be with Caesar. The noble Brutus hath told you Caesar was ambitious 9
10 Text dan Web Mining - Budi Susanto TI UKDW 19 Contoh Indexer Sorting Diurutkan berdasar term Kemudian diurutkan berdasar docid Text dan Web Mining - Budi Susanto TI UKDW 20 Contoh Indexer Dictionary dan Postings Beberapa term sama dalam dokumen tunggal di gabungkan. Dipisahkan ke dalam Dictionary dan Postings. Informasi tambahan, seperti frekuensi kemunculan term, disimpan. 10
11 Text dan Web Mining - Budi Susanto TI UKDW 21 Contoh Query Dicari: Brutus AND Calpurnia Proses: 1. Temukan Brutus dalam dictionary. 2. Ambil postings yang terkait. 3. Temukan Calpurnia dalam dictionary. 4. Ambil postings yang terkait. 5. Lakukan operasi interseksi antara dua daftar postings. Interseksi adalah memilih item dari dua list yang sama. Text dan Web Mining - Budi Susanto TI UKDW 22 Algoritma Interseksi 11
12 Text dan Web Mining - Budi Susanto TI UKDW 23 Contoh Interseksi Text dan Web Mining - Budi Susanto TI UKDW 24 Latihan #1 1. Gambarkan inverted index untuk Doc 1 Doc 2 Doc 3 Doc 4 new home sales top forecasts home sales rise in july increase in home sales in july july new home sales rise 12
13 Text dan Web Mining - Budi Susanto TI UKDW 25 Latihan #2 Terdapat kumpulan dokumen berikut: Doc 1 breakthrough drug for schizophrenia Doc 2 new schizophrenia drug Doc 3 new approach for treatment of schizophrenia Doc 4 new hopes for schizophrenia patients 1. Gambarkan incidence matrix untuk kumpulan dokumen tersebut 2. Gambarkan inverted index untuk kumpulan dokumen tersebut. 3. Apa hasil kembalian untuk query berikut: a. schizophrenia AND drug b. for AND NOT(drug OR approach) Text dan Web Mining - Budi Susanto TI UKDW 26 Ingest Menurut Kowalski, G. (2010), proses awal dalam suatu sistem information retrieval disebut sebagai ingest. Ingest merupakan proses yang menerima item-item yang akan disimpan dan diindex dalam sistem dan melakukan preprocessing. Pull atau crawling. Tokenisasi Deteksi kemiripan dan atau duplikasi Stemming dan atau normalisasi lain Ekstraksi entitas (information extraction) Pemrosesan metadata 13
14 Text dan Web Mining - Budi Susanto TI UKDW 27 Query Frase Saat ini sistem IR harus juga mampu menerima query dalam bentuk frase. Contoh: Universitas Kristen Duta Wacana atau UKDW Yogyakarta Sehingga jika ada dokumen berisi Duta Wacana adalah satu-satunya universtas kristen terbaik di Yogyakarta tidak akan ditemukan. Frase dalam query biasanya ditulis dalam tanda petik ganda ( ). Dengan query frase, diperlukan struktur index yang sedikit berbeda. Text dan Web Mining - Budi Susanto TI UKDW 28 Biword Index Sebuah pengindex yang akan membangun dictionary berdasar setiap pasangan dua kata yang muncul dalam tiap dokumen. Contoh: universitas kristen duta wacana, Akan diindex membentuk dictionary: universitas kristen kristen duta duta wacana 14
15 Text dan Web Mining - Budi Susanto TI UKDW 29 Biword Index Sehingga penanganan query yang panjang, seperti: universitas duta wacana yogyakarta Akan dibagi menjadi: universitas duta AND duta wacana AND wacana yogyakarta Kelemahan: Bisa memberikan false positif. Tanpa melakukan pengujian terhadap seluruh dokumen, kita tidak dapat memverifikasi apakah query tersebut memang mewakili frase yang sebenarnya. Text dan Web Mining - Budi Susanto TI UKDW 30 Extended Biword Memparsing teks dan melakukan POST. Term-term akan dikenali sebagai Nouns (N) dan artikel/ preposisi (X). Dengan demikian, maka setiap string berpola NX*N merupakan bentukan dari dictionary. Contoh: universitas di yogyakarta Akan diparsing menjadi N X N, sehingga index yang dicari adalah: universitas yogyakarta 15
16 Text dan Web Mining - Budi Susanto TI UKDW 31 Positional Index Dalam postings, simpan posisi setiap term dimana term tersebut muncul: <term, number of docs containing term; doc1: posibon1, posibon2 ; doc2: posibon1, posibon2 ; etc.> Text dan Web Mining - Budi Susanto TI UKDW 32 Contoh Positional Index 16
17 Text dan Web Mining - Budi Susanto TI UKDW 33 Positional Intersect Algorithm Text dan Web Mining - Budi Susanto TI UKDW 34 Wildcard Queries Contoh wildcard query: yogya* : menemukan semua dokumen yang berisi sembarang kata berawalan yogya. Dengan B+Tree dapat cukup dilakukan dengan mencari semua node yang berada di bawah node yogya. yogya w < yogyb Bagaimana dengan query: *arta? Perlu dipelihara B+ tree tambahan yang menyimpan backward dari semua kata. Bagaimana dengan query: yo*arta? 17
18 Text dan Web Mining - Budi Susanto TI UKDW 35 Permuterm Index Menggunakan karakter khusus, misal $, untuk menandai akhir sebuah term. Contoh: ukdw akan tersimpan sebagai ukdw$. Dibangun sebuah permuterm index yang berisi berbagai bentuk rotasi tiap term. kdw$u, dw$uk, w$ukw Query wildcard X lookup on X$ X* lookup on $X* *X lookup on X$* *X* lookup on X* X*Y lookup on Y$X* Text dan Web Mining - Budi Susanto TI UKDW 36 K-gram index Menghasilkan enumerasi semua k-grams (deretan k- karakter) dari tiap kata yang muncul. Contoh enumerasi dari kalimat ukdw yogyakarta dengan 3-gram adalah: $uk, ukd, kdw, dw$, $yo, yog, ogy, gya, yak, aka, art, rta, ta$ Setiap postings akan berisi semua term yang berisi k- gram dari dictionary. $m mace madden mo on among along amortize among 18
19 Text dan Web Mining - Budi Susanto TI UKDW 37 k-gram index Semua query yang dikenakan terhadap k-gram index akan dilakukan proses enumerasi serupa dengan pembentukan index. Contoh: yo*arta akan diubah menjadi $yo AND art AND rta AND ta$ Text dan Web Mining - Budi Susanto TI UKDW 38 Spelling Correction Terdapat dua prinsip dasar : 1. Pilih salah satu yang paling mendekati dari query yang salah ejaan. Didasarkan pada dictionary index. 3. Ketika terdapat dua atau lebih kemunculan term yang benar, maka dipilih yang paling umum digunakan. Bentuk pembetulan ejaan Isolated-term Pembetulan terhadap masing-masing kata Context-sensitive Pembetulan berdasar kata-kata yang ada di sekitarnya. 19
20 Text dan Web Mining - Budi Susanto TI UKDW 39 Isolated-Term Menggunakan dasar lexicon dimana pembetulan ejaan berasal. Standar lexicon Misalnya Kamus bahasa Index lexicon Terdapat dua metode: Edit distance K-gram Text dan Web Mining - Budi Susanto TI UKDW 40 Edit Distance (Levenshtein distance) Diberikan dua buah string, S1 dan S2, pilih kata yang memiliki jumlah operasi konversi paling kecil. Jenis operasi yang dilakukan: Insert, delete, replace 20
21 Text dan Web Mining - Budi Susanto TI UKDW 41 Contoh u n v e r s i t a u n i v e r s i t a s Text dan Web Mining - Budi Susanto TI UKDW 42 Latihan j o g j a k a t a y o g y a k a r t a 21
22 Text dan Web Mining - Budi Susanto TI UKDW 43 K-gram Enumerasikan semua n-gram dalam string query sebagaimana terhadap lexicon. Gunakan index n-gram untuk mengambil semua lexicon yang cocok dengan n-gram query. Threshold dengan jumlah n-gram yang cocok. Text dan Web Mining - Budi Susanto TI UKDW 44 Contoh tri-gram Sebagai contoh term november nov, ove, vem, emb, mbe, ber. Query adalah december. dec, ece, cem, emb, mbe, ber. Terdapat 3 trigram yang overlap. Bagaimana caranya agar overlap tersebut dinormalisasikan menjadi sebuah nilai overlap? 22
23 Text dan Web Mining - Budi Susanto TI UKDW 45 Jaccard coefficient X dan Y adalah himpunan n-gram. Maka JC adalah Contoh: X Y / X Y JC untuk q=bord dan term=boardroom 2/(8+3-2) Text dan Web Mining - Budi Susanto TI UKDW 46 TERIMA KASIH Budi Susanto 23
Text dan Web Mining - Budi Susanto TI UKDW 1 INDEXING. Budi Susanto
Text dan Web Mining - Budi Susanto TI UKDW 1 INDEXING Budi Susanto Text dan Web Mining - Budi Susanto TI UKDW 2 Tujuan Memaham pengertian dari information retrieval Memahami pembentukan struktur inverted
Lebih terperinciSistem Temu Kembali Informasi/ Information Retrieval
Sistem Temu Kembali Informasi/ Information Retrieval Pemodelan IR Imam Cholissodin S.Si., M.Kom. Table Of Content 1. Boolean Retrieval Model Boolean Index Inverted Index 2. Boolean Query Retrieval 3. Vector
Lebih terperinciVECTOR SPACE MODEL. Tujuan 4/2/13. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model index berdasar pada bobot untuk binary retrieval model Memahami
Lebih terperinciText & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 VECTOR SPACE MODEL Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Parametric dan zone Index Sebuah dokumen, selain tersusun dari deretan term, juga
Lebih terperinciTemu-Kembali Informasi 2017
Temu-Kembali Informasi 2017 02: Temu-Kembali Boolean Husni Husni@Trunojoyo.ac.id Modifikasi dari slide kuliah Stanford CS276 Temu-Kembali Informasi Information Retrieval Information Retrieval (IR) adalah
Lebih terperinciSTBI Sistem Temu Balik Informasi Temu-Balik Boolean. Husni. Husni.trunojoyo.ac.id Komputasi.wordpress.
STBI-2011 Sistem Temu Balik Informasi 2011 Temu-Balik Boolean Husni husni@if.trunojoyo.ac.id Husni.trunojoyo.ac.id Komputasi.wordpress.com Pemrolehan-Kembali Informasi Information Retrieval (IR) Pencarian
Lebih terperinciTemu-Kembali Informasi
Temu-Kembali Informasi 2017 Pertemuan ke-1 Pengantar Perkuliahan Husni Husni@trunojoyo.ac.id Tentang Saya Husni Web site : Husni.trunojoyo.ac.id Email : husni@trunojoyo.ac.id Ruang kerja: Lab. SisTer,
Lebih terperinciSistem Temu-Kembali Informasi Temu-Kembali Boolean
Sistem Temu-Kembali Informasi Temu-Kembali Boolean Husni Program Studi Teknik Informatika Universitas Trunojoyo Madura Semeter Gasal 2015-17 Sep. 2015 Boolean Retrieval: Outline Matriks dokumen-term Kebutuhan
Lebih terperinciDocument Indexing dan Term Weighting. M. Ali Fauzi
Document Indexing dan Term Weighting M. Ali Fauzi Document Indexing Setelah melakukan preprocessing, kita akan mendapatkan sebuah set term yang bisa kita jadikan sebagai indeks. Indeks adalah perwakilan
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 4 TOLERANCE RETRIEVAL Tugas Extended Boolean Pelajari Extended Boolean Mengapa dikembangkan model ini? Bagaimana prinsip dasar model ini? Bagaimana
Lebih terperinciINDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX
INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id
Lebih terperinciText dan Web Mining - Budi Susanto 1 EVALUASI IR. Budi Susanto
Text dan Web Mining - Budi Susanto 1 EVALUASI IR Budi Susanto Text dan Web Mining - Budi Susanto 2 Tujuan mahasiswa memahami tentang bagaimana mengukur dan mengartikan precision dan recall terhadap sistem
Lebih terperinciEVALUASI IR. Tujuan 4/16/13. Budi Susanto
Text dan Web Mining - Budi Susanto 1 EVALUASI IR Budi Susanto Text dan Web Mining - Budi Susanto 2 Tujuan mahasiswa memahami tentang bagaimana mengukur dan mengartikan precision dan recall terhadap sistem
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Identifikasi Masalah Merumuskan Masalah Study Literatur Perancangan Struktur Menu Interface Analisa
Lebih terperinciInformation Retrieval
Information Retrieval Budi Susanto Information Retrieval Information items content Feature extraction Structured Structured Document Document representation representation Retrieval model: relevance Similarity?
Lebih terperinciSistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN
Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciIMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
IMPLEMENTASI INVERTED INDEX DENGAN SISTEM MANAJEMEN BASISDATA UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma
Lebih terperinciTemu-Kembali Informasi 2017
Temu-Kembali Informasi 2017 07: Penskoran, Pembobotan Term & Model Ruang Vektor Husni Husni@Trunojoyo.ac.id Modifikasi dari slide kuliah Stanford CS276 Rekap Kuliah Sebelumnya Statistika koleksi dan kosa
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Information Retrieval Perkembangan teknologi internet yang sangat pesat membuat pengguna harus dapat menyaring informasi yang dibutuhkannya. Information retrieval atau sistem
Lebih terperinciIMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN
IMPLEMENTASI INVERTED INDEX DENGAN SISTEM ORDBMS MENGGUNAKAN COLLECTION UNTUK MENDUKUNG MODEL PEMEROLEHAN BOOLEAN JB Budi Darmawan Jurusan Teknik Informatika, Fakultas Sains dan Teknologi, Universitas
Lebih terperinciPenerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi
Penerapan Model OKAPI BM25 Pada Sistem Temu Kembali Informasi Rizqa Raaiqa Bintana 1, Surya Agustian 2 1,2 Teknik Informatika, FST UIN Suska Riau Jl. HR Soeberantas km 11,5 Panam, Pekanbaru, Riau e-mail:
Lebih terperinciTEMU KEMBALI INFORMASI
JULIO ADISANTOSO Departemen Ilmu Komputer IPB Pertemuan 1 Identitas Mata Kuliah Nama Mata Kuliah : Temu Kembali Informasi (TKI) Information Retrieval (IR) Kode Mata Kuliah : KOM431 Koordinator : Julio
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah
Lebih terperinciPENDAHULUAN. Latar belakang
Latar belakang PEDAHULUA Kata kunci atau yang biasa disebut dengan query pada pencarian informasi dari sebuah search engine digunakan sebagai kriteria pencarian yang tepat dan sesuai dengan kebutuhan.
Lebih terperinciPEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS
PEMEROLEHAN INFORMASI MENGGUNAKAN INVERTED INDEX DENGAN STRUKTUR DATA KLASIK VS ORDBMS J.B. Budi Darmawan Dosen Program Studi Teknik Informatika, Fakultas Sains dan Teknologi, Universitas Sanata Dharma
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard
Lebih terperinciTugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System
Tugas Makalah Sistem Temu Kembali Informasi (STKI) TI029306 Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System Oleh : I PUTU ANDREAS WARANU 1204505042 Dosen : I Putu Agus
Lebih terperinciUNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI
UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester
Lebih terperinciText Pre-Processing. M. Ali Fauzi
Text Pre-Processing M. Ali Fauzi Latar Belakang Latar Belakang Dokumen-dokumen yang ada kebanyakan tidak memiliki struktur yang pasti sehingga informasi di dalamnya tidak bisa diekstrak secara langsung.
Lebih terperinciRANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan
RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan Prodi Teknik Informatika, Fakultas Sains dan Teknik, Universitas Jenderal
Lebih terperinciKLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR
KLASIFIKASI TEKS SURAT KABAR DENGAN MENGGUNAKAN ALGORITMA N-GRAM STEMMERS TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1 Teknik Informatika Universitas Muhammadiyah Malang Oleh: KHOZINATUL
Lebih terperinciBAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]
BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi
Lebih terperinciSistem Temu-Kembali Informasi Pengantar Perkuliahan
Sistem Temu-Kembali Informasi Pengantar Perkuliahan Husni Program Studi Teknik Informatika Universitas Trunojoyo Madura Semeter Gasal 2015-03 Sep. 2015 Perkenalan... Husni (UGM, ITB) Bidang Minat Sistem
Lebih terperinciBAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Pada zaman seperti sekarang ini, jurnal atau berita elektronik merupakan suatu bentuk hasil karya dari seseorang yang sudah familiar. Di dalam karyakarya tersebut
Lebih terperinciBudi Susanto Versi /08/2012. Teknik Informatika UKDW Yogyakarta
Budi Susanto Versi 1.0 29/08/2012 1 Memahami pengertian dari text mining dan web mining Memahami latar belakang perlunya pengolahan dokumen teks dan web Memahami arsitektur dasar aplikasi text dan web
Lebih terperinciPEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN
PEMANFAATAN ASSOCIATION RULE MINING DALAM MEMBANTU PENCARIAN DOKUMEN-DOKUMEN BERITA YANG SALING BERKAITAN Hermawan Andika Institut Informatika Indonesia andika@iii.ac.id Suhatati Tjandra Sekolah Tinggi
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Sentimen Analisis Analisis sentimen juga dapat dikatakan sebagai opinion mining. Analisis sentimen dapat digunakan dalam berbagai kemungkian domain, dari produk konsumen, jasa
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa
Lebih terperinciText dan Web Mining. Budi Susanto Teknik Informatika UKDW Yogyakarta
Text dan Web Mining Budi Susanto Teknik Informatika UKDW Yogyakarta Deskripsi Matakuliah ini secara prinsip menekankan tentang teknik-teknik yang perlu diketahui mahasiswa dalam mengelola kumpulan dokumen
Lebih terperinciKONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431
KONTRAK PERKULIAHAN TEMU KEMBALI INFORMASI KOM431 KOORDINATOR MATA AJARAN TEMU KEMBALI INFORMASI DEPARTEMEN ILMU KOMPUTER INSTITUT PERTANIAN BOGOR TAHUN 2011/2012 KONTRAK PERKULIAHAN Nama Matakuliah :
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Sistem Rekomendasi Sistem rekomendasi adalah sebuah sistem yang dibangun untuk mengusulkan informasi dan menyediakan fasilitas yang diinginkan pengguna dalam membuat suatu keputusan
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision
Lebih terperinciBAB I PENDAHULUAN Latar Belakang Masalah
BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses atau bagaimana mencari informasi, namun
Lebih terperinciBAB 1 PENDAHULUAN UKDW
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan ilmu pengetahuan yang pesat dewasa ini telah mendorong permintaan akan kebutuhan informasi ilmu pengetahuan itu sendiri. Cara pemenuhan kebutuhan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart
Lebih terperinciBAB IV ANALISA DAN PERANCANGAN
BAB IV ANALISA DAN PERANCANGAN Bab ini akan membahas tentang analisa dan perancangan aplikasi source detection pada kasus plagiarisme dokumen menggunakan biword winnowing dan retrieval berbasis Okapi BM25.
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Lebih terperinciText Mining. Budi Susanto. Text dan Web Mining. Teknik Informatika UKDW Yogyakarta
Text Mining Budi Susanto Materi Pengertian Text Mining Pemrosesan Text Tokenisasi Lemmatization Vector Document Pengertian Text Mining Text mining merupakan penerapan konsep dan teknik data mining untuk
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Kemajuan teknologi informasi dan komunikasi tidak hanya membawa dampak positif, tetapi juga membawa dampak negatif, salah satunya adalah tindakan plagiarisme (Kharisman,
Lebih terperinciSearch Engines. Information Retrieval in Practice
Search Engines Information Retrieval in Practice All slides Addison Wesley, 2008 Search Engine Architecture Arsitektur dari mesin pencari ditentukan oleh 2 persyaratan efektivitas (kualitas hasil) efisiensi
Lebih terperinciText & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.
Lebih terperinciIMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI
IMPLEMENTASI VECTOR SPACE MODEL DAN BEBERAPA NOTASI METODE TERM FREQUENCY INVERSE DOCUMENT FREQUENCY (TF-IDF) PADA SISTEM TEMU KEMBALI INFORMASI Oka Karmayasa dan Ida Bagus Mahendra Program Studi Teknik
Lebih terperinciBAB III ANALISIS DAN PERANCANGAN
BAB III ANALISIS DAN PERANCANGAN Dalam bab ini akan dijabarkan analisa, yang meliputi analisa masalah dan gambaran umum masalah yang sedang dibahas, perancangan sistem serta desain antarmuka (user interface)
Lebih terperinciBernadus Very Christioko Fakultas Teknologi Informasi dan Komunikasi, Universitas Semarang. Abstract
IMPLEMENTASI SISTEM TEMU KEMBALI INFORMASI Studi Kasus: Dokumen Teks Berbahasa Indonesia (IMPLEMENTATION OF INFORMATION RETRIEVAL SYSTEM Case Study: Text Document in Indonesian Language) Bernadus Very
Lebih terperinciABSTRAK. Kata kunci : Pemerolehan Informasi, TF-IDF, Inverted Index, document to document
Jurnal Ilmiah Widya Teknik Volume 15 Nomor 2 2016 ISSN 1412-7350 SISTEM PEMEROLEHAN INFORMASI UNDANG-UNDANG DAN KASUS MENGGUNAKAN STRUKTUR DATA INVERTED INDEX DENGAN PEMBOBOTAN TF-IDF Fredes Winda Oktaviani
Lebih terperinci1. Pendahuluan. 1.1 Latar belakang
1. Pendahuluan 1.1 Latar belakang Pada saat ini, kebutuhan setiap individu terhadap Internet semakin meningkat. Hal ini terlihat dari semakin banyaknya fasilitas yang ditawarkan dari dunia Internet itu
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Bagi perusahaan yang bergerak dalam industri manufaktur, sistem informasi produksi yang efektif merupakan suatu keharusan dan tidak lepas dari persoalan persediaan
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Komputer adalah sebuah alat yang dipakai untuk mengolah informasi menurut prosedur yang telah dirumuskan (Wikipedia, 2007: Komputer). Komputer berkembang mulai
Lebih terperinciKOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN
KOREKSI EJAAN QUERY BAHASA INDONESIA MENGGUNAKAN ALGORITME DAMERAU LEVENSHTEIN Utis Sutisna 1), Julio Adisantoso 2) 1,2 Departemen Ilmu Komputer, Institut Pertanian Bogor Kampus Darmaga, Wing 20 Level
Lebih terperinciSISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera.
SISTEM PENGKOREKSIAN KATA KUNCI DENGAN MENGGUNAKAN METODE LEVENSHTEIN DISTANCE Studi Kasus Pada Website Universitas Halmahera Oleh : Benisius Sejumlah penelitian terhadap mesin pencari (search engine)
Lebih terperinciPERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY
Vol. 4, No. 2 Desember 2014 ISSN 2088-2130 PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY Andry Kurniawan, Firdaus Solihin, Fika Hastarita Prodi Teknik
Lebih terperinciTeknik Informatika UKDW Yogyakarta
Budi Susanto Versi 1.1 15/01/2013 1 Memahami pengertian dari text mining dan web mining Memahami latar belakang perlunya pengolahan dokumen teks dan web Memahami arsitektur dasar aplikasi text dan web
Lebih terperinciRETRIEVAL STRATEGIES. Tujuan 4/9/13. Budi Susanto
Text & Web Mining - Budi Susanto - TI UKDW 1 RETRIEVAL STRATEGIES Budi Susanto Text & Web Mining - Budi Susanto - TI UKDW 2 Tujuan Memahami model probabilitistic retrieval dengan metode Simple Term Weights.
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Lebih terperinciAPLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE
APLIKASI WEB PENGUJIAN KESERUPAAN XML DENGAN METODA EDIT DISTANCE 1 Heni Novianti 2 Lintang Yuniar Banowosari. 1,2 Universitas Gunadarma Jl. Margonda Raya No. 100 Pondok Cina Depok Indonesia cowzy_heni@yahoo.com,
Lebih terperinciSistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)
Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,
Lebih terperinciStruktur Data adalah : suatu koleksi atau kelompok data yang dapat dikarakteristikan oleh organisasi serta operasi yang didefinisikan terhadapnya.
Pertemuan 1 STRUKTUR DATA Struktur Data adalah : suatu koleksi atau kelompok data yang dapat dikarakteristikan oleh organisasi serta operasi yang didefinisikan terhadapnya. Pemakaian Struktur Data yang
Lebih terperinciJurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 6, Juni 2017, hlm. 498-506 http://j-ptiik.ub.ac.id Deteksi Kesalahan Ejaan dan Penentuan Rekomendasi Koreksi Kata
Lebih terperinciJURNAL INFORMATIKA IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL
IMPLEMENTASI METODE GENERALIZED VECTOR SPACE MODEL PADA APLIKASI INFORMATION RETRIEVAL Jasman Pardede [1], Mira Musrini Barmawi [2], Wildan Denny Pramono [3] Jurusan Teknik Informatika Institut Teknologi
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka
Lebih terperinciStruktur Data adalah : suatu koleksi atau kelompok data yang dapat dikarakteristikan oleh organisasi serta operasi yang didefinisikan terhadapnya.
Pertemuan 1 STRUKTUR DATA Struktur Data adalah : suatu koleksi atau kelompok data yang dapat dikarakteristikan oleh organisasi serta operasi yang didefinisikan terhadapnya. Pemakaian Struktur Data yang
Lebih terperinciSistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient
Jurnal Transistor Elektro dan Informatika (TRANSISTOR EI) Vol. 2, No. 1 1 Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient Muhammad Fadelillah, Imam Much Ibnu Subroto,
Lebih terperinciBAB I PENDAHULUAN. Information retrieval (IR) adalah ilmu yang mempelajari pencarian
BAB I PENDAHULUAN 1.1 Latar Belakang Information retrieval (IR) adalah ilmu yang mempelajari pencarian dokumen untuk memenuhi kebutuhan informasi dari dalam koleksi besar media penyimpanan komputer (Manning,
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Pengertian Plagiarisme Kata plagiarisme berasal dari kata Latin plagiarius yang berarti merampok, membajak. Plagiarisme merupakan tindakan pencurian atau kebohongan intelektual.
Lebih terperinciRata-rata token unik tiap dokumen
Percobaan Tujuan percobaan ini adalah untuk mengetahui kinerja algoritme pengoreksian ejaan Damerau Levenshtein. Akan dilihat apakah algoritme tersebut dapat memberikan usulan kata yang cukup baik untuk
Lebih terperinciINFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER
INFORMATION RETRIEVAL SSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER Muhammad asirzain 1), Suswati 2) 1,2 Teknik Informatika, Fakultas Teknik,
Lebih terperinciPENGKOREKSIAN DAN SUGGESTION WORD PADA KEYWORD MENGGUNAKAN ALGORITMA JARO WINKLER
Artikel ini telah dipresentasikan dalam Innovative and Creative Information Technology Conference (ICITech) Pengkoreksian dan suggestion word (Kristien Margi S, Agus T.) dengan tema E-Transaction and Power
Lebih terperinci1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah
1. Pendahuluan 1.1 Latar belakang Informasi telah menjadi kebutuhan primer pada kehidupan saat ini. Informasi seakan-akan menjadi mata uang baru yang membuat akurasi menjadi sangat penting ketika mencari
Lebih terperinciStruktur Data adalah : suatu koleksi atau kelompok data yang dapat dikarakteristikan oleh organisasi serta operasi yang didefinisikan terhadapnya.
Pertemuan 1 STRUKTUR DATA Struktur Data adalah : suatu koleksi atau kelompok data yang dapat dikarakteristikan oleh organisasi serta operasi yang didefinisikan terhadapnya. Pemakaian Struktur Data yang
Lebih terperinciROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Lebih terperinciMAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA
MAXIMUM MARGINAL RELEVANCE UNTUK PERINGKASAN TEKS OTOMATIS SINOPSIS BUKU BERBAHASA INDONESIA Aida Indriani ) ) Teknik Informatika STMIK PPKIA Tarakanita Rahmawati Tarakan Jl Yos Sudarso 8, Tarakan 77 Email
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Information Retrieval (pencarian Informasi) adalah proses pemisahan dokumen-dokumen dari sekumpulan dokumen yang ada untuk memenuhi kebutuhan pengguna. Jumlah
Lebih terperinciJurnal Politeknik Caltex Riau
1 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id IMPLEMENTASI TEXT MINING DALAM KLASIFIKASI JUDUL BUKU PERPUSTAKAAN MENGGUNAKAN METODE NAIVE BAYES Siti Amelia Apriyanti 1), Kartina Diah Kesuma Wardhani
Lebih terperinciIMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI
IMPLEMENTASI ALGORITMA RABIN-KARP MENGGUNAKAN STEMMING NAZIEF DAN ADRIANI UNTUK MENDETEKSI TINGKAT KEMIRIPAN FILE TEKS YANG BERBENTUK SKRIPSI SKRIPSI WINDI ARINDA 091401061 PROGRAM STUDI S1 ILMU KOMPUTER
Lebih terperinciStudi Penggunaan Data Exif Untuk Mengukur Pengaruhnya. Terhadap Peningkatan Kinerja Image Search Engine
Studi Penggunaan Data Exif Untuk Mengukur Pengaruhnya Terhadap Peningkatan Kinerja Image Search Engine Nugroho Herucahyono (13504038) Program Studi Teknik Informatika Sekolah Teknik Elektro dan Informatika,
Lebih terperinciImplementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information
Implementasi Aljabar Vektor pada Sistem Temu Kembali Informasi untuk Customer Information Ratnadira Widyasari 13514025 Program Studi Informatika Sekolah Teknik Elektro dan Informatika Institut Teknologi
Lebih terperinciBAB I PERSYARATAN PRODUK
BAB I PERSYARATAN PRODUK 1.1 PENDAHULUAN Pada saat kita melakukan pencarian melalui search engine (google.com, yahoo, dsb), kita bisa mendapatkan beberapa hasil, yang berupa dokumen - dokumen yang sama
Lebih terperinciPENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA.
PENYUSUNAN STRONG S CONCORDANCE UNTUK ALKITAB PERJANJIAN BARU BAHASA INDONESIA Gunawan 1, Devi Dwi Purwanto, Herman Budianto, dan Indra Maryati 1 Jurusan Teknik Elektro, Fakultas Teknologi Industri, Institut
Lebih terperinciIdentifikasi Kesalahan Penulisan Kata (Typographical Error) pada Dokumen Berbahasa Indonesia Menggunakan Metode N-gram dan Levenshtein Distance
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No., Januari 208, hlm. 53-62 http://j-ptiik.ub.ac.id Identifikasi Kesalahan Penulisan Kata (Typographical Error) pada
Lebih terperinciPENGERTIAN VARIABEL, KONSTANTA DAN TIPE DATA
PENGERTIAN VARIABEL, KONSTANTA DAN TIPE DATA Haida Dafitri, ST, M.Kom Ta. 2016 2017 T. Informatika STT Harapan Medan TUJUAN PEMBELAJARAN Setelah menyelesaikan bab ini, anda diharapkan : Mengenal dan Mengetahui
Lebih terperinciEkspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis Konteks Lokal
Tersedia secara online di: http://journal.ipb.ac.id/index.php.jika Volume 1 Nomor 1 halaman 22-29 ISSN: 2089-6026 Ekspansi Kueri pada Sistem Temu Kembali Informasi Berbahasa Indonesia Menggunakan Analisis
Lebih terperinciBAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN
28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi
Lebih terperinciBAB I PENDAHULUAN 1.1 LATAR BELAKANG
BAB I PENDAHULUAN Pada bab ini akan dibahas latar belakang penelitian, perumusan masalah, tujuan penelitian, manfaat penelitian dan batasan masalah. 1.1 LATAR BELAKANG Perkembangan penggunaan informasi
Lebih terperinciBAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad
1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan komputer di dalam lingkungan kehidupan masyarakat di seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad terakhir ini. Hal
Lebih terperinciSISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ
SISTEM PENCARIAN SKRIPSI BERBASIS INFORMATION RETRIEVAL DI FASTIKOM UNSIQ Nur Hasanah a a Fakultas Teknik dan Ilmu Komputer Universtas Sains Al Qur an a E-mail: nurh.unsiq@gmail.com INFO ARTIKEL Riwayat
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Bahasa Inggris merupakan salah satu bahasa yang sering digunakan baik pada percakapan sehari-hari maupun pada dunia akademik. Penelitian mengenai pemeriksaan
Lebih terperinci