BAB III METODOLOGI PENELITIAN

dokumen-dokumen yang mirip
BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

1. Pendahuluan. 1.1 Latar belakang

SISTEM PENCARIAN AYAT AL-QUR AN BERDASARKAN TERJEMAHAN BAHASA INDONESIA DENGAN PEMODELAN RUANG VEKTOR TUGAS AKHIR

BAB 1 PENDAHULUAN UKDW

BAB I PERSYARATAN PRODUK

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN Latar Belakang

INFORMATION RETRIEVAL SYSTEM PADA PENCARIAN FILE DOKUMEN BERBASIS TEKS DENGAN METODE VECTOR SPACE MODEL DAN ALGORITMA ECS STEMMER

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Sistem Rekomendasi Hasil Pencarian Artikel Menggunakan Metode Jaccard s Coefficient

ABSTRAK. Kata kunci : Information Retrieval system, Generalized Vector Space Model. Universitas Kristen Maranatha

BAB 3 LANDASAN TEORI

1. Pendahuluan 1.1 Latar belakang 1.2 Perumusan masalah

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB IV ANALISA DAN PERANCANGAN

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB I. Pendahuluan. 1. Latar Belakang Masalah

APLIKASI MESIN PENCARI DOKUMEN CROSS LANGUAGE BAHASA INGGRIS BAHASA INDONESIA MENGGUNAKAN VECTOR SPACE MODEL

UKDW BAB 1 PENDAHULUAN Latar Belakang Masalah

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

BAB I PENDAHULUAN Latar Belakang Masalah

beberapa tag-tag lain yang lebih spesifik di dalamnya.

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III METODOLOGI PENELITIAN

UKDW BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

BAB III METODOLOGI PENELITIAN

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

BAB III METODOLOGI PENELITIAN. Metode pengumpulan data yang digunakan pada penelitian ini berupa studi

HASIL DAN PEMBAHASAN. diformulasikan digunakan dalam proses temu kembali selanjutnya.

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

1.5 Metode Penelitian

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. tersebut dibuktikan dengan semakin canggihnya perangkat keras seperti prosesor,

STEMMING DOKUMEN TEKS BAHASA INDONESIA MENGGUNAKAN ALGORITMA PORTER ABSTRAK

BAB 1 PENDAHULUAN. 1.1.Latar Belakang

BAB I PENDAHULUAN I-1

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

PENERAPAN SISTEM TEMU KEMBALI INFORMASI PADA KUMPULAN DOKUMEN SKRIPSI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III METODE PENELITIAN. a. Menentukan kebutuhan data yang dibutuhkan. b. Mengumpulkan semua data yang dibutuhkan.

BAB 1 PENDAHULUAN. bahasanya, digunakannya berbagai macam huruf dengan kepentingannya masing-masing

1. PENDAHULUAN 1.1 Latar belakang Masalah

RANCANG BANGUN SISTEM TEMU KEMBALI INFORMASI ABSTRAK TUGAS AKHIR MAHASISWA PRODI TEKNIK INFORMATIKA UNSOED Oleh : Lasmedi Afuan

BAB III ANALISIS DAN PERANCANGAN

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB III METODELOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

FRAMEWORK PHP BERBASIS KOMPONEN UNTUK MEMBUAT FORMULIR DAN LAPORAN SECARA OTOMATIS ABSTRAK

BAB I PENDAHULUAN. 1.1 Latar Belakang

Indexing dan Bahasa Penelusuran

Tugas Makalah. Sistem Temu Kembali Informasi (STKI) TI Implementasi Metode Generalized Vector Space Model Pada Information Retrieval System

BAB 1 PENDAHULUAN Pengantar

PERANCANGAN DAN PEMBUATAN APLIKASI PENCARIAN INFORMASI BEASISWA DENGAN MENGGUNAKAN COSINE SIMILARITY

BAB IV IMPLEMENTASI SISTEM

BAB III METODE PENELITIAN. Tahapan penelitian yang akan dilakukan adalah sebagai berikut: keputusan tingkat kesehatan.

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. seluruh dunia menjadi sebuah fenomena yang sangat mengejutkan dalam satu abad

BAB III METODOLOGI PENELITIAN

Information Retrieval

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

Search Engines. Information Retrieval in Practice

Inera Firdestawati¹, Yanuar Firdaus A.w.², Kiki Maulana³. ¹Teknik Informatika, Fakultas Teknik Informatika, Universitas Telkom

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. dan rahasia telah menjadi suatu hal yang sangat berharga. Data atau informasi

BAB I PENDAHULUAN. bagaimana membuat mesin (komputer) dapat melakukan pekerjaan seperti dan

BAB 4 IMPLEMENTASI DAN EVALUASI

BAB III ANALISIS DAN PERANCANGAN

HASIL DAN PEMBAHASAN. Tabel 1 Perhitungan recall-precision. ) adalah peluang kata i dalam dokumen setelah q j. p( i q j

BAB III METODE PENELITIAN. Berikut adalah tahapan penelitian yang dilakukan : Menentukan kebutuhan data yang digunakan, seperti data makanan, data

BAB 1 PENDAHULUAN. Bahasa Jepang menggunakan berbagai jenis karakter untuk sistem

BAB V IMPLEMENTASI PERANGKAT LUNAK. Aplikasi setelah dianalisa dan dirancang, maka aplikasi tersebut siap

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

BAB II LANDASDAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1. PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI. karya rekam secara profesional dengan sistem yang baku guna memenuhi

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. pendidikan, perbankan, perencanaan dan sebagainya. Dengan adanya teknologi komputer

Analisis dan Pengujian Kinerja Korelasi Dokumen Pada Sistem Temu Kembali Informasi

UKDW. Bab 1 PENDAHULUAN

Transkripsi:

BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah sebagai berikut: Gambar 3.1 flowchart Penyusunan Tugas Akhir 3.1 Identifikasi Masalah Pada tahapan ini dilakukan identifikasi permasalahan mengenai pentingnya bagi user untuk memperoleh dokumen ayat Al-Qur an dan terjemahan yang relevan sesuai dengan kebutuhannya dan masukan query dari sekumpulan informasi (dokumen).

3.2 Perumusan Masalah Dari tahapan identifikasi masalah, didapatkan rumusan masalah tentang bagaimana proses membangun aplikasi pencarian ayat Al-Qur an berdasarkan terjemahan bahasa Inggris dengan konsep Information Retrieval dengan Porter Stemmer Enhancement menggunakan model ruang vektor. 3.3 Studi Literatur Studi literatur dilakukan dengan mempelajari konsep-konsep yang berkaitan dengan penelitian ini, seperti sistem temu balik informasi, model ruang vektor, tahapan text operations/preprocessing seperti penghapusan markup, penghapusan stopwords, stemming, query operations, dan weighting melalui literatur-literatur seperti buku, jurnal, dan sumber ilmiah lain seperti situs internet ataupun artikel dokumen teks yang berhubungan. 3.4 Analisa Sistem Pada tahapan ini, ditentukan analisa masukan ( input) untuk membangun sistem, analisa proses pada sistem, serta tahapan pembangunan information retrieval system sebelum diterapkan Model Ruang Vektor dalam pengukuran kesamaan ( similarity measure). Secara garis besar tahapan pembangunan sistem pencarian ayat Al-Qur an dalam tugas akhir ini adalah: 1. Text Operation Pertama, mengumpulkan dokumen yang akan diindeks (korpus). Koleksi dokumen (korpus) yang digunakan dalam membangun sistem adalah korpus terjemahan Al-Qur an dalam bahasa Inggris dan korpus gambar (tulisan arab) ayat Al-Qur an berformat *.png. Dari dua koleksi dokumen tadi dilakukan proses untuk penyusunan kembali korpus untuk membentuk sebuah korpus baru berisi kumpulan subtopik Al-Qur an. Satu dokumen subtopik mewakili dari beberapa ayat Al-Qur an. Pembagian subtopik merujuk dari subtopik Al- Qur an terjemahan bahasa Indonesia oleh Wulandari, 2012. Hal ini dilakukan untuk menghindari salah tafsir dari pengguna. Jika dijadikan satu ayat sebagai satu dokumen, ditinjau dari terjemahannya, banyak ayat pendek justru tidak selesai kalimatnya, atau tidak mengandung suatu makna yang jelas. Korpus III-2

subtopik Al-Qur an nantinya akan digunakan sebagai bahan indeks dokumen untuk melakukan tahapan indexing. a. Penghapusan Markup Pemrosesan pemisahan rangkaian kata pada teks terjemahan Al-Qur an pada tahapan preprocessing adalah proses memisahkan kalimat menjadi potongan kata/term. Pada proses ini juga menghilangkan karakter tanda baca (stoplist) dan mengubah kata ke dalam huruf kecil. b. Penghapusan Stopwords Setelah proses pemisahan rangkaian kata, dilakukan proses penghapusan stopwords untuk kata-kata yang sering muncul dan dianggap tidak mencerminkan isi dari dokumen. Dalam bahasa inggris yang merupakan bagian dari stopwords adalah artikel(articles), kata depan(prepositions), dan kata penghubung(conjunctions). Dengan membuang stopwords, ukuran struktur indexing dapat dikurangi dan dapat mengurangi recall dokumen yang tidak sesuai. c. Stemming Proses stemming dilakukan untuk menjadikan kata yang ke bentuk dasar, dengan menghilangan awalan atau akhiran dari sebuah kata. Stemming di sini menggunakan kamus kata dasar sebagai pembanding kata-kata yang ada dalam terjemahan Al-Qur an yang telah melalui tahapan stemming. Selain meggunakan Porter Stemmer sebagai algoritma untuk memotong akhiran kata, juga akan dilanjutkan dengan pengecekan dan pemotongan awalan kata dengan mengadaptasi aturan algoritma Nazief dan Adriani untuk peningkatan kualitas stemming untuk memperoleh hasil yang lebih baik. 2. Indexing Pada saat logical view di tahap text operations telah ditetapkan, database manager (menggunakan Database manager module) akan membangun indeks dari teks. Sebuah indeks adalah sebuah struktur data kritikal karena mengizinkan pencarian cepat terhadap data berukuran besar. Struktur-struktur indeks yang berbeda dapat digunakan, tetapi yang paling sering adalah inverted file. Sumber-sumber (waktu dan tempat penyimpanan) yang terpakai III-3

untuk mendefinisikan teks database dan membangun indeks diselesaikan dengan melakukan pemrosesan query (querying) terhadap IR berulang kali. 3. Query Operation Query operations mencakup pemberian bobot dan perluasan query. User pertama kali harus menentukan sebuah kebutuhan informasi yang kemudian akan diuraikan (parsed) dan diubah oleh operasi teks yang sama yang diterapkan pada teks dokumen. Lalu, operasi-operasi query bisa diterapkan sebelum query yang sebenarnya, yang menyediakan sebuah representasi sistem sehingga dapat menghasilkan kebutuhan user. Query kemudian diproses untuk memperoleh dokumen-dokumen yang dikembalikan atau dicari (retrieved documents). Pemrosesan query yang cepat dimungkinkan dengan struktur indeks yang sebelumnya sudah dibangun. 4. Searching & ranking Setelah menghitung pembobotan, dilakukan perhitungan kemiripan (similarity) antara dokumen dengan query dengan menerapkan pemodelan ruang vektor. Melakukan analisis terhadap persamaan model ruang vektor untuk mengetahui nilai kerelevanan/kemiripan (similarity) dokumen terhadap query sehingga dokumen dapat diurutkan (dirangkingkan). Setelah dokumen diranking, sejumlah tetap dokumen top-scoring dikembalikan kepada pengguna. 3.5 Perancangan Sistem Pada tahapan ini akan dilakukan analisa pembangunan information retrieval system terhadap kebutuhan pengguna dan kebutuhan perangkat lunak, dijelaskan secara rinci tentang proses dari sistem temu kembali informasi yang akan dibangun sehingga mempermudah pemahaman terhadap sistem. Tahap perancangan information retrieval system dengan model ruang vektor merupakan tahapan dalam membuat rincian sistem temu balik informasi berdasarkan analisa agar dapat dimengerti oleh pengguna. Tiga rancangan utama yang akan dilakukan, yaitu: III-4

1. Perancangan sistem temu kembali ayat Al-Qur an yang akan dibangun menggunakan pemodelan berorientasi objek,yaitu OOAD (Object Oriented Analysis and Design ). 2. Transformasi koleksi dokumen ke dalam bentuk inverted index database. 3. Perancangan antarmuka sistem ( interface) yang baik sehingga mudah digunakan (user friendly). 3.6 Implementasi Sistem Pada implementasi sistem akan dilakukan pembuatan modul-modul yang telah dirancang dalam tahap perancangan ke dalam bahasa pemrograman. Berikut adalah spesifikasi lingkungan implementasi perangkat keras dan perangkat lunak yang akan digunakan: 1. Perangkat keras Processor : Intel(R) Core(TM) i3 CPU M 350, 2.3GHz Memory (RAM) : 2 GB Harddisk : 320 GB 2. Perangkat lunak Sistem Operasi Bahasa Pemrograman Tools Perancangan : Windows 7 Professional : PHP : Notepad++ 3.7 Pengujian Sistem Pengujian merupakan tahapan sistem yang akan dijalankan. Tahap pengujian diperlukan untuk menjadi ukuran bahwa sistem dapat dijalankan sesuai dengan tujuan. Pengujian sistem temu balik informasi dalam tugas akhir ini dilakukan dengan cara mengukur kualitas text retrieval. Ukuran yang digunakan untuk mengukur kualitas dari documents retrieval adalah precision dan recall berdasarkan hasil perhitungan kemiripan (similarity measure). III-5

3.8 Kesimpulan dan Saran Tahapan ini akan membahas tentang kesimpulan yang dihasilkan dari penelitian tugas akhir, kesimpulan diambil dari proses analisa kepada implementasi dan pengujian. Pada tahapan saran, penelitian ini diharapkan dapat memberikan sebuah catatan rekomendasi untuk menyempurnakan dan mengembangkan penelitian sistem temu kembali pencarian ayat Al-Qur an. III-6