UNIVERSITAS MERCU BUANA FAKULTAS : ILMU KOMPUTER PROGRAM STUDI : SISTEM INFORMASI No. Dokumen 02-3.04.1.02 Distribusi Tgl. Efektif RENCANA PEMBELAJARAN SEMESTER Mata Kuliah Kode Rumpun MK Bobot (SKS) Semester Tanggal Penyusunan Informartion Retrieval XXX 3 7 10-07-2017 Dosen Pengemban RPS Koordinator RMK Ketua Program Studi Otorisasi Capaian Pembelajaran Deskripsi Singkat Mata Kuliah Hendra Prastiawan, S.SI., MT Hendra Prastiawan, S.SI., MT Nur Ani, ST, MMSI CPL Prodi Mahasiswa mempelajari dan memahami prinsip, teknik, dan metode IR. Mampu menyelesaikan masalah teknologi informasi dan komunikasi dengan keahlian komputasi cerdas dan visualisasi CP Mata Kuliah Mahasiswa mampu mengaplikasikan prinsip, teknik, dan metode IR secara umum seperti pengindeksan, mesin pencari, klasifikasi, peringkasan dokumen, web search, dan berbagai aplikasi IR lainnya. Mahasiswa mengimplementasikan teknik IR dari berbagai bentuk dokumen teks, baik desktop maupun web. Mahasiswa men topik riset (skripsi), berlatih menelaah jurnal, dan presentasi. Mahasiswa mengimplementasikan teknik-teknik masalah seperti pengindeksan, pencarian, query dalam kebutuhan temu kembali informasi. Mahasiswa mampu membuat suatu mesin pencari untuk ektraksi informasi sebagai contoh implementasi sederhana dan mengkategorikan hasil demi kemudahan visualisasi. Matakuliah ini mempelajari prosedur-prosedur dan metode-metode untuk menemukan kembali informasi yang tersimpan dari berbagai sumber (resources) yang relevan atau koleksi sumber informasi yang dicari atau dibutuhkan. Dengan tindakan index (indexing), panggilan (searching), pemanggilan data kembali (recalling). Mahasiswa akan mempelajari teknik-teknik pengolahan data teks untuk menemukan kembali informasi pada data berbentuk teks. Bahasan perkuliahan meliputi pengolahan awal, ekstraksi fitur, penghitungan tingkat kemiripan teks sesuai masukan query, dan menampilkan hasil pencarian. Bahasan lanjut adalah teknik relevance feedback, klasifikasi dan klasterisasi teks untuk membantu
Materi Pembelajaran/ Pokok Bahasan pengguna dalam pencarian. Mahasiswa akan merancang, menganalisis serta mengaplikasikan metode-metode sistem temu kembali informasi pada berbagai permasalahan nyata baik secara mandiri atau kerjasama tim. 1. Konsep dasar Information Retrieval (IR) 2. Pemodelan IR dan Evaluasi IR 3. Query Expansion dan Algoritma Rocchio 4. Text Classification dan Clustering 5. Probabilistic Information Retrieval, CLIR dan Web Information Retrieval Pustaka Utama (1,2) 1. C.J. van Rijsbergen. Information Retrieval 2. Christopher D. Manning, Prabhakar Raghavan, Hinrich Schu tze, Introduction to Information Retrieval, Cambridge University Press, 2008 Pendukung (3, 4, 5, 6, 7) 3. Baeza-Yates & Ribeiro-Neto, Modern Information Retrieval Complete, 2011 4. Gerald Kowalski, Information Retrieval Architecture and Algorithm, Springer, 2011 5. B. Croft, D. Metzler, & T. Strohman, Search Engines: Information Retrieval in Practice, Addison Wesley, 2009. 6. D. Grossman & O. Frieder, Information Retrieval: Algorithms and Heuristics 2nd Edition, Springer, 2004. 7. I. H. Witten, Managing Gigabytes, Morgan Kaufman, 1999 Media Perangkat Lunak Perangkat Keras Pembelajaran Team Teaching Mata Kuliah Prasyarat Sistem Basis Data Minggu Ke- Sub-CP-MK (Sebagai Kemampuan Akhir yang diharapkan) Materi Pembelajaran [Pustaka] Indikator Kriteria & Bentuk Penilaian Metode Pembelajaran [estimasi waktu] Pengalaman Belajar Mahasiswa (1) (2) (3) (4) (5) (6) (7) (8) 1. Membedakan antara Definisi Dapat menjelaskan Information Retrieval dan Information definisi : 60 Data Mining serta Retrieval, Ruang information konsep, menjelaskan menggambarkan gagasan Lingkup dan retrieval, sejarah, Diskusi definisi dan tentang aplikasi Penerapan memberikan lingkup dan mahasiswa: 60 konsep dari information retrieval Information contoh information penerapan, information retrieval, dan serta contoh retrieval serta Bobot Penilaian
Retrieval, Contoh Information Retrieval merencanakan suatu aplikasi information retrieval information retrieval Melakukan tanya jawab pemahaman mahasiswa Presentasi hasil diskusi: 30 memberikan contoh dari information retrieval 2. Memiliki kemampuan dalam teks dan kalimat dengan menggunakan bahasa pemrograman perl/phyton Pemrosesan Teks, Pengantar bahasa PERL/Phyton teks berupa kata dan kalimat dengan menggunakan bahasa pemrograman perl/phyton definisi korpus beserta contohnya, kata yang dimulai dari melacak teks, statistik teks serta menghitung frekuensi kata melalui stopwords dan tokenisasi simulasi teks menggunaka n bahasa pemrograma n perl/phyton : 90 Pengantar bahasa pemrograman perl/phyton beserta simulasi teks: 60 memahami pengertian dari teks, kata dan kalimat dalam sebuah teks dengan menggunakan hukum Zipf teks dengan menggunakan bahasa pemrograman perl/phyton beberapa manipulasi teks dengan bahasa pemrograman perl/phyton
3. Kemampuan dalam pengindeksan secara manual dan otomatis, tokenisasi, stopwords, dan stemming serta pembobotan sebuah kata Inverted Text Indexing Tokenisasi Stopwords Stemming Pembobotan kata pengindeksan teks, pembagian teks berupa kalimat, paragraf, dan dokumen proses stopwords dan stemming untuk efisiensi dan efektivitas teks pembobotan kata dengan beberapa pendekatan seperti term frequency, document frequency, dan inverse document frequency indexing, tokenisasi, stopwords, dan proses stemming Menyelesaik an beberapa contoh teks baik berupa kalimat maupun dokumen Memberikan bobot pada sebuah kata didalam teks dengan menggunaka n beberapa pendekatan : 90 : 60 mengetahui dan tahapantahapan didalam teks dan juga pembobotan kata 4. Memiliki pengetahuan pemodelan Information Retrieval (IR) seperti Boolean Model, dan Vector Space Model Pemodelan IR Boolean Model Vector Space Model Dapat mendefinisikan beberapa model dari Information Retrieval beserta tahapan-tahapan dari masingmasing model IR Mendefinisik an masingmasing model IR beserta proses-proses didalamnya : 90 : 60 menjelaskan model-model IR beserta memberikan contoh dari proses setiap model IR
5. Memiliki kemampuan dalam mengukur tingkat relevansi dan akurasi dari teks 6. Memiliki kemampuan untuk memberikan umpan balik pada dokumen hasil teks yang dianggap relevan Memiliki kemampuan untuk memformulasikan query yang lebih baik ketika tidak ada informasi dari koleksi yang ada 7. Memiliki kemampuan untuk pengelompokan dokumen ke dalam kelas yang berbeda Evaluasi IR: Recall & Precision, Single Value Summaries, User Oriented Measures, Web Search Approach Relevance Feedback Query Expansion Algoritma Rocchio pengukuran dasar keefektifan IR untuk menkan tingkat relevansi dan akurasi dari teks Dapat memberikan umpan balik dari dokumen hasil teks untuk memformulasikan query yang lebh baik sehingga memperoleh hasil yang lebih relevan Text Classification Dapat mengelompokan dokumendokumen ke dalam kelas yang berbeda Melakukan evaluasi IR dari hasil teks yang sudah melalui proses perhitungan dan pengolahan teks Relevance Feedback, Query Expansion dan Algoritma Rocchio disertai dengan Text Classificatio n yang disertai dengan Materi: 60 Menit : 90 Materi: 60 Menit : 90 Materi: 60 Menit Text Classification: 90 pengukuran evaluasi IR untuk menkan tingkat relevansi dan akurasi dari hasil teks memberikan umpan balik dan memformulasi kan kembali query sehingga memperoleh hasil yang lebih relevan mampu mengelompok an dokumendokumen kedalam kelas yang berbeda dari studi kasus yang diselesaikan
8. Evaluasi tengah semester : validasi hasil penilaian, evaluasi dan perbaikan proses pembelajaran berikutnya 1 9. Memiliki kemampuan Clustering mengelompokkan Partitional proses clustering Materi: 60 dokumen dengan teks Algorithm dokumen dengan Menit yang mirip memiliki Hierarchical menggunakan keterkaitan baik yang Algorithms salah satu memiliki kesamaan algoritma yang tersedia semantik maupun Clustering: 90 kesamaan statistik clustering dalam IR dengan disertai algoritmaalgoritma yang tersedia di dalam proses clustering mampu mengelompok an dokumendokumen dengan menggunakan algoritma yang tersedia di dalam proses clustering 10. Memiliki kemampuan untuk meringkas informasi yang ter didalam sebuah dokumen sehingga menghasilkan suatu versi yang ringkas untuk pengguna informasi 11. Memiliki kemampuan untuk memformulasikan dan menerapkan Question Answering System (QAS) untuk mengevaluasi teks Peringkasan Teks Jenis Ringkasan Hasil Ringkasan Definisi QAS QA vs Search Engine Pengembangan QAS Definisi Passages proses penyaringan informasi yang paling penting dari suatu sumber (atau beberapa sumber) untuk menghasilkan suatu versi yang ringkas untuk user. Dapat menjelaskan QAS dan menerapkan QAS didalam bagian dari sebuah teks dan juga latihan proses peringkasan teks dari beberapa dokumen Simulasi dari penerapan QAS Materi: 60 Menit Text Summarization: 60 Diskusi kelompok hasil dari peringkasan teks: 60 QAS: 60 simulasi QAS: 90 text summarization dari dokumendokumen yang tersedia memahami dan penerapan dari QAS
12. Memiliki kemampuan dalam menganalisa kemungkinanlemungkinan yang muncul dari hasil teks untuk memastikan kebutuhan user Probabilistic relevance feedback Probability Ranking Principle Binary Independence Model Dapat memahami Probabilistic relevance feedback serta memberikan contohnya Studi Kasus penerapan Probabilistic relevance feedback Diskusi kelompok: 60 Penyelesaian : 90 memiliki wawasan baru Probabilistic relevance feedback dan menerapkanny a didalam yang sudah diberikan 13. Memiliki kemampuan dalam membaca dan menginterpretasikan informasi dan menggabungkannya dengan informasi pada bahasa-bahasa lain Cross-Language Information Retrieval (CLIR) Monolingual vs CLIR Dokumen vs Query Metode Penterjemahan Mengimplementasi kan dasar dari mesin penterjemah sehingga hasil akan baik jika query ditulis dalam kalimat sesuai dengan tata bahasa yang baik Studi kasus penerapan CLIR dengan bebrapa metode penterjemaha n : 60 Studi kasus tentang CLIR: 90 menerapkan konsep CLIR dengan menggunakan beberapa metode penterjemahan yang tersedia 14. Memiliki kemampuan dalam memahami web search dan search engine sebagai bagian dalam Information Retrieval Dasar dan komponen Web Search Markov chain Mendefisikan dan memberikan contoh proses dari Web Search dsn Search Engine Web Search dan Search Engine : 90 Tanya jawab: 60 menjelaskan penggunaan Web Search dan membedakann ya dengan Search Engine
15. mengerti tugas yang akan dikerjakan Final Project Information Retrieval Menyelesaikan tugas akhir mata kuliah Information Retrieval Presentasi kelompok dengen ketentuan: Slide 1: sekilah tentang topik yang di ambil Slide 2: Ruang lingkup dan batasan Slide 3: Arsitektur sistem yang dibuat Slide 4: pembagian tugas setiap anggota Demo sisem Presentasi dan penilaian: 150 mampu menbuat arsitektur sistem dari Information Retrieval serta mendemokann ya 16. Evaluasi Akhir Semester : Melakukan validasi penilaian akhir dan menentukan kelulusan mahasiswa 1