BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam perkembangan teknologi internet yang semakin maju ini kita dapat mengakses dokumen, buku dan majalah mulai dari bahasa asing sampai bahasa daerah yang dapat kita peroleh di situs situs internet dan perpustakaan. Sementara itu, banyak generasi muda yang berasal dari Sunda tidak memahami bahasa Sunda, sayang sekali jika bahasa Sunda semakin lama semakin tidak digunakan dan akhirnya punah. Membuat dan membaca dokumen berbahasa Sunda merupakan salah satu cara melestarikan penggunaan bahasa Sunda. Bagi mereka yang belum paham tentang bahasa Sunda, membaca keseluruhan dokumen untuk memahaminya akan sangat melelahkan. Namun jika terdapat ringkasan pendek dari sebuah dokumen, akan membantu pembaca mendapatkan intisari dari sebuah dokumen berbahasa Sunda. Membuat ringkasan secara manual membutuhkan waktu yang lama jika dokumen yang diringkas berjumlah sangat banyak, maka membutuhkan peringkas teks otomatis untuk membantu proses ekstraksi dalam penyusunan kalimat mengenai intisari dari dokumen serta menggabungkan menjadi suatu ringkasan [5]. Diharapkan dari membaca ringkasan dokumen, buku dan majalah berbahasa Sunda, akan menumbuhkan niat membaca berbahasa Sunda menjadi lebih meningkat. Beberapa penelitian tentang peringkas teks otomatis sudah pernah dilakukan sebelumnya, salah satu contoh penelitian Budhi Kurniawan Wangsa yang menyajikan peringkasan teks otomatis menggunakan metode Generalyzed Vector Space Model (GVSM) dan tingkat keberhasilannya hanya mencapai 53%.[11] Pada penelitian sebelumnya oleh Agustinus Widiantoro metode yang digunakan untuk peringkasan teks otomatis adalah TF-IDF (Term Frequency-Inversed Document Frequency) dan tingkat keberhasilannya mencapai 70%.[5] Ada beberapa proses yang dilakukan 1
2 untuk meringkas artikel dengan metode TF-IDF (Term Frequnecy Iversed Document Frequency) yaitu Case folding, Tokenizing, Filtering, Stemming dengan Algoritma Nazief-Andriani dan Pattern Discovery / Analysis. Metode ini bertujuan untuk mengambil sebagian kalimat dari keseluruhan dokumen yang penting dengan mengekstraksi kalimat-kalimat beranking tinggi untuk dimasukkan ke dalam rangkuman. Oleh karena itu penulis tertarik untuk membuat tugas akhir dengan mengambil topik tentang automatic text summarization dengan Judul: PERINGKAS TEKS OTOMATIS ARTIKEL BERBAHASA SUNDA MENGGUNAKAN METODE TF-IDF (TERM FREQUENCY-INVERSED DOCUMENT FREQUENCY) 1.2 Perumusan Masalah Berdasarkan latar belakang di atas maka terdapat rumusan masalah sebagai berikut : 1. Bagaimana menggunakan metode TF-IDF pada program aplikasi peringkasan teks otomatis pada dokumen berbahasa Sunda? 2. Bagaimana mengukur akurasi sistem peringkas teks otomatis menggunakan metode TF-IDF pada dokumen berbahasa Sunda? 1.3 Tujuan Penelitian Tujuan yang diambil dari penelitian ini adalah : 1. Mengimplemetasikan metode TF-IDF (Term Frequency-Inversed Document Frequency) ke dalam sistem peringkas teks otomatis, sehingga dapat mempermudah dalam mendapatkan rangkuman atau ringkasan dokumen. 2. Menganalisis tingkat akurasi hasil rangkuman menggunakan TF-IDF (Term Frequency-Inversed Document Frequency)
3 1.4 Batasan Masalah Ruang lingkup dibatasi pada : 1. Dokumen yang digunakan yaitu artikel yang bersumber dari media internet dan dokumen berformat pdf yang tidak di lock. 2. Dokumen harus berupa teks dan tidak terdapat gambar. 3. Teknik peringkasan menggunakan teknik ekstraksi. 4. Ekstraksi teks yang digunakan adalah dokumen berbahasa Sunda. 5. Teks yang dapat diringkas hanya sebatas karakter a-z.. 6. Proses Stemming menggunakan Algoritma Nazief-Andriani. 1.5 Metode Penelitian 1. Studi Pustaka Penulis mempelajari buku, paper, laporan tugas akhir, ebook, dan referensi lain yang berkaitan dengan penelitian, Sumber pengetahuan tersebut dijadikan sebagai landasan teori untuk mendapatkan solusi dari masalah yang muncul pada penelitian ini. 2. Pembangunan sistem Penulis menggunakan waterfall model untuk tahap pembangunan sistem. Pada pembangunan perangkat lunak dilakukan secara sekuensial, dimana satu tahap dilakukan setelah tahap sebelumnya selesai dilaksanakan. Adapun tahapan dalam pengembangan waterfall model sebagai berikut: a. Requirements analysis and definition, pada tahap ini mencari dan mengumpulkan kebutuhan secara lengkap lalu dianalisis serta didefinisikan kebutuhan apa saja yang harus dipenuhi oleh program yang akan dirancang. b. System and software design, pada tahap ini mendesain program yang akan dibangun setelah kebutuhan selesai dikumpulkan secara lengkap. c. Implementation and unit testing, pada tahap ini setelah desain program dibuat lalu desain program diterjemahkan ke dalam kode-
4 kode dengan bahasa pemrograman yang sudah ditentukan. Program yang dibangun langsung diuji baik secara unit. d. Integration and system testing, pada tahap ini melakukan penyatuan unit-unit program kemudian diuji secara keseluruhan (system testing). e. Operation and maintenance, pada tahap terakhir yaitu mengoperasikan program dilingkungannya dan melakukan pemeliharaan, seperti penyesuaian atau perubahan karena adaptasi dengan situasi sebenarnya. 1.6 Sistematika Penulisan Sistematika penulisan yang akan diuraikan dalam tugas akhir ini terbagi dalam beberapa bab yang akan dibahas ialah sebagai berikut: BAB I PENDAHULUAN Bab ini menjelaskan tentang latar belakang masalah, rumusan masalah, batasan masalah, tujuan dan manfaat penelitian, metode penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Bab ini berisikan tentang literatur dan teori teori yang berhubungan dengan pembuatan aplikasi. BAB III ANALISIS SISTEM Bab ini membahas tentang mengidentifikasi masalah dan menganalisa kebutuhan dari aplikasi. BAB IV PERANCANGAN SISTEM Bab ini membahas tentang tahap perancangan dari sistem yang akan dibuat yang meliputi pemodelan sistem dan perancangan user interface.
5 BAB V IMPLEMENTASI DAN PENGUJIAN SISTEM Bab ini akan membahas mengenai lingkungan implementasi, tampilan antarmuka aplikasi dan pengujian aplikasi. BAB VI PENUTUP Bab ini berisi tentang kesimpulan yang didapat dari aplikasi ini, serta saran-saran mengenai aplikasi ini sebagai rencana pengembangan aplikasi ini untuk lebih baik.