BAB II KAJIAN TEORI. kumpulan kalimat penting dari suatu teks yang menggambarkan inti teks tersebut

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II KAJIAN TEORI. kumpulan kalimat penting dari suatu teks yang menggambarkan inti teks tersebut"

Transkripsi

1 A. Peringkasan Teks Otomatis BAB II KAJIAN TEORI Peringkasan teks merupakan proses untuk mendapatkan ringkasan teks secara otomatis dengan menggunakan bantuan komputer. Ringkasan teks adalah kumpulan kalimat penting dari suatu teks yang menggambarkan inti teks tersebut dan mempunyai informasi teks aslinya. Menurut Niladri (2007:448), peringkasan teks otomatis merupakan penelitian yang penting pada bidang natural language processing. Alguliev & Aliguliyev (2009:128) mengungkapkan bahwa proses peringkasan teks dapat dibagi menjadi tiga tahap, yakni: 1. Menganalisa teks dan memilih beberapa bagian penting 2. Mengubah hasil analisis menjadi representasi ringkasan 3. Mengubah representasi ringkasan menjadi ringkasan yang sesuai. Ada dua pendekatan pada peringkasan teks, yakni extract dan abstract. Pada peringkasan extract, ringkasan dihasilkan dengan mengambil beberapa kalimat penting dari teks asli. Banyaknya kalimat yang diambil ditentukan oleh tingkat kompresi ringkasan. Tingkat kompresi adalah perbandingan panjang ringkasan dengan teks asli. Tingkat kompresi merupakan faktor penting dalam menentukan kualitas ringkasan. Semakin kecil tingkat kompresi maka semakin sedikit pula ringkasan yang dihasilkan, namun lebih banyak informasi yang hilang. Sebaliknya, semakin besar tingkat kompresi maka ringkasan menjadi semakin banyak, banyak informasi penting yang dihasilkan. Tingkat kompresi ringkasan dipilih sesuai kebutuhan. Tingkat kompresi yang baik berkisar dari 5% sampai 30% (Mani, 4

2 2001:14). Pada penelitian ini besar tingkat kompresi yang dipilih adalah 20% agar ringkasan yang dihasilkan tidak terlalu sedikit atau terlalu banyak. Peringkasan abstract merupakan peringkasan dengan menyertakan kata atau kalimat yang tidak ada pada teks asli. Mani (2001:6) mengungkapkan bahwa abstract mempunyai kemungkinan untuk menghasilkan ringkasan yang lebih sedikit tetapi mempunyai informasi lebih dari ringkasan extract. Akan tetapi, abstract membutuhkan pemahaman yang mendalam mengenai natural language processing seperti semantic representation, inference, dan natural language generation (Ye et al, 2007:1643). Semantic representation berhubungan dengan arti kata dan bagaimana mengombinasikan kata menjadi kalimat yang bermakna. Inference merupakan proses untuk menentukan apakah suatu hipotesis bahasa alami dapat disimpulkan dari suatu premis bahasa alami. Natural language generation merupakan proses menghasilkan kalimat bermakna dalam bentuk bahasa alami dari beberapa representasi. Berdasarkan banyak sumber teks yang akan diringkas, peringkasan teks dibagi menjadi dua, yakni peringkasan single document dan peringkasan multi document (Dragomir, 2002:400). Pada single document, sumber ringkasan merupakan dokumen tunggal sedangkan multi document meringkas beberapa sumber dokumen. Berdasarkan metodenya, peringkasan teks dapat dibedakan menjadi dua, yakni peringkasan generik dan peringkasan query (Aliguliyev, 2010:423). Peringkasan generik akan menghasilkan ringkasan secara umum sedangkan peringkasan query akan menghasilkan ringkasan sesuai dengan query. Query merupakan kalimat atau topik yang ditentukan oleh pengguna. 5

3 Banyak penelitian yang sudah dilakukan dalam bidang peringkasan teks. Kebanyakan penelitian menggunakan peringkasan extract karena komputasinya lebih mudah. Beberapa metode yang telah digunakan dalam peringkasan extract pada teks bahasa Inggris, antara lain: Algoritma genetika (Qazvinian et al, 2008), Modified Discrete Differential Evolution (Alguliev & Aliguliyev, 2009), Textrank (Mihalcea & Tarau, 2004). Adapun beberapa metode yang telah diterapkan pada teks bahasa Indonesia, antara lain: Maximum Marginal Relevance (Mustaqhfiri, 2011), Fuzzy (Gerbawani, 2013), dan Non-negative Matrix Factorization (Ridok, 2014). Pada penelitiannya, Qazvinian et al (2008:442) menyimpulkan bahwa metodenya efisien dalam peringkasan teks. Alguliev & Aliguliyev (2009:136) menyimpulkan bahwa metodenya dapat meningkatkan hasil ringkasan secara signifikan. Mihalcea & Tarau (2004:411) menyimpulkan bahwa penggunaan metode Textrank menghasilkan ringkasan yang lebih baik dibandingkan metode graf lainnya. Penelitian Mustaqhfiri et al (2011:146), menunjukkan hasil tingkat keakuratan sebesar 67.4%. Hasil penelitian Gerbawani (2013:19) menunjukkan bahwa akurasi rata-rata terbaik yang diperoleh adalah sebesar 50.6%. Penelitian Ridok (2014:44) menghasilkan tingkat keakuratan sebesar 64.6%. Penelitian Mustaqhfiri, Gerbawani, dan Ridok menggunakan dokumen teks berita. B. Jenis Teks Bahasa Indonesia Menurut Suparno & Yunus (2009:1.11), teks atau karangan dapat disajikan dalam lima jenis, yakni: narasi, deskripsi, eksposisi, argumentasi, dan persuasi. Berikut penjelasan masing-masing jenis teks: 6

4 1. Narasi: jenis tulisan yang menceritakan proses kejadian atau peristiwa. Sasarannya adalah memberikan gambaran yang jelas kepada pembaca mengenai fase, langkah, urutan, atau rangkaian terjadinya suatu hal. Contoh teks narasi adalah sebagai berikut: Ketika aku sedang dalam perjalanan menuju ke sekolah, aku melihat Budi yang sedang berjalan dengan sangat cepat. Dia terlihat seolah olah dikejar sesuatu, padahal waktu itu jam masih menunjukan pukul 7. Karena merasa penasaran, aku mengikutinya dari belakang. Akan tetapi aku begitu terkejut karena Budi tidak menuju ke sekolah. Aku pun merasa curiga dengan sikapnya. Kemudian aku memanggilnya, dan benar saja wajah Budi terlihat sangat gugup dan ketakutan. Ternyata dia ingin membolos waktu itu, untungnya aku mengetahui rencananya itu sehingga dia membatalkannya. 2. Deskripsi: ragam tulisan yang melukiskan atau menggambarkan sesuatu berdasarkan kesan-kesan dari pengamatan, pengalaman, dan perasaan penulisnya. Contoh teks deskripsi adalah sebagai berikut: Tempat tinggalku tidaklah begitu besar. Rumahku hanya memiliki luas sekitar 68 m2. Dengan luas seperti itu, aku hanya memiliki 3 kamar tidur, satu kamar mandi, ruang tamu, keluarga dan dapur. Ruang tidur utamanya terletak di samping ruamg tamu. Sedangkan ruang tidur lainnya berdekatan di dekat ruang keluarga. Sementara itu, dapur rumahku tidak begitu lebar, luasnya hanya sekitar 10 m2. Tepat di tengah tengah dapurku terdapat meja makan yang terbuat dari kayu. Kamar mandi kami yang hanya satu terletak di samping dapur dekat pintu menuju halaman luar. Meskipun tidak begitu besar, rumahku sangatlah nyaman untuk ditempati. 3. Eksposisi: ragam tulisan yang bertujuan menerangkan, menyampaikan, atau menguraikan sesuatu yang dapat memperluas atau menambah pengetahuan dan pandangan pembacanya. 7

5 Contoh teks eksposisi adalah sebagai berikut: Susu adalah minuman yang sangat bermanfaat bagi tubuh. Hal ini dikarenakan susu banyak mengandung vitamin dan mineral yang sangat berguna. Kandungan yang paling banyak di dalam susu adalah kalsium. Zat inilah yang akan membuat tubuh dan tulang kita menjadi kuat. Bahkan susu juga bisa membantu pertumbuhan tulang agar menjadi lebih tinggi. Selain kalsium, susu juga memiliki kandungan protein. Zat ini sangat dibutuhkan untuk membangun sel sel di dalam tubuh. Terlebih lagi susu juga memiliki lemak, lemak inilah yang akan digunakan sebagai sumber energi di dalam tubuh. Oleh karena itu, meminum susu sangat baik untuk tubuh kita. 4. Argumentasi: ragam wacana yang dimaksudkan untuk meyakinkan pembaca mengenai kebenaran yang disampaikan oleh penulisnya. Contoh teks argumentasi adalah sebagai berikut: Setelah Lulus dari SMA, langkah selanjutnya adalah menuju dunia perkuliahan. Di sana Anda akan memilih satu konsentrasi study atau jurusan. Tetapi memilih jurusan perkuliahan tidaklah semudah yang dibayangkan, perlu beberapa pertimbangan agar Anda tidak salah dalam memilihnya. Memilih jurusan haruslah sesuai dengan minat dan bakat karena jika salah dalam mengambil jurusan, maka kehidupan kampus akan terasa sangat sulit. Disamping itu, pilihlah jurusan yang memiliki prospek yang cerah. Jika memilih jurusan yang prospeknya cerah, maka Anda tidak akan kesulitan dalam hal mencari pekerjaan setelah lulus. Oleh karena itu, sebelum memilih jurusan, pertimbangkanlah dengan sangat matang agar tidak salah dalam memilih. 5. Persuasi: karangan yang ditujukan untuk mempengaruhi sikap dan pendapat pembaca mengenai sesuatu hal yang disampaikan penulisannya. Contoh teks persuasi adalah sebagai berikut: Sampah yang menumpuk adalah sesuatu yang menjijikan. Tumpukan sampah ini bahkan bisa menimbulkan bau yang tidak sedap. Selain itu, tumpukan sampah juga bisa menjadi sarang penyakit. Banyak sekali penyakit yang bisa ditimbulkan dari sampah sampah yang menumpuk, diantaranya adalah diare, demam berdarah, dan masih banyak lagi. Oleh 8

6 karena itu, marilah kita bersama sama membersihkan sampah yang berserakan agar tidak menumpuk sehingga kita semu bisa terbebabas dari bahaya sampah yang bisa ditimbulkan. C. Preprocessing Preprocessing merupakan proses dengan tujuan untuk menyiapkan teks yang akan diringkas sehingga proses peringkasan dapat dilakukan oleh komputer. Ada beberapa tahap pada preprocessing, yakni segmentasi kalimat, case folding, segmentasi kata, stopword removal, dan stemming. Gambar 1 menunjukkan diagram alur dari preprocessing. Segmentasi kalimat Case folding Segmentasi kata Stopword removal Stemming Gambar 1. Diagram Alur Preprocessing 1. Segmentasi Kalimat Segmentasi kalimat merupakan proses untuk memisahkan kalimat dari teks yang akan diringkas. Proses ini memerlukan aturan khusus untuk menentukan batas kalimat. Pada umumnya, batas kalimat adalah titik (.), tanda tanya (?), atau tanda seru (!). Akan tetapi, jika hanya mengandalkan ketiga tanda baca tersebut maka kemungkinan terjadi kesalahan cukup besar. Untuk meminimalkan kesalahan, batas yang digunakan adalah tanda baca diikuti spasi dan huruf kapital. Agar hasil 9

7 segmentasi lebih akurat maka dipastikan terlebih dahulu kata sebelum tanda baca bukan suatu singkatan. Hal ini bertujuan agar singkatan yang berada di tengah kalimat tidak menjadi akhir kalimat. Tabel 1 menunjukkan contoh segmentasi kalimat. Tabel 1. Contoh Segmentasi Kalimat Teks Awal Nyanyian dalam Tari Saman dibagi dalam lima macam. Regnum adalah nyanyian berupa suara auman. Dering adalah suara auman yang dilakukan oleh semua penari. Hasil Segmentasi - Nyanyian dalam Tari Saman dibagi dalam lima macam. - Regnum adalah nyanyian berupa suara auman. - Dering adalah suara auman yang dilakukan oleh semua penari. 2. Case Folding Case folding adalah proses mengubah setiap huruf pada kalimat menjadi huruf kecil. Hal ini akan membantu proses pencarian kata yang sama. Tabel 2 menunjukkan contoh case folding. Tabel 2. Contoh Case Folding Kalimat Awal - Nyanyian dalam Tari Saman dibagi dalam lima macam. - Regnum adalah nyanyian berupa suara auman. - Dering adalah suara auman yang dilakukan oleh semua penari. Hasil Case Folding - nyanyian dalam tari saman dibagi dalam lima macam. - regnum adalah nyanyian berupa suara auman. - dering adalah suara auman yang dilakukan oleh semua penari. 10

8 3. Segmentasi Kata Segmentasi kata adalah proses memisahkan kata pada setiap kalimat. Proses pemisahan kata dapat dilakukan berdasarkan white space (spasi, tab) pada kalimat. Setelah kata berhasil dipisahkan, tanda baca pada awal maupun akhir kata dihapus. Penghapusan tanda baca bertujuan agar proses selanjutnya dapat dilakukan dengan baik. Tabel 3 menunjukkan contoh segmentasi kata. Tabel 3. Contoh Segmentasi Kata Kalimat Nyanyian dalam Tari Saman dibagi dalam lima macam. Hasil Segmentasi Kata - Nyanyian - dibagi - dalam - dalam - Tari - lima - Saman - macam 4. Stopword Removal Stopword removal merupakan proses menghilangkan kata-kata tertentu pada kalimat. Kata-kata tersebut kurang mempunyai makna dan banyak muncul pada kalimat. Contoh kata tersebut adalah kata penghubung, kata ganti, dll. Stopword removal dilakukan dengan mencocokkan setiap kata dengan daftar stopword. Jika kata tersebut ada pada daftar stopword maka kata tersebut dihilangkan. Tabel 4 menunjukkan contoh stopword removal. Tabel 4. Contoh Stopword Removal Teks awal - Nyanyian dalam Tari Saman dibagi dalam lima macam. Hasil Stopword Removal - Nyanyian Tari Saman dibagi lima. - Regnum nyanyian berupa suara auman. 11

9 - Regnum adalah nyanyian berupa suara auman. - Dering adalah suara auman yang dilakukan oleh semua penari. - Dering suara auman dilakukan penari. 5. Stemming Stemming merupakan proses mengembalikan kata turunan ke bentuk akar kata (kata dasar) menggunakan aturan tertentu. Pada penelitian ini algoritma stemming yang digunakan adalah algoritma Nazrief & Adriani. Algoritma ini mempunyai tingkat presisi yang tinggi karena berdasarkan morfologi bahasa Indonesia. Algoritma Nazrief & Adriani menggunakan beberapa aturan untuk menghilangkan awalan dan akhiran dari sebuah kata kemudian mencocokkan dengan daftar kata dasar. Semakin lengkap daftar kata maka semakin tinggi akurasi algoritma ini (Ledy, 2009:200). Tabel 5 menunjukkan contoh stemming menggunakan Algoritma Nazrief & Adriani. Tabel 5. Contoh Stemming Kata Awal - tari - santun - saman - kepahlawanan - mengandung - kekompakan - pendidikan - dan - keagamaan - kebersamaan - sopan Hasil Stemming - tari - santun - saman - pahlawan - kandung - kompak - didik - dan - agama - sama - sopan 12

10 2007:60): Algoritma Nazrief & Adriani mempunyai tahapan sebagai berikut (Asian, 1. Kata yang ingin dicari kata dasarnya dicek dalam daftar kata dasar. Jika ada dalam daftar, maka kata tersebut adalah adalah kata dasar. Selanjuntnya, untuk setiap akhir langkah di bawah, langkah 1 dilakukan kembali. 2. Penghapusan inflection suffixes (-kah, -lah, -tah, -pun, -ku, -mu, -nya). Jika berupa partikel (-kah, -lah, -tah, -pun), ulangi langkah ini untuk menghapus possesive pronouns (-ku, -mu, -nya). 3. Penghapusan derivative suffixes (-i, -kan, -an). 4. Penghapusan awalan be-, di-, ke-, me-, pe-, se-, dan te-. a. Langkah 4 ini tidak dilakukan bila: Kata mempunyai gabungan awalan dan imbuhan yang tidak diperbolehkan dalam Tabel 6. Awalan yang akan dihilangkan, sama dengan awalan yang telah dihilangkan sebelumnya Awalan telah dihilangkan sebanyak tiga kali b. Identifikasi tipe awalan dan disambiguitasnya jika diperlukan. Awalan mempunyai dua tipe, yaitu: plain: awalan di-, ke-, se- dapat dihilangkan secara langsung. complex: awalan be-, te-, me-, pe- harus dianalisis ambiguitasnya menggunakan Tabel 7. Awalan ini mempunyai bermacam variasi. Awalan me- dapat berubah menjadi mem- atau men- tergantung dari huruf awal akar kata. 13

11 c. Lakukan langkah 1. Jika bukan merupakan akar kata, maka ulangi langkah 4 ini secara berulang sampai menemukan akar katanya atau sampai kondisi 4a terjadi. Bila kondisi 4a tidak terjadi dan akar kata belum diperoleh, maka lanjutkan ke langkah Apabila sampai langkah 4 akar kata belum ditemukan, lakukan analisis apakah kata tersebut masuk dalam tabel disambiguitas kolom terakhir atau tidak. 6. Apabila semua proses di atas gagal, maka kata awal merupakan kata dasar. Tabel 6. Kombinasi Awalan dan Akhiran yang Tidak Diperbolehkan Awalan Akhiran yang tidak diperbolehkan ber- -i di- -an ke- -i -kan me- -an ter- -an per- -an Tabel 7. Aturan Stemming Prefiks Rule Construct Return 1 berv ber-v be-rv 2 bercap ber-cap dimana C!= r dan P!= er 3 bercaerv ber-caerv dimana C!= r 4 belajar bel-ajar 5 bec1erc2 be-c1erc2 dimana C1!={ r l } 6 terv ter-v te-rv 7 tercerv ter-cerv dimana C!= r 8 tercp ter-cp dimana C!= r dan P!= er 9 tec1erc2 te-c1erc2 dimana C1!= r 10 me{l r w y}v me-{l r w y}v 11 mem{b f v} mem-{b f v} 12 mempe{r l} mem-pe 13 mem{rv V} me-m{rv V} me-p{rv V} 14 men{c d j z} men-{c d j z} 15 menv me-nv me-tv 14

12 16 meng{g h q} meng-{g h q} 17 mengv meng-v meng-kv 18 menyv meny-sv 19 mempv mem-pv dimana V!= e 20 pe{w y}v pe-{w y}v 21 perv per-v pe-rv 23 percap per-cap dimana C!= r dan P!= er 24 percaerv per-caerv dimana C!= r 25 pem{b f v} pem-{b f v} 26 pem{rv V} pe-m{rv V} pe-p{rv V} 27 pen{c d j z} pen-{c d j z} 28 penv pe-nv pe-tv 29 peng{g h q} peng-{g h q} 30 pengv peng-v peng-kv 31 penyv peny-sv 32 pelv pe-lv pengecualian untuk pelajar, kembalikan ajar 33 pecerv per-erv dimana C!={r w y l m n} 34 pecp pe-cp dimana C!={r w y l m n} dan P!= er Keterangan: V = vokal C = konsonan P = bagian kecil kata misal er Pada penelitiannya, Asian (2007:76) mengusulkan beberapa aturan tambahan untuk meningkatkan keakuratan algoritma Nazief & Adriani. Aturan tambahan tersebut adalah: 1. Aturan kata plural Jika kata yang dihubungkan sama, maka kata dasar adalah salah satu kata tersebut. Contoh buku-buku menjadi buku. Jika ditemukan kata seperti bolakbalik, suap-menyuap dll, maka masing-masing kata di-stem, jika hasil stem sama, maka hasil stem tersebut merupakan kata dasar. Jika hasil stem tidak sama, maka kata awal adalah kata dasar. 15

13 2. Kondisi tambahan Aturan tambahan dapat dilihat pada Tabel 8. Penjelasan masing-masing aturan tambahan adalah sebagai berikut: Pada awalan te-, ditambahkan Rule 35 sehingga kata seperti terpercaya dapat di-stem menjadi percaya. Pada awalan pe-, ditambahkan Rule 36 sehingga kata seperti pekerja dapat di-stem menjadi kerja. Pada awalan me-, Rule 12 dimodifikasi sehingga kata seperti mempengaruhi dapat di-stem menjadi pengaruh. Pada awalan me-, Rule 16 dimodifikasi sehingga kata seperti mengkritik dapat di-stem menjadi kritik. Tabel 8. Aturan Tambahan dan Aturan yang Diubah Rule Construct Return 35 terc1erc2 ter-c1erc2 dimana C1!= r 36 pec1erc2 pe-c1erc2 dimana C!={r w y l m n} 12 mempe mem-pe 16 meng{g h q k} meng-{g h q k} 3. Pengubahan urutan algoritma Urutan algoritma dapat mempengaruhi hasil stemming. Sebagai contoh kata bertingkah akan di-stem menjadi ting, bukan tingkah. Pada kata seperti itu, untuk mendapatkan hasil yang benar urutannya adalah hapus prefiks kemudian hapus sufiks. Kata yang menggunakan aturan ini adalah kata yang mempunyai kriteria pada Tabel 9. 16

14 Tabel 9. Kombinasi Awalan dan Akhiran Syarat Urutan Algoritma Diubah Awalan Akhiran be- -lah, -an di-, pe-, ter- -i D. Klasterisasi Kalimat (Alguliev & Aliguliyev, 2009) Klasterisasi adalah proses mengelompokkan data berdasarkan perhitungan kemiripan data (Alguliev & Aliguliyev, 2009:130). Klasterisasi dipelajari secara mendalam pada banyak bidang seperti text mining, pattern recognition, information retrieval (IR), dan sebagainya. Klasterisasi dokumen merupakan masalah utama pada text mining dan dapat didefinisikan sebagai upaya mengelompokkan dokumen ke dalam klaster berdasarkan topik atau konten utamanya. Klasterisasi dokumen juga berguna untuk membuat ringkasan, ekstraksi topik otomatis, deteksi topik, dan manajemen informasi pada perpustakaan digital (Aliguliyev, 2010:425). Alguliev & Aliguliyev (2009:130) mengungkapkan bahwa ada tiga syarat utama pada klasterisasi kalimat, yaitu: 1. Dua klaster yang berbeda tidak mempunyai kalimat yang sama di dalamnya. 2. Setiap kalimat harus termuat dalam klaster 3. Setiap klaster harus mempunyai minimal satu kalimat Li (2006:199) mengungkapkan bahwa klasterisasi mempunyai empat komponen dasar, yaitu: a. Representasi data b. Perbedaan antar data c. Fungsi objektif 17

15 d. Prosedur optimasi Pada klasterisasi kalimat, komponen perbedaan antar data diganti dengan kemiripan kalimat selain itu, prosedur optimasi pada penelitian ini menggunakan Modified Discrete Differential Evolution. Penjelasan lebih lanjut mengenai komponen dalam klasterisasi kalimat adalah sebagai berikut: 1. Representasi Data Teks merupakan himpunan kalimat, sehingga teks D dapat direpresentasikan sebagai berikut: D = {S 1, S 2, S 3,, S n }. S i = {t 1, t 2, t 3,, t m i }, dengan S i mewakili kalimat dan t j mewakili kata yang berbeda. 2. Kemiripan Kalimat Penghitungan kemiripan kalimat mempunyai peran penting pada NLP dan IR. Kemiripan kalimat digunakan di penelitian tentang teks seperti text mining, information retrieving, peringkasan teks, dan klasterisasi teks. Salah satu metode yang dapat digunakan untuk menghitung kemiripan kalimat adalah metode Normalized Google Distance (NGD). Metode ini menghitung kemiripan kalimat berdasarkan kesamaan kata yang muncul pada dua kalimat. Sebelum menghitung kemiripan kalimat, kemiripan antar kata (term) dihitung terlebih dahulu. Menurut Alguliev & Aliguliyev (2009:131), kesamaan term menggunakan NGD adalah sebagai berikut: dimana sim NGD (t k, t l ) = exp( NGD(t k, t l )) NGD(t k, t l ) = max{log(f k), log(f l )} log(f kl ) n min {log(f k ), log(f l )} (1) (2) 18

16 Keterangan : t k, t l =term f k =banyak kalimat yang memuat term k n=banyak kalimat Berdasarkan Persamaan (1), persamaan tingkat kemiripan antar kalimat S i dan S j adalah sebagai berikut: sim NGD (S i, S j ) = t sim k S i t l S j NGD(t k, t l ) m i m j Keterangan: m i =banyak term pada kalimat i (3) 3. Fungsi Objektif Klasterisasi membutuhkan fungsi objektif untuk menentukan klasterisasi sudah optimal atau belum. Berdasarkan penelitian Alguliev & Aliguliyev (2009:131), fungsi objektif klasterisasi kalimat adalah: F = (1 + sigm(f 1 )) F 2 (4) sigm merupakan fungsi sigmoid yang memetakan bilangan nyata ke [0,1]. sigm(z) = exp( z) Persamaan (4) menyeimbangkan kemiripan intra-klaster dan ketidakmiripan antar klaster berikut: (5) k 1 k F 1 = C p sim NGD (S i, S j ) p=1 S i,s j C p k F 2 = 1 C p 1 sim NGD (S i, S j ) C q p=1 q=p+1 S i C p S j C q (6) (7) Keterangan: C P = Klaster 19

17 Persamaan (6) menentukan kemiripan intra-klaster dan Persamaan (7) menentukan ketidakmiripan antar klaster. 4. Modified Discrete Differential Evolution Modified Discrete Differential Evolution (MDDE) adalah modifikasi dari metode Differential Evolution (DE). DE merupakan metode untuk menyelesaikan masalah optimasi yang diperkenalkan oleh Rainer Storn dan Kenneth Price pada tahun Metode ini merupakan salah satu metode evolutionary selain algoritma genetika dan fuzzy. Tahapan pada DE adalah inisialisasi populasi, evaluasi fitness, mutasi, crossover, dan seleksi (Storn & Prince, 1997). Ada beberapa perbedaan antara MDDE dan DE, yaitu: setiap elemen pada populasi MDDE menggunakan bilangan asli, mutasi berdasarkan algoritma genetika, dan tidak ada tahap crossover. Penggunaan bilangan asli pada MDDE memudahkan klasterisasi karena setiap elemen dapat mewaliki suatu klaster. Setiap elemen pada MDDE bernilai diantara 1 sampai k, dimana k mewakili banyak klaster. Inisialisasi populasi pada MDDE dilakukan dengan membuat populasi berisi serangkaian nilai acak dari 1 sampai k. Representasi sebuah populasi adalah sebagai berikut: X r (t) = [x r,1 (t), x r,2 (t), x r,3 (t),, x r,d (t)] (8) Keterangan: t=generasi N=banyak populasi k=banyak klaster D=banyak elemen / banyak kalimat x r,s (t) {1,2,, k} r = 1,2,3,, N & s = 1,2,3,, D 20

18 Sebagai contoh, misalkan banyak kalimat=6, banyak klaster=2, dan banyak populasi =3, maka contoh populasinya adalah: X 1 (t) = [1,2,1,2,2,1], X 2 (t) = [2,1,2,1,1,2], X 3 (t) = [2,1,1,1,2,2] Populasi X 1 (t) mempunyai makna kalimat 1,3,6 berada pada klaster 1 dan kalimat 2,4,5 berada pada klaster 2. Setelah populasi awal dibuat, perhitungan fitness dilakukan. Perhitungan fitness dilakukan untuk menentukan kualitas dari masing-masing populasi. Berdasarkan Persamaan (4), (6), dan (7), fitness yang sesuai adalah: Fitness(X r (t)) = F(X r (t)) fitness 1 (X r (t)) = F 1 (X r (t)) 1 fitness 2 (X r (t)) = F 2 (X r (t)) (9) (10) (11) Tahap selanjutnya pada MDDE adalah mutasi. Untuk setiap populasi X r (t), dibuat populasi M r (t + 1) = [m r,1 (t + 1), m r,2 (t + 1),,, m r,d (t + 1)], yang didefinisikan sebagai berikut: m r,s (t + 1) = { 1, rnd(s) < sigm (y r,s(t + 1)) 0, rnd(s) sigm (y r,s (t + 1)) (12) M r (t + 1) merepresentasikan perubahan yang diperlukan untuk mentransformasi X r (t) menjadi Y r (t + 1). Y r (t + 1) merupakan calon populasi generasi selanjutnya. Jika m r,s (t + 1) = 1 maka elemen tersebut akan disalin dari X r (t) ke Y r (t + 1). Jika m r,s (t + 1) = 0 maka elemen tersebut dimutasi. Proses mutasi adalah dengan melakukan inversi posisi elemen X r (t) yang mempunyai 21

19 elemen nol pada populasi M r (t + 1). Contoh proses inversi ditunjukkan pada Gambar 2 sebagai berikut: X r (t) M r (t + 1) Y r (t + 1) Gambar 2. Contoh Proses Inversi Setelah populasi hasil mutasi terbentuk, selanjutnya dilakukan proses seleksi. Nilai fitness populasi hasil mutasi dibandingkan dengan nilai fitness populasi awal. Populasi dengan nilai fitness lebih besar dipilih menjadi populasi generasi selanjutnya. Proses seleksi didefinisikan sebagai berikut: X r (t + 1) = { Y r(t + 1) X r (t), f(y r (t + 1)) < f(x r (t)), f(y r (t + 1)) f(x r (t)) (13) Kriteria penghentian MDDE dapat menggunakan batas waktu CPU atau batas generasi maksimal (t max ). Setelah generasi optimal didapatkan, dipilih populasi dengan nilai fitness terbesar. Populasi tersebut merupakan hasil klasterisasi yang akan digunakan pada pemilihan kalimat penting. E. Pemilihan Kalimat Penting (Aliguliyev, 2010) Pada peringkasan teks menggunakan klasterisasi kalimat, masing-masing klaster dipilih satu kalimat yang mewakili klaster tersebut. Perhitungan kalimat terpenting pada setiap klaster menggunakan fungsi bobot rata-rata kalimat pada klaster sebagai berikut: 22

20 degc p (S i ) = 1 C p sim NGD(S i, S j ), i j S j C P (14) Kalimat dengan nilai degc p terbesar setiap klaster merupakan kalimat yang akan ditampilkan pada ringkasan. F. Evaluasi Ringkasan (Steinberger & Jeˇzek, 2009) Pada dasarnya, evaluasi ringkasan dilakukan dengan membandingkan hasil ringkasan sistem dengan hasil ringkasan pakar. Kalimat yang ada pada ringkasan pakar dan ringkasan sistem dinamakan correct. Kalimat hasil ringkasan pakar yang tidak ada dalam ringkasan sistem dinamakan missed. Kalimat hasil ringkasan sistem yang tidak termasuk dalam ringkasan pakar dinamakan wrong. Gambar 3 di bawah ini menunjukkan hubungan ketiga variabel di atas. Wrong Hasil Sistem Hasil Pakar Missed Correct Gambar 3. Hubungan Ringkasan Sistem dan Ringkasan Pakar Dari ketiga variabel di atas, persamaan untuk menghitung akurasi sistem sebagai berikut: Precision Precision (P) adalah perbandingan kalimat yang sama-sama muncul pada ringkasan sistem dan ringkasan pakar dengan banyak kalimat di ringkasan pakar. P = correct correct + wrong (15) 23

21 Recall Recall (R) adalah perbandingan kalimat yang sama-sama muncul pada ringkasan sistem dan ringkasan pakar dengan banyak kalimat di ringkasan sistem. R = correct correct + missed (16) F-Score F-Score merupakan hubungan antara precision dan recall yang menyatakan akurasi sistem peringkasan. F-Score = 2PR P+R (17) G. Sistem Menurut Kadir (2003:54), sistem adalah sekumpulan elemen yang saling terkait atau terpadu untuk mencapai tujuan. Sedangkan menurut Jogiyanto (2005:2), sistem adalah sekumpulan elemen-elemen yang berinteraksi untuk mencapai suatu tujuan tertentu. Berdasarkan pendapat di atas, sistem merupakan sekumpulan elemen yang saling terkait dan berinteraksi untuk mencapai tujuan tertentu. Menurut Jogiyanto (2005:3-5) sistem mempunyai karasteristik atau sifat-sifat tertentu, yaitu: 1. Komponen Sistem : suatu sistem terdiri dari sejumlah komponen yang saling berinteraksi, yang artinya saling kerjasama membentuk satu kesatuan. 24

22 2. Sifat-sifat : sistem itu terdiri untuk menjalankan fungsi tertentu dan mempunyai sistem yang lain secara keseluruhan. 3. Batasan (Boundary) Sistem : daerah yang membatasi antara suatu sistem dengan sistem yang lainnya. 4. Lingkungan Luar Sistem (Environment) : apapun diluar batasan sistem yang mempengaruhi operasi sistem, lingkungan luar sistem dapat bersifat menguntungkan dan juga dapat bersifat merugikan sistem tersebut. 5. Penghubung (Interface) Sistem : media penghubung antara suatu subsistem dengan subsistem lainya. 6. Masukkan Sistem (Input) : energi yang dimasukkan kedalam sistem, masukan dapat berupa masukkan perawatan (Maintenace Input), dan masukkan sinyal (Signal Input), maintenance input adalah energi yang dimasukkan supaya sistem tersebut dapat beroperasi. Sedangkan signal input adalah energi yang di proses untuk mendapatkan keluaran. 7. Keluaran Sistem (Output) : hasil energi yang diolah dan di klasifikasikan menjadi keluaran yang berguna dan sisa pembuangan keluaran dapat merupakan masukan untuk subsistem yang lain kepada supra sistem. 8. Sasaran Sistem : suatu sistem pasti memiliki sasaran atau tujuan (Goal). Sasaran dari sistem sangat menentukan sekali masukan yang dibutuhkan sistem dan keluaran yang akan di hasilkan sistem. H. Model Perancangan Sistem Perancangan sistem merupakan pengembangan sistem baru untuk mengatasi masalah pada sistem yang lama. Model perancangan sistem yang akan 25

23 dipakai pada penelitian ini adalah metode analisis sistem terstruktur atau model Waterfall. Tahapan pada model Waterfall disusun bertingkat dan dilakukan secara berurutan. Ada empat tahapan pada model Waterfall, yakni: Analysis, Design, Code, dan Test (Pressman, 2001:28). Tahapan pada model Waterfall dapat disajikan pada Gambar 4 sebagai berikut: System / Information Engineering Analysis Design Code Test Gambar 4. Tahapan Model Waterfall Uraian tahap-tahap pada model Waterfall adalah sebagai berikut: 1. Analysis adalah tahap menganalisa hal-hal yang diperlukan dalam pelaksanaan perancangan sistem. 2. Design adalah tahap penerjemah atau tahap perancangan dari keperluankeperluan yang dianalisis dalam bentuk yang lebih mudah dimengerti oleh pemakai. 3. Code adalah tahap implementasi dari hasil sistem yang telah dirancang dalam bahasa pemrograman yang telah ditentukan dan digunakan dalam pembuatan sistem. 4. Test adalah tahap pengujian terhadap program yang telah dibuat. Pengujian dilakukan agar fungsi-fungsi dalam sistem bebas dari error, dan hasilnya 26

24 harus benar-benar sesuai dengan kebutuhan yang sudah didefinisikan sebelumnya. I. Diagram Sequence Diagram sequence menggambarkan interaksi antar objek secara berurutan di dalam sebuah sistem (Bell, 2004). Tujuan utama diagram sequence adalah untuk mendefinisikan urutan kejadian untuk mendapatkan output dari suatu proses. Diagram sequence terdiri atas dimensi vertikal (waktu) dan dimensi horizontal (objek yang terkait). Simbol-simbol yang digunakan dalam diagram sequence ditunjukkan pada Tabel 10 di bawah ini: Tabel 10. Simbol Pada Diagram Sequence Simbol Keterangan Actor Boundary Control Entity Object Message Message to Self Return Message Lifeline Penjelasan masing-masing simbol adalah sebagai berikut: Actor menggambarkan seseorang atau sesuatu yang berinteraksi dengan sistem. 27

25 Boundary menggambarkan interaksi antara satu atau lebih actor dengan sistem, memodelkan bagian dari sistem yang bergantung pada pihak di sekitarnya dan merupakan pembatas dari dunia luar. Control menggambarkan perilaku mengatur, mengoordinasikan perilaku sistem dan dinamika dari suatu sistem, menangani tugas utama, dan mengontrol alur kerja suatu sistem. Entity menggambarkan informasi yang harus disimpan oleh sistem. Object Message menggambarkan pesan/hubungan antar objek. Message to Self menggambarkan pesan/hubungan obyek itu sendiri. Return Message menggambarkan pesan/hubungan antar objek. Lifeline menggambarkan eksekusi objek. J. Pengujian Sistem Pengujian merupakan metode yang dilakukan untuk menjelaskan mengenai pengoperasian perangkat lunak. Pengujian sistem yang dilakukan adalah pengujian Betha. Pengujian ini bersifat objektif dan dilakukan oleh pengguna/user. Hasil pengujian Betha berupa persentase dan dicari dengan menggunakan persamaan sebagai berikut: Y = ( P Q ) 100% (18) Keterangan : Y = Nilai persentase P = Banyaknya jawaban responden tiap soal Q = Total responden 28

26 Ada beberapa faktor yang mempengaruhi kualitas sistem. Faktor yang sering digunakan oleh pengembang software adalah faktor McCall (Indrajit, 2012:2). Faktor-faktor McCall tersebut adalah: 1. Correctness: sejauh mana suatu perangkat lunak memenuhi keinginan dari user. 2. Reliability: sejauh mana suatu perangkat lunak dapat diharapkan untuk melaksanakan fungsinya dengan ketelitian yang diperlukan. 3. Efficiency: banyaknya sumber daya komputasi dan kode program yang dibutuhkan suatu perangkat lunak untuk melakukan fungsinya. 4. Integrity: sejauh mana akses ke perangkat lunak dan data oleh pihak yang tidak berhak dapat dikendalikan. 5. Usability: usaha yang diperlukan untuk mempelajari, mengoperasikan, menyiapkan input, dan mengartikan output dari perangkat lunak. 6. Maintainability: usaha yang diperlukan untuk menetapkan dan memperbaiki kesalahan dalam program. 7. Testability: usaha yang diperlukan untuk menguji program untuk memastikan bahwa program melaksanakan fungsi yang ditetapkan. 8. Flexibility: usaha yang diperlukan untuk memodifikasi program operasional. 9. Portability: usaha yang diperlukan untuk memindahkan program dari perangkat keras / lingkungan sistem perangkat lunak tertentu ke yang lainnya. 10. Reusability: tingkat kemampuan program / bagian dari program yang dapat dipakai ulang dalam aplikasi lainnya, berkaitan dengan paket dan lingkup dari fungsi yang dilakukan oleh program. 29

27 11. Interoperability: usaha yang diperlukan untuk menggabungkan satu sistem dengan yang lainnya. K. PHP Pada mulanya, PHP merupakan singkatan dari Personal Home Page. PHP diciptakan oleh Rasmus Lerdorf pada tahun 1994 untuk melacak pengunjung resume online miliknya. Seiring meningkatnya kemampuan dan kegunaan PHP, PHP memiliki makna baru, yakni PHP: Hypertext Preprocessor (Ullman, 2011:ix). Berdasarkan situs resminya, PHP merupakan bahasa pemrograman yang cocok dengan web development dan dapat dilekatkan pada HTML. PHP merupakan bahasa pemrograman pada sisi server, sehingga PHP berjalan di server dan mengirimkan informasi yang sesuai ke browser. PHP merupakan alat yang tepat untuk membuat halaman web dinamis. Diagram proses antara client, server, dan PHP ditunjukkan pada Gambar 5. Client URL Request Server HTML HTML Script Request PHP Gambar 5. Diagram Proses PHP 30

IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT

IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT 10108371 Latar Belakang Masalah 1. Jumlah buku yang semakin banyak. 2. Belum adanya sistem pencarian informasi buku

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Plagiarisme Menurut Peraturan Menteri Pendidikan RI Nomor 17 Tahun 2010 dikatakan: "Plagiat adalah perbuatan sengaja atau tidak sengaja dalam memperoleh atau mencoba memperoleh

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Peringkas Teks Otomatis Berikut ini akan dibahas mengenai teori-teori peringkas teks otomatis dalam beberapa subbab, yaitu sebagai berikut: 2.1.1 Definisi Peringkas Teks Otomatis

Lebih terperinci

BAB III PEMBAHASAN. untuk menampilkan ringkasan dari teks yang dimasukkan pengguna. Ringkasan

BAB III PEMBAHASAN. untuk menampilkan ringkasan dari teks yang dimasukkan pengguna. Ringkasan BAB III PEMBAHASAN Pada penelitian ini akan dibuat sistem peringkasan teks. Sistem ini bertujuan untuk menampilkan ringkasan dari teks yang dimasukkan pengguna. Ringkasan yang ditampilkan adalah kalimat-kalimat

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM. Jurnal PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM Jurnal Diajukan kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta untuk

Lebih terperinci

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM

PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM HALAMAN JUDU L PERINGKASAN TEKS BAHASA INDONESIA MENGGUNAKAN MODIFIED DISCRETE DIFFERENTIAL EVOLUTION ALGORITHM SKRIPSI Diajukan kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri

Lebih terperinci

IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING

IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING DOSEN PEMBIMBING Diana Purwitasarti, S.Kom., M.Sc. MAHASISWA Andita Dwiyoga T (5106

Lebih terperinci

BAB 2 LANDASAN TEORI. 2.1 Text mining

BAB 2 LANDASAN TEORI. 2.1 Text mining BAB 2 LANDASAN TEORI Bab ini akan membahas landasan teori, penelitian terdahulu, kerangka pikir, dan hipotesis yang mendasari penyelesaian permasalahan dalam pengklasifikasian novel menggunakan TF-IDF.

Lebih terperinci

Self Organizing Map-Neural Network untuk Pengelompokan Abstrak

Self Organizing Map-Neural Network untuk Pengelompokan Abstrak 160 ISSN: 2354-5771 Self Organizing Map-Neural Network untuk Pengelompokan Abstrak Self Organizing Map - Neural Network for Abstract Clustering Fajar Rohman Hariri* 1, Danar Putra Pamungkas 2 1,2 Universitas

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Text Mining Text mining merupakan teknik yang digunakan untuk menangani masalah klasifikasi, clustering, information extraction, dan information retrieval (Berry & Kogan, 2010).

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori, penelitian terdahulu, dan kerangka pikir yang mendasari penyelesaian permasalahan stemming dengan menggunakan algoritma enhanced confix

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi.1 Volume. 1 Bulan AGUSTUS ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi.1 Volume. 1 Bulan AGUSTUS ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 IMPLEMENTASI METODE VECTOR SPACE MODEL (VSM) UNTUK REKOMENDASI NILAI TERHADAP JAWABAN ESSAY Harry Septianto Teknik Informatika Universitas Komputer Indonesia

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkas Teks Otomatis 2.1.1 Pengertian Konsep sederhana ringkasan adalah mengambil bagian penting dari keseluruhan isi dari artikel. Ringkasan adalah mengambil isi yang paling

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB 3 ANALISIS DAN PERANCANGAN SISTEM BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Sistem 3.1.1 Analisis Masalah Dilihat dari sistem yang sedang berjalan saat ini sistem pencarian yang berlaku masih manual, dimana pengunjung perpustakaan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Dasar Teori 2.1.1. Kuis Online Kuis, sebagaimana didefinisikan oleh WordWeb Online (2005) adalah "sebuah ujian yang berisi pertanyaan singkat". QuestionMark & League (2004)

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Information Retrieval System Sistem temu kembali informasi ( information retrieval system) merupakan sistem yang dapat digunakan untuk menemukan informasi yang relevan dengan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Kata Pengertian kata secara sederhana adalah sekumpulan huruf yang mempunyai arti. Dalam kamus besar bahasa indonesia (KBBI) pengertian kata adalah unsur bahasa yang diucapkan

Lebih terperinci

BAB II LANDASAN TEORI. Menurut McLeod dalam buku Al-Bahra (2005:3) Sistem adalah. Menurut Lucas dalam buku Al-Bahra (2005:3) Sistem sebagai suatu

BAB II LANDASAN TEORI. Menurut McLeod dalam buku Al-Bahra (2005:3) Sistem adalah. Menurut Lucas dalam buku Al-Bahra (2005:3) Sistem sebagai suatu BAB II LANDASAN TEORI 2.1 Pengertian Sistem Terdapat beberapa pengertian sistem menurut beberapa ahli yang diantaranya sebagai berikut: Menurut McLeod dalam buku Al-Bahra (2005:3) Sistem adalah sekelompok

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

APLIKASI PENDETEKSI KEMIRIPAN PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA NAZIEF & ADRIANI DAN METODE COSINE SIMILARITY

APLIKASI PENDETEKSI KEMIRIPAN PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA NAZIEF & ADRIANI DAN METODE COSINE SIMILARITY APLIKASI PENDETEKSI KEMIRIPAN PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA NAZIEF & ADRIANI DAN METODE COSINE SIMILARITY Azhar Firdaus, Ernawati, dan Arie Vatresia Program Studi Teknik Informatika, Fakultas

Lebih terperinci

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah 3.1.1 Analisis Kebutuhan Ada banyak hal yang berhubungan dengan sastra atau ilmu bahasa yang dapat diterapkan di dalam teknologi, seperti penerjemahan

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

SISTEM TEMU BALIK INFORMASI

SISTEM TEMU BALIK INFORMASI SISTEM TEMU BALIK INFORMASI Algoritma Nazief dan Adriani Disusun Oleh: Dyan Keke Rian Chikita Agus Dwi Prayogo 11/323494/PA/14356 11/323813/PA/14362 11/323856/PA/14367 PRODI S1 ILMU KOMPUTER JURUSAN ILMU

Lebih terperinci

BAB I PENDAHULUAN I-1

BAB I PENDAHULUAN I-1 BAB I PENDAHULUAN 1.1 Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas merupakan sebuah bukti nyata bahwa informasi sangat diperlukan bagi pencari informasi [16]. Dengan munculnya

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING

IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING 1 IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING Andita Dwiyoga Tahitoe - Diana Purwitasari Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan

BAB II LANDASAN TEORI. 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

IMPLEMENTASI METODE MAXIMUM MARGINAL RELEVANCE PADA PERINGKASAN TEKS OTOMATIS ARTIKEL BERITA

IMPLEMENTASI METODE MAXIMUM MARGINAL RELEVANCE PADA PERINGKASAN TEKS OTOMATIS ARTIKEL BERITA IMPLEMENTASI METODE MAXIMUM MARGINAL RELEVANCE PADA PERINGKASAN TEKS OTOMATIS ARTIKEL BERITA SKRIPSI diajukan sebagai salah satu persyaratan untuk memperoleh gelar Sarjana Pendidikan Program Studi Pendidikan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketersediaan informasi yang semakin banyak menjadikan ringkasan sebagai kebutuhan yang sangat penting (Mulyana, 2010). Menurut (Hovy, 2001) Ringkasan merupakan teks

Lebih terperinci

IMPLEMENTASI ALGORITMA MULTINOMIAL NAIVE BAYES CLASSIFIER PADA SISTEM KLASIFIKASI SURAT KELUAR (Studi Kasus : DISKOMINFO Kabupaten Tangerang)

IMPLEMENTASI ALGORITMA MULTINOMIAL NAIVE BAYES CLASSIFIER PADA SISTEM KLASIFIKASI SURAT KELUAR (Studi Kasus : DISKOMINFO Kabupaten Tangerang) JURNAL TEKNIK INFORMATIKA VOL.10 NO.2, 2017 109 IMPLEMENTASI ALGORITMA MULTINOMIAL NAIVE BAYES CLASSIFIER PADA SISTEM KLASIFIKASI SURAT KELUAR (Studi Kasus : DISKOMINFO Kabupaten Tangerang) Dea Herwinda

Lebih terperinci

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA Ledy Agusta Fakultas Teknologi Informasi Universitas Kristen Satya Wacana ledyagusta@gmail.com

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama proses pembuatan tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat dilihat

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan rekomendasi tag serta metode TF-IDF dan Collaborative tagging. 2.1 Rekomendasi Tag Rekomendasi

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III BAB 3 METODE PENELITIAN 3.1. Tahap pengumpulan data Data awal dalam penelitian ini adalah dokumen berupa artikel teks berita online dalam bahasa Indonesia yang dikumpulkan secara acak dari portal

Lebih terperinci

BAB III LANDASAN TEORI. order penjualan, nomor penjualan. (Stair, 2006) daripada kumpulan kebenaran itu sendiri. (Stair, 2006)

BAB III LANDASAN TEORI. order penjualan, nomor penjualan. (Stair, 2006) daripada kumpulan kebenaran itu sendiri. (Stair, 2006) BAB III LANDASAN TEORI 3.1 Data Dan Informasi Data adalah sebuah kebenaran, atau kenyataan, contoh nama pegawai, order penjualan, nomor penjualan. (Stair, 2006) Informasi adalah sekumpulan kebenaran atau

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Peringkasan Teks Otomatis (Automatic Text Summarization) Peringkasan Teks Otomatis (Automatic Text Summarization) merupakan pembuatan rangkuman dari sebuah sumber teks secara

Lebih terperinci

BAB II DASAR TEORI. 2.1 Konsep Dasar Sistem Aplikasi Pengertian Sistem. Pengertian sistem adalah kumpulan dari elemen-elemen yang berinteraksi

BAB II DASAR TEORI. 2.1 Konsep Dasar Sistem Aplikasi Pengertian Sistem. Pengertian sistem adalah kumpulan dari elemen-elemen yang berinteraksi BAB II DASAR TEORI 2.1 Konsep Dasar Sistem Aplikasi 2.1.1 Pengertian Sistem Pengertian sistem adalah kumpulan dari elemen-elemen yang berinteraksi untuk mencapai suatu tujuan tertentu. Suatu sistem mempunyai

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori mengenai pendeteksian kemiripan dokumen teks yang mengkhususkan pada pengertian dari keaslian dokumen, plagiarisme, kemiripan dokumen, dan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang

BAB I PENDAHULUAN 1.1 Tujuan 1.2 Latar Belakang BAB I PENDAHULUAN 1.1 Tujuan Merancang sebuah sistem yang dapat meringkas teks dokumen secara otomatis menggunakan metode generalized vector space model (GVSM). 1.2 Latar Belakang Dunia informasi yang

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi Penelitian adalah sekumpulan peraturan, kegiatan, dan prosedur yang digunakan oleh pelaku suatu disiplin ilmu. Metodologi juga merupakan analisis teoritis mengenai

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Kebutuhan akan informasi yang sangat luas dan tidak terbatas seiring dengan sumber informasi yang banyak merupakan suatu bukti konkret bahwa informasi sangat dibutuhkan

Lebih terperinci

BAB I PENDAHULUAN. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat

BAB I PENDAHULUAN. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam media internet artikel merupakan suatu kebutuhan dan pengetahuan. Pada umumnya pembaca ingin mendapatkan rangkuman suatu artikel dengan cepat tanpa membaca

Lebih terperinci

BAB II LANDASAN TEORI. bidang media komunikasi dan informasi. Internet adalah suatu jaringan komputer

BAB II LANDASAN TEORI. bidang media komunikasi dan informasi. Internet adalah suatu jaringan komputer BAB II LANDASAN TEORI 2.1 World Wide Web Dunia internet semakin berkembang, terutama penggunaanya dalam bidang media komunikasi dan informasi. Internet adalah suatu jaringan komputer global, sedangkan

Lebih terperinci

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity

Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Pemodelan Penilaian Essay Otomatis Secara Realtime Menggunakan Kombinasi Text Stemming Dan Cosine Similarity Komang Rinartha

Lebih terperinci

Learning Vector Quantization untuk Klasifikasi Abstrak Tesis

Learning Vector Quantization untuk Klasifikasi Abstrak Tesis 128 ISSN: 2354-5771 Learning Vector Quantization untuk Klasifikasi Abstrak Tesis Fajar Rohman Hariri* 1, Ema Utami 2, Armadyah Amborowati 3 1,2,3 Magister Teknik Informatika STMIK AMIKOM Yogyakarta E-mail:

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Sumber informasi atau referensi sudah merupakan hal yang tidak asing lagi bagi seorang peneliti, terutamanya bagi para mahasiswa yang sedang melakukan penelitian untuk

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

Klasifikasi Konten Berita Dengan Metode Text Mining

Klasifikasi Konten Berita Dengan Metode Text Mining JURNAL DUNIA TEKNOLOGI INFORMASI Vol. 1, No. 1, (2012) 14-19 14 Klasifikasi Konten Berita Dengan Metode Text Mining 1 Bambang Kurniawan, 1 Shril Effendi, 1 Opim Salim Sitompul 1 Program Studi S1 Teknologi

Lebih terperinci

II. TINJAUAN PUSTAKA

II. TINJAUAN PUSTAKA 4 II. TINJAUAN PUSTAKA 2.1 Konsep Dasar Sistem Sistem adalah sekumpulan unsur yang melakukan suatu kegiatan atau menyusun skema (alur) yang melakukan suatu kegiatan pemrosesan untuk mencapai suatu tujuan.

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 7 BAB II TINJAUAN PUSTAKA 2.1 Penelitian Terdahulu Pembuatan website sangat terbantu dengan adanya referensi-referensi yang ada. Adanya informasi tersebut dapat membantu menyajikan konten yang baik dan

Lebih terperinci

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25

Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi BM25 54 Widiasri, M., dkk.: Peningkatan Kinerja Pencarian Dokumen Tugas Akhir Menggunakan Peningkatan Kinerja Pencarian Dokumen Tugas Akhir menggunakan Porter Stemmer Bahasa Indonesia dan Fungsi Peringkat Okapi

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

1.5 Metode Penelitian

1.5 Metode Penelitian BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dalam perkembangan teknologi internet yang semakin maju ini kita dapat mengakses dokumen, buku dan majalah mulai dari bahasa asing sampai bahasa daerah yang

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan rangkaian dari langkah-langkah yang diterapkan dalam penelitian, secara umum dan khusus langkah-langkah tersebut tertera pada Gambar flowchart

Lebih terperinci

BAB I PENDAHULUAN. MMS (Multimedia Messaging Service) adalah puncak dari evolusi SMS

BAB I PENDAHULUAN. MMS (Multimedia Messaging Service) adalah puncak dari evolusi SMS BAB I PENDAHULUAN 1.1 Latar Belakang Masalah MMS (Multimedia Messaging Service) adalah puncak dari evolusi SMS (Short Messaging Service) yang berupa pesan teks pendek, dan EMS (Enhanced Messaging Service)

Lebih terperinci

commit to user BAB II TINJAUAN PUSTAKA

commit to user BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Cosine Similarity Secara umum, fungsi similarity adalah fungsi yang menerima dua buah objek dan mengembalikan nilai kemiripan (similarity) antara kedua objek

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Plagiarisme 2.1.1. Pengertian plagiarisme Maxim Mozgovoy (2007) mengemukakan bahwa komputer jika dan hanya jika dapat mendeteksi plagiarisme apabila sejumlah dokumen dianggap

Lebih terperinci

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING Julianto Wibowo Mahasiswa Program Studi Teknik Informatika, STMIK Budi Darma Medan Jl. Sisimangaraja

Lebih terperinci

BAB II LANDASAN TEORI. Pengertian sistem terbagi menjadi dua yaitu : pendekatan yang menekankan pada elemen / komponen.

BAB II LANDASAN TEORI. Pengertian sistem terbagi menjadi dua yaitu : pendekatan yang menekankan pada elemen / komponen. 10 BAB II LANDASAN TEORI 2.1. Pengertian Sistem Sistem adalah sekumpulan elemen yang dalam sebuah jaringan yang bekerja secara teratur dalam satu kesatuan yang bulat dan terpadu untuk mencapai sebuah tujuan

Lebih terperinci

BAB II LANDASAN TEORI. beberapa ahli, definisi sistem adalah sebagai berikut.

BAB II LANDASAN TEORI. beberapa ahli, definisi sistem adalah sebagai berikut. BAB II LANDASAN TEORI 2.1 Sistem Sistem memiliki beberapa definisi yang berbeda-beda menurut pendapat beberapa ahli, definisi sistem adalah sebagai berikut. 1. Menurut Jogiyanto (1999:1), sistem adalah

Lebih terperinci

BAB II LANDASAN TEORI. Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling

BAB II LANDASAN TEORI. Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling 6 BAB II LANDASAN TEORI 2.1 Sistem Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling berhubungan, berkumpul bersama-sama untuk melakukan suatu kegiatan atau untuk menyelesaikan suatu

Lebih terperinci

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER Dony Yudha Lestiyanto, A12.2009.03537 Sistem Informasi S1 Universitas Dian Nuswantoro Semarang 2014 Abstrak Stemming

Lebih terperinci

TELEMATIKA, Vol. 12, No. 02, JULI, 2015, Pp ISSN X PENILAIAN UJIAN BERTIPE ESSAY MENGGUNAKAN METODE TEXT SIMILARITY

TELEMATIKA, Vol. 12, No. 02, JULI, 2015, Pp ISSN X PENILAIAN UJIAN BERTIPE ESSAY MENGGUNAKAN METODE TEXT SIMILARITY TELEMATIKA, Vol. 12, No. 02, JULI, 2015, Pp. 146 158 ISSN 1829-667X PENILAIAN UJIAN BERTIPE ESSAY MENGGUNAKAN METODE TEXT SIMILARITY Meiyanto Eko Sulistyo 1, Ristu Saptono 2, Adam Asshidiq 3 Jurusan Informatika

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada penelitian tugas akhir ini ada beberapa tahapan penelitian yang akan dilakukan seperti yang terlihat pada gambar 3.1: Identifikasi Masalah Rumusan Masalah Studi Pustaka

Lebih terperinci

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL

SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SISTEM REKOMENDASI DOSEN PEMBIMBING TUGAS AKHIR BERBASIS TEXT MINING MENGGUNAKAN VECTOR SPACE MODEL SKRIPSI Disusun Sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Komputer pada Departemen Ilmu

Lebih terperinci

BAB II LANDASAN TEORI. saling mempengaruhi dalam melakukan kegiatan bersama untuk mencapai. Adapun pegertian sistem menurut Jogiyanto :

BAB II LANDASAN TEORI. saling mempengaruhi dalam melakukan kegiatan bersama untuk mencapai. Adapun pegertian sistem menurut Jogiyanto : BAB II LANDASAN TEORI 2.1. Pengertian Sistem Sistem adalah sekumpulan unsur / elemen yang saling berkaitan dan saling mempengaruhi dalam melakukan kegiatan bersama untuk mencapai suatu tujuan. Adapun pegertian

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Analisis sentimen Analisis sentimen atau opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah 1 BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perusahaan adalah tempat terjadinya kegiatan produksi dan berkumpulnya semua faktor produksi. Setiap perusahaan ada yang terdaftar di pemerintah dan ada pula

Lebih terperinci

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN

BAB 3 PERANCANGAN 3.1 GAMBARAN UMUM PROSES SEGMENTASI DOKUMEN 28 BAB 3 PERANCANGAN Pada bab ini akan dijelaskan mengenai rancangan percobaan pada penelitian segmentasi dokumen ini. Pembahasan akan dimulai dengan penjelasan mengenai gambaran umum proses segmentasi

Lebih terperinci

BAB II LANDASAN TEORI. yang digunakan dalam penyelesaian Tugas Akhir ini, yaitu System Development

BAB II LANDASAN TEORI. yang digunakan dalam penyelesaian Tugas Akhir ini, yaitu System Development BAB II LANDASAN TEORI Dalam penyusunan tugas akhir ini dibutuhkan beberapa landasan teori sebagai acuan dalam penyusunannya. Landasan teori yang dibutuhkan antara lain teori tentang Rancang Bangun, teori

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1 Text Mining Text mining merupakan suatu teknologi untuk menemukan suatu pengetahuan yang berguna dalam suatu koleksi dokumen teks sehingga diperoleh tren, pola, atau kemiripan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Pengertian Stemming Stemming merupakan suatu proses atau cara dalam menemukan kata dasar dari suatu kata. Stemming sendiri berfungsi untuk menghilangkan variasi-variasi morfologi

Lebih terperinci

Jurnal String Vol.1 No.2 Tahun 2016 ISSN :

Jurnal String Vol.1 No.2 Tahun 2016 ISSN : PERBANDINGAN ALGORITMA STEMMING PORTER DENGANARIFIN SETIONO UNTUK MENENTUKAN TINGKAT KETEPATAN KATA DASAR Dian Novitasari Program Studi Teknik Informatika, Universitas Indraprasta PGRI Emai : diannovita.unindra@gmail.com

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

BAB II LANDASAN TEORI. digunakan untuk memodelkan kebutuhan data dari suatu organisasi,

BAB II LANDASAN TEORI. digunakan untuk memodelkan kebutuhan data dari suatu organisasi, BAB II LANDASAN TEORI 2.1 Entity Relationship Diagram Entity Relationship Diagram (ERD) merupakan teknik yang digunakan untuk memodelkan kebutuhan data dari suatu organisasi, biasanya oleh System Analys

Lebih terperinci

Bab 2 Tinjuan Pustaka 2.1 Penelitian Sebelumnya

Bab 2 Tinjuan Pustaka 2.1 Penelitian Sebelumnya 5 Bab 2 Tinjuan Pustaka 2.1 Penelitian Sebelumnya Penerapan virtual map berbasis web cukup banyak digunakan. Dalam penelitian yang berjudul Pembuatan Peta 3 Dimensi Kampus ITS, menyatakan bahwa peta merupakan

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN 4.1 Analisa Sistem Lama Pada sistem peringkasan dokumen sebelumnya sistem sudah bisa dijalankan namun masih adanya kekurangan pada sistem tersebut yaitu penginputan dokumen

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua

BAB IV HASIL DAN PEMBAHASAN. jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua BAB IV HASIL DAN PEMBAHASAN 4.1. Dokumen yang digunakan Pada penelitian yang dilakukan oleh penulis ini menggunakan dua jenis dokumen, yaitu dokumen training dan dokumen uji. Kemudian dua jenis dokumen

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI digilib.uns.ac.id BAB II LANDASAN TEORI 2.1 Sistem Informasi 2.1.1 Pengertian dan Karakteristik Sistem Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling berhubungan, berkumpul bersama-sama

Lebih terperinci

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2]

BAB II DASAR TEORI Crawler Definisi Focused Crawler dengan Algoritma Genetik [2] BAB II DASAR TEORI Pada bab ini dibahas teori mengenai focused crawler dengan algoritma genetik, text mining, vector space model, dan generalized vector space model. 2.1. Focused Crawler 2.1.1. Definisi

Lebih terperinci

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining

commit to user 5 BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori Text mining BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Text mining Text mining adalah proses menemukan hal baru, yang sebelumnya tidak diketahui, mengenai informasi yang berpotensi untuk diambil manfaatnya dari

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI Pada bab ini akan dibahas mengenai beberapa landasan teori yang digunakan untuk perancangan dan pembuatan aplikasi rekomendasi informasi yang bisa dijadikan sebagai acuan. 3.1 Media

Lebih terperinci

BAB II LANDASAN TEORI Konsep Dasar Membangun Aplikasi Berbasis Web

BAB II LANDASAN TEORI Konsep Dasar Membangun Aplikasi Berbasis Web BAB II LANDASAN TEORI 2.1. Konsep Dasar Membangun Aplikasi Berbasis Web Aplikasi berbasis web adalah aplikasi yang dijalankan melalui browser dan diakses melalui jaringan komputer. Aplikasi berbasis web

Lebih terperinci

BAB III 3. LANDASAN TEORI

BAB III 3. LANDASAN TEORI BAB III 3. LANDASAN TEORI 3.1. Definisi Berita Berita adalah sebuah laporan atau pemberitahuan mengenai terjadinya sebuah peristiwa atau keadaan yang bersifat umum dan baru saja terjadi yang disampaikan

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 49 RANCANG BANGUN APLIKASI CHATBOT INFORMASI OBJEK WISATA KOTA BANDUNG DENGAN PENDEKATAN NATURAL LANGUAGE PROCESSING Elisabet Nila S. C. P 1, Irawan Afrianto 2 1,2 Program Studi Teknik Informatika Fakultas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Text mining Menurut Feldman dan Sanger (Feldman dan Sanger, 2007), text mining dapat didefinisikan secara luas sebagai proses pengetahuan intensif yang memungkinkan pengguna berinteraksi

Lebih terperinci

PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIV. MUHAMMADIYAH MALANG) TUGAS AKHIR

PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIV. MUHAMMADIYAH MALANG) TUGAS AKHIR PENCARIAN DOKUMEN MENGGUNAKAN METODE SINGLE PASS CLUSTERING (STUDI KASUS : ABSTRAKSI TA TEKNIK INFORMATIKA UNIV. MUHAMMADIYAH MALANG) TUGAS AKHIR Sebagai Persyaratan Guna Meraih Gelar Sarjana Strata 1

Lebih terperinci

ANALISIS KLASTERING LIRIK LAGU INDONESIA

ANALISIS KLASTERING LIRIK LAGU INDONESIA ANALISIS KLASTERING LIRIK LAGU INDONESIA Afdilah Marjuki 1, Herny Februariyanti 2 1,2 Program Studi Sistem Informasi, Fakultas Teknologi Informasi, Universitas Stikubank e-mail: 1 bodongben@gmail.com,

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN

BAB 3 ANALISIS DAN PERANCANGAN BAB 3 ANALISIS DAN PERANCANGAN 3.1 Analisis Masalah Penelitian yang sudah pernah membuat sistem ini berhasil menciptakan pembangkitan pertanyaan non-factoid secara otomatis dengan menggunakan tiga jenis

Lebih terperinci

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN

Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Sistem Temu Kembali Informasi/ Information Retrieval IRS VS SI LAIN Dokumen Penyimpanan yang Terorganisasi Database Mahasiswa Database Buku ID Nama Buku Pengarang 001 Information Retrieval Ricardo baeza

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Saat ini, kebutuhan manusia akan teknologi semakin meningkat karena tidak bisa dipungkiri bahwa teknologi tersebut dapat meringankan pekerjaan manusia. Hal ini juga diimbangi

Lebih terperinci

MODIFIKASI ALGORITMA PORTER UNTUK STEMMING PADA KATA BAHASA INDONESIA

MODIFIKASI ALGORITMA PORTER UNTUK STEMMING PADA KATA BAHASA INDONESIA MODIFIKASI ALGORITMA PORTER UNTUK STEMMING PADA KATA BAHASA INDONESIA Badrus Zaman Program Studi Sistem Informasi, Fakultas Sains dan Teknologi, Universitas Airlangga Jl. Dr. Ir. Soekarno MERR Surabaya

Lebih terperinci

Sistem Wawancara Virtual untuk Penerimaan Mahasiswa Jurusan Teknik Informatika di ITHB dengan Metode Natural Language Processing

Sistem Wawancara Virtual untuk Penerimaan Mahasiswa Jurusan Teknik Informatika di ITHB dengan Metode Natural Language Processing Jurnal Telematika, vol.8 no.1, Institut Teknologi Harapan Bangsa, Bandung, Indonesia Sistem Wawancara Virtual untuk Penerimaan Mahasiswa Jurusan Teknik Informatika di ITHB Harry Hartanto #1, The Houw Liong

Lebih terperinci

BAB II LANDASAN TEORI. pembelian dilakukan dengan mengubah bentuk barang. 2003). Menurut Soemarso S.R (1994) kegiatan pembelian dalam perusahaan

BAB II LANDASAN TEORI. pembelian dilakukan dengan mengubah bentuk barang. 2003). Menurut Soemarso S.R (1994) kegiatan pembelian dalam perusahaan BAB II LANDASAN TEORI 2.1 Pembelian Pembelian adalah usaha pengadaan barang-barang untuk perusahaan. Dalam perusahaan dagang pembelian dilakukan dengan dijual kembali tanpa mengadakan perubahan bentuk

Lebih terperinci