DAFTAR KODE SUMBER. xxxvii

Ukuran: px

Mulai penontonan dengan halaman:

Download "DAFTAR KODE SUMBER. xxxvii"

Liana Kusuma
7 tahun lalu
Tontonan:

1 DAFTAR KODE SUMBER Kode Sumber 2-1 Contoh dokumen RSS... 9 Kode Sumber 2-2 Contoh dokumen XML Kode Sumber 3-1 Pseudocode penguraian RSS Kode Sumber 4-1 Fungsi untuk mengurai konten rss Kode Sumber 4-2 Fungsi untuk menambah channel Kode Sumber 4-3 Fungsi untuk mengunduh konten rss Kode Sumber 4-4 Fungsi untuk menghapus channel Kode Sumber 4-5 Fungsi untuk melakukan pelatihan data Kode Sumber 4-6 Fungsi untuk melakukan klasifikasi Kode Sumber 4-7 Fungsi untuk menambah kategori baru Kode Sumber 4-8 Fungsi untuk menambah data latih baru Kode Sumber 4-9 Fungsi untuk memanggil pengaturan Kode Sumber 4-10 Fungsi untuk menyimpan pengaturan Kode Sumber 4-11 Implementasi kelas objek RSSChannel Kode Sumber 4-12 Implementasi kelas objek RSSItem Kode Sumber 4-13 Implementasi kelas objek Category Kode Sumber 4-14 Implementasi kelas objek Comment Kode Sumber 4-15 Implementasi kelas objek Rule Kode Sumber 4-16 Implementasi kelas objek User Kode Sumber 4-17 Implementasi kelas objek Download Kode Sumber 4-18 Potongan kode sumber kelas RSSChannelDao xxxvii

2 Kode Sumber 4-19 Potongan kode sumber kelas RSSItemlDao Kode Sumber 4-20 Potongan kode sumber kelas RuleDao Kode Sumber 4-21 Potongan kode sumber kelas CategoryDao 152 Kode Sumber 4-22 Potongan kode sumber kelas CommentDao xxxviii

3 BAB 1 PENDAHULUAN Pada bab ini akan dipaparkan mengenai garis besar Tugas Akhir (TA) yang meliputi Latar Belakang, Rumusan Masalah, Batasan Masalah, Tujuan dan Manfaat, Metodologi Pembuatan Tugas Akhir serta Sistematika Penulisan. 1.1 Latar Belakang Berita merupakan salah satu informasi yang banyak diminati oleh sebagian orang baik berita olahraga, kesehatan, sosial, politik maupun teknologi menjadi topik yang sangat menarik untuk dibaca. Hal ini menunjukkan bahwa setiap orang membutuhkan informasi sebagai bagian dari tuntutan kehidupannya, penunjang kegiatannya, bahkan pemenuhan kebutuhannya. Hal ini pula yang melatarbelakangi semakin banyaknya media masa yang bermunculan dalam memenuhi kebutuhan para pembaca berita tersebut baik dengan menyediakan berbagai informasi yang hangat dan aktual dalam berbagai bentuk baik cetak maupun elektronik. Sebagian besar orang lebih memilih membaca berita elektonik yang disediakan oleh beberapa situs web daripada media cetak karena lebih ekonomis dan efektif dalam memilih berita yang diinginkan. Pada umumnya setiap orang akan membuka situs berita yang berbeda untuk mendapatkan informasi-informasi terbaru seputar olahraga, kesehatan, sosial, politik, sosial maupun teknologi baik untuk melengkapi informasi atau hanya sekedar membandingkan kebenarannya. Kondisi seperti ini tentu saja kurang efektif karena setiap orang harus membuka situs berita lain atau halaman berbeda dalam satu situs berita yang sama untuk mendapatkan informasi terbaru yang diinginkan. Saat ini telah terdapat beberapa situs berita yang memberikan informasi berita dari sumber berita yang berbeda seperti Lintas Berita ( Delicious 1

4 2 ( com) dan Digg ( akan tetapi berita yang terdapat pada situs tersebut cenderung menggabungkan berita dari sumber satu dengan sumber berita yang lainnya dalam satu kolom sehingga menyulitkan untuk mendapatkan berita dari sumber berita yang diinginkan secara spesifik dan cepat. Di lain sisi, cara untuk mendapatkan informasi berita terbaru dari suatu situs berita adalah dengan berlangganan RSS yang disediakannya. Teknologi Really Simple Syndication (RSS) ini merupakan teknologi yang memudahkan untuk mendapatkan informasi berita terbaru secara otomatis dari suatu situs tertentu. Pada RSS, setiap kali situs web melakukan pembaruan informasi maka informasi terbaru tersebut akan diterima secara otomatis kepada pelanggan RSS dari situs penyedia RSS tersebut. Pada umumnya beberapa mesin penjelajah web telah memiliki kemampuan untuk menyimpan RSS suatu situs web namun tampilan yang dihasilkan kurang informatif karena hanya berupa judul dan tidak dapat menampilkan gambar dari berita terkait (bila tersedia), bila menginginkan RSS dari berbagai situs web maka mesin penjelajah web akan penuh. Oleh karena itu dibutuhkan perancangan dan pembuatan aplikasi perangkat lunak berbasis web yang mampu membaca dan mengelola RSS tersebut dengan baik dan dinamis sehingga dapat menjadi sebuah website berita tersendiri yang dapat memberikan kenyamanan dan kemudahan dalam mendapatkan informasi berita terbaru secara spesifik sesuai dengan yang dibutuhkan. 1.2 Rumusan dan batasan masalah Rumusan masalah yang diangkat dalam Tugas Akhir ini dapat dipaparkan sebagai berikut: 1. Bagaimana membaca dan mengelola RSS suatu situs berita serta memastikan kontennya selalu diperbarui. 2. Bagaimana mengimplementasikan metode Bayesian dalam mengklasifikasikan berita pada perangkat lunak pembuat berita.

5 3 3. Bagaimana merancang dan mengimplementasikan perangkat lunak pembuat berita dengan menggunakan kerangka kerja JSF. Permasalahan yang dibahas dalam Tugas Akhir ini memiliki beberapa batasan, diantaranya sebagai berikut: 1. Aplikasi ini berbasis web. 2. Perangkat lunak yang dikembangkan hanya membaca RSS Feed. 3. Konten berita pada perangkat lunak diambil dari situs web yang menggunakan bahasa indonesia. 4. Konten berita pada perangkat lunak diklasifikasikan secara otomatis berdasarkan sumber RSS dan kategorikategori tertentu 5. Metode klasifikasi berita yang digunakan adalah Naïve Bayes Classifier. 6. Konten berita pada perangkat lunak hanya berisi text. 7. Perangkat lunak berupa aplikasi web dengan platform Java dengan menggunakan arsitektur MVC dengan kerangka kerja Java Server Faces dan XML sebagai media penyimpanannya 1.3 Tujuan dan manfaat Tugas Akhir ini bertujuan merancang dan membangun perangkat lunak yang dapat membaca serta mengelola RSS dari beberapa situs web secara praktis. Manfaat yang diharapkan dari Tugas Akhir ini yaitu membuat perangkat lunak yang mempu membaca serta mengelola RSS dari beberapa situs web yang menyediakan informasi berita. Informasi berita yang dihasilkan dapat diklasifikasikan berdasarkan sumber RSS berita atau kategori tertentu yang dapat dilakukan secara manual ataupun otomatis sehingga nantinya akan menghasilkan sebuah situs berita tersendiri yang hanya memuat berita-berita secara spesifik yang dinginkan oleh pembaca saja.

6 4 1.4 Metodologi Langkah-langkah yang ditempuh dalam pengerjaan Tugas Akhir ini adalah: 1. Studi Literatur Mencari dan mempelajari berbagai macam literatur yang berkaitan dengan rumusan masalah, teori-teori yang berhubungan dengan sistem yang akan dibangun, perancangan, implementasi, dan teknologi yang digunakan. Fokus studi dilakukan pada penguraian RSS dalam bahasa pemrograman Java, konsep query pada XML, konsep membangun aplikasi pembuat berita dalam ruang kerja Java Server Faces, library antarmuka pengguna Primefaces 3.0 dan metode klasifikasi Naïve Bayes Classifier. 2. Perancangan Perangkat Lunak Dalam tahap ini akan dibagi menjadi beberapa kategori perancangan yaitu: a. Perancangan Logika Bisnis dengan Pemodelan Data. Pada tahap ini dilakukan pembuatan model data beserta logikanya untuk memodelkan entitas dan proses bisnis pada Newsmaker. Pemodelan Data juga dilakukan di tahap ini yaitu pada setiap domain object. b. Perancangan Lapisan Akses Data aplikasi. Pada tahap ini dilakukan perancangan pada bagian perangkat lunak yang berhubungan dengan pengambilan atau penulisan data ke penyimpanan atau servis data. Fungsi atau proses pada Lapisan Akses Data disesuaikan dengan kebutuhan fungsional sistem. c. Perancangan Lapisan Antarmuka Pengguna (User Interface). Perancangan antarmuka dilakukan dengan pola Model-View-Controller sehingga memisahkan antara tampilan(view) dengan logika presentasi (presentation logic).

7 5 3. Implementasi perangkat lunak Pada tahap ini dilakukan proses implementasi dari tahap perancangan perangkat lunak. Pembuatan aplikasi dilakukan dengan menggunakan Netbeans Uji coba dan evaluasi Pada tahap ini, aplikasi sudah selesai dibuat dan siap digunakan untuk diuji. Uji coba dilakukkan dengan menguji setiap fitur yang meliputi pengujian logic dengan data tertentu. 5. Penyusunan buku tugas akhir Pada tahap ini dilakukan penyusunan buku sebagai laporan dan dokumentasi dari perangkat lunak secara keseluruhan, mulai dari tahap awal hingga tahap akhir pembuatan tugas akhir. 1.5 Sistematika Penulisan Buku Tugas Akhir ini terdiri dari beberapa bab, yang dijelaskan sebagai berikut: BAB I. PENDAHULUAN Bab ini berisi latar belakang masalah, rumusan permasalahan, tujuan dan manfaat pembuatan tugas akhir, metodologi yang digunakan, dan sistematika penyusunan tugas akhir. BAB II. KAJIAN PUSTAKA Bab ini membahas beberapa teori penunjang yang berhubungan dengan pokok pembahasan dan mendasari pembuatan Tugas Akhir ini. BAB III. ANALISIS DAN PERANCANGAN Bab ini membahas tahap analisis dan desain kebutuhan bisnis dari proses bisnis yang ada pada perusahaan. BAB IV. IMPLEMENTASI Bab ini membahas implementasi dari desain sistem yang dilakukan pada tahap sebelumnya yaitu tahap perancangan, disertai dengan potongan source code yang penting dalam aplikasi.

8 6 BAB V. UJI COBA DAN EVALUASI Bab ini membahas uji coba dari aplikasi yang dibuat dengan melihat hasil keluaran yang dihasilkan oleh aplikasi, dan evaluasi untuk mengetahui kemampuan aplikasi. BAB VI. PENUTUP Bab ini berisi kesimpulan dari hasil uji coba yang dilakukan serta saran untuk pengembangan aplikasai selanjutnya.

9 BAB 2 KAJIAN PUSTAKA Pada bab ini akan dipaparkan beberapa teori penunjang yang berhubungan dengan pokok pembahasan dan mendasari pembuatan Tugas Akhir ini. 2.1 Really Simple Syndication (RSS) RSS adalah teknologi internet yang merujuk pada cara men-sindikasi-kan konten sebuah situs web (web syndication). Teknologi RSS ini memberikan layanan untuk berlangganan kepada situs web yang menyediakan layanan RSS feed [1]. RSS adalah salah satu varian dari format web feed yang digunakan untu mempublikasikan konten digital yang secara frekuentatif diperbarui seperti blog, news feed atau podcast. Teknologi RSS merupakan contoh dari pull technology atau client pull, artinya request atau permintaan berasal dari client dan langsung direspons oleh server. Selain itu, RSS disediakan sebuah situs dapat digunakan untuk melengkapi situs lain. Format RSS dikhususkan dalam bentuk XML (spesifikasi umum format data). RSS menyebarkan informasi melalui sebuah berkas XML yang disebut sebagai RSS feed, webfeed, RSS stream, atau RSS Channel. Program yang dikenal sebagai feed reader atau aggregators dapat melakukan pemeriksaan terhadap daftar feed berdasarkan kepentingan pengguna dan menampilkan berbagai macam informasi atau artikel terbaru pada suatu situs web. Gambar 2.1 [2] menunjukkan komponen fungsional dari teknologi RSS. 7

10 8 Gambar 2.1 Komponen fungsional teknologi RSS Berkas XML pada RSS terdiri dari deklarasi dari versi XML dan RSS yang digunakan. Di dalam deklarasi RSS terdapat elemen-elemen yang menunjukkan isi dari RSS tersebut. Elemen yang berisi informasi RSS tersebut dinamakan elemen channel sedangkan elemen yang berisi informasi berupa artikel atau berita dinamakan elemen item. Untuk lebih jelasnya, Kode Sumber 2-1 menunjukka contoh dari dokumen RSS. Menurut aturan RSS Advisory Board [3], terdapat tiga elemen penting yang harus ada dalam elemen channel yaitu : 1. Title : Judul RSS 2. Link : Alamat url dari situs penyedia RSS 3. Description : Informasi singkat RSS Sedangkan untuk elemen yang berupa opsional adalah sebagai berikut : 1. Category : Informasi kategori RSS 2. Copyright : Informasi hak cipta RSS 3. Image : Alamat url dari gambar situs RSS 4. Language : Informasi bahasa yang digunakan 5. Pubdate : Tanggal publikasi konten channel

11 9 Untuk elemen item, terdapat tiga elemen penting yang harus ada didalamnya yaitu: 1. Title : Judul item 2. Link : Alamat url item pada situs penyedia RSS 3. Description : Informasi atau konten dari item Sedangkan untuk elemen opsional dari elemen item yang bisa ada atau tidak adalah sebagai berikut : 1. Author : Penulis item 2. Enclosure : Alamat dokumen media yang dimuat 3. Pubdate : Informasi tanggal publikasi item 4. Guid : Informasi id unik dari item Kode Sumber 2-1 Contoh dokumen RSS <rss version="2.0" xmlns:atom=" <channel> <title>vivanews - POLITIK</title> <link> <description>rss Service</description> <language>en-us</language> <pubdate>mon, 04 Jul :47: </pubDate> <image> <title>vivanews.co.id</title> <link> <url> </url> <width>213</width> <height>30</height> <description>viva News Feeds</description> </image> <item> <title>pendiri Demokrat: Partai Ini Lagi Heboh</title> <link> <description>meski begitu Demokrat tidak akan.</description> <pubdate>mon, 04 Jul :44: </pubDate> <guid> </item> <item> <title>prihatin Nazaruddin, Pendiri Demokrat Kumpul</title>

12 10 <link> <description>mereka menilai kondisi..</description> <pubdate>mon, 04 Jul :22: </pubDate> <guid> </guid> </item>... </channel> </rss> 2.2 Extensible Markup Language (XML) XML (Extensible Markup Language) adalah merupakan suatu bahasa Markup. Markup yaitu bahasa yang berisikan kodekode berupa tanda-tanda tertentu dengan aturan tertentu untuk memformat dokumen teks dengan tag sendiri agar dapat dimengerti baik manusia maupun mesin [4]. XML dapat digunakan sebagai media penyimpanan data, standar dari transfer data juga dapat digunakan sebagai berkas konfigurasi. Banyak antarmuka pemrograman aplikasi (API) telah dikembangkan untuk digunakan pengembang perangkat lunak dalam membaca dan memproses data XML diantaranya adalah XML Document Object Model (XML DOM) dan XPath XML Document Object Model (DOM) DOM merupakan sebuah standar untuk mengakses dan memanipulasi dokumen XML dan HTML. DOM dibagi menjadi 3 bagian [5] yang berbeda yaitu : - Core DOM, model standar untuk dokumen terstruktur - HTML DOM, model standar untuk dokumen html - XML DOM, model standar untuk dokumen XML XPath Xpath digunakan untuk memilih node atau sekumpulan node dalam sebuah dokumen XML menggunakan sebuah ekspresi path. Ekspresi path tersebut terlihat sangat familiar dan mudah dimengerti karena sangat mirip dengan ekspresi yang digunakan

13 11 dalam mengakses sebuah sistem berkas dalam computer [6]. Dalam Xpath terdapat 7 macam node, yaitu : element, attribute, text, namespace, processing-instruction, comment, and document nodes. Untuk mengakses sebuah dokumen XML menggunakan XPath, langkah dan ekspresi path yang serta contoh dokumenxml pada Kode Sumber 2-1 adalah sebagai berikut: Kode Sumber 2-2 Contoh dokumen XML <?xml version="1.0" encoding="iso "?> <tokobuku> <buku> <judul lang= eng >XML DOM</judul> <harga>35</harga> </buku> <buku> <judul lang= ind >XML XPath</judul> <harga>50</harga> </buku> </tokobuku> 1. Memilih Node Untuk memilih node maka ekspresi dasar yang digunakan ditunjukkan pada Tabel 2.1. Ekspresi nodename Tabel 2.1 Ekspresi dasar dari XPath Deskripsi Memilih semua anak node dari elemen dengan nama nodename / Memilih akar node dalam dokumen dimulai akar node (root node) // Memilih semua node tertentu dalam dokumen dipossisi manapun. Memilih node saat ini (current node).. Memilih parent dari node saat Memilih atribut

14 12 Contoh dari penggunaan ekspresi dasar pada Tabel 2.1 ditunjukkan pada Tabel 2.2. Tabel 2.2 Contoh penggunaan ekspresi dasar dari XPath Ekspresi path Hasil tokobuku Memilih semua anak node dari elemen tokobuku /tokobuku Memilih semua anak node tokobuku dalam dokumen dimulai akar node (root node) tokobuku//buku Memilih semua node buku yang merupakan anak dari node tokobuku //buku Memilih semua node buku dimanapun posisi node buku dalam dokumen tokobuku//buku Memilih semua node buku yang merupakan anak dari node tokobuku dimanapun posisi node buku Memilih semua atribut yang ditunjukkan oleh nama atribut lang 2. Predikat Predikat digunakan untuk mendapatkan node tertentu secara spesifik. Predikat ditandai dengan menggunakan kurung siku yang berisi parameter tertentu. Tabel 2.3 menunjukkan penggunaan dari predikat yang diterapkan dalam contoh dokumen XML. Tabel 2.3 Penggunaan ekspresi predikat pada XPath Ekspresi Tokobuku/buku[1] /tokobuku/buku[last()] Hasil Memilih node buku pertama dari anak node tokobuku Memilih node buku terakhir dari anak node tokobuku /tokobuku/buku[last()-1] Memilih node buku kedua terkahir dari anak node tokobuku

15 13 /tokobuku/buku[position<3] Memilih semua node buku diposisi kurang dari 3 /judul[@lang] Memilih semua node yang memiliki atribut lang /judul[@lang= eng ] Memilih semua node yang memiliki nilai atribut eng /tokobuku/buku[harga>35] Memilih semua node buku yang memiliki anak node bernama harga dengan nilai > 35 /tokobuku/buku[harga>35]/judul Memilih semua node judul dari node buku yang memiliki anak node dengan nilai > Wildcard Xpath menyedian ekspresi wildcard untuk memilih sembarang node. Tabel 2.4 dan Tabel 2.5 menunjukkan ekspresi dasar dan contoh penggunaan ekspresi wildcard XPath pada contoh dokumen XML. Tabel 2.4 Ekspresi dasar wildcard pada Xpath Ekspresi path Deskripsi * Memilih semua node dalam Memilih semua node yang memiliki sembarang atribut Tabel 2.5 Contoh penggunaan ekspresi wildcard XPath Ekspresi path Hasil tokobuku/* Memilih semua anak node dari node tokobuku //* Memilih semua node dalam dokumen //judul[@*] Memilih semua node yang memiliki atribut 2.3 Java Platform Java 2 Platform, Enterprise Edition (J2EE) adalah platform independen yang telah digunakan secara luas dalam

16 14 bahasa pemrograman Java untuk mengembangkan, membangun dan menyebarkan aplikasi web berskala enterprise. J2EE mencakup banyak komponen dari Java Standard Edition (Java SE). Komponen-komponen tersebut bersifat modular yang dapat digunakan ulang dan memungkinkan setiap tier pada aplikasi melakukan aspek pemrograman secara otomatis. Platform J2EE terdiri dari satu set layanan, API, dan protokol yang menyediakan fungsionalitas untuk mengembangkan aplikasi berbasis web multitier. Beberapa teknologi yang mendukung J2EE adalah sebagai berikut : Java Server Faces Java Server Faces (JSF) adalah teknologi Java untuk aplikasi web yang dikembangkan oleh Sun Microsystems dengan tujuan menciptakan standar kerangka kerja komponen antarmuka pengguna dalam sebuah aplikasi web. JSF membangun suatu aplikasi web yang berjalan pada sisi server kemudian menampilkan antarmuka pengguna ke klien. JSF menyediakan komponen antarmuka pengguna yang umumnya digunakan web dan memiliki standar yang sama sehingga dapat dijalankan di berbagai platform dan device [7]. Sebagaimana konsep arsitektur pemrograman berorientasi objek, JSF juga mempunyai pemisahan yang jelas antara komponen layer Model, View, dan Controller. Kerangka kerja JSF memiliki sebuah controller servlet bagian depan yaitu FacesServlet yang bertanggung jawab untuk menerima permintaan dari klien dan kemudian menjalankan action yang telah ditentukan Primefaces Primefaces adalah komponen dalam pembangunan aplikasi web yang menggunakan framework Java Server Faces yang bersifat open source. Selain itu, primefaces juga dapat digunakan untuk membangun aplikasi mobile web.

17 Confix Stripping Stemmer Confix Stripping (CS) stemmer adalah metode stemming untuk Bahasa Indonesia yang diperkenalkan oleh Jelita Asian [8]. Stemmer ini merupakan pengembangan dari metode stemming untuk Bahasa Indonesia yang diperkenalkan oleh Nazief dan Adriani (1996). Algoritma stemming Nazief dan Adriani ini dikembangkan berdasarkan pada aturan morfologi Bahasa Indenesia yang mengelompokkan dan mengenkapsulasi imbuhanimbuhan, termasuk di dalamnya adalah awalan (prefix), sisipan (infix), akhiran (suffix) dan gabungan awalan-akhiran (confixes). Algoritma ini menggunakan kamus kata dasar dan mendukung recoding, yakni penyusunan kembali kata-kata yang mengalami proses stemming berlebih. Tabel 2.6 Kombinasi awalan-akhiran yang dilarang Awalan (prefix) Akhiran (suffix) yang tidak diperbolehkan be- -i di- -an ke- -I, -kan me- -an se- -a, -kan te- -an Algoritma stemmer Nazief dan Adriani mengelompokkan imbuhan ke dalam beberapa kategori sebagai berikut: 1. Inflection suffixes yakni kelompok-kelompok akhiran yang tidak merubah bentuk kata dasar. Sebagai contoh, kata duduk yang diberikan akhiran -lah akan menjadi duduklah. Kelompok ini dapat dibagi menjadi dua : Particle (P) atau partikel, yakni termasuk di dalamnya -lah, -kah, -tah, dan -pun. Possessive Pronoun (PP) atau kata ganti kepunyaan, termasuk di dalamnya adalah -ku, -mu, dan -nya.

18 16 2. Derivation Suffixes (DS) yakni kumpulan akhiran asli Bahasa Indonesia yang secara langsung ditambahkan pada kata dasar. Termasuk di dalamnya adalah akhiran -i, -kan, dan -an. 3. Derivation Prefixes (DP) yakni kumpulan awalan yang dapat langsung diberikan pada kata dasar murni, atau pada kata dasar yang sudah mendapatkan penambahan sampai dengan 2 awalan. Termasuk di dalamnya adalah awalan yang dapat bermorfologi ( me-, be-, pe-, dan te- ) serta awalan yang tidak bermorfologi ( di-, ke- dan se- ). Berdasarkan pengklasifikasian imbuhan-imbuhan di atas, maka bentuk kata berimbuhan dalam Bahasa Indonesia dapat dimodelkan sebagai berikut: [ DP + [ DP + [ DP + ] ] ] Kata Dasar [ [ + DS ][ + PP ][ + P ] ] dengan batasan sebagai berikut : 1. Tidak semua kombinasi diperbolehkan, sebagai contoh pada kata yang diberi awalan di-, maka penambahan akhiran - an tidak diperkenankan. Kombinasi-kombinasi imbuhan yang tidak diperbolehkan dapat dilihat pada Tabel Penggunaan imbuhan yang sama secara berulang tidak diperkenankan. 3. Jika suatu kata hanya terdiri dari satu atau dua huruf, maka proses stemming tidak dilakukan. 4. Penambahan suatu awalan tertentu dapat mengubah bentuk asli kata dasar, ataupun awalan yang telah diberikan sebelumnya pada kata dasar bersangkutan (bermorfologi). Sebagai contoh, awalan me- dapat berubah menjadi meng-, men-, meny-, dan mem-. Oleh karena itu, diperlukan suatu aturan yang mampu mengatasi masalah morfologi ini. Pada dasarnya, algoritma confix stripping stemmer dikembangkan dari algoritma stemming yang dibuat oleh Nazief dan Adriani, dengan beberapa penambahan aturan tertentu yang telah terbukti mampu meningkatkan kinerja stemmer tersebut. Algoritma stemmer yang diperkenalkan Nazief dan Adriani didefinisikan sebagai berikut :

19 17 1. Kata yang hendak di-stemming dicari terlebih dahulu pada kamus. Jika kata ditemukan dalam kamus, berarti kata tersebut sudah berbentuk kata dasar, jika tidak maka tahap selanjutnya dilakukan. 2. Hilangkan inflectional particle P ( -lah, -kah, -tah, - pun ) dan kata ganti kepunyaan atau possessive pronoun PP ( -ku, -mu, -nya ). 3. Hilangkan derivation suffixes DS ( -i, -kan, atau -an ). 4. Hilangkan derivation prefixes DP { di-, ke-, se-, me-, be-, pe, te- } dengan iterasi aksimum adalah 3 kali : a. Langkah 4 berhenti jika : Terjadi kombinasi awalan dan akhiran yang terlarang seperti pada Tabel 2.6. Awalan yang dideteksi saat ini sama dengan awalan yang dihilangkan sebelumnya. Tiga awalan telah dihilangkan. b. Identifikasikan tipe awalan dan hilangkan. Awalan ada dua tipe: Standar: di-, ke-, se- yang dapat langsung dihilangkan dari kata. Kompleks: me-, be-, pe, te- adalah tipetipe awalan yang dapat bermorfologi sesuai kata dasar yang mengikutinya. Oleh karena itu, gunakan aturan pada Tabel 2.7 untuk mendapatkan pemenggalan yang tepat. c. Cari kata yang telah dihilangkan awalannya ini di dalam kamus. Apabila tidak ditemukan, maka langkah 4 diulangi kembali. Apabila ditemukan, maka keseluruhan proses dihentikan. 5. Apabila setelah langkah 4 kata dasar masih belum ditemukan, maka proses recoding dilakukan dengan mengacu pada aturan pada Tabel 2.6. Recoding dilakukan dengan menambahkan karakter recoding di awal kata yang dipenggal. Pada Tabel 2.7, karakter recoding adalah huruf kecil setelah tanda hubung ( - ) dan terkadang berada sebelum tanda kurung. Sebagai contoh, kata menangkap

20 18 (aturan 15), setelah dipenggal menjadi nangkap. Karena tidak valid, maka recoding dilakukan dan menghasilkan kata tangkap 6. Jika semua langkah gagal, maka input kata yang diuji pada algoritma ini dianggap sebagai kata dasar. Dilihat segi performa, stemmer ini mampu memberikan hasil yang lebih baik jika dibandingkan dengan algoritma stemmer untuk Bahasa Indonesia seperti yang dikembangkan oleh Arifin dan Setiono (2002) [9], Vega (2001), Ahmad (1996), dan Idris (2001). Hal ini wajar, mengingat algoritma ini merupakan algoritma yang paling kompleks. Jelita Asian kemudian mengembangkan algoritma CS stemmer, dengan menambahkan beberapa perbaikan yang bertujuan untuk meningkatkan hasil stemming yang diperoleh. Perbaikan yang ditambahkannya adalah sebagai berikut : 1. Menggunakan kamus kata dasar yang lebih lengkap. 2. Memodifikasi dan menambahkan aturan pemenggalan untuk tipe awalan yang kompleks (memodifikasi aturan pada Tabel 2.7 dan menambahkan aturan pada Tabel 2.8 ke Tabel 2.9). 3. Menambahkan aturan stemming untuk kata ulang dan bentuk jamak, semisal pada buku-buku yang seharusnya distemming menjadi buku. Caranya, adalah dengan melakukan pemisahan menjadi dua sub-kata, yang masingmasing di-stemming. Apabila stemming memberikan kata dasar yang sama, maka output kata dasarnya adalah hasil stemming tersebut. Namun apabila hasil stemming 2 sub-kata ini berbeda, maka dapat disimpulkan bahwa input adalah kata ulang semu, dan tidak memiliki bentuk kata dasar lagi. 4. Mengubah urutan stemming untuk beberapa kasus tertentu. Algoritma stemmer Nazief dan Adriani akan menghilangkan akhiran terlebih dahulu, baru diikuti penghilangan awalan. Menurut Jelita Asian, cara ini tidak selalu berhasil pada beberapa kata. Oleh karena itu, diberikan beberapa aturan yang akan mengubah urutan stemming, dimana penghilangan awalan dilakukan terlebih dahulu, lalu diikuti penghilangan akhiran. Aturan ini disebut rule precedence, dan berlaku jika

21 19 suatu kata memiliki pasangan awalan-akhiran be-lah, bean, me-i, di-i, pe-i, atau te-i. Pada Tabel 2.7, 2.8, dan 2.9, simbol C merupakan konsonan, simbol V menandakan vokal, simbol A merupakan vokal atau konsonan, dan simbol P merepresentasikan partikel atau fragmen dari suatu kata, misalnya er. Tabel 2.7 Aturan pemenggalan awalan stemmer Nazief dan Adriani Aturan Format Kata Pemenggalan 1 berv... ber-v... be-rv... 2 bercap... ber-cap... dimana C!= r & P!= er 3 bercaerv... ber-caerv... dimana C!= r 4 belajar bel-ajar 5 bec1erc2... be-c1erc2... dimana C1!={ r l } 6 terv... ter-v... te-rv... 7 tercerv... ter-cerv... dimana C!= r 8 tercp... ter-cp... dimana C!= r dan P!= er 9 tec1erc2... te-c1erc2... dimana C1!= r 10 me{l r w y}v... me-{l r w y}v mem{b f v}... mem-{b f v} mempe{r l}... mem-pe mem{rv V}... me-m{rv V}... me-p{rv V} men{c d j z}... men-{c d j z} menv... me-nv... me-tv 16 meng{g h q}... meng-{g h q} mengv... meng-v... meng-kv menyv... meny-sv mempv... mem-pv... dimana V!= e 20 pe{w y}v... pe-{w y}v perv... per-v... pe-rv percap per-cap... dimana C!= r dan P!= er 24 percaerv... per-caerv... dimana C!= r 25 pem{b f V}... pem-{b f V} pem{rv V}... pe-m{rv V}... pe-p{rv V}...

22 20 27 pen{c d j z}... pen-{c d j z} penv... pe-nv... pe-tv peng{g h q}... peng-{g h q} pengv... peng-v... peng-kv penyv... peny-sv pelv... pe-lv... kecuali pelajar yang menghasilkan ajar 33 pecerv... per-erv... dimana C!={r w y l m n} 34 pecp... pe-cp... dimana C!={r w y l m n} dan P!= er Tabel 2.8 Modifikasi aturan pada Tabel 2.7 oleh Jelita Asian Aturan Format Kata Pemenggalan 12 mempe... mem-pe meng{g h q k}... meng-{g h q k}... Tabel 2.9 Tambahan aturan untuk Tabel 2.7 oleh Jelita Asian Aturan Format Kata Pemenggalan 35 terc1erc2... ter-c1erc2... dimana C1!= r 36 pec1erc2... pe-c1erc2... dimana C1!={r w y l m n} 2.5 Algoritma Naïve Bayes Algoritma naïve bayes merupakan salah satu algoritma klasifikasi yang dapat digunakan untuk mengklasifikasikan dokumen teks. Algoritma ini memiliki bentuk yang paling sederhana diantara metode Bayesian learning lainnya namun tetap memiliki tingkat akurasi yang tinggi [10]. Model yang saling independen terhadap kelas adalah asumsi dasar naïve bayes, dimana dokumen digambarkan sebagai representasi dari himpunan kata-kata yang ada di dalamnya. Urutan kata-kata diabaikan dan jumlah kata yang terdapat pada sebuah dokumen tersebut digunakan. Setiap kata diperhitungkan sebagai event dan

23 21 dokumen adalah sekumpulan dari word event. Meskipun asumsi ini tidak ada di dunia nyata akan tetapi hasil klasifikasi yang baik dapat diperoleh dengan menggunakan algoritma ini [11]. Pada NBC setiap dokumen berita direpresentasikan dalam pasangan atribut <a 1,a 2. a n > di mana a 1 adalah kata pertama, a 2 kata kedua dan seterusnya. Sedangkan V adalah himpunan kategori berita (olahraga, ilmu teknologi dan sebagainya). Pada saat klasifikasi, pendekatan Bayes akan menghasilkan label kategori yang palingtinggi probabilitasnya (v MAP ) dengan masukan atribut <a 1,a 2. a n > [12]. =argmax 1, 2, 3, ) (2.1) Theorema bayes digambarkan sebagai berikut, probabilitas dokumen A untuk masuk ke dalam kelas Bi, P(Bi A) didefinisikan dalam persamaan (2.2). P Bi A)= P Bi).P A Bi) P A) (2.2), dimana pada persamaan (2.2) : P(A Bi) = likelihood, P(Bi) = prior, P(A) = evidence, dan P(Bi A) = posterior Menggunakan teorema Bayes ini, persamaan (2.1) ini dapat ditulis menjadi persamaan (2.3). =argmax P a,a, a v )P v ) P a,a a ) (2.3) P(,, ) nilainya konstan untuk semua sehingga persamaan ini dapat ditulis menjadi persamaan (2.4). =argmax P a,a a v ) P v ) (2.4)

24 22 Tingkat kesulitan menghitung P(,,, ) menjadi tinggi karena jumlah term bisa jadi akan sangat besar. Ini disebabkan jumlah term tersebut sama dengan jumlah semua kombinasi posisi kata dikali dengan jumlah kategori. Naïve Bayes Classifier menyederhanakan hal ini dengan mengasumsikan bahwa di dalam setiap kategori, setiap kata independen satu sama lain. Dengan kata lain :,, )= ) (2.5) Subtitusi persamaan (2.5) dengan persamaan (2.4) akan menghasilkan persamaan (2.6). =argmax P v P a,v ) (2.6) P( ) dan probabilitas kata untuk setiap kategori P ( ) dihitung pada saat pelatihan yang ditunjukkan pada persamaan (2.7) dan (2.8). = h P ( ) = (2.7) (2.8), dimana adalah jumlah kata pada kategori j dan contoh adalah jumlah dokumen yang digunakan dalam pelatihan. Sedangkan adalah jumlah kemunculan kata pada kategori, n adalah jumlah semua kata pada kategori dan kosakata adalah jumlah kata yang unik (distinct) pada semua data latihan.

23 2.6 Weka Weka adalah aplikasi penggalian data open source berbasis Java. Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru sebelum menjadi bagian dari Pentaho.

25 Weka Weka adalah aplikasi penggalian data open source berbasis Java. Aplikasi ini dikembangkan pertama kali oleh Universitas Waikato di Selandia Baru sebelum menjadi bagian dari Pentaho. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi / formulasi dari sekumpulan data sampling. Weka saat ini sudah cukup banyak mendukung algoritma untuk pemodelan data atau biasa disebut classifier, diantaranya adalah J48, Linear Regression, Naïve Bayes dan lain sebagainya. [13]. Suatu perangkat lunak dapat mengimplementasikan pustaka Weka melalui Weka API (Aplication Programming Interface) dengan memberikan format-format data yang dapat dibaca atau dijadikan masukan Weka, seperti Attribute-Relation Berkas Format(ARFF) yang ditunjukkan oleh Gambar 2.2, Comma Separated Values (CSV), C4.5 dan serialisasi data biner melalui Weka sendiri. Gambar 2.2 Contoh potongan data dengan format ARFF

26 Klasifikasi Dokumen Klasifikasi dokumen adalah proses dimana sebuah dokumen teks diklasifikasikan kedalam suatu kategori yang bersesuaian dari beberapa kategori yang telah didefinisikan dengan menggunakan informasi darik dokumen-dokumen teks yang telah diberi label [15]. Manfaat dari klasifikasi dokumen adalah untuk pengorganisasian dokumen. Dengan jumlah dokumen yang sangat besar, untuk mencari sebuah dokumen akan lebih mudah apabila kumpulan dokumen yang dimiliki terorganisir dan telah dikelompokkan sesuai kategorinya masing-masing. Sistem klasifikasi dokumen berita terdiri dari beberapa tahapan yaitu tahap praproses, tahap training, dan tahap klasifikasi Tahap Praproses Tahap praproses adalah tahapan untuk mendapatkan dokumen dalam bentuk plain text sehingga akan didapatkan hasil yang maksimal dalam training dokumen nantinya [15]. Tahap praproses ini berupa : 1. Analisa leksikal teks, untuk menangani tanda baca, digit, dan bentuk huruf (huruf kecil atau huruf kapital). 2. Penghapusan stopword, dengan menghapus kata-kata yang sering muncul namun tidak digunakan sebagai media index terms. 3. Penggunaan stemming, yang akan menghilangkan imbuhanimbuhan yang melekat pada kata Analisa Leksikal Teks Analisa leksikal merupakan tahap awal dari tahapan praproses, dimana langkah ini merupakan prses pengubahan dokumen teks input menjadi sekumpulan token. Hal yang dilakukan pada tahap ini antara lain adalah pengidentifikasian tanda spasi, penangan digit, nomor, tanda hubung dan tanda baca. Tanda baca yang dihilangkan adalah sebagai berikut:

27 25 \t\n\r\f\ \ \\ !@#$%^&*()_+-{} []:;<,>.?/`~. Penanganan bentuk huruf (huruf kecil atau huruf kapital) juga dilakukan dalam tahap ini. Pada umumnya seluruh huruf akan dikonversi menjadi bentuk huruf kecil atau huruf capital saja Penghapusan Stopwords Penghapusan stopwords merupakan proses menghilangkan kata kata yang dianggap tidak berkontribusi banyak pada isi dokumen (Yates dan Neto, 1999). Dalam bahasa Indonesia banyak terdapat kata kata yang sering muncul namun tidak merepresentasikan konten secara signifikan, seperti dan, dari, yang, untuk dan sebagainya. Kata kata tersebut disebut stopwords dan daftar yang berisi stopwords disebut stoplist. Jenis kata yang termasuk stoplist adalah: 1. Kata depan 2. Kata ganti 3. Kata hubung 4. Kata sandang Penghilangan stopword dapat mengurangi ukuran index dan waktu pemrosesan. Selain itu, juga dapat mengurangi tingkat noise Steemming Stemming merupakan suatu proses yang terdapat dalam sistem information retrieval yang mentransformasi kata-kata yang terdapat dalam suatu dokumen ke kata-kata dasarnya (root word) dengan menggunakan aturan-aturan tertentu. Sebagai contoh, kata bersama, kebersamaan, menyamai, akan distem ke kata dasarnya yaitu sama. Proses stemming pada teks berbahasa Indonesia berbeda dengan stemming pada teks berbahasa Inggris. Pada teks berbahasa Inggris, proses yang diperlukan hanya proses menghilangkan sufiks. Sedangkan pada teks berbahasa Indonesia, selain sufiks, prefiks, dan konfiks juga dihilangkan.

28 26 Banyak algoritma untuk melakukan stemming seperti porter stemmer, confix stripping stemmer, nazief dan adriani dan sebagainya. Pada tugas akhir ini algoritma yang digunakan untuk melakukan stemming dokumen berbahasa Indonesia adalah confix stripping stemmer Tahap Training Data Pada tahap training, model kategori untuk setiap kategori dibangun. Model ini berisi nama kategori, jumlah dokumen dan daftar keywords (kata kunci). Untuk melatih sebuah classifier untuk kategori, diperlukan sekumpulan dokumen training. Dari setiap dokumen tersebut, kata kunci diekstraksi menggunakan teknik pembobotan. Setiap dokumen training diekstraksi termsnya dan diboboti, kemudian terms tersebut ditetapkan sebagai kata kunci kata kunci untuk setiap kategori dan disimpan beserta jumlah dokumen training tempat kata kunci tersebut muncul. Pada Tahap Klasifikasi Pada tahap klasifikasi merupakan tahap penetapan kategori untuk dokumen uji. Proses klasifikasi meliputi empat tahap besar : 1. Ekstraksi kata kunci dokumen uji 2. Perhitungan likelihood 3. Perhitungan rata-rata dan standar deviasi 4. Seleksi kategori Tahap klasifikasi pada tugas akhir ini menggunakan algoritma Naïve Bayes. Pada Tugas Akhir ini data akan diambil dari berita yang didapatkan melalui RSS lalu setelah terkumpul kemudian dilakukan analisis data lalu diklasifikasikan menggunakan API yang disediakan oleh pustaka perangkat lunak open source Weka.

29 Penelitian terkait sebelumnya Terdapat beberapa judul Tugas Akhir yang pernah dipublikasikan di Institut Teknologi Sepuluh Nopember Surabaya yang berkenaan dengan tema klasifikasi dokumen berita berbahasa indonesia. Salah satunya adalah "Penggunaan Algoritma Semut dan Confix Stripping Stemmer dalam Klasifikasi Dokumen Berita Berbahasa Indonesia oleh I Putu Adhi Kerta Mahendra. Tugas akhir tersebut mengklasifikasikan dokumen berita berbahasa indonesia menggunakan metode algoritma Semut. [16] Sedangkan pada tugas akhir ini metode yang digunakan untuk klasifikasi berita berbahasa Indonesia adalah algoritma Naïve Bayes Classifier hanya saja menggunakan metode stemming yang sama yaitu Confix Stripping Stemmer karena terbukti mampun memberikah hasil yang lebih akurat dalam proses stemming pada tugas akhir sebelumnya.

30 28 [Halaman ini sengaja dikosongkan]

31 BAB 3 ANALISIS DAN PERANCANGAN Pada bab ini akan membahas tahap analisis dan perancangan dari perangkat lunak. Tahap analisis meliputi deskripsi umum perangkat lunak, spesifikasi kebutuhan fungsional dan non fungsional perangkat lunak, aktor dan skenario kasus penggunaan. Sedangkan pada tahap perancangan meliputi perancangan arsitektur perangkat lunak, lapisan presentasi, lapisan servis aplikasi, lapisan model data, dan lapisan akses data. Berikut penjabaran bagian-bagian tahap analisis. 3.1 Analisis Tahap analisa merupakan proses memahami dan menspesifikasi dengan detail apa yang harus dilakukan oleh sistem atau bisa dikatakan sebagai tahapan dalam mendefinisikan masalah Deskripsi Umum Perangkat Lunak Perangkat lunak yang akan dikembangkan pada Tugas Akhir ini adalah sebuah aplikasi berbasis web yang mampu memberikan kemudahan bagi pengguna dalam mengikuti perkembangan berita dari berbagai situs web berita yang ada. Aplikasi web ini memanfaatkan konten berita berupa item yang didapatkan dari RSS situs web berita sebagai konten dari aplikasi. Aplikasi web ini memanfaatkan RSS sebagai sumber kontennya karena sebagian besar situs berita yang selalu memperbarui kontennya menyediakan layanan RSS kepada para pembaca agar mereka dapat mengikuti dan mengetahui perkembangan berita terbaru yang dikeluarkan oleh situs berita tersebut. Maka dengan mengumpulkan berbagai RSS dari berbagai situs web berita yang ada berarti secara tidak langsung akan mendapatkan berbagai berita terbaru yang yang dikeluarkan oleh berbagai situs berita tersebut yang kemudian berita-berita itu akan dikelola oleh 29

32 30 aplikasi ini. Proses pengelolaan berita ini hanya mampu dilakukan oleh pengguna yang memiliki hak akses tertentu atau pengelola dimana nantinya pengelola mampu menentukan berita apa saja dan dari mana saja yang dapat dibaca oleh pengguna lainnya pada tampilan halaman depan dari aplikasi ini atau justru menghapus RSS yang jarang diperbarui atau berisi konten yang tidak layak, sedangkan pengguna biasa hanya mampu membaca, melihat berita serta mampu memberikan komentar pada berita tertentu sebagaimana situs web berita pada umumnya. Berita-berita yang didapatkan dengan mengunduh RSS akan dikelompokkan berdasarkan sumber RSS-nya sehingga pengguna dapat memilah berita mana yang akan dibaca. Selain itu berita yang didapatkan melalui mengunduh RSS tadi akan diklasifikasikan berdasarkan kategori tertentu, misalnya : politik, ekonomi, sosial, kesehatan dan olahraga. Pengelola juga dapat menambahkan kategori lain yang diperlukan. Hal ini ditujukan untuk memudahkan pengguna dalam mengikuti perkembangan berita dari kategori-kategori tertentu tadi. Hal yang terpenting adalah agar aplikasi ini mampu memberikan berita yang selalu baru dan segar maka aplikasi harus berjalan secara otomatis untuk mengunduh berita melalui sekumpulan RSS yang telah didaftarkan tentunya dalam kurun waktu tertentu. Akan tetapi aplikasi web ini juga menyediakan fasilitas bagi pengembang untuk mengunduh berita sewaktu-waktu Arsitektur Perangkat Lunak Arsitektur sistem dari aplikasi yang dibangun pada Tugas Akhir ini dapat ditunjukkan pada Gambar 3.1. Dari sisi client, terdapat dua macam klien dengan karakteristik yang berbeda yaitu pengguna dan pengelola. Pengguna yang dimaksud disini adalah pengguna umum yang hanya dapat membaca berita yang disediakan oleh aplikasi sedangkan pengelola aplikasi di sini memiliki hak akses untuk melakukan pengelolaan data pada aplikasi Tugas Akhir ini. Dari sisi server, terdapat dua buah server yaitu Application Server, tempat aplikasi ditanam, dan

31 Database Server, tempat penyimpanan data yang berupa dokumen XML. Gambar 3.

33 31 Database Server, tempat penyimpanan data yang berupa dokumen XML. Gambar 3.1 Arsitektur sistem Arsitektur dari perangkat lunak yang dibangun dalam TA ini akan menggunakan arsitektur yang terdiri dari empat lapisan. Pembagian lapisan tersebut ditujukan untuk mempermudah pembangunan perangkat lunak dengan memperjelas tugas masing-masing lapisan tersebut. Lapisan arsitektur pada perangkat lunak yaitu Lapisan Model Data, Lapisan Presentasi, Lapisan Servis Aplikasi, dan Lapisan Akses Data. Keempat lapisan arsitektural pada perangkat lunak ini ditunjukkan oleh Gambar 3.2. Gambar 3.2 Arsitektur perangkat lunak

34 Lapisan Model Data Model Data adalah permodelan konsep model bisnis yang diimplementasikan ke dalam kelas. Domain model berisi kelas yang mendefinisikan objek yang terdapat pada servis data yaitu berkas xml. Model data ini yang nantinya akan digunakan selama aplikasi berjalan Lapisan Presentasi Lapisan ini bertanggungjawab terhadap tampilan yang yang ditampilkan ke pengguna. Lapisan Presentasi bertugas sebagai media aplikasi berinteraksi dengan pengguna. Lapisan Presentasi tidak bertanggung jawab terhadap pengolahan data. Lapisan ini terbagi menjadi 2 komponen yaitu Antarmuka Pengguna dan Logika Presentasi. Antarmuka Pengguna berfungsi sebagai media interaksi aplikasi dengan pengguna dan Logika Presentasi adalah media interaksi anatar Antarmuka Pengguna dengan Lapisan Servis Aplikasi. Pada Antarmuka Pengguna berisi berkas jsf berformat xhtml yang diberi tambahan komponen Primefaces. Sedangkan pada Logika Presentasi berisi kelas managed beans Java Lapisan Servis Aplikasi Lapisan Servis Aplikasi adalah lapisan yang menangani permasalahan Logika Bisnis. Logika Bisnis terdiri dari sejumlah operasi yang menggunakan data. Dalam perangkat lunak ini, data dimodelkan dengan entitas bisnis. Servis Aplikasi dapat mengakses data dari Lapisan Akses Data, dan mengolahnya agar dapat dimanfaatkan oleh perangkat lunak ini. Pada lapisan ini juga terdapat fungsi yang digunakan untuk mengunduh RSS hingga menyimpannya ke dalam penyimpanan. Proses dari fungsi ini ditunjukkan oleh Gambar3.3.

35 33 Gambar 3.3 Alur proses pengelolaan RSS Gambar 3.3 dapat dijelaskan sebagai berikut : 1. Unduh RSS Pada proses ini sistem mengunduh rss dari alamat url rss yang telah didaftarkan melalui jaringan internet. Oleh karena itu aplikasi ini harus selalu terhubung dengan internet. 2. Parsing RSS Pada proses ini dilakukan penguraian atau parsing pada data RSS hasil mengunduh pada proses 1 (satu) sebelumnya. Data RSS masih berformat XML oleh karena itu agar dapat dibaca oleh sistem harus diurai menjadi objek channel dan item agar dapat langsung dibaca oleh sistem. Pseudocode dari proses penguraian RSS untuk membaca struktur RSS berdasarkan elemenelemen RSS sebagaimana dijelaskan pada subbab 2.1 ditunjukkan pada Kode Sumber Analisis Teks Pada proses ini, data item yang telah didapatkan dari hasil penguraian RSS dianalisis untuk didapatkan datadata penting yang digunakan dalam proses mengklasifikasikan item termasuk kategori berita politik, sosial, teknologi, olahraga atau lainnya. Data penting hasil analisis ini nanti akan disimpan dalam dokumen dengan format.arff dengan isi sebagaimana ditunjukkan pada Gambar 2.2 sebelumnya.

36 34 Kode Sumber 3-1 Pseudocode penguraian RSS while terdapat elemen xml do if awal elemen = TITLE simpan teks elemen title if awal elemen = LINK simpan teks elemen link if awal elemen = DESCRIPTION simpan teks elemen description if awal elemen = GUID simpan teks elemen guid if awal elemen = PUBDATE simpan teks elemen pubdate if awal elemen = LANGUAGE simpan teks elemen language if awal elemen = COPYRIGHT simpan teks elemen copyright if awal elemen = ITEM pembacaan data Channel berakhir simpan data Channel if akhir elemen = ITEM pembacaan data Item berkahir simpan data Item end 4. Klasifikasi Pada proses ini data hasil analisis item pada proses analisis diklasifikasikan ke dalam kategori tertentu menggunakan bantuan pustaka Weka. Algoritma pada pustaka Weka yang digunakan dalam klasifikasi adalah algoritma Naïve Bayes sebagaimana algoritma ini telah dijelaskan pada subbab Simpan RSS Setelah data yang terkumpul dari rss baik channel maupun item lengkap serta telah mengalami proses klasifikasi, maka data rss ini disimpan ke dalam penyimpanan yang berupa file xml.

37 Lapisan Akses Data Lapisan Akses Data adalah lapisan di dalam aplikasi sistem yang menangani mekanisme yang berhubungan dengan data dalam hal ini adalah berkas xml Spesifikasi Kebutuhan Fungsional dan Non Fungsional Dari uraian deksripsi umum perangkat lunak maka dapat dianalisis kebutuhan fungsional dan non fungsional sistem aplikasi pada Tugas Akhir ini adalah sebagai berikut Kebutuhan Fungsional Kebutuhan fungsional berisi proses-proses atau fungsifungsi utama yang nantinya akan dilakukan oleh sistem pada perangkat lunak. Dari deskripsi umum perangkat lunak maka kebutuhan fungsional sistem perangkat lunak ditunjukkan pada Tabel 3.1. Tabel 3.1 Daftar kebutuhan fungsional sistem Kebutuhan Deskripsi Menambahkan channel Pengelola dapat menambahkan channel baru ke dalam aplikasi Melihat daftar Pengelola/Pengguna dapat melihat daftar channel channel keseluruhan Melihat berita Pengelola/Pengguna dapat melihat berita channel berdasarkan channel tertentu Melihat berita Pengelola/Pengguna dapat melihat berita kategori bersarkan kategori tertentu Menghapus Pengelola dapat menghapus channel channel tertentu Mengunduh Pengelola dapat mengunduh berita terbaru berita Melakukan Pengelola dapat melakukan klasifikasi

38 36 klasifikasi Melakukan pengaturan konten Menambah kategori Menambah data latih Melakukan pencarian Memberikan komentar Melihat detail berita Melihat histori pembaruan berita berita Pengelola dapat mengatur channel atau kategori apa saja yang ditampilkan Pengelola dapat menambah kategori berita baru Pengelola dapat menambah data latih untuk keperluan klasifikasi Pengelola/Pengguna dapat melakukan pencarian berita Pengelola/Pengguna dapat memberikan komentar Pengelola/Pengguna dapat melihat detail berita tertentu Pengelola dapat melihat kapan saja waktu pembaruan berita dan berita apa saja yang berhasil diunduh Kebutuhan Non-Fungsional Kebutuhan non-fungsional menjelaskan fungsi-fungsi pendukung perangkat lunak ditunjukkan pada Tabel 3.2. Tabel 3.2 Daftar kebutuhan non-fungsional sistem Kebutuhan Apache Tomcat Web Server Jaringan Internet Deskripsi Aplikasi Newsmaker ini hanya dapat berjalan pada server Apache Tomcat Web Server. Aplikasi Newsmakaer ini dapat berjalan jika terhubung dengan jaringan internet Aktor Pada perangkat lunak ini terdapat dua tipe aktor yaitu pengelola dan pengguna. Pengelola memiliki ruang kerja yang lebih luas disbanding pengguna. Pengelola memiliki hak akses penuh dalam melakukan manajemen konten sedangkan pengguna

39 37 hanya dapat melihat, membaca, melakukan dan memberikan komentar pada konten berita tertentu Skenario Kasus Penggunaan Berdasarkan analisis pada tahap maka fungsionalitas sistem dapat digambarkan dalam sebuah diagram kasus penggunaan yang ditunjukkan pada Gambar Kasus Penggunaan Melihat Daftar Channel Adapun spesifikasi kasus penggunaan Melihat Daftar Channel dijelaskan pada Tabel 3.3. Tabel 3.3 Spesifikasi kasus penggunaan Melihat Daftar Channel Nama Kasus Penggunaan Nomor Aktor Deskripsi Melihat Daftar Channel KP-001 Pengelola Proses ini digunakan untuk melihat daftar channel apa saja yang telah tersedia atau terdaftar dalam aplikasi Alur Normal 1. Aktor masuk pada halaman daftar channel 2. Sistem membaca data channel 3. Sistem mengambil seluruh data channel 4. Sistem menampilkan daftar channel yang tersedia Alur Alternatif - Kondisi Awal - Kondisi Akhir - Diagram aktivitas yang menggambarkan aliran fungsionalitas sistem pada kasus penggunaan Melihat Daftar Channel ditunjukkan pada Gambar 3.5.

40 38 uc Use Case Model Sistem Newsmaker mencari item melihat detail berita memperbarui channel «include» melihat daftar berita channel «include» melihat histori pembaruan berita memberi komentar menambah data latih kategori «include» menambah channel Pengelola «extend» melihat daftar channel Pengguna «extend» menambah kategori «include» melihat daftar berita kategori mengatur konten melakukan klasifikasi menghapus channel Gambar 3.4 Diagram kasus penggunaan aplikasi Sementara itu bentuk interaksi objek-objek yang terlibat dalam kasus penggunaan ini ditunjukkan diagram sekuensial pada Gambar 3.6.

dokumen-dokumen yang mirip

PERANCANGAN DAN PEMBANGUNAN PERANGKAT LUNAK PEMBUAT BERITA MENGGUNAKAN RSS DENGAN KLASIFIKASI BAYESIAN BERBASIS KERANGKA KERJA JSF

PERANCANGAN DAN PEMBANGUNAN PERANGKAT LUNAK PEMBUAT BERITA MENGGUNAKAN RSS DENGAN KLASIFIKASI BAYESIAN BERBASIS KERANGKA KERJA JSF Fajar Dwi Nugroho 1, Dwi Sunaryono 2 1,2,3 Jurusan Teknik Informatika,

Lebih terperinci

IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT

IMPLEMENTASI METODE SUPPORT VECTOR MACHINES UNTUK PENCARIAN INFORMASI BUKU RIKI HIDAYAT 10108371 Latar Belakang Masalah 1. Jumlah buku yang semakin banyak. 2. Belum adanya sistem pencarian informasi buku

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Plagiarisme Menurut Peraturan Menteri Pendidikan RI Nomor 17 Tahun 2010 dikatakan: "Plagiat adalah perbuatan sengaja atau tidak sengaja dalam memperoleh atau mencoba memperoleh

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1. Peringkas Teks Otomatis Berikut ini akan dibahas mengenai teori-teori peringkas teks otomatis dalam beberapa subbab, yaitu sebagai berikut: 2.1.1 Definisi Peringkas Teks Otomatis

Lebih terperinci

SISTEM TEMU BALIK INFORMASI

SISTEM TEMU BALIK INFORMASI Algoritma Nazief dan Adriani Disusun Oleh: Dyan Keke Rian Chikita Agus Dwi Prayogo 11/323494/PA/14356 11/323813/PA/14362 11/323856/PA/14367 PRODI S1 ILMU KOMPUTER JURUSAN ILMU

Lebih terperinci

IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING

IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING DOSEN PEMBIMBING Diana Purwitasarti, S.Kom., M.Sc. MAHASISWA Andita Dwiyoga T (5106

Lebih terperinci

BAB 2 LANDASAN TEORI. 2.1 Text mining

BAB 2 LANDASAN TEORI. 2.1 Text mining BAB 2 LANDASAN TEORI Bab ini akan membahas landasan teori, penelitian terdahulu, kerangka pikir, dan hipotesis yang mendasari penyelesaian permasalahan dalam pengklasifikasian novel menggunakan TF-IDF.

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi.1 Volume. 1 Bulan AGUSTUS ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 IMPLEMENTASI METODE VECTOR SPACE MODEL (VSM) UNTUK REKOMENDASI NILAI TERHADAP JAWABAN ESSAY Harry Septianto Teknik Informatika Universitas Komputer Indonesia

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA Pada bab ini, akan dibahas landasan teori, penelitian terdahulu, dan kerangka pikir yang mendasari penyelesaian permasalahan stemming dengan menggunakan algoritma enhanced confix

Lebih terperinci

BAB 3 ANALISIS MASALAH DAN PERANCANGAN

BAB 3 ANALISIS MASALAH DAN PERANCANGAN 3.1 State of the Art Pada penelitian sebelumnya sudah ada yang menggunakan metode Stemming untuk preprocessing text dalam mengolah data pelatihan dan data uji untuk

Lebih terperinci

Self Organizing Map-Neural Network untuk Pengelompokan Abstrak

160 ISSN: 2354-5771 Self Organizing Map-Neural Network untuk Pengelompokan Abstrak Self Organizing Map - Neural Network for Abstract Clustering Fajar Rohman Hariri* 1, Danar Putra Pamungkas 2 1,2 Universitas

Lebih terperinci

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita

Tabel 3 Situs berita dan jumlah RSS yang diunduh Situs Berita 6 besar dibandingkan dengan istilah yang berada pada description. Lingkup Implemental Lingkungan implementasi yang akan digunakan adalah sebagai berikut: Perangkat Lunak : Sistem operasi Windows XP Professional

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1. Dasar Teori 2.1.1. Kuis Online Kuis, sebagaimana didefinisikan oleh WordWeb Online (2005) adalah "sebuah ujian yang berisi pertanyaan singkat". QuestionMark & League (2004)

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 2.1. Text Mining Text mining merupakan teknik yang digunakan untuk menangani masalah klasifikasi, clustering, information extraction, dan information retrieval (Berry & Kogan, 2010).

Lebih terperinci

APLIKASI PENDETEKSI KEMIRIPAN PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA NAZIEF & ADRIANI DAN METODE COSINE SIMILARITY

APLIKASI PENDETEKSI KEMIRIPAN PADA DOKUMEN TEKS MENGGUNAKAN ALGORITMA NAZIEF & ADRIANI DAN METODE COSINE SIMILARITY Azhar Firdaus, Ernawati, dan Arie Vatresia Program Studi Teknik Informatika, Fakultas

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB 3 ANALISIS DAN PERANCANGAN SISTEM 3.1 Analisis Sistem 3.1.1 Analisis Masalah Dilihat dari sistem yang sedang berjalan saat ini sistem pencarian yang berlaku masih manual, dimana pengunjung perpustakaan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA 2.1 Analisis sentimen Analisis sentimen atau opinion mining merupakan proses memahami, mengekstrak dan mengolah data tekstual secara otomatis untuk mendapatkan informasi sentimen

Lebih terperinci

IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING

1 IMPLEMENTASI MODIFIKASI ENHANCED CONFIX STRIPPING STEMMER UNTUK BAHASA INDONESIA DENGAN METODE CORPUS BASED STEMMING Andita Dwiyoga Tahitoe - Diana Purwitasari Jurusan Teknik Informatika, Fakultas Teknologi

Lebih terperinci

Judul Dokumen : Dokumentasi RSS Penerjemah : mee Tahun : 2007

Judul Dokumen : Dokumentasi RSS Penerjemah : mee Referensi : http://w3schools.com Tahun : 2007 Lisensi : Open Apa itu RSS? RSS merupakan kependekan dari Really Simple Syndication

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

3 BAB I PENDAHULUAN 1.1. Latar Belakang Semakin banyaknya pengunaan teknologi informasi pada pemerintahan, dapat mempermudah masyarakat dalam pelayanan masyarakat itu sendiri. Seperti misalnya ketika sesorang

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Manajemen Proyek 2.1.1. Pengertian Manajemen Menurut James A.F. Stoner (2006) Manajemen adalah suatu proses perencanaan, pengorganisasian, kepemimpinan, dan pengendalian upaya

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahap-tahap yang dilaksanakan dalam pembuatan tugas akhir. Adapun tahapan yang dilalui dalam pelaksanaan penelitian ini adalah

Lebih terperinci

3.1 APLIKASI YANG DITANGANI OLEH CODE GENERATOR

3.1 APLIKASI YANG DITANGANI OLEH CODE GENERATOR BAB III ANALISIS Bab ini berisi analisis mengenai aplikasi web target code generator, analisis penggunaan framework CodeIgniter dan analisis perangkat lunak code generator. 3.1 APLIKASI YANG DITANGANI

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang Buku merupakan media informasi yang memiliki peran penting dalam perkembangan ilmu pengetahuan, karena dengan buku kita dapat memperoleh banyak informasi, pengetahuan

Lebih terperinci

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA

PERBANDINGAN ALGORITMA STEMMING PORTER DENGAN ALGORITMA NAZIEF & ADRIANI UNTUK STEMMING DOKUMEN TEKS BAHASA INDONESIA Ledy Agusta Fakultas Teknologi Informasi Universitas Kristen Satya Wacana ledyagusta@gmail.com

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI 3.1 Twitter API Application Programming Interface (API) merupakan fungsi-fungsi/perintah-perintah untuk menggantikan bahasa yang digunakan dalam system calls dengan bahasa yang lebih

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Peringkas Teks Otomatis 2.1.1 Pengertian Konsep sederhana ringkasan adalah mengambil bagian penting dari keseluruhan isi dari artikel. Ringkasan adalah mengambil isi yang paling

Lebih terperinci

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI. Oleh : SEPTIAN BAGUS WAHYONO NPM :

PEMANFAATAN TEKNIK STEMMING UNTUK APLIKASI TEXT PROCESSING BAHASA INDONESIA SKRIPSI Oleh : SEPTIAN BAGUS WAHYONO NPM : 0734010126 PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI UNIVERSITAS

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Weblog, atau yang sering disebut sebagai Blog, merupakan bagian tak terpisahkan dalam perkembangan dunia teknologi informasi berbasis Web. Berbagai jenis informasi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Natural Language Processing Natural language processing (NLP), merupakan salah satu pendekatan terkomputerisasi untuk menganalisa teks berdasarkan aspek teori dan teknologi. Menurut

Lebih terperinci

HTML DOM #1 Yosef Murya Kusuma Ardhana. ST., M.Kom

HTML DOM #1 Yosef Murya Kusuma Ardhana. ST., M.Kom HTML? HTML merupakan singkatan dari Hypertext Markup Language. HTML adalah sekumpulan text atau file ASCII yang berisi intruksi atau perintah program

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Berkembangnya teknologi telah membuat banyak informasi bermunculan. Informasi-informasi tersebut tertuang dalam bentuk dokumen terutama dokumen digital. Semakin

Lebih terperinci

TEKNIK DOCUMENT OBJECT MODEL (DOM) UNTUK MANIPULASI DOKUMEN XML. Kusnawi ABSTRACT

TEKNIK DOCUMENT OBJECT MODEL (DOM) UNTUK MANIPULASI DOKUMEN XML Kusnawi ABSTRACT Extensible Markup Language (XML) merupakan media yang sangat penting untuk representasi, pertukaran, dan pengaksesan data

Lebih terperinci

IMPLEMENTASI DAN ANALISIS ALGORITMA STEMMING NAZIEF & ADRIANI DAN PORTER PADA DOKUMEN BERBAHASA INDONESIA

ISSN (Print) : 1693-1173 ISSN (Online) : 2548-4028 IMPLEMENTASI DAN ANALISIS ALGORITMA STEMMING NAZIEF & ADRIANI DAN PORTER PADA DOKUMEN BERBAHASA INDONESIA Dwi Wahyudi 1), Teguh Susyanto 2), Didik Nugroho

Lebih terperinci

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah Analisis Kebutuhan Analisis Masalah

BAB 3 METODOLOGI 3.1 Analisis Kebutuhan dan Masalah 3.1.1 Analisis Kebutuhan Ada banyak hal yang berhubungan dengan sastra atau ilmu bahasa yang dapat diterapkan di dalam teknologi, seperti penerjemahan

Lebih terperinci

KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER

1 KLASIFIKASI ARTIKEL BERITA BERBAHASA INDONESIA BERBASIS NAÏVE BAYES CLASSIFIER MENGGUNAKAN CONFIX-STRIPPING STEMMER Amalia Anjani A. 1, Arif Djunaidy 2, Renny P. Kusumawardani 3 Jurusan Sistem Informasi,

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB I PENDAHULUAN I - 1

BAB I PENDAHULUAN I - 1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dunia pendidikan merupakan dunia yang memerlukan perhatian khusus karena pendidikan merupakan faktor yang sangat mempengaruhi kualitas para calon penerus bangsa

Lebih terperinci

Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia

ISSN : 088-9984 Seminar Nasional dan ExpoTeknik Elektro 0 Analisa dan Evaluasi Afiks Stemming untuk Bahasa Indonesia Jiwa Malem Marsya ) dan Taufik Fuadi Abidin ) ) Data Mining and IR Research Group FMIPA

Lebih terperinci

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy).

BAB I PENDAHULUAN. Pada sekarang ini ketersediaan informasi berbentuk dokumen teks. sebagian besar sudah berbentuk elektronik (softcopy). BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada sekarang ini ketersediaan informasi berbentuk dokumen teks sebagian besar sudah berbentuk elektronik (softcopy). Kemungkinan penyimpanan media teks ke

Lebih terperinci

BAB III METODOLOGI PENELITIAN

28 BAB III METODOLOGI PENELITIAN Untuk menunjang kegiatan penelitian, dalam bab ini akan dijelaskan desain penelitian, metode penelitian yang digunakan, serta alat dan bahan penelitian. 3.1 Desain Penelitian

Lebih terperinci

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era

BAB I PENDAHULUAN. informasi pada ruang lingkup besar (biasanya disimpan di komputer). Di era BAB I PENDAHULUAN 1.1 Latar Belakang Information retrieval atau disingkat dengan IR adalah menemukan bahan (dokumen) dari dokumen terstruktur (biasanya teks) yang memenuhi kebutuhan informasi pada ruang

Lebih terperinci

Implementasi Stemmer Tala pada Aplikasi Berbasis Web

Implementasi Stemmer Tala pada Aplikasi Berbasis Web Mardi Siswo Utomo Program Studi Teknik Informatika, Universitas Stikubank email : mardiutomo@gmail.com Abstrak Stemming adalah proses untuk mencari kata dasar pada suatu kata. Pada analisa temu kembali

Lebih terperinci

BAB 3. METODOLOGI PENELITIAN

BAB 3. METODOLOGI PENELITIAN 3.1 Alat dan Bahan Penelitian Pada penelitian ini menggunakan alat penelitian berupa perangkat keras dan perangkat lunak, yaitu : 1. Perangkat keras a. Processor Intel Core

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Klasifikasi Klasifikasi merupakan suatu pekerjaan menilai objek data untuk memasukkannya ke dalam kelas tertentu dari sejumlah kelas yang tersedia. Dalam klasifikasi ada dua pekerjaan

Lebih terperinci

Framework CodeIgniter Part 1

1 Framework CodeIgniter Part 1 Fajar Y. Zebua fajarzebua@gmail.com http://www.bangjar.blogspot.com Lisensi Dokumen : Copyright 2012 Fajar Y. Zebua Seluruh tulisan yang dibuat oleh Fajar Y. Zebua dapat

Lebih terperinci

Klasifikasi Konten Berita Dengan Metode Text Mining

JURNAL DUNIA TEKNOLOGI INFORMASI Vol. 1, No. 1, (2012) 14-19 14 Klasifikasi Konten Berita Dengan Metode Text Mining 1 Bambang Kurniawan, 1 Shril Effendi, 1 Opim Salim Sitompul 1 Program Studi S1 Teknologi

Lebih terperinci

Gambar 1.1 Proses Text Mining [7]

Gambar 1.1 Proses Text Mining [7] 1. BAB II LANDASAN TEORI 2.1 Text Mining Text mining memiliki definisi menambang data yang berupa teks dimana sumber data biasanya didapatkan dari dokumen, dan tujuannya adalah mencari kata-kata yang dapat

Lebih terperinci

Learning Vector Quantization untuk Klasifikasi Abstrak Tesis

128 ISSN: 2354-5771 Learning Vector Quantization untuk Klasifikasi Abstrak Tesis Fajar Rohman Hariri* 1, Ema Utami 2, Armadyah Amborowati 3 1,2,3 Magister Teknik Informatika STMIK AMIKOM Yogyakarta E-mail:

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI Bab ini menjelaskan mengenai dasar teori yang digunakan oleh penulis sebagai acuan dalam membuat sistem. 3.1 Pariwisata Menurut UU No 10 Tentang Kepariwisataan tahun 2009 pasal 1

Lebih terperinci

Dasar Pemrograman Web. Pemrograman Web. Adam Hendra Brata

Dasar Pemrograman Web. Pemrograman Web. Adam Hendra Brata Dasar Pemrograman Web Pemrograman Web Adam Hendra Brata Konsep Dasar Desain Web HTML CSS HTML HTML (HyperText Markup Language) Bahasa standar yang digunakan untuk menampilkan document web. Mengontrol tampilan

Lebih terperinci

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB III ANALISIS DAN PERANCANGAN SISTEM 3.1. Analisis Sistem Analisis sistem bertujuan untuk mengidentifikasi permasalahanpermasalahan yang ada pada sistem yang meliputi perangkat lunak (software), pengguna

Lebih terperinci

BAB 3 ANALISIS DAN PERANCANGAN

BAB 3 ANALISIS DAN PERANCANGAN 3.1 Analisis Masalah Penelitian yang sudah pernah membuat sistem ini berhasil menciptakan pembangkitan pertanyaan non-factoid secara otomatis dengan menggunakan tiga jenis

Lebih terperinci

IMPLEMENTASI ALGORITMA MULTINOMIAL NAIVE BAYES CLASSIFIER PADA SISTEM KLASIFIKASI SURAT KELUAR (Studi Kasus : DISKOMINFO Kabupaten Tangerang)

JURNAL TEKNIK INFORMATIKA VOL.10 NO.2, 2017 109 IMPLEMENTASI ALGORITMA MULTINOMIAL NAIVE BAYES CLASSIFIER PADA SISTEM KLASIFIKASI SURAT KELUAR (Studi Kasus : DISKOMINFO Kabupaten Tangerang) Dea Herwinda

Lebih terperinci

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING

APLIKASI PENENTUAN KATA DASAR DARI KATA BERIMBUHAN PADA KALIMAT BAHASA INDONESIA DENGAN ALGORITMA STEMMING Julianto Wibowo Mahasiswa Program Studi Teknik Informatika, STMIK Budi Darma Medan Jl. Sisimangaraja

Lebih terperinci

BAB II KAJIAN TEORI. kumpulan kalimat penting dari suatu teks yang menggambarkan inti teks tersebut

BAB II KAJIAN TEORI. kumpulan kalimat penting dari suatu teks yang menggambarkan inti teks tersebut A. Peringkasan Teks Otomatis BAB II KAJIAN TEORI Peringkasan teks merupakan proses untuk mendapatkan ringkasan teks secara otomatis dengan menggunakan bantuan komputer. Ringkasan teks adalah kumpulan kalimat

Lebih terperinci

BAB I PENDAHULUAN. Dari tahun ke tahun sudah tidak dapat dipungkiri bahwa teknologi informasi

BAB I PENDAHULUAN. Dari tahun ke tahun sudah tidak dapat dipungkiri bahwa teknologi informasi BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dari tahun ke tahun sudah tidak dapat dipungkiri bahwa teknologi informasi mengalami kemajuan yang sangat pesat. Ini merupakan bukti bahwa manusia senantiasa

Lebih terperinci

PEMANFAATAN ARDUINO DALAM PENGEMBANGAN SISTEM RUMAH PINTAR BERBASIS MOBILE DAN WEB (Studi Kasus : Penjadwalan Lampu Rumah)

PEMANFAATAN ARDUINO DALAM PENGEMBANGAN SISTEM RUMAH PINTAR BERBASIS MOBILE DAN WEB (Studi Kasus : Penjadwalan Lampu Rumah) TUGAS AKHIR Disusun sebagai salah satu syarat untuk kelulusan Program Strata 1,

Lebih terperinci

dimana P(A B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan 2.1 didapatkan persamaan 2.2.

dimana P(A B) artinya peluang A jika diketahui keadaan B. Kemudian dari persamaan 2.1 didapatkan persamaan 2.2. 1.1 Naive Bayes Classifier Naive bayes classifier merupakan salah satu metode machine learning yang dapat digunakan untuk klasifikasi suatu dokumen. Teorema bayes berawal dari persamaan 2.1, yaitu: (2.1)

Lebih terperinci

3.1 Ganesha Digital Library

3.1 Ganesha Digital Library BAB III ANALISIS Dalam bab ini akan dibahas mengenai analisis perangkat lunak yang akan dibangun. Analisis dilakukan pada sistem lama dan sistem baru. Analisis pada sistem lama meliputi penerapan folksonomy,

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN Pada bab ini akan dibahas mengenai analisa proses information retrieval dengan menggunakan cosine similarity dan analisa proses rekomendasi buku dengan menggunakan jaccard

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. sebuah sistem pencarian lokasi kuliner berbasis mobile web untuk wilayah

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Dalam penelitian yang dilakukan oleh Hasan (2011) tentang aplikasi pencarian lokasi kuliner di Yogyakarta. Penelitian tersebut telah menghasilkan

Lebih terperinci

BAB 1 PENDAHULUAN UKDW

BAB 1 PENDAHULUAN UKDW BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Saat ini sudah banyak sistem klasifikasi yang diciptakan dalam rangka membantu pengguna dalam melakukan pengklasifikasian dokumen, baik dokumen yang berbentuk

Lebih terperinci

Search Engines. Information Retrieval in Practice

Search Engines. Information Retrieval in Practice Search Engines Information Retrieval in Practice All slides Addison Wesley, 2008 Search Engine Architecture Arsitektur dari mesin pencari ditentukan oleh 2 persyaratan efektivitas (kualitas hasil) efisiensi

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang Perkembangan dunia perpustakaan, dari segi data dan dokumen yang disimpan, dimulai dari perpustakaan tradisional yang hanya terdiri dari kumpulan koleksi buku tanpa

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini

Lebih terperinci

IMPLEMENTASI TEKNOLOGI SINDIKASI DALAM PENGELOLAAN LAYANAN INFORMASI WEB LAPAN BANDUNG

Implementasi Teknologi Sindikasi dalam Pengelolaan...(Elyyani) IMPLEMENTASI TEKNOLOGI SINDIKASI DALAM PENGELOLAAN LAYANAN INFORMASI WEB LAPAN BANDUNG Elyyani Peneliti Bidang Sistem Informasi, Lapan e-mail:

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM Pada bab ini membahas analisa dan perancangan sistem, penelitian ini menggunakan bahasa pemrograman berbasis objek. Analisa sistem meliputi analisa kebutuhan fungsional,

Lebih terperinci

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa

BAB I PENDAHULUAN. penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dengan kemajuan teknologi yang sangat pesat ini sudah banyak aplikasi penunjang Al-Quran untuk memudahkan untuk mempelajarinya, yang bisa disebut atau di artikan

Lebih terperinci

BAB II LANDASAN TEORI. bidang media komunikasi dan informasi. Internet adalah suatu jaringan komputer

BAB II LANDASAN TEORI. bidang media komunikasi dan informasi. Internet adalah suatu jaringan komputer BAB II LANDASAN TEORI 2.1 World Wide Web Dunia internet semakin berkembang, terutama penggunaanya dalam bidang media komunikasi dan informasi. Internet adalah suatu jaringan komputer global, sedangkan

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI III.1. Sistem Informasi Sistem presensi menggunakan QRCode dan ijin berbasis web dan mobile merupakan sistem informasi yang digunakan untuk menyelesaika masalah presensi dan ijin

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini menjelaskan tentang analisa data, rancangan sistem, dan skenario pengujian. Bagian analisa data meliputi data penelitian, analisis data, data preprocessing.

Lebih terperinci

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS

PENERAPAN ALGORITMA STEMMING NAZIEF & ADRIANI DAN SIMILARITY PADA PENERIMAAN JUDUL THESIS Hafiz Ridha Pramudita Magister Teknik Informatika STMIK AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur, Sleman,

Lebih terperinci

JULIO ADISANTOSO - ILKOM IPB 1

JULIO ADISANTOSO - ILKOM IPB 1 KOM341 Temu Kembali Informasi KULIAH #3 Inverted Index Inverted index construction Kumpulan dokumen Token Modifikasi token Tokenizer Linguistic modules perkebunan, pertanian, dan kehutanan perkebunan pertanian

Lebih terperinci

PENERAPAN JAVA SERVER FACES UNTUK DESIGN PATTERN WEB

PENERAPAN JAVA SERVER FACES UNTUK DESIGN PATTERN WEB Yanto (1) Abstrak: J2EE Pattern adalah kumpulan pola-pola yang digunakan dalam menyelesaikan masalah yang umumnya dihadapi oleh setiap programmer Java

Lebih terperinci

BAB III LANDASAN TEORI. user management seperti yang diuraikan oleh definisi-definisi berikut.

BAB III LANDASAN TEORI. user management seperti yang diuraikan oleh definisi-definisi berikut. BAB III LANDASAN TEORI 3.1. Teori Umum Terdapat beberapa teori umum yang digunakan dalam implementasi web user management seperti yang diuraikan oleh definisi-definisi berikut. 3.1.1. CDM (Conceptual Data

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Sentimen Analisis Analisis sentimen juga dapat dikatakan sebagai opinion mining. Analisis sentimen dapat digunakan dalam berbagai kemungkian domain, dari produk konsumen, jasa

Lebih terperinci

Klasifikasi Iklan pada Online Shop dengan Metode Naive Bayes

Klasifikasi Iklan pada Online Shop dengan Metode Naive Bayes Danny Septiawan 1,Dwi Aries Suprayogi 1,Abdul Malik Mukhtar 1,Wahyudi Hatiyanto 1 1 Teknik Informatika, Program Teknologi Informasi dan Ilmu

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Dalam dunia perdagangan, kode yang banyak dipakai adalah barcode (kode batang). Hampir semua barang yang dijual di toko grosir, department store sudah menggunakan dan

Lebih terperinci

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya.

BAB I PENDAHULUAN. memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. BAB I PENDAHULUAN 1. 1.1. Latar Belakang Perkembangan infrastruktur dan penggunaan teknologi informasi memberikan dampak yang luas dalam bagaimana manusia menjalani hidupnya. Salah satunya adalah perolehan

Lebih terperinci

BAB III ANALISIS. 3.1 Analisis Model Business Process Outsourcing

BAB III ANALISIS. 3.1 Analisis Model Business Process Outsourcing BAB III ANALISIS 3.1 Analisis Model Outsourcing Dari beberapa penjelasan mengenai model Outsourcing (BPO) pada subbab 2.3.1, diajukan Gambar III.1 sebagai gambaran umum dari BPO pada Tugas Akhir ini. Beberapa

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI II.1. Sistem Informasi Sistem informasi adalah sekumpulan elemen yang saling bekerja sama baik secara manual atau berbasis komputer yang didalamnya ada pengumpulan, pengolahan, pemprosesan

Lebih terperinci

Rancang Bangun Aplikasi Pengelompokan dan Pemberi Rekomendasi Berita Lomba Online Menggunakan Klasifikasi Fuzzy Berbasis Kerangka Kerja Spring

JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) A-105 Rancang Bangun Aplikasi Pengelompokan dan Pemberi Rekomendasi Berita Lomba Online Menggunakan Klasifikasi Fuzzy Berbasis

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam

BAB III METODOLOGI PENELITIAN. Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam BAB III METODOLOGI PENELITIAN 3.1 Desain Penelitian Gambar 3.1 merupakan desain penelitian yang akan digunakan dalam proses penelitian penerapan algoritma K-Means pada clustering berita berbahasa Indonesia.

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Sekarang ini, ketersediaan sumber informasi dalam bentuk dokumen teks sebagaian besar telah disajikan ke dalam bentuk elektronik. Kemungkinan penyimapan media

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI III.1. Sistem Informasi Sistem informasi adalah suatu sistem yang dibuat oleh manusia yang terdiri dari komponen komponen dalam organisasi untuk mencapai suatu tujuan yaitu menyajikan

Lebih terperinci

MANAJEMEN INTERNET CONTENT DAN INTEGRASI APLIKASI UNTUK MENDUKUNG ENTERPRISE INFORMATION PORTAL EKSEKUTIF

MANAJEMEN INTERNET CONTENT DAN INTEGRASI APLIKASI EMAIL UNTUK MENDUKUNG ENTERPRISE INFORMATION PORTAL EKSEKUTIF D. Faroq Romdhoni 1, Rengga Asmara 2, Arif Basofi 2 Mahasiswa 1, Dosen Pembimbing 2 Politeknik

Lebih terperinci

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS)

PRESENTASI TUGAS AKHIR KI PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) PRESENTASI TUGAS AKHIR KI091391 PERANCANGAN DAN PEMBANGUNAN MODUL REKOMENDASI SECTION PADA OPEN JOURNAL SYSTEM (OJS) (Kata kunci: Jurnal, K-Nearest Neighbor, Karya Ilmiah, Klasifikasi Penyusun Tugas Akhir

Lebih terperinci

MODEL INTERAKSI APLIKASI WEB PADA TEKNOLOGI JAVA

INFOMATEK Volume 18 Nomor 2 Desember 2016 MODEL INTERAKSI APLIKASI WEB PADA TEKNOLOGI JAVA Ade Sukendar *) Program Studi Teknik Informatika Fakultas Teknik Universitas Pasundan Abstrak: Aplikasi web adalah

Lebih terperinci

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER

STEMMING BAHASA INDONESIA SEBAGAI MEDIA BELAJAR SISWA SEKOLAH MENGGUNAKAN ALGORITMA PORTER Dony Yudha Lestiyanto, A12.2009.03537 Sistem Informasi S1 Universitas Dian Nuswantoro Semarang 2014 Abstrak Stemming

Lebih terperinci

Jurnal String Vol.1 No.2 Tahun 2016 ISSN :

Jurnal String Vol.1 No.2 Tahun 2016 ISSN : PERBANDINGAN ALGORITMA STEMMING PORTER DENGANARIFIN SETIONO UNTUK MENENTUKAN TINGKAT KETEPATAN KATA DASAR Dian Novitasari Program Studi Teknik Informatika, Universitas Indraprasta PGRI Emai : diannovita.unindra@gmail.com

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan rekomendasi tag serta metode TF-IDF dan Collaborative tagging. 2.1 Rekomendasi Tag Rekomendasi

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN SISTEM. diusulkan dari sistem yang ada di Dinas Kebudayaan dan Pariwisata Kota

BAB IV ANALISA DAN PERANCANGAN SISTEM 4.1. Analisis Sistem yang Sedang Berjalan Pada bab ini dijelaskan mengenai prosedur yang berjalan dan yang diusulkan dari sistem yang ada di Dinas Kebudayaan dan Pariwisata

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 3.1 Metode Pengumpulan Data Dalam kegiatan pengumpuan data untuk penelitian ini digunakan metode pengumpulan studi pustaka yag mana pada metode ini kegiatan dilakukan adalah

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN berikut. Tahapan penelitian yang dilakukan dalam penelitian adalah sebagai Indentifikasi Masalah Merumuskan Masalah Study Literatur Perancangan : 1. Flat Teks 2. Database

Lebih terperinci

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah BAB III METODOLOGI Dalam penelitian ini metodologi memegang peranan penting guna mendapatkan data yang obyektik, valid dan selanjutnya digunakan untuk memecahkan permasalahan yang telah dirumuskan. Maka

Lebih terperinci

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

Bab 1 PENDAHULUAN. 1.1 Latar Belakang Masalah Bab 1 PENDAHULUAN 1.1 Latar Belakang Masalah Semakin hari semakin banyak inovasi, perkembangan, dan temuan-temuan yang terkait dengan bidang Teknologi Informasi dan Komputer. Hal ini menyebabkan semakin

Lebih terperinci

BAB I PERSYARATAN PRODUK

BAB I PERSYARATAN PRODUK 1.1 Pendahuluan Perusahaan CV. Alfa Teknologi membutuhkan aplikasi untuk pengembangan reservasi penginapan. Aplikasi ini bisa menjadi investasi bagi perusahaan, karena di Indonesia

Lebih terperinci

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF)

Sistem Temu Kembali Informasi pada Dokumen Teks Menggunakan Metode Term Frequency Inverse Document Frequency (TF-IDF) 1 Dhony Syafe i Harjanto, 2 Sukmawati Nur Endah, dan 2 Nurdin Bahtiar 1 Jurusan Matematika,

Lebih terperinci

To make this website work, we log user data and share it with processors. To use this website, you must agree to our Privacy Policy, including cookie policy.