PENCARIAN KEYWORD PAPER MENGGUNAKAN ALGORITMA BAYESIAN

dokumen-dokumen yang mirip
TEKNOLOGI APLIKASI WEB BERBASIS SERVER

HTML 5. Geolocation Web SQL Database, media penyimpanan database lokal

BAB 1 PENDAHULUAN. perusahaan yang serupa menggunakan sistem pelayanan bisinis secara online.

BAB 1 PENDAHULUAN. diinginkan. Dengan banyaknya penjual ikan secara konvensional untung yang

BAB III LANDASAN TEORI

BAB 1 PENDAHULUAN. yang sudah maju seperti Amerika, Eropa, Jepang dan lain sebagainya.

SISTEM INFORMASI PELATIHAN LEMBAGA PENGEMBANGAN DAN PENJAMINAN MUTU PENDIDIKAN UNIVERSITAS DIPONEGORO SEMARANG

BAB III TINJAUAN PUSTAKA

Bab II. TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA. Suatu sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling

BAB 2 LANDASAN TEORI

BAB III TINJAUAN PUSTAKA

BAB III LANDASAN TEORI. sistem, pengertian sistem informasi, sumber dari sistem informasi, dan metodemetode. lainnya yang dipakai dalam pembahasan.

SMS gateway telah banyak digunakan dalam berbagi aplikasi dan

WEBSITE PEMILIHAN CALON KETUA HIMPUNAN JURUSAN SISTEM KOMPUTER UNIVERSITAS KRISTEN MARANATHA. Angga Indrajaya /

BAB 2 LANDASAN TEORI. Sitem adalah kumpulan dari elemen-elemen yang berinteraksi untuk mencapai tujuan. keluaran. Berikut gambaran umum sebuah sistem.

BAB 1 PENDAHULUAN. perubahan kultur kita sehari-hari. Dalam era yang disebut information age ini, media

Perancangan Website Ujian. Teknik Elektro UNDIP Berbasis HTML

BAB II TINJAUAN PUSTAKA

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI. layanan (service) tertentu dalam sebuah jaringan komputer. Server. sebagai sistem operasi jaringan (network operating system).

BAB 2 TINJAUAN PUSTAKA. : Multi sistem operasi, bisa Windows, Linux, Mac OS, maupun Solaris

BAB 1 PENDAHULUAN. Sistem informasi merupakan fokus utama dari studi disiplin sistem informasi dan

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. Sistem adalah jaringan kerja dari prosedur-prosedur yang saling berhubungan,

Dasar Pemrograman Web. Pemrograman Web. Adam Hendra Brata

Pertemuan 1. Pengenalan Dasar Web

BAB II LANDASAN TEORI. Dalam pembangunan suatu sistem informasi, terdapat dua kelompok

(artikel Pengantar ke PHP, Bpk Marsani Asfi)

BAB 2 LANDASAN TEORI. disebut HTML (HyperText Markup Langauge). Pada perkembangan berikutnya,

BAB 1 PENDAHULUAN Latar Belakang. Dalam era globalisasi saat ini, ilmu pengetahuan dan teknologi berkembang

BAB II TINJAUAN PUSTAKA

PENGERTIAN WEB web adalah

MODUL 3 DASAR-DASAR PHP

No HP :

BAB II LANDASAN TEORI. di jaman sekarang, namun apakah Anda mengetahui sejarah nya itu?. Mungkin,

BAB 2 LANDASAN TEORI

BAB III LANDASAN TEORI


BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. Website atau World Wide Web, sering disingkat sebagai www atau web saja, yakni

BAB II LANDASAN TEORI. produk itu baik atau rusak ataupun untuk penentuan apakah suatu lot dapat diterima

Pemrograman Web BAB I Pendahuluan

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. karya ilmiah yaitu penelitian yang dilakukan Lingga Jaya Bermana Putra mahasiswa

BAB I PENDAHULUAN. internet yang sangat membantu dalam kemudahan serta kecepatan pengiriman,

BAB II LANDASAN TEORI

BAB III LANDASAN TEORI. berkembang sejalan dengan perkembangan teknologi informasi. Contoh aplikasi


BAB II KAJIAN PUSTAKA

BAB 1 PENDAHULUAN. kehidupan manusia membuat manusia yang dalam hal ini sebagai user menginginkan

BAB 1 PENDAHULUAN. yang benar-benar mempunyai skill atau kemampuan dalam bidang Teknologi

BAB 2 LANDASAN TEORI

APLIKASI REGISTRASI ONLINE PADA WEBSITE INTERAKTIF

BAB 1 PENDAHULUAN. penerimaan informasi. Mulai dari perusahaan-perusahaan, sekolah-sekolah,

RANCANGAN APLIKASI LAPORAN PENYELENGGARAAN PEMERINTAHAN DAERAH KABUPATEN/KOTA PROVINSI SULAWESI SELATAN BERBASIS WEB

BAB III LANDASAN TEORI

BAB 2 LANDASAN TEORI. Kata komputer (computer) berasal dari bahasa latin computare yang berarti

BAB II TINJAUAN PUSTAKA

PEMBUATAN APLIKASI SISTEM PENDAFTARAN PRAKTIKUM ONLINE PADA JURUSAN TEKNIK INFORMATIKA UNIVERSITAS KRISTEN PETRA DENGAN MENGGUNAKAN PHP

BAB 2 LANDASAN TEORI. Bab ini akan menjelaskan masalah-masalah teoritis yang berkaitan dalam pembuatan

BAB II LANDASAN TEORI. Internet adalah singkatan dari Interconnection network, merupakan

BAB 2 TINJAUAN PUSTAKA. memerlukan Jaringan Internet. Namun Tentu saja filenya berada di komputer

BAB III LANDASAN TEORI

Bahasa Pemrograman Untuk Pembuatan Web

APLIKASI BERBASIS WEB

Pertemuan Ke-1 (Konsep Dasar Web) D3 Manajemen Informatika - Unijoyo 1

PEMROGRAMAN WEB. Agussalim

BAB III LANDASAN TEORI. Secara umum pengertian inventori adalah stock barang yang harus dimiliki

XAMPP dan CMS (XAMPP Paket Apache, PHP dan MySQL Instant. Sistem Informasi Manajemen Sesi 9 STIE YASA ANGGANA GARUT

BAB III LANDASAN TEORI

BAB II LANDASAN TEORI

APLIKASI MANAJEMEN PERPUSTAKAAN BERBASIS WEB MENGGUNAKAN PHP DAN MYSQL PADA SMA NEGERI 5 BINJAI TUGAS AKHIR FATIMAH

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI. World Wide Web (WWW) atau lebih dikenal dengan web merupakan salah satu

BAB II TINJAUAN PUSTAKA. Berkaca dari pesatnya laju perkembangan teknologi. modern, sistem penjadwalan guru di sebuah sekolah akan lebih

Pemrograman Basis Data Berbasis Web

BAB II LANDASAN TEORI. untuk mencapai tujuan (McLeod, 2010). Sistem juga dapat didefinisikan sebagai

BAB 2 LANDASAN TEORI

Pengenalan Web Server dan Server Side Scripting

BAB II TINJAUAN PUSTAKA. Website merupakan kumpulan dari halaman halaman yang berhubungan dengan

BAB II LANDASAN TEORI. Perangkat lunak atau Software adalah perintah (program komputer) yang dieksekusi

BAB 1 PENDAHULUAN. pengetahuan dan pola pikir manusia. Salah satu bidang yang turut serta menikmati hasil

BAB II KAJIAN PUSTAKA

BAB 2 LANDASAN TEORI. tujuan tertentu. Sistem mempunyai karakteristik atau sifat-sifat tertentu, yaitu:

BAB 2 LANDASAN TEORI. Computer Based Information System (CBIS) atau yang dalam Bahasa Indonesia disebut juga

KAMUS INGGRIS-INDONESIA BERBASIS J2ME

Pemrograman Web I (Mengenal. Web) Oleh : Devie Rosa Anamisa

Rekayasa Sistem Web. Teguh Wahyono. Fakultas Teknologi Informasi Semester Antara Tahun 2012/2013

BAB 2 LANDASAN TEORI

TOKO KUE ONLINE (STUDI KASUS PADA TOKO QANITA PASTRY)

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI

Pertemuan 11 Pengenalan DBMS dan MySQL

Cara Membuat Website. Heni Handayani. Abstrak. Pendahuluan. ::

PERANCANGAN DAN IMPLEMENTASI SISTEM INFORMASI SEKOLAH (STUDI KASUS SMP N 2 PATIKRAJA BANYUMAS)

BAB II LANDASAN TEORI

WWW (World Wide Web) Adalah salah satu bentuk layanan yang dapat diakses melalui internet. Biasa disingkat sebagai Web. Merupakan sekumpulan

BAB II LANDASAN TEORI. Pada tahap ini berisi pengertian dan penjelasan teori-teori yang digunakan penulis untuk pembangunan sistem.

: ANALISIS DAN PERANCANGAN SISTEM. berbasis web dengan gambaran umum rancangannya.

BAB II TINJAUAN PUSTAKA. Menurut Jogianto (2001), Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang

Transkripsi:

PENCARIAN KEYWORD PAPER MENGGUNAKAN ALGORITMA BAYESIAN Firman Arifin 1), Moch Hariadi 2), Achmad Basuki 3) 1) Jurusan Elektronika, Politeknik Elektronika Negeri Surabaya 2) Jurusan Teknik Elektro, 3) Jurusan Teknologi Informasi, Politeknik Elektronika Negeri Surabaya Institut Teknologi Sepuluh Nopember (ITS) Surabaya Kampus ITS, Keputih Sukolilo Surabaya Telepon +62-31-5947280 Fax +62-31-6946114 Email : firmanits@yahoo.com Abstrak Penggunaan Keyword dalam sebuah informasi sangat diperlukan, karena hal tersebut memudahkan para pembaca untuk mengetahui langsung point-point tertentu yang terdapat pada isi informasi. Karena point-point itu dapat menelaskan sebagian besar isi informasi dan menyampaikan info kepada pembaca sehingga pembaca tahu apa hal-hal yang bisa ia ambil dari informasi. Pada paper ini menelaskan bahwa keyword untuk paper atau makalah digunakan untuk mempermudah pembaca mencari point-point penting pada paper atau makalah. Software aplikasi yang kami gunakan adalah Apache (sebagai Web Server), PHP (Pemrograman berbasis Web) dan Mysql (aplikasi Database). Untuk algoritma pemrosesan kami gunakan Bayesian Classifier sebagai machine learning untuk mefilter dan menghasilkan keyword yang sesuai. Program aplikasi pencarian keyword makalah ini akan ditampilkan pada Web, sehingga pengakses mudah untuk menggunakannya Kata kunci: Keyword, Algoritma Bayesian, Informasi, paper. 1. PENDAHULUAN Pesatnya perkembangan teknologi informasi pada lingkungan kita, disebabkan karena adanya pemikiran bagaimana aktifitas yang bersifat konvensional dapat dilakukan pada masa sekarang ini dengan proses yang lebih mudah. Dengan muncul teknologi untuk dapat menghubungkan komunitas di seluruh dunia yaitu menggunakan internet, dan layanan ini bisa langsung mengakses sesuai alamat yang akan dituu dengan menggunakan IP Public. Layanan akses informasi uga cepat dengan adanya bantuan situs pencari seperti Google, Lycos atau Yahoo service, sehingga orang-orang dapat langsung menemukan informasi yang diinginkan tanpa harus membaca semuanya cukup memberikan kata kunci. Disitulah pentingnya kata kunci untuk membantu pencarian informasi yang dibutuhkan. Kata kunci itu uga dapat mewakili point-point penting pada media informasi. Disini kami akan membantu pengakses informasi menemukan kata kunci pada media informasi yang berupa makalah dimaksudkan agar pengakses dapat mengetahui isi pokok dengan melihat kata kunci yang dihasilkan, tanpa harus membaca seluruh isi makalah. Dan pencarian ini menggunakan metode Bayesian karena terbukti metode ini pada machine learning mampu memberikan hasil yang optimal. Dan software yang kami buat berbasis Web dimaksudkan agar semua dapat mengakses dengan mudah karena lewat Internet. 2. TINJAUAN PUSTAKA Untuk membangun sistem ini maka diperlukan beberapa komponen-komponen sebagai berikut: 2.1 HTML HTML adalah singkatan dari Hyper Text Markup Language,merupakan bahasa teks yang menggunakan tanda-tanda (markup) yang dikenal dengan <tag>, dimana merupakan pengembangan dari SGML (Standard Generalize Markup Language ). Dengan HTML maka dapatlah dibuat suatu halaman web statis dimana nantinya merupakan dasar dari pembuatan halaman web dinamis. Adapun kelebihannya html ini meliput semua platform, adi walau anda menggunakan OS (operating System) apapun maka akan tetap bisa dialankan. 2.2 Apache Sebagai Web Server Web Server (World Wide Web Server) adalah server internet yang melayani koneksi transfer data dalam protocol HTTP (Hypertext Transfer Protocol). Web server saat ini merupakan inti dari server-server internet selain e-mail server, ftp, dan news server. Hal ini dapat dimaklumi karena web server yang telah dirancang untuk dapat melayani berbagai enis data, mulai dari text, hypertext, gambar (image), suara, plug-in dan sebagainya Salah satu enis web server yang banyak dipakai dan digemari adalah Apache. Karena beberapa alasan kemudahan,seperti: Bersifat Free (gratis). Mudah dalam proses instalasi A-10

Ringan dalam proses kera sebagai srver dan cepat dalam proses transfer file. Handal dengan berbagai fitur keamanan dan lainnya. Bersifat Multiplatform (Perbedaan Operating system masih bisa berkomunikasi). 2.3 PHP pemrograman Web Dinamis PHP (Hypertext Preprocecor) dikenal sebagai sebuah bahasa skrip yang menyatu dengan tag-tag HTML, diproses hanya di server. Sedangkan hasil yang dikirim ke klien berupa skrip HTML, ditangkap menggunakan browser pada sisi klien. PHP digunakan untuk pembuatan Web Dinamis seperti halnya Active Server Pages (ASP), Java Server Pages (JSP), PERL dan sebagainya. Kelebihan PHP sehingga banyak digemari adalah sebagai berikut: Life Cycle yang singkat, sehingga PHP selalu mengikuti perkembangan teknologi Internet. Cross platform, php dapat dipakai di hampir semua web server yang ada di pasaran (Apache, AOLServer, fhttpd, Microsoft IIS dan lain-lain), dan dapat dialankan di berbagai sistem operasi (Windows, Linux, FreeBSD, Unix, Solaris dan sebagainya). PHP mendukung banyak paket database baik yang komersil maupun nonkomersil seperti PostgreeSQL, MySQL, Oracle dan lain-lainnya. Akses database yang lebih fleksibel. Waktu eksekusi lebih cepat. Tingkat keamanan tinggi. 2.4 MySQL database Sistem MySQL adalah salah satu enis database server yang sangat terkenal. Kepopuleran disebabkan karena MySQL menggunakan SQL sebagai bahasa dasar untuk mengakses databasenya. MySQL merupakan server basis data yang menggunakan teknik relasional untuk menghubungkan antara table-tabel dalam databasenya atau mendukung RDBMS (Relational Database Management System), adapun kelebihan lain dari MySQL adalah sebagai berikut: MySQL bersifat Free (gratis) Dikeluarkan oleh GNU General Public Licence (GPL) sama seperti PHP sehingga keduanya cocok untuk digabungkan. MySQL uga bersifat OpenSource adi para user dapat mengembanggkan pengetahuaanya mengenai MySQL secara gratis. Kemampuan yang handal (robust). Multi-user (banyak pemakai) cocok untuk server. Multi-thread (beberapa prosedur dalam proses dikerakan bersama) sehingga proses cepat. Kecepatan koneksi yang tinggi dan keamanan yang kuat. 2.5 Bayesian Sebagai pemroses Kata Kunci 2.5.1 Teori Bayes Teori Bayes sebenarnya merupakan implementasi teori probabilitas bersyarat. Teori Bayes seperti probabilitas bersyarat digunakan untuk menentukan probabilitas suatu keadian Y, bila diketahui keadiankeadian lain X 1, X 2, X 3,..., X n. Gambaran teori bayes dalam diagram Venn adalah sebagai berikut. X X X n Y Gambar 1. Diagram Ven Teori Bayes Probabilitas X k bila Y diketahui dapat dihitung menggunakan Teori Bayes yang didefinisikan dengan: P(X k Y) P(Y X k ) Σ P(Y X i )P(X i ) A-11

2.5.2 HMAP HMAP (Hypothesis Maximum Appropri Probability) menyatakan hipotesa yang diambil berdasarkan nilai probabilitas berdasarkan kondisi prior yang diketahui. HMAP inilah yang digunakan di dalam metode Bayes untuk proses machine learning dari data training tertentu. Untuk menentukan HMAP untuk keadian ya dan tidak dari X, terlebih dahulu diketahui P(X) dan P(~X) yang menyatakan probabilitas X dan probabilitas bukan X. Kemudian diketahui P(Y i X) dan P(Y i ~X) yang menyatakan probabilitas Y i di dalam X dan probabilitas Y i di dalam bukan X. Data-data itulah yang dinamakan dengan fakta atau dikenal dengan keadaan prior. Dari keadaan prior inilah dapat ditentukan hipotesa yang digunakan untuk menentukan keputusan apakah X atau bukan X. HMAP untuk keadian S{Y} didefinisikan dengan: P( S X ) argmax x X P( Y X ) P(X) P(X ) argmax x X P( Y X ) P(X) 2.5.3 Implementasi pada klasifikasi Teks Dengan menggunakan rumus-rumus tersebut maka akan ditentukan algoritma bayesian sebagai pemroses kata kunci, adapun rumus-rumus yang dipakai adalah sebagai berikut: Rumus Naïve Bayes Clasifier untuk klasifikasi Text, adalah: HMAP V V a i Komunitas kata (dimana diwakili (w) untuk perkata) v Kata sebagai target docs example ( ) arg max sebagian kata dari kata yang menadi target V Jumlah semua kata-kata yang menadi target V. 3. METODE PENELITIAN ( ) P( a V ) P v docs P v example V position i Client-Side Makalah (Dokument KeyWord (Kata Kunci pada Makalah) Web Server (APACHE) PHP (Hypertext Preprocecor) Algoritma Bayesian Proses (Server-Side) MySQL Data base Gambar 2. Skema Sistem Dari gambar diatas dapat diketahui bahwa user menginputkan makalah berupa dokumen dengan format teks, masukkan pada halaman web aplikasi sisi klien. Kemudian teks akan dikirim ke sisi server untuk diproses dengan Algoritma Bayesian yang terdapat pada bahasa pemrograman PHP, tidak lupa bekerasama dengan MySQL sebagai database server. Setelah ditemukan kata kunci, kemudian kata kunci tersebut akan dikirim ke sisi klien, untuk memberi awaban pada user pemberi inputan tadi. A-12

3.1 Flowchart sistem Start Deklarasi Variabel Input berupa teks (makalah) Eleminisa kata penghubung pada makalah Hitung kemunculan kata Seleksi < 1 kemunculan Cek kata maemuk lalu hitung Naïve Bayes Clasifier cek kata maemuk Ambil beberapa nilai tertinggi Pemisahan makalah menadi suku-suku kata Keyword makalah END Gambar 3. Flowchart Program Adapun penelasan flowchart adalah sebagai berikut: Di masukkan input berupa teks kedalam variable input, kemudian teks dalam umlah besar pada makalah itu dipisahkan dengan kategori Kata Penghubung dan Kata Pokok. Jika termasuk salah satu pada salah satu kategori maka akan dimasukkan pada tabel, dimana kata hubung dimasukkan ke tabel kata hubung dan kata pokok dimasukkan ke tabel kata pokok. Tabel kata pokok bersifat sementara hanya untuk menampung kata pokok sebelum diproses menggunakan Algoritma Bayesian. Kemudian kata-kata tersebut dengan metode Naïve Bayes Classifier dipisahkan dengan cara diberi nilai antara True dan false. Jika hasil menunukkan false data tidak ditampilkan, tapi ika data bernilai true akan ditampilkan, dan kata-kata yang ditampilkan adalah hasil dari proses berupa keyword pada makalah 3.2 Skema Database Sistem Database Latihan Kata_Penghubung *No *Isi_kata_Penghubung Gambar 4 Skema Database Sistem Database sistem hanya digunakan untuk meletakkan data kata penghubung, dimana data tersebut digunakan untuk mengeliminasi kata-kata yang tidak perlu sebelum diproses, sebelum algoritma bayesian bekera. 4.1 HASIL DAN PEMBAHASAN 4.2 Konversi Makalah meadi foermat Teks Untuk sementara konversi masih bersifat manual atau tradisional, yaitu dengan: 1) Buka makalah apapun dengan macam-macam format seperti Document, PDF dan lain-lain. 2) Blok semuanya copy atau copy teks ika ada. 3) Buka editor Note Pad, paste dan simpan makalah tersebut. 4) Makalah yang telah disimpan siap untuk diproses. A-13

4.3 Buka halaman Web Buka halaman web tempat aplikasi berada dengan menggunakan Browser pada PC anda, tentunya harus berhubungan dengan server tempat aplikasi berada. Maka akan muncul Form tempat untuk memasukkan input berupa teks makalah. Masukkan makalah dengan menekan tombol Browse, kemudian cari Input makalah dimana anda meletakkannya. Gambar 5 Tampilan Inputan Pada Browser 4.4 Tampilan Hasil sesudah proses Kemudian klik tombol proses untuk memproses input dengan algoritma Bayesian Gambar 6. tampilan Hasil proses beserta Kata Kunci 5. KESIMPULAN Berdasarkan dari hasil analisa dan pengkaian ini, maka penulis mengambil kesimpulan sebagai berikut: 1. User Menginputkan makalah harus dalam format teks, ika terdapat format lain maka data tersebut tidak akan diproses. 2. Input makalah sebelum diproses dieleminasi kata penghubung beserta karakter selain teks seperti angka, petik dan lain-lain. 3. Sesudah itu akan masuk pada algoritma bayesian untuk memproses makalah kemudian menghasilkan kata kunci makalah tersebut. 6. DAFTAR PUSTAKA [1] Basuki, Achmad, Machine Learning, PENS-ITS, Surabaya, [2] Kadir, Abdul, Dasar PemrogramanWeb Dinamis Menggunakan PHP, Penerbit ANDI, Yogyakarta, [3] M, Farid, Belaar Sendiri Pemrograman PHP4, Elex Media Komputindo, Jakarta, 2001. [4] Mccallum, Andrew and Nigam, Kamal, A Comparison of Event Models for Naïve Bayes Text Classification,http://www.cs.cmu.edu [5] Nur Iman, Budi,dkk, Statistika dan Probabilitas, PENS-ITS, Surabaya, 2001. [6] Shen, Yirong and Jiang, Jing, Improving the performance of Naïve Bayes for Text Classification, CS224N Spring,2003. [7] Wasista,Sigit, Pemrograman Web, PENS-ITS, Surabaya, Juni 2002. A-14