2 BAB II LANDASAN TEORI

2 BAB II LANDASAN TEORI 2.1 Information Retrieval Sistem information retrieval (IR) adalah sistem yang digunakan untuk menemukan kembali (retrieve) informasi-informasi yang relevan terhadap kebutuhan pengguna dari suatu kumpulan informasi secara otomatis [Bunyamin, 2005]. Sistem IR berhubungan dengan pencarian informasi yang isinya tidak memiliki struktur. Demikian pula ekspresi kebutuhan pengguna yang disebut query, juga tidak memiliki struktur. Hal inilah yang membedakan sistem IR dengan sistem basis data. Dokumen adalah contoh informasi yang tidak terstruktur. Isi dari suatu dokumen sangat tergantung pada pembuat dokumen tersebut. Sebagai suatu sistem, sistem IR memiliki beberapa bagian yang membangun sistem secara keseluruhan. Gambaran bagian-bagian yang terdapat pada suatu sistem IR digambarkan pada Gambar 2.1 Gambar 2.1 Bagian bagian information retrieval (IR) II-1

II-2 Dari Gambar 2.1, terlihat bahwa terdapat dua proses operasi dalam sistem IR. Proses pertama dimulai dari koleksi dokumen dan proses kedua dimulai dari query pengguna. Proses pertama yaitu pemrosesan terhadap koleksi dokumen menjadi basis data indeks dan proses ini tidak ada ketergantungan dengan proses kedua. Sedangkan proses kedua tergantung dari keberadaan basis data indeks yang dihasilkan pada proses pertama. Bagian-bagian dari sistem IR menurut gambar 1 meliputi : 1. Text Operations (operasi terhadap teks) yang meliputi pemilihan kata-kata dalam query maupun dokumen (term selection) dalam pentransformasian dokumen atau query menjadi term index (indeks dari kata-kata). 2. Query formulation (formulasi terhadap query) yaitu memberi bobot pada indeks kata-kata query. 3. Ranking (perangkingan), mencari dokumen-dokumen yang relevan terhadap query dan mengurutkan dokumen tersebut berdasarkan kesesuaiannya dengan query. 4. Indexing (pengindeksan), membangun basis data indeks dari koleksi dokumen. Dilakukan terlebih dahulu sebelum pencarian dokumen dilakukan. Sistem IR menerima query dari pengguna, kemudian melakukan perangkingan terhadap dokumen pada koleksi berdasarkan kesesuaiannya dengan query. Hasil perangkingan yang diberikan kepada pengguna merupakan dokumen yang menurut sistem relevan dengan query. Namun relevansi dokumen terhadap suatu query merupakan penilaian pengguna yang subjektif dan dipengaruhi banyak faktor seperti topik, sumber informasi maupun tujuan pengguna. 2.2 Pengindeksan Mencari sebuah informasi yang relevan sangat tidak mungkin dapat dilakukan oleh sebuah komputer, meskipun dilakukan oleh sebuah komputer yang memiliki spesifikasi yang canggih. Agar komputer dapat mengetahui sebuah dokumen itu

II-3 relevan terhadap sebuah informasi, komputer memerlukan sebuah model yang mendeskripsikan bahwa dokumen tersebut relevan atau tidak. Salah satu caranya adalah dengan menggunakan indeks istilah. Indeks adalah bahasa yang digunakan di dalam sebuah buku konvensional untuk mencari informasi berdasarkan kata atau istilah yang mengacu ke dalam suatu halaman. Dengan menggunakan indeks si pencari informasi dapat dengan mudah menemukan informasi yang diinginkannya. Pada information retrieval, indeks ini nantinya yang digunakan untuk merepresentasikan informasi di dalam sebuah dokumen. Elemen dari indeks adalah istilah indeks (index term) yang didapatkan dari teks yang dipecah di dalam sebuah dokumen. Elemen lainnya adalah bobot istilah (term weighting) sebagai penentuan rangking dari kriteria relevan sebuah dokumen yang memiliki istilah yang sama. Proses pembuatan indeks dari sebuah dokumen teks atau dikenal dengan proses analisis teks (automatic teks analysis) melalui beberapa tahap : a. Proses penentuan digit, tanda hubung, tanda baca dan penyeragaman dari huruf yang digunakan. b. Penyaringan kata meliputi penghilangan kata yang memiliki arti nilai paling rendah (Stopwords) untuk proses penemu-kembalian. c. Penghilangan imbuhan kata, baik awalan maupun akhiran kata. Penghilangan imbuhan kata ini dikenal dengan stemming. d. Pemilihan istilah untuk menentukan kata atau stem (atau kelompok kata) yang akan digunakan sebagai elemen indeks. Untuk lebih jelasnya mengenai proses pengindeksan dari sebuah dokumen yang memiliki sekumpulan teks menjadi istilah dapat dilihat pada Gambar 2.2

II-4 Gambar 2.2 Tahapan Dalam Pemrosesan Text 2.3 Parsing Parsing adalah proses pengenalan token (tokenizing) didalam rangkain teks (Grossman, 2002). Di dalam pembuatan sebuah indeks istilah, dokumen dipecahpecah menjadi unit-unit yang lebih kecil misalnya berupa kata, frasa atau kalimat. Unit tersebut biasanya disebut sebagai token atau seringkali disebut sebagai Term. Sedangkan algoritma untuk memecahkan kumpulan kalimat atau frasa menjadi token disebut tokenizer. Pemrosesan parsing sangat dipengaruhi oleh pengetahuan bahasa yang digunakan di dalam sebuah dokumen untuk menangani karakter-karakter khusus, serta untuk memberikan batasan-batasan token di dalam sebuah dokumen.

II-5 2.4 Stopword Stopword Removal merupakan tahap penyaringan untuk mengambil kata-kata penting dan membuang kata-kata yang tidak penting, dimana kata-kata yang tidak penting tersebut telah tersimpan dalam suatu database Stopword seperti yang, hingga, dan, dengan, dll. Penghilangan kata-kata ini dilakukan agar pencarian informasi lebih terarah karena kata-kata tersebut tidak signifikan di dalam menentukan informasi suatu dokumen. 2.5 Inverted Index Inverted index adalah salah satu mekanisme untuk pengindeksan sebuah koleksi teks yang digunakan untuk mempercepat proses pencarian. Struktur dari inverted index terdiri dari dua elemen yaitu kosakata dan posisinya di dalam sebuah dokumen. Posisi dari sebuah istilah di dalam indeks pada sebuah buku, diterjemahkan dalam bentuk nomor halaman. Pada inverted index, setiap istilah di masukan ke dalam inverted list yang menyimpan daftar dari istilah yang menujuk ke sejumlah dokumen yang memiliki istilah tersebut. Inverted list juga kadang-kadang di sebut posting list. Misalkan istilah T1 terdapat dalam dokumen D1, D2, dan D3 sedangkan istilah T2 terdapat dalam dokumen D1 dan D2 maka inverted index yang dihasilkan seperti berikut: T1 D1, D2, D3 T2 D1, D2 Menurut Grossman (2002), Inverted Index adalah struktur yang dioptimasi untuk proses penemukembalian sedangkan proses update hanya menjadi pertimbangan sekunder. Struktur tersebut membalik teks sehingga indeks memetakan istilah-istilah ke dokumen-dokumen (sebagaimana indeks sebuah buku yang memetakan istilahistilah ke nomor halaman).

II-6 2.6 Algoritma Algoritma adalah urutan langkah-langkah logis penyelesaian masalah yang disusun secara sistematis dan logis. Kata logis merupakan kata kunci dalam algoritma. Langkah-langkah dalam algoritma harus logis dan harus dapat ditentukan bernilai salah atau benar. (Tanjung, 2013). 2.7 Algoritma tf-idf Pada model pengindeksan yang berdasarkan pada frekuensi istilah dapat diperkirakan bahwa istilah-istilah indeks terbaik adalah istilah-istilah yang sering muncul dalam dokumen individual tetapi jarang muncul dalam keseluruhan koleksi. Sebuah penanda kepentingan jenis ini yang umum adalah perkalian (tf idf), yaitu untuk mengetahui bobot (W) istilah pada dokumen. Tf disini didefinisikan sebagai frekuensi istilah dan idf sebagai fungsi inverse document frequency. Baeza-Yates dan Ribeiro-Neto (1999), menyebutkan bahwa pembobotan (tf idf) terdiri dari dua faktor, yaitu: 1. Tf (term frequency) Term frequency (Tf) merupakan metode yang paling sederhana dalam pembobotan setiap term. Setiap term diasumsikan memiliki kepentingan yang sebanding terhadap jumlah kemunculan term tersebut pada dokumen. Bobot Tf dari term i pada dokumen j yaitu : Tf(i,j) = f(i,j) Dimana f(i,j) adalah frekuensi kemunculan term i pada dokumen j. 2. Idf (inverse document frequency) Idf adalah frekuensi kemunculan suatu istilah atau term di dalam seluruh dokumen. Pembobotan ini menganggap term yang jarang muncul pada kumpulan dokumen sangat bernilai. Kepentingan tiap term diasumsikan memiliki perbandingan yang berkebalikan dengan jumlah dokumen yang mengandung term. Faktor Idf dari term i dalam N buah dokumen yaitu :

II-7 Idf (i) = Log + N df (i) Dimana df(i) adalah jumlah dokumen yang mengandung term i. Dari dua faktor tersebut maka pembobotan Tf Idf dapat dinyatakan dengan: W i.j = Tf. Idf i.j = Tf i.j x Log + N df i Dimana : W : Bobot dokumen Tf : Term frequency atau banyaknya kata/ term yang dicari pada dokumen Idf : inverse document frequency atau frekuensi kemunculan suatu istilah atau term di dalam seluruh dokumen N : Total dokumen df : banyak dokumen yang mengandung kata/ term yang dicari j i : dokumen ke-j : kata/term ke-i Term yang sering muncul pada dokumen tertentu, tapi jarang muncul pada kumpulan dokumen, memberikan nilai bobot yang tinggi. Tf.idf akan meningkat dengan jumlah kemunculan term pada dokumen tertentu, tapi akan berkurang dengan jumlah term yang muncul pada banyak dokumen. 2.8 Vector Space Model Salah satu model matematika yang digunakan pada sistem information retrieval untuk menentukan bahwa sebuah dokumen itu relevan terhadap sebuah informasi adalah Vector Space Model (VSM). Model ini akan menghitung derajat kesamaan antara setiap dokumen yang disimpan di dalam sistem dengan query yang diberikan oleh pengguna. Model ini pertama kali diperkenalkan oleh Salton (1989). Salah satu

II-8 ukuran kemiripan teks yang popular digunakan pada Vector Space Model untuk pencarian dokumen ini yaitu cosine similarity. Nilai cosine similarity didefinisikan sebagai berikut : n i=1(w ij. W iq ) sim(q, D (j) ) = n 2 W ij. t 2 i=1 W iq i=1 Dimana : Sim(Q,D(j)) W j i : Similarity query dengan Dokumen : Bobot dokumen : dokumen ke-j : kata/term ke-i Beberapa karakteristik untuk metode vector space model dalam Information Retrieval ini yaitu sebagai berikut : 1. Model vektor berdasarkan index term 2. Model vektor mendukung penentuan peringkat dokumen 3. Prinsip dasar vektor model adalah sebagai berikut : a. Dokumen direpresentasikan dengan menggunakan vektor index term b. Ruang dimensi ditentukan oleh index term c. Query direpresentasikan dengan menggunakan vektor index term d. Kesamaan document-query dihitung berdasarkan hasil kali titik (cross product) antara vektor vektor tersebut 4. Model vektor memerlukan : a. Bobot index term untuk vektor dokumen b. Bobot index term untuk query c. Perhitungan cross product untuk vektor document-query 5. Kinerja a. Efisien b. Mudah dalam representasi

II-9 c. Dapat diimplementasikan pada document-matching 2.9 Recall & Precision Evaluasi dari sistem temu-kembali informasi dipengaruhi oleh dua parameter utama yaitu recall dan precision. Recall adalah rasio antara dokumen relevan yang berhasil ditemukembalikan dari seluruh dokumen relevan yang ada di dalam sistem, sedangkan precision adalah rasio dokumen relevan yang berhasil ditemukembalikan dari seluruh dokumen yang berhasil ditemu-kembalikan (Grossman, 2002). Gambar 2.3 Recall & Precision pada contoh information retrieval Berdasarkan Gambar 2.3 recall dan precision dapat dinyatakan sebagai berikut: Dimana : Ra R A Re call = Ra R : Dokumen relevan yang dicari : Dokumen relevan yang ada : Jumlah dokumen pencarian Precision = Ra A

II-10 Dengan menggunakan nilai dari parameter recall dan precision akan dicari nilai dari average precision untuk menghitung keefektifan dan keakuratan dari algoritma sistem information retrieval. Average precision adalah suatu ukuran evaluasi sistem temu-kembali informasi yang diperoleh dengan cara menghitung rata-rata precision pada seluruh tingkat recall (Grossman, 2002). Sedangkan untuk menentukan nilai dari recall dan precision harus didapatkan jumlah dokumen yang relevan terhadap suatu topik informasi. Satu- satunya cara untuk mendapatkannya yaitu dengan membaca dokumen itu satu per satu. Menurut Rijsbergen (1979) relevansi merupakan sesuatu yang sifatnya subyektif. Setiap orang mempunyai perbedaan untuk mengartikan sesuatu dokumen tersebut relevan terhadap sebuah topik informasi. Menurut Mizzaro (1998), evaluasi pada sebuah sistem temu-kembali informasi dengan menggunakan recall dan precision sudah cukup baik untuk menjadi ukuran dari sistem tersebut. 2.10 Dokumentasi Dokumentasi adalah istilah bentukan dari kata dokumen. Dokumen bisa disebut sebagai kumpulan data yang konkrit dan didapatkan berdasarkan proses sistem pengelolaan tertentu. Kemudian dokumentasi adalah sebuah proses pengumpulan data yang sistematis hingga data tersebut dikelola dan menghasilkan dokumen. Dokumentasi memiliki berbagai macam kegiatan yang bisa dilakukan. Kegiatan kegiatan yang dimaksud meliputi mencari dan mencatat data sebanyak - banyaknya, mengumpulkan bahan bahan atau dokumen menjadi satu kesatuan, mencatat dokumen agar tidak lupa dan tercecer, mengolah dokumen, memproduksi dokumen, menyajikan dan menyebarluaskan dokumen hasil dari proses produksi kepada pihak pihak tertentu, serta menyimpan dan memelihara seluruh dokumen agar terpelihara dengan baik jika sewaktu waktu dokumen tersebut dibutuhkan kembali.

II-11 2.11 Dokumentasi Project Dokumentasi project adalah proses merekam garis besar dilaksanakannya suatu project dengan output berupa sebuah dokumen. Dokumentasi project yang dibuat setidaknya dapat memenuhi beberapa tujuan berikut : 1. Sebagai media komunikasi di internal tim, dengan client, dengan manajemen, dan pihak lain yang berkepentingan (stakeholder) 2. Sebagai catatan historis jalannya project 3. Sebagai alat bantu untuk melihat kondisi terkini project (project visibility) 4. Sebagai kontrak legal dan report antara pengembang dan client. 5. Sebagai media informasi bagi manajemen yang dapat membantu dalam proses perencanaan, pengembangan dan penyelesaian project Selama proses pengembangan project, ada banyak jenis dokumen yang dapat dihasilkan, mulai dari rencana project, spesifikasi desain, rencana pengetesan, dan lain-lain. Beberapa dokumen yang diproduksi dalam project dapat dikategorikan dalam 2 kelas yang berbeda : 1. Dokumentasi proses Dokumen-dokumen ini merekam proses pengembangan dan maintenance. Rencana - rencana, jadwal - jadwal, dokumen kualitas proses, standar organisasi dan standar proses merupakan dokumentasi proses. Contoh : proposal penawaran project, laporan pekerjaan, dokumen test plan, test report, berita acara uat dan MOM. Karakteristik utama dari dokumentasi proses adalah sebagian informasi akan menjadi kadaluarsa. 2. Dokumentasi produk : dokumentasi ini menggambarkan produk yang sedang dikembangkan yaitu terdiri dari : a. Dokumentasi sistem menjelaskan produk dari sudut pandang teknis dalam mengembangkan dan memelihara sistem. Contoh : SRS (Dokumen requirement berisi catatan kebutuhan sistem), AND (Dokumen analysis design). b. Dokumentasi User menyediakan penjelasan produk yang

II-12 berorientasi pada User. Contoh : SOP (Dokumen panduan penggunaan sistem) 2.12 Unified Modeling Language (UML) UML merupakan metode pengembangan perangkat lunak (atau sistem informasi) dengan metode grafis yang relatif mudah dipahami. Dalam kerangka spesifikasi, UML menyediakan model-model yang tepat, tidak ambigu, serta lengkap. Secara khusus, UML menspesifikasi langkah-langkah penting dalam pengambilan keputusan analisis, perancangan, serta implementasi dalam sistem yang sangat bernuansa perangkat lunak (software intensive system). Dalam hal ini, UML bukanlah bahasa pemrograman tetapi model-model yang tercipta berhubungan langsung dengan berbagai macam bahasa pemrograman, sehingga dapat melakukan pemetaan (mapping) dari model-model yang dibuat dengan UML ke bahasa-bahasa pemrograman berorientasi objek. Metode UML menggunakan tiga bangunan dasar untuk mendeskripsikan perangkat lunak yang akan dikembangkan, yaitu sebagai berikut. a. Sesuatu (things). b. Relasi (relationship). c. Diagram. Setiap bangunan dasar dapat diterapkan sepanjang tahap pengembangan sistem. Ketiga jenis bangunan dapat digunakan secara saling melengkapi satu sama lain. (Nugroho, 2005). 2.13 Usecase Diagram Use case adalah deskripsi fungsi sebuah sistem dari perspektif pengguna. Use case bekerja dengan cara mendeskripsikan tipikal interaksi antara pengguna sebuah

II-13 sistem dengan sistemnya sendiri melalui sebuah cerita bagaimana sebuah sistem dipakai. (Munawar, 2005). Gambar 2.4 Use Case Diagram 2.14 Class Diagram Class adalah sebuah spesifikasi yang jika diinstansiasi akan menghasilkan sebuah objek dan merupakan inti dari pengembangan dan desain berorientasi objek. Class menggambarkan keadaan (atribut/properti) suatu sistem, sekaligus menawarkan layanan untuk memanipulasi keadaan tersebut (metoda/fungsi). Class diagram menggambarkan struktur dan deskripsi class, package dan beserta hubungan satu sama lain seperti containment, pewarisan, asosiasi, dan lain-lain. Class memiliki tiga area pokok, yaitu nama, atribut dan metoda yang di gambarkan sebagai berikut : Gambar 2.5 Komponen pokok Class Diagram Atribut dan metoda dapat memiliki salah satu sifat berikut : a. Private, tidak dapat dipanggil dari luar class yang bersangkutan.

II-14 b. Protected, hanya dapat dipanggil oleh class yang bersangkutan dan anak-anak yang mewarisinya. c. Public, dapat dipanggil oleh siapa saja. Hubungan yang digunakan dalam pengambaran antar class dapat dilihat pada tabel berikut : Tabel 2.1 Relasi class Simbol Keterangan Asosiasi / Assosiation Hubungan statis antar class. Umumnya menggambarkan class yang memiliki atribut berupa class lain, atau class yang harus mengetahui eksistensi class lain. Panah navigability menunjukkan arah query antar class Asosiasi berarah/ directed Asosiasi dengan makna kelas yang satu assosiation digunakan oleh kelas yang lain. Generalisasi/ Generalization Dependency/ kebergantungan Agregasi Komposisi/ composition Relasi antar kelas dengan makna generalisasispesialisasi (umum-khusus) atau untuk menyatakan hubungan inheritance Relasi antar kelas dengan makna kebergantungan antar kelas Hubungan yang menyatakan suatu kelas menjadi atribut bagi kelas lain Bentuk khusus dari agregasi dimana kelas yang menjadi bagian diciptakan setelah kelas mejadi whole dibuat. Misal kelas whole dihapus, maka kelas yang menjadi part ikut terhapus.

II-15 2.15 Sequence Diagram Sequence diagram adalah suatu diagram yang menggambarkan interaksi antar obyek dan mengindikasikan komunikasi diantara obyek-obyek tersebut. Diagram ini juga menunjukkan serangkaian pesan yang dipertukarkan oleh obyek-obyek yang melakukan suatu tugas atau aksi tertentu. Obyek-obyek tersebut kemudian diurutkan dari kiri ke kanan, aktor yang menginisiasi interaksi biasanya ditaruh di paling kiri dari diagram. Pada diagram ini, dimensi vertikal merepresentasikan waktu. Bagian paling atas dari diagram menjadi titik awal dan waktu berjalan ke bawah sampai dengan bagian dasar dari diagram. Garis vertikal disebut lifeline, dilekatkan pada setiap obyek atau aktor. Selanjutnya, lifeline tersebut digambarkan menjadi kotak ketika obyek melakukan suatu operasi, kotak tersebut disebut activation box. Obyek dikatakan mempunyai live activation pada saat tersebut. Pesan yang dipertukarkan antar obyek digambarkan sebagai sebuah anak panah antara activation box pengirim dan penerima. Kemudian diatasnya diberikan label pesan. Elemen-elemen sequence diagram diantaranya dapat dilihat pada tabel berikut : Tabel 2.2 Komponen Sequence Diagram Nama Keterangan Object - adalah komponen berbentuk kotak yang mewakili sebuah class atau object. Mereka mendemonstrasikan bagaimana sebuah object berperilaku pada sebuah system. Activation boxes - adalah komponen yang berbentuk persegi panjang yang menggambarkan waktu yang diperlukan sebuah object untuk menyelesaikan tugas. Lebih lama waktu yang diperlukan, maka activation boxes akan lebih panjang. Actors - adalah komponen yang berbentuk stick figure. Komponen yang mewakili seorang pengguna yang berinteraksi dengan system.

II-16 Lifeline - adalah komponen yang berbentuk garis putus - putus. Lifeline biasanya memuat kotak yang berisi nama dari sebuah object. Berfungsi menggambarkan aktifitas dari object. Menggambarkan pesan/hubungan antar obyek yang menunjukkan urutan kejadian yang terjadi Pada sequence diagram terdapat combined fragment yang merupakan bagian dari interaksi yang menyatakan suatu kondisi tertentu. Macam macam combined fragment yaitu sebagai berikut : Tabel 2.3 Combined Fragment Sequence Diagram Nama Alternative : Keterangan Memodelkan skenario alternatif dari proses flow yang ada. Hanya satu pilihan yang akan di eksekusi. Option Menggambarkan langkah optional dari proses flow yang ada Loop Memodelkan pengulangan Week Sequencing : Menggambarkan suatu interaksi pada operasi yang lemah. Merepresentasikan urutan operasi lemah diantara operasi lainnya Break Memodelkan skenario pengecualian pada flow proses yang ada.

II-17 Parallel Menggambarkan pelaksanaan eksekusi suatu proses secara bersamaan / paralel Strict Menegaskan suatu interaksi pada operasi yang sangat sensitif (ketat) 2.16 Hypertext Prepocessor (PHP) PHP atau HyperText Preprocessor adalah salah satu bahasa pemrograman yang berjalan dalam sebuah web server dan berfungsi sebagai pengolah data pada sebuah server. Dengan menggunakan program PHP, sebuah website akan lebih interaktif dan dinamis. Data yang dikirim oleh pengunjung website/komputer client akan diolah dan disimpan pada basis data web server dan dapat ditampilkan kembali apabila diakses. Untuk menjalankan kode-kode program PHP ini, file harus di-upload ke dalam server. Upload adalah proses mentransfer data atau file dari komputer client ke dalam web server. Download adalah proses mentransfer atau memindah data dari web server ke komputer client. Beberapa keunggulan yang dimiliki program PHP adalah sebagai berikut. a. PHP memiliki tingkat akses yang lebih cepat. b. PHP memiliki tingkat lifecycle yang cepat sehingga selalu mengikuti perkembangan teknologi internet. c. PHP memiliki tingkat keamanan yang tinggi. d. PHP mampu berjalan di beberapa server yang ada. e. PHP mampu berjalan di Linux, FreeBSD, Unix, Solaris, Windows, dan yang lain.

II-18 f. PHP mendukung akses ke beberapa basis data yang sudah ada, baik yang bersifat gratis ataupun komersial. g. PHP bersifat gratis. (MADCOMS, 2004). 2.17 CodeIgniter CodeIgniter (selanjutnya disebut CI) adalah sebuah framework yang digunakan untuk membuat sebuah aplikasi berbasis web yang disusun dengan menggunkan bahasa PHP. Di dalam CI terdapat beberapa macam kelas yang berbentuk library dan helper yang berfungsi untuk membantu pemogram dalam mengembangkan aplikasinya. (Riyanto, 2011). 2.18 Database MYSQL Database adalah kumpulan dari item data yang saling berhubungan satu dengan yang lainnya yang diorganisasikan berdasarkan sebuah skema tertentu, tersimpan pada perangkat keras komputer dan perangkat lunak untuk melakukan manipulasi data untuk penggunaan tertentu. (Fathansyah, 2002). MySQL adalah salah satu aplikasi database server yang sering digunakan dalam pembuatan web. Keunggulan lainnya MySQL adalah produk open source yang terus dikembangkan oleh MySQL AB. Namun ada juga produk yang enterprise. Dengan MySQL, pengguna dapat membuat tabel, dimana data dapat disimpan lebih efisien dibandingkan menyimpan data dalam array. Keunggulan MySQL adalah sebagai berikut. a. MySQL merupakan program yang multi-threaded, sehingga dapat dipasang pada server yang memiliki multi-cpu. b. Didukung program-program umum seperti C, C++, Java, Perl, PHP, Python. Bekerja pada berbagai platform (tersedia berbagai versi untuk berbagai OS).

II-19 c. Memiliki jenis kolom yang banyak sehingga memudahkan konfigurasi sistem database. d. Mendukung ODBC untuk sistem operasi Microsoft Windows. (Mulyana 2004). 2.19 Black box Testing Pengujian black box juga dikenal sebagai Behavioral Testing merupakan sebuah metode pengujian software dimana internal struktur, desain, dan implementasi dari suatu bagian yang sedang diuji tidak diketahui oleh pengujinya. Metode pengujian software ini dinamakan black box dikarenakan software program yang sedang diuji dimata penguji atau testernya adalah seperti kotak hitam; apa apa didalamnya tidak diketahui. Metode pengujian ini diseleggarakan untuk mencari error-error didalam kategori berikut ini : 1. Tidak benar atau hilangnya fungsionalitas 2. Error desain antar muka 3. Error di dalam struktur data atau akses external database 4. Error di performanya 5. Error pada inisialisasi dan terminasi Identifikasi proses Blackbox Testing diantaranya yaitu sebagai berikut : 1. Menganalisis kebutuhan dan spesifikasi dari perangkat lunak 2. Pemilihan jenis input yang memungkinkan menghasilkan output benar serta jenis input yang memungkinkan output salah pada perangkat lunak yang sedang diuji. 3. Menentukan output untuk suatu jenis input. 4. Pengujian dilakukan dengan input-input yang telah benar-benar diseleksi. 5. Melakukan pengujian. 6. Pembandingan output yang dihasilkan dengan output yang diharapkan. 7. Menentukan fungsionalitas yang seharusnya ada pada perangkat lunak yang sedang diuji.

II-20 Berikut ini merupakan beberapa tenik yang bisa digunakan untuk merancang pengujian black box ini: 1. Equivalence partitioning Teknik ini merupakan teknik pengujian software yang melibatkan pembagian nilai input kedalam bagian nilai valid dan tidak valid dan memilih nilai perwakilan dari masing-masing sebagai data test. 2. Boundary vallue analisys Teknik ini merupakan teknik pengujian software yang melibatkan penentuanpenentuan nilai input dan memilih beberapa nilai dari batasan-batasan tersebut baik luar maupun dalam dari batasan-batasan tersebut sebagai data test. 3. Cause Effect Graphic Teknik ini merupakan teknik pengujian software yang melibatkan pengidentifikasian sebab-sebab (kondisi input) dan akibat-akibat (kondisi output), menghasilkan grafik sebab-akibat dan kasus-kasus test.