BAB I PENDAHULUAN 1.1 Latar Belakang Teknik scraping adalah suatu teknik yang digunakan untuk mengambil, menganalisa dan memproses suatu data dari suatu sistem atau dokumen yang berbeda. Teknik scraping biasanya digunakan untuk menggambil data dari webite yang bisa disebut web scraping, tetapi teknik scraping juga bisa digunakan dalam pengambilan data dalam subuah dokumen word, PDF atau excel. Selain mengambil data scraping juga akan menganalisa dan memproses data yang diambil sesuai dengan kebutuhan. PDF (Portable Document Format) adalah sebuah format berkas yang dibuat oleh Adobe Systems pada tahun 1993 untuk keperluan pertukaran dokumen digital. Karna kepopuleran dan keamanan file berformat PDF maka beberapa perusahan mewajibkan menyimpan dokumen kedalam format PDF. Diantaranya Agoda dan Traveloka sebagai website penyedia kamar hotel secara online atau online travel agent yang menggunakan file berformat PDF untuk bukti pemesana kamar hotel diantaranya: Agoda dan Traveloka. Untuk mengekstraksi data reservasi dari file PDF online travel agent agoda dan traveloka di butuhkan library PHP PDF parser, PDF parser adalah library PHP yang digunakan untuk mengekstraksi data dari file PDF berlisensi open sorurce yang dikembangkan oleh tim smalot dan didukung oleh Actualys. File PDF dari agoda dan traveoka yang berisi data pemesan kamar hotel tersebut akan dikirimkan ke hotel penyedia kamar. Di karnakan pemesanan kamar dari website pencari kamar (Agoda dan Traveloka) merupakan sistem terpisah dari sistem hotel, mengakibatkan ketika seseorang memesan kamar dari website pemesanan kamar maka data-data pemesanan kamar yang ada tidak akan masuk ke database hotel tempat menginap. sehingga file PDF yang berisi data-data pemesanan kamar dari website pemesanan kamar hotel akan di kirimkan kembali ke hotel yang dituju dan akan di input ulang ke dalam sistem hotel tersebut. Berdasarkan uraian di atas untuk mempermudah proses memasaukan data pemesanan kamar dari situs pemesanan kamar hotel penulis akan mencoba 1
membuat Implementasi Scraping Data reservasi Pada File PDF Menggunakan Library PHP PDF Parser 1.2 Perumusan Masalah Berdasarkan uraian yang telah disampaikan sebelumnya, maka masalah yang akan berusaha dijawab dalam tugas akhir ini adalah bagaimana merancang dan membuat aplikasi Scraping Data Pada File PDF Menggunakan Library PHP PDF Parser. 1. Bagaimana mencari data yang diperlukan dalam file PDF? 2. Bagaimana menentukan algoritma pencarian yang tepat? 1.3 Tujuan Dan Manfaat Penelitian Tujuan dari tugas akhir ini adalah: 1. Membuat aplikasi untuk melakukan upload Dokumen. 2. Mengimplementasikan Library PDF parser kedalam aplikasi. Aplikasi yang dibuat diharapkan memberikan manfaat sebagai berikut : 1. Menghemat waktu dalam memasukan data reservasi. 2. Mengurangi pemakaian kertas untuk arsip dokumen reservasi. 3. Memudahkan dalam memindahkan data reservasi dari file PDF ke database reservasi. 4. Pengarsipan data reservasi file PDF. 1.4 Batasan Masalah Dalam penelitian ini, batasan masalah dalam membuat aplikasi scraping data pada file pdf dengan menggunakan algoritma pencarian adalah sebagai berikut: 1. Pada aplikasi ini hanya dapat membaca file dengan format PDF untuk memasukan data pemesanan kamar 2. Hanya proses upload data file pdf dan proses menampilkan hasil data scripting. 3. Untuk modul lain seperti security, user management, reporting, email alert tidak dimasukan ke dalam penulisan ini. 2
4. Aplikasi akan menyimpan hasil scraping data pada sebuah basis data. 5. Format PDF pemesanan yang di gunakan di dalam aplikasi ini hanya dari AGODA dan TRAVELOKA. 6. File PDF yang di gunakan adalah PDF yang tidak terkunci. 1.5 Metode Penelitian Metodologi penelitian merupakan suatu proses yang digunakan untuk memecahkan suatu masalah yang logis, dimana memerlukan data untuk mendukung terlaksananya suatu penelitian. Pada aplikasi ini menggunakan metode penelitian komparatif, yaitu sejenis penelitian deskriptif yang ingin mencari jawaban secara mendasar tentang sebab akibat, dengan menganalisa faktor-faktor penyebab terjadinya ataupun munculnya suatu kondisi tertentu. Jangkauan waktu adalah masa sekarang, Karena jika jangkauan waktu terjadinya adalah masa lampau, maka penelitian tersebut termasuk dalam metode sejarah. Pengumpulan data menggunakan studi literature, yaitu dengan mempelajari buku-buku atau bacaan yang relevan dengan masalah yang sedang diteliti, baik melalui perpustakaan maupun dari jurnal atau sumber lain seperti internet. Output dari studi literatur ini adalah terkoleksinya referensi yang relefan dengan perumusan masalah. Tujuannya adalah untuk memperkuat permasalahan serta sebagai dasar teori dalam melakukan studi dan juga menjadi dasar untuk melakukan desain aplikasi scraping data pada file PDF dengan menggunakan algoritma pencarian. 1.6 Metode Rekayasa Perangkat Lunak Agar hasil penelitian dapat benar-benar sesuai dengan kebutuhan pengguna, maka digunakan metode rekayasa perangkat lunak dengan metode Rapid Application Development (RAD). RAD atau rapid prototyping adalah model prosespembangunan perangkat lunak yang tergolong dalam teknik incremental (bertingkat). RAD menekankan pada siklus pembangunan pendek, singkat, dan cepat. Waktu yang singkatadalah batasan yang penting untuk model ini. 3
Tahapan-tahapan pada metode RAD (Rapid Application Development) sebagai berikut : 1. Rencana kebutuhan (Requirement Planning). 2. Proses desain (Design Workshop) 3. Implementasi (Implementation) Gambar 1.1 Tahapan-tahapan metode RAD 1.7 Sistematika Penulisan Untuk memudahkan dalam penulisan laporan tugas akhir, maka dibuat rsistematika penulisan laporan yang akan digunakan pada tugas akhir ini, yaitu sebagai berikut: BAB I PENDAHULUAN Pada bab ini dibahas mengenai latar belakang masalah yang mendorong penulis untuk melakukan penelitian, rumusan masalah, tujuan dan manfaat penelitian, batasan masalah, metodologi penelitian, dan sistematika penulisan. BAB II LANDASAN TEORI Pada bab ini dibahas tentang teori-teori yang manjadi acuan dan berkaitan dengan penelitian. BAB III BAB IV ANALISA KEBUTUHAN DAN PERANCANGAN Pada bab ini dibahas tentang analisa kebutuhan dan perancangan sistem sesuai dengan teori yang ada. IMPLEMENTASI DAN PENGUJIAN Pada bab ini dimuat implementasi serta pengujian terhadap sistem. 4
BAB V KESIMPULAN DAN SARAN Bab ini berisi kesimpulan dan saran yang diperoleh dari seluruh pembahasan pada bab-bab sebelumnya. 5