Implementasi Web Scrapping pada Website Eduesia.Com untuk Pengukur Kesenjangan Jumlah Mahasiswa Perguruan Tinggi di Indonesia

dokumen-dokumen yang mirip
BAB III LANDASAN TEORI. Landasan teori ini merupakan dasar tentang teori-teori dalam melakukan

BAB 1 PENDAHULUAN. Di era globalisasi ini, perkembangan teknologi informasi berperan penting dalam

BAB I PENDAHULUAN.

BAB III METODOLOGI PENELITIAN. berjalannya perancangan dan implementasi website, antara lain: perangkat keras yang digunakan.

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN 1.1 Latar Belakang

PERANCANGAN APLIKASI FARMASI HOSPITAL INFORMATION SYSTEM DI SILOAM HOSPITALS

PENGEMBANGAN APLIKASI UJIAN ONLINE SEBAGAI MEDIA PEMBELAJARAN SISWA SEKOLAH MENENGAH PERTAMA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Perancangan E-Learning pada SMK Negeri 1 Bandung

1 BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. Travel Agent merupakan usaha yang bergerak di bidang jasa yang memiliki tujuan

MOBILE APPLICATION DEVELOPMENT FOR E- COMMERCE VENDPAD USING IONIC FRAMEWORK

ABSTRAK. Kata Kunci : Aplikasi Web, Asuhan Keperawatan, Metode Waterfall, Sistem Informasi Manajemen

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

KELOMPOK 1. Metode Pengembangan Sistem Informasi. Imelda Florensia Stefani. P.

RANCANG BANGUN SISTEM PENDATAAN TALENT BERBASIS WEB PADA XYZ.COM DENGAN METODE WATERFALL TUGAS AKHIR

BAB I PENDAHULUAN. Salah satu media yang dapat digunakan untuk mempermudah manusia menginput data

SISTEM PEMASARAN LAPTOP BERBASIS E-COMMERCE PADA CV. WAHOO COMPUTER MEDAN

BAB I PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Kegiatan penjualan pada butik Be Collection merupakan kegiatan pokok

BAB 3 Analisa dan Perancangan Sistem

DAFTAR ISI SAMPUL DALAM...

Jurnal Ilmiah d ComPutarE Volume 2 Juni 2012

SISTEM INFORMASI PEMBEBASAN LAHAN BERBASIS WEB PADA DAERAH XYZ. Nelson Weldy ¹,Tri Sandhika Jaya.²,Moch. Yusman.³.

BAB II LANDASAN TEORI. untuk mencapai tujuan (McLeod, 2010). Sistem juga dapat didefinisikan sebagai

PENGEMBANGAN SISTEM ERP MODUL PROJECT MANAGEMENT PADA CLIENT PT. JIVA VENTURES (STUDI KASUS : PT. BEST PLANTATION INTERNATIONAL)

JPGMI, Vol. 2, No Hal [16-25] ISSN :

BAB II LANDASAN TEORI. beberapa ahli, definisi sistem adalah sebagai berikut.

1. PENDAHULUAN 1.1. Latar Belakang

ABSTRAK. vi Universitas Kristen Maranatha

Sistem Informasi Geografis Perumahan Di Kota Manado Berbasis Web

RANCANG BANGUN SISTEM INFORMASI PENJADWALAN MATA PELAJARAN DAN PENGOLAHAN DATA NILAI SISWA PADA SEKOLAH DASAR (SD) NEGERI 02 KOTA BARU.

BAB I PENDAHULUAN.

RANCANG BANGUN SISTEM INFORMASI TERPADU FMIPA UNIVERSITAS TADULAKO

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI

PERANCANGAN SISTEM INFORMASI PENGELOLAAN MATA PELAJARAN MENGGABUNGKAN AUDIO KE DALAM SAJIAN MULTIMEDIA DI SMK NEGERI 5 SIJUNJUNG

Rancang Bangun Sistem Informasi Pelelangan Ikan Berbasis Web Pada Tempat Pelelangan Ikan Kabupaten Situbondo Jawa Timur

PEMBUATAN APLIKASI PENJUALAN BARANG PADA JARINGAN OUTLET DISTRO BLAZE

BAB III LANDASAN TEORI. kinerja dan memotivasi kinerja individu di waktu berikutnya.

PENGEMBANGAN APLIKASI PENGOLAHAN NILAI SISWA BERBASIS WEB DI SEKOLAH DASAR NEGERI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

SISTEM INFORMASI PENGELOLAAN INVENTARIS BARANG DI SMKN 1 BATUSANGKAR. ABSTRACT

BAB 1 PENDAHULUAN. persiapannya lebih singkat. E-Learning menjawab semua tantangan tersebut.

BAB 1 PENDAHULUAN. Istilah ini dicetuskan pertama kali oleh O Reilly Media pada tahun 2003 dan

BAB 1 PENDAHULUAN. perusahaan yang serupa menggunakan sistem pelayanan bisinis secara online.

BAB I PENDAHULUAN. Seiring berjalannya waktu dan kebutuhan penyajian informasi yang lebih

1 BAB 1 Pendahuluan. 1.1 Latar Belakang

KELOMPOK 3. Imelda Florensia Stefani. P. Tangkuman Gladis Ansiga Ariyanto Pakaya Andre Lay

BAB I PENDAHULUAN. 1

BAB I PENDAHULUAN. 1.1 Latar Belakang

1. BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI. yang digunakan dalam menyelesaikan permasalahan. Menurut Jogianto (2005), sistem merupakan satu kesatuan komponen atau

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. web. Hal ini dikarenakan sistem informasi berbasis web lebih praktis dan. menawarkan berbagai kemudahan dari segi akses informasi.

BAB III ANALISIS DAN PERANCANGAN SISTEM

IMPLEMENTASI PUSAT INFORMASI PROGRAM STUDI TEKNIK INFORMATIKA BERBASIS WEB DAN MOBILE

BAB III LANDASAN TEORI. mengetik melalui keyboard, penggunaan pointer mouse, alat scanner (pembaca

BAB III PERANCANGAN PENELITIAN

BAB I PENDAHULUAN. dengan sangat pesat. Dimana saat ini teknologi telah menjamah di berbagai

WEBSITE PT. LUMENINDO GILANG CAHAYA MENGGUNAKAN METODE WATERFALL

BAB I PENDAHULUAN. 1.1 Latar Belakang

SISTEM PENDUKUNG KEPUTUSAN PENERIMAAN SISWA BARU DI SMA NEGERI 3 GORONTALO MENGGUNAKAN METODE AHP BERBASIS WEB. Abstrak

E-SENI GORDANG SAMBILAN

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI METODE BUDGETOPTIMIZED DALAM FITUR PENGAMBILAN KEPUTUSAN PADA PT.TOTAL PRINT TUGAS AKHIR FIRDAUS ANGGA DEWANGGA

BAB IV HASIL DAN PEMBAHASAN

BAB III LANDASAN TEORI. adalah mengajarkan anak untuk menjadi anak yang mampu memajukan

PENGEMBANGAN SISTEM INFORMASI MANAJEMEN PRAKTIK INDUSTRI DI JURUSAN PENDIDIKAN TEKNIK ELKTRONIKA UNY BERBASIS WEBSITE MENGGUNAKAN YII FRAMEWORK

Aplikasi Pendataan Kendaraan Hilang Berbasis Web (Studi Kasus : Polres Cimahi)

Sistem Informasi Pencatatan Data Warga Kelurahan Berbasis Mobile

Pembuatan Website. : Sistem Informasi. Nasional. : Danang Ibnu Anggoro NPM :

KELOMPOK 1. Metode Pengembangan Sistem Informasi. Imelda Florensia Stefani. P. 1

BAB I PENDAHULUAN 1.1 Latar Belakang

DAFTAR ISI. LAPORAN TUGAS AKHIR... ii

Implementasi Framework Twitter Bootstrap Dalam Perancangan Aplikasi Penerimaan Mahasiswa Baru Berbasis Web

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB II LANDASAN TEORI. Sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling

RANCANGAN APLIKASI LAPORAN PENYELENGGARAAN PEMERINTAHAN DAERAH KABUPATEN/KOTA PROVINSI SULAWESI SELATAN BERBASIS WEB

Ratna Wardani. Department of Electronic Engineering Yogyakarta State University

ABSTRAK. Universitas Kristen Maranatha

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II LANDASAN TEORI. 2.1 Sistem Perhitungan Penjualan PT Panca Patriot Prima

BAB 1 PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. pengembangan pendidikan di bumi nusantara ini adalah sekolah baik sekolah

BAB III METODE PENELITIAN

BAB III LANDASAN TEORI. mengumpulkan (input), memanipulasi (process), menyimpan, dan menghasilkan

BAB III LANDASAN TEORI. Menurut Lusyani Sunarya S.Sn (2010:45) Company Profile. sebuah aset lembaga atau perusahaan yang biasa digunakan sebagai tanda

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

APLIKASI MONITORING DAN PENILAIAN GURU (STUDI KASUS SMPK 4 PENABUR BANDUNG) JOURNAL WRITING FORMAT FOR FINAL PROJECT TELKOM UNIVERSITY

BAB 1 PENDAHULUAN 1.1 Latar Belakang

PEMETAAN SEKOLAH MENENGAH ATAS BERBASIS WEB SISTEM INFORMASI GEOGRAFIS

Analisis dan Perancangan Perangkat Lunak Media Sosial untuk Berbagi Informasi Diskon

TUGAS AKHIR DORIS SILALAHI

BAB I PENDAHULUAN I-1

6 BAB I PENDAHULUAN. 1.1 Latar Belakang

Menakar Resiko Pembangunan Prototipe User Experience Dengan Weighted Risk Check List

BAB I PENDAHULUAN. sebagian besar dalam format digital dan yang dapat diakses dengan komputer.

Transkripsi:

Implementasi Web Scrapping pada Website Eduesia.Com untuk Pengukur Kesenjangan Jumlah Mahasiswa Perguruan Tinggi di Indonesia Yuri Pramana, Wira Munggana Program Studi Sistem Informasi, Universitas Multimedia Nusantara, Tangerang, Indonesia yeo.yuri@gmail.com, wira@umn.ac.id Abstract Education is an important asset for the future of each individual, community, nation, and world. However, not everyone can have the same opportunity as the field of economic and geographic constraints that trigger gaps in the public assessment of the quality of one s intellectual. Based on data provided by UNESCO, Indonesia recorded no. 4 from other ASEAN countries, in the level of Gross Enrolment Ratio. The research process is intended to form a picture of educational inequality at the college level in every region in Indonesia. This study was made with Web scrapping s techniques and produce a website that presents a valid and accurate information and analysis of the ratio of Gross Enrolment Ratio to show the level of participation at the college level. Index Terms Data Collection, UMN, Web Crawling, Data Cleansing, Web Scrapping Diterima 14 Desember 2015 Disetujui 28 Desember 2015 dengan menggunakan data yang disediakan situs pemerintah yaitu BAN-PT, data.go.id, dan dikti. Dari penelitian ini akan menghasilkan sebuah website dan yang dapat menampilkan informasi kesenjangan tingkat edukasi pada perguruan tinggi yang ada di Indonesia yang diharapkan dapat membantu pemerintah dalam meratakan distribusi pendidikan. I. PENDAHULUAN Pendidikan merupakan aset penting bagi masa depan masing-masing individu, masyarakat, negara, dan dunia. Untuk sebuah negara pendidikan menjadi tolak ukur kecerdasan warganya. Sangat penting bagi warga negara untuk mendapatkan hak mengakses dan memiliki tingkat pendidikan yang sama. Berdasarkan perhitungan Gross Enrolment Ratio yang dilakukan oleh UNESCO, Indonesia berada di peringkat 4 dari negara ASEAN, seperti dapat dilihat pada Gambar 1. Penelitian ini dilakukan, untuk mengetahui tingkat partisipasi untuk memasuki perguruan tinggi pada daerah-daerah di Indonesia. Proses pengumpulan data menggunakan web scrapping, web crawling, dan data cleansing Gambar 1. Gross Enrolment Ratio ASEAN II. LANDASAN TEORI Data Collection merupakan proses dalam pengumpulan data dan variable, dengan cara sistematis yang berguna dalam menjawab kebutuhan dari perushaan dan organisasi. Dalam penggambilan data pada penelitian ini menggunakan teknik web scrapping, web crawling, dan data cleansing Web crawling digunakan untuk mendapatkan kode HTML dari website tersebut. Kode HTML merupakan hasil akhir dari proses web crawling yang akan dianalisa untuk mencari URL yang terdapat dapat website. Web scrapping merupakan proses yang 130 ULTIMA InfoSys, Vol. VI, No. 2 Desember 2015

melibatkan sebuah dokumen semi-structured dari internet, umumnya pada halaman web menggunakan markup language seperti HTML atau XHTML Data Cleansing ditujukan untuk pengidentifikasi data yang di dapat untuk memastikan bahwa data relevan dan tidak terdapat kesalahan pada data untuk menghindari adanya kesalahan pada proses analisa data. III. METODOLOGI PENELITIAN Pendidikan tak kalah penting dari kesehatan finansial. Seiring dengan perkembangan zaman, muncul permasalahan baru yang membuat dunia pendidikan semakin dibutuhkan dan penting untuk didapatkan, karena itulah pendidikan semakin diprioritaskan untuk masyarakat. Berdasarkan perhitungan Gross Enrolment Rastio yang dilakukan oleh UNESCO, Indonesia berada di peringkat 4 dari negara ASEAN. Meskipun pendidikan Indonesia belum dapat dijajarkan dengan pendidikan di Asia lainnya, namun pendidikan di Indonesia mengalami perubahan yang lebih baik dari sebelumnya. Perubahan pendidikan di Indonesia dapat dilihat adanya program kebijakan pemerintah wajib belajar 9 tahun, Ujian Akhir Nasional (UAN) yang diwajibkan untuk anak SMA. Atau SMK dan dengan adanya Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) dengan tujuan untuk membangun pendidikan di Indonesia A. Metode Penelitian Metode yang digunakan dalam penelitian ini untuk menyelesaikan akar permasalahan yang dihadapi pada penelitian ini adalah penggunaan rancangan aplikasi dengan model System Development Life Cycle (SDLC) Rapid Application Development (RAD). Gambar 2. Siklus Metode Rapid Application Development Gambar 2 menunjukkan empat fase dalam RAD yakni Requirements & Planning, User Design, construction dan Cutover. Berikut merupakan penjelasan dari masing-masing fase. B. Fase Requirements Planning Requirements Planing merupakan gabungan dari fase planning dan fase analysis dari metode SDLC. Fase ini bertujuan untuk mengumpulkan requirement yang akan digunakan untuk membuat website. Pengambilan data dilakukan dengan cara web scrapping, web crawling, dan data cleansing. Web Crawling adalah sistem yang digunakan untuk melakukan pengunduhan pada halaman website dalam jumlah besar. Web Scrapping merupakan proses pengekstrakan data pada halaman website yang berupa kumpuluan kode HTML, javascript, css, dll. Data Cleansing adalah proses pengidentifikasi data yang didapat untuk memastikan data relevan dan tidak terdapat kesalahan, untuk menghindari kesalahan pada proses analisa data. C. Fase User Design Fase User Design juga dikenal sebagai desain tahap fungsional, tahap ini model sistem data dan menggambarkan proses sistem yang terjadi pada website. Sistem pada website dirancang menggunakan DFD yang sesuai dengan proses dan aliran data dengan 2 tingkat yaitu diagram konteks dan diagram level 1. Gambar 3 mengilustrasikan rancangan DFD yang telah dibuat. ULTIMA InfoSys, Vol. VI, No. 2 Desember 2015 131

pengambilan URL pada BAN-PT untuk mengambil halaman pada website Proses 2.0 Web Scrapping. Digunakan untuk mengambil data yang di perlukan untuk di analisan dan masih menjadi data kotor. Keterangan : Gambar 3. Diagram Konteks Hasil pencarian kepada pengguna merupakan data produk secara lengkap. Tahap dalam diagram : Pengguna ingin melihat informasi terkait dengan data yang cari pada website Pengguna mencari data dengan fitur searching dengan memilih dan memasukan kata kunci. Pengguna ingin melihat data dalam suatu kumpulan sesuai dengan tempat yang mereka pilih Pengguna dapat melihat hasil pada web dari hasil yang pengguna cari. Proses 3.0 Data Cleansing. Proses ini kedua data dibersihkan untuk noise pada kedua data. Proses 4.0 Matching. Pada 4.0 kedua data disamakan entitasnya sehingga data mendapatkan data dari kedua sumber Proses 5.0 Search. Proses ini mengambil kata kunci yang diberikan kepada pengguna kemudian diteruskan ke Data Store. Kemudian Data Store memberikan data yang dinginkan dan ke pengguna D. Fase Construction Fase ini juga dikenal sebagai tahap pembangunan, tahap ini melengkapi pembangunan sistem aplikasi yang akan dibangun. Seperti halnya SDLC yang juga membangun aplikasi yang sudah dirancang. E. Fase Cutover Fase ini menyerupai tugas akhir dalam tahap implementasi SDLC, termasuk konversi data, pengujian. F. Ukuran kesuksesan website Untuk mengetahui apakah website sudah memenuhi kebutuhan dan berjalan dengan baik, keberhasilan website ini ditentukan dengan ukuran dengan tingkat yang dibuat seperti berikut : Keterangan: Gambar 4. Diagram Level-1 Website Data yang terdapat pada Data.go.id merupakan data bersih. Tahapan pada Diagram Level 1 : Proses 1.0 Web crawling. Merupakan proses Dapat mengolah data dari ban-pt.kemdiknas. go.id secara otomatis dengan penerapan web scrapping. Aplikasi mempunyai data yang valid dan akurasi yang baik dalam memberikan informasi kepada pengguna. Dapat menampilkan data pada tabel yang memberikan fungsi search memberikan output yang sesuai dengan pengguna. Menampilkan rasio 132 ULTIMA InfoSys, Vol. VI, No. 2 Desember 2015

IV. ANALISIS DAN PEMBAHASAN A. Fase Requirements Planning Dari hasil requirements Planning yang dilakukan dalam pembuatan webisite dapat disimpulkan bahwa kebutuhan yang diperlukan dalam pembuatan website adalah sebagai berikut: Aplikasi berbasis web application, yang bertujuan untuk mempermudah pengguna dalam mengakses. Aplikasi dapat menyediakan data informasi yang valid sesuai dengan data-data perguran tinggi dan data sensus penduduk yang dikeluarkan oleh Ban-pt dan data.go.id. Pengguna dapat melakukan pencarian perguruan tinggi dengan melalui aplikasi yang akan dibangun. B. Fase User Design Pada fase user design dirancang pada halaman awal atau index dan halaman pencarian atau halaman Search_Page sesuai dengan perancangan website sebagai berikut: Pada halaman index website, pengguna akan diberikan beberapa menu dalam halaman awal.. Pada halaman index website, pengguna akan diberikan suatu fungsi pencarian. Pada halaman pencarian pengguna dapat melihat tabel dan fungsi pencarian untuk melakukan pencarian kembali. Pada halaman pencarian pengguna melihat pada row pertama sebagai informasi jumlah total penduduk, berdasarkan dari hasil katagori yang dipilih. Pada tabel data yang ditunjukan, pengguna dapat melakukan fungsi sort pada tabel. C. Fase Construction Proses lengkap dari setiap tahap yang dilewati dalam pengelolaan data, dari data kotor hingga menjadi data bersih yang ditampilkan di website adalah sebagai berikut: 1) Pencarian Data Pencarian data dilakukan dari website terkait seperti BAN-PT, Dikti, dan data.go.id untuk diabil datanya. Pada tahap pencarian, data yang didapatkan berbentuk URL (uniform resource locator) untuk dimasukan dalam pengambilan data. 2) Pengambilan Data Pengambilan data dilakukan dengan cara Web Scrapping dengan menggunakan Tools Pentaho Data Integration, yang akan memalu beberapa tahap yaitu: Text File input proses memasukan data pada text file yang berisikan source code dalam bahasa HTML yang di ambil dari http://ban-pt. kemdiknas.go.id/ untuk mengambil data Filter rows digunakan untuk menyaring data yang akan digunakan untuk penelitian ini Replacement string untuk menghilangkan datadata yang tidak di perlukan, agar hasil yang diterima menjadi data bersih Row Flattener digunakan untuk pengurutan data yang di ambil di ambil 3) Data Cleansing Data dibersihkan menggunakan Pentaho Data Integration dengan dependensi pada nomor kopertis sehingga tidak akan keluar dari wilayah kopertisnya. Data yang dupilkat akan dibersihkan dengan nama yang disamakan. Berikutnya mengidentifisikasi nomor kode kota/kabupaten yang ada pada setiap perguruan tinggi agar dapat digabungkan pada data penduduk yang ada sehingga dapat di identifikasi berapa jumlah penduduk yang ada. 4) Penggabungan Data Penggabungan data dalam Pentaho Data Integration ditujukan untuk menggabungkan dua data yang berbeda. Dengan fungsi Join row pada Pentaho Data Integration kedua data dapat menjadi satu dan mempunyai dependensi yang sama. D. Rasio Rasio digunakan untuk mengetahui kesenjangan edukasi pada perguruan tinggi dari setiap daerah Indonesia. Penelitian ini menggunakan Gross Enrolment Ratio (GER). Untuk menghasilkan data yang tepat digunakan data terakhir dari sensus penduduk dan data ULTIMA InfoSys, Vol. VI, No. 2 Desember 2015 133

DIKTI untuk digunakan dalam perhitungan rasio. dilakukan adalah keakurasian data dan validitas data yang diberikan oleh website. dimana (1) Pengukuran validitas dan akurasi pada website, dengan cara membandingkan dengan data yang dapatkan pada ban-pt.kemdiknas.go.id dan data.go.id. adalah Gross Enrolment Ratio pada level edukasi h dalam tahun sekolah t Tabel 1. Sampling pengujian validasi data perguruan tinggi adalah Pendaftaran pada level edukasi h dalam tahun sekolah t adalah Populasi dalam grup usia a dimana koresponden pada level edukasi h dalam tahun sekolah t Gross Enrolment Ratio yang digunakan untuk tingkat umum partisipasi dalam tingkat pendidikan, dan dapat menjadi indicator melengkapi angka partisipasi murni.. Nilai yang mendekati atau melebihi 100% menunjukkan bahwa suatu daerah mampu menampung golongan usia sekolah, tetapi tidak menunjukan proporsi yang sudah terdaftar. Oleh karena itu pencapaian 100% adalah kondisi yang diperlukan tetapi tidak dapat menjadi suatu indikasi yang pasti. Jika sudah mendekati 90% kondisi merupakan indikasi menunjukkan bahwa suatu daerah mampu menampung golongan usia mahasiswa. Pengujian juga mencakup validitas pada jumlah populasi pada provinsi dan daerah dengan cara yang sama sama. Pengujian ini bertujuan untuk mengetahui apakah sistem dalam penjumlah data telah berjalan dengan baik Tabel 2. Sampling pengujian validasi data penduduk Dengan melakukan data sampling dapat membuktikan bahwa aplikasi dapat menghasilkan informasi perguruan tinggi dengan valid. Kedua pengujian yang telah dilakukan pada kedua pengujian diatas dapat memenuhi ekspetasi. Tingkat validitas data dan akurasi telah memenuhi kesuksesan website. Gambar 5. Hasil perhitungan rasio GER per provinsi di Indonesia E. Fase Cutover Website akan diuji setelah dibangun untuk mengukur apakah website yang dibuat dapat memberikan informasi yang sesuai dengan ekspetasi penulis dan memastikan website bekerja dengan baik. Pengujian yang akan 134 ULTIMA InfoSys, Vol. VI, No. 2 Desember 2015 V. KESIMPULAN DAN SARAN A. Kesimpulan Website ini dibangun untuk mengetahui gambaran kesenjangan edukasi pada tingkat perguruan tinggi setiap daerah yang ada di Indonesia. Sistem pengumpulan data pada website dibangun dengan cara web crawling, web scrapping, dan data cleansing untuk

mendapatkanan data-data yang valid Pada perhitungan Gross Enrolment Ratio (GER) yang didapatkan dari penelitian ini, Indonesia mendapatkan hasil 2,03%, dan untuk perhitungan rasio per daerah, DKI Jakarta mendapatkan rasio tertinggi senilai 41,78%. Dari hasil rasio yang didapatkan bisa ditarik kesimpulan bahwa Indonesia belum dapat menampung golongan usia mahasiswa dari standar yang diberikan oleh UNESCO. Website yang dibangun telah berhasil menunjukan rasio, dapat mengolah data, dapat menampilkan data tabel pencarian, dan dapat memberikan data dan informasi yang valid serta akurasi yang baik. [6] UNESCO, UNESCO Institute for Statistics, [Online]. Available: http://www.uis.unesco.org/library/documents/ eiguide09-en.pdf. [Accessed 13 Mei 2015]. [7] University of Wisconsin Eau Claire, Data Collection Methods, University of Wisconsin Eau Claire, [Online]. Available: http://people.uwec.edu/piercech/researchmethods/ data%20collection%20methods/data%20collection%20 methods.htm. [Accessed 5 Maret 2010]. B. Saran Agar mendapatkan data yang lebih aktul dan terbaru dari UNESCO. Agar dapat memberikan gambaran secara keseluruan tentang pendidikan di Indonesia, website dapat dikembangakan dengan cara menambahkan data akreditasi sekolah, perwilayah. Terkait dengan pengembangan website ini, agar dapat memberikan tambilan hasil search lebih menarik dan mudah dimengerit pengguna Ucapan Terima Kasih Penulis mengucapkan terimakasih kepada Bapak Wira Munggana, S. Si., M.Sc. dan Ir. Raymond Sunardi Oetama, M.C.I.S yang memberikan dukungan, saran dan inspirasi dalam penelitian ini. DAFTAR PUSTAKA [1] Cambridge, Viral, Cambridge Dictionaries, [Online]. Available: http://dictionary.cambridge.org/dictionary/british/ viral. [Accessed 2015 Maret 3]. [2] Franklin & Marshall College, Data Collection, Franklin & Marshall College, [Online]. Available: http://www.fandm.edu/ opinionresearch/data-collection. [Accessed 20 Maret 2015]. [3] O. Christopher and N. Marc, Web Crawling, California: standford, 2010. [4] OLAP, Business Intelligence, PARIS Technologies, [Online]. Available: http://olap.com/learn-bi-olap/olap-bi-definitions/ business-intelligence/. [Accessed 3 Maret 2015]. [5] T. Matthew, php architect s Guide to Web Scrapping with PHP, Alexandria: musketeers.me, LLC, 2010. ULTIMA InfoSys, Vol. VI, No. 2 Desember 2015 135