BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

1. Pendahuluan Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang. commit to user

DATA CENTER: PENDAHULUAN

BAB I PENDAHULUAN Latar Belakang

MENTERI HUKUM DAN HAK ASASI MANUSIA REPUBLIK INDONESIA,

: POB-SJSK-009 PROSEDUR OPERASIONAL BAKU Tanggal Berlaku : 1/01/2013 Backup & Recovery Nomor Revisi : 02

IMPLEMENTASI EYE OS MENGGUNAKAN METODE LOAD BALANCING DAN FAILOVER PADA JARINGAN PRIVATE CLOUD COMPUTING DENGAN LAYANAN IAAS DAN SAAS

MENTERI RISET, TEKNOLOGI, DAN PENDIDIKAN TINGGI REPUBLIK INDONESIA

BIDANG OTOMASI DOKUMENTASI HUKUM PUSAT DOKUMENTASI DAN JARINGAN INFORMASI HUKUM NASIONAL BADAN PEMBINAAN HUKUM NASIONAL KEMENTERIAN HUKUM DAN HAM RI

Big Data dengan Hadoop Oleh : Agus Priyanto, M.Kom

ALIH MEDIA DIGITAL BAHAN PUSTAKA Oleh: Wahyu Dona Pasa Sulendra, S.IP

BAB 2 TINJAUAN PUSTAKA

PENGENDALIAN SISTEM INFORMASI BERDASARKAN KOMPUTER DIANA RAHMAWATI

Dasar Dasar Intelijen Bisnis: Database dan Manajemen Informasi

Analisa Hadoop High Availability Menggunakan Quorum Journal Manager dan Zookeeper dengan Studi Kasus Namenode Failover

Analisa Perbandingan Original Hadoop Cluster Dan Modifikasi Hadoop Cluster

BAB 4 HASIL DAN PEMBAHASAN PENGUKURAN RISIKO TI. Sebagaimana individu, perusahaan, dan ekonomi semakin bergantung pada sistem

BAB 4 PERANCANGAN SISTEM

Chapter 10 PENGENDALIAN INTEGRITAS PEMROSESAN DAN KETERSEDIAAN

BAB I PENDAHULUAN. kehilangan/kerusakan data maupun kesalahan pemrosesan data. [12]

Casing Dell Storage MD1400 dan MD1420 Panduan Pengaktifan

BERITA DAERAH KOTA YOGYAKARTA

YUVIRNA ADIKTIA SOVIANTY

6.2 Pendekatan Database Untuk Pengelolaan Data

Gambar 1.1 Contoh laporan billing di Windows Azure

BAB 2 LANDASAN TEORI. menyediakan layanan ke komputer lain melalui koneksi jaringan. Server dapat

Latex 3000 Printer Series. Jaminan Terbatas

Hadoop Framework. 1. Pengantar

BAB 1 PENDAHULUAN. Pengukuran overhead..., Ida Nurhaida, FT UI, 2009

BAB 1 PENDAHULUAN. Perkembangan teknologi dan informasi memberikan pengaruh terhadap

WALIKOTA PROBOLINGGO PROVINSI JAWA TIMUR

PERATURAN BADAN INFORMASI GEOSPASIAL NOMOR 8 TAHUN 2017 TENTANG TATA KELOLA TEKNOLOGI INFORMASI DAN KOMUNIKASI DENGAN RAHMAT TUHAN YANG MAHA ESA

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB III PROSES ALIH MEDIA KOLEKSI DEPOSIT PADA BADAN PERPUSTAKAAN DAN DOKUMENTASI SUMATERA UTARA (BPAD)

PERTEMUAN 8 PENGAMANAN SISTEM INFORMASI BERBASIS KOMPUTER

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

HP Latex 1500 Printer. Jaminan Terbatas

SAN [storage area network] Muhammad Riza Hilmi,ST.

BAB 2 ANALISIS KONDISI EKSISTING TIK UNHAS DAN KECENDERUNGAN PERKEMBANGAN TIK

PERANCANGAN SISTEM RECOVERY DATABASE MENGGUNAKAN METODE MIRRORING. Linda Elisa Sinaga A

BAB I PENDAHULUAN. Seiring dengan pesatnya perkembangan teknologi informasi yang semakin

Printer Scitex FB550 dan FB750. Jaminan Terbatas

Pengenalan Komunikasi Data

Bermain dengan Infrastruktur Virtual : VMware vsphere (Tulisan Pertama)

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

RAID level 0 menggunakan kumpulan disk dengan striping pada level blok, tanpa redundansi.

BAB 1 PENDAHULUAN Latar Belakang. Pada era informasi saat ini, komunikasi merupakan sarana penting dalam dunia

ABSTRAK. Kata kunci: Big Data, Hadoop, Karakteristik, Kecepatan Transfer, Stabilitas. v Universitas Kristen Maranatha

BAB I PENDAHULUAN. pelayanan terbaik dan untuk menghadapi persaingan global. Di Indonesia

SISTEM PENDETEKSI SERANGAN FLOODING PACKET BERBASIS OPEN SOURCE MENGGUNAKAN SNORT IDS ARTIKEL SKRIPSI

Bermain dengan Infrastruktur Virtual : VMware vsphere (Tulisan Pertama)

BAB 5 FASE PERANCANGAN

BAB I PENDAHULUAN. media kabel ataupun tanpa kabel (nirkabel), sehingga memungkinkan pengguna

BUPATI SITUBONDO PERATURAN BUPATI SITUBONDO NOMOR 4 TAHUN 2012

PERATURAN MENTERI PENDIDIKAN NASIONAL REPUBLIK INDONESIA NOMOR 38 TAHUN 2008 TENTANG

BAB 3 ANALISIS SISTEM YANG SEDANG BERJALAN

Pengendalian Sistem Informasi Berdasarkan Komputer

BAB 4 EVALUASI SISTEM INFORMASI DISTRIBUSI PADA PT PRIMA CIPTA INSTRUMENT

Oracle Case Study HIGH AVAILABILITY. Oleh: Ahmad Syauqi Ahsan

[ Lembaga Ilmu Pengetahuan Indonesia] 2012

Printer HP Latex Seri 500. Jaminan Terbatas

1BAB I PENDAHULUAN 1.1 Latar Belakang

PENGENDALIAN SISTEM INFORMASI BERDASARKAN KOMPUTER

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah. Perkembangan aplikasi teknologi informasi saat ini sudah berkembang begitu pesat

PERATURAN MENTERI PENDIDIKAN NASIONAL REPUBLIK INDONESIA

PENGGUNAAN CLOUD COMPUTING DI DUNIA PENDIDIKAN MENENGAH DALAM PENDEKATAN TEORITIS. Maria Christina

SURVEI INDEKS KINERJA INFRASTRUKTUR DATA SPASIAL

Bab II Landasan Teori

Perancangan Aplikasi Monitoring Suhu pada Ruangan DMZ Berbasis Web dan Mobile

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. Kemajuan dari teknologi Database Management System (DBMS) telah

PERATURAN MENTERI ENERGI DAN SUMBER DAYA MINERAL REPUBLIK INDONESIA NOMOR: 06 TAHUN 2013 TENTANG

MENTERI HUKUM DAN HAK ASASI MANUSIA REPUBLIK INDONESIA,

LAPORAN KINERJA TAHUN Pusat Data dan Teknologi Informasi

BAB I PENDAHULUAN I-1

LAMPIRAN A KUESIONER. Menetapkan Dan Mengatur Tingkatan Layanan (DS1)

Developing information systems and technology to support business strategy

FAILOVER CLUSTER SERVER DAN TUNNELING EOIP UNTUK SISTEM DISASTER RECOVERY

Bab 2 Tinjauan Pustaka

BAB 4 HASIL DAN PEMBAHASAN PENGUKURAN RISIKO TI

SHARE DATA & TRANSACTION

BAB I PENDAHULUAN 1 BAB I PENDAHULUAN

WEBGIS. Tujuan. Arna fariza. Setelah menyelesaikan bab ini, anda diharapkan dapat: Memahami tentang Web GIS Mengetahui software2 untuk Web GIS

Panduan Penggunaan e-document

Buku Panduan INFRASTRUKTUR JARINGAN KOMPUTER DAN KOMUNIKASI DATA DEPARTEMEN PERHUBUNGAN

BAB I PENDAHULUAN. Membuat modul tutorial dasar-dasar Microsoft Sharepoint 2010 dengan

Etika dalam Sistem Informasi

Keamanan dan Kontrol Sistem Informasi


BAB IV HASIL DAN UJI COBA

DAFTAR INFORMASI PUBLIK INFORMASI YANG WAJIB TERSEDIA SETIAP SAAT PERATURAN MENTERI KOMUNIKASI DAN INFORMATIKA TAHUN 2011

STANDAR SISTEM INFORMASI UNIVERSITAS INTERNASIONAL BATAM

BAB IV KONFIGURASI INSTALASI UPS. daya serta kerusakan sistem dan hardware. UPS akan menjadi sistem yang sangat

1 BAB I PENDAHULUAN. informasi dalam segala bentuknya (McKeown, 2002).Infrastruktur teknologi

BAB I PENDAHULUAN. Perkembangan teknologi informasi di era digital seperti sekarang ini

MEMUTUSKAN : Menetapkan : PERATURAN KEPALA BADAN METEOROLOGI, KLIMATOLOGI, DAN GEOFISIKA TENTANG PENGOPERASIAN SISTEM PENGOLAHAN DATABASE BMKGSOFT.

Kebijakan Privasi Kami

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Teknologi Informasi dan Komunikasi (TIK) memiliki peran yang penting di dalam pemerintahan. Beberapa peran TIK adalah untuk meningkatkan efisiensi dan transparansi dalam penyelenggaraan pemerintahan [1]. Melalui pemanfaatan secara tepat, TIK dapat digunakan sebagai sarana untuk membangun infrastruktur E-Government yang lebih baik. Bentuk penyelenggaraan pemerintahan ada berbagai macam, salah satunya adalah pengelolaan administrasi pemerintahan dan pelayanan terhadap masyarakat (public services). Pemanfaatan website oleh pemerintah untuk memberikan berbagai layanan secara elektronis adalah salah satu bentuk pemanfaatan TIK dalam melayani masyarakat. Sebagai salah satu instansi pemerintah, Monumen Pers Nasional yang berada di bawah Direktorat Jenderal Informasi dan Komunikasi Publik Kementerian Komunikasi dan Informatika Republik Indonesia memiliki tugas dan fungsi dalam menyelenggarakan kegiatan pemerintahan dan memberikan pelayanan publik kepada masyarakat seperti yang tertuang dalam Peraturan Menteri Komunikasi dan Informatika (Kominfo) Nomor 6 tahun 2011. Berdasarkan pasal 2 dan pasal 3 yang menerangkan bahwa Monumen Pers Nasional memiliki tugas untuk melakukan pelestarian dan pelayanan terhadap masyarakat mengenai produk pers nasional yang bernilai sejarah. Salah satu perwujudannya adalah dengan melakukan pelayanan informasi, penyiapan sarana penyebaran informasi, pemeliharaan, penatalaksanaan koleksi, pengawetan dan perlindungan terhadap benda-benda pers bersejarah [2]. Untuk mendukung salah satu tugasnya sebagai penyedia layanan informasi kepada masyarakat, Monumen Pers Nasional melakukan kegiatan penambahan koleksi media cetak pers dari seluruh nusantara secara rutin sepanjang tahun. Hasil penambahan koleksi tersebut disimpan, dikelola dan dibuka aksesnya untuk masyarakat yang memerlukan informasi. Kegiatan tersebut merupakan salah satu 1

bentuk diseminasi informasi kepada masyarakat [3]. Berdasarkan data resmi yang diperoleh dari Monumen Pers Nasional, jumlah koleksi data media cetak pers yang dimiliki saat ini mencapai 296 judul koran dan 335 judul majalah, baik dalam bentuk format digital maupun cetak yang terbit dari tahun sebelum kemerdekaan Indonesia hingga sekarang di tahun berjalan. Jumlah koleksi tersebut diperkirakan akan terus bertambah karena adanya kegiatan penambahan koleksi media cetak pers nasional yang rutin dilakukan setiap hari serta penambahan judul baru media cetak pers tiap tahun. Berdasarkan Undang-Undang Nomor 43 tahun 2009 tentang Kearsipan [4], koleksi media cetak pers yang dimiliki Monumen Pers Nasional harus dikelola dengan baik, karena setiap koleksi media cetak pers dapat dikategorikan sebagai arsip milik negara yang berisi berbagai rekaman dan informasi kegiatan atau suatu peristiwa sejarah. Terdapat dua macam tata cara pengelolaan koleksi media cetak pers yang dilakukan di Monumen Pers Nasional berdasarkan format media cetak yang dikelola. Untuk media dengan format fisik disimpan dan ditata di dalam ruangan khusus. Sedangkan media cetak dengan format digital disimpan di dalam server penyimpanan. Media cetak berformat digital milik Monumen Pers Nasional saat ini terdiri dari 2 tipe data yaitu media cetak berformat citra (jpeg) dan media cetak berformat dokumen PDF (Portable Document Format). Format citra (jpeg) tersebut dihasilkan dari kegiatan digitalisasi sedangkan format dokumen (pdf) sisanya diperoleh dari berbagai sumber. Kegiatan digitalisasi bertujuan untuk melakukan duplikasi sekaligus penyelamatan informasi yang terkandung di dalam media cetak fisik [5]. Hasil dari alih media tersebut diharapkan mampu memberikan fleksibilitas akses yang sebelumnya tidak dimiliki oleh format fisik. Keunggulan penggunaan format digital salah satunya adalah dapat digunakan oleh banyak pengguna sekaligus dalam satu waktu. Melalui perubahan pola akses informasi dari fisik ke digital, setidaknya dapat mengurangi kebutuhan akses langsung ke media cetak fisik yang lebih rapuh sehingga bentuk aslinya dapat terjaga. 2

Data alih media yang telah dibuat selanjutnya akan disimpan dan tidak akan diubah lagi. Data tersebut disediakan bagi pengguna yang membutuhkan informasi. Karakteristik perlakuan data dengan metode write once read many (WORM) merupakan perlakuan yang sering ditemui di dalam data warehouse [6]. Perlakuan semacam itu mirip dengan perlakuan pada data alih media yang dimiliki oleh Monumen Pers Nasional. Server media penyimpanan yang digunakan di Monumen Pers Nasional saat ini berada di dalam demilitarized zone (DMZ) yang terpisah baik secara logika atau fisik dengan komputer klien seperti yang ditunjukkan pada Gambar 1.1. Gambar 1.1 Ilustrasi jaringan antara klien dan server media penyimpanan di Monumen Pers Nasional DMZ menurut [7] adalah sebuah konsep desain jaringan yang memisahkan serta mengisolasi jaringan server dari jaringan lainnya terutama dengan jaringan klien. Hal ini bertujuan untuk meningkatkan keamanan serta untuk mengelola akses dari klien ke seluruh server yang berada di dalam DMZ. Topologi jaringan dan server di dalam DMZ ditunjukkan pada Gambar 1.2. 3

Gambar 1.2 Topologi jaringan DMZ server data media cetak di Monumen Pers Nasional Saat ini Monumen Pers Nasional memiliki 2 buah server penyimpanan (Server Data1 dan Server Data2) yang berada di dalam DMZ. Kedua server penyimpanan tersebut terhubung ke dalam satu server (Server Sentral) yang berfungsi sebagai pintu gerbang akses. Ketiga server tersebut (Server Sentral, Server Data1 dan Server Data2) akan digunakan sebagai infrastruktur awal untuk membangun data warehouse media cetak berformat digital. Topologi jaringan yang digunakan saat ini untuk menghubungkan ketiga server tersebut adalah topologi bintang. Topologi bintang tersebut dipilih karena akan memberi kemudahan dalam pengelolaannya, apabila terjadi kerusakan pada salah satu kabel atau komputer tidak akan mempengaruhi seluruh komunikasi di jaringan, tetapi topologi tipe ini memiliki satu kelemahan pada switch sentralnya [8]. Data media cetak pers nasional berformat digital yang disimpan di dalam server penyimpanan memang disediakan untuk publik. Sehingga banyak pengunjung Monumen Pers Nasional terutama mahasiswa dan peneliti yang memanfaatkan data tersebut untuk dianalisa sebagai bahan referensi. Saat ini Monumen Pers Nasional belum memiliki data warehouse media cetak pers nasional yang berfungsi untuk menyimpan dan memudahkan proses pencarian data sampai analisis data. Peneliti yang ingin melakukan pencarian data di Monumen Pers Nasional saat ini harus melakukan pencarian datanya secara satu 4

persatu di dalam server penyimpanan sehingga dirasa kurang efektif dan kurang efisien [9]. Berdasarkan keterbatasan tersebut, Monumen Pers Nasional kemudian berencana untuk mengembangkan infrastruktur yang telah digunakan sekarang sebagai data warehouse untuk menyimpan dan mengelola seluruh koleksi digital yang dimiliki. Untuk mempermudah akses data antara pengguna dengan server media penyimpanan saat ini, server sentral difungsikan sebagai pintu gerbang yang menghubungkan seluruh server penyimpanan. Dengan begitu pengguna cukup mengakses data melalui server sentral yang didalamnya tersambung data dari seluruh server penyimpanan. Berdasarkan pemanfaatan dan fungsinya data warehouse tersebut diharapkan selalu tersedia 24 jam sehari, 7 hari seminggu serta memiliki tingkat ketersediaan yang tinggi (high availability). Ketersediaan yang tinggi berarti memiliki fase down time minimal, dimana fase down time didefinisikan sebagai sebuah fase dimana sebuah layanan sistem atau data menjadi tidak bisa diakses [10]. Beberapa penyebabnya adalah terputusnya pasokan listrik, kegagalan sistem, hilangnya data, kerusakan data, penurunan performa jaringan, terputusnya komunikasi jaringan serta ketidakmampuan sistem dalam pemulihan ke kondisi normal. Berdasarkan survei yang telah dilakukan oleh perusahaan Computer Network Technology (CNT) dan Data Quest [10]. Penyebab sebuah sistem mengalami fase down time bisa dikarenakan berbagai macam hal seperti bencana alam, kegagalan fungsi dan komunikasi jaringan, kerusakan perangkat keras, kerusakan sistem operasi, kerusakan aplikasi, virus, kesalahan manusia, dan beberapa hal yang penyebabnya tidak diketahui. Salah satu langkah yang telah ditempuh Monumen Pers Nasional untuk meminimalisir fase down time karena terputusnya sumber daya listrik adalah dengan memasang genset dan perangkat uninterruptible power supply (UPS). Untuk melindungi data yang disimpan di server dari ancaman kerusakan perangkat keras hard disk maka implementasi teknologi Redundant Array Independent Disk (RAID) telah dilakukan. Teknologi RAID selain RAID versi 0 menurut [11] memiliki mekanisme perlindungan data dengan melakukan replikasi 5

data di setiap anggota hard disk yang tergabung di dalamnya. Data yang disimpan menggunakan teknologi RAID akan dipecah kemudian direplikasi dan disebar merata lintas hard disk yang tersusun sebagai anggota RAID array. Kemampuan perangkat keras controller yang digunakan pada server di Monumen Pers Nasional saat ini hanya mendukung RAID versi 0 (RAID 0), RAID versi 1 (RAID 1) dan RAID versi 5 (RAID 5). Teknologi RAID 5 yang digunakan di server Monumen Pers Nasional dipilih karena mampu menyediakan tingkat toleransi kegagalan yang sama jika dibandingkan dengan RAID 1 tetapi menyediakan kapasitas penyimpanan yang lebih besar [12]. RAID 5 juga mampu memberikan mekanisme perlindungan data yang tidak dimiliki oleh RAID 0 dengan mengesampingkan performa dalam melakukan penulisan data pada RAID 5 yang lebih rendah dibandingkan dengan RAID 1 dan RAID 0. Untuk menggunakan teknologi RAID 5 setidaknya membutuhkan minimal 3 buah hard disk dan maksimal tersusun dari 16 hard disk yang dapat dikonfigurasi dalam satu array. RAID 5 mampu melindungi hilangnya data yang disimpan ketika terjadi kerusakan pada salah satu hard disk dalam satu kesatuan array [13]. Dari situ dapat disimpulkan bahwa kelemahan pada RAID 5 adalah ketika kerusakan terjadi bersamaan pada beberapa hard disk sekaligus (lebih dari satu hard disk) maka kehilangan data dapat menjadi suatu hal yang tidak dapat dihindari. Kondisi tersebut pernah terjadi di Monumen Pers Nasional pada tahun 2013 sehingga menyebabkan banyak data yang hilang karena kerusakan hard disk secara bersamaan di salam satu array tersebut tidak dapat diantisipasi oleh RAID 5. Akibatnya hampir sebagian data hilang dan tidak dapat diakses. Proses pemulihan dilakukan menggunakan data cadangan. Hanya saja waktu yang dibutuhkan agar kondisi kembali seperti semula membutuhkan waktu beberapa minggu. Melalui kejadian tersebut, maka prioritas pertama Monumen Pers Nasional saat ini adalah membangun infrastruktur media penyimpanan yang mampu menyediakan ketersediaan data yang lebih tinggi dibanding sebelumnya yang akan digunakan sebagai data warehouse ke depannya. Berdasarkan kebutuhan tersebut aplikasi Hadoop dapat menjadi sebuah solusi [14]. Hadoop adalah 6

sebuah aplikasi yang berasal dari proyek open source dari Apache Foundation yang menyediakan teknologi penyimpanan bernama Hadoop Distributed File System (HDFS) dan pemrosesan data skala besar secara paralel dengan paradigma MapReduce [15]. Berbagai perusahaan juga sudah banyak yang membuktikan kemampuan Hadoop yang digunakan untuk menyimpan dan memproses data dengan skala besar, berikut diantaranya [16]: a) Facebook menggunakan Hadoop untuk menyimpan salinan log dan berbagai data untuk analisis dan pelaporan. b) Adobe menggunakan Hadoop untuk menyimpan dan memproses data yang berasal dari layanan publik yang digunakan untuk kebutuhan internal. c) Ebay menggunakan Hadoop untuk mengoptimasi sistem pencarian di dalam website-nya. d) Yahoo! menggunakan Hadoop untuk riset di sistem periklanan dan pencarian web. e) Twitter menggunakan Hadoop untuk menyimpan dan memproses data sosial media yang dihasilkan. f) Rakuten, perusahaan toko online yang berasal dari Jepang menggunakan Hadoop untuk membangun sistem rekomendasi bagi pelanggannya dan lainlain. HDFS memiliki kemampuan untuk dapat mendeteksi dan mengatasi kegagalan yang terjadi pada sistem penyimpanan dari lapisan perangkat lunak sehingga mampu melapisi kemampuan perangkat keras dalam mengatasi kegagalan [15]. 7

Kemampuan yang dimiliki HDFS diharapkan mampu menjadi solusi akan potensi masalah yang dapat timbul karena keterbatasan teknologi perangkat keras yang digunakan. Selain menyediakan teknologi media penyimpanan, fitur MapReduce yang dimiliki Hadoop juga dapat dimanfaatkan untuk melakukan pemrosesan komputasi dan analisis data seperti yang data warehouse dapat lakukan [15]. Aplikasi Hadoop juga dapat dijalankan menggunakan perangkat keras komoditas yang mudah didapatkan di pasaran [17]. Untuk mendapatkan dan menggunakan berbagai kelebihan Hadoop tersebut, pengguna juga tidak perlu mengeluarkan biaya apapun (free) untuk membayar lisensi. Berbagai kelebihan yang dimiliki oleh Hadoop tersebut menjadi dasar pemilihan aplikasi Hadoop untuk dijadikan sebagai infrastruktur awal sebelum data warehouse media cetak dibangun di Monumen Pers Nasional. 1.2 Perumusan Masalah Dari uraian latar belakang di atas dapat ditarik rumusan masalah yaitu: 1. Infrastruktur media penyimpanan di Monumen Pers Nasional saat ini dalam menjamin ketersediaan data yang disimpan memilki tingkat toleransi kegagalan yang rendah karena hanya menggunakan metode RAID. 2. Aplikasi Hadoop dengan fitur HDFS dapat memberikan solusi yang tepat dalam mengatasi permasalahan yang ada sebelumnya, hanya saja seberapa jauh tingkat toleransi kegagalan yang dimiliki dalam memberikan jaminan tingkat ketersediaan data yang disimpan belum diketahui. 8

1.3 Keaslian Penelitian Penelitian tentang high availability system, aplikasi Hadoop dan HDFS telah banyak dilakukan sebelumnya. Berikut beberapa penelitian sebelumnya yang dapat dijadikan acuan. Salah satu penelitian tentang perlindungan data pada media penyimpanan menjelaskan bahwa ada beberapa solusi untuk melakukan perlindungan pada data yang disimpan di media penyimpanan [18]. Salah satu solusinya adalah menggunakan metode redundancy. Metode ini dapat meningkatkan tingkat ketersediaan data yang disimpan di dalam media penyimpanan. Walaupun begitu, konsekuensi dengan metode tersebut adalah kebutuhan kapasitas penyimpanan menjadi lebih besar dari ukuran data yang seharusnya disimpan. Metode ini akan memberikan jaminan ketersediaan yang diakibatkan oleh kegagalan perangkat keras, tetapi tidak memberikan jaminan kerusakan atau kehilangan data yang diakibatkan oleh virus atau ulah manusia. Implementasi dari metode redundancy pernah diterapkan pada penelitian tentang menggunakan Object-based Storage Devices (OSD) [19]. Melalui metode tersebut, setiap data yang disimpan di dalam OSD akan diduplikasi dan disebar ke beberapa tempat sekaligus dalam satu array saat proses penyimpanan dilakukan. Penyebaran duplikasi data ini bertujuan untuk meningkatkan ketersediaannya. Apabila terjadi kegagalan pada salah satu media penyimpanan yang digunakan, maka duplikasi data dari media penyimpanan yang masih berfungsi normal akan digunakan untuk menggantikannya. Banyak penelitian tentang pemanfaatan Hadoop dilakukan, salah satunya adalah penelitian Hadoop yang digunakan untuk data warehouse [20]. Pada penelitian tersebut, aplikasi Hadoop yang dikolaborasikan dengan aplikasi Hive mampu melakukan proses analisis data dengan skala petabyte. Melalui penelitian tersebut didapatkan hasil bahwa dibandingkan menggunakan basis data relasional, pemrosesan data dengan skala besar melalui pemanfaatan fitur map reduce pada aplikasi Hadoop terasa lebih efektif. Penggunaan aplikasi open source dapat digunakan untuk membangun suatu sistem sehingga memiliki ketersediaan tinggi dan dapat menekan biaya produksi 9

dan investasi [21]. Ada banyak aplikasi atau sistem operasi open source yang dapat dijadikan alternatif pengganti dari aplikasi atau sistem operasi berbayar yang tersedia di pasaran. Apabila dilakukan secara tepat kemampuan aplikasi open source juga dapat memiliki kemampuan yang setara bahkan bisa melebihi kemampuan aplikasi yang berbayar. Walaupun begitu, melalui penelitian tersebut diketahui bahwa implementasinya bukanlah perkara yang mudah tetapi tidak mustahil untuk dilakukan. Penelitian tentang high availability dan reliable server juga pernah dilakukan [22]. Tujuan penelitian tersebut adalah membangun purwarupa server basis data relasional yang memiliki kemampuan redundancy dan failover sehingga mampu menjaga ketersediaan layanan selama operasional walaupun terjadi masalah. Purwarupa tersebut dibangun hanya melibatkan tidak lebih dari 2 perangkat server dimana salah satu server berperan sebagai server aktif dan satunya berperan sebagai server pasif (cadangan). Server cadangan tersebut akan berperan aktif seketika menggantikan peran server utama ketika terjadi masalah. Akan tetapi, metode ini belum teruji ketika digunakan dengan di lebih dari 2 server. 1.4 Tujuan Penelitian Tujuan penelitian ini adalah untuk mengetahui tingkat ketersediaan data media penyimpanan HDFS terutama pada Datanode di aplikasi Hadoop sehingga dapat digunakan untuk merancang dan membangun purwarupa infrastruktur data warehouse agar memiliki tingkat ketersediaan data yang disimpan menjadi lebih tinggi dari infrastruktur saat ini di Monumen Pers Nasional. 1.5 Manfaat Penelitian Dari penelitian ini dapat diambil manfaat bagi Monumen Pers Nasional yaitu mampu menghasilkan informasi dan pengetahuan tentang tingkat ketersediaan yang dijamin oleh aplikasi Hadoop yang dapat digunakan untuk membangun infrastruktur media penyimpanan untuk data warehouse agar memiliki tingkat 10

ketersediaan data yang lebih tinggi dari media penyimpanan yang digunakan saat ini. 1.6. Batasan Penelitian Penelitian ini memiliki batasan sebagai berikut: a) Penelitian ini hanya membahas sebatas ketersediaan data yang disediakan Datanode pada fitur HDFS di aplikasi Hadoop. b) Pada penelitian ini tidak membahas tentang tingkat ketersediaan aplikasi YARN (Map Reduce) yang merupakan salah satu fitur lainnya pada aplikasi Hadoop. 11