Langkah-Langkah Merancang Arsitektur Big Data

dokumen-dokumen yang mirip
Chapter 10 PENGENDALIAN INTEGRITAS PEMROSESAN DAN KETERSEDIAAN

BAB 1 PENDAHULUAN. Pengukuran overhead..., Ida Nurhaida, FT UI, 2009

DATA CENTER: PENDAHULUAN

BAB I PENDAHULUAN. Dengan semakin besar kapasitas media penyimpanan dan harga yang semakin

STANDAR OPERASIONAL PROSEDUR KEAMANAN JARINGAN

Modul ke: Sistem Operasi. Komponen Sistem Operasi dan Fungsi-Fungsinya. Fakultas FASILKOM. Juliansyahwiran, S. Kom, MTI.

PROSEDUR KEAMANAN JARINGAN SPMI - UBD

Teknik Informatika S1

SISTEM BASIS DATA BACKUP DAN RECOVERY. Backup Data. Restore Data. DENI HERMAWAN Informatika

BAB I PERMASALAHAN DAN SOLUSI UMUM SISTEM INFORMASI PENDIDIKAN

Gambar 1.1 Contoh laporan billing di Windows Azure

BAB I PENDAHULUAN Latar Belakang Masalah

OBJEK PEMBELAJARAN OBJEK PEMBELAJARAN. Pertemuan 1 Konsep Dasar ERP. Gambaran Umum ERP. Definisi Sistem Informasi Klasifikasi Sistem Informasi

1.2. Rumusan Masalah Batasan Masalah

ITSP Product Offering

REKAYASA PERANGKAT LUNAK LANJUT WEB ENGINEERING. Defri Kurniawan M.Kom

Miyarso Dwi Ajie Otomasi Perpustakaan Pertemuan #7

Adapun karakteristik umum yang dimiliki datawarehouse adalah :

BAB 2 TINJAUAN PUSTAKA

Implementasi Configuration Management pada IT Infrastruktur Library (ITIL)

STANDAR OPERASIONAL PROSEDUR KEAMANAN JARINGAN

ANALISIS PEMANFAATAN LAYANAN BERBASIS CLOUD MENGGUNAKAN MICROSOFT AZURE

Pengenalan Basis Data (lanjutan)

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. perusahaan atau organisasi dalam menentukan kebijakan-kebijakan strategis

DIAGRAM SITASI PAPER. Disusun oleh: Anggy Tias Kurniawan SK2A

BAB II LANDASAN TEORI. teknis yang dikosentrasikan untuk produk atau layanan yang spesifik. Helpdesk

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

PENGANTAR DATA CENTER

Kontrak Kuliah. Desain Sistem. Edi Sugiarto, S.Kom, M.Kom

6/26/2011. Kebutuhan perusahaan untuk mengimplementasikan BI cukup besar. BI dengan data analysis toolnya merupakan

MERANCANG WEB DATA BASE UNTUK CONTENT SERVER

TEKNIK AUDIT DATA CENTER DAN DISASTER RECOVERY. Titien S. Sukamto

BAB I PENDAHULUAN I.I

Enterprise Architecture. Muhammad Bagir, S.E., M.T.I

ARSITEKTUR SISTEM. Alif Finandhita, S.Kom, M.T. Alif Finandhita, S.Kom, M.T 1

UTILITY COMPUTING Segala hal mengenai Utility Computing dan Cloud. Oleh: Abdullah Adnan Dosen: I Made Andhika

MENTERI HUKUM DAN HAK ASASI MANUSIA REPUBLIK INDONESIA,

Pengantar Teknologi SIA 1

6.2 Pendekatan Database Untuk Pengelolaan Data

Pengantar Cloud Computing Berbasis Linux & FOSS

Teknik Informatika Universitas Pasundan. Caca E. Supriana, S.Si.,MT.

OPERASI DASAR KOMPUTER dan PERANGKAT LUNAK DALAM SISTEM INFORMASI

Software-Defined Networking (SDN) Transformasi Networking Untuk Mempercepat Agility Bisnis BAB 1 PENDAHULUAN

STANDARD OPERATING PROCEDURE

Cloud Computing Windows Azure

Komputasi Awan (Cloud Computing)

MODEL ARSITEKTUR SISTEM INFORMASI TERDISTRIBUSI

ENTERPRISE RESOURCE PLANNING

Tugas. Data Warehouse. OLAP, Operasi OLAP, dan Jenis Rolap

DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan

perkembangan teknologi informasi dan komunikasi. Firewall : Suatu sistem perangkat lunak yang mengizinkan lalu lintas jaringan yang dianggap aman

DAFTAR PERTANYAAN. 1. Apakah kebutuhan pemakai / end-user (dalam kasus ini divisi penjualan) telah

Prinsip Kerahasiaan dan Keamanan Data Layanan Cloud IBM

Bab 1. Pengenalan Sistem Terdistribusi

ADMINISTRASI SERVER KELAS 11. Oleh Alimansyah Aprianto Tek. Komputer dan Jaringan

BAB I PENDAHULUAN. I.1 Pendahuluan

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Tabel 2.1 Tinjauan Pustaka

BAB I PENDAHULUAN 1.1 Latar Belakang


Waktu yang lebih efisien. Lebih Aman. Memahami dan Memilih Tool Manajemen Network

ABSTRAK. Keyword : big data, distribusi, Hadoop, sistem file. vi Universitas Kristen Maranatha

BAB I PENDAHULUAN 1.1 Latar Belakang

PASAL DEMI PASAL. Pasal 1 Cukup jelas.

PERATURAN BADAN INFORMASI GEOSPASIAL NOMOR 8 TAHUN 2017 TENTANG TATA KELOLA TEKNOLOGI INFORMASI DAN KOMUNIKASI DENGAN RAHMAT TUHAN YANG MAHA ESA

SISTEM OPERASI. Belajar SO?

MAKALAH CLOUD KOMPUTING. Disusun Oleh : Villy Thias. Semester 4 POLITEKNIK PAJAJARAN TEKNIK KOMPUTER

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. Virtual Desktop Infrastructure (VDI) adalah sebuah solusi virtual desktop yang terpusat

NAMA JABATAN : Kepala Subbagian Operasional Layanan Teknologi Informasi

BAB 1 PENDAHULUAN Latar Belakang

adil efisiensi waktu tanggap (response time) turn arround time throughput

PENGENALAN JARINGAN KOMPUTER

1. Apa saja data yang dibutuhkan? 2. Bagaimana sistem pengolahan data real time yang bisa diimplementasikan? 3. Teknologi Akses yang digunakan?

Developing an Enterprise Architecture Management Plan

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

COMMAND CENTER DAN DATA WAREHOUSE KEMENTERIAN PERHUBUNGAN TAHUN 2010

ABSTRAK. Kata Kunci : Disaster Recovery Plan, Business Continuity Plan, Bencana. Universitas Kristen Maranatha

Algoritma MAC Berbasis Jaringan Syaraf Tiruan

BAB I PENDAHULUAN. Industri perbankan sangat erat kaitannya dengan Teknologi Informasi (TI),

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB II GAMBARAN UMUM CV. CITRA KITA. sejak Bulan Oktober 2010 dalam skala Small Office Home Office

ANALISIS PERFORMANSI LOAD BALANCING DENGAN ALGORITMA ROUND ROBIN DAN LEAST CONNECTION PADA SEBUAH WEB SERVER ABSTRAK

Bab III Metodologi Penelitian.

Bermain dengan Infrastruktur Virtual : VMware vsphere (Tulisan Pertama)

BAB IV ANALISIS DAN PERENCANAAN SISTEM. yang terdapat pada sistem tersebut untuk kemudian dijadikan landasan usulan

BAB I PENDAHULUAN 1.1. Tujuan 1.2. Latar Belakang

ORGANISASI BERKAS SEQUENTIAL STRUKTUR & ORGANISASI DATA 1

BUSINESS INTELLIGENCE. Management Database & Informasi

Enterprise Resource Planning

BAB I Pendahuluan. 1BAB I Pendahuluan

CORE SUPPORT MANAGEMENT PROCESS

DASAR-DASAR PEMBELAJARAN FISIKA

SISTEM INFORMASI CREATED BY:

BAB II TINJAUAN PUSTAKA. Pada bagian ini akan dijelaskan tentang state of the art dari hal-hal. CVE, dan implementasi deteksi tabrakan pada CVE.

Gordon B. Davis (1984)

KOMPUTASI BISNIS DAN DUNIA USAHA

GARIS GARIS BESAR PROGRAM PENGAJARAN/GBPP (Rencana Kegiatan Belajar Mengajar)

BAB III LANDASAN TEORI. adalah suatu jaringan kerja dari prosedur-prosedur yang saling berhubungan,

BAB II LANDASAN TEORI. Berikut ini adalah beberapa teori dan definisi yang terkait dengan Disaster. Recovery yang digunakan dalam tesis ini.

Transkripsi:

Indra Aulia Program Studi Teknologi Informasi Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara Langkah-Langkah Merancang Arsitektur Big Data

Pendahuluan Arsitektur big data merupakan suatu struktur logis dan/atau fisik yang menangani seberapa besar data akan disimpan, diakses dan dikelola dalam suatu big data atau lingkungan TI. Dalam rangka mendefininsikan seberapa besar solusi big data, kita akan bekerja berdasarkan komponen inti yang digunakan, arus informasi, keamanan dan lainnya. Arsitektur big data ini akan menjadi referensi dalam merancang infrastruktur big data dengan solusi-solusinya.

Pendahuluan Big data dapat disimpan, diperoleh, diproses dan dianalisa dengan berbagai cara dari berbagai sumber. Big data yang disimpan dan diproses akan juga melibatkan dimensi tambahan (tata kelola, keamanan dan kebijakan).

Tipe Big Data Merancang arsitektur big data merupakan aktivitas yang kompleks. Oleh karena itu, sebelum merancang referensi arsitektur big data, langkah yang paling utama adalah mengidentifikasi apakah skenario bisnis tergolong dalam masalah big data atau bukan.

Tipe Big Data Merancang arsitektur big data dapat diawali dengan mengkategorikan masalah yang telah diidentifikasi ke dalam beberapa tipe. Tujuan mengkategorikan tersebut: untuk menentukan karakteristik masing-masing tipe big data.

Tipe Big Data Tipe big data dapat dikategorikan sebagai berikut: Machine-Generated Data Web and Social Data Transaction Data Human Generated Biometrics

Klasifikasi Karakteristik Big Data berdasarkan Tipe Big Data

Tipe Analisis Analisis Real Time atau Analisis Batch Penting karena mempengaruhi penentuan keputusan terkait produk, perangkat, sumber data dan frekuensi data yang diharapkan.

Tipe Analisis Analisa Real Time adalah Suatu proses analisis yang membutuhkan input secara kontinu, pemrosesan konstan dan output data yang jelas. Spark adalah suatu tool yang baik untuk digunakan dalam pemrosesan real time. Near real-time akan membuat kecepatan penting, namun waktu pemrosesan dalam hitungan menit dapat diterima sebagai pengganti detik. Contoh: Gabungan pengolahan data dan Complete Event Processing (CEP) pada Operational Intelligence. CEP berguna untuk mengidentifikasi peluang di kumpulan data (seperti prospek penjualan) serta ancaman (mendeteksi penyusup di jaringan).

Tipe Analisis Analisa Batch adalah Pemrosesan terkadang membutuhkan waktu berjam-jam atau berhari-hari. Melibatkan 3 (tiga) proses terpisah. Data dikumpulkan dalam jangka waktu tertentu. Data diproses oleh program yang terpisah. Menghasilkan output berdasarkan pengolahan data. Contoh data yang dimasukkan untuk analisis dapat mencakup data operasional, data historis dan arsip, data dari media sosial, data layanan, dll. MapReduce adalah alat yang berguna untuk pemrosesan batch. Contoh penggunaan untuk pemrosesan batch mencakup kegiatan penggajian dan penagihan.

Metodologi Pengolahan Jenis teknik yang akan diterapkan untuk pengolahan data. Metodologi yang dipilih membantu dalam memilih Alat dan Teknik yang sesuai untuk Solusi big data.

Frekuensi dan Ukuran Data Jumlah data dan kecepatan perolehannya. Karakteristik data ini membantu dalam menentukan mekanisme penyimpanan, format dan alat pra-pemrosesan. Ukuran dan Frekuensi bervariasi untuk sumber data yang berbeda: On Demand - Data Media Sosial Continuous Feed / Real Time - Data Cuaca, Data Transaksional Time Series - Data Berbasis Waktu

Tipe Data Jenis Data yang akan diolah. Mengetahui tipe data membantu dalam pemisahan data dalam penyimpanan.

Format Konten Format memberitahu kita tentang bagaimana data yang masuk perlu diproses dan alat dan teknik apa yang harus digunakan. Format bisa berupa Structured (RDBMS) atau Un-Structured (Audio, Video, Images) atau Semi-Structured.

Sumber Data Mengidentifikasi Sumber Data sangat penting dalam menentukan lingkup dari perspektif bisnis. Misalnya. Media Web dan Sosial, mesin yang dihasilkan, buatan manusia dll.

Data Konsumen Daftar kemungkinan konsumen data yang diproses Proses bisnis Pengguna Bisnis Aplikasi Enterprise Individu dalam Berbagai Peran Bisnis Bagian dari proses mengalir Repositori data atau aplikasi enterprise lainnya

Hardware Hardware dimana Big Data Solution akan diimplementasikan Memahami keterbatasan perangkat keras membantu menginformasikan pilihan Big Data Solution

Langkah-Langkah Dasar Merancang Arsitektur Big Data Setalah menganalisa dan mengetahui skenario big data, karakternya dan pola big data di suatu perusahaan, maka kita dapat memulai dengan merancang Referensi Arsitektur Big Data. Langkah-langkahnya terdiri atas 6 dasar langkah yakni: Analyze the Problem Vendor Selection Deployment Strategy Capacity Planning Infrastructure Sizing Backup and Disaster Recovery

Langkah-Langkah Dasar Merancang Arsitektur Big Data

Analyze the Problem Menganalisa apakah kita memerlukan Big Data Solution atau tidak, karakteristik Data dan tipe Big Data Pattern.

Vendor Selection Berdasarkan jenis fungsionalitas yang harus kita capai melalui alat bantu. Ada banyak vendor di pasar dengan berbagai alat yang handal untuk berbagai tugas. Penentuannya diserahkan kepada organisasi dalam menentukan jenis alat yang ingin mereka pilih.

Deployment Strategy Menentukan apakah akan didasarkan pada premis, berbasis awan atau campuran keduanya. Solusi premis cenderung lebih aman, namun pemeliharaan perangkat keras akan menghabiskan banyak uang, usaha dan waktu. Solusi berbasis cloud lebih hemat biaya dalam hal skalabilitas, pengadaan dan perawatan.

Capacity Planning Mengevaluasi ukuran perangkat keras dan infrastruktur berdasarkan faktor-faktor: Volume Data untuk One-Historical Load Volume konsumsi data harian Periode retensi data Replikasi Data untuk Data Penting Periode waktu dimana cluster berukuran, setelah itu cluster diberi skala horizontal Penyebaran Multi Datacenter

Infrastructure Sizing Kesimpulan dari langkah sebelumnya membantu dalam perencanaan infrastruktur seperti jenis perangkat keras yang dibutuhkan. Faktor Penting yang harus dipertimbangkan: Jenis pengolahan Memori atau I / O intensif Jenis Disk Tidak ada disk per mesin Ukuran Memori Ukuran HDD Tidak ada CPU dan core Data disimpan dan disimpan di setiap lingkungan

Backup and Disaster Recovery Bagian perencanaan yang sangat penting Pertimbangan: Kekritisan data yang tersimpan Persyaratan RPO (Recovery Point Objective) dan RTO (Recovery Time Objective) Pemulihan Bencana Aktif-Aktif atau Aktif-Pasif Multi datacenter deployment Interval Cadangan (dapat berbeda untuk berbagai jenis data)