Lecture s Structure. Bagaimana Strukturnya. Data Warehouse Methodology (I) Yudi Agusta, PhD Data Warehouse and Data Mining, Lecture 5

dokumen-dokumen yang mirip
Lecture s Structure. Proses Data Warehouse. Proses Data Warehouse

Data Warehouse (II): Pemodelan Berdimensi (Lanj.) Lecture s Structure. Rekap. Rekap Kuliah Lalu Contoh Rancangan. Rancangan Berdimensi Agregat

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)

Perancangan Basis Data

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut :

BAB I PENDAHULUAN A. Latar Belakang

Lecture s Structure. Desain Data Warehouse (I): Dimensional Modelling. Mendisain Sebuah Data Warehouse

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization


Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6

OLAP - PERTEMUAN 8 OLAP

DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan

BAB I PENDAHULUAN. perusahaan atau organisasi dalam menentukan kebijakan-kebijakan strategis

Kerangka Lecture. Perangkat Keras Komputer. Dasar-Dasar Pemrosesan Komputer, Database & Komunikasi Data

BAB IV PERANCANGAN SISTEM

BAB III LANDASAN TEORI

BAB 4 PERANCANGAN DAN IMPLEMENTASI

BAB 2 LANDASAN TEORI. Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada

FAST berarti sistem ditargetkan untuk memberikan response terhadap user dengan secepat mungkin, sesuai dengan analisis yang dilakukan.

PERTEMUAN 2 DBMS & PERANCANGAN BASIS DATA

DATABASE. Basis Data : Suatu pengorganisasian sekumpulan data yang saling terkait sehingga

Data Warehouse, Data Mart, OLAP, dan Data Mining. arifin, sistem informasi - udinus 1

BAB II TINJAUAN PUSTAKA

6.2 Pendekatan Database Untuk Pengelolaan Data

Adapun karakteristik umum yang dimiliki datawarehouse adalah :

BAB III METODE PENELITIAN

PERKEMBANGAN BASIS DATA SAAT INI

MIGRASI BASIS DATA SISTEM INFORMASI AKADEMIK ITS

3.5 Arsitektur Data Warehouse Data Source Data Warehouse Surveilans Terpadu Penyakit (STP) kabupatenbantul

Database dan DBMS DBMS adalah perangkat lunak sistem yang memungkinkan para pemakai membuat, memelihara, mengontrol, dan mengakses basis data dengan

BAB 2 LANDASAN TEORI

Sistem Pendukung Keputusan. Komponen SPK. Entin Martiana, S.Kom, M.Kom. Politeknik Elektronika Negeri Surabaya

PROSES EXTRACT, TRANSFORM DAN LOAD PADA DATA WAREHOUSE

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

berpengaruh pada waktu query dan besarnya data.

PROSES PERANCANGAN DATABASE

Knowledge Module pada Oracle Data Integrator (ODI)

BAB 4 IMPLEMENTASI DAN EVALUASI. dirancang maka langkah selanjutnya adalah mengimplementasikan data. tahapan implementasi dan waktu yang dibutuhkan:

PERANCANGAN DATA WAREHOUSE UNTUK DEMOGRAFI, PERKEMBANGAN PRODUK DAN PROMOSI PADA MANDIRI TABUNGAN RENCANA DI PT.BANK MANDIRI(PERSERO) TBK.

Teknik Informatika Universitas Pasundan. Caca E. Supriana, S.Si.,MT.

Obyektif : Mahasiswa dapat mengerti dan memahami konsep perancangan basis data Mahasiswa dapat merancang basis data sesuai dengan fase-fasenya

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. satu hal yang sangat dominan dan terjadi dengan sangat pesat. Informasi

PERANCANGAN DATA WAREHOUSE CALON MAHASISWA BARU POLITEKNIK NEGERI LHOKSEUMAWE

DATAWAREHOUSE. Sukarsa:Pasca Elektro Unud. I Made Sukarsa

BAB 4 IMPLEMENTASI DAN EVALUASI. digunakan untuk mendukung implementasi data warehouse yang telah

DATA WAREHOUSE USULAN PEMANFAATAN DATA WAREHOUSE UNTUK SISTEM IRIGASI OTOMATIS PADA DESA KELATING, KERAMBITAN, TABANAN

Pemrosesan data sebelum adanya basis data Perancangan sistemnya masih didasarkan pada kebutuhan individu pemakai, bukan kebutuhan sejumlah pemakai

SUMBER DAYA-SUMBER DAYA SISTEM INFORMASI (BAGIAN 1) PSI Materi III Sesi 6

BAB II TINJAUAN PUSTAKA. yang akan dibuat adalah sebagai berikut : Sistem Monitoring Pertumbuhan Balita Berbasis Web. Wahyuningsih

BAB I PENDAHULUAN. Berkembangnya teknologi dan informasi saat ini telah menghasilkan kumpulan

BAB II LANDASAN TEORI. seorang pimpinan atau manajer didalam organisasi untuk mencapai tujuan

BAB I PENDAHULUAN Latar Belakang

SISTEM MANAJEMEN DATABASE

BAB 2 LANDASAN TEORI

Pertemuan XII Distributed Database Fak. Teknik Jurusan Teknik Informatika. Caca E. Supriana, S.Si.,MT.

BAB 4 IMPLEMENTASI DAN EVALUASI DATA WAREHOUSE

Pengenalan Database 1

ANALISA DATA TRANSAKSIONAL PADA E-COMMERCE DENGAN TEKNOLOGI OLAP (ON-LINE ANALYTICAL PROCESS)

Tugas. Data Warehouse. OLAP, Operasi OLAP, dan Jenis Rolap

Rancang Bangun Data Warehouse

BAB 1 PENDAHULUAN. tersedianya informasi yang sesuai, dibutuhkan data warehouse yang berisi data

Perancangan Data Warehouse pada Perpustakaan. STMIK AMIKOM Yogyakarta

UKDW BAB I PENDAHULUAN


BAB 4 4 PEMBAHASAN. implementasi program, dan evaluasi. Analisis lanjutan berisi analisis dari waktu ETL,

PROSES PERANCANGAN BASIS DATA

BAB 2 LANDASAN TEORI. pengolahan data, pengolahan gambar, pengolahan angka, dan lainnya.

BAB I PENDAHULUAN. 1.1 Latar Belakang

[Data Warehouse] [6/C2 & 6/D2]

6/26/2011. Database Terdistribusi. Database Terdesentralisasi

BAB III METODOLOGI PENELITIAN. permasalahan yang diambil dalam penelitian. Dibagian ini juga dijelaskan alat dan

TSI Perbankan REPLIKASI


Administrasi Basis Data. Transaksi dan Lock. Yoannita

UNIVERSITAS BINA NUSANTARA PERANCANGAN DATA WAREHOUSE PENJUALAN PADA PT ISTANA KEMAKMURAN MOTOR (HONDA DAAN MOGOT)

Pengantar Komputer Universitas Gunadarma PENGANTAR DATABASE. Disusun Oleh : Dr. Lily Wulandari

Sistem Basis Data Lanjut DATA WAREHOUSE. Data Warehouse 1/20

ARSITEKTUR SISTEM. Alif Finandhita, S.Kom, M.T. Alif Finandhita, S.Kom, M.T 1

LANDASAN TEORI. Sebelum dikenal database, penyimpanan data menggunakan pendekatan

PEMBANGUNAN DATA MART UNTUK FAKTA PENGUNJUNG RAWAT JALAN PADA RS TELOGOREJO SKRIPSI

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DAN EVALUASI. tugas-tugas yang akan dilakukan dalam tahap implementasi. Berikut penjadwalan. Gambar 4.1 Gambar Jadwal Implementasi

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat

Pengantar Teknologi. Informasi (Teori) Minggu ke-07. Basis Data. Oleh : Ibnu Utomo WM, M.Kom UNIVERSITAS DIAN NUSWANTORO FAKULTAS ILMU KOMPUTER

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 I PENDAHULUAN. terbarukan untuk mengelola dan mengolah data tersebut. Perkembangan database

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN YAYASAN LENTERA INSAN

PERTEMUAN 13 STRATEGI PENGUJIAN PERANGKAT LUNAK

PERANCANGAN DAN PEMBANGUNAN INTELIGENSI BISNIS PADA PERUSAHAAN ASURANSI PENSIUN XYZ TUGAS AKHIR

BAB III METODOLOGI PENELITIAN

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK

BAB III LANDASAN TEORI. waktu berdasarkan rencana pengaturan urutan kerja, daftar atau tabel kegiatan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti

The Design of Warehouse Data Structure to Support Product Marketing Plan Using Star Schema

perkembangan yang diraih, namun ada juga kegagalan dan ketidakstabilan pada masingmasing Database Engine. Database yang bekerja 24 jam dan yang memili

Transkripsi:

Data Warehouse Methodology (I) Yudi Agusta, PhD Data Warehouse and Data Mining, Lecture 5 Copyright Yudi Agusta, PhD 2006 Lecture s Structure Teknik Data Warehouse Pengidentifikasian Keperluan Pengambilan, Transformasi dan Penyimpanan Data Arsitektur Warehouse (Overview) Teknologi dan Alatnya Belakangan Perancangan Database secara Fisik Policy untuk operasional Metode data warehousing (Kuliah selanjutnya) Mengimplementasikan teknik melalui life-cycle Bagaimana Strukturnya 1

Bagaimana Strukturnya Bagaimana Strukturnya Bagaimana Strukturnya 2

Bagaimana Strukturnya Bagaimana Strukturnya Pengidentifikasian Keperluan Suatu hal yang sangat sulit Keperluan pengguna Ketersediaan data Laporan yang sudah ada dapat ditiru Wawancara dengan pengguna Pekerjaan menerka secara intelligent oleh analis yang berilmu Sekali sistem dibangun maka semua jenis keperluan akan muncul Feedback sangat diperlukan 3

Pengambilan, Transformasi dan Penyimpanan Data Sebagian besar usaha, waktu dan biaya muncul di sini Tool ETL untuk pengambilan, transformasi dan penyimpanan sudah dipasarkan tapi sedikit yang memakai Untuk ETL yang dirancang sendiri, secara rata-rata untuk setiap data warehouse (menurut survey): Pengambilan 16 program/875 baris per program Transformasi 12 program/741 baris per program Pengecekan integritas 9 program/522 baris per program Mengidentifikasikan data yang berubah sangat sulit Disebut dengan Changed Data Capture (CDC) Banyak yang melakukan refresh lengkap Pengambilan Data Produksi Pengambilan utama Memerlukan data dengan format yang sudah ada Mengidentifikasikan records baru dan yang sudah berubah Mengeneralisasikan kunci untuk mengubah dimensi Mentransformasikan ke load record image Migrasi dari sistem yang sudah ada ke sistem data warehouse Pengambilan Data Produksi Melakukan sorting dan membangun agregat Mengeneralisasikan kunci untuk agregat Menyimpan dan melakukan indexing Perkecualian proses Menjamin integritas keterkaitan Jaminan kualitas Mempublikasikan 4

Pengambilan Data Utama Memerlukan koneksi fisik untuk sistem sumber Keamanan FTP Manajemen pergerakan volume data dalam jumlah besar Memerlukan definisi format yang sudah ada dan pengertian bagaimana sistem tersebut bekerja Contoh Produk ETL Ardent (Informix) DataStage SAS Warehouse Administrator Microsoft DTS Services Systemfabrik s Warehouse Workbench DataJunction Fasilitas Pada Produk ETL Umum Manajemen Meta Data Akses ke sumber data dengan jenis yang berbeda Konfigurasi/tool perancangan yang berorientasi grafik Objek umum untuk SQL, proses, keputusan, sumber data, target data, error, laporan pengecualian Fasilitas perencanaan kerja Sebagian besar berbasis server dengan range menengah (NT/200, Unix/Linux, Solaris dll) 5

Metode untuk Change Data Capture (CDC) Membaca database transaction logs Modifikasi aplikasi untuk menulis perubahan dan untuk mengubah file Melakukan scanning database untuk memberikan waktu Membandingkan potret database Penduplikasian data Arsitektur Warehouse Opsi Utama: Data Warehouse Perusahaan Data Mart yang mempunyai ketergantungan Data Mart yang berdiri sendiri Arsitektur Bis Data Warehouse Perusahaan Sumber data terpusat Besar dalam hal scope dan terkadang ukuran Mengoptimalkan proses pengambilan Memaksimalkan keuntungan pengintegrasian Cara pandang pengguna Sulit untuk memenuhi keperluan kelompok pengguna yang berbeda Proyek sering gagal 6

Data Warehouse Perusahaan Data Mart Yang Tergantung Sebagian dari data diambil dari data warehouse perusahaan dan diorganisasikan untuk memenuhi keperluan bisnis dan aplikasi Umumnya data warehouse perusahaan dalam bentuk 3NF Data Mart di-de-normalisasikan OLAP sebagai contohnya Dalam kenyataannya, sulit untuk mendapatkan semua data yang diperlukan dari penyimpan data perusahaan Pendekatan paling umum (secara teori) Data Mart Yang Tergantung 7

Data Mart Yang Berdiri Sendiri Banyak data warehouse kecil di berbagai tempat Umumnya mengikuti pendekatan berdimensi Kurang integrasi Tidak konsisten Duplikasi sumber data Hal yang paling menyulitkan Tapi bisa digunakan Masalahnya adalah dalam jangka waktu menengah maupun panjang Data Mart Yang Berdiri Sendiri Data Mart Federal Seperti data mart yang berdiri sendiri, mereka ada di berbagai tempat, tetapi Mempunyai area untuk data staging yang bisa dishare Manajemen yang lebih bagus untuk proses ETL Kuncinya adalah manajemen meta data Ini adalah rekomendasi Kimball Arsitektur Bis 8

Data Mart Federal Rancangan Database Fisik Perlu untuk dipikirkan: Standar Lokasi file secara fisik Volume data Index, agregat, dan detail data Kelangkaan data Konfigurasi disk Pola penggunaan Jumlah dan distribusi pengguna Frekuensi update Kemampuan pengembangan Data, penggunaan dan query Aspek Untuk Rancangan Fisik Manajemen buffer Keparalelan Pemrosesan data load Pemrosesan query SMP, MMP, NUMA Partisi Indexing B-Tree Bitmapped Hash Index 9

Partisi Tidak didukung oleh semua RDBMS Kimball merekomendasikan partisi berdasarkan tanggal (Kimball et al (1998) p.599) Maintenance penanggulangan karena hanya data yang terkini yang perlu untuk diload dan aktif Membantu performance karena segmen tabel yang lebih kecil yang diakses saat menjalankan query Dapat menyebabkan masalah saat menjalankan query lintas partisi (tidak direkomendasikan oleh semua) B-Tree Index Tipe index yang paling banyak digunakan dalam sistem RDBM Item ditambahkan ke index tree satu persatu Cocok untuk pengambilan satu item (seperti dalam lingkungan transaksi) Di dalam data warehouse, sistem ini cocok untuk item yang merupaka item utama seperti product_key atau custormer_key Memerlukan banyak space dan waktu untuk membuat Bitmapped Index Sekumpulan bits mewakili setiap nilai yang memungkinkan dalam sebuah kolom Melihat dengan membandingkan bit-wise vector Sangat cepat Hanya diimplementasikan pada produk RDBMS utama belakangan ini Sebenarnya sudah berumur lama Cocok untuk data yang bukan merupakan item utama Jenis kelamin (M/F/Tidak Diketahui) 3 bits Laki-laki 100, Wanita 010, Tidak Diketahui 001 10

Contoh Index Policy Operasional Manajemen dengan ritme harian untuk data load dan query Policies untuk semua hal yang berbeda yang dapat menjadi masalah dalam proses data load Data warehouse sebagai sistem yang amburadul Manajemen untuk performance query Mengatur indes, agregat, partisi dll untuk memastikan waktu respon yang baik 11