Pemodelan Data Warehouse

dokumen-dokumen yang mirip
[Data Warehouse] [6/C2 & 6/D2]

Data Warehouse dan Decision Support System. Arif Basofi

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)

Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6

DATAWAREHOUSE. Sukarsa:Pasca Elektro Unud. I Made Sukarsa

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti

BAB 2 LANDASAN TEORI. Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut:

6/26/2011. Menurut W.H. Inmon dan Richard D.H. Menurut Vidette Poe

[Data Warehouse] [6/C2 & 6/D2]


[Data Warehouse] [6/C2 & 6/D2]

BAB II. LANDASAN TEORIse. Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah

Data Warehouse, Data Mart, OLAP, dan Data Mining. arifin, sistem informasi - udinus 1

BAB 2 LANDASAN TEORI. berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5).

Membangun Data Warehouse

DATA WAREHOUSE PERTEMUAN I S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Datawarehouse dan OLAP (Overview) Diambil dari presentasi Jiawei Han

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat

BAB III LANDASAN TEORI

Data Warehousing dan Decision Support

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI. Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

BAB 2 LANDASAN TEORI

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

DATAMULTIDIMENSI. DATAWAREHOUSE vs DATAMART FIRDAUS SOLIHIN UNIVERSITAS TRUNOJOYO

BAB 2 LANDASAN TEORI

Data Warehouse dan Data Mining Oleh : Asep Jalaludin,S.T.,M.M.

Data Warehouse dan Data Minig. by: Ahmad Syauqi Ahsan

BAB 2 LANDASAN TEORI

BAB 2 2 LANDASAN TEORI. Menurut Inmon (2002, p388), data adalah rekaman dari fakta-fakta, konsepkonsep,

BAB 2 LANDASAN TEORI

MINI PROJECT - 4. Kelompok 4 : Kecerdasan Bisnis (Kelas B)

BAB 2 LANDASAN TEORI

BAB IV PERANCANGAN SISTEM

BAB 2 LANDASAN TEORI. kebutuhan informasi suatu perusahaan. komputer secara sistematis. menggunakan database SQL Server 2000.

BAB II TINJAUAN PUSTAKA

ANALISA DATA TRANSAKSIONAL PADA E-COMMERCE DENGAN TEKNOLOGI OLAP (ON-LINE ANALYTICAL PROCESS)

INTRODUCTION OF DATA WAREHOUSE. Presented by HANIM M.A M. IRWAN AFANDI.

Adapun karakteristik umum yang dimiliki datawarehouse adalah :

MANFAAT DATA WAREHOUSE PADA PT ABC

Aplikasi Database. Budi Susanto Teknik Informatika UKDW Yogyakarta Semester Genap Thn Ajaran 2010/2011. teknik informatika UKDW Yogyakarta

UNIVERSITAS BINA NUSANTARA. Fakultas Ilmu Komputer Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil Tahun 2007 / 2008

MEMBANGUN DATA WAREHOUSE

BAB II TINJAUAN PUSTAKA

PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN UNIVERSITAS NASIONAL

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI. membantu mengambil keputusan di lingkungan perusahaan.


KARAKTERISTIK DATA WAREHOUSE

BAB 2 LANDASAN TEORI

Analisis Data dengan Menggunakan ERD dan Model Konseptual Data Warehouse

BAB 2 LANDASAN TEORI. data, DBMS, dan data mart, hal hal diatas dapat menjelaskan secara mendasar

Physical Modeling of Data Warehouse using Unified Modeling Language (UML) Muhammad Iqbal Dzulhaq Dendy Jonas Rudi Triwibowo

BAB 2 LANDASAN TEORI

FAST berarti sistem ditargetkan untuk memberikan response terhadap user dengan secepat mungkin, sesuai dengan analisis yang dilakukan.

BAB 2 LANDASAN TEORI

Perancangan Data Warehouse

OLAP - PERTEMUAN 8 OLAP

BAB II LANDASAN TEORI. Dasar-dasar teori tersebut akan digunakan sebagai landasan berpikir dalam

LANDASAN TEORI. Sebelum dikenal database, penyimpanan data menggunakan pendekatan

BAB 2 LANDASAN TEORI. informasi adalah bagaimana data tersebut diartikan dan dimengerti oleh

BAB III LANDASAN TEORI Akreditasi Nasional Perguruan Tinggi dan Program Studi

Lecture s Structure. Desain Data Warehouse (I): Dimensional Modelling. Mendisain Sebuah Data Warehouse

BAB 2 LANDASAN TEORI. logically related data, and a description of this data, designed to meet the information

BAB 2 LANDASAN TEORI

UNIVERSITAS BINA NUSANTARA

Perancangan Data Warehouse pada Perpustakaan. STMIK AMIKOM Yogyakarta

BAB 2 LANDASAN TEORI. subject-oriented, integrated, time-variant, and non-volatile collection of data in

Bab 3 Metode dan Perancangan Sistem

BAB 2 LANDASAN TEORI. 2.1 Teori Umum Pengertian Data

BAB 2 LANDASAN TEORI

TUGAS DATA WAREHOUSE & DATA MINING OLAP, OPERASI OLAP & MOLAP

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI

Penerapan Slowly Changing Dimensions untuk Mendukung Pembentukan Dimensi Dinamis pada Data Warehouse

BAB II KONSEP DATA WAREHOUSING

BAB I PENDAHULUAN. memanfaatkan teknologi informasi, perusahaan dapat menjalankan proses bisnis dengan

BAB I PENDAHULUAN. perusahaan saling bersaing dalam meningkatkan produktivitas dan kinerja dari

BAB 1 PENDAHULUAN 1.1 Latar Belakang 1.2 Ruang Lingkup

BAB I PENDAHULUAN. I.1 Pendahuluan

DATABASE. Basis Data : Suatu pengorganisasian sekumpulan data yang saling terkait sehingga

PERKEMBANGAN BASIS DATA SAAT INI

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI. descriptions of things, events, activities, and transactions, that are captured,

PERANCANGAN DATA WAREHUSE PADA PERPUSTAKAAN STMIK AMIKOM YOGYAKARTA. Armadyah Amborowati Dosen STMIK AMIKOM Yogyakarta

BAB 2 LANDASAN TEORI

Basis Data Oracle - Business Intelligence System. Ramos Somya, M.Cs.

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK

Perancangan Basis Data

BAB 2 LANDASAN TEORI

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Program Studi Strata-1 Skripsi Sarjana Komputer Semester Ganjil Tahun 2006/2007

BAB 2 LANDASAN TEORI

Database dan DBMS DBMS adalah perangkat lunak sistem yang memungkinkan para pemakai membuat, memelihara, mengontrol, dan mengakses basis data dengan

BAB I PENDAHULUAN Latar Belakang

Transkripsi:

Pemodelan Data Warehouse Budi Susanto Teknik Informatika Universitas Kristen Duta Wacana Yogyakarta 10/31/11 budi susanto 1

Tujuan Memahami konsep dasar data warehouse Memahami pemodelan berbasis dimensi 10/31/11 budi susanto 2

Pengantar Data warehouse mendukung keputusan bisnis dengan cara mengumpulkan, mengkonsolidasikan, dan mengorganisasikan data untuk pelaporan dan analisis. Tool yang digunakan: OLAP dan Data Mining Walaupun data warehouse dibangun di atas database relasional, perancangannya harus berbeda dari database transaksional. 10/31/11 budi susanto 3

Data Warehouse vs OLTP Data Warehouse OLTP Dirancang untuk analisis ukuran bisnis Dioptimalkan untuk load data yang besar, kompleks, query yang tidak terprediksi. Dirancang untuk operasi bisnis real-time dioptimalkan untuk sekumpulan transaksi, pada umumnya CRUD. Diisi dengan data yang sudah konsisten Dioptimalkan untuk data yang masuk dan valid, tidak memerlukan validasi real selama transaksi, menggunakan validasi time terhadap data. Mendukung beberapa pemakai dari sistem OLTP mendukung banyak sekali user. 10/31/11 budi susanto 4

Mengapa data warehouse? Tanpa data warehouse untuk menyimpan informasi historical, data disimpan di media statik atau di akumulasikan di database OLTP. Jika data tersedia untuk cadangan, data tersebut tidak dapat digunakan untuk analisis dan pembuatan keputusan. Jika data diakumulasikan di database OLTP, maka akan membebani biaya query yang semakin lama semakin besar. 10/31/11 budi susanto 5

Mengapa data warehouse? Query dapat menjadi sangat komplek terkait dengan skema database OLTP. Dengan pengorganisasian dan konsolidasi ke data warehouse: memungkinkan OLTP tetap dapat berjalan untuk transaksi yang tinggi. Query yang digunakan untuk analisis dapat lebih efisien dan sederhana. 10/31/11 budi susanto 6

OLAP OLAP dirancang untuk menyediakan kinerja yang baik untuk query business intelligent. OLAP mengorganisasikan data ke dalam kubus multidimensi. OLAP tidak dirancang untuk menyimpan data biner/teks yang besar. 10/31/11 budi susanto 7

Data Mining (DM) DM merupakan teknologi yang menerapkan algoritma yang komplek dan tepat untuk analisis dan menemukan informasi untuk pengambil keputusan. OLAP mengorganisasikan data dalam suatu model yang sesuai untuk analisis, sedangkan DM melakukan analisis data dan menyediakan hasilnya. OLAP mendukung model-driven analysis, dan DM mendukung data-driven analysis. 10/31/11 budi susanto 8

Tujuan Arsitektur Data Warehouse Data warehouse harus dirancang untuk memenuhi kebutuhan: Memberikan pengalaman yang cukup penting kepada user. Tidak perlu mengganggu OLTP Menyediakan tempat penyimpanan data yang konsisten secara terpusat Menjawab query komplek secara cepat. Menyediakan berbagai tool analisis, seperti OLAP dan Data Mining. 10/31/11 budi susanto 9

Arsitektur DW 10/31/11 budi susanto 10

Karakteristik Data Warehouse Di dasarkan pada model dimensi Berisi data historis Berisi data detil maupun ringkasan. Mengkonsolidasikan pemisahan data dari berbagai sumber selagi menjaga konsistensi Fokus pada subjek tunggal, seperti penjualan, inventori, atau keungan. 10/31/11 budi susanto 11

Pemakai Data Warehouse 10/31/11 budi susanto 12

Pengembangan Data Warehouse Identifikasi kebutuhan Perancangan model dimensional Pengebangan arsitektur, termasuk Operational Data Store (ODS) Perancangan relational database dan OLAP Pengembangan aplikasi pemelihara data Pengembangan aplikasi analisis Pengujian dan pemasangan sistem 10/31/11 budi susanto 13

Identifikasi Kebutuhan Pahami bisnis sebelum diskusi dengan pemakai Interview dan bekerja dengan pemakai Temukan informasi apa yang mereka butuhkan Pemakai harus bekerja satu tim perancangan Interview dengan pakar data untuk menemukan data yang sudah ada dan dimana Komunikasikan dengan pemakai sesering mungkin. 10/31/11 budi susanto 14

Perancangan Model Dimensional Model harus memenuhi kebutuhan pemakai dan mudah digunakan Mudah untuk dipelihara Harus dapat diterapkan di relational database yang mendukung OLAP Model dimensional biasanya menggunakan star atau snowflake. 10/31/11 budi susanto 15

Model Dimensional Model yang terdapat tabel fact dan tabel dimensi. Tabel fact berisi transaksi historis Tabel dimensi berisi penjelasan dari fact. Dua skema Skema star Skema Snowflake 10/31/11 budi susanto 16

Denormalisasi Lawan dari Normalisasi. Digunakan untuk membuat model data warehouse Biasanya mencoba untuk melakukan granularity terbalik. 10/31/11 budi susanto 17

many-to-many Denormalisasi 3NF 10/31/11 budi susanto 18

Denormalisasi 3NF Penggabungan atribut dalam tabel terpisah 10/31/11 budi susanto 19

Transitif Dependence Denormalisasi 3NF 10/31/11 budi susanto 20

Derived Value Denormalisasi 3NF 10/31/11 budi susanto 21

Trik Denormalisasi Pisahkan antara data aktif dan nonaktif. Copy field antar tabel. Field-field ringkasan diletakkan pada tabel induk. Pisahkan field yang jarang dan sering diakses. Efek dari pemisahan data aktif dan nonaktif. 10/31/11 budi susanto 22

Contoh Copy field antar tabel 10/31/11 budi susanto 23

Field-field ringkasan 10/31/11 budi susanto 24

Sebelum Denormalisasi 10/31/11 budi susanto 25

Setelah Denormalisasi 10/31/11 budi susanto 26

Latihan Denormalisasi Dari 3NF ke 0NF Seorang pelanggan dapat memiliki beberapa nomor telepon CUSTOMER (CustomerId, CustomerName,...) CUST_PHONE (CustomerId, Phone) Bentuk denormalisasi? 10/31/11 budi susanto 27

Latihan Denormalisasi Dari 3NF ke 2NF CUSTOMER(CustomerId, CustomerName) ORDER (OrderId, OrderDate, DeliveryDate, Amount, CustomerId) ORDERLINE (OrderId, ItemId, QtyOrdered, OrderPrice) ITEM (ItemId, ItemDescription, CurrentPrice) Bentuk denormalisasi? 10/31/11 budi susanto 28

Latihan Denormalisasi Dari 3NF ke 2NF SALESPERSON (SalespersonId, SalespersonName,...) ORDER (OrderId, OrderDate, DeliveryDate, Amount, SalespersonId) Bentuk denormalisasi? 10/31/11 budi susanto 29

Surrogate Key dan Constraint di DW Surrogate key pada DW model mungkin akan semakin banyak digunakan. Referential integrity masih tetap dibutuhkan dalam pemodelan DW. 10/31/11 budi susanto 30

Skema Star 10/31/11 budi susanto 31

Skema Snowflake 10/31/11 budi susanto 32

Star atau Snowflake Perbedaannya hanya di penerapan fisiknya. Skema snowflake mendukung pemeliharaan dimensi yang lebih mudah. Star lebih mudah diakses pemakai dan mendukung query yang lebih sederhana dan efisien. Lebih baik membuat versi star dari snowflake untuk mempresentasikan kepada pemakai. 10/31/11 budi susanto 33

Tabel Dimensi Membungkus atribut yang teraosiasi dengan fact dan memisahkan atribut-atribut ini ke dalam kelompok berbeda secara logika Contoh: waktu, geografi, produk, konsumen. Sebuah tabel dimensi dapat digunakan di beberapa tabel fact (skema). Disebut conforming dimension. Jika atribut dimensi sering di update, maka lebih baik dibuat dimensi snowflake. 10/31/11 budi susanto 34

Tabel Dimensi Data dalam dimensi biasanya hirarki. Hirarki ditentukan oleh kebutuhan bisnis. Contoh: Dimensi waktu berisi hirarki: (all time), Tahun, Kuartal, Bulan, hari OLAP tool tergantung pada hirarki untuk mengelompokan data. 10/31/11 budi susanto 35

Dimensi Waktu dan Tanggal Granularity Waktu Sebuah dimensi tanggal dengan satu record per hari sudah cukup jika tidak dibutuhkan rincian yang lebih detil (granularity fine) dari 1 hari. Tabel dimensi waktu terpisah harus dibentuk jika detil waktu diperlukan, contoh: menit/detik. Antara tanggal dan waktu lebih baik dipisahkan dalam dimensi yang berbeda. 10/31/11 budi susanto 36

Latihan! 10/31/11 budi susanto 37

Skenario Pabrik roti Sarapan adalah perusahan pembuatan roti yang berlokasi di Sleman Yogyakarta. Produk-produk rotinya dijual di seluruh kabupaten di Yogyakarta. Pabrik ini memiliki unit penjualan di kota Wonosari, Kota Yogyakarta, dan Sleman. Direksi ingin informasi penjualan. 10/31/11 budi susanto 38

Informasi Penjualan Jumlah penjualan dari waktu ke waktu. Jumlah item yang dijual untuk setiap produk dan waktu. 10/31/11 budi susanto 39

Informasi Penjualan Jumlah penjualan per item di tiap kota untuk setiap waktunya. 10/31/11 budi susanto 40

Informasi Penjualan Jumlah penjualan item dan pendapatan tiap area untuk setiap item produk dan waktu. 10/31/11 budi susanto 41

Ukuran Penjualan dan Dimensi Ukuran Unit terjual Jumlah Dimensi Produk Waktu Area 10/31/11 budi susanto 42

Model Dimensi 10/31/11 budi susanto 43