Data Warehouse & Data Mining STMIK GLOBAL

dokumen-dokumen yang mirip
Datawarehouse dan OLAP (Overview) Diambil dari presentasi Jiawei Han

Data warehouse dan OLAP (Overview) Diambil dari presentasi Jiawei Han / Chirayu Versi dok: 0.8/ Sept 14

Pengantar Data Warehouse dan OLAP

DESAIN WAREHOUSE FIRDAUS SOLIHIN UNIVERSITAS TRUNOJOYO LANGKAH MEMBANGUN WAREHOUSE

Data Warehouse dan Decision Support System. Arif Basofi

Pengantar Data Warehouse dan OLAP

DATABASE DAN DATA WAREHOUSE. Pertemuan 06 2 SKS

INTRODUCTION OF DATA WAREHOUSE. Presented by HANIM M.A M. IRWAN AFANDI.

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)

Data Warehouse dan Data Mining Oleh : Asep Jalaludin,S.T.,M.M.

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

PERTEMUAN 14 DATA WAREHOUSE

Lecture s Structure. Desain Data Warehouse (I): Dimensional Modelling. Mendisain Sebuah Data Warehouse

DATA WAREHOUSE PERTEMUAN I S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM

Data Warehousing dan Decision Support

BAB II LANDASAN TEORI


Pembuatan Aplikasi OLAP Untuk Pelaporan pada PT. Aneka Tuna Indonesia Menggunakan SQL Server 2005

6/26/2011. Menurut W.H. Inmon dan Richard D.H. Menurut Vidette Poe

Arsitektur Data Warehouse. Minggu 4

BAB II. LANDASAN TEORIse. Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah

UNIVERSITAS BINA NUSANTARA. Jurusan Sistem Informasi Skripsi Sarjana Komputer Semester Genap 2004 / 2005

[Data Warehouse] [6/C2 & 6/D2]

Basis Data Oracle - Business Intelligence System. Ramos Somya, M.Cs.

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization

BAB II LANDASAN TEORI

DATAWAREHOUSE. Sukarsa:Pasca Elektro Unud. I Made Sukarsa

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

PERKEMBANGAN BASIS DATA SAAT INI

BAB I PENDAHULUAN. I.1 Pendahuluan

MENENTUKAN KEBUTUHAN BISNIS

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti

BAB 2 LANDASAN TEORI. kebutuhan informasi suatu perusahaan. komputer secara sistematis. menggunakan database SQL Server 2000.

[Data Warehouse] [6/C2 & 6/D2]

PERANCANGAN DATA WAREHOUSE PENGOLAHAN PERSEDIAAN BUKU PT. GRAMEDIA ASRI MEDIA MAKASSAR

FAST berarti sistem ditargetkan untuk memberikan response terhadap user dengan secepat mungkin, sesuai dengan analisis yang dilakukan.

BAB 2 LANDASAN TEORI. Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut:

S1 Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Maranatha

BAB II LANDASAN TEORI. Dasar-dasar teori tersebut akan digunakan sebagai landasan berpikir dalam

BAB II KONSEP DATA WAREHOUSING

Tugas Akhir (KI091391) Muhamad Adi Prasetyo


KARAKTERISTIK DATA WAREHOUSE

DATAWAREHOUSE FIRDAUS SOLIHIN UNIVERSITAS TRUNOJOYO. DATA dlm suatu ORGANISASI

UNIVERSITAS BINA NUSANTARA

Analisis Data dengan Menggunakan ERD dan Model Konseptual Data Warehouse

BAB 2 LANDASAN TEORI

BAB III LANDASAN TEORI

BAB 2 LANDASAN TEORI. berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5).

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Program Studi Strata-1 Skripsi Sarjana Komputer Semester Ganjil Tahun 2006/2007

Pemodelan Data Warehouse

Arsitektur Data Warehouse. Minggu 4

BAB 2 LANDASAN TEORI. informasi yang mentah atau kumpulan dari fakta yang masih harus diproses agar

OLAP - PERTEMUAN 8 OLAP

Pertemuan 8a. Manajemen Basis Data. Penerapan Komputer KOM Bogor Agricultural University

BAB 2 LANDASAN TEORI

Perancangan Data Warehouse

IN086 Temu Pengetahuan

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

BAB 2 2 LANDASAN TEORI. Menurut Inmon (2002, p388), data adalah rekaman dari fakta-fakta, konsepkonsep,

Perancangan Basis Data

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat

UNIVERSITAS BINA NUSANTARA ANALISIS DAN PERANCANGAN DATA WAREHOUSE PEMBELIAN DAN PENJUALAN PADA PT. SINAR MEADOW INTERNATIONAL INDONESIA

Physical Modeling of Data Warehouse using Unified Modeling Language (UML) Muhammad Iqbal Dzulhaq Dendy Jonas Rudi Triwibowo

BAB 2 LANDASAN TEORI

Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6

PENDAHULUAN TINJAUAN PUSTAKA

ANALISA PERBANDINGAN DATA WAREHOUSE DENGAN SKEMA STAR DAN SNOWFLAKES (STUDI KASUS: AKADEMIK IT TELKOM)

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

MINI PROJECT - 4. Kelompok 4 : Kecerdasan Bisnis (Kelas B)

Data Warehouse, Data Mart, OLAP, dan Data Mining. arifin, sistem informasi - udinus 1

BUSINESS INTELLIGENCE. Management Database & Informasi

BAB 2 LANDASAN TEORI. Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada

Analisis Data Minimarket dengan Menggunakan ERD dan Model Konseptual Data Warehouse

DATA WAREHOUSE (The Building Blocks)

DESAIN DATAWAREHOUSE AKADEMIK UNTUK MENDUKUNG SISTEM ADMINISTRASI DATA AKADEMIK DI UNIVERSITAS TADULAKO. Mohammad Yazdi 1

DATAMULTIDIMENSI. DATAWAREHOUSE vs DATAMART FIRDAUS SOLIHIN UNIVERSITAS TRUNOJOYO

BAB 2 LANDASAN TEORI

MENGENAL DATA WAREHOUSE

[Data Warehouse] [6/C2 & 6/D2]

PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN UNIVERSITAS NASIONAL

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK

ANALISA DATA TRANSAKSIONAL PADA E-COMMERCE DENGAN TEKNOLOGI OLAP (ON-LINE ANALYTICAL PROCESS)

PERANCANGAN DATA WAREHOUSE DENGAN PENDEKATAN ENTERPRISE ARCHITECTURE (STUDI KASUS: PT. TELEKOMUNIKASI INDONESIA Tbk.)

ABSTRAK. Kata Kunci: ETL, Data Warehouse, Visualisasi Data, Bagan. Universitas Kristen Maranatha

BAB 2 LANDASAN TEORI

DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Program Studi Strata-1 Skripsi Sarjana Komputer Semester Genap Tahun 2005/2006

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Genap tahun 2005/2006

Kegunaan Data Warehouse

BAB 2 LANDASAN TEORI. Menurut Thomas Connolly dan Carolyn Begg (2010, p65), database adalah

BAB 2 LANDASAN TEORI

Achmad Yasid, S.Kom

Perkembangan Teknologi Database

Transkripsi:

Data Warehouse & Data Mining STMIK GLOBAL

Tanpa Data Warehouse Dengan Data Warehouse

Multiple Report tanpa/ dengan Data Warehouse

teknologi yang ada di data warehouse dan OLAP (On-Line Analytical Processing) dimanfaatkan penuh untuk melakukan data mining

Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis guna mendukung DSS (Decision Suport System) dan EIS (Expert Information System). Salinan dari transaksi data yang terstruktur secara spesifik pada query dan analisa. Salinan dari transaksi data yang terstruktur spesifik untuk query dan laporan Tujuan : Meningkatkan kualitas dan akurasi informasi bisnis dan mengirimkan informasi ke pemakai dalam bentuk yang dimengerti dan dapat diakses dengan mudah.

4 Karakteristik Data Warehouse 1. Subject Oriented Data yang disusun menurut subyek berisi hanya informasi yang penting bagi pemprosesan decision support. Database yang semua informasi yang tersimpan di kelompokkan berdasarkan subyek tertentu misalnya: pelanggan, gudang, pasar, dsb. Semua Informasi tersebut disimpan dalam suatu sistem data warehouse. Data-data di setiap subyek dirangkum ke dalam dimensi, misalnya : dalam periode waktu, info produk, info wilayah, dsb, sehingga dapat memberikan nilai sejarah sebagai bahan analisa. 2. Integrated Jika data terletak pada berbagai aplikasi yang terpisah dalam suatu lingkungan operasional, encoding data sering tidak seragam sehinggga bila data dipindahkan ke data warehouse maka coding akan diasumsikan sama seperti lazimnya.

3. Time variant Data warehouse adalah tempat untuk storing data selama 5 sampai 10 tahun atau lebih, Data digunakan untuk perbandingan atau perkiraan dan data ini tidak dapat diperbaharui. 4. Non-volatile Data tidak dapat diperbaharui atau dirubah tetapi hanya dapat ditambah dan dilihat

Perbedaan Data Warehouse & Database Data Warehouse Tidak terikat suatu aplikasi Data terpusat Historical Denormalisasi kecil Multiple subject Sumber dari dari semua internal maupun eksternal source Fleksibel Data oriented Umurnya panjang Ukuran besar Single complex structure Database Aplikasi DSS secara spesifik Tidak terpusat oleh user area Sebagian historical Denormalisasi besar Satu subject Sumber dari sebagian internal maupun eksternal source Tidak fleksibel, terbatas Project oriented Umurnya pendek Ukuran dari kecil menjadi besar Multi complex structure

Langkah penerapan Data Warehouse

Proses pada Data Warehouse

Data Warehouse & Operasional DBMS OLTP (on-line transaction processing) Tugas utama DBMS relasional tradisional Operasional Harian : pembelian, persediaan, perbankan, manufaktur, penggajian, pendaftaran, akuntansi, dll OLAP (on-line analytical processing) Tugas utama dari sistem data warehouse Analisis data dan pengambilan keputusan Fitur yang berbeda (OLTP vs OLAP): Orientasi User dan system orientation: customer vs. market Data contents: saat ini, detail vs. Histori, konsolidasi Database design: ER + application vs. star + subject View: saat ini, lokal vs. evolutionary, integrated Pola Akses: update vs. read-only tetapi complex queries

Data Warehouse & Operasional DBMS OLTP OLAP users clerk, IT professional knowledge worker function day to day operations decision support DB design application-oriented subject-oriented data current, up-to-date detailed, flat relational isolated usage repetitive ad-hoc access read/write lots of scans index/hash on prim. key unit of work short, simple transaction complex query # records accessed tens millions #users thousands hundreds DB size 100MB-GB 100GB-TB historical, summarized, multidimensional integrated, consolidated metric transaction throughput query throughput, response

Konsep Model Data Warehouse 1. Skema bintang: Sebuah tabel fakta di tengah terhubung ke satu set tabel dimensi 2. Skema Snowflake : Sebuah penyempurnaan skema bintang di mana beberapa hirarki dimensi dinormalisasi menjadi satu set tabel dimensi yang lebih kecil, membentuk bentuk mirip dengan kepingan salju 3. Fakta konstelasi: Beberapa fakta tabel dibagi menjadi dimensi tabel, dipandang sebagai kumpulan bintang, karena itu disebut Skema Galaxy atau fakta konstelasi

time time_key day day_of_the_week month quarter year Example of Star Schema branch branch_key branch_name branch_type Measures Sales Fact Table time_key item_key branch_key location_key units_sold dollars_sold avg_sales item item_key item_name brand type supplier_type location location_key street city province_or_street country

time time_key day day_of_the_week month quarter year branch Example of Snowflake Schema branch_key branch_name branch_type Measures Sales Fact Table time_key item_key branch_key location_key units_sold dollars_sold avg_sales item item_key item_name brand type supplier_key location location_key street city_key supplier supplier_key supplier_type city city_key city province_or_street country

Example of Fact Constellation time time_key day day_of_the_week month quarter year Sales Fact Table time_key item_key branch_key item item_key item_name brand type supplier_type Shipping Fact Table time_key item_key shipper_key from_location branch branch_key branch_name branch_type Measures location_key units_sold dollars_sold avg_sales location location_key street city province_or_street country to_location dollars_cost units_shipped shipper shipper_key shipper_name location_key shipper_type

Data Mining Query Language, DMQL: Language Primitives Cube Definition (Fact Table) define cube <cube_name> [<dimension_list>]: <measure_list> Dimension Definition ( Dimension Table ) define dimension <dimension_name> as (<attribute_or_subdimension_list>) Special Case (Shared Dimension Tables) First time as cube definition define dimension <dimension_name> as <dimension_name_first_time> in cube <cube_name_first_time>

Defining a Star Schema in DMQL define cube sales_star [time, item, branch, location]: dollars_sold = sum(sales_in_dollars), avg_sales = avg(sales_in_dollars), units_sold = count(*) define dimension time as (time_key, day, day_of_week, month, quarter, year) define dimension item as (item_key, item_name, brand, type, supplier_type) define dimension branch as (branch_key, branch_name, branch_type) define dimension location as (location_key, street, city, province_or_state, country)

Defining a Snowflake Schema in DMQL define cube sales_snowflake [time, item, branch, location]: dollars_sold = sum(sales_in_dollars), avg_sales = avg(sales_in_dollars), units_sold = count(*) define dimension time as (time_key, day, day_of_week, month, quarter, year) define dimension item as (item_key, item_name, brand, type, supplier(supplier_key, supplier_type)) define dimension branch as (branch_key, branch_name, branch_type) define dimension location as (location_key, street, city(city_key, province_or_state, country))

Defining a Fact Constellation in DMQL define cube sales [time, item, branch, location]: dollars_sold = sum(sales_in_dollars), avg_sales = avg(sales_in_dollars), units_sold = count(*) define dimension time as (time_key, day, day_of_week, month, quarter, year) define dimension item as (item_key, item_name, brand, type, supplier_type) define dimension branch as (branch_key, branch_name, branch_type) define dimension location as (location_key, street, city, province_or_state, country) define cube shipping [time, item, shipper, from_location, to_location]: dollar_cost = sum(cost_in_dollars), unit_shipped = count(*) define dimension time as time in cube sales define dimension item as item in cube sales define dimension shipper as (shipper_key, shipper_name, location as location in cube sales, shipper_type) define dimension from_location as location in cube sales define dimension to_location as location in cube sales

3 Kategori Pengukuran Distributif: jika hasil yang diperoleh dengan menerapkan fungsi untuk nilai keseluruhan n adalah sama dengan yang diperoleh dengan menerapkan fungsi pada semua data tanpa partisi. Misalnya, count (), jumlah (), min (), max (). Aljabar: jika dapat dihitung dengan fungsi aljabar dengan argumen M (di mana M adalah bilangan bulat dibatasi), yang masing-masing diperoleh dengan menerapkan fungsi agregat distributif. Misalnya, avg (), min_n (), deviasi_standar (). Holistik: jika tidak ada konstan terikat pada ukuran penyimpanan yang dibutuhkan untuk menggambarkan sub sebuah kumpulan Misalnya, median (), mode (), tank ().

Konsep Hirarki: Dimension (location) all all region Europe... North_America country Germany... Spain Canada... Mexico city Frankfurt... Vancouver... Toronto office L. Chan... M. Wind

View of Warehouses and Hierarchies Specification of hierarchies Schema hierarchy day < {month < quarter; week} < year Set_grouping hierarchy {1..10} < inexpensive

Product Multidimensional Data Sales volume as a function of product, month, and region Dimensions: Product, Location, Time Hierarchical summarization paths Industry Region Year Category Country Quarter Product City Month Week Office Day Month

Country Contoh Data Cube TV PC VCR sum Date 1Qtr 2Qtr 3Qtr 4Qtr sum Total annual sales of TV in U.S.A. U.S.A Canada Mexico sum

Cuboids Corresponding to the Cube all product date country product,date product,country date, country 0-D(apex) cuboid 1-D cuboids 2-D cuboids product, date, country 3-D(base) cuboid

Browsing a Data Cube Visualization OLAP capabilities Interactive manipulation

A Star-Net Query Model Shipping Method AIR-EXPRESS Customer Orders CONTRACTS Customer Time TRUCK ANNUALY QTRLY DAILY CITY COUNTRY ORDER PRODUCT LINE Product PRODUCT ITEM PRODUCT GROUP SALES PERSON DISTRICT REGION Location Each circle is called a footprint Promotion DIVISION Organization