BAB 2 LANDASAN TEORI

dokumen-dokumen yang mirip
BAB 2 LANDASAN TEORI

MEMBANGUN DATA WAREHOUSE

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. kebutuhan informasi suatu perusahaan. komputer secara sistematis. menggunakan database SQL Server 2000.

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

[Data Warehouse] [6/C2 & 6/D2]

BAB 2 LANDASAN TEORI. berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5).

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)

BAB 2 LANDASAN TEORI. Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada

UNIVERSITAS BINA NUSANTARA. Jurusan Sistem Informasi Skripsi Sarjana Komputer Semester Genap 2004 / 2005

BAB 2 LANDASAN TEORI. informasi yang mentah atau kumpulan dari fakta yang masih harus diproses agar

BAB 2 LANDASAN TEORI

[Data Warehouse] [6/C2 & 6/D2]

BAB 2 LANDASAN TEORI

DATA WAREHOUSE PERTEMUAN I S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM

LANDASAN TEORI. Sebelum dikenal database, penyimpanan data menggunakan pendekatan

BAB 2 LANDASAN TEORI

BAB II. LANDASAN TEORIse. Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti

BAB II KONSEP DATA WAREHOUSING

BAB I PENDAHULUAN. perusahaan saling bersaing dalam meningkatkan produktivitas dan kinerja dari

BAB 2 LANDASAN TEORI. dan piranti lunak yang digunakan dalam sistem informasi. Perangkat keras. Piranti Lunak

BAB 2 LANDASAN TEORI. Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut:

BAB 2 LANDASAN TEORI. informasi adalah bagaimana data tersebut diartikan dan dimengerti oleh

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Genap tahun 2005/2006

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

PERTEMUAN 14 DATA WAREHOUSE

Basis Data Oracle - Business Intelligence System. Ramos Somya, M.Cs.

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat


UNIVERSITAS BINA NUSANTARA

UNIVERSITAS BINA NUSANTARA

BAB 2 2 LANDASAN TEORI. Menurut Inmon (2002, p388), data adalah rekaman dari fakta-fakta, konsepkonsep,

BAB 2 LANDASAN TEORI

UNIVERSITAS BINA NUSANTARA ANALISIS DAN PERANCANGAN DATA WAREHOUSE PEMBELIAN DAN PENJUALAN PADA PT. SINAR MEADOW INTERNATIONAL INDONESIA

BAB 2 LANDASAN TEORI. bentuk yang dimengerti dan dapat digunakan.

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/2006

BAB 2 LANDASAN TEORI. membantu mengambil keputusan di lingkungan perusahaan.

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Program Studi Strata-1 Skripsi Sarjana Komputer Semester Genap Tahun 2005/2006

BAB II LANDASAN TEORI

BAB 2 LANDASAN TEORI. subject-oriented, integrated, time-variant, and non-volatile collection of data in

Data Warehouse dan Decision Support System. Arif Basofi

BAB 2 LANDASAN TEORI. diproses atau data yang mempunyai makna. Menurut Stephen Haag, Cummings, dan McCubbery ( 2005, p6 ), Data

6/26/2011. Menurut W.H. Inmon dan Richard D.H. Menurut Vidette Poe

[Data Warehouse] [6/C2 & 6/D2]

BAB 2 LANDASAN TEORI. data, DBMS, dan data mart, hal hal diatas dapat menjelaskan secara mendasar

BAB III LANDASAN TEORI

Bab 2 LANDASAN TEORI

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Genap tahun 2005/2006

BAB 2 LANDASAN TEORI

+++ BAB 1 PENDAHULUAN. dalam berbagai bidang. Perusahaan harus pandai dalam memanfaatkan sumber daya

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Skripsi Sarjana Komputer Semester Ganjil tahun 2005/ 2006

Data Warehousing dan Decision Support

KARAKTERISTIK DATA WAREHOUSE

ANALISIS DAN PERANCANGAN DATA WAREHOUSE PADA PT.ASURANSI WAHANA TATA

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 2 LANDASAN TEORI

6.2 Pendekatan Database Untuk Pengelolaan Data

Perancangan Basis Data

BAB 2 LANDASAN TEORI. informasi, database, dan data warehouse adalah sebagai berikut : dimengerti oleh pemiliknya atau pihak yang bersangkutan.

UNIVERSITAS BINA NUSANTARA. Jurusan Sistem Informasi Skripsi Sarjana Komputer Semester Genap tahun 2003/2004

BAB 2 LANDASAN TEORI

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6

BAB 2 LANDASAN TEORI. saling berhubungan, bekerja bersama untuk mencapai tujuan bersama dengan

UNIVERSITAS BINA NUSANTARA

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. perkembangan teknologi informasi, dunia bisnis yang didukungnya juga turut

Tugas Akhir (KI091391) Muhamad Adi Prasetyo

ANALISIS DAN PERANCANGAN DATAWAREHOUSE BAGIAN KEPENDUDUKAN PADA KEMENTERIAN DALAM NEGERI SKRIPSI. Oleh. Poltak Caesarrio Hutagaol

UNIVERSITAS BINA NUSANTARA

BAB 2 LANDAS AN TEORI

DATAMULTIDIMENSI. DATAWAREHOUSE vs DATAMART FIRDAUS SOLIHIN UNIVERSITAS TRUNOJOYO

UNIVERSITAS BINA NUSANTARA

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Program Studi Ilmu Komputer Skripsi Sarjana Komputer Semester Ganjil tahun 2006/2007

MENGENAL DATA WAREHOUSE

BAB I PENDAHULUAN. I.1 Pendahuluan

DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan

BAB 2 LANDASAN TEORI

PERANCANGAN DATA MART BAGIAN PENJUALAN MOTOR BEKAS(USED MOTOR CYCLE ) PADA CV. ATLAS MOTOR

BAB 2 LANDASAN TEORI

Sistem Basis Data Lanjut DATA WAREHOUSE. Data Warehouse 1/20

Pemodelan Data Warehouse

PERANCANGAN DATA WAREHOUSE PENGOLAHAN PERSEDIAAN BUKU PT. GRAMEDIA ASRI MEDIA MAKASSAR

UNIVERSITAS BINA NUSANTARA. Jurusan Teknologi Informasi Skripsi Sarjana Komputer Semester Genap tahun 2005 / 2006

ANALISIS DAN PERANCANGAN DATA WAREHOUSE PENJUALAN, PEMBELIAN, DAN PERSEDIAAN UNTUK MENDUKUNG EKSEKUTIF DALAM PENGAMBILAN

BAB 2 LANDASAN TEORI

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Program Studi Database Skripsi Sarjana Komputer Semester Ganjil 2005 / 2006

PROSES PERANCANGAN BASIS DATA

Transkripsi:

BAB 2 LANDASAN TEORI 2.1 Teknologi Informasi Menurut Alter (2000, p42) teknologi informasi adalah perangkat keras dan piranti lunak yang digunakan dalam sistem informasi. Perangkat keras Mengarah pada peralatan dan objek fisik lain yang terlibat dalam melakukan proses informasi seperti: komputer, workstation, jaringan fisik, tempat penyimpanan data, dan peralatan transmisi. Piranti lunak Mengarah pada program komputer untuk proses penerjemahan input user dan menyampaikan pada perangkat keras mengenai apa yang harus dilakukan. Yang termasuk dalam piranti lunak yaitu sistem operasi, end user software seperti word processor, dan software aplikasi yang berhubungan dengan fungsi bisnis yang khusus seperti merekam transaksi kartu kredit atau merancang mobil. 2.2 Sistem Informasi Menurut Laudon dan Laudon (2002, p7), sistem informasi adalah kumpulan komponen-komponen yang saling berhubungan yang bekerja sama untuk mengumpulkan, memproses, menyimpan, dan menyebarkan informasi untuk mendukung pengambilan keputusan, koordinasi, kontrol, analisis, dan visualisasi dalam organisasi.sedangkan menurut Mallach (2000, p88), sistem informasi adalah sebuah 7

sistem yang bertujuan untuk menyimpan, memproses, dan mengkomunikasikan informasi. Menurut Turban, Rainer, Potter (2001, p17-19), sebuah sistem informasi mencakup input (data, instruksi) dan output (laporan, kalkulasi). Kemudian input-nya diproses dan menghasilkan output yang dikirim ke user atau sistem lain. Untuk dapat bersaing dengan sukses dalam lingkungan bisnis modern saat ini, maka sebuah organisasi mengharapkan sistem informasi mereka dapat memiliki kemampuan yang kuat. Sistem informasi yang kuat harus dapat melakukan hal-hal berikut : Menyediakan proses transaksi yang cepat dan akurat Menyediakan kapasitas yang besar dan akses ke tempat penyimpanan data yang cepat Menyediakan komunikasi yang cepat Mengurangi informasi yang berlebihan Menyediakan pendukung dalam pengambilan keputusan Menyiapkan senjata untuk bersaing 2.3 Database 2.3.1 Pengertian Data Menurut Turban, Rainer, Potter (2001, p17) data adalah fakta mentah atau deskripsi dasar dari sesuatu (benda), kejadian, kegiatan, dan transaksi, yang ditangkap, direkam, disimpan, dan diklasifikasikan, tetapi tidak diorganisasikan untuk menyampaikan arti spesifik apapun. 8

Menurut Alter (2000, p48), Data are facts, images, or sounds that may or may not be pertinent or useful for particular task, yang artinya data merupakan fakta, gambar atau suara yang berhubungan atau tidak, dan bermanfaat bagi tugas tertentu. Perbedaannya dengan informasi, menurut Turban, Rainer, Potter (2001, p17), informasi adalah koleksi fakta (data) yang diorganisasikan dengan beberapa cara sehingga bisa memberikan arti untuk penerimanya. 2.3.2 Pengertian Database Menurut Connoly (2002, p14), database adalah koleksi yang terbagi dari data yang berhubungan secara logikal, dan deskripsi dari data tersebut, yang dirancang untuk memenuhi kebutuhan informasi dalam organisasi. Menurut W.H. inmon (2002, p3), database didefenisikan sebagai suatu koleksi dari penyimpanan data yang terhubung yang sering digunakan dan mengurangi redudansi (perulangan) menurut skemanya. Sebuah database dapat digunakan pada aplikasi tunggal atau jamak. Database merupakan sebuah tempat penyimpanan data yang besar yang dapat digunakan secara simultan oleh banyak departemen dan user. Database tidak hanya menyimpan data operasional organisasi tetapi juga menyimpan deskripsi dari data tersebut (Connoly, 2002, pp14 15). Menurut O Brien (1997, p166), Database is an integrated collection of logically related records of files, yang artinya bahwa Database merupakan 9

suatu koleksi yang terintegrasi dimana secara logika berhubungan dengan record dari file. Menurut http://en.wikipedia.org/wiki/database, database adalah kumpulan record yang tersimpan didalam komputer dengan cara yang sistematis, sehingga program komputer dapat menggunakannya untuk menjawab pertanyaan. 2.4 Data warehouse 2.4.1 Pengertian Data warehouse Terdapat beberapa definisi tentang data warehouse dari beberapa ahli. Menurut Inmon (2002, p31), Data warehouse adalah koleksi data yang berorientasi pada subjek, terintegrasi, non-volatile, dan time-variant dalam mendukung keputusan manajemen. Menurut Poe (1996, p24), A Data warehouse is an analytical database that is used as the foundation of a decision support sistem, yang artinya data warehouse adalah database yang bersifat analisis yang digunakan sebagai dasar dari sistem pendukung keputusan. Menurut http://en.wikipedia.org/wiki/data warehouse, A Data warehouse is a logical collection of information gathered from many different operational databases used to create business intelligence that supports business analysis activities and decision-making tasks, yang artinya data warehouse adalah koleksi logikal dari informasi yang dikumpulkan dari bermacam database 10

yang digunakan untuk membangun business intelligence yang mendukung aktivitas business analysis dan decision-making. Menurut Pareto Analyst (2002) http://www.paretoanalysts.com, A Data warehouse is a collection of data marts representing historical data from different operations in the company, maksudnya Data warehouse adalah kumpulan dari data mart yang menjelaskan data histori dari operasi yang berbeda dalam suatu perusahaan. Dari defenisi-defenisi diatas dapat ditarik suatu kesimpulan yaitu data warehouse adalah suatu database yang saling terhubung yang digunakan untuk query dan analisa yang memiliki sifat subject oriented (berorientasi subjeck), integrated (saling terpadu), non volatile (tidak dapat berubah-ubah) dan time variant (memilki variasi waktu) bagi para pengambil keputusan yaitu eksekutif perusahaan. Data-data dari operasional database dan external source diekstrak, disaring, disummary dan kemudian diload ke data warehouse mengandung datadata historis, maka sering kali aktivitasnya meliputi pengambilan kembali datadata yang telah benar-benar disummarized. Data warehouse berguna untuk mempermudah membuat aplikasi DSS (decision support system) dan EIS (executive information system). 2.4.2 Konsep Data warehouse Konsep dasar yang asli dari data warehouse ditemukan oleh IBM sebagai gudang informasi dan dihadirkan sebagai solusi untuk mengakses data yang berada dalam sistem non-relational (Connoly, 2002, p1047). 11

Dari perkembangan model rancangan database muncul apa yang disebutkan dengan data warehouse, di sini data warehouse dapat ditampilkan dalam bentuk database untuk data histori dari berbagai bagian yang ada dalam perusahaan, serta data warehouse dapat pula digunakan dalam menganalisa dari database yang telah ada, dan memperlihatkan sifat yang lebih interaktif dalam membantu mengambil suatu keputusan dalam perusahaan. Data warehouse dibangun dari data aplikasi yang ditemukan dalam lingkungan operasional. Data aplikasi tersebut diintegrasikan dan dimasukkan ke dalam data warehouse. Proses integrasi data selalu kompleks. Data mengalir dari data warehouse ke dalam lingkungan departemental (data mart). 2.5 Karakterisitik Data warehouse Karakteristik dari data warehouse menurut Inmon (2002, p31) dalam deskripsinya menjelaskan tentang data warehouse dibagi atas empat yaitu: 1. Subject Oriented (Berorientasi pada subjek) 2. Integrated (Terintegrasi) 3. Time Variant (Rentang Waktu) 4. Nonvolatile (Tidak dapat diubah) 2.5.1 Subject Oriented Subject-oriented (berorientasi pada subjek) artinya data diorganisasikan di sekeliling subjek utama dari perusahaan (seperti pelanggan, produk, dan penjualan) dari area aplikasi utama (seperti tagihan pelanggan, kontrol stok, dan 12

penjualan produk). Dengan kata lain, data diorganisasikan oleh topik bisnis, bukan oleh nomor customer atau key lainnya. Contohnya perusahaan asuransi, area subjek utamanya dapat berupa pelanggan (customer), kebijakan (policy), bayaran (premium), dan tuntutan (claim). Perbandingan antara data warehouse dan data operasional secara singkat diperlihatkan pada tabel 2.1. Tabel 2.1 Tabel Perbandingan dari data warehouse dan data operasional Perbandingan Data warehouse Data Operational Maksud perancangan Untuk kegiatan Analisis Perusahaan Untuk Kegiatan operasi perusahaan Lingkungan perancangan Pada subjek yang ada pada perusahaan Pada proses yang dilakukan pada perusahaan Hasil data yang disimpan Berupa data analisa dari kumpulan data operational Berupa data detail dari hasil kegiatan perusahaan Fokus perancangan Pada performance pemodelan aplikasi Penggunaan aturan database Menggunakan aturan bisnis Pada desain database dan proses transaksi Menggunakan aturan yang terkini atau terbaru 13

2.5.2 Integrated Integrated (terintegrasi) artinya data disimpan sebagai satu unit, bukan sebagai koleksi file yang dapat memiliki struktur atau organisasi yang berbeda. Data diintegrasikan karena datangnya sumber data yang bersamaan dari sistem aplikasi perusahaaan yang berbeda. Data yang terintegrasi harus dibuat konsisten, agar user dapat melihat keseluruhan data dengan mudah. Sekali data ditempatkan ke dalam data warehouse, maka data tersebut harus mempunyai satu gambaran fisik perusahaan. 2.5.3 Time variant Time-variant (rentang waktu) artinya dimensi waktu yang secara eksplisit termasuk dalam data agar trend dan perubahan yang terjadi dapat dipelajari. Adanya rentang waktu tersebut karena data didalam gudang (warehouse) hanya data yang akurat dan valid pada waktu atau interval waktu tertentu. Rentang waktu tersebut menyatakan secara tidak langsung bahwa setiap unit dari data dalam data warehouse adalah akurat dalam beberapa waktu. Lingkungan yang berbeda mempunyai horison waktu yang berbeda. horison waktu adalah parameter waktu yang diwakilkan dalam sebuah lingkungan. Kolektif horison waktu untuk data yang ditemukan dalam data warehouse secara signifikan lebih lama daripada sistem operasional. Horison waktu 60-90 hari adalah normal untuk sistem operasional; horison waktu 5-10 tahun adalah normal untuk data warehouse. Hasil dari perbedaan horison waktu, data warehouse berisi lebih banyak history daripada lingkungan apapun lainnya. 14

2.5.4 Nonvolatile Arti nonvolatile di sini adalah tidak mengalami perubahan, karena data dalam data warehouse hanya di-load dan diakses, tetapi tidak di-update. Dengan kata lain dalam data warehouse hanya tersedia operasi insert dan select saja, berbeda dengan data operasional yang sehari-hari dilakukan, lebih banyak perintahnya. Dengan adanya sifat nonvolatile membuat data warehouse terlihat lebih tersusun dengan baik, sebab data-data yang digunakan dalam data warehouse merupakan hasil transformasi yang sudah mengalami penyaringan yang lebih spesifik. Data baru mungkin ditambahkan ke dalam database sebagai tambahan, tetapi data yang lama tidak dibuang. 2.6 Struktur Data warehouse highly summarized data Lightly summarized data M E T E D A T A Current detail data Older detail data Gambar 2.1 Struktur Data warehouse Secara Umum 15

Gambar 2.1 menunjukkan bahwa terdapat banyak level detil (rincian) yang berbeda-beda dalam data warehouse. Pada gambar, terdapat older level dari detil (biasanya pada alternative, bulk storage), current level dari detil, level dari lightly summarized data (level data mart), dan level dari highly summarized data. Data mengalir ke dalam data warehouse dari lingkungan operasional. Biasanya transformasi data yang signifikan terjadi pada perjalanan dari level operasional ke level data warehouse. Sekali data tersebut digunakan, data tersebut akan melalui current detail menuju older detail. Dengan diringkasnya data, data tersebut akan berjalan melalui current detail ke lightly summarized data, kemudian dari lightly summarized data ke highly summarized data (Inmon, 2002, p35). 2.6.1 Current Detail Data Menggambarkan keadaan data yang sedang berjalan, data ini merupakan level data terendah dari data warehouse, cepat diakses dan memerlukan storage (tempat penyimpanan) yang besar. Sehingga sulit untuk diatur, karena data tersebut sangat kompleks. 2.6.2 Older Detail Data Older Detail Data adalah hasil backup yang disimpan dalam storage (tempat penyimpanan) yang terpisah, dan pada saat tertentu dapat diakses kembali bilamana dibutuhkan. Penyusunan direktori untuk data ini harus mencerminkan umur dari data agar memudahkan pengaksesan kembali. 16

2.6.3 Highly Summary Data Highly Summary Data adalah suatu hasil data yang bersifat totalitas, data ini tersusun rapi dan mudah diakses terutama untuk melakukan analisis perbandingan data berdasarkan urutan waktu dan analisis yang menggunakan data multi dimensi. Sumber data tersebut dapat berasal dari data yang sedang aktif ataupun di luar dari data warehouse. 2.6.4 Lightly Summary Data Lightly Summary Data adalah ringkasan dari data tingkat rendah yang ada pada detail yang sedang aktif tetapi belum bersifat total summary. Data ini banyak ditampilkan dalam bentuk view dari kondisi yang sedang berjalan atau sudah berjalan. 2.6.5 Metadata Menurut O Neil (1997, p152), metadata adalah data tentang data, sehingga data dapat dimengerti dan diatur dengan tepat. Sebuah data warehouse sangat kompleks; yang mewakili integrasi dari banyak gambaran data dalam perusahaan yang berbeda-beda. Untuk dapat mengerti semua data tersebut dan bagaimana menggunakannya dengan tepat untuk memudahkan pengambilan keputusan manajemen, data tentang data dibutuhkan. Menurut Poe (1996, p31), metadata adalah data tentang data dan menyediakan informasi tentang struktur data dan hubungan antara struktur data dalam atau diantara database. 17

Sedangkan Menurut http://en.wikipedia.org/wiki/metadata, metadata are information about another set of data, yang artinya metadata adalah informasi mengenai sekumpulan data. Seperti terlihat pada Gambar 2.2, di dalam lingkungan data warehouse terdapat 2 tipe utama metadata (Poe, 1996, p169) yaitu: Metadata Operasional Berisi informasi tentang bagaimana sistem operasional dipetakan ke dalam data warehouse. Metadata tersebut dapat mencakup informasi sistem sumber asal, nama field, dan informasi transformasi data. Metadata DSS (Decision Support Sistem) Memberikan informasi bagaimana data warehouse dipetakan ke model bisnis dimensional pengguna akhir. Metadata DSS menyediakan analisis dengan sebuah katalog data dalam data warehouse dan memetakan data warehouse fisikal ke model bisnis dimensional pengguna. 18

Source 1 Source 2 Data Transformation Data Warehouse DSS Tool & Application Source 3 Operational Metadata DSS Metadata Gambar 2.2 Metadata Operasional dan Metadata DSS 2.7 Arsitektur dan Infrastruktur Data warehouse 2.7.1 Arsitektur Data warehouse Arsitektur data warehouse seperti yang digambarkan pada Gambar 2.3 adalah satu set atau sekumpulan peraturan atau struktur yang menyediakan kerangka kerja untuk keseluruhan desain dari suatu sistem atau produk (Poe, 1996, p40). Arsitektur data warehouse mempunyai komponen utama, sebuah database yang hanya dapat dibaca yang digunakan untuk pendukung keputusan. Arsitektur data warehouse mempunyai karakteristik sendiri yang membedakannya dari sistem-sistem lain. Sifat dari arsitektur data warehouse menurut Poe (1996, p41) adalah: Data diperoleh dari sumber sistem, database, dan file yang ada. Data dari sumber sistem diintegrasikan dan diubah terlebih dahulu sebelum diload ke dalam data warehouse. 19

Data warehouse merupakan sebuah database terpisah yang hanya dapat dibaca yang diciptakan secara spesifik untuk pendukung keputusan. Pengguna mengakses data melalui alat front end atau aplikasi. Gambar 2.3 Arsitektur Data warehouse 2.7.2 Infrastruktur Data warehouse Menurut O Neil (1997,p25), data warehouse terdiri dari komponenkomponen arsitektural yang menyusun infrastruktur data warehouse : Sistem infrastructure: Perangkat keras, perangkat lunak, jaringan, sistem manajemen basis data, dan komponen personalia dari infrastruktur. Metadata layer: Data tentang data, yang dalam hal ini mencakup definisi dan deskripsi dari item data dan aturan bisnis, namun cakupannya tidak hanya terbatas pada hal tersebut saja. Data discovery: Proses pemahaman lingkungan yang sekarang sehingga dapat diintegrasikan ke dalam data warehouse. 20

Data acquisition: Proses loading data dari berbagai sumber. Data distribution: Penyebaran atau replikasi dari data ke data mart terdistribusi untuk bagian kelompok yang spesifik. User analysis: Mencakup infrastruktur yang dibutuhkan untuk mendukung query dan analisis dari pengguna. Menurut Poe (1996, p54), infrastruktur data warehouse adalah perangkat lunak, perangkat keras, pelatihan dan komponen-komponen lainnya yang menyediakan dukungan untuk mengimplementasikan arsitektur data warehouse. Infrastruktur teknikal berupa teknologi, platform, database, gateway, dan komponen-komponen penting yang mendukung arsitektur data warehouse yang dipilih. Ada beberapa cara yang dapat diimplementasikan untuk mengaplikasikan sebuah arsitektur data warehouse yaitu dengan menggunakan infrastruktur yang berbeda. Arsitektur dan infrastruktur saling berkaitan erat dan satu sama lainnya saling mendukung. Pengaruh dari lingkungan atau organisasi juga otomatis mempengaruhi pemilihan suatu infrastruktur yang akan kita pilih. 2.8 Anatomi Data warehouse Dalam memutuskan bentuk (anatomi) dari data warehouse mana yang akan kita gunakan dalam suatu perusahaan, terlebih dahulu kita harus mengetahui kebutuhan yang kita perlukan didalam menjalankan aplikasi yang ingin kita rancang. Bentuk umum yang sering digunakan dalam data warehouse adalah dibagi atas tiga bentuk yakni: 21

Functional Data warehouse (Data warehouse Fungsional) Centralized Data warehouse (Data warehouse Terpusat) Distributed Data warehouse (Data warehouse Terdistribusi) 2.8.1 Data warehouse Functional Kata operasional disini merupakan database yang diperoleh dari hasil kegiatan operasi sehari-hari, data warehouse dibuat lebih dari satu dan dikelompokkan berdasarkan masing-masing fungsi yang ada di dalam perusahaan seperti fungsi keuangan (finansial), fungsi marketing, fungsi kinerja personalia dan lain-lainnya. Keuntungan dari bentuk ini adalah sistem mudah dibangun dengan biaya yang relatif murah sedangkan kerugiannya adalah resiko kehilangan konsistensi data dan terbatasnya kemampuan dalam pengumpulan data bagi pengguna. Gambar 2.4 Functional Data warehouse 22

2.8.2 Data warehouse Terpusat Sebenarnya bentuk ini terlihat seperti bentuk functional data warehouse, namun disini sumber data terlebih dahulu dikumpulkan atau diintegrasikan pada suatu tempat terpusat, kemudian barulah data tersebut dibagi-bagi berdasarkan fungsi-fungsi yang dibutuhkan oleh perusahaan, dan bentuk ini sering digunakan oleh perusahaan-perusahaan yang belum memiliki jaringan eksternal. Keuntungan dari bentuk ini adalah data benar-benar terpadu karena konsistensinya yang tinggi sedangkan kerugiannya adalah biaya mahal serta perlu waktu yang cukup lama dalam membangun bentuk ini. Gambar 2.5 Centralized Data warehouse 23

2.8.3 Data warehouse Terdistribusi Pada bentuk ini, digunakan gateway yang berguna sebagai jembatan antara lokasi data warehouse dengan workstation yang menggunakan sistem yang beraneka ragam atau berbeda, sehingga pada bentuk ini memungkinkan kita untuk mengakses sumber data yang berada diluar lokasi perusahaan (eksternal). Keuntungan dari bentuk ini adalah kelebihan dalam mengakses data dari luar perusahaan yang telah mengalami sinkronisasi terlebih dahulu dan tetap terjaga konsistensinya. Namun kerugian dari bentuk ini adalah bentuk yang paling mahal dan komplek untuk diterapkan, karena sistem operasinya dikelola secara terpisah. Functional Data Warehouse Workstation Source Data warehouse Gateway Source Workstation Operational Data Warehouse Workstation Gambar 2.6 Distributed Data warehouse 24

2.9 Kegunaan Data warehouse Data warehouse biasanya digunakan untuk melakukan 4 tugas yang berbeda, yaitu : Pembuatan laporan Penggunaan query sederhana dalam data warehouse dapat menghasilkan informasi per tahun, per bulan, per minggu, atau bahkan per hari. Online Analytical Processing (OLAP) Data warehouse digunakan untuk melakukan analisis guna menyelidiki kecenderungan pasar dan faktor penyebabnya. Dalam penggunaan ini, data warehouse merupakan tool yang handal untuk analisis data yang kompleks. Data Mining Pengunaan data warehouse dalam pencarian pola dan hubungan data, dengan tujuan membuat keputusan bisnis. Dalam hal ini software dirancang untuk pola statistik dalam data untuk mengetahui kecenderungan yang ada. Proses Informasi Eksekutif Data warehouse digunakan untuk mencari informasi summary kunci yang penting, dengan tujuan membuat keputusan bisnis, tanpa harus menjelajahi keseluruhan data yang ada. 25

2.10 Metode Analisis Perancangan Data warehouse 2.10.1 Metode Analisis Kebutuhan dan Tujuan Sistem Data warehouse Pada metode ini, digunakan teknik-teknik Fact Finding (Connoly 2002). Di antaranya yaitu, mempelajari dokumen pada perusahaan yang berupa struktur organisasi, deskripsi tugas dan wewenang, serta deskripsi sistem yang sudah berjalan. Observasi operasi perusahaan juga dilakukan untuk mempelajari aktivitas sistem yang sedang berjalan. Selain itu dilakukan juga serangkaian wawancara pada pihak eksekutif perusahaan untuk mengetahui kebutuhan mereka. Selanjutnya dilakukan studi kepustakaan yaitu membaca ataupun mencari informasi mengenai data warehouse dari pustaka-pustaka sebagai acuan dalam analisa dan perancangan data warehouse. 2.10.2 Metode Perancangan Data warehouse Perancangan data warehouse yang dibuat disesuaikan dengan Decision Support Life Cycle berdasarkan pendapat Poe (1996). Perancangan data warehouse-nya meliputi rancangan fisik yang dibuat berupa rancangan skema bintang, pemetaan dan transformasi data dari database ke data warehouse, mempopulasikan data warehouse, dan proses manajemen data secara otomatis. 2.11 Perancangan Data warehouse dengan Skema Bintang Tujuan dari dukungan pengambilan keputusan sering dicapai dengan perancangan database yang disebut dengan skema bintang. Di dalam desain database yang biasa umumnya terdapat hubungan many to many antara entiti relasi, dan 26

melakukan join antar tabel-tabel untuk mendapatkan laporan yang sederhana, inilah yang terkadang membuat para pengguna menjadi frustasi dalam melakukan query. Kenyataannya relasi antar database dibuat bukan untuk mendukung keputusan melainkan dibuat untuk menyediakan struktur data yang lebih fleksibel bagi pengoptimalan penyimpanan data. Sedangkan skema bintang dikembangkan untuk memfasilitasi kegiatan query (O Neil, 1997, p248), yang mendukung keputusan bagi pengguna bisnis. 2.11.1 Keuntungan Skema Bintang Dalam membuat keputusan dengan menggunakan skema bintang, maka dilakukan pengoptimalan performance dari database dengan denormalisasi dan partisi data. Penggunaan skema bintang menyediakan beberapa keuntungan, dimana struktur relasi yang biasa kita gunakan tidak menyediakannya. Skema bintang menjadi standar untuk perancangan database data warehouse karena keuntungannya yaitu (Poe, 1996, p121) : Membuat desain database yang menyediakan waktu respon yang cepat. Menyediakan desain yang dapat dengan mudah dimodifikasi atau ditambahkan sesuai dengan perkembangan iterasi dan pertumbuhan data warehouse. Pendesainan data secara paralel, dimana pengguna secara umum dapat memandang dan menggunakan data. Memudahkan pemahaman dan pengaturan metadata bagi pengembang dan pengguna. 27

Memperluas pilihan dari peralatan akses data front end, seperti beberapa produk yang membutuhkan desain skema bintang. 2.11.2 Rancangan Skema Bintang Perancangan skema bintang adalah sebuah struktur sederhana dengan beberapa tabel secara relatif dan jalur gabungan (join path) yang didefinisikan dengan benar (Poe, 1996, pp120-121). Desain database untuk data warehouse sangat berbeda dengan struktur ternormalisasi yang digunakan untuk database proses transaksi dan desain ini menyediakan waktu respon yang cepat dalam melakukan query, serta memudahkan pemahaman bagi analis dan pengguna, walaupun mereka tidak biasa dengan struktur database. 2.11.3 Tabel dalam Skema Bintang Skema bintang terdiri atas 2 tipe tabel yaitu: 1. Tabel Fakta (Fact Table) Sering disebut Tabel Mayor (Major Table) berisi data kuantitatif atau fakta tentang bisnis, informasi ini biasanya berbentuk angka (numerik) dan mengandung banyak kolom dan jutaan baris. 2. Tabel Dimensi (Dimension Table) Sering disebut juga Tabel Minor (Minor Table) yang berukuran lebih kecil dan menyimpan data deskriptif yang merefleksikan dimensi bisnis. 28

2.11.4 Jenis-jenis Skema Bintang Terdapat beberapa jenis desain skema bintang yaitu: Simple Star Schema (Skema Bintang Sederhana) Setiap tabel harus mempunyai kunci utama yang dapat terdiri atas satu kolom atau lebih yang isinya secara unik mengidentifikasi setiap baris. Pada jenis ini kunci utama (primary key) untuk tabel fakta dikomposisikan dari satu atau lebih kunci asing (foreign key). Kunci asing (foreign key) adalah kolom pada suatu tabel yang nilainya didefinisikan oleh kunci utama (primary key) pada tabel yang lain. Gambar 2.7 Skema Bintang Sederhana 29

Star Schema with Multiple Fact table (Skema Bintang dengan banyak tabel Fakta) Skema ini dapat berisi banyak tabel fakta. Dalam beberapa kasus, tabel fakta multipel ini ada karena berisi fakta-fakta yang tidak berhubungan atau karena perbedaan periode waktu load. Dalam kasus lain, tabel fakta multipel ini ada karena terjadi perbaikan performance. Gambar 2.8 Contoh Skema Bintang dengan Banyak Tabel Fakta Kegunaan lain dari tabel fakta adalah untuk menentukan hubungan many to many antar dimensi bisnis tertentu, tipe ini dikenal sebagai Associative table (tabel asosiasi). 30

Gambar 2.9 Contoh Skema Bintang dengan Tabel Asosiasi Tabel dimensi juga dapat mengandung kunci asing (foreign key) yang merupakan kunci utama (primary key) pada tabel dimensi lainnya, ini merupakan tabel dimensi secondary atau dikenal sebagai Outboard Table. Gambar 2.10 Contoh Skema Bintang dengan Tabel Outboard 31

2.11.5 Variasi Skema Bintang Snowflake Schema Merupakan salah satu variasi dari skema bintang yang menyimpan semua informasi dimensi dalam bentuk normal ketiga, dan tabel fakta dalam bentuk yang sama. Alasan-alasan menggunakan tipe ini adalah: 1. Timbulnya peralatan pendukung keputusan yang dapat memanfaatkan struktur ini. 2. Banyak organisasi sistem, informasi yang merasa lebih nyaman dengan desain bentuk normal. Gambar 2.11 Contoh Skema Snowflake 32

Multi Star Schema Penggunaan jenis ini karena pada beberapa aplikasi, pengabungan kunci asing (foreign key) terkadang tidak mengambarkan keadaan yang benarbenar unik pada tabel fakta, jadi pada jenis ini kunci utamanya (primary key) merupakan gabungan dari kunci asing (foreign key) dari tabel dimensi ditambah dengan kunci yang unik dari tabel fakta itu sendiri. Dalam skema ini kunci utama (primary key) dan kunci asing (foreign key) tidaklah sama, inilah yang membedakan antara multi star schema dengan single star schema. Gambar 2.12 Desain Skema Multi Star 33

2.11.6 Agregasi Agregasi adalah proses pengakumulasian data fakta bersamaan dengan atributnya (Poe, 1996, p136). Sebagai contoh, kita dapat membuat ringkasan dari penjualan produk berdasarkan wilayah dan waktu, dengan menghitung jumlah produk dari transaksi yang telah terjadi. Kegiatan ini umumnya dilakukan pada saat transformasi dan pengambilan data ke dalam data warehouse. Faktor utama yang mendorong dilakukannya aggregasi adalah: Memperbaiki penampilan query dari pengguna Mengurangi jumlah pemprosesan CPU (Central Prosessing Unit) Konsep yang perlu kita ingat bahwa ketika data digunakan dalam data warehouse kita masih membutuhkan apa yang disebut dengan teknik database klasik seperti pembagian tabel secara fisik, hal ini akan menjadi lebih berguna bila data telah mencapai jumlah yang sangat besar. 2.11.7 Denormalisasi Denormalisasi adalah proses pengabungan tabel-tabel untuk meningkatkan penampilan (Poe, 1996, p137), sedangkan menurut Adelman (2000, p244), denormalisasi adalah suatu prosedur regrouping normalisasi data untuk menspesifikasikan kumpulan proses sehingga membuat proses menjadi lebih efesien. Proses denormalisasi ini sangat berlawanan dengan proses normalisasi yang biasa dilakukan dalam pendesainan database. 34

Hal-hal utama yang membuat kita melakukan proses denormalisasi adalah: Untuk mengurangi jumlah hubungan antar tabel yang harus diproses dari query pengguna. Membuat struktur database fisik semakin dekat dengan pandangan model bisnis pengguna. Mempercepat proses aggregasi serta memudahkan pengaksesan data secara langsung pada bagian yang hendak dianalisis. Namun penggunaan denormalisasi memiliki kelemahan, dimana tempat penyimpanan data haruslah besar, ini juga akan mempengaruhi kinerja kerja secara fisik. Menurut O Neil (1997, p222), keuntungan denormalisasi yaitu dapat membantu meminimalkan join dan mempercepat pemrosesan agregasi. Teknikteknik denormalisasi yang dapat digunakan : Menambah redundant data dengan menduplikasi kolom atau dengan menentukan perhitungan. Merubah isi kolom dan mengabungkan isi dari kolom-kolom yang ada. Mengabungkan tabel multiple menjadi satu tabel. Mereplikasi semua tabel atau bagian dari tabel, dan membagi tabel menjadi tabel multiple (hal ini dikenal sebagai overnormalization) 35

2.12 Critical Success Factor (CSF) Menurut Mcleod (2001,p109), CSF merupakan salah satu bentuk dari aktivitas perusahaan yang mempunyai pengaruh kuat terhadap kemampuan perusahaan dalam mencapai tujuannya. Delapan faktor kritis kesuksesan (Critical Success Factors) dalam memuaskan pelanggan menurut Seybold yang dikutip oleh Sterne (2000,p5) 1. menargetkan kepada pelanggan yang tepat waktu 2. memiliki pengalaman dari pelanggan yang bersangkutan 3. proses arus bisnis yang mempengaruhi pelanggan 4. menyediakan sudut pandang sebesar 360 o dari hubungan pelanggan 5. membiarkan pelanggan membantu diri mereka sendiri 6. membantu pelanggan melakukan tugasnya. 7. mengirimkan pelayanan secara pribadi. 8. komunitas yang dewasa. 2.13 STD (State Transition Diagram) Menurut David dan Davis (1999,p236) State Transition Diagram adalah suatu alat pemodelan yang bagus untuk mempresentasikan hubungan antara proses sistem dan state (keadaan) dan untuk mempresentasikan struktur pengulangan dan umpan balik. Tujuan dari STD adalah untuk mempresentasikan sebuah sistem yang terdiri dari beberapa state (keadaan) dan hubungan aktivitas, menampilkan hubungan antar state (keadaan), menampilkan bagaimana sistem bergerak dari satu state ke state lainnya, dan urutan dokumen dan prioritas state. 36

Komponen komponen utama dalam STD Menampilkan arus dari kontrol dan memicu suatu peristiwa yang memicu layar menjadi aktif Mengidentifikasi perintah yang terjadi sehingga suatu layar muncul. Mengambarkan tampilan pada layar Menggambarkan tampilan yang dapat muncul selama dialog berlansung 37