BAB II KAJIAN PUSTAKA. nearly real time data warehouse (NRTDWH) telah banyak dilakukan, diantaranya

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II KAJIAN PUSTAKA. nearly real time data warehouse (NRTDWH) telah banyak dilakukan, diantaranya"

Transkripsi

1 BAB II KAJIAN PUSTAKA 2.1 State Of The Art Review Beberapa penelitian yang berkaitan dengan pengembangan model untuk nearly real time data warehouse (NRTDWH) telah banyak dilakukan, diantaranya penelitian yang dilakukan oleh Wisswani dkk, (2012) yang melakukan pemodelan change data capture untuk nearly real time data warehouse dengan meletakkan trigger pada sisi On Line Transactional Processing (OLTP). NRTDWH dalam penelitian ini diimplementasikan dalam dua tahapan. Tahap pertama dilakukan dengan memodelkan teknik pengambilan data agar data yang dikelola oleh mesin extract, transfer, load (ETL) menjadi lebih ringkas. Tahap ini meletakkan staging area pada on line transactional processing (OLTP). Selain itu pada OLTP juga diterapkan metode change data capture (CDC) yang akan diimplementasikan dengan active database berupa trigger. Tahap kedua adalah proses sinkronisasi pemindahan data dari staging area ke NRTDWH. Penelitian lain tentang NRTDWH juga dilakukan oleh Bokade dkk, (2013) yang membahas tentang framework dari change data capture berdasarkan pada transaction log file dari suatu basis data dan proses ekstraksi data pada real time data warehouse. Pada penelitian ini dijelaskan bahwa ada beberapa teknik dan teknologi yang dapat diterapkan untuk menangani proses CDC, diantaranya yaitu : (1) Transaction Log File; (2) Trigger Method; (3) RDBMS Replication. Pada penelitian ini dinyatakan bahwa hampir semua DBMS memiliki 11

2 12 transaction log file yang mencatat semua perubahan yang terjadi dalam basis data yang dilakukan oleh setiap transaksi. Untuk menangkap perubahan yang terjadi pada basis data, kita harus memeriksa dan menganalisa isi dari transaction log file dari basis data. Ketika proses CDC diimplementasikan menggunakan teknik transaction log file maka proses analisa transaction log file tidak akan mempengaruhi operational transactional database. Dari penelusuran yang penulis lakukan di beberapa sumber pustaka, termasuk di beberapa database hasil penelitian seperti scholar.google.com, ieeexplore.ieee.org, Penelitian yang membahas tentang integrasi NRTDWH dengan SOA masih sangat jarang dilakukan (jumlah jurnal yang ditemukan kurang dari 6). Cristian, (2010) melakukan penelitian tentang pembuatan model data warehouse dengan menggunakan metode service oriented architecture untuk menunjang sistem informasi eksekutif pada Universitas Budi Luhur. Model ini dikembangkan dengan menggunakan metode SOA dengan tujuan untuk menghasilkan data yang bisa diakses oleh end application yang berbeda-beda dan independen terhadap DBMS. Pengembangan data warehouse dalam penelitian ini menggunakan pendekatan business dimensional life cycle. Salah satu pendekatan yang diusulkan oleh Ralph Kimball, yaitu mengintegrasikan pengembangan dari tiga sudut pandang berbeda, yaitu teknologi, data dan aplikasi dari pendekatan bisnis. Untuk model skema yang digunakan ialah star schema, dimana satu tabel fakta dikelilingi oleh beberapa tabel dimensi. Penggunaan skema ini dilandasi atas kemudahan query dan akses terhadap tabel dimensi yang lebih mudah. Model

3 13 distribusi data warehouse yang dikembangkan berbasis web service dengan framework WSF/PHP. Web service dikembangkan dalam bentuk file PHP dengan format yang disesuaikan dengan framework. Untuk keperluan prototipe ini, dikembangkan contoh 6 service. Penelitian tentang SOA telah banyak dilakukan, diantaranya penelitian Mankad dan Sajja, (2010) yang membahas bagaimana arsitektur Procedural Developments, Structured Design, Client Server Technology, Transaction Processing, Component Oriented N tier, World Wide Web, Object Oriented Architecture telah berhasil membuktikan bahwa mereka sudah mampu memberikan keuntungan dalam perancangan suatu perangkat lunak tertentu. Akan tetapi disaat yang bersamaan mereka kurang efisien untuk memenuhi kebutuhan yang cepat dalam penyediaan beberapa aplikasi seperti aplikasi terintegrasi. Dalam penelitian ini dijelaskan bahwa arsitektur SOA mampu memberikan solusi terhadap kekurangan dari arsitektur seperti di atas karena: 1. SOA dapat dikembangkan dari sistem yang sudah ada. Service dapat dibuat menggunakan teknologi yang sudah ada dengan pendekatan berbasis komponen. Hal ini membuat SOA mampu memberikan alternatif solusi lain secara fleksibel. 2. SOA dapat ditanamkan pada arsitektur berbasis objek dengan menambahkan lapisan abstraksi. 3. SOA bukan hanya suatu arsitektur dari services jika dilihat dari perspektif teknologi tapi juga suatu kebijakan, praktek dan kerangka kerja dimana SOA dapat memastikan bahwa suatu service yang tepat sudah disediakan dan dikonsumsi.

4 14 4. SOA dapat menawarkan services baru kepada pelanggan tanpa harus khawatir dengan infrastruktur IT yang ada dibelakangnya. 5. SOA dapat memberikan efektivitas biaya dengan mengintegrasikan sistem historis terpisah dengan penurunan waktu siklus dan biaya. 6. SOA dapat mengurangi risiko dengan meningkatkan visibilitas operasi bisnis. Tabel 2.1 berisi daftar penelitian yang sudah dilakukan yang terkait dengan topik yang penulis ambil pada pembuatan thesis ini. Tabel 2.1 Daftar Penelitian yang dijadikan acuan Area Penelitian No Judul Penelitian Tahun DWH NRT SOA Model Data Warehouse dengan Service Oriented Architecture untuk Menunjang Sistem Informasi Eksekutif Utilization of Web Services for Service Oriented Architecture Change Data Capture on OLTP Staging Area for Nearly Real Time Data Warehouse base on Database Trigger Framework Of Change Data Capture And Real Time Data Warehouse 2010 X 2010 X X 2012 X 2013 X 2.2 Konsep Data Warehouse Rainardi (2008:p.1) menjelaskan data warehouse merupakan suatu sistem yang mengambil dan menkonsolidasikan data secara periodik dari sistem asal menjadi suatu penyimpanan data dimensional atau ternormalisasi. Data warehouse biasanya akan tetap menyimpan informasi yang berasal dari beberapa tahun belakangan yang akan dipakai untuk business intelligence atau untuk keperluankeperluan analisis. Data warehouse biasanya diperbarui dalam suatu periode waktu tertentu, tidak setiap suatu transaksi terjadi pada sistem asal.

5 15 Menurut Vincent Rainardi, ada dua definisi utama dari data warehouse yang dikonsepsikan oleh dua orang yang disebut sebagai bapak dari data warehouse, yaitu Bill Inmon dan Ralph Kimball (Rainardi, 2008:p.16). Menurut Bill Inmon, data warehouse merupakan sekumpulan data yang berorientasi subjek, terintegrasi, non-volatile dan time-variant untuk mendukung pengambilan keputusan oleh pihak manajemen (Inmon, 2005:p.29). Menurut Ralp Kimball, data warehouse adalah suatu sistem yang mengambil, membersihkan, menyesuaikan, dan mengirimkan sumber data ke dalam penyimpanan data dimensional dan kemudian mendukung serta mengimplementasikan query dan analisis untuk tujuan pengambilan keputusan (Kimball, 2004:p.23). Definisi lain yang cukup menarik tentang data warehouse dikemukakan oleh Hammergren dan Simon (2009), yang menyebutkan data warehouse sebagai data yang dikoordinasikan, dibangun, dan secara periodik disalin dari berbagai sumber ke dalam sebuah lingkungan yang dioptimalkan untuk analisis dan pengolahan informasi (Hammergren, 2009:p.9). 2.3 Karakteristik Data Warehouse Berikut ini adalah karakteristik utama dari data warehouse menurut Turban (2005:p ): a. Berorientasi-subjek Data diorganisasikan oleh subjek detail (misal berdasarkan pelanggan, jenis kebijakan, dan klaim dalam perusahaan asuransi), yang berisi hanya informasi yang relevan untuk mendukung keputusan. Orientasi subjek memungkinkan para pengguna untuk menentukan tidak hanya bagaimana bisnis mereka sedang

6 16 berjalan, tetapi juga mengapa ia berjalan. Data warehouse berbeda dengan database operasional dalam hal kebanyakan database operasional mempunyai sebuah orientasi produk dan disetel untuk menangani transaksi yang memperbarui database; orientasi subjek menyediakan sebuah pandangan yang menyeluruh mengenai organisasi. b. Terintegrasi Data pada sumber berbeda dapat dienkode dengan cara yang berbeda. Sebagai contoh, data jenis kelamin dapat dienkode sebagai 0 dan 1 di satu tempat dan m dan f di tempat lain. Di dalam warehouse, enkode tersebut dibuat (dibersihkan) ke dalam satu format sehinga mereka distandarisasi dan konsisten. Banyak organisasi menggunakan terminologi yang sama untuk data dari jenis yang berbeda. Sebagai contoh, penjualan bersih bisa berarti komisi bersih untuk departemen pemasaran, tetapi retur penjualan kotor bagi departemen akuntansi. Data yang terintegrasi mengatasi inkonsistensi dan menyediakan istilah yang seragam di organisasi keseluruhan. Juga, format, waktu dan data bervariasi di seluruh bumi. c. Time-variant (time series) Data tidak menyediakan status saat ini. Mereka disimpan untuk lima atau sepuluh tahun atau lebih dan digunakan untuk tren, peramalan, dan perbandingan. Ada kualitas sementara pada sebuah data warehouse. Waktu adalah dimensi penting yang harus didukung oleh semua data warehouse. Data untuk analisis dari berbagai sumber berisi berbagai poin waktu (misal harian, mingguan, bulanan).

7 17 d. Non-volatile Sekali dimasukkan ke dalam warehouse, data adalah read-only, mereka tidak bisa diubah atau dibarui. Data usang dibuang, dan perubahan direkam sebagai data baru. Ini memungkinkan data warehouse untuk disesuaikan hampir secara eksklusif untuk akses data. Sebagai contoh, sejumlah besar ruang kosong (untuk pertumbuhan data) umumnya tidak diperlukan dan reorganisasi database dapat dijadwalkan bersama dengan operasi pengisian sebuah data warehouse. e. Ringkas Jika diperlukan, data operasional dikumpulkan ke dalam ringkasan-ringkasan. f. Tidak ternormalisasi Data di dalam sebuah data warehouse biasanya tidak dinormalisasi dan sangat redundan. g. Sumber Semua data ada, baik internal maupun eksternal. h. Metadata Metadata digambarkan sebagai data tentang data. 2.4 Arsitektur Data Warehouse Sistem data warehouse memiliki dua arsitektur utama yaitu : arsitektur aliran data dan arsitektur sistem (Rainardi, 2008:p.29) Arsitektur aliran data Arsitektur aliran data berisi mengenai bagaimana penyimpanan data diatur di dalam data warehouse dan bagaimana data mengalir dari sistem asal ke pengguna melalui penyimpanan-penyimpanan data ini (Rainardi, 2008:p.29).

8 18 Penyimpanan data (data stores) merupakan komponen penting dari arsitektur aliran data. Penyimpanan data merupakan satu atau beberapa basis data atau filefile yang berisi data dari data warehouse, yang disusun dalam suatu format tertentu dan terlibat dalam proses-proses data warehouse. Berdasarkan hak akses dari pengguna maka penyimpanan data dapat diklasifikasikan menjadi tiga (Rainardi, 2008:p.30), yaitu: a. User facing data store Penyimpanan data yang tersedia untuk end user dan di-query oleh aplikasi end user. b. Internal data store Penyimpanan data yang digunakan secara internal oleh komponen data warehouse untuk tujuan integrasi, pembersihan, pencatatan dan persiapan data dan tidak dibuka untuk diakses oleh end user dan aplikasi end user. c. Hybrid data store Penyimpanan data yang digunakan baik untuk mekanisme internal data warehouse dan untuk diakses oleh end user dan aplikasi end user. Berdasarkan format data, penyimpanan data dapat diklasifikasikan menjadi empat (Rainardi, 2008:p.30), yaitu: a. Stage Stage merupakan penyimpanan data internal yang digunakan untuk merubah dan mempersiapkan data yang diperoleh dari sistem asal, sebelum data dikirim ke penyimpanan data yang lain dalam data warehouse.

9 19 b. Normalized data store (NDS) NDS merupakan penyimpanan data master internal dalam bentuk satu atau beberapa basis data relasional ternormalisasi untuk tujuan integrasi data yang berasal dari beberapa sumber data yang ditangkap dalam proses stage, sebelum data dikirim ke user-facing data store. c. Operational data store (ODS) ODS merupakan penyimpanan data hybrid dalam bentuk satu atau beberapa basis data relasional ternormalisasi yang mengandung data transaksi serta data master versi terkini untuk tujuan mendukung aplikasi operasional. d. Dimensional data store (DDS) DDS merupakan user facing data store dalam bentuk satu atau beberapa basis data relasional, dimana data disusun dalam format dimensional untuk tujuan mendukung permintaan analisis data. Untuk lebih jelasnya arsitektur aliran data dapat dilihat pada gambar 2.1: Gambar 2.1 Arsitektur Aliran Data (Sumber : Rainardi, 2008:p.35)

10 Arsitektur sistem Arsitektur sistem berisi mengenai konfigurasi fisik dari server-server, jaringan, perangkat lunak, perangkat penyimpanan, dan klien-klien (Rainardi, 2008:p.29). Perancangan arsitektur sistem membutuhkan pengetahuan tentang perangkat keras (khususnya server), jaringan (yang berhubungan dengan keamanan dan kinerja) serta media penyimpanan (SAN, RAID, Tape Backup). Untuk lebih jelasnya arsitektur sistem dapat dilihat pada gambar 2.2: Gambar 2.2 Arsitektur Sistem (Sumber : Rainardi, 2008:p.42) 2.5 Metodologi Pengembangan Data Warehouse Pembuatan data warehouse pada penelitian ini menggunakan pendekatan business dimensional lifecycle dari Ralph Kimball. Adapun diagram dari pendekatan business dimensional lifecycle ini dapat dilihat pada gambar 2.3:

11 21 Technical Architecture Design Product Solution & Installation Project Planning Business Requirement Definition Dimensional Modelling Physical Design Data Staging Design & Development Deployment Maintenance & Growth End User Application Specification End User Application Development Project Management Gambar 2.3 Diagram Business Dimensional Life Cycle (Sumber : Kimball, 1998:p.2.3) Pendekatan business life cycle yang diusulkan oleh Ralp Kimball ini adalah pendekatan yang mengintegrasikan 3 konsepsi yang berbeda dari sudut pandang bisnis, yaitu teknologi, data, dan aplikasi (Kimball, 1998:p.2.2). Berikut ini akan dijelaskan masing-masing komponen yang terdapat pada diagram business dimensional lifecycle: a. Project Planning Perencanaan proyek membahas definisi dan cakupan dari proyek data warehouse, termasuk penilaian kesiapan dan justifikasi bisnis. Perencanaan proyek berfokus pada sumber daya, ditambah dengan tugas proyek yang akan diberikan, durasi waktu, dan urutan pengerjaan. b. Data Track : Dimensional Modelling Definisi dari kebutuhan bisnis menentukan data yang diperlukan untuk kebutuhan analisis pengguna bisnis. Merancang model data untuk mendukung analisis membutuhkan pendekatan yang berbeda dari yang digunakan untuk

12 22 desain sistem operasional. Tahapan ini mengidentifikasi tabel fakta, dimensidimensi yang terkait dan atribut-atribut. Desain database logis dilengkapi dengan struktur tabel yang sesuai dan hubungan primary / foreign key. Rencana agregasi awal juga dikembangkan pada tahapan ini. c. Data Track : Physical Design Desain database fisik yang berfokus pada bagaimana cara mendefinisikan struktur fisik yang diperlukan untuk mendukung desain database logis. Elemen utama dari proses ini meliputi mendefinisikan penamaan standar dan menyiapkan lingkungan database. Pengindeksan awal dan strategi partisi juga ditentukan pada tahapan ini. d. Data Track : Data Staging Design and Development Tahapan ini berfokus pada perencanaan dan pembuatan database data staging. Proses pada data staging ini meliputi extraction, transformation, dan load. e. Technology Track : Technical Architecture Design Lingkungan data warehouse membutuhkan integrasi dari beberapa jenis teknologi. Pada tahapan ini akan ditentukan jenis teknologi yang akan dipakai pada data warehouse seperti spesifikasi perangkat keras server, jaringan, perangkat lunak sistem operasi, perangkat lunak basis data, dll. Ada tiga hal penting yang harus dipertimbangkan dalam tahapan ini, yaitu : analisa kebutuhan arsitektur, arsitektur yang sedang berjalan dan arah pengembangan arsitektur di masa depan.

13 23 f. Technology Track : Product Selection and Installation Pada tahapan ini akan dilakukan proses evaluasi dan pemilihan dari komponenkomponen hardware dan software yang telah dipilih pada tahapan technical architecture design. Setelah dipilih maka komponen ini kemudian akan dipakai/dipasang. g. Application Track : End User Application Specification Sebaiknya mendefinisikan satu set aplikasi pengguna akhir yang standar karena tidak semua bisnis pengguna memerlukan akses ad hoc ke gudang data. Spesifikasi aplikasi menggambarkan template laporan, parameter yang harus dimasukkan oleh pengguna, dan perhitungan yang diperlukan. Spesifikasi ini memastikan bahwa tim pengembangan dan pengguna bisnis memiliki pemahaman umum yang sama akan aplikasi yang akan dikembangkan. h. Application Track : End User Application Development Pada tahapan ini akan dikembangkan end user application yang telah disesuaikan dengan spesifikasi yang telah ditentukan pada tahapan end user application specification. i. Deployment Deployment merupakan proses konvergensi dari teknologi, data, dan aplikasi pengguna akhir yang diakses dari komputer desktop pengguna bisnis. j. Maintenance and Growth Pada tahapan ini akan dilakukan proses pemeliharaan pada teknologi, data, dan aplikasi pengguna akhir yang terdapat dalam lingkungan data warehouse. Seiring perkembangan waktu pasti akan terjadi pertumbuhan data yang pesat

14 24 dimana mengakibatkan terjadinya penyesuaian pada teknologi, data, dan aplikasi pengguna akhir terhadap kebutuhan yang baru. k. Project Management Manajemen proyek memastikan bahwa kegiatan-kegiatan yang terdapat dalam business dimensional lifecycle tetap berada pada jalur yang benar (spesifikasi yang telah ditentukan sebelumnya) dan berjalan sinkron antar kegiatan satu dengan kegiatan yang lain. 2.6 Sistem ETL dalam Data Warehouse ETL merupakan singkatan dari extract, transform, load. Sistem ETL merupakan sekumpulan proses-proses yang mengambil data dari sistem sumber, melakukan perubahan pada data dan mengirimkan data ke suatu sistem target (Rainardi, 2008:p.4). Menurut Kimball, sistem ETL merupakan pondasi dari data warehouse. Sebuah sistem ETL yang dirancang dengan baik akan mengekstrak data dari sistem sumber, memberlakukan standar kualitas data dan konsistensi data, melakukan penyesuaian data sehingga beberapa sumber berbeda dapat digunakan secara bersama-sama, dan pada akhirnya akan mengirimkan data dalam format siap pakai sehingga pengembang aplikasi dapat membangun aplikasi dan pengguna akhir dapat membuat keputusan (Kimball, 2004:p.xxi). Berikut ini pada gambar 2.4 akan ditunjukkan arsitektur sistem ETL dalam data warehouse khususnya untuk bagian staging area:

15 25 Gambar 2.4 Arsitektur Sistem ETL pada Bagian Staging Area (Sumber : Kimball, 2004:p.18) Extraction Data mentah yang berasal dari sistem sumber biasanya ditulis langsung ke disk dengan beberapa restrukturisasi minimal sebelum transformasi konten yang signifikan terjadi. Data dari sistem sumber terstruktur (seperti IMS database, atau XML data set) sering ditulis ke flat file atau tabel relasional dalam langkah ini. Hal ini memungkinkan proses ekstraksi data menjadi sesederhana dan secepat mungkin serta memungkinkan fleksibilitas yang lebih besar untuk mengulangi proses ekstraksi data jika ada gangguan. Data awal yang diambil kemudian dapat dibaca beberapa kali seperlunya untuk mendukung langkah-langkah berikutnya. Dalam beberapa kasus, data awal yang diambil akan dibuang setelah langkah pembersihan selesai, sedangkan pada kasus lain data akan disimpan sebagai arsip cadangan jangka panjang. Data awal yang diambil juga dapat disimpan untuk setidaknya satu siklus capture sehingga perbedaan antara proses ekstraksi data yang berturut-turut dapat dihitung (Kimball, 2004:p.18).

16 Cleaning Proses cleaning ini merupakan salah satu bagian dari proses data transformation. Dalam kebanyakan kasus, tingkat kualitas data yang dapat diterima dari sistem sumber bisa berbeda dengan kualitas yang dibutuhkan oleh data warehouse. Kualitas pengolahan data dapat melibatkan banyak langkah diskrit, termasuk memeriksa nilai-nilai yang valid (apakah ada kode pos? dan apakah kode pos berada dalam rentang nilai yang valid?), memastikan konsistensi pada nilai (apakah kode pos dan kota konsisten?), menghapus duplikat (apakah pelanggan yang sama muncul dua kali dengan atribut sedikit berbeda?), dan memeriksa apakah aturan bisnis yang kompleks dan prosedur telah ditegakkan (apakah pelanggan platinum memiliki keterkaitan dengan status kredit diperpanjang?). Transformasi data-cleaning bahkan mungkin melibatkan intervensi manusia. Hasil langkah pembersihan data sering disimpan secara semi permanen karena transformasi yang diperlukan sulit dan tidak dapat diubah. Ini adalah pertanyaan yang menarik dalam lingkungan apapun, apakah data yang sudah dibersihkan dapat dikirim kembali ke sistem sumber untuk meningkatkan kualitas data mereka dan mengurangi kebutuhan untuk memproses masalah data yang sama berulang-ulang. Bahkan jika data yang sudah dibersihkan tidak dapat dikirimkan ke sistem sumber, permasalahan ini tetap harus dilaporkan supaya dapat dilakukan perbaikan dalam sistem sumber (Kimball, 2004:p.18-19) Conforming Proses conforming merupakan salah satu bagian dari proses data transformation. Data konformasi diperlukan ketika dua atau lebih sumber data

17 27 digabungkan ke dalam data warehouse. Sumber data terpisah tidak dapat dilihat bersama-sama kecuali beberapa atau semua label tekstual dalam sumber-sumber ini telah dibuat identik dan kecuali langkah-langkah numerik yang serupa telah dirasionalisasi secara matematis sehingga perbedaan dan rasio antara langkahlangkah ini menjadi masuk akal. Data konformasi merupakan langkah signifikan yang lebih sederhana dari data cleaning. Data konformasi memerlukan kesepakatan perusahaan besar untuk penggunaan domain dan langkah-langkah standar (Kimball, 2004:p.19) Delivering Proses delivering ini lebih dikenal dengan nama proses loading. Proses delivering adalah suatu proses untuk mengirim data hasil proses transformasi data (data yang sudah dibersihkan dan data yang sudah disesuaikan formatnya) ke dalam data warehouse. Data warehouse ini berupa penyimpanan data dimensional (Data Dimensional Store). Isi dari data dimensional store (DDS) inilah yang akan diakses oleh aplikasi end user baik untuk kepentingan business intelligence (BI), analytics (On Line Analytical Processing), data mining, dashboard, scorecards, reports (Rainardi, 2008). 2.7 Metode ETL Dalam hal siapa yang memindahkan data keluar dari sistem sumber, kita dapat mengkategorikan metode ETL menjadi empat pendekatan (Rainardi, 2008:p.176):

18 28 a. Proses ETL menarik data keluar dari sistem sumber dengan melakukan query secara reguler ke basis data sistem sumber. Ini merupakan pendekatan yang paling umum digunakan. Proses ETL melakukan koneksi ke basis data sistem sumber, melakukan query data, dan membawa data keluar. b. Proses trigger di basis data sistem sumber mendorong data yang berubah keluar dari sistem sumber. Trigger basis data adalah kumpulan dari perintah SQL yang dieksekusi setiap ada operasi insert, update, atau delete pada suatu tabel. Dengan menggunakan trigger, kita dapat menyimpan baris data yang berubah ke dalam tabel yang lain. c. Proses terjadwal yang terdapat pada sistem sumber yang mengirim data keluar secara reguler. Hal ini mirip dengan pendekatan yang pertama, akan tetapi program yang melakukan query ke basis data bukanlah suatu program ETL eksternal, melainkan suatu program eksporter internal yang berjalan pada server sistem sumber. d. Log reader membaca file log basis data untuk mengidentifikasi perubahan data. File log basis data mengandung suatu catatan dari suatu transaksi yang terjadi pada basis data tersebut. Log reader adalah suatu program yang memahami format dari data yang terdapat pada file log. Log reader membaca file-file log, mengirim data ke luar sistem sumber, dan menyimpan data di tempat lain. Keempat metode ETL ini dapat dilihat pada gambar 2.5:

19 29 Gambar 2.5 Empat Metode ETL (Sumber : Rainardi, 2008:p.176) 2.8 Pendekatan dalam Pembuatan Data Warehouse Menurut Ponniah, ada dua pendekatan dalam pembuatan data warehouse yaitu pendekatan top-down dan pendekatan bottom-up (Ponniah, 2010:p.29) Pendekatan Top-Down Bill Inmon adalah salah satu pendukung terdepan dari pendekatan top-down. Dia telah mendefinisikan data warehouse sebagai repositori terpusat untuk seluruh perusahaan. Dalam pendekatan ini, data di gudang data disimpan pada tingkat terendah dari granularity yang didasarkan pada model data dinormalisasi. Dalam visi Inmon, gudang data pada pusat "Corporate Information Factory" (CIF) menyediakan kerangka logis untuk memberikan kecerdasan bisnis (BI) untuk perusahaan. Operasi bisnis menyediakan data untuk mendorong CIF. Data warehouse terpusat akan menyediakan kebutuhan untuk dependent data mart yang mungkin dirancang berdasarkan model data dimensi. Keuntungan dari pendekatan ini adalah: a. Bukan penggabungan dari data mart-data mart yang berbeda. b. Tempat penyimpanan data hanya satu, terpusat.

20 30 c. Aturan dan kontrol dilakukan secara terpusat. d. Dapat melihat hasil cepat jika diimplementasikan secara iteratif. Kerugian dari pendekatan ini adalah: a. Membutuhkan waktu pengembangan yang lebih lama walaupun dengan menggunakan metode iteratif. b. Memiliki resiko kegagalan yang sangat tinggi. c. Membutuhkan keterampilan lintas fungsional yang sangat tinggi. d. Pengeluaran akan besar jika tidak terdapat pembuktian dari konsep Pendekatan Bottom-Up Ralp Kimball, merupakan salah satu pendukung terdepan untuk pendekatan Bottom-Up. Dalam pendekatan ini data mart dibuat pertama kali untuk memberikan analisis dan kemampuan pelaporan untuk subjek bisnis yang spesifik berdasarkan pada model data dimensi. Data mart berisi data pada tingkat terendah dari granularity dan juga sebagai ringkasan, tergantung pada kebutuhan untuk analisis. Data mart ini kemudian akan digabungkan menjadi suatu data warehouse. Keuntungan dari pendekatan ini: a. Cepat dan mudah untuk diimplementasikan. b. Dapat memberikan keuntungan atas investasi dengan suatu konsep yang dapat dibuktikan. c. Resiko kegagalan kecil. d. Dapat melakukan penjadwalan supaya data mart yang penting dibuat terlebih dahulu.

21 31 Kerugian dari pendekatan ini: a. Setiap data mart memiliki pandangan yang berbeda akan data. b. Dapat terjadi data redundan pada setiap data mart. c. Data tidak konsisten. d. Interface tidak dapat diatur. 2.9 Dimensional Data Modelling Menurut Rainardi (2008), Sebuah gudang data adalah sistem yang mengambil data dari sistem sumber dan meletakkannya ke dalam penyimpanan data dimensi (data dimensional store). Sebuah data dimensional store (DDS) adalah satu atau beberapa database yang berisi kumpulan data mart dimensional. Data mart dimensional adalah sekelompok tabel fakta yang terkait satu sama lainnya dan dikelilingi oleh beberapa tabel dimensi yang berhubungan dengan tabel fakta, yang berisi pengukuran dari kegiatan bisnis yang dikategorikan oleh tabel dimensi (Rainardi, 2008:p.7). Sebuah penyimpanan data dimensional merupakan penyimpanan data dalam bentuk yang tidak dinormalisasi dimana semua tabel dimensinya telah disesuaikan. Tabel dimensi yang sesuai berarti semua tabel dimensi memiliki dimensi yang sama atau satu tabel dimensi adalah subset dari tabel dimensi yang lain. Dimensi A dikatakan himpunan bagian dari dimensi B ketika semua kolom dimensi A ada di dimensi B dan semua baris dimensi A ada di dimensi B (Rainardi, 2008:p.7).

22 32 Sebuah penyimpanan data dimensional dapat diimplementasikan secara fisik dalam beberapa bentuk skema yang berbeda: skema bintang (star schema), skema kepingan salju (snow flake schema), dan skema galaksi (galaxy schema). a. Skema Bintang Dalam skema bintang, dimensi tidak memiliki sub tabel (sub dimensi). Skema bintang dapat dilihat pada gambar 2.6. b. Skema Kepingan Salju Gambar 2.6 Skema Bintang (Sumber : Inmon, 2005:p.360) Dalam skema kepingan salju, dimensi dapat memiliki sub dimensi. Tujuan adanya sub dimensi ini adalah untuk meminimalkan terjadinya pengulangan data yang sama (data redundansi). Skema kepingan salju dapat dilihat pada gambar 2.7. Gambar 2.7 Skema Kepingan Salju (Sumber : Inmon, 2005:p.361)

23 33 c. Skema Galaksi Galaksi skema juga dikenal dengan nama skema konstelasi fakta (fact constellation schema). Dalam skema galaksi kita memiliki dua atau lebih tabel fakta yang saling terkait satu sama lainnya yang dikelilingi oleh beberapa tabel dimensi. Kelebihan dari skema bintang adalah skema bintang lebih sederhana dan lebih konsisten dari skema kepingan salju dan skema galaksi, karena hanya memiliki satu level pada semua dimensi, sehingga memudahkan proses ETL untuk memuat data ke DDS. Kekurangan skema bintang adalah membutuhkan ruang penyimpanan data yang besar karena banyak terjadi pengulangan data (data redundansi) (Rainardi, 2008:p.7). Kelebihan dari skema kepingan salju adalah bahwa beberapa aplikasi analisis data bekerja lebih baik dengan skema kepingan salju dibandingkan dengan skema bintang atau skema galaksi. Kelebihan yang lain dari skema kepingan salju adalah mengurangi terjadinya data redundansi, sehingga lebih sedikit ruang penyimpanan data yang diperlukan. Kekurangan dari skema kepingan salju adalah skemanya lebih komplek karena adanya sub dimensi. Hal ini menyebabkan waktu respon dari suatu query juga akan menurun karena adanya operasi JOIN untuk menggabungkan tabel dimensi dengan tabel sub dimensi (Rainardi, 2008:p.7). Kelebihan dari skema galaksi adalah kemampuan untuk memodelkan peristiwa bisnis (business event) secara lebih akurat dengan menggunakan beberapa tabel fakta. Kekurangan dari skema galaksi adalah arsitekturnya lebih komplek karena terdapatnya dua atau lebih tabel fakta. Hal ini menyebabkan skema ini lebih

24 34 susah untuk dipahami dan waktu respon juga jauh lebih lambat dibandingkan skema kepingan salju karena operasi JOIN menjadi lebih komplek karena melibatkan beberapa tabel fakta yang terhubung dengan beberapa tabel dimensi (Rainardi, 2008:p.7) Komponen Dimensional Data Modelling Dalam dimensional modelling, basis data dibangun berdasarkan pengukuran numerik dari perusahaan. Tabel fakta mengandung pengukuran dan tabel dimensi mengandung konteks pengukuran yang terdapat disekitarnya (Kimball, 2004:p.209). Dalam dimensional data modelling terdapat dua komponen utama yaitu tabel fakta dan tabel dimensi Tabel fakta Hubungan antara tabel fakta dan pengukuran adalah sangat sederhana. Jika pengukuran ada, maka dapat dimodelkan menjadi suatu baris pada tabel fakta. Jika suatu baris dari tabel fakta ada maka itu adalah pengukuran (Kimball, 2004:p.209). Sebuah tabel fakta adalah struktur yang berisi banyak kejadian data. Disekitar tabel fakta adalah tabel dimensi, yang menggambarkan salah satu aspek penting dari tabel fakta. Jumlah kemunculan data pada tabel dimensi lebih sedikit dibandingkan dengan jumlah kemunculan data pada tabel fakta (Inmonn, 2005: p.360). Tabel fakta adalah suatu tabel yang menjadi pusat dari beberapa tabel dimensi dalam skema bintang (Inmonn, 2005:p.497).

25 35 Ciri-ciri tabel fakta adalah (Wiswani, 2012:p.22): a. Primary key pada tabel fakta terdiri atas gabungan lebih dari satu primary key yang dimiliki tabel-tabel dimensi yang terkait (concatenated key). b. Memiliki tingkatan data yang telah teridentifikasi. c. Mudah untuk melakukan rekap data. d. Memiliki jumlah record yang banyak. e. Memiliki kolom atau atribut yang sedikit. f. Tidak memiliki baris yang berisi nilai null Tabel dimensi Tabel dimensi merupakan tempat dimana sekumpulan data yang berhubungan dengan tabel fakta ditempatkan dalam suatu tabel multi dimensi (Inmonn, 2005:p.495). Tabel dimensi adalah tabel yang berisi berbagai atribut yang menjelaskan kunci dimensi yang terdapat pada tabel fakta (Rainardi, 2008:p.76). Ciri-ciri tabel dimensi adalah (Wiswani, 2012:p.22): a. Memiliki key unik pada tabel dimensi (primary key). b. Memiliki jumlah kolom atau atribut yang banyak. c. Atributnya textual dan tidak saling berhubungan. d. Tabelnya tidak dilakukan normalisasi. e. Mempunyai kemampuan untuk drill-down dan roll-up. f. Memiliki jumlah record yang sedikit dibandingkan tabel fakta.

26 Agregasi Tabel Fakta Agregasi adalah proses perhitungan ringkasan data dari keseluruhan data (record) yang ada. Hal ini sering digunakan untuk mengurangi ukuran tabel fakta dengan menggabungkan data ke dalam ringkasan data jika tabel fakta dibuat. Namun, ketika data diringkas dalam tabel fakta, informasi rinci tidak lagi langsung tersedia bagi analis. Jika informasi rinci diperlukan, baris detail yang diringkas harus diidentifikasi dan dicari, mungkin dalam sistem sumber yang memberikan data. Data tabel fakta harus dipertahankan pada kemungkinan granularity terbaik. Menggabungkan data dalam tabel fakta hanya boleh dilakukan setelah mempertimbangkan konsekuensinya (Technet, 2014). Mencampur data agregat dan rinci dalam tabel fakta dapat menyebabkan masalah dan komplikasi bila menggunakan data warehouse. Sebagai contoh, order penjualan sering berisi beberapa item baris dan mungkin berisi diskon biaya, pajak, atau pengiriman yang diterapkan pada total order bukan item baris individu, namun jumlah dan identifikasi barang dicatat pada tingkat item baris. Permintaan summarization menjadi lebih kompleks dalam situasi ini, dan alat-alat seperti Analysis Services sering membutuhkan pembuatan suatu filter khusus untuk menangani permasalahan ini (Technet, 2014). Ada dua pendekatan yang dapat digunakan dalam situasi ini. Satu pendekatan adalah untuk mengalokasikan nilai-nilai tingkat untuk baris item berdasarkan nilai, kuantitas, atau berat pengiriman. Pendekatan lain adalah untuk membuat dua tabel fakta, satu berisi data pada tingkat item baris, yang lain berisi informasi order-level. Kunci identifikasi urutan harus dilakukan dalam tabel rinci

27 37 fakta sehingga dua tabel dapat dihubungkan. Urutan tabel kemudian dapat digunakan sebagai tabel dimensi ke tabel detail, dengan nilai order-level yang dianggap sebagai atribut dari tingkat urutan hirarki dimensi (Technet, 2014) Manajemen Kunci Sebuah surrogate key adalah identifier dari baris data master dalam data warehouse. Dalam DDS, surrogate key digunakan sebagai primary key dari tabel dimensi. Surrogate key adalah bilangan bulat berurutan, mulai dari 0. Jadi, surrogate key adalah 0, 1, 2, 3,..., dan seterusnya. Dengan menggunakan surrogate key, kita dapat mengidentifikasi data unik yang terdapat pada tabel dimensi. Surrogate key juga ada pada tabel fakta untuk mengidentifikasi atribut dimensi untuk suatu transaksi bisnis tertentu. Surrogate key digunakan untuk menghubungkan tabel fakta dan tabel dimensi. Misalnya, dengan menggunakan surrogate key, kita dapat mengetahui data detail dari seorang pelanggan yang terlibat pada suatu transaksi tertentu (Rainardi, 2008:p.37). Natural key adalah suatu identifier unik dari baris data pada suatu tabel master yang terdapat dalam sistem sumber (OLTP). Ketika terjadi pengambilan data dari OLTP untuk dikirim ke data staging, maka kita perlu menerjemahkan natural key dari sistem sumber menjadi surrogate key untuk data warehouse. Hal ini dapat dilakukan dengan memeriksa surrogate key yang terdapat pada data staging, untuk setiap nilai natural key dari sistem sumber. Jika natural key ada di data staging, itu berarti data sudah ada di data staging dan perlu diperbarui. Jika

28 38 natural key tidak ada di data staging, itu berarti data tidak ada di data staging dan perlu dibuat (Rainardi, 2008:p.37). Surrogate key tidak akan memiliki arti apa-apa sebelum dilakukan mapping dengan natural key yang terdapat pada sistem sumber (Kimball, 2004:p.214) Metode Ekstraksi Data Setelah kita berhasil melakukan koneksi ke sumber data (sistem sumber) maka selanjutnya kita bisa melakukan proses ekstraksi data. Ketika melakukan ekstraksi data dari suatu basis data relasional yang terdiri dari banyak tabel, kita dapat menggunakan salah satu dari empat metode di bawah ini (Rainardi, 2008:p ) : a. Whole Table Every Time Metode whole table every time akan digunakan jika ukuran tabelnya kecil, seperti suatu tabel yang terdiri dari 3 kolom bertipe integer atau varchar (10), dan hanya berisi beberapa baris data. Alasan yang lebih umum mengapa memakai metode ini adalah karena tidak ada timestamp atau kolom identitas yang dapat digunakan untuk mengetahui baris mana yang telah diperbarui sejak proses ekstraksi data yang terakhir. b. Incremental Extract Tabel transaksi dalam suatu organasisasi besar adalah suatu tabel besar yang berisi ratusan ribu baris bahkan ratusan juta baris (atau lebih banyak lagi). Hal ini menyebabkan proses ekstraksi data dapat memakan waktu berhari-hari untuk mengekstrak data dari seluruh tabel. Proses ini merupakan proses yang sangat

29 39 intensif memakai sumber daya harddisk (storage device) sehingga dapat menurunkan kinerja transaksional pada aplikasi front-end karena terjadi bottleneck pada basis data. Hal Ini bukanlah pilihan yang layak sebagai metode ekstraksi data (karena waktu yang dibutuhkan untuk mengekstraksi data), jadi perlu suatu metode lain untuk mengekstrak data dari sistem sumber. Untuk mengatasi permasalah seperti kasus ini maka digunakan metode incremental extraction. Incremental extraction adalah teknik untuk men-download hanya baris yang mengalami perubahan data pada sistem sumber, bukan men-download seluruh baris yang terdapat pada suatu tabel. Kita dapat menggunakan beberapa hal untuk mengekstraksi data dengan metode incremental extraction, yaitu : kolom timestamp, kolom identitas, tanggal transaksi, pemicu (triggers), atau kombinasi dari beberapa metode ini. c. Fixed Range Jika tidak mungkin untuk mengekstrak seluruh tabel karena tabel terlalu besar dan tidak mungkin untuk melakukan metode incremental extraction, misalnya, karena tidak ada kolom timestamp atau kolom timestamp tidak dapat diandalkan, karena tidak ada kolom identitas incremental extraction yang dapat diandalkan, dan karena tidak mungkin untuk memasang pemicu (triggers) dalam sistem sumber maka ada satu pendekatan yang lain yang bisa kita lakukan. Kita dapat menggunakan metode "fixed range". Pada dasarnya dengan menggunakan metode fixed range, kita akan mengekstrak sejumlah data yang berada pada suatu jangka waktu tertentu. Misalnya, kita

30 40 mengekstrak data enam bulan terakhir, berdasarkan tanggal transaksi. Kita bisa mendapatkan durasi periode waktu transaksi dari sumber aplikasi jika ada pembatasan pada aplikasi front-end. Sebagai contoh, ketika proses closing (tutup buku) akhir bulan dilakukan, maka baris data tidak akan dapat diubah lagi. Dalam kasus ini, kita dapat men-download data pada lima minggu terakhir pada saat setiap kali proses ETL berjalan atau kita dapat men-download data di mana tanggal transaksi terjadi setelah tanggal akhir bulan (closing date). Jika tidak ada kolom tanggal transaksi dalam tabel dan kita tidak dapat mengekstrak seluruh tabel karena merupakan suatu tabel besar, maka kita dapat menggunakan systemassigned row ID untuk mengekstrak data dengan metode fixed range, seperti mengekstrak baris data yang terakhir. Yang dimaksud dengan system-assigned row ID adalah kolom tersembunyi dalam setiap tabel yang berisi nilai-nilai sekuensial yang diberikan oleh sistem. Tidak semua sistem database memiliki system-assigned row ID; misalnya, Oracle dan Informix memiliki system-assigned row ID, tapi SQL Server dan DB/2 tidak. (Dalam DB/2, system-assigned row ID adalah tipe data, bukan kolom tersembunyi.) Bila menggunakan system-assigned row ID, kita tidak memiliki batasan pada aplikasi front-end, jadi kita perlu memonitor sistem sumber dan mencari tahu berapa banyak baris yang kita perlu ambil setiap kali proses ekstraksi data dilakukan. Men-download kolom primary key setiap hari, dan membandingkan data primary key antar setiap proses download, setiap hari, untuk mendeteksi perubahan pada data. Proses identifikasi baris baru dan baris yang dihapus sangat mudah dilakukan dengan membandingkan primary key.

31 41 d. Related Tables Jika baris dalam tabel sumber diperbarui, maka kita perlu untuk mengambil baris yang bersesuaian dalam tabel lain yang terkait dengan baris pada tabel yang diperbarui. Sebagai contoh, jika order ID di tabel header order diperbarui dan diekstraksi ke gudang data, baris untuk order ID pada tabel detail order juga harus diekstrak ke gudang data, dan sebaliknya. Sebagai contoh, jika sebuah baris dalam tabel detail order diperbarui dan baris tersebut diekstraksi ke dalam gudang data, maka baris yang bersesuaian di tabel header order juga perlu diekstrak ke dalam gudang data. Hal ini juga berlaku pada waktu menyisipkan dan menghapus baris data. Jika baris baru (order baru) dimasukkan ke dalam tabel header order dalam sistem sumber, maka baris tabel detail order yang bersesuaian dengan baris baru pada tabel header order juga perlu dimasukkan ke dalam data warehouse tabel detail order. Jika suatu baris ditandai sebagai canceled (soft delete) dalam tabel header order pada sistem sumber, maka baris yang bersesuaian pada tabel detail order juga harus dibatalkan (canceled). Kita juga dapat melakukan hal ini dalam aplikasi data warehouse, tapi idealnya hal itu dilakukan dalam database data warehouse. Jika suatu baris secara fisik dihapus dalam tabel header order, maka baris yang bersesuaian pada tabel detail order dalam data warehouse juga perlu ditandai sebagai dihapus. Untuk melakukan hal ini, maka kita harus mengidentifikasi perubahan baris dalam tabel pertama, dan kemudian menggunakan hubungan relasi antara kunci primer (primary key) dan kunci asing (foreign key), kita juga mengidentifikasi baris dalam tabel kedua, dan

32 42 sebaliknya. Sebagai contoh, dalam kasus yang melibatkan tabel header order dan tabel detail order, terlebih dahulu kita menemukan adanya baris yang berubah pada tabel header order, maka kemudian kita akan mengidentifikasi baris yang bersesuaian dalam tabel detail order, dan pada akhirnya kita akan mengekstrak kedua set baris dari kedua tabel tersebut ke dalam data warehouse Slowly Changing Dimension Slowly Changing Dimension (SCD) adalah suatu teknik yang digunakan untuk menyimpan nilai historis dari atribut-atribut yang terdapat pada suatu tabel dimensi (Rainardi, 2008:p.80). Ada tiga tipe dari SCD yaitu : a. SCD tipe 1 SCD tipe 1 adalah suatu teknik SCD yang menimpa nilai lama dari suatu atribut dengan nilai yang baru, sehingga nilai lama tidak dipertahankan. b. SCD tipe 2 SCD tipe 2 adalah suatu teknik SCD yang mempertahankan nilai lama dari suatu atribut dengan membuat baris data baru setiap terjadi perubahan pada nilai atribut tersebut. c. SCD tipe 3 SCD tipe 3 adalah suatu teknik SCD yang mempertahankan nilai lama dari suatu atribut dengan meletakkan nilai lama ini pada kolom yang lain pada baris data yang sama. Umumnya, SCD tipe 2 lebih fleksibel untuk menyimpan nilai historis dari atribut-atribut dimensional. Hal ini dikarenakan dengan SCD tipe 2, kita dapat

33 43 menyimpan banyak versi nilai historis dari atribut-atribut dimensional tanpa mengubah struktur tabel (Rainardi, 2008:p.81). SCD tipe 3 menggunakan kolom untuk menyimpan nilai-nilai lama, sehingga SCD tipe 3 menjadi tidak fleksibel. SCD tipe 3 ideal digunakan untuk situasi di mana kita tidak memiliki banyak versi nilai (lima atau lebih sedikit) dan kita tahu hanya akan ada sejumlah versi dari nilai atribut tersebut. SCD tipe 3 ini juga cocok digunakan ketika perubahan nilai atribut ini mempengaruhi cukup banyak baris data. Dengan kata lain, banyak baris dimensi mengubah nilai atribut ini pada saat yang sama (simultan) (Rainardi, 2008:p.81) Real Time Data Warehouse Data warehouse tradisional adalah pasif, memberikan tren historis, sedangkan real-time data warehouse adalah dinamis, memberikan pandangan yang paling up-to-date tentang suatu bisnis secara real time. Sebuah real time data warehouse akan akan diperbarui secara terus menerus, dengan waktu tunggu hampir mendekati nol (Ponniah, 2010:p.50). Real-time ETL bukanlah layanan data warehouse yang benar-benar real time. Dengan kata lain, real time ETL merupakan suatu perangkat lunak yang memindahkan data secara asynchronous (secara terus menerus) ke dalam suatu data warehouse dengan terdapat waktu jeda setelah proses eksekusi transaksi bisnis pada sistem sumber (Kimball, 2004:p.424). Sebuah gudang data, beberapa tahun yang lalu, biasanya diperbarui setiap hari atau setiap minggu. Dalam dua sampai tiga tahun terakhir, telah terjadi lebih banyak dan lebih banyak lagi permintaan untuk meningkatkan frekuensi update

34 44 data pada gudang data. Para pengguna ingin melihat data dalam gudang data diperbarui setiap dua menit atau bahkan secara real time. Sebuah real time data warehouse adalah gudang data yang diperbarui (dengan ETL) saat transaksi terjadi dalam sistem sumber (Rainardi, 2008:p.27). Sebagai contoh, kita dapat menempatkan pemicu (triggers) pada tabel transaksi penjualan dalam sistem sumber sehingga setiap kali ada transaksi penjualan yang dimasukkan ke dalam database, maka triggers akan aktif dan kemudian akan mengirim data baru ke gudang data sebagai sebuah pesan. Data warehouse memiliki active listener yang dapat menangkap pesan saat pesan sampai ke data warehouse, membersihkan pesan itu, menerapkan data quality service (DQS) pada pesan itu, mengubah format pesan supaya sesuai dengan format data warehouse, dan kemudian memasukkan pesan ke dalam tabel fakta. Ada perbedaan waktu dua detik di sini, antara saat pelanggan membeli produk di situs web dan saat data ini tersedia dalam tabel fakta (Rainardi, 2008:p.27). Pendekatan lain untuk mengimplementasikan real-time data warehouse adalah memodifikasi sumber aplikasi operasional (OLTP) untuk melakukan penulisan ke area data staging dari data warehouse, segera setelah menulis data ke dalam database internal. Dalam staging database, kita dapat menempatkan pemicu yang akan dipanggil setiap kali ada data baru yang akan dimasukkan, dan pemicu ini secara otomatis akan memperbarui data warehouse (Rainardi, 2008:p.27). Pendekatan near real-time data warehouse dapat diimplementasikan dengan menggunakan mini-batch dengan frekuensi dua sampai lima menit. Pendekatan ini lebih memilih untuk menarik data dari area data staging dengan

35 45 frekuensi dua sampai lima menit dibandingkan menggunakan pemicu. Mini batch ini juga melakukan proses ETL yang standar yaitu pekerjaan-mengubah data dan memuatnya ke dalam basis data dimensional dari data warehouse. Mini-batch juga dapat menarik data secara langsung dari sistem sumber, menghilangkan kebutuhan memodifikasi sistem sumber untuk memperbarui area data staging (Rainardi, 2008:p.27) Capture Transform Flow Capture, Transform, dan Flow (CTF) adalah tools untuk proses integrasi data yang relatif baru muncul, yang dirancang untuk menyederhanakan proses pemindahan data secara real time antar teknologi basis data yang berbeda-beda. Lapisan aplikasi dari aplikasi transaksional dihilangkan. Pertukaran langsung antar database-to-database akan dilakukan. Semua transaksi, baik perubahan pada tabel fakta dan tabel dimensi dapat dipindahkan secara langsung dari sistem operasional ke tabel data staging dari data warehouse dengan waktu tunggu yang sangat kecil, hanya beberapa detik (Kimball, 2004:p.444). CTF merupakan suatu pendekatan yang sangat baik untuk perusahaan yang membutuhkan near real time reporting dengan kebutuhan integrasi data yang tidak begitu besar serta (Kimball, 2004:p.445). Skema proses CTF dapat dilihat pada gambar 2.8.

36 Change Data Capture Gambar 2.8 Proses Capture, Transform, dan Flow (Sumber : Kimball, 2004:p.445) Change data capture (CDC) mencatat aktifitas insert, update, delete yang dilakukan pada sebuah tabel. Hal ini membuat detail dari perubahan data yang terjadi akan tersedia dalam format relasional yang mudah untuk dipahami. Informasi kolom dan metadata yang diperlukan untuk menerapkan perubahan ini ke lingkungan target ditangkap untuk baris yang diubah dan disimpan dalam tabel perubahan yang mencerminkan struktur kolom pada tabel sumber yang akan dilacak. Fungsi table-valued disediakan untuk memungkinkan akses sistematis ke data yang dirubah oleh konsumen (Technet, 2014). Sebuah contoh yang baik dari konsumen data yang ditargetkan oleh teknologi ini adalah aplikasi extraction, transformation, dan loading (ETL). Sebuah aplikasi ETL secara bertahap mengirim perubahan data dari tabel sumber ke data warehouse atau data mart. Meskipun representasi dari tabel sumber dalam data warehouse harus mencerminkan perubahan dalam tabel sumber, sebuah teknologi

37 47 end-to-end yang memperbarui data pada replika dari sumber tidaklah tepat. Sebaliknya, kita perlu aliran perubahan data yang handal yang terstruktur sehingga konsumen dapat menerapkannya pada representasi sasaran yang berbeda dari data (Technet, 2014). Gambar 2.9 akan menunjukkan aliran data pada teknologi change data capture. Gambar 2.9 Aliran Data pada Change Data Capture (Sumber : Technet, 2014) Sumber perubahan data untuk change data capture adalah transaction log. Setelah proses insert, update, dan delete dilakukan pada tabel sumber yang akan dilacak, entri yang menggambarkan terjadinya perubahan data ini akan ditambahkan ke dalam log. Log ini akan menjadi input untuk proses capture.

38 48 Kemudian proses change data capture akan membaca log ini dan menyimpan informasi perubahan data pada log ini ke tabel perubahan. Isi dari tabel perubahan ini kemudian akan di-query oleh proses ETL sampai akhirnya perubahan data ini akan dikirim ke dalam data warehouse. Jadi hanya perubahan data terbaru saja yang akan disimpan ke dalam data warehouse (Technet, 2014) MS SQL SERVER 2008 R2 SQL Server 2008 R2 adalah kumpulan dari komponen yang dapat kita terapkan secara terpisah atau sebagai sebuah kelompok untuk membentuk sebuah platform data yang scalable. Dalam arti luas, platform data ini terdiri dari dua jenis komponen yaitu : komponen yang akan membantu dalam mengelola data dan komponen-komponen yang akan membantu dalam mewujudkan suatu business intelligence (BI) (Mistry, 2010:p. xvii). Salah satu fitur baru pada SQL Server 2008 R2 adalah Parallel Data Warehouse. Parallel Data Warehouse ditujukan untuk sebuah enterprise data warehouse. Parallel Data Warehouse terdiri dari perangkat lunak dan perangkat keras yang dirancang untuk memenuhi kebutuhan gudang data yang sangat besar. Solusi ini memiliki kemampuan untuk menampung data warehouse sampai ratusan terabyte dengan penggunaan teknologi baru yang disebut sebagai massively parallel processing (MPP). Parallel data warehouse dapat dihubungkan melalui perangkat keras murah yang dikonfigurasi dalam arsitektur hub and spoke. Peningkatan kinerja dapat dicapai dengan pendekatan desain parallel data warehouse karena teknik ini melakukan partisi tabel besar ke beberapa node fisik, dimana setiap node memiliki CPU sendiri, memori, penyimpanan, dan SQL Server

39 49 instance. Desain ini secara langsung menghilangkan masalah yang terkait dengan kecepatan dan memberikan skalabilitas karena control node mendistribusikan data secara merata ke semua compute node. Control node juga bertanggung jawab untuk mengumpulkan data dari semua compute note ketika jawaban untuk sebuah query harus diberikan ke aplikasi (Mistry, 2010:p. 8-9). Keuntungan Penggunaan MS SQL Server 2008 R2 adalah sebagai berikut (Mistry, 2010:p ): a. Maximum scalability Windows Server 2008 R2 mendukung hingga 256 processor dan 2 terabyte memori dalam sebuah sistem operasi. b. Hyper-V improvements Hyper-V dapat menggunakan hingga 64 processor dalam host processor pool, yang memungkinkan untuk mengkonsolidasikan lebih banyak SQL Server VMs pada satu host Hyper-V. c. Windows Server 2008 R2 Server Manager Server Manager telah dioptimalkan pada Windows Server 2008 R2. d. Best Practices Analyzer (BPA) Membantu mengurangi kesalahan-kesalahan yang terjadi, yang pada akhirnya dapat membantu memperbaiki dan mencegah penurunan kinerja, skalabilitas, dan downtime. e. Windows PowerShell 2.0 Database Administration (DBA) dapat meningkatkan produktivitas mereka menggunakan Windows PowerShell dengan menyederhanakan,

40 50 mengotomatisasi, dan mengkonsolidasikan tugas-tugas yang berulang dan melakukan proses manajemen server di lingkungan SQL Server terdistribusi Tipe data pada MS SQL SERVER 2008 Pada SQL Server 2008 terdapat beberapa tipe data, diantaranya adalah: a. Tipe data untuk Bilangan Jenis-jenis dari tipe data bilangan ini dapat dilihat pada tabel 2.2. Tabel 2.2 Tipe Data Numerik Nama Tipe Data Kelas Ukuran / Bytes Keterangan Bit Integer 1 Bit tipe data pertama dalam tabel menggunakan 1 byte. Bigint Integer 8 Tipe data ini memungkinkan untuk menggunakan angka dari 2 63 sampai dengan Int Integer 4 Tipe data ini meliputi angka dari 2,147,483,648 sampai dengan 2,147,483,647. SmallInt Integer 2 Tipe data ini meliputi angka 32,768 sampai dengan 32,767. TinyInt Integer 1 Tipe data ini meliputi angka 0 sampai dengan 255. Decimal or Numeric Decimal / Numeric Varies Memiliki presisi yang tetap dengan skala dari sampai dengan Money Money 8 Satuan moneter dari sampai 2 63 ditambah presisi sampai empat tempat desimal. SmallMoney Money 4 Satuan moneter dari -214, sampai dengan +214, Float Approximate Numeric Varies Menerima argumen (misalnya, Float (20)) yang menentukan ukuran dan presisi. Perhatikan bahwa argumen dalam bit, bukan byte. Berkisar dari- 1.79E sampai dengan 1.79E (Sumber : Viera, 2009:p.12-15)

41 51 b. Tipe Data Special Numeric dan Karakter Jenis-jenis dari tipe data special numeric dan karakter ini dapat dilihat pada tabel 2.3. Tabel 2.3 Tipe Data Special Numeric dan Karakter Nama Tipe Kelas Ukuran Keterangan Data / Bytes Cursor Special 1 Pointer ke kursor. Numeric Timestamp / rowversion Special Numeric 8 Nilai khusus yang unik yang diberikan oleh basis data. (binary) UniqueIdentifier Special 16 Globally Unique Identifier (GUID). Numeric (binary) Char Character Varies Fixed-length data karakter. Data adalah non-unicode. Panjang maksimal adalah karakter. VarChar Character Varies Variabel-length data karakter. Data adalah non-unicode. Panjang maksimal adalah karakter. Dapat menggunakan kata kunci MAX. Text Character Varies Dukungan warisan dari SQL Server gunakan varchar (max) sebagai gantinya! Nchar Unicode Varies Fixed-length data karakter. Data adalah Unicode. Panjang maksimal adalah karakter. NVarChar Unicode Varies Variabel-length data karakter. Data adalah Unicode. Panjang maksimal adalah karakter. Dapat menggunakan kata kunci MAX. Ntext Unicode Varies Ntext ini adalah warisan dari MS SQL Server 2005, gunakan nvarchar (max). Variable-length Unicode Data karakter. Binary Binary Varies Fixed-length data biner dengan Panjang maksimal bytes. VarBinary Binary Varies Variabel-length data biner dengan panjang maksimal byte. Image Binary Varies Dukungan warisan dari SQL Server gunakan VarBinary(max) sebagai gantinya! (Sumber : Viera, 2009:p.12-15)

42 52 c. Tipe Data Tanggal dan Waktu Jenis-jenis dari tipe data tanggal dan waktu ini dapat dilihat pada tabel 2.4. Nama Tipe Data DateTime Date / Time DateTime2 Date / Time SmallDateTime Date / Time DateTimeOffsett Date / Time Date Date / Time Time Date / Time (Sumber : Viera, 2009:p.12-15) Tabel 2.4 Tipe Data Tanggal dan Waktu Kelas Ukuran Keterangan / Bytes 8 Data tanggal dan waktu dari 1 Januari 1753, sampai dengan 31 Desember 9999, dengan akurasi tiga-seperseratus detik. Varies (6-8) Tipe Data DateTime yang diperbarui. Mendukung rentang tanggal yang lebih besar dan presisi fraksi waktu besar (hingga 100 nanodetik). 4 Data tanggal dan waktu dari tanggal 1 Januari 1900, sampai dengan 6 Juni 2079, dengan akurasi satu menit. Varies (8-10) Serupa dengan tipe data DateTime tipe, tetapi juga mengharapkan offset -14:00 sampai dengan +14:00 dari waktu UTC. Waktu disimpan secara internal sebagai waktu UTC, dan setiap perbandingan, pengurutan, dan pengindeksan akan didasarkan pada zona waktu bersatu. 3 Menyimpan hanya tanggal data dari tanggal 1 Januari 0001, sampai dengan 31 Desember 9999 seperti yang didefinisikan oleh kalender Gregorian. Menggunakan format tanggal standar ANSI (YYYY-MM-DD), tapi akan secara implisit mengkonversi dari beberapa format lain. Varies (3-5) Menyimpan hanya data waktu yang secara presisi dipilih oleh user sebagai granular 100 nanodetik (yang merupakan default).

43 53 d. Tipe Data Lain Jenis-jenis tipe data ini dapat dilihat pada tabel 2.5. Tabel 2.5 Tipe Data Lain Nama Tipe Data Kelas Ukuran / Bytes Keterangan Table Other Special Tipe data ini biasanya digunakan pada waktu bekerja dengan result sets. Tipe data biasanya dipakai pada User-defined Function atau sebagai parameter untuk Stored Procedures. Tipe data ini tidak dapat digunakan sebagai tipe data dalam tabel definition (Anda tidak bisa membuat tabel bersarang (tabel dalam tabel)). HierarchyID Other Special Tipe data khusus yang menangani informasi posisi hirarki. Menyediakan fungsi khusus untuk kebutuhan hirarki. Perbandingan kedalaman, orangtua / anak, hubungan, dan pengindeksan diperbolehkan. Ukuran yang tepat bervariasi dengan jumlah dan rata-rata kedalaman node dalam hirarki. sql_variant Other Special Tipe data ini terkait dengan tipe data Variant yang terdapat pada VB dan C + +. Pada dasarnya, tipe data ini adalah wadah yang memungkinkan kita untuk memegang sebagian besar tipe data SQL Server lainnya di dalamnya. Kita dapat menggunakan tipe data ini ketika satu kolom atau fungsi harus mampu menangani beberapa tipe data. Tidak seperti pada VB, dengan menggunakan tipe data ini kita dapat memaksa untuk melakukan casting data pada tipe data ini secara eksplisit untuk mengubahnya menjadi tipe data yang lebih spesifik. XML Character Varies Mendefinisikan field karakter untuk XML data. Menyediakan validasi data untuk XML Schema seperti penggunaan fungsi-xml berorientasi khusus. Table Other Special Tipe data ini biasanya digunakan pada waktu bekerja dengan result sets. Tipe data biasanya dipakai pada User-defined Function atau sebagai parameter untuk Stored Procedures. Tipe data ini tidak dapat digunakan sebagai tipe data dalam tabel definition (Anda tidak bisa membuat tabel bersarang (tabel dalam tabel)). (Sumber : Viera, 2009:p.12-15)

44 Basic query pada MS SQL SERVER 2008 Ada 4 operasi dasar yang dapat dilakukan pada suatu basis data, yaitu: select, insert, update, dan delete. Pada SQL Server 2008, sintak untuk penggunaan dari empat operasi basis data ini dapat dilihat pada tabel 2.6: Tabel 2.6 Sintaks Query pada SQL Server 2008 Nama Fungsi Sintak Query SELECT Membaca data SELECT <column list> [FROM <source table(s)> [[AS] <table alias>] [[{FULL INNER {LEFT RIGHT} OUTER CROSS}] JOIN <next table> [ON <join condition>] [<additional JOIN clause>...]]] [WHERE <restrictive condition>] [GROUP BY <column name or expression using a column in the SELECT list>] [HAVING <restrictive condition based on the GROUP BY results>] [ORDER BY <column list>] [[FOR XML {RAW AUTO EXPLICIT PATH [(<element>)]}[, XMLDATA][, ELEMENTS][, BINARY base 64]] [OPTION (<query hint>, [,...n])] [{ UNION [ALL] EXCEPT INTERSECT }] [;] INSERT Menyisipkan data INSERT [INTO] <table> [(<column list>)] VALUES (<data values>) [, (<data values>) [,... n]] UPDATE Memperbarui data UPDATE <table name> SET <column> = <value> [,<column> = <value>] [FROM <source table(s)>] [WHERE <restrictive condition>] DELETE Menghapus data DELETE [TOP (<expression>) [PERCENT] [FROM ] <table name> [FROM ] <table list/join conditions> [WHERE <search condition>] (Sumber : Viera, 2009:p )

45 Service Oriented Architecture SOA adalah sebuah metode membangun aplikasi yang menggunakan sejumlah kecil, komponen independen yang berkomunikasi satu sama lain dengan saling menawarkan dan menggunakan layanan antar komponen-komponen independen ini. Komponen-komponen ini dapat didistribusikan; pada kenyataannya, mereka dapat berada di sisi yang berbeda dari dunia (Rainardi, 2008:p.26). Hampir setiap aplikasi besar bisa mendapatkan keuntungan dari pendekatan SOA. Kita tidak perlu untuk membangun satu aplikasi besar lagi. Sebaliknya, kita membangun banyak potongan-potongan kecil aplikasi yang terhubung dan berkomunikasi satu sama lain. Salah satu sifat dari industri TI adalah aplikasi akan perlu diganti setiap beberapa tahun (setiap 4-8 tahun). Bisa jadi karena teknologi yang digunakan sudah usang atau karena fungsionalitas dari aplikasi tersebut sudah tidak mampu mengakomodasi kebutuhan perusahaan. Kepailitan, merger, dan pengambilalihan perusahaan juga merupakan alasan lain untuk melakukan penggantian aplikasi ini (Rainardi, 2008:p.26). Jika kita membuat satu aplikasi raksasa, itu akan menjadi mahal untuk menggantinya. Jika kita membuatnya dari sejumlah kecil, komponen independen, lebih mudah untuk menggantinya. SOA memberi kita lebih banyak fleksibilitas untuk mengganti komponen. Dengan kata lain, kita dapat melakukannya secara bertahap sepotong demi sepotong tanpa mempengaruhi fungsi tersebut. Hal ini karena komponen yang independen; yaitu, mereka tidak peduli bagaimana komponen lainnya bekerja secara internal selama eksternal mereka mendapatkan

46 56 tanggapan yang mereka butuhkan. Hal ini memungkinkan kita untuk membangun kembali salah satu komponen dengan teknologi yang lebih baru tanpa mempengaruhi yang lain (Rainardi, 2008:p.26). Bagaimana SOA ini berhubungan dengan data warehouse? Sebuah sistem data warehouse terdiri dari banyak komponen: sistem sumber, sistem ETL, mekanisme kualitas data, sistem metadata, audit dan sistem kontrol, sebuah portal BI, aplikasi pelaporan, aplikasi OLAP/analitik, aplikasi data mining, dan sistem database itu sendiri (Rainardi, 2008:p.26). Kita dapat membangun data warehouse sebagai satu aplikasi raksasa dengan semua komponen digabungkan; Hal ini akan menyebabkan kita tidak akan dapat mengganti salah satu komponen tanpa mempengaruhi komponen lainnya. Atau kita dapat membangun data warehouse dengan pendekatan SOA. Kita membangunnya sebagai jumlah yang lebih kecil, komponen independen yang terhubung dan berkomunikasi satu sama lain dengan saling menawarkan dan menggunakan layanan antar komponen-komponen independen ini (Rainardi, 2008:p.26). Semakin banyak aplikasi data warehousing di semua lini yang dibangun menggunakan SOA, seperti misalnya : ETL, pelaporan, analisis, aplikasi BI, data mining, metadata, kualitas data, dan pembersihan data. Di masa depan, dengan menggunakan pendekatan SOA, akan lebih mudah untuk memperbarui salah satu komponen tanpa mempengaruhi komponen yang lain dan untuk menghubungkan berbagai komponen yang dibuat dengan menggunakan teknologi yang berbedabeda (Rainardi, 2008:p.26).

47 57 SOA adalah pendekatan yang berbeda untuk memisahkan antara perhatian dan pembangunan solusi bisnis dengan memanfaatkan komponen-komponen kecil yang digabungkan dan digunakan kembali. Dengan mengadopsi SOA, organisasi dapat mengaktifkan aplikasi bisnis mereka dengan cepat dan efisien menanggapi bisnis, proses, dan perubahan integrasi yang biasanya terjadi dalam lingkungan perusahaan (Kankanamge, 2012:p. 8) Arsitektur SOA Gambar 2.10 Arsitektur SOA (Sumber : Barry, 2013:p.18) Pada gambar 2.10 dapat dilihat bahwa arsitektur SOA yang paling sederhana adalah dimana ada sebuah service provider dan sebuah service consumer. Service consumer akan mengirimkan service request ke service provider dan kemudian service provider akan mengirimkan service response ke service consumer Building block SOA Ketika mempelajari solusi standar berorientasi pada layanan, kita dapat mengindentifikasi tiga building block besar seperti berikut ini (Kankanamge, 2012:p. 9-11):

BAB I PENDAHULUAN. perusahaan atau organisasi dalam menentukan kebijakan-kebijakan strategis

BAB I PENDAHULUAN. perusahaan atau organisasi dalam menentukan kebijakan-kebijakan strategis BAB I PENDAHULUAN 1.1 Latar Belakang Dewasa ini informasi merupakan hal yang sangat penting bagi suatu perusahaan atau organisasi dalam menentukan kebijakan-kebijakan strategis perusahaan terkait dengan

Lebih terperinci

PERANCANGAN DATA WAREHOUSE E-PROCUREMENT PADA INSTANSI PEMERINTAHAN

PERANCANGAN DATA WAREHOUSE E-PROCUREMENT PADA INSTANSI PEMERINTAHAN PERANCANGAN DATA WAREHOUSE E-PROCUREMENT PADA INSTANSI PEMERINTAHAN Luky Hidayat 1), Adhistya Erna Permanasari 2), Igi Ardiyanto 3) 1),2),3 ) Departemen Teknik Elektro dan Teknologi Informasi, Fakultas

Lebih terperinci

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP) DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP) Overview Data Warehouse dan OLAP merupakan elemen penting yang mendukung decision support. Terutama bagi perusahaan perusahaan besar dengan database

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI BAB III LANDASAN TEORI Dalam bab ini akan dijelaskan tentang beberapa konsep tentang supra desa, business intelligence, data warehouse, staging area, ETL, OLAP, ROLAP, Pentaho Data Integration, dan PHP.

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Pembuatan data warehouse telah banyak dilakukan oleh perusahaanperusahaan industri yang berorientasi profit. Data warehouse diharapkan mampu

Lebih terperinci

[Data Warehouse] [6/C2 & 6/D2]

[Data Warehouse] [6/C2 & 6/D2] [Data Warehouse] [6/C2 & 6/D2] [ Chapter 2] Jenis dan Karakteristik Data Warehouse Dedy Alamsyah, S.Kom, M.Kom [NIDN : 0410047807] Jenis Data Warehouse 1. Functional Data Warehouse (Data Warehouse Fungsional)

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Data Data adalah sebuah rekaman dari fakta-fakta, konsep-konsep, atau instruksiinstruksi pada media penyimpanan untuk komunikasi perolehan, dan pemrosesan dengan cara otomatis

Lebih terperinci

PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN UNIVERSITAS NASIONAL

PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN UNIVERSITAS NASIONAL PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN UNIVERSITAS NASIONAL Heni Jusuf 1, Ariana Azimah 2 Jurusan Sistem Informasi, Fakultas Teknologi Komunikasi dan Informatika, Universitas Nasional Jl. Sawo Manila,

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Rekapitulasi Laporan Rekapitulasi laporan sangat penting artinya bagi seorang pimpinan karena merupakan salah satu alat untuk melaksanakan kegiatan-kegiatan dalam perencanaan,

Lebih terperinci

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization Business Intelligence Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization DEFINISI DATA WAREHOUSE Data warehouse adalah database yang saling bereaksi yang dapat digunakan

Lebih terperinci

BAB 2 LANDASAN TEORI. Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut:

BAB 2 LANDASAN TEORI. Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut: BAB 2 LANDASAN TEORI 2.1 Teori Umum Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut: 2.1.1 Pengertian Data Menurut Hoffer & Venkataraman (2011: 5) menjelaskan bahwa

Lebih terperinci

PROSES EXTRACT, TRANSFORM DAN LOAD PADA DATA WAREHOUSE

PROSES EXTRACT, TRANSFORM DAN LOAD PADA DATA WAREHOUSE PROSES EXTRACT, TRANSFORM DAN LOAD PADA DATA WAREHOUSE Oktavian Abraham Lantang ABSTRAK Saat ini seiring dengan perkembangan teknologi informasi yang semakin pesat, ketergantungan proses bisnis suatu perusahaan

Lebih terperinci

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006. 1 Latar Belakang PENDAHULUAN Kemajuan teknologi komputer semakin memudahkan proses penyimpanan dan pengolahan data berukuran besar. Namun demikian, seringkali data yang sudah tersimpan belum dimanfaatkan

Lebih terperinci

BAB II LANDASAN TEORI. Basis Data Terdistribusi didefinisikan sebagai sebuah collection of multiple,

BAB II LANDASAN TEORI. Basis Data Terdistribusi didefinisikan sebagai sebuah collection of multiple, BAB II LANDASAN TEORI 2.1 Basis Data Terdistribusi Basis Data Terdistribusi didefinisikan sebagai sebuah collection of multiple, database yang saling berkaitan secara logik yang didistribusikan melalui

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Sistem Informasi Sistem Informasi adalah suatu kumpulan dari komponen yang berinteraksi untuk menyelesaikan tugas bisnis. pendapat ini didukung dengan pendapat Satzinger, Jackson,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi informasi yang semakin pesat ditunjukkan dengan munculnya beragam perangkat teknologi yang mempermudah manusia dalam memonitor perkembangan usahanya

Lebih terperinci

http://www.brigidaarie.com Apa itu database? tempat penyimpanan data yang saling berhubungan secara logika Untuk apa database itu?? untuk mendapatkan suatu informasi yang diperlukan oleh suatu organisasi

Lebih terperinci

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti BAB II LANDASAN TEORI 2.1 Data Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti dan sangat penting bagi pemakai (Hoffer, Prescott dan McFadden,2007, p6). 2.2 Basis Data Basis

Lebih terperinci

BAB II TINJAUAN PUSTAKA. yang akan dibuat adalah sebagai berikut : Sistem Monitoring Pertumbuhan Balita Berbasis Web. Wahyuningsih

BAB II TINJAUAN PUSTAKA. yang akan dibuat adalah sebagai berikut : Sistem Monitoring Pertumbuhan Balita Berbasis Web. Wahyuningsih BAB II TINJAUAN PUSTAKA A. Telaah Penelitian Penelitian sebelumnya yang berhubungan dengan sistem informasi yang akan dibuat adalah sebagai berikut : Wahyuningsih (2011) telah melakukan penelitian yang

Lebih terperinci

DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan

DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan direkam yang sering ditemukan dalam sistem operasional

Lebih terperinci

Adapun karakteristik umum yang dimiliki datawarehouse adalah :

Adapun karakteristik umum yang dimiliki datawarehouse adalah : 1 Data Warehouse Data Warehouse adalah database yang didesain khusus untuk mengerjakan proses query, membuat laporan dan analisa. Data yang di simpan adalah data business history dari sebuah organisasi

Lebih terperinci

[Data Warehouse] [6/C2 & 6/D2]

[Data Warehouse] [6/C2 & 6/D2] [Data Warehouse] [6/C2 & 6/D2] [ Chapter 6] Pemodelan Data Warehouse Dedy Alamsyah, S.Kom, M.Kom [NIDN : 0410047807] Pemodelan Data Ada dua pendekatan yang diterima sebagai best practice untuk memodelkan

Lebih terperinci

Rancang Bangun Data Warehouse

Rancang Bangun Data Warehouse Rancang Bangun Data Warehouse i ii Rancang Bangun Data Warehouse Rancang Bangun Data Warehouse iii iv Rancang Bangun Data Warehouse RANCANG BANGUN DATA WAREHOUSE Oleh : Muhammad Yazdi Pusadan, S.Kom.,

Lebih terperinci

BAB III LANDASAN TEORI Akreditasi Nasional Perguruan Tinggi dan Program Studi

BAB III LANDASAN TEORI Akreditasi Nasional Perguruan Tinggi dan Program Studi BAB III LANDASAN TEORI 3.1. Akreditasi Nasional Perguruan Tinggi dan Program Studi Satu satunya badan akreditasi yang diakui oleh pemerintah adalah BAN-PT yang berdiri pada tahun 1994, berlandaskan UU

Lebih terperinci

BAB 2 2 LANDASAN TEORI. Menurut Inmon (2002, p388), data adalah rekaman dari fakta-fakta, konsepkonsep,

BAB 2 2 LANDASAN TEORI. Menurut Inmon (2002, p388), data adalah rekaman dari fakta-fakta, konsepkonsep, BAB 2 2 LANDASAN TEORI 2.1 Pengertian Data Menurut Inmon (2002, p388), data adalah rekaman dari fakta-fakta, konsepkonsep, atau instruksi-instruksi pada media penyimpanan untuk komunikasi, pengambilan,

Lebih terperinci

BAB IV PERANCANGAN SISTEM

BAB IV PERANCANGAN SISTEM BAB IV PERANCANGAN SISTEM Pembahasan BAB IV mengenai proses perancangan data warehouse meliputi proses integrasi, pemodelan database dan dashboard interface. 4.1 Perencanaan Tahap perencanaan penelitian

Lebih terperinci

BAB I BAB I PENDAHULUAN

BAB I BAB I PENDAHULUAN 1 BAB I BAB I PENDAHULUAN 1.1 Latar Belakang Ketatnya persaingan bisnis dan semakin majunya teknologi informasi saat ini menuntut para manajemen perusahaan untuk mengambil langkah-langkah cerdas dan strategis

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi selalu dituntut untuk dapat memenuhi berbagai kebutuhan di segala bidang kehidupan yang semakin lama semakin meningkat dan

Lebih terperinci

DATA WAREHOUSE PERTEMUAN I S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM

DATA WAREHOUSE PERTEMUAN I S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM DATA WAREHOUSE PERTEMUAN I 22032013 S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM METODE PEMBELAJARAN Kuliah Diskusi Presentasi Latihan Tugas Quiz UTS UAS BUKU ACUAN Apress Building A Data Warehouse With

Lebih terperinci

BAB II KONSEP DATA WAREHOUSING

BAB II KONSEP DATA WAREHOUSING BAB II KONSEP DATA WAREHOUSING Komptensi yang diharapkan: Peserta pembelajaran memahami konsep-konsep, berbagai istilah, karakteristik, manfaat, tujuan, tugas-tugas data warehouseing. A. Pengertian Beberapa

Lebih terperinci

BASIS DATA MODEL BASIS DATA

BASIS DATA MODEL BASIS DATA BASIS DATA MODEL BASIS DATA APA ITU MODEL BASIS DATA? Model database menunjukkan struktur logis dari suatu basis data, termasuk hubungan dan batasan yang menentukan bagaimana data dapat disimpan dan diakses.

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1. Pengertian Data Menurut McLeod (2007, p9), data terdiri dari fakta fakta dan angka angka yang relatif tidak berarti bagi pemakai. Sedangkan menurut O'Brien (2005,

Lebih terperinci

MENGENAL DATA WAREHOUSE

MENGENAL DATA WAREHOUSE MENGENAL DATA WAREHOUSE Kusumawardani wardhanik24@gmail.com :: http://ilmuti.org/author/kusumawardani/ Abstrak Tentu setiap orang kenal dengan yang namanya data, karena segala aktifitas sudah pasti merangkum

Lebih terperinci

MEMBANGUN DATA WAREHOUSE

MEMBANGUN DATA WAREHOUSE MEMBANGUN DATA WAREHOUSE A. Menentukan Bentuk Data Warehouse Data warehouse memiliki berbagai macam bentuk yang sering digunakan. Jadi sebelum membangun suatu data warehouse kita harus memutuskan bentuk

Lebih terperinci

BAB I PENDAHULUAN. Berkembangnya teknologi dan informasi saat ini telah menghasilkan kumpulan

BAB I PENDAHULUAN. Berkembangnya teknologi dan informasi saat ini telah menghasilkan kumpulan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Berkembangnya teknologi dan informasi saat ini telah menghasilkan kumpulan data diberbagai bidang ilmu pengetahuan, bisnis ataupun pemerintahan. Pada proses penyediaan

Lebih terperinci

6.2 Pendekatan Database Untuk Pengelolaan Data

6.2 Pendekatan Database Untuk Pengelolaan Data 6.2 Pendekatan Database Untuk Pengelolaan Data Database adalah sekumpulan data yang diorganisasikan untuk melayani berbagai aplikasi secara efisien dengan memusatkan data dan mengurangi penggandaan data.

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Teori Umum 2.1.1 Pengertian Data Menurut (Inmon, 2005, p. 493) data merupakan kumpulan faktafakta, konsep-konsep dan instruksi-instruksi yang disimpan dalam media penyimpanan yang

Lebih terperinci

ABSTRAK. Kata kunci: Change Data Capture, Real-Time, Data Warehouse, Database Management System, Binary Log. vii

ABSTRAK. Kata kunci: Change Data Capture, Real-Time, Data Warehouse, Database Management System, Binary Log. vii ABSTRAK Perusahaan yang mengelola data dalam jumlah besar diharuskan memiliki sistem yang kuat yaitu sistem yang bersifat real time agar mampu mengelola data dalam jumlah besar yang bergerak dalam kurun

Lebih terperinci

Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6

Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6 1 Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6 Data Warehouse 2 Data warehouse adalah basis data yang menyimpan data sekarang dan data masa lalu yang berasal dari berbagai sistem operasional

Lebih terperinci

BAB II. LANDASAN TEORIse. Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah

BAB II. LANDASAN TEORIse. Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah BAB II LANDASAN TEORIse 2.1 Data Warehouse Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah tempat penyimpanan data dimana kapasitas penyimpanannya berskala besar; datanya diakumulasikan

Lebih terperinci

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat 7 BAB 2 LANDASAN TEORI 2.1 Pengertian Data Warehouse Menurut Inmon (2002, p389), A data warehouse is a collection of integrated, subject oriented database designed to support the DSS function, where each

Lebih terperinci

Database dan DBMS DBMS adalah perangkat lunak sistem yang memungkinkan para pemakai membuat, memelihara, mengontrol, dan mengakses basis data dengan

Database dan DBMS DBMS adalah perangkat lunak sistem yang memungkinkan para pemakai membuat, memelihara, mengontrol, dan mengakses basis data dengan Database dan DBMS Database adalah : suatu pengorganisasian sekumpulan data yang saling terkait sehingga memudahkan aktifitas untuk memperoleh informasi. semua data yang disimpan pada sumberdaya berbasis

Lebih terperinci

BAB 1 PENDAHULUAN. penting dalam berbagai bidang, terutama dalam bidang bisnis. Salah satu

BAB 1 PENDAHULUAN. penting dalam berbagai bidang, terutama dalam bidang bisnis. Salah satu BAB 1 PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang semakin pesat memberikan pengaruh penting dalam berbagai bidang, terutama dalam bidang bisnis. Salah satu bentuk penerapan teknologi yang

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN YAYASAN LENTERA INSAN

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN YAYASAN LENTERA INSAN PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN YAYASAN LENTERA INSAN Aulia Paramita Program Studi Teknik Informatika, Universitas Indraprasta PGRI Email: aulia.pps@gmail.com Abstrak Data merupakan suatu

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Piramida Sistem Informasi Pada kondisi sekarang ini, hampir seluruh pekerjaan yang ada telah disusun secara sistem. Sistem adalah suatu hal yang menghubungkan suatu hal dengan

Lebih terperinci

Basis Data Oracle - Business Intelligence System. Ramos Somya, M.Cs.

Basis Data Oracle - Business Intelligence System. Ramos Somya, M.Cs. Basis Data Oracle - Business Intelligence System Ramos Somya, M.Cs. Menurut W.H. Inmon dan Richard D.H., data warehousing adalah koleksi data yang mempunyai sifat berorientasi subjek, terintegrasi, time-variant,

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Teori Umum 2.1.1 Data dan Informasi Menurut Inmon (2005, p493), data adalah kumpulan dari fakta, konsep atau perintah pada sebuah media penyimpanan yang digunakan untuk komunikasi,

Lebih terperinci

Lecture s Structure. Bagaimana Strukturnya. Data Warehouse Methodology (I) Yudi Agusta, PhD Data Warehouse and Data Mining, Lecture 5

Lecture s Structure. Bagaimana Strukturnya. Data Warehouse Methodology (I) Yudi Agusta, PhD Data Warehouse and Data Mining, Lecture 5 Data Warehouse Methodology (I) Yudi Agusta, PhD Data Warehouse and Data Mining, Lecture 5 Copyright Yudi Agusta, PhD 2006 Lecture s Structure Teknik Data Warehouse Pengidentifikasian Keperluan Pengambilan,

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD) Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery

Lebih terperinci

SISTEM BASIS DATA By Novareza Klifartha

SISTEM BASIS DATA By Novareza Klifartha SISTEM BASIS DATA By Novareza Klifartha Konsep Sistem Basis Data SISTEM sebuah keterpaduan yang terdiri atas sejumlah komponen fungsional dengan satuan fungsi / tugas tertentu, yang saling berhubungan

Lebih terperinci

BAB 2 LANDASAN TEORI. Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada

BAB 2 LANDASAN TEORI. Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada BAB 2 LANDASAN TEORI 2.1 Teori Database Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada yang berbeda satu dengan yang lainnya dan biasanya merupakan data yang bersifat sementara

Lebih terperinci

BAB 4 PERANCANGAN DAN IMPLEMENTASI

BAB 4 PERANCANGAN DAN IMPLEMENTASI BAB 4 PERANCANGAN DAN IMPLEMENTASI 4.1 Arsitektur Data Warehouse Pelaksanaan perancangan data warehouse dimulai dari perumusan permasalahan yang dihadapi oleh perusahaan kemudian dilanjutkan dengan pencarian

Lebih terperinci

DATAWAREHOUSE. Sukarsa:Pasca Elektro Unud. I Made Sukarsa

DATAWAREHOUSE. Sukarsa:Pasca Elektro Unud. I Made Sukarsa DATAWAREHOUSE I Made Sukarsa Evolusi Sistem Informasi Decision Support System database Database (I,U,D,R) ETL DW (Read) Masalah : integrasi /konsistensi OLTP Normalisasi/Den ormalisasi OLAP Denormalisasi

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI BAB III LANDASAN TEORI 3.1. Sistem Informasi Sistem informasi secara teknis bisa didefinisikan sebagai sekelompok komponen yang saling terkait yang mengumpulkan, memproses, menyimpan, dan mendistribusikan

Lebih terperinci

BAB II LANDASAN TEORI. seorang pimpinan atau manajer didalam organisasi untuk mencapai tujuan

BAB II LANDASAN TEORI. seorang pimpinan atau manajer didalam organisasi untuk mencapai tujuan BAB II LANDASAN TEORI 2.1 Payment Management Control. Manajemen merupakan proses atau kegiatan yang dilakukan oleh seorang pimpinan atau manajer didalam organisasi untuk mencapai tujuan bersama. Kegiatan

Lebih terperinci

PROSES PERANCANGAN DATABASE

PROSES PERANCANGAN DATABASE PROSES PERANCANGAN DATABASE PENDAHULUAN Sistem informasi berbasiskan komputer terdiri dari komponen-komponen berikut ini : Database Database software Aplikasi software Hardware komputer termasuk media

Lebih terperinci

[Data Warehouse] [6/C2 & 6/D2]

[Data Warehouse] [6/C2 & 6/D2] [Data Warehouse] [6/C2 & 6/D2] [ Chapter 3] Arsitektur dan Struktur Data Warehouse Dedy Alamsyah, S.Kom, M.Kom [NIDN : 0410047807] Arsitektur Data Warehouse Menurut Poe, arsitektur adalah sekumpulan atau

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Konsep Dasar Sistem Informasi Menurut Inmon (2002, p388), data adalah suatu pencatatan dari sekelompok fakta, konsep, atau instruksi dalam suatu media penyimpanan untuk komunikasi,

Lebih terperinci

Teknologi Elektro, Vol. 14, No.2, Juli - Desember

Teknologi Elektro, Vol. 14, No.2, Juli - Desember Teknologi Elektro, Vol. 14, No.2, Juli - Desember 2015 11 Pemodelan Integrasi Nearly Real Time Data Warehouse dengan Service Oriented Architecture untuk Menunjang Sistem Informasi Retail I Made Dwi Jendra

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang

BAB 1 PENDAHULUAN 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi informasi yang cepat dan pesat, banyak organisasi terus mencari cara untuk meningkatkan penggunaan dari sebuah sistem informasi

Lebih terperinci

BAB 1 PENDAHULUAN. satu hal yang sangat dominan dan terjadi dengan sangat pesat. Informasi

BAB 1 PENDAHULUAN. satu hal yang sangat dominan dan terjadi dengan sangat pesat. Informasi BAB 1 PENDAHULUAN 1.1 Latar Belakang Di era globalisasi ini, perkembangan teknologi informasi sudah merupakan satu hal yang sangat dominan dan terjadi dengan sangat pesat. Informasi merupakan suatu kebutuhan

Lebih terperinci

BAB 1 I PENDAHULUAN. terbarukan untuk mengelola dan mengolah data tersebut. Perkembangan database

BAB 1 I PENDAHULUAN. terbarukan untuk mengelola dan mengolah data tersebut. Perkembangan database BAB 1 I PENDAHULUAN 1.1. Latar Belakang Perkembangan teknologi saat ini sudah sangat pesat dengan data yang berjumlah cukup besar dan juga semakin dibutuhkannya sebuah pengembangan terbarukan untuk mengelola

Lebih terperinci

Bab 2 Tinjauan Pustaka

Bab 2 Tinjauan Pustaka Bab 2 Tinjauan Pustaka 2.1 Penelitian Sebelumnya Pada jurnal dengan judul A Service-oriented Architecture for Business Intelligence dipaparkan tentang perbandingan konsep service-oriented dalam BI dengan

Lebih terperinci

ABSTRAK. Kata Kunci : Data Warehouse, Real Time Data Warehouse, Change Data Capture, Audit Log. vii

ABSTRAK. Kata Kunci : Data Warehouse, Real Time Data Warehouse, Change Data Capture, Audit Log. vii ABSTRAK Kebutuhan akan pengolahan informasi dari berbagai sumber untuk kemudian dijadikan dasar analisa pengambilan keputusan didalam perusahaan semakin besar. Data Warehouse merupakan teknologi dengan

Lebih terperinci

BAB II. 2.1 Model Data High Level Data Model (Conceptual Data Model)

BAB II. 2.1 Model Data High Level Data Model (Conceptual Data Model) BAB II PENGEMBANGAN SISTEM BASIS DATA Bab ini akan membahas lebih lanjut mengenai arsitektur sistem basis data dan pengembangan sistem basis data. Sistem basis data tidak berdiri sendiri, tetapi selalu

Lebih terperinci

BAB III METODOLOGI. mengidentifikasi proses-proses bisnis utama dan entitas-entitas utama yang ada di SFI,

BAB III METODOLOGI. mengidentifikasi proses-proses bisnis utama dan entitas-entitas utama yang ada di SFI, BAB III METODOLOGI 3.1 Analisa masalah Langkah pertama yang dilakukan dalam proyek business intelligence pada PT Suzuki Finance Indonesia (SFI) adalah dengan melakukan analisa masalah. Yaitu dengan mengidentifikasi

Lebih terperinci

Pemodelan Data Warehouse

Pemodelan Data Warehouse Pemodelan Data Warehouse Budi Susanto Teknik Informatika Universitas Kristen Duta Wacana Yogyakarta 10/31/11 budi susanto 1 Tujuan Memahami konsep dasar data warehouse Memahami pemodelan berbasis dimensi

Lebih terperinci

Perancangan Data Warehouse pada Perpustakaan. STMIK AMIKOM Yogyakarta

Perancangan Data Warehouse pada Perpustakaan. STMIK AMIKOM Yogyakarta Perancangan Data Warehouse pada Perpustakaan STMIK AMIKOM Yogyakarta Armadyah Amborowati STMIK AMIKOM Yogyakarta armagauthama@yahoo.com Abstraksi Data merupakan aset penting dalam sebuah organisasi yang

Lebih terperinci

6/26/2011. Menurut W.H. Inmon dan Richard D.H. Menurut Vidette Poe

6/26/2011. Menurut W.H. Inmon dan Richard D.H. Menurut Vidette Poe Menurut W.H. Inmon dan Richard D.H. koleksi data yang mempunyai sifat berorientasi subjek,terintegrasi,time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Pengertian Data Menurut Inmon (2002, p388), data adalah sebuah catatan dari fakta-fakta, konsep-konsep, atau instruksi-instruksi pada sebuah media penyimpanan untuk komunikasi,

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM. permasalahan yang ada sebagai dasar untuk membuat sebuah solusi yang

BAB III ANALISA DAN PERANCANGAN SISTEM. permasalahan yang ada sebagai dasar untuk membuat sebuah solusi yang BAB III ANALISA DAN PERANCANGAN SISTEM 3.1 Analisis Masalah Langkah awal dalam pembuatan sistem adalah mengidentifikasi permasalahan yang ada sebagai dasar untuk membuat sebuah solusi yang disajikan dalam

Lebih terperinci

PROSES PERANCANGAN BASIS DATA

PROSES PERANCANGAN BASIS DATA PROSES PERANCANGAN BASIS DATA Seperti telah disebutkan sebelumnya, sebuah sistem basis data merupakan komponen dasar sistem informasi organisasi yang besar. Oleh karena itu siklus hidup aplikasi basis

Lebih terperinci

Langkah-Langkah Merancang Arsitektur Big Data

Langkah-Langkah Merancang Arsitektur Big Data Indra Aulia Program Studi Teknologi Informasi Fakultas Ilmu Komputer dan Teknologi Informasi Universitas Sumatera Utara Langkah-Langkah Merancang Arsitektur Big Data Pendahuluan Arsitektur big data merupakan

Lebih terperinci

http://www.brigidaarie.com Di lingkungan file-server, pemrosesan didistribusikan ke jaringan yang Local Area Network (LAN). File-Server menunjang kebutuhan file dengan aplikasi-aplikasi dan DBMS. Aplikasi

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Teori-Teori Umum 2.1.1 Data Data sangat penting bagi sebuah organisasi karena memainkan peranan penting di dalamnya. Data digunakan di dalam setiap kegiatan di dalam organisasi.

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 4, April 2018, hlm. 1366-1371 http://j-ptiik.ub.ac.id Analisis Peningkatan Performa Proses ETL (Extract, Transform,

Lebih terperinci

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PROSES ETL PADA DATA WAREHOUSE

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PROSES ETL PADA DATA WAREHOUSE ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PROSES ETL PADA DATA WAREHOUSE Armadyah Amborowati STMIK AMIKOM Yogyakarta Jl. Ring Road Utara, Condong Catur, Yogyakarta Telp (0274) 884201 e-mail : armagauthama@yahoo.com

Lebih terperinci

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK Novia Busiarli 1), Mardhiya Hayati 2) 1), 2,)3) Teknik Informatika STMIK AMIKOM

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Teori Basis Data 2.1.1 Pengertian Data Menurut Turban (2003, p2), data ialah fakta yang belum diolah atau gambaran dari transaksi yang ditangkap, direkam, disimpan dan diklasifikasikan.

Lebih terperinci

6/26/2011. Database Terdistribusi. Database Terdesentralisasi

6/26/2011. Database Terdistribusi. Database Terdesentralisasi Sekumpulan database independen pada komputer komputer yang tidak saling berhubungan melalui jaringan Suatu database logis secara fisik tersebar pada beberapa komputer (di beberapa lokasi) dihubungkan melalui

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1. 1 Latar Belakang Berbagai aspek ilmu pengetahuan dan teknologi selalu berkembang dan mengalami kemajuan, sesuai dengan perkembangan cara berpikir manusia dan perkembangan zaman. Salah

Lebih terperinci

PERANCANGAN DATA WAREHUSE PADA PERPUSTAKAAN STMIK AMIKOM YOGYAKARTA. Armadyah Amborowati Dosen STMIK AMIKOM Yogyakarta

PERANCANGAN DATA WAREHUSE PADA PERPUSTAKAAN STMIK AMIKOM YOGYAKARTA. Armadyah Amborowati Dosen STMIK AMIKOM Yogyakarta PERANCANGAN DATA WAREHUSE PADA PERPUSTAKAAN STMIK AMIKOM YOGYAKARTA Armadyah Amborowati Dosen STMIK AMIKOM Yogyakarta armagauthama@yahoo.com Abstraksi Data merupakan aset penting dalam sebuah organisasi

Lebih terperinci

HASIL DAN PEMBAHASAN. Microsoft SQL Server Microsoft Sharepoint Microsoft.Net Framework 4.0.

HASIL DAN PEMBAHASAN. Microsoft SQL Server Microsoft Sharepoint Microsoft.Net Framework 4.0. 3 warehouse dan data mart memiliki batasan yang sangat tipis, namun perbedaan ini tidak perlu dikhawatirkan karena secara subtansi tujuan dari pembuatannya memiliki kesamaan (Noviandi 2010). Konsep data

Lebih terperinci

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut :

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut : BAB II LANDASAN TEORI Teori teori yang digunakan sebagai landasan dalam desain dan implementasi dari sistem ini adalah sebagai berikut : 2.1. Sistem Informasi Manajemen Sistem Informasi Manajemen adalah

Lebih terperinci

BAB II LANDASAN TEORI. dan belanja daerah atau perolehan lainnya yang sah antara lain:

BAB II LANDASAN TEORI. dan belanja daerah atau perolehan lainnya yang sah antara lain: BAB II LANDASAN TEORI 2.1 Barang Milik Daerah Menurut Permendagri No. 17 Tahun 2007, Barang Milik Daerah (BMD) adalah semua barang yang dibeli atau diperoleh atas beban anggaran pendapatan dan belanja

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi...Volume..., Bulan 20..ISSN : PEMBANGUNAN INDEPENDENT DATA MART PADA OPTIK YUDA

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi...Volume..., Bulan 20..ISSN : PEMBANGUNAN INDEPENDENT DATA MART PADA OPTIK YUDA Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 PEMBANGUNAN INDEPENDENT DATA MART PADA OPTIK YUDA Dinar Priskawati 1, Dian Dharmayanti 2 Teknik Informatika Universitas Komputer Indonesia Jl. Dipatiukur

Lebih terperinci

BAB I PENDAHULUAN. I.1 Pendahuluan

BAB I PENDAHULUAN. I.1 Pendahuluan BAB I PENDAHULUAN I.1 Pendahuluan Dalam kegiatan manusia sehari-hari, terutama dalam kegiatan transaksi, seperti transaksi perbankan, rekam medis, transaksi jual beli dan transaksi lainnya harus dicatat

Lebih terperinci

BAB 2 LANDASAN TEORI. kebutuhan informasi suatu perusahaan. komputer secara sistematis. menggunakan database SQL Server 2000.

BAB 2 LANDASAN TEORI. kebutuhan informasi suatu perusahaan. komputer secara sistematis. menggunakan database SQL Server 2000. BAB 2 LANDASAN TEORI 2.1 Pengertian Database dan Data Warehouse 2.1.1 Pengertian Database Menurut Connolly dan Begg (2002, p14) database adalah kumpulan data yang berhubungan satu sama lain yang digunakan

Lebih terperinci

Data Warehouse. Komponen Data warehouse

Data Warehouse. Komponen Data warehouse Data Warehouse Komponen Data warehouse Komponen Data warehouse Komponen Data warehouse 1. Sumber Data (Data Source) 2. Pementasan Data (Data Staging) 3. Penyimpanan Data (Data Storage) 4. Penyampaian Informasi

Lebih terperinci

Tugas Akhir (KI091391) Muhamad Adi Prasetyo

Tugas Akhir (KI091391) Muhamad Adi Prasetyo Tugas Akhir (KI091391) Muhamad Adi Prasetyo 5105100159 Prolog Sebuah Program Aplikasi Web yang dibuat untuk melaporkan kuantitas Proses Produksi Menggunakan Metode OLAP pada PT. Aneka Tuna Indonesia (ATI).

Lebih terperinci

BAB 2 LANDASAN TEORI. berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5).

BAB 2 LANDASAN TEORI. berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5). BAB 2 LANDASAN TEORI 2.1 Data Data adalah sebuah representasi dari obyek - obyek dan kejadian - kejadian yang berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5). Data

Lebih terperinci

BAB I PENDAHULUAN A. Latar Belakang

BAB I PENDAHULUAN A. Latar Belakang BAB I PENDAHULUAN A. Latar Belakang Penggunaan yang luas atas teknologi komputer dan jaringan telah membentuk basis data-basis data elektronik besar yang menyimpan berbagai transaksi bisnis (Bose & Mahapatra,

Lebih terperinci

BAB II LANDASAN TEORI. Data adalah deskripsi tentang benda, kejadian, aktifitas, dan transaksi, yang

BAB II LANDASAN TEORI. Data adalah deskripsi tentang benda, kejadian, aktifitas, dan transaksi, yang 9 BAB II LANDASAN TEORI 2.1.1 Pengertian Data Pengertian data adalah : Data adalah deskripsi tentang benda, kejadian, aktifitas, dan transaksi, yang tidak mempunyai makna atau tidak berpengaruh langsung

Lebih terperinci

BAB I PENDAHULUAN. memanfaatkan teknologi informasi, perusahaan dapat menjalankan proses bisnis dengan

BAB I PENDAHULUAN. memanfaatkan teknologi informasi, perusahaan dapat menjalankan proses bisnis dengan BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini teknologi informasi telah berkembang dengan pesat, dengan memanfaatkan teknologi informasi, perusahaan dapat menjalankan proses bisnis dengan lebih cepat,

Lebih terperinci

PERKEMBANGAN BASIS DATA SAAT INI

PERKEMBANGAN BASIS DATA SAAT INI PERKEMBANGAN BASIS DATA SAAT INI Sejak tahun 1960-an penggunaan basis data sudah digunakan untuk bidang komersial, dimana pemrosesan file-nya masih berbasis manajemen file tradisional. Perkembangan komputer

Lebih terperinci

Perancangan Basis Data

Perancangan Basis Data Modul ke: Perancangan Basis Data Fakultas FASILKOM DATA WAREHOUSE Program Studi Sistem Informasi www.mercubuana.ac.id Anita Ratnasari, S.Kom, M.Kom DATA WAREHOUSE Definisi Data Warehouse Salah satu efek

Lebih terperinci

Pengantar Datawarehouse Muhammad Subhan subhan@binusian.org m@tsubhan.com subhan_0072001@live.com http://subhan.blog.binusian.org http://geeks.netindonesia.net/blogs/muhammadsubhan Lisensi Dokumen: Copyright

Lebih terperinci

SUMBER DAYA-SUMBER DAYA SISTEM INFORMASI (BAGIAN 1) PSI Materi III Sesi 6

SUMBER DAYA-SUMBER DAYA SISTEM INFORMASI (BAGIAN 1) PSI Materi III Sesi 6 SUMBER DAYA-SUMBER DAYA SISTEM INFORMASI (BAGIAN 1) PSI Materi III Sesi 6 Sumber Daya-sumber Daya Sistem Informasi Sumber Daya Manusia Sumber Daya Data Sumber Daya Hardware Sumber Daya Software Sumber

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Database 2.1.1 Definisi Database Menurut W.H Inmon(2002, p3), database diartikan sebagai suatu koleksi dari penyimpanan data yang terhubung yang sering digunakan dan mengurangi

Lebih terperinci

BAB 1 PENDAHULUAN. tidak bisa dipisahkan dari proses bisnis, bahkan tidak jarang teknologi informasi menjadi

BAB 1 PENDAHULUAN. tidak bisa dipisahkan dari proses bisnis, bahkan tidak jarang teknologi informasi menjadi BAB 1 PENDAHULUAN 1.1 Latar Belakang Dewasa ini, teknologi informasi telah menjadi salah satu bagian penting yang tidak bisa dipisahkan dari proses bisnis, bahkan tidak jarang teknologi informasi menjadi

Lebih terperinci