BAB 2 LANDASAN TEORI 2.1 Teori-Teori Dasar dan Umum 2.1.1 Pengertian Data Menurut O Brien (2005, P38), data adalah fakta atau observasi mentah, yang biasanya mengenai fenomena fisik atau transaksi bisnis. Sedangkan menurut Laudon & Laudon (2004, P7), data adalah fakta mentah yang menggambarkan kejadian-kejadian yang terjadi dalam sebuah organisasi atau sebuah lingkungan fisik sebelum mereka mengatur dan menyusunnya ke dalam bentuk yang dapat dimengerti dan digunakan orang lain. Menurut Inmon (2005, P493), data adalah suatu pencatatan dari fakta, konsep, atau instruksi dalam suatu media penyimpanan untuk komunikasi, pencarian, dan pemrosesan dengan menggunakan alat otomatis dan presentasi sebagai informasi yang dapat dimengerti oleh manusia. Berdasarkan teori-teori diatas, dapat kami simpulkan bahwa data adalah catatan fakta mentah atau yang belum diolah sehingga belum dapat dimengerti dan belum dapat digunakan dalam hubungannya dengan pemecahan masalah. 2.1.2 Pengertian Informasi Menurut Mc.Leod (2001, P21), Informasi adalah data yang telah diproses atau data yang telah memiliki arti dan pengertian. Menurut Saunder (2009, P17), dalam dunia bisnis, dengan mengetahui informasi apa yang dibutuhkan oleh business user akan membantu dalam menentukan kebutuhan data yang harus tersedia dalam data warehouse. 7
8 Berdasarkan beberapa teori diatas maka kami menyimpulkan bahwa informasi adalah data yang telah diproses sehingga mempunyai arti dan dapat digunakan oleh pihak-pihak yang memerlukan dalam mengambil sebuah keputusan. 2.1.3 Pengertian Basis data Menurut Williams dan Sawyer (2005, P 116), Database is a Collection of Interrelated file in a computer system yang artinya adalah Basis data merupakan kumpulan dari file-file yang saling berhubungan atau terintegrasi dalam sebuah sistem komputer. Menurut Connolly & Begg (2005, P17), Database is a shared collection of logically related data, and a description of this data, designed to meet the information needs of an organization yang artinya adalah basis data merupakan kumpulan relasi-relasi logical dari data, dan deskripsi dari data yang dapat digunakan bersama dan dibuat untuk memperoleh informasi yang dibutuhkan oleh perusahaan. Berdasarkan teori diatas maka kami menyimpulkan bahwa basis data adalah kumpulan dari beberapa item data yang saling berhubungan satu dengan yang lainnya yang diorganisasikan berdasarkan sebuah skema atau struktur tertentu, kemudian disimpan didalam hardisk komputer dan dengan menggunakan software untuk melakukan manipulasi guna memenuhi kebutuhan user untuk suatu tujuan tertentu.
9 2.1.4 Pengertian Datamart Menurut Connolly & Begg (2005, P1171) datamart merupakan bagian dari Data Warehouse yang mendukung kebutuhan informasi bagian departemen atau fungsi bisnis tertentu. Menurut Matteo Golfarelli, Stefano Rizzi (2009, P1) Data Mart adalah data yang diambil dari ringkasan data warehouse ke dalam informasi yang relevan untuk membuat keputusan, dalam bentuk multi dimensional cube, yang secara khusus di-query-kan oleh OLAP dan reporting front-ends. Data mart adalah sebuah bentuk dari data warehouse yang mempunyai fungsi yang khusus atau merupakan bagian dari data warehouse. Jadi datamart selain bisa juga menjadi miniatur data warehouse yang bisa digunakan untuk memperoleh bagian fungsional, juga dapat merupakan bagian dari data warehouse yaitu hanya merupakan salah satu representasi dari data warehouse. 2.1.5 Pengertian Relational Model Menurut Conolly & Begg (2005, P69) dalam relational model semua data terstuktur secara logika dengan relasinya. Setiap relasi mempunyai sebuah nama dan dibentuk dari attribute (kolom) dan data. Setiap tuple (baris) berisi satu nilai per attribute. Menurut Conolly & Begg (2005, P72) Relational model meliputi: a. Relasi Relasi adalah sekumpulan assosiasi yang berarti diantara entity types sedangkan relationship occurence adalah sebuah assosiasi yang dapat diidentifikasi secara unik dimana terdiri dari satu occurence untuk
masing-masing entity type yang berhubungan. Setiap tipe relasi digambarkan dengan garis yang menghubungkan entity type. 10 Gambar 2.1 Contoh relasi b. Attribute Attribute adalah properti dari sebuah entitas atau relationship type, contohnya Pasien memiliki atribute Id_Pasien, Nama, Alamat, dan Gender. 2.1.6 Pengertian OLTP Vieira, Robert (2000, P892) OLTP (Online Transaction Proccessing) adalah sistem operasional yang didasarkan pada proses dan fungsi bisnis. OLTP memungkinkan untuk proses concurrency yaitu proses yang mengijinkan banyak user untuk mengakses sumber data yang sama dan membangun proses yang mereka butuhkan. Menurut Conolly & Begg (2005, P330), adalah system yang dirancang untuk menangani transaksi dalam jumlah besar, dengan transaksi yang secara khusus membuat perubahan kecil terhadap data operasional organisasi, yaitu data yang diperlukan organisasi untuk menangani day-to-day operation.
11 2.1.6.1 Perbandingan Sistem OLTP dan Sistem Data Warehouse Menurut Conolly & Begg (2005, P1134), Perbedaan antara sistem OLTP dengan sistem Data Warehouse adalah: Data Operational Data Warehouse Menyimpan data sekarang Menyimpan data rinci Data dinamis Pemrosesan Berulang Transaksi level tinggi Pola penggunaan dapat diperkirakan Mendorong Transaction Orientasi pada aplikasi Mendukung Pengambilan keputusan harian Digunakan oleh banyak user Menyimpan data Historis Menyimpan data rinci, sedang dan ringkas Data statis Pemrosesan Ad hock, tidak terstruktur, heuristic Transaksi level Menengah dan rendah Pola penggunaan tidak dapat diperkirakan Mendorong Analisis Orientasi pada subjek Mendukung pengambilan keputusan strategis Digunakan oleh sebagian kecil user manajerial Table 2.1 Perbedaan sistem OLTP dengan Sistem Data Warehouse Jadi menurut kami Online Transaction Processing atau yang sering disebut dengan OLTP adalah sistem yang berorientasi proses yang memproses
suatu transaksi secara langsung melalu aplikasi komputer yang terhubung dalam jaringan. 12 2.1.7 Pengertian OLAP Menurut Mallach (2000, P531) OLAP adalah suatu kategori teknologi software yang memungkinkan analis, manajer, dan eksekutif lainnya untuk memperoleh wawasan tentang data dengan cepat, konsisten, dan akses interaktif kedalam variasi yang lebih luas jika dimungkinkan untuk melihat informasi yang telah diubah dari data mentah menjadi dimensi nyata dari suatu perusahaan agar dimengerti oleh user. Menurut Hoffer et al (2005, p480), OLAP adalah penggunaan sekumpulan alat grafikal yang menyediakan kepada user sebuah tampilan multi dimensional dari data user dan memampukan user untuk menganalisa data menggunakan teknik penyajian yang sederhana. Jadi menurut kami, OLAP (Online Analytical Processing) merupakan suatu cara untuk menganalisa pola data-data dengan sangat mudah dan cepat dengan menggunakan teknik Drag and Drop, sehingga data-data tersebut dapat menjadi suatu rantai informasi yang lebih bermakna. 2.1.8 Konsep Data Warehouse 2.1.8.1 Pengertian Data Warehouse Menurut Laudon (2006, p233), Data Warehouse adalah basis data yang menyimpan data penting saat ini dan historis dari kebutuhan informasi untuk manajer dalam perusahaan.
13 Menurut Inmon (2002, p29), sebuah Data Warehouse ialah sebuah kumpulan data yang integrated, subject-oriented, nonvolatile, dan time variant yang mendukung manajemen pengambilan keputusan. Berdasarkan teori diatas kami menyimpulkan bahwa data data warehouse adalah kumpulan data dari berbagai sumber yang ditempatkan menjadi satu dalam tempat penyimpanan berukuran besar lalu diproses menjadi bentuk penyimpanan multidimensional dan didesain untuk querying dan reporting. 2.1.8.2 Keuntungan Data Warehouse Data Warehouse merupakan pendekatan untuk menyimpan data dimana sumber-sumber data yang heterogen (yang biasanya tersebar pada beberapa basis data OLTP) dimigrasikan untuk penyimpanan data yang homogen dan terpisah. Keuntungan yang didapatkan dengan menggunakan data warehouse tersebut dibawah ini. Data dapat diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi. Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi. Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari basis data OLTP ke data warehouse.
Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi. 14 2.1.8.3 Karakteristik Data Warehouse Menurut Inmon (2005, pp29-32), karakteristik dari Data Warehouse yaitu subject oriented, integrated, nonvolatile dan time variant. Keempat karakteristik ini saling terkait satu sama lain, sehingga ke semuanya harus diimplementasikan agar suatu data warehouse bisa secara efektif memiliki data yang mendukung pengambilan keputusan. 2.1.8.3.1 Subject Oriented Data Warehouse berorientasi subject artinya data warehouse didesain untuk menganalisa data berdasarkan subjectsubject tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. data warehouse diorganisasikan disekitar subjek-subjek utama dari perusahaan (pelanggan, produk dan penjualan) dan tidak diorganisasikan pada area-area aplikasi utama (customer invoicing, stock control dan product sales). Hal ini dikarenakan kebutuhan dari Data Warehouse untuk menyimpan data-data yang bersifat sebagai penunjang suatu keputusan, dari pada aplikasi yang berorientasi terhadap data. Jadi dengan kata lain, data yang disimpan adalah berorientasi kepada subjek bukan terhadap proses.
15 2.1.8.3.2 Integrated Data Warehouse dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri. Syarat integrasi sumber data dapat dipenuhi dengan berbagai cara sepeti konsisten dalam penamaan variable,konsisten dalam ukuran variable,konsisten dalam struktur pengkodean dan konsisten dalam atribut fisik dari data. Contoh pada lingkungan operasional terdapat berbagai macam aplikasi yang mungkin pula dibuat oleh developer yang berbeda. Oleh karena itu, mungkin dalam aplikasi-aplikasi tersebut ada variable yang memiliki maksud yang sama tetapi nama dan format-nya berbeda. Variable tersebut harus dikonversi menjadi nama yang sama dan format yang disepakati bersama. Dengan demikian tidak ada lagi kerancuan karena perbedaan nama, format dan lain sebagainya. Barulah data tersebut bisa dikategorikan sebagai data yang terintegrasi karena kekonsistenannya.
16 Gambar 2.2 Contoh Integration 2.1.8.3.3 Time Variant Time variant menyatakan bahwa setiap unit data dalam data warehouse adalah akurat pada waktu tertentu. Dalam beberapa kasus, record ditandai. Dalam kasus lain, sebuah record memiliki tanggal transaksi. Tetapi pada setiap kasus, ada beberapa bentuk penanda waktu untuk menunjukkan record tersebut akurat.
17 Gambar 2.3 Time variancy 2.1.8.3.4 Non-Volatille Karakteristik keempat dari data warehouse adalah nonvolatile,maksudnya data pada data warehouse tidak di-update secara real time tetapi di refresh dari sistem operasional secara reguler. Data yang baru selalu ditambahkan sebagai suplemen bagi basis data itu sendiri dari pada sebagai sebuah perubahan. Basis data tersebut secara kontinyu menyerap data baru ini, kemudian secara incremental disatukan dengan data sebelumnya. Berbeda dengan basis data operasional yang dapat melakukan update,insert dan delete terhadap data yang mengubah isi dari basis data sedangkan pada data warehouse hanya ada dua kegiatan memanipulasi data yaitu loading data (mengambil data) dan akses data (mengakses data warehouse seperti melakukan
query atau menampilan laporan yang dibutuhkan, tidak ada kegiatan updating data). 18 Gambar 2.4 Nonvolatility 2.1.8.4 Meta data Menurut Inmon (2005, p102), metadata adalah sebuah komponen penting dari lingkungan data warehouse. Metadata berisikan data yang menyimpan proses perpindahan data meliputi basis data structure,contents,detail data dan summary data, matrics,versioning, aging criteria,versioning, transformation criteria. Metadata khusus dan memegang peranan yang sangat penting dalam data warehouse. Metadata sendiri mengandung: Struktur data Sebuah direktori yang membantu user untuk melakukan analisis Decision Support System dalam pencarian letak/lokasi dalam data warehouse.
19 Algoritma Algoritma digunakan untuk summary data. Metadata sendiri merupakan panduan untuk algoritma dalam melakukan pemrosesan summary data antara current detail data dengan lightly summarized data dan antara lightly summarized data dengan hightly summaried data. Mapping Sebagai panduan pemetaan (mapping) data pada saat data di transform/diubah dari lingkup operasional menjadi lingkup data warehouse. 2.1.8.5 Granularity Menurut Inmon (2002, p43) Granularity mengarah pada level dari data yang detail atau ringkasan pada data warehous, semakin detail data semakin rendah pula level granularity. Granularity adalah salah satu aspek terpenting dalam desain Data Warehouse karena menentukan volume data yang akan disimpan dalam data warehouse dan menentukan kedalam detail Query yang bisa dijalankan. Secara ekstrem ada (Grain terendah) dan Highest Grain (Grain tertinggi). Lowest Grain menyimpan transaksi di level detail (AtomicTransaction) sedangkan Highest Grain menyimpan data hanya dilevel Enterprise atau level Perusahaan (SummaryTransaction) Level dari Granularity disimpan pada Hirarchy suatu Dimension.
20 2.1.8.6 Struktur Data Warehouse 2.1.8.6.1 Current Detail data Merupakan data detil yang aktif saat ini, mencerminkan keadaan yang sedang berjalan dan merupakan level terendah dalam data warehouse. Didalam area ini warehouse menyimpan seluruh detail data yang terdapat pada skema basis data. Jumlah data sangat besar sehingga memerlukan storage yang besar pula dan dapat diakses secara cepat. Dampak negatif yang ditimbulkan adalah kerumitan untuk mengatur data menjadi meningkat dan biaya yang diperlukan menjadi mahal. Berikut ini beberapa alasan mengapa current detail data menjadi perhatian utama : 1. Menggambarkan kejadian yang baru terjadi dan selalu menjadi perhatian utama 2. Sangat banyak jumlahnya dan disimpan pada tingkat penyimpanan terendah. 3. Hampir selalu disimpan dalam storage karena cepat di akses tetapi mahal dan kompleks dalam pengaturannya. 4. Bisa digunakan dalam membuat rekapitulasi sehingga current detail data harus akurat. 2.1.8.6.2 Old Detail Data Data ini merupakan data historis dari current detail data, dapat berupa hasil cadangan atau archive data yang disimpan dalam storage
21 terpisah. Karena bersifat back-up (cadangan), maka biasanya data disimpan dalam storage alternatif seperti tape-desk. Data ini biasanya memilki tingkat frekuensi akses yang rendah. Penyusunan file atau directory dari data ini di susun berdasarkan umur dari data yang bertujuan mempermudah untuk pencarian atau pengaksesan kembali. 2.1.8.6.3 Summarized data Adalah suatu kelompok data yang dikelompokan berdasarkan hubungan tertentu dari data yang besar, sehingga menjadi data yang lebih kecil yang dapat digunakan dalam pembuatan laporan di tingkat eksekutif, analisis trend dan analisis keputusan. Summarized data terbagi menjadi dua kelompok yaitu : Lighlty summarized data Data ini merupakan ringkasan atau rangkuman dari current detail data. Data ini dirangkum berdasarkan periode atau dimensi lainnya sesuai dengan kebutuhan. Ringkasan dari current detail data belum bersifat total summary. Data-data ini memiliki detil tingkatan yang lebih tinggi dan mendukung kebutuhan warehouse pada tingkat departemen. Tingkatan data ini di sebut juga dengan data mart. Akses terhadap data jenis ini banyak digunakan untuk view suatu kondisi yang sedang atau sudah berjalan.
22 Highly summarized data Data ini merupakan tingkat lanjutan dari Lightly summarized data, merupakan hasil ringkasan yang bersifat totalitas, dapat di akses misal untuk melakukan analisis perbandingan data berdasarkan urutan waktu tertentu dan analisis menggunakan data multidimensi. 2.1.8.7 Anatomi Data Warehouse 2.1.8.7.1 Data Warehouse terpusat Merupakan data warehouse fisikal tunggal yang memuat semua data untuk area fungsional yang khusus seperti departemen, divisi atau perusahaan. Data Warehouse ini digunakan ketika terdapat kebutuhan akan data yang informatif dan sudah terdapat banyak end user yang terhubung ke komputer pusat atau jaringan. Sumber datanya dikumpulkan pada satu tempat terpusat kemudaian data tersebut dibagi-bagi berdasarkan fungsi-fungsi yang dibutuhkan oleh perusahaan yang belum memiliki jaringan eksternal. Keuntungan : a. Data yang terpadu karena adanya konsistensi yang tinggi Kerugian : a. Memerlukan waktu yang lama dan biaya yang mahal untuk membangun Data Warehouse ini
23 Gambar 2.5 Arsitektur Data Warehouse terpusat 2.1.8.7.2 Data Warehouse terdistribusi Adalah data warehouse yang didistribusikan melewati sejumlah basis data fisikal yang berbeda. Data warehouse terdistribusi biasanya melibatkan data yang paling teredudansi dan mengakibatkan proses load dan update yang sangat kompleks. Menggunakan gateway yang berfungsi sebagai jembatan antara lokasi data warehouse dengan workstation, sehingga memungkinkan kita untuk mengakses sumber data diluar lokasi perusahaan. Keuntungan : a. Dalam hal pengaksesan data dari luar telah mengalami sinkronisasi terlebih dahulu sehingga datanya tetap konsisten. Kerugian : a. Implementasi yang mahal dan kompleks karena sistem operasinya dikelola secara terpisah.
24 Gambar 2.6 Arsitektur Data Warehouse Terdistribusi 2.1.8.8 Perancangan Data Warehouse Menurut Kimball dalam buku Connolly dan Begg (2005, p1187), terdapat sembilan tahapan dalam membangun data warehouse (nine step methodology), yaitu: 2.1.8.8.1 Pemilihan Proses Proses yang menunjuk pada subjek yang ada dari sebuah bagian data mart. Data mart pertama yang akan dibangun harus tepat waktu, disesuaikan dengan anggapan dari menjawab pertanyaan bisnis yang banyak diutarakan. 2.1.8.8.2 Pemilihan grain Memilih grain berarti menentukan secara tepat apa yang direpresentasikan oleh record pada tabel fakta.
25 2.1.8.8.3 Identifikasi dan penyesuaian dimensi Dimensi menetapkan konteks pertanyaan mengenai fakta dalam tabel fakta. Kumpulan dimensi yang baik membuat data mart mudah dimengerti dan digunakan. Dimensi diidentifikasikan dengan detil untuk menjelaskan suatu hal seperti client dan properti pada grain yang tepat. Sebagai contoh dimensi client buyer mendeskripsikan atribut ID, nama, tipe, kota, area dan Negara. 2.1.8.8.4 Pemilihan fakta Grain dari tabel fakta menentukan fakta yang bisa digunakan. Misalnya, grain dari tabel fakta adalah setiap penjualan property, kemudian semua fakta numerik harus menunjuk pada penjualan ini. Fakta-fakta tersebut harus numerik dan dapat ditambah. 2.1.8.8.5 Penyimpanan pra-calculation di tabel fakta Setelah fakta-fakta dipilih maka dilakukan pengkajian ulang untuk menentukan apakah ada fakta-fakta yang dapat diterapkan untuk precalculation (kalkulasi awal). Contoh umum dari kebutuhan untuk penyimpanan pre-calculation muncul ketika fakta berisi pernyataan untung dan rugi. Situasi ini akan meningkat ketika tabel fakta didasarkan pada invoice atau sales.
26 2.1.8.8.6 Memastikan tabel dimensi Dalam langkah ini, kembali pada dimension table dan menambahkan gambaran teks terhadap dimensi yang memungkinkan. Gambaran teks harus mudah digunakan dan dimengerti oleh User. Kegunaan suatu data mart ditentukan oleh lingkup dan atribut tabel dimensi. 2.1.8.8.7 Pemilihan durasi basis data Sebagai contoh, perusahaan asuransi memiliki kebutuhan untuk menyimpan data dalam jangka waktu 5 tahun atau lebih. Tabel fakta yang sangat besar menimbulkan dua persoalan. Dan interpretasi file lama. Kedua, menimbulkan kemungkinan versi dimensi lama digunakan, bukan versi terbarunya. Hal ini akan dibahas lebih lanjut pada tahap delapan Tracking slowly changing dimensions. 2.1.8.8.8 Melacak perubahan dari dimensi secara perlahan Mengamati perubahan dari dimensi pada dimension table. Ada tiga tipe dasar dari perubahan dimensi secara perlahan, yaitu tipe 1, dimana atribut dimensi yang diubah dituliskan ulang; tipe 2, dimana atribut dimensi yang diubah menyebabkan pembentukan record baru; dan tipe 3, dimana atribut dimensi yang diubah mengakibatkan sebuah atribut atau kolom alternative dibuat, jadi antara record yang lama dan baru diakses secara bersama-sama.
27 2.1.8.8.9 Penentuan prioritas dan model query. Mempertimbangkan pengaruh dari rancangan fisik, seperti penyortiran urutan tabel fakta pada disk dan keberadaan dari penyimpanan awal ringkasan (summaries) atau penjumlahan (aggregate). Selain itu, masalah administrasi, backup, kinerja indeks, dan keamanan juga merupakan faktor yang harus diperhatikan 2.1.8.9 ETL (Extract, Transformation, Load) ETL merupakan proses yang sangat penting, dengan ETL data dapat dimasukkan ke dalam data warehouse. ETL juga dapat digunakan untuk mengintegrasikan data dengan sistem yang sudah ada sebelumnya. Tujuan ETL adalah mengumpulkan, menyaring, mengolah, dan menggabungkan data-data yang relevan dari berbagai sumber untuk disimpan ke dalam data warehouse. Hasil dari proses ETL adalah dihasilkannya data yang memenuhi kriteria data warehouse seperti data historis, terpadu, terangkum, statis, dan memiliki struktur yang dirancang untuk keperluan proses analisis. Extra ct Menurut Kimball dan Ross (2002, p8), extraction ialah langkah pertama dalam proses mendapatkan data ke dalam lingkungan Data Warehouse. Menurut Dyche (2000, p157), data ditemukan dan dipindahkan dari sistem operasional ke data warehouse atau platform transformasi. Transform
28 Menurut Kimball dan Ross (2002, p8), setelah data diextract, ada sejumlah transformation yang mungkin dilakukan, seperti melakukan cleansing data (memperbaiki kesalahan pengejaan kata, mengatasi masalah elemen yang hilang, atau mengubah ke bentuk standard), mengkombinasikan data dari berbagai sumber, dan memberikan warehouse keys. Loading Menurut Kimball dan Ross (2002, p8), setelah melakukan transformasi maka data dapat dimuat ke dalam data warehouse. Fase load merupakan tahapan yang berfungsi untuk memasukkan data kedalam target akhir, yang biasanya kedalam suatu data warehouse. Jangka waktu proses ini tergantung pada kebutuhan organisasi. Beberapa data warehouse dapat setiap minggu menulis keseluruhan informasi yang ada secra kumulatif, data diubah, sementara data warehouse yang lain (atau bagian lain dari data warehouse yang sama) dapat menambahkan data baru dalam suatu bentuk historical, contohnya setiap jam. Waktu dan jangkauan untuk mengganti atau menambah data tergantung dari perancangan data warehouse pada waktu menganalisis keperluan informasi. 2.1.9 Metodologi perancangan Data Warehouse Menurut Connolly dan Begg (2002, p1183), dimensionality modeling adalah sebuah teknik logical design yang bertujuan untuk menghadirkan data
dalam sebuah bentuk yang standard dan intuitif yang memungkinkan pengaksesan basis data dengan performa yang tinggi. 29 Ada beberapa konsep pemodelan data warehouse pada dimensionality modeling yang dikenal umum pada saat ini, konsep konsep tersebut antara lain ialah skema bintang, snowflake schema, dan starflake schema. 2.1.9.1 Skema Bintang Menurut Hoffer et al (2005, p467), skema bintang terdiri dari dua macam tabel, yaitu tabel fakta (fact table) dan tabel dimensi (dimension table). Tabel fakta mengandung fakta atau data kuantitatif mengenai sebuah bisnis seperti jumlah unit terjual, jumlah order, dan sebagainya. Tabel dimensi berisi data deskriptif mengenai subjek bisnis. Tabel dimensi biasanya adalah sebagai sumber attribute yang digunakan untuk mengkualifikasi, mengkategorikan, atau meringkas fakta dalam query, report, atau grafik. Menurut Ponniah (2001, pp210-216), skema bintang adalah teknik dasar desain data untuk Data Warehouse. Struktur skema bintang adalah suatu struktur yang dapat dengan mudah dipahami dan digunakan oleh User seperti yang terlihat pada gambar 2.7. Struktur tersebut mencerminkan bagaimana user biasanya memandang ukuran-ukuran kritis mengikuti dimensi-dimensi bisnis yang ada
30 Gambar 2.7 Gambaran Skema Bintang Keuntungan skema bintang: 1. Mudah Dipahami User Skema bintang menggambarkan dengan jelas bagaimana user berpikir dan memerlukan data untuk query dan analisis. Skema bintang menggambarkan hubungan antar tabel sama seperti cara user melihat hubungan tersebut secara normal. 2. Mengoptimalkan navigasi Skema bintang mengoptimalisasikan navigasi melalui basis data sehingga lebih mudah dilihat. Meskipun hasil query terlihat kompleks, tetapi navigasi itu memudahkan User. 3. Paling cocok untuk pemrosesan query Skema bintang paling cocok untuk pemrosesan query karena skema ini berpusat pada query. Tanpa bergantung pada banyak dimensi dan kompleksitas query, setiap query akan dengan mudah dijalankan, pertama dengan memilih baris dari
tabel dimensi dan kemudian menemukan baris yang sama di tabel fakta. 31 2.1.9.2 Snowflake Menurut Ponniah (2001, p235), snowflake schema merupakan variasi lain dari skema bintang dimana tabel dimensi dari skema bintang dinormalisasi, seperti yang digambarkan pada gambar 2.8. Gambar 2.8 Gambaran Skema Snowflake Keuntungan snowflake schema: a. Ukuran penyimpanan kecil di dalam tempat penyimpanan. b. Struktur yang normal lebih mudah untuk di-update dan dijaga. Kerugian snowflake schema: a. Skemanya kurang intuitif atau jelas dan end-user terhambat oleh kompleksitas. b. Sulit untuk mencari isi skema karena terlalu kompleks.
c. Performa query menurun karena adanya tambahan gabungan tabel. 32 2.1.9.3 Starflake Schema (Skema Starflake) Menurut Connolly dan Begg (2005, p1185), starflake schema adalah struktur campuran (hybrid) yang berisi gabungan dari skema bintang dan snowflake schema. Gambar 2.9 Skema Starflake 2.1.10 Komponen Dimensional Modelling a. Fact Menurut Kimball dan Ross (2002, p402), fact atau fakta adalah sebuah ukuran dari performansi bisnis, biasanya berupa numerical dan penjumlahan. Hal ini berlanjut pada pengertian dari tabel fact sebagai lokasi penyimpanan untuk fact yang ada.
33 b. Fact Table Menurut Inmon ( 2005, p497), fact table ialah pusat dari tabel star join dimana data dengan banyak kepentingan tersimpan. Menurut Kimball dan Ross (2002, p402), fact table pada sebuah skema bintang ialah tabel central dengan pengukuran performansi bisnis dalam bentuk numerik yang memiliki karakteristik berupa sebuah composite key, yang tiap-tiap elemennya adalah foreign key yang didapat dari tabel dimensi. c. Dimension Menurut Kimball dan Ross (2002, p399), dimension atau dimensi merupakan sebuah entitas independent pada sebuah model dimensional yang berfungsi sebagai pintu masuk atau mekanisme untuk memecah mecah pengukuran tambahan yang ada pada tabel fakta dari model dimensional. d. Dimension Table Menurut Inmon (2005, p495), dimension table atau tabel dimensi merupakan tempat dimana data tambahan yang berhubungan dengan tabel fakta ditempatkan pada sebuah tabel multidimensional. Menurut Kimball dan Ross (2002, p399), tabel dimensi ialah sebuah tabel pada model dimensional yang memiliki sebuah primary key tunggal dan kolom dengan atribut deskriptif. e. Surrogate Key Menurut Kimball dan Ross (2002, p414), surrogate key ialah key berupa integer yang secara sequential ditambahkan sesuai dengan keperluan untuk membentuk sebuah tabel dimensi dan elemen yang
34 menggabungkannya dengan tabel fakta. Pada tabel dimensi, surrogate key bertindak sebagai primary key. Sedangkan pada tabel fakta, surrogate key bertindak sebagai foreign key yang menspesifikasikan dimensi. 2.1.11 Agregasi Menurut Inmon (2005, p114), terdapat banyak kasus dimana data dalam data warehouse tidak memenuhi kriteria stabilitas dan tidak sering berubah, kasus lainnya dimana jumlah data menjadi terlalu banyak, sering terjadi perubahan isi data, dan sebagainya. Dalam kasus-kasus seperti demikian, dapat dilakukan agregasi yang mengelompokkan beberapa data detil operasional yang berbeda ke dalam satu record tunggal. Record tunggal itu disebut sebagai profile record atau aggregate record. Sebuah profile record dibuat untuk mengelompokkan record detil yang sangat banyak jumlahnya. Sebagai contoh, sebuah perusahaan telepon pada akhir bulan mengumpulkan semua data-data aktivitas telepon para pelanggan dalam sebulan kedalam data record pelanggan dalam data warehouse. Agregasi dari data operasional kedalam sebuah record tunggal dalam Data Warehouse dapat dilakukan dengan menggunakan beberapa cara, seperti: Nilai-nilai yang diambil dari data operasional dapat diringkas. Unit-unit data operasional dapat dihitung / dijumlahkan, dimana jumlah dari unit data tersebut disimpan. Unit-unit atas data dapat diproses untuk menentukan yang paling tinggi, paling rendah, rata-ratanya, dan lain-lain. Kejadian pertama dan terakhir dari data dapat ditangkap.
35 Tipe data tertentu, yang berada dalam batasan dari beberapa parameter, dapat diukur. Data yang efektif pada momen waktu tertentu dapat ditangkap Data yang paling muda dan yang paling tua dapat ditangkap 2.1.12 Denormalisasi Menurut Inmon (2005, p495), denormalisasi adalah teknik dari penempatan data normalisasi dalam lokasi fisik yang mengoptimalkan kinerja dari sistem. Menurut Rainardi (2008, p30), denormalized basis data ialah sebuah basis data dengan beberapa redundancy data tidak hilang melalui sebuah proses normalisasi. 2.2 Teori-teori Khusus 2.2.1 Pengertian Rumah sakit Rumah sakit adalah tempat dimana orang sakit mencari dan menerima pelayanan kedokteran serta tempat dimana pendidikan klinik untuk mahasiswa kedokteran, perawat dan tenaga profesi kesehatan lainya diselenggarakan, Wolper dan Pena (1997). 2.2.1.1 Fungsi Rumah Sakit Menurut Permenkes RI No. 159b/Men kes/per/1998, fungsi rumah sakit adalah : a) Menyediakan dan menyelenggarakan pelayanan medik, penunjang medik, rehabilitasi, pencegahan dan peningkatan kesehatan.
36 b) Menyediakan tempat pendidikan atau latihan tenaga medik dan paramedik. c) Sebagai tempat penelitian dan pengembangan ilmu dan teknologi bidang kesehatan. 2.2.2 Rawat Inap Rawat inap adalah suatu kelompok pelayanan kesehatan yang terdapat di rumah sakit yang merupakan gabungan dari beberapa fungsi pelayanan. Kategori pasien yang masuk rawat inap adalah pasien yang perlu perawatan intensif atau observasi ketat karena penyakitnya. Pasien yang masuk pada pelayanan rawat inap akan mengalami tingkat proses transformasi, yaitu: a. Tahap Admission, yaitu pasien dengan penuh kesabaran dan keyakinan dirawat tinggal di rumah sakit. b. Tahap Diagnosis, yaitu pasien diperiksa dan ditegakan diagnosisnya. c. Tahap Treatment, yaitu berdasarkan diagnosis pasien dimasukan dalam program perawatan dan therapi. d. Tahap Inspection, yaitu secara continue diobservasi dan dibandingkan pengaruh serta respon pasien atas pengobatan. e. Tahap Control, yaitu setelah dianalisa kondisinya, pasien dipulangkan. pengobatan diubah atau diteruskan, namun dapat juga kembali ke proses untuk didiagnosa ulang. Revans (1986 )
37 2.2.2.1 Kualitas pelayanan Rumah Sakit Menurut Jacobalis ( 1990 ) kualitas pelayanan kesehatan di ruang rawat inap rumah sakit dapat diuraikan dari beberapa aspek, diantaranya adalah: a. Penampilan keprofesian atau aspek klinis Aspek ini menyangkut pengetahuan, sikap dan perilaku dokter dan perawat dan tenaga profesi lainya. b. Efisiensi dan efektifitas Aspek ini menyangkut pemanfaatan semua sumber daya di rumah sakit agar dapat berdaya guna dan berhasil guna. c. Keselamatan Pasien Aspek ini menyangkut keselamatan dan keamanan pasien. Aspek ini menyangkut kepuasan fisik, mental, dan sosial pasien terhadap lingkungan rumah sakit, kebersihan, kenyamanan, kecepatan pelayanan, keramahan, perhatian, biaya yang diperlukan dan sebagainya. Mutu asuhan pelayanan rawat inap dikatakan baik apabila : a. Memberikan rasa tentram kepada pasienya yang biasanya orang sakit. b. Menyediakan pelayanan yang profesional dari setiap strata pengelola rumah sakit. Pelayanan ini bermula sejak masuknya pasien ke rumah sakit sampai pulangnya pasien.
38 Dari kedua aspek ini dapat diartikan sebagai berikut: a. Petugas penerima pasien dalam melakukan pelayanan terhadap pasien harus mampu melayani dengan cepat karena mungkin pasien memerlukan penanganan segera. b. Penanganan pertama dari perawat harus mampu membuat pasien menaruh kepercayaan bahwa pengobatan yang diterima dimulai secara benar. c. Penanganan oleh para dokter yang profesional akan menimbulkan kepercayaan pasien bahwa mereka tidak salah memilih rumah sakit. d. Ruangan yang bersih dan nyaman, memberikan nilai tambah kepada rumah sakit. e. Peralatan yang memadai dengan operator yang profesional. f. Lingkungan rumah sakit yang nyaman. Adji Muslihuddin (1996) 2.2.3 Rawat Jalan Rawat jalan adalah pelayanan pengobatan di fasilitas pelayanankesehatan dengan tidak harus menginap di fasilitas pelayanan kesehatan tersebut baik didalam gedung dan diluar gedung [Anonim]. 2.2.4 Pengertian IGD Sarana kesehatan yang telah mempunyai kemampuan untuk melaksanakan pelayanan gawat darurat sesuai standart dan dapat diakses oleh masyarakat dalam kurun waktu tertentu. Kegawatan adalah keadaan yang menimpa seseorang yang dapat menyebabkan jiwanya terancam sehingga
39 memerlukan pertolongan secara cepat, tepat dan cermat. Kedaruratan adalah keadaan yang memerlukan tindakan mendesak dan tepat untuk menyelamatkan nyawa, menjamin perlindungan dan memulihkan kesehatan individu atau masyarakat, Anonim. 2.2.5 Pengertian Kesehatan Organisasi Kesehatan Dunia (WHO, World Health Organization) mendefinisikan sehat sebagai suatu keadaan fisik, mental dan sosial yang sejahtera dan bukan hanya ketiadaan penyakit dan lemah. Menurut UU 23 tahun 1992, kesehatan adalah keadaan sejahtera dari badan, jiwa, dan sosial yang memungkinkan setiap orang hidup produktif secara sosial dan ekonomi Berdasarkan pernyataan diatas, maka menurut kami kesehatan itu bukan hanya tidak adanya penyakit atau rasa sakit pada diri kita tapi juga seorang dapat dikatakan benar-benar sehat apabila ia itu terlihat sehat bukan hanya pada fisiknya tapi juga aspek kejiwaannya atau psikologisnya.