jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

dokumen-dokumen yang mirip
PENDAHULUAN TINJAUAN PUSTAKA

TUGAS DATA WAREHOUSE & DATA MINING OLAP, OPERASI OLAP & MOLAP

PENDAHULUAN TINJAUAN PUSTAKA


6/26/2011. Menurut W.H. Inmon dan Richard D.H. Menurut Vidette Poe

PEMBUATAN DATA WAREHOUSE POTENSI DESA DI WILAYAH BOGOR MENGGUNAKAN ORACLE DATA WAREHOUSE DINA WISUDAWAN KUSUMANINGTIAS G

DATA WAREHOUSING AND ONLINE ANALYTICAL PROCESSING (OLAP)

HASIL DAN PEMBAHASAN Dalam pembuatan data warehouse potensi desa wilayah Bogor melalui beberapa tahap yaitu:

Basis Data Oracle - Business Intelligence System. Ramos Somya, M.Cs.

IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI PROVINSI JAWA BARAT TAHUN 2003 DAN 2006 SOFIYANTI INDRIASARI G

MATERI : OLAP DAN ANALISIS DATA MULTIDIMENSIONAL

Data Warehousing dan Decision Support

BAB III METODE PENELITIAN

PENDAHULUAN TINJAUAN PUSTAKA

PERANCANGAN DATA WAREHOUSE CALON MAHASISWA BARU POLITEKNIK NEGERI LHOKSEUMAWE

Tugas Akhir (KI091391) Muhamad Adi Prasetyo

DATAMULTIDIMENSI. DATAWAREHOUSE vs DATAMART FIRDAUS SOLIHIN UNIVERSITAS TRUNOJOYO

Anggota Kelompok 3 :

IMPLEMENTASI FUZZY OLAP PADA DATA POTENSI DESA DI PROVINSI JAWA BARAT TAHUN 2003 DAN 2006 ABSTRAK

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Perancangan Data Warehouse

Bab 2 Tinjauan Pustaka 2. 1 Penelitian Terdahulu

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi...Volume..., Bulan 20..ISSN : PEMBANGUNAN INDEPENDENT DATA MART PADA OPTIK YUDA

BAB I PENDAHULUAN. I.1 Pendahuluan

DESAIN DATAWAREHOUSE AKADEMIK UNTUK MENDUKUNG SISTEM ADMINISTRASI DATA AKADEMIK DI UNIVERSITAS TADULAKO. Mohammad Yazdi 1

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

DATA WAREHOUSE KONSEP Konsep dasar data warehouse adalah perbedaan antara data dan informasi. Data terdiri dari fakta-fakta yang dapat diamati dan

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization

PEMANFAATAN DATA WAREHOUSE SEBAGAI SARANA PENUNJANG PENYUSUNAN BORANG AKREDITASI STANDAR 3 PADA FAKULTAS TEKNOLOGI INFORMASI UNIVERSITAS BUDI LUHUR

BAB 2 LANDASAN TEORI

BAB III LANDASAN TEORI

OLAP - PERTEMUAN 8 OLAP

BAB II LANDASAN TEORI

Perancangan Basis Data

DATABASE. Basis Data : Suatu pengorganisasian sekumpulan data yang saling terkait sehingga

BAB II LANDASAN TEORI

ANALISA DATA TRANSAKSIONAL PADA E-COMMERCE DENGAN TEKNOLOGI OLAP (ON-LINE ANALYTICAL PROCESS)

Tugas. Data Warehouse. OLAP, Operasi OLAP, dan Jenis Rolap

[Data Warehouse] [6/C2 & 6/D2]

Web browser Mozilla Firefox 2.0 dan Internet Explorer 7 HASIL DAN PEMBAHASAN. Analisis Data

FAST berarti sistem ditargetkan untuk memberikan response terhadap user dengan secepat mungkin, sesuai dengan analisis yang dilakukan.

BAB 2 2 LANDASAN TEORI. Menurut Inmon (2002, p388), data adalah rekaman dari fakta-fakta, konsepkonsep,

HASIL DAN PEMBAHASAN. Microsoft SQL Server Microsoft Sharepoint Microsoft.Net Framework 4.0.

Datawarehouse dan OLAP (Overview) Diambil dari presentasi Jiawei Han

Online Analytical Processing (OLAP)

BASIS DATA MODEL BASIS DATA

KARAKTERISTIK DATA WAREHOUSE

SIE/nts/TIUAJMks 9/26/2013

Data Warehouse dan Decision Support System. Arif Basofi

HASIL DAN PEMBAHASAN. Studi pustaka. Analisis data. Versi struktur dan fungsi transformasi. Pemuatan data. Implementasi operasi OLAP

TUGAS DATA WAREHOUSE

[Data Warehouse] [6/C2 & 6/D2]

BAB II TINJAUAN PUSTAKA

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti

PEMODELAN DATA WAREHOUSE PADA JURUSAN TEKNIK INFORMATIKA UNIKOM

DATA WAREHOUSE PERTEMUAN I S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM

Data Warehouse, Data Mart, OLAP, dan Data Mining CHAPTER 6

BAB II. LANDASAN TEORIse. Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi... Volume..., Bulan 20.. ISSN :

Database dan DBMS DBMS adalah perangkat lunak sistem yang memungkinkan para pemakai membuat, memelihara, mengontrol, dan mengakses basis data dengan

BAB 2 LANDASAN TEORI. Database adalah suatu koleksi / kumpulan dari data yang persistent, yaitu ada

Jurnal Ilmiah Widya Teknik Volume 15 Nomor

BAB IV PERANCANGAN SISTEM

BAB 2 LANDASAN TEORI

PERANCANGAN DATA WAREHOUSE E-PROCUREMENT PADA INSTANSI PEMERINTAHAN

Lecture s Structure. Desain Data Warehouse (I): Dimensional Modelling. Mendisain Sebuah Data Warehouse

IMPLEMENTASI OLAP PADA DATA PENJUALAN BBM MENGGUNAKAN PENTAHO TRIYONO

PENGEMBANGAN DATA WAREHOUSE PROGRAM TRACKING STASIUN TV DI INDONESIA ABSTRAK

DATAWAREHOUSE. Sukarsa:Pasca Elektro Unud. I Made Sukarsa

BAB 2 LANDASAN TEORI. berarti dan penting di lingkungan pemakai. (Hoffer, Prescott, dan McFadden, 2002, p5).

MAKALAH SEMINAR PENGEMBANGAN DATA WAREHOUSE DAN APLIKASI OLAP PADA DATA EVALUASI PROSES BELAJAR MENGAJAR IPB BERBASIS WEB

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN

PERANCANGAN DATA WAREHOUSE PENGOLAHAN PERSEDIAAN BUKU PT. GRAMEDIA ASRI MEDIA MAKASSAR

MODEL DATA WAREHOUSE UNTUK MENUNJANG PENYUSUNAN BORANG AKREDITASI STANDAR 3 PADA FAKULTAS TEKNOLOGI INFORMASI UNIVERSITAS BUDI LUHUR

BAB 2 LANDASAN TEORI. Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut:

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat

4 Web server mengakses kubus data Palo server melalui Palo PHP API. Aplikasi OLAP menggunakan library JpGraph untuk menampilkan grafik.

BAB 2 LANDASAN TEORI

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009

Sistem Penunjang Keputusan, Pertemuan Ke-9 KECERDASAN BISNIS Data Warehouse, Data Mart, OLAP, dan Data Mining

BAB 2 LANDASAN TEORI

Data Warehouse, Data Mart, OLAP, dan Data Mining. arifin, sistem informasi - udinus 1

Data Warehouse Data warehouse adalah basis data yang menyimpan data sekarang dan data masa lalu yang berasal dari berbagai sistem operasional dan

BAB II KONSEP DATA WAREHOUSING

Tugas Data Warehouse. Kebutuhan Bisnis untuk Gudang Data. (Warehouse)

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI. Dasar-dasar teori tersebut akan digunakan sebagai landasan berpikir dalam

PERTEMUAN 14 DATA WAREHOUSE

6.2 Pendekatan Database Untuk Pengelolaan Data

PEMBANGUNAN DATA WAREHOUSE DAN APLIKASI OLAP UNTUK MEMANTAU PRESTASI MAHASISWA PROGRAM STUDI S1 ILMU KOMPUTER IPB SUCI REZKY FHATTIYA

SUMBER DAYA-SUMBER DAYA SISTEM INFORMASI (BAGIAN 1) PSI Materi III Sesi 6

Membangun Data Warehouse

BAB I PENDAHULUAN 1.1 Latar Belakang

Analisis Data dengan Menggunakan ERD dan Model Konseptual Data Warehouse

BAB 2 LANDASAN TEORI

Data Warehouse dan Data Mining Oleh : Asep Jalaludin,S.T.,M.M.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB I PENDAHULUAN. 1.1 Latar Belakang

menggunakan framework Geomondrian dan

PENGEMBANGAN DATA WAREHOUSE DAN APLIKASI OLAP DATA TRACER STUDY ALUMNI IPB BERBASIS WEB MENGGUNAKAN MICROSOFT BUSINESS INTELLIGENCE

Transkripsi:

1 Latar Belakang PENDAHULUAN Kemajuan teknologi komputer semakin memudahkan proses penyimpanan dan pengolahan data berukuran besar. Namun demikian, seringkali data yang sudah tersimpan belum dimanfaatkan secara maksimal menjadi suatu informasi dan pengetahuan yang penting di kemudian hari. Pemakaian sumber informasi yang terkandung dalam basis data sangat berperan dalam proses permintaan dan pelayanan query. Terkadang proses query tersebut melibatkan sumber informasi yang besar sehingga diperlukan peningkatan kinerja query untuk mempercepat akses informasi. Data warehouse dan On-Line Analytical Processing (OLAP) merupakan elemen penting dalam mendukung proses pengambilan keputusan. Badan Pusat Statistik (BPS) secara teratur melakukan pengumpulan data untuk memantau kondisi penduduk dan sosial ekonomi Indonesia, misalnya melalui Survei Potensi Desa (Podes). Podes merupakan data yang berhubungan dengan wilayah (tata ruang) dengan basis desa/kelurahan. Podes pertama kali dilakukan pada tahun 1980 bersamaan dengan Sensus Penduduk 1980. Data Podes terdiri dari 257 item untuk seluruh desa di Indonesia. Data podes memiliki volume yang besar sehingga perlu disimpan dalam sebuah repositori yang solid, yaitu data warehouse. Data warehouse dapat digunakan untuk menyimpan dan mengolah data multidimensi agar dapat mendukung keputusan yang lebih cepat dan lebih tepat. Tujuan Penelitian ini bertujuan untuk merancang dan membangun suatu model basis data multidimensi untuk data potensi desa wilayah Bogor. Model data tersebut akan diimplementasikan dalam pembuatan kubus data dan OLAP (On Line Analitical Processing) pada data warehouse potensi desa. Ruang Lingkup Penelitian ini akan dibatasi pada pembuatan data warehouse potensi desa wilayah Bogor dengan subjek utama luas lahan, jumlah penduduk, jumlah sekolah, jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006. Manfaat Manfaat penelitian ini adalah tersedianya data dan informasi mengenai potensi desa yang dapat diakses secara cepat dan akurat. Dengan demikian, diharapkan data dan informasi tersebut dapat digunakan oleh pihak-pihak terkait (BPS dan Pemerintah) dalam mendukung proses pengambilan keputusan. TINJAUAN PUSTAKA Potensi Desa (Podes) Potensi desa (podes) adalah kemampuan atau daya/kekuatan yang memiliki kemungkinan untuk dikembangkan dalam wilayah otonomi desa. Data potensi desa merupakan data yang berurusan dengan wilayah/tata ruang dengan basis desa/ kelurahan. Sensus podes dilakukan setiap tiga tahun. Tujuan diadakannya PODES antara lain (www.bps.go.id/podes2006): Tersedianya data yang potensi/keadaan pembangunan di desa/ dan perkembangannya meliputi keadaan sosial, ekonomi, sarana dan prasarana, serta potensi yang ada di desa/kelurahan. Menyediakan data untuk berbagai keperluan khususnya yang berkaitan dengan kebutuhan perencanaan regional (spasial) di setiap daerah. Melengkapi penyusunan kerangka sampling (sampling frame) untuk kegiatan statistik lebih lanjut. Menyediakan informasi bagi keperluan penentuan klasifikasi/updating desa urban dan rural, desa tertinggal dan tidak tertinggal. Menyediakan data pokok bagi penyusunan statistik wilayah kecil (small area statistics). Data Warehouse Secara umum, data warehouse merujuk pada tempat penyimpanan data yang dikelola secara terpisah dari basis data-basis data operasional yang dimiliki sebuah

2 instansi. Data warehouse seringkali dibangun dari berbagai basis data yang diintegrasikan dengan berbagai sistem aplikasi untuk mendukung proses pengambilan keputusan dan analisis data dengan menyediakan platform yang solid untuk data historikal dan gabungan (consolidated). Definisi dari data warehouse telah dinyatakan oleh Bill Inmon pada tahun 1980an, yaitu koleksi data yang bersifat subject-oriented, integrated, time variant, dan non-volatile, yang digunakan dalam pembuatan keputusan strategis (Imhoff et. al. 2003). Istilah data warehousing merujuk ke proses konstruksi dan pengunaan data warehouse (Tam 1998). Konstruksi data warehouse memerlukan tahapan data integration, data cleaning, dan data consolidation. Hal ini dikarenakan basis data diintegrasikan dari sumber data yang heterogen. Sumber-sumber data tersebut mungkin mengandung data dengan kualitas yang beragam atau memiliki representasi format data yang tidak konsisten. Model Data Multidimensi Model data multidimensi adalah model data yang digunakan pada data warehouse. Model data multidimensi terdiri dari dua data, yaitu (Mallach 2000): Data dimensi (dimension data) Data dimensi adalah entitas yang ingin disimpan oleh perusahaan (organisasi). Data dimensi akan berubah jika analisis kebutuhan pengguna berubah. Data dimensi mendefinisikan label yang membentuk isi laporan. Setiap dimensi diulang untuk setiap kelompok. Atribut data dimensi diletakkan pada tabel dimensi. Tabel dimensi berukuran lebih kecil daripada tabel fakta, berisi data bukan numerik yang berasosiasi dengan atribut dimensi. Data fakta (fact data) Data fakta adalah data utama dari data multidimensi yang merupakan kuantitas yang ingin diketahui dengan menganalisis hubungan antardimensi. Data fakta diekstrak dari berbagai sumber. Data fakta cenderung stabil dan tidak berubah seiring waktu. Atribut data fakta diletakkan pada tabel fakta. Tabel fakta berukuran besar, memiliki jumlah baris sesuai dengan jumlah kombinasi nilai dimensi yang mungkin dan jumlah kolom sesuai dengan jumlah dimensi yang direpresentasikan. Tabel fakta berisi nama-nama fakta, ukuran, dan foreign key dari tabel dimensi yang berhubungan. Model data multidimensi menampilkan data dalam bentuk kubus data. Kubus data memungkinkan data dimodelkan dan ditampilkan dalam banyak dimensi. Kubus data disebut juga cuboid. Pola-pola cuboid dapat dibuat apabila diberikan satu kumpulan dimensi. Masing-masing pola menampilkan data pada tingkat kesimpulan yang berbeda-beda (Han & Kamber 2006). Untuk menggambarkan hubungan antardata pada data multidimensi digunakan skema multidimensi. Skema adalah sekumpulan objek dalam basis data. Pada data warehouse, skema merupakan sekumpulan tabel yang berhubungan. Skema digunakan untuk menunjukkan hubungan antara tabel dimensi dengan tabel fakta. Skema ditentukan berdasarkan kebutuhan data warehouse dan keinginan pembuat data warehouse. Data warehouse membutuhkan skema yang ringkas dan berorientasi subjek. Tipe-tipe skema multidimensi antara lain (Han & Kamber 2006): Skema bintang (star schema) Skema bintang adalah skema data warehouse yang paling sederhana. Skema ini disebut skema bintang karena hubungan antara tabel dimensi dan tabel fakta menyerupai bintang dimana satu tabel fakta dihubungkan dengan beberapa tabel dimensi. Titik tengah skema bintang adalah satu tabel fakta besar dan sudut-sudutnya adalah tabeltabel dimensi. Bentuk skema bintang dapat dilihat pada Gambar 1. Keuntungan yang didapat jika menggunakan skema ini adalah peningkatan kinerja data warehouse, pemrosesan query yang lebih efisien, dan waktu respon yang cepat. Gambar 1 Skema bintang (Elmasri & Navathe 2000)

3 Skema snowflake (snowflake schema) Skema snowflake adalah variasi dari skema bintang dimana beberapa tabel dimensi dinormalisasi, jadi dihasilkan beberapa tabel tambahan. Bentuk skema snowflake dapat dilihat pada Gambar 2. Keuntungan yang didapat dengan menggunakan skema ini adalah penghematan memori, tapi waktu yang dibutuhkan untuk pemrosesan query menjadi lebih lama. Gambar 2 Skema snowflake (Elmasri & Navathe 2000) Skema galaksi (fact constellation) Pada skema galaksi, beberapa tabel fakta berbagi tabel dimensi. Bentuk skema galaksi dapat dilihat pada Gambar 3. Keuntungan menggunakan skema ini adalah menghemat memori dan mengurangi kesalahan yang mungkin terjadi. Gambar 3 Skema galaksi (Elmasri & Navathe 2000) Kubus Data: Komputasi Kuantitas Agregat Kubus data didefinisikan oleh dimensi dan fakta. Dimensi berisi perspektif atau entitas-entitas dimana organisasi menyimpan record data, sedangkan fakta mengandung ukuran-ukuran data dan relasi antardimensi akan dianalisis. Setiap dimensi dapat memiliki sebuah tabel dimensi yang menjelaskan lebih jauh dimensi-dimensi, sedangkan informasi tentang fakta seperti nama-nama fakta, ukuran-ukuran serta kunci untuk setiap tabel-tabel dimensi yang berelasi berada dalam tabel fakta. Motivasi utama untuk menentukan data multidimensi adalah pentingnya membuat agregasi data dalam berbagai cara. Measure pada kubus data adalah fungsi numerik yang dievaluasi pada tiap titik di dalam ruang kubus data (Han & Kamber 2006). Dalam contoh penjualan, kita dapat menemukan pendapatan penjualan total untuk tahun tertentu dan untuk produk tertentu, atau mungkin ingin dilihat pendapatan penjualan tahunan untuk setiap lokasi untuk semua produk. Perhitungan agregasi total melibatkan penetapan nilai tertentu untuk beberapa atribut yang digunakan sebagai dimensi dan menjumlahkan semua nilai yang mungkin untuk atribut-atribut yang membentuk dimensi-dimensi sisanya. Tabel 1 menunjukkan total yang dihasilkan dari semua lokasi untuk waktu tertentu dan Tabel 2 menunjukkan marginal total dari Tabel 1. Tabel 1 Total hasil penjumlahan semua lokasi untuk waktu dan produk tertentu Tahun Product ID Jan 1, Jan 2,.. Dec 31, 1 1,001 987.. 891.. 27 10,265 10,225 9,325.. Tabel 2 Marginal total dari Tabel 1. Jan Jan.. Dec Total 1, 2, 31, 1 1, 001 987.. 891 370, 000.. Product ID 27 10, 265 10, 225 9, 325.. Total 527, 532,... 631, 362 953 221 3,800, 020 227, 352, 127 Jika terdapat 365 hari dalam satu tahun dan 1000 produk, maka Tabel 1 memiliki entri sebanyak 365,000 (nilai total), untuk setiap pasangan data produk. Dapat juga ditentukan lokasi toko dan tanggal serta menjumlahkan nilai pada semua produk atau

4 menentukan lokasi dan produk serta menjumlahkan nilai pada seluruh tanggal. Tabel 2 menunjukkan marginal total dari Tabel 1. Nilai-nilai total ini dihasilkan dari penjumlahan pada tanggal dan produk. Dalam Tabel 3, pendapatan penjualan total untuk produk 1, yang diperoleh dengan menjumlahkan seluruh nilai pada baris 1 (seluruh tanggal), adalah 370,000. Pendapatan penjualan total pada 1 Januari, yang diperoleh dengan menjumlahkan seluruh nilai pada kolom 1 (seluruh produk), adalah 527,362. Pendapatan penjualan total, yang diperoleh dengan menjumlahkan semua baris dan semua kolom (semua tanggal dan produk) adalah 227, 352, 127. Hal yang penting dalam contoh ini adalah bahwa terdapat sejumlah total (agregat) yang berbeda yang dapat dihitung untuk sebuah array multidimensi, tergantung kepada berapa banyak atribut yang kita jumlahkan. Diasumsikan bahwa terdapat n dimensi dan bahwa dimensi (atribut) ke-i memiliki s i nilai yang mungkin. Terdapat n cara yang berbeda untuk menjumlahkan hanya pada sebuah atribut. Jika kita menjumlahkan pada dimensi j, maka diperoleh s 1 *...* s j-1 *s j+1 *...* s n total, masing-masing untuk setiap kombinasi nilai atribut yang mungkin dari n 1 atribut (dimensi) lainnya. Total yang dihasilkan dari penjumlahan satu atribut dari array multidimensi dengan n 1 dimensi dan terdapat n array dari total. Dalam contoh penjualan, terdapat tiga himpunan total yang dihasilkan dari pejumlahan hanya pada satu atribut dan masing-masing total dapat ditampilkan sebagai tabel dua dimensi. Jika kita menjumlahkan nilai atribut pada dua dimensi (mungkin dimulai dengan salah satu dari array total yang diperoleh dengan penjumlahan pada satu dimensi), maka kita akan memperoleh sebuah array multidimensi total dengan n 2 dimensi. Terdapat n array yang berbeda untuk 2 total. Untuk contoh penjualan, terdapat array total yang dihasilkan dari 3 = 3 2 penjumlahan pada lokasi dan produk, lokasi dan waktu, atau produk dan waktu. Secara umum, penjumlahan pada k dimensi menghasilkan n array total, masingmasing dengan n k k dimensi. Representasi data multidimensi, bersama dengan semua total (agregat) yang mungkin, dikenal sebagai kubus data. Selain nama, ukuran dari setiap dimensi, yaitu banyaknya nilai atribut, tidak harus sama. Di samping itu, sebuah kubus data dapat memiliki dimensi kurang atau lebih dari tiga. Online Analytical Processing ( OLAP) Sistem data warehouse digunakan untuk analisis data dan pembuatan keputusan. Sistem ini dikenal sebagai on-line analytical processing (OLAP) system. Sistem OLAP dapat mengorganisasikan dan mempresentasikan data dalam beragam format agar dapat mengakomodasi kebutuhan pengguna yang beragam. Online Analytical Processing (OLAP) adalah proses komputer yang memungkinkan pengguna dapat dengan mudah dan selektif memilih dan melihat data dari sudut pandang yang berbeda (Han & Kamber 2006). Data pada OLAP disimpan dalam basis data multidimensi. Jika basis data relasional terdiri atas dua dimensi, maka basis data multidimensi terdiri atas banyak dimensi yang dapat dipisahkan oleh OLAP menjadi beberapa sub atribut. OLAP dapat digunakan untuk menemukan hubungan antara suatu item yang belum ditemukan. Berdasarkan struktur basis datanya, OLAP dibedakan menjadi tiga kategori utama (Han & Kamber 2006): 1 Multidimensional Online Analytical Processing (MOLAP) adalah OLAP yang secara langsung mengarah pada basis data multidimensi. MOLAP memproses data yang telah disimpan dalam array multidimensional dimana semua kombinasi data yang mungkin dicerminkan, masing-masing di dalam suatu sel yang dapat diakses secara langsung. 2 Relational Online Analytical Processing (ROLAP) adalah OLAP yang melakukan analisis data secara dinamis yang disimpan dalam basis data relasional bukan pada basis data multidimensi. ROLAP merupakan bentuk teknologi dari OLAP yang paling berkembang. 3 Hybrid Online Analytical Processing (HOLAP) merupakan kombinasi antara ROLAP dengan MOLAP. HOLAP dikembangkan untuk mengkombinasikan

5 antara kapasitas data pada ROLAP yang besar dengan kemampuan proses pada MOLAP. Data Praproses Data praproses adalah proses yang harus dilakukan sebelum membuat data warehouse. Proses-proses tersebut adalah (Han & Kamber 2006): 1 Ekstraksi (extraction) Ekstraksi adalah pengambilan data yang relevan dari basis data operasional sebelum masuk ke data warehouse. Pada ekstraksi, atribut-atribut dan recordrecord yang diinginkan dipilih dan diambil dari basis data operasional. Hal ini perlu dilakukan karena tidak semua elemen data berguna dalam pembuatan keputusan. 2 Pembersihan (cleaning) Pada pembersihan semua kesalahan dihilangkan dan diperbaiki. Pembersihan dilakukan untuk menghilangkan kesalahan (error). Kesalahan yang umum terjadi adalah nilai yang hilang (missing values), noise, dan data yang tidak konsisten. Pembersihan dilakukan dengan mengisi nilai yang kosong dan menghilangkan noise. 3 Transformasi (transformation) Pada transformasi, data dari semua sumber diberikan format dan nama yang umum. Proses transformasi dilakukan agar data tetap konsisten. Transformasi yang paling penting adalah transformasi nama agar tidak ada nama atribut yang sama atau atribut yang sama memiliki nama yang berbeda pada basis data yang berbeda. Setelah transformasi nama, semua elemen data harus dikonversikan ke format yang umum. 4 Pemuatan (loading) Setelah tahap ekstraksi dan transformasi dilakukan, maka data sudah siap untuk dimasukkan ke data warehouse. Pada tahap ini juga dilakukan pengurutan dan pengecekan integritas. 5 Refresh Tahapan ini dilakukan jika ada data baru yang masuk. Arsitektur Data Warehouse Salah satu arsitektur data warehouse adalah arsitektur tiga tingkat seperti pada Gambar 4 (Han & Kamber 2006), yaitu: 1 Tingkat paling bawah merupakan server basis data warehouse yang seringkali berupa sistem basis data relasional. Pada awal proses data diekstrak dan ditransformasi agar siap dimasukkan ke data warehouse. Setelah data siap, maka dilakukan perancangan data warehousenya. 2 Tingkat tengah adalah server OLAP yang diimplementasikan menggunakan sebuah OLAP multidimensi (MOLAP) atau OLAP relasional (ROLAP). 3 Tingkat paling atas adalah tingkat pengguna. Pada tingkat ini dibuat suatu analysis tools, reporting tools, atau data mining tools. Gambar 4 Arsitektur tiga tingkat data warehouse (Han & Kamber 2006). Operasi-Operasi Pada Data Multidimensi Operasi-operasi pada data multidimensi meliputi (Han & Kamber 2006): Slicing dan Dicing Slicing adalah pemilihan sekelompok sel dari seluruh array multidimensi dengan menentukan nilai tertentu untuk satu atau lebih dimensi. Dicing merupakan pemilihan sebuah subset dari sel dengan menentukan range nilai atribut. Hal ini ekuivalen dengan mendefinisikan sebuah subarray dari array yang lengkap. Dalam praktis, kedua operasi

6 ini dapat disertai oleh agregasi pada beberapa dimensi. Roll up dan Drill down Nilai atribut seperti tanggal memiliki nilai yang menyatakan tahun, bulan dan minggu. Sebuah lokasi juga dapat memiliki beberapa ciri seperti country (negara), state (propinsi) dan kabupaten. Product dapat dibagi ke dalam berbagai kategori seperti elektronik dan furniture. Seringkali kategori ini dapat diorganisasikan sebagai pohon hirarki atau lattice. Sebagai contoh, tahun berisi bulan dan minggu, keduanya berisi hari. Lokasi dapat dibagi ke dalam negara, yang terdiri dari propinsi, dan propinsi terdiri dari kabupaten. Contoh lain adalah kategori produk, furniture, dapat dibagi ke dalam sub kategori kursi, meja, sofa dan lain-lain. Struktur hirarki memunculkan operasi roll-up dan drill-down. Sebagai ilustrasi, pada data penjualan, yang merupakan data multidimensi dengan entri-entri untuk setiap tanggal, kita dapat menentukan agregat (roll-up) penjualan untuk semua tanggal dalam satu bulan. Sebaliknya, diberikan representasi data dimana dimensi waktu dipecah ke dalam bulan, kita ingin memisahkan total penjualan bulanan (drill down) ke dalam total penjualan harian. Dengan demikian operasi roll-up dan drill-down berkaitan dengan agregasi. Akan tetapi kedua ini berbeda dengan operasi agregasi yang telah dibahas, bahwa operasi roll-up dan drill-down mengagregasi sel dalam sebuah dimensi, bukan pada seluruh dimensi. Pivot Agregasi yang dijelaskan sebelumnya dapat dipandang sebagai bentuk reduksi dimensionalitas. Secara khusus, dimensi ke-j dieliminasi dengan penjumlahan pada dimensi tersebut. Secara konseptual, hal ini meringkas setiap kolom dari sel dalam dimensi ke-j ke dalam sebuah sel. Jika s j adalah banyaknya nilai yang mungkin dari dimensi ke-j, banyaknya sel direduksi oleh faktor dari s j. Pivoting merujuk kepada agregasi pada semua dimensi. Hasilnya adalah tabulasi silang dua dimensi dengan dua dimensi yang ditentukan sebagai dimensi-dimensi sisanya. Gambar 5 menunjukkan ilustrasi untuk operasi-operasi pada data multidimensi. Gambar 5 Ilustrasi untuk operasi-operasi pada data multidimensi. Oracle Data Warehouse Oracle data warehouse adalah proses pembangunan data warehouse menggunakan tools yang terdapat dalam oracle sehingga data dapat dengan mudah dikelola, diakses, dan dianalisis. Dengan manajemen antarmuka tunggal, Oracle Database 10g melakukan pemeliharaan sederhana terhadap pengembangan data warehouse (Oracle 2006). METODE PENELITIAN Penelitian ini akan dilakukan dalam beberapa tahap yaitu tahap analisis aliran data, perancangan, dan pembuatan data warehouse, dan pengembangan OLAP. Tahap-tahap tersebut dijelaskan sebagai berikut : Analisis Data Sensus potensi desa (podes) dilakukan setiap tiga tahun. Data yang akan digunakan dalam pembuatan data warehouse potensi desa di wilayah Bogor adalah data potensi desa hasil sensus BPS pada tahun 1996, 1999, 2003, 2006. Untuk data Potensi Desa akan dilakukan praproses data meliputi