PERANCANGAN DATA WAREHOUSE

dokumen-dokumen yang mirip
Seminar Perkembangan dan Hasil Penelitian Ilmu Komputer (SPHP-ILKOM) 147. STMIK Global Informatika MDP Jl. Rajawali No.

PERANCANGAN DATA WAREHOUSE DAN PENERAPAN ALGORITMA TIME SERIES UNTUK MEMPREDIKSI INFORMASI PERTUMBUHAN PENDUDUK DI PROVINSI BENGKULU

Perancangan Data warehouse Studio Foto Dan Salon Pada CV. XYZ Palembang

ANALISIS DAN PERANCANGAN DATA WAREHOUSE PENJUALAN, PEMBELIAN, DAN PERSEDIAAN UNTUK MENDUKUNG EKSEKUTIF DALAM PENGAMBILAN

Perancangan Data Warehouse Pemetaan Data Siswa Pada Disdikpora Kota Palembang

Desain Data Warehouse dan Implementasi Data Mining Terhadap Data Nilai Mahasiswa

PERANCANGAN DATA WAREHOUSE CALON MAHASISWA BARU POLITEKNIK NEGERI LHOKSEUMAWE

ANALISIS DAN PERANCANGAN DATA WAREHOUSE PERPUSTAKAAN (STUDI KASUS: PERPUSTAKAAN UNIVERSITAS BINADARMA PALEMBANG)

PERANCANGAN STRUKTUR DAN APLIKASI DATAWAREHOUSE PADA PELAYANAN KESEHATAN SINT CAROLUS. Ervyn. Binus University, Jakarta, DKI Jakarta, Indonesia.

PERANCANGAN DATA WAREHOUSE UNTUK DEMOGRAFI, PERKEMBANGAN PRODUK DAN PROMOSI PADA MANDIRI TABUNGAN RENCANA DI PT.BANK MANDIRI(PERSERO) TBK.

BAB I PENDAHULUAN.

Perancangan Data Warehouse pada PT. Olympindo Multi Finance Palembang Area Regional Sumatera II

Perancangan Data Warehouse Pasien pada RS. Muhammadyah Palembang

PERANCANGAN DATA WAREHOUSE E-PROCUREMENT PADA INSTANSI PEMERINTAHAN

ANALISIS DAN DESAIN DATA WAREHOUSE PADA PERPUSTAKAAN DAERAH KABUPATEN LUMAJANG. Tugas Akhir

BAB 2 LANDASAN TEORI

ANALISA DATA TRANSAKSIONAL PADA E-COMMERCE DENGAN TEKNOLOGI OLAP (ON-LINE ANALYTICAL PROCESS)

PERANCANGAN DATA WAREHOUSE PADA RUMAH SAKIT (STUDI KASUS: BLUD RSU KOTA BANJAR)

DATA WAREHOUSE PERTEMUAN I S1 TEKNIK INFORMATIKA TITUS KRISTANTO, S.KOM

PERANCANGAN DATA WAREHOUSE PADA PERPUSTAKAAN UNIVERSITAS NASIONAL

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Jurnal Ilmiah Widya Teknik Volume 15 Nomor

DESAIN DATA WAREHOUSE UNTUK MENGINTEGRASIKAN DATA KEPOLISIAN DI WILAYAH JAWA TIMUR

PROSES EXTRACT, TRANSFORM DAN LOAD PADA DATA WAREHOUSE

PERANCANGAN DATA MART BAGIAN PENJUALAN MOTOR BEKAS(USED MOTOR CYCLE ) PADA CV. ATLAS MOTOR

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

Perancangan Data Warehouse dan Penerapan Algoritma Association untuk Ektraksi Data Penjualan Barang pada Minimarket Darmanto Jaya

Abidah Elcholiqi, Beta Noranita, Indra Waspada

PERTEMUAN 14 DATA WAREHOUSE

ANALISA PENGEMBANGAN STAR SCHEMA DATA WAREHOUSE PADA ONLINE SHOP GALIYA

BAB II LANDASAN TEORI. Data adalah sesuatu yang mewakilkan objek dan peristiwa yang memiliki arti

[Data Warehouse] [6/C2 & 6/D2]

PERANCANGAN DATA WAREHOUSE DAN DESIGN DASHBOARD PADA PT PALEMBANG DISTRIBUSINDO RAYA

Analisa dan Perancangan Data Warehouse untuk Departemen Finance, Accounting, dan Purchasing pada PT. Panarub Industry

STMIK GI MDP. Program Studi Sistem Informasi Skripsi Sarjana Komputer Semester Ganjil 2011/2012

PENERAPAN DATA MINING UNTUK DATA JUMLAH KENDARAAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION (EM) PADA DISPENDA KOTA PALEMBANG

BAB 1 PENDAHULUAN. perusahaan. Dengan informasi, organisasi bisa berkembang dan menjadi lebih

BAB 1 PENDAHULUAN. pokok untuk kelangsungan hidup perusahaan. perusahaan yang bergerak di bidang retail.

KARAKTERISTIK DATA WAREHOUSE

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Perancangan Data Warehouse Transaksi Obat-Obatan Pada RS.ABC Palembang

BAB III METODOLOGI. mengidentifikasi proses-proses bisnis utama dan entitas-entitas utama yang ada di SFI,

BAB 1 PENDAHULUAN 1.1 Latar Belakang 1.2 Ruang Lingkup

TUGAS DATA WAREHOUSE

MANFAAT DATAWAREHOUSE PADA RUMAH SAKIT ABC

Perancangan Data Warehouse pada Perpustakaan. STMIK AMIKOM Yogyakarta

SYLLABUS, KEBUTUHAN DAN KONSEP DATA WAREHOUSE. Astrid Lestari Tungadi, S.Kom., MTI.

ANALISA PERBANDINGAN DATA WAREHOUSE DENGAN SKEMA STAR DAN SNOWFLAKES (STUDI KASUS: AKADEMIK IT TELKOM)

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

PERANCANGAN DATA WAREHOUSE DAN PENERAPAN DATA MINING MENGGUNAKAN ALGORITMA FP-TREE DAN FP-GROWTH UNTUK PENYUSUN PRODUK PADA PT.

BAB II. LANDASAN TEORIse. Menurut McLeod dan Schell (2004, p405), data warehouse adalah sebuah

PERANCANGAN DATA WAREHUSE PADA PERPUSTAKAAN STMIK AMIKOM YOGYAKARTA. Armadyah Amborowati Dosen STMIK AMIKOM Yogyakarta

BAB 1 PENDAHULUAN. dibutuhkan teknologi informasi yang baik dan berkualitas. Maka dari itu,

OPTIMALISASI DATA PADA BAGIAN PENJUALAN DENGAN MENGGUNAKAN DATA MART DI PT. XYZ

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PROSES ETL PADA DATA WAREHOUSE

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

PERANCANGAN DATA WAREHOUSE PADA PT. CENTRA INTI PRATAMA

PERANCANGAN DATA WAREHOUSE PENGOLAHAN PERSEDIAAN BUKU PT. GRAMEDIA ASRI MEDIA MAKASSAR

Business Intelligence dengan SQL Server 2008 R2

BAB II LANDASAN TEORI

PERANCANGAN DATAWAREHOUSE DAN PENERAPAN METODE ASSOCIATION UNTUK EKSTRAKSI DATA PENJUALAN PADA PT. CNI PALEMBANG

PEMBANGUNAN SISTEM METADATA SEBAGAI INFORMASI DATA DALAM PEMBUATAN DATA MART PADA PANGKALAN DATA MAHASISWA DI UNIVERSITAS MUHAMMADIYAH YOGYAKARTA

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 1 Edisi... Volume..., Bulan 20.. ISSN :

PERANCANGAN SISTEM DATA WAREHOUSE PADA RUMAH SAKIT PERMATA BUNDA

MANFAAT DATA WAREHOUSE PADA PT ABC

PEMANFAATAN DATA MINING UNTUK MENINGKATKAN PENJUALAN PUPUK UREA DI PEMASARAN PUSRI DAERAH SUMATERA SELATAN

ALGORITMA NEAREST NEIGHBOR

MODELLING OF DATA WAREHOUSE ON FOOD DISTRIBUTION CENTER AND RESERVES IN THE MINISTRY OF AGRICULTURE

BAB 1 PENDAHULUAN. berbasis komputer saat ini menjadi salah satu hal utama bagi manusia modern,

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. tersedianya informasi yang sesuai, dibutuhkan data warehouse yang berisi data

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Teknologi informasi sekarang ini telah mengalami perkembangan yang

information karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi

Perancangan Basis Data

BAB II LANDASAN TEORI

PERANCANGAN DAN PEMBUATAN DATA WAREHOUSE DAN APLIKASI ONLINE ANALYTICAL PROCESSING UNTUK BANK X

SATUAN ACARA PERKULIAHAN UNIVERSITAS GUNADARMA

BAB I PENDAHULUAN. memanfaatkan teknologi informasi, perusahaan dapat menjalankan proses bisnis dengan

Data Warehouse pada PT. Universal Broker Indonesia

Perancangan Data Warehouse Untuk Sumber Daya Manusia Diklat Dalam Pengambilan Keputusan Eksekutif Jasa Marga Development Centre (JMDC)

ANALISIS DAN PERANCANGAN DATA WAREHOUSE UNTUK UNIT TABUNGAN PADA BANK SYARIAH MANDIRI

BAB 2 LANDASAN TEORI. Berikut ini akan dijelaskan teori umum atau dasar yang digunakan, yaitu sebagai berikut:

DESAIN DATAWAREHOUSE AKADEMIK UNTUK MENDUKUNG SISTEM ADMINISTRASI DATA AKADEMIK DI UNIVERSITAS TADULAKO. Mohammad Yazdi 1

BAB II TINJAUAN PUSTAKA. yang akan dibuat adalah sebagai berikut : Sistem Monitoring Pertumbuhan Balita Berbasis Web. Wahyuningsih

PEMBANGUNAN DATA MART LULUSAN DENGAN ARSITEKTUR NORMALIZED DATA STORE DAN DIMENSIONAL DATA STORE

BAB III LANDASAN TEORI

Perancangan Data Warehouse dan Design Dashboard Distributor Barang Pada PT Unilever Cabang Lahat

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

PERKEMBANGAN IPM 6.1 INDEKS PEMBANGUNAN MANUSIA. Berdasarkan perhitungan dari keempat variabel yaitu:

Sistem Informasi Eksekutif Data Alumni Menggunakan Data Warehouse

BAB 1 PENDAHULUAN. tersebut dapat membantu dalam pengambilan keputusan yang tepat di waktu

BAB 2 LANDASAN TEORI. each unit of data is relevant to some moment in time, atau kurang lebih dapat

PERBANDINGAN METODE NEAREST NEIGHBOR DAN ALGORITMA C4.5 UNTUK MENGANALISIS KEMUNGKINAN PENGUNDURAN DIRI CALON MAHASISWA DI STMIK AMIKOM YOGYAKARTA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

BAB III LANDASAN TEORI Akreditasi Nasional Perguruan Tinggi dan Program Studi

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE UNTUK MENDUKUNG SISTEM AKADEMIK (STUDI KASUS PADA STKIP MUHAMMADIYAH KOTABUMI)

Transkripsi:

PERANCANGAN DATA WAREHOUSE DAN PENERAPAN ALGORITMA NEAREST NEIGHBOUR UNTUK PREDIKSI PENGUNDURAN DIRI JEMAAH HAJI DI KEMENTRIAN AGAMA KANTOR WILAYAH SUMATERA SELATAN M. Fhariz Utama Putra (fhariz.tama@gmail.com), Cavri Efander (cavriefander@gmail.com) Mardiani (mardiani@stmik-mdp.net) Jurusan Teknik Informatika STMIK MDP Abstrak : Kementrian Agama Kantor Wilayah Sumatera Selatan merupakan Badan Usaha Milik Negara (BUMN) yang ditugaskan untuk mengurus segala sesuatu yang berhubungan dengan agama. Salah satu tugasnya adalah untuk mengurus jemaah haji. Mengingat dari tahun ke tahun peminat jemaah haji tidak pernah surut hal ini menciptakan kondisi data yang berlimpah tapi minim informasi. Perancangan data warehouse dan data mining adalah salah satu cara yang dapat digunakan untuk mendapatkan informasi dari data yang banyak tersebut. Salah satu informasinya adalah untuk memprediksi potensi calon jemaah haji yang batal berangkat. Prediksi dapat dilakukan dengan menggunakan algoritma nearest neighbour. Dengan prediksi tersebut dapat dilihat faktor yang paling berpengaruh yang menyebabkan calon jemaah haji batal berangkat adalah alasan keluarga. Kata kunci : data mining, data warehouse, informasi, kementrian agama, nearest neighbour, Abstract : Ministry of South Sumatra Region Office Religion is government-owned corporations (GOC) assigned to manage all thing relating to religion. One of religion ministry the duty is to manage of pilgrim. Remembers from year to year enthusiast of pilgrim have never withdrawn this thing to create condition of copious data but a little information. Scheme of data warehouse and data mining is one of way which applicable to get information from data. One of data mining the information is to predict of pilgrim candidate for potency hajj is canceled. Prediction can be done by using nearest neighbor algorithm. With the visible prediction of factor that is very influential causing pilgrim candidate hajj cancelation leaves is reason of family. Keyword : data mining, data warehouse, information, religion ministry, nearest neighbour, 1 Pendahuluan Saat ini setiap tahunnya semakin banyak orang-orang yang melaksanakan ibadah haji khususnya di wilayah Sumatera Selatan. Mengingat minat masyarakat terus meningkat sehingga penyimpanan data jemaah hajipun semakin bertambah dari tahun ketahun, yang dapat menimbulkan penumpukan data. Data yang tersimpan dalam jumlah yang besar akan tidak berguna, jika tidak digali informasi yang tersedia didalamnya. Perancangan data warehouse merupakan salah satu solusi yang dapat digunakan agar data yang tersimpan dalam jumlah yang besar dapat menghasilkan berbagai macam informasi. Data warehouse merupakan metode dalam perancangan database, yang menunjang DSS (Decission Support System) dan EIS (Executive Information System). dalam pengambilan keputusan dan dapat memberi informasi data dari berbagai dimensi data. Setelah dilakukan perancangan data warehouse langkah selanjutnya adalah menerapkan data mining. Data mining merupakan proses untuk menggali (mining) pengetahuan dan informasi baru dari data Hal - 1

yang berjumlah banyak pada data warehouse, dengan menggunakan kecerdasan buatan (Artificial Intelegence), statistik dan matematika. Data mining merupakan teknologi yang diharapkan dapat menjembatani komunikasi antara data dan pemakainya. Berdasarkan uraian diatas, penulis tertarik untuk mengambil skripsi dengan judul Perancangan Data Warehouse dan Penerapan Algoritma Nearest Neighbour untuk Prediksi Pengunduran Diri Jemaah Haji di Kementrian Agama Kantor Wilayah Sumatera Selatan. 2 LANDASAN TEORI 2.1 Data Warehouse Menurut Inmon (2005, hal. 29), data warehouse adalah sekumpulan data yang bersifat integrated, subject oriented, time variant dan non volatile dalam mendukung pengambilan keputusan manajemen. Sedangkan menurut Feri Sulianta (2010, h.32) data warehouse adalah kumpulan dari data berbagai sumber yang ditempatkan menjadi satu dalam tempat penyimpanan berukuran besar lalu diproses menjadi bentuk penyimpanan multi-dimensional dan didesain untuk querying dan reporting. Karakteristik dari data warehouse menurut Poniah P (2001, h.20) adalah subject oriented (berorientasi subjek), integrated (terintergrasi), time variant (rentang waktu) dan non-volatile. Dimensionality modelling adalah sebuah teknik desain logis yang bertujuan untuk menghadirkan data dalam sebuah bentuk yang standar dan intuitif yang memungkinkan pengaksesan basis data dengan performa yang tinggi (Connolly dan Begg 2010, h.1183). Menurut Han et all (2011, h.124) tipe-tipe skema model data multidimensi terbagi atas stars, snowflakes, and fact constellations. 2.2 Microsoft SQL BIDS Business Intelligence atau BI adalah serangkaian kegiatan untuk memahami situasi bisnis dengan melakukan berbagai jenis analisis pada data yang dimiliki oleh organisasi serta data eksternal dari pihak ketiga untuk membantu menentukan strategi, keputusan bisnis yang taktis, dan operasional dan mengambil yang diperlukan tindakan untuk meningkatkan kinerja bisnis (Rainardi, 2007). BIDS menyediakan tool untuk melakukan analisa data. Pada BIDS terdapat 3 jenis solusi analisa, yaitu : a. SQL Server 2008 Integration Services (SSIS) Menurut Wirawa et all (2009, h.1) SQL Server Integration Services atau biasa disingkat dengan SSIS adalah sebuah tools yang digunakan untuk melakukan proses extract, transform, and load (ETL) dan diklasifikasikan sebagai fitur business intelligence (BI). b. SSQL Server 2008 Analysis Services (SSAS) Business intelligence (BI) di mulai dari proses pengumpulan data (ETL) di lanjutkan dengan penyajian data kemudian interpretasi dari data tersebut yang berupa hasil analisa, tentunya semua itu harus di dukung dengan data yang benar, waktu yang tepat dan format benar. bi merupakan business tool yang efektif untuk mendukung keputusan bisnis, baik berupa keputusan strategi, tactical ataupun operational (Wirama K et all, 2009.h38). c. SQL Server 2008 Reporting Services (SSRS) Menurut Wirama et all (2009, h.194) sql server reporting services (SSRS) adalah platform laporan berbasis server yang menyediakan fungsionalitas pembuatan laporan untuk berbagai sumber data. 2.3 Data Mining Menurut Larose (2005, hal. 4), data mining merupakan analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya, yang Hal - 2

dapat dipahami dan bermanfaat bagi pemilik data. Sedangkan menurut Kusrini (2009, h.7), data mining adalah proses mencari pola atau informasi menarik dalam data terpilih dengan menggunakan teknik atau metode tertentu. Teknik, metode, atau algoritma dalam data mining sangat bervariasi. Pemilihan metode atau algoritma yang tepat sangat bergantung pada tujuan dan proses KDD (Knowledge Discovery in Database) secara keseluruhan. open source (GPL) dan dengan engine java. Aplikasi ini dikembangkan pertama kali oleh sebuah Universitas di Selandia Baru yang bernama Universitas Waikato sebelum menjadi bagian di Pentanho. Weka terdiri dari koleksi algoritma machine learning yang dapat digunakan untuk melakukan generalisasi atau formulasi dari sekumpulan data sampling. 3 PERANCANGAN DATA WAREHOUSE 3.1 Profil Kemenag Sumsel Merupakan Badan Usaha Milik Negara (BUMN) yang ditugaskan untuk mengurus segala sesuatu yang berhubungan dengan agama yang bertujuan untuk terwujudnya masyarakat Indonesia yang taat beragama, rukun, cerdas, mandiri dan sejahtera lahir batin. Gambar 2.1 Tahapan Data Mining Data mining dibagi menjadi dua kelompok yang disebut dengan fungsi minor atau fungsi tambahan dan fungsi minor atau fungsi utama (Kusrini et all, 2009). Fungsi minor terbagi atas fungsi deskripsi, estimasi dan prediksi sedangkan fungsi mayor terbagi atas fungsi klasifikasi, asosiasi dan pengelompokan. 2.4 Algoritma Nearest Neighbour Menurut Kursini et all (2009, hal. 93), nearest neighbour adalah pendekatan untuk mencari kasus dengan menghitung kedekatan antara kasus baru dengan kasus lama, yaitu berdasarkan pada pencocokan bobot dari sejumlah fitur yang ada. kedekatan biasanya berada pada nilai antara 0 s/d 1. Nilai 0 artinya kedua kasus mutlak tidak mirip. Sebaliknya nilai 1 kasus mirip dengan mutlak (Kusrini et all 2009, h.95). 2.5 WEKA Menurut Feri Sulianta (2010, h.63) weka merupakan aplikasi data mining yang berbasis 3.2 Perancangan Data Warehouse Metode perancangan data warehouse menurut Kimball meliputi 9 tahap yang dikenal dengan nine-step methodology (Connolly, Thomas, C. B, 2010). a. Pemilihan Proses Proses yang digunakan dalam data warehouse yaitu, proses keberangkatan Jemaah haji yang meliputi data jemaah haji yang berangkat dan yang batal berangkat. Adapun atribut yang digunakan adalah kode embarkasi jemaah, nama jemaah, tahun keberangkatan jemaah, jenis kelamin dan tabungan haji. b. Pemilihan Grain Dimensi yang akan dibuat agar terbentuknya tabel fakta meliputi dimensi bank, dimensi jemaah, dimensi waktu serta dimensi wilayah. Adapun grain dalam perancangan data warehouse pada Kementrian Agama Kantor Wilayah Sumatera Selatan meliputi jumlah jemaah haji berdasarkan kategori bank, jumlah jemaah haji berdasarkan kategori wilayah Hal - 3

(kabupaten/kota), analisis dapat dilihat per periode waktu (tahun). c. Identifikasi dan Penyesuaian Dimensi (Identifying and Conforming The Dimensions) Pada tahap ini dilalukan penyesuaian dimensi untuk rujukan tabel fakta. Setelah fakta dipilih, maka dilakukan pengkajian ulang untuk menentukan apakah dapat digunakan untuk precalculations. f. Memastikan Tabel Dimensi Dalam tahap ini, penulis menggambarkan secara rinci serta memberikan keterangan selengkapnya pada tabel dimensi yang bermaksud agar dapat dipahami dan mudah dimengerti oleh user. g. Pemilihan Durasi Database Gambar 3.1 Loading Data pada SSIS d. Pemilihan Fakta Pada tahap ini penulis menentukan tabel fakta dalam melakukan perancangan data warehouse pada Kementrian Agama Kantor Wilayah Sumatera Selatan. Tabel fakta digunakan untuk dapat menarik informasi dari dimensi-dimensi yang saling berelasi. Hubungan antara Tabel fakta dan tabel dimensi dapat dilihat pada gambar 3.2 Data yang digunakan adalah data jemaah haji dari 3 (tiga) tahun terakhir yaitu data jemaah haji pada tahun 2011, 2012 dan data jemaah haji pada tahun 2013. Diharapkan data jemaah haji selama 3 (tiga) tahun tersebut dapat memberikan informasi yang berguna baik bagi penulis dan juga Kementrian Agama Kantor Wilayah Sumatera Selatan. h. Melacak Perubahan dari Dimensi Secara Perlahan Setiap atribut yang terdapat pada tabel dimensi tidak semuanyanya memiliki nilai yang tetap, dengan kata lain ada kalanya atribut tersebut akan berubah. i. Penentuan Prioritas dan Model Query Dalam perancangan sebuah data warehouse kapasitas penyimpanan sangat berpengaruh dan harus dipertimbangkan karna semakin banyak data kapasitas memori yang dibutuhkan maka harus semakin besar ruang pada disk yang dibutuhkan. Gambar 3.2 Fakta Haji e. Penyimpanan Pre-Calculation di Tabel Fakta 4 ANALISIS DAN PEMBAHASAN 4.1 Presentasi Data Warehouse Informasi yang diperoleh dari data warehouse Haji menggunakan data Haji Hal - 4

BANYUASIN EMPAT LAWANG LAHAT LUBUK LINGGAU MUARA ENIM MUSI BANYUASIN MUSI RAWAS OGAN ILIR OKI OKU OKU SELATAN OKU TIMUR PAGAR ALAM PALEMBANG PRABUMULIH selama 3 (tiga) tahun terakhir yaitu pada tahun 2011, 2012 dan 2013 sebagai data training. 1. Berdasarkan Dimensi Waktu Dimensi waktu merupakan sebuah tabel dimensi dalam data warehouse haji yang digunakan sebagai pengukur jumlah jemaah haji terhadap periode waktu tertentu. Sebagai contoh, jumlah jemaah haji pada tahun 2011 adalah sebanyak 6819 jiwa. 2. Berdasarkan Dimensi Wilayah Dimensi wilayah dapat digunakan sebagai pengukur jumlah jemaah haji berdasarkan Kabupaten atau Kota tertentu terhadap periode waktu. Contoh, jumlah jemaah Kabupaten Lahat pada tahun 2012 sebanyak 232 jiwa. 4000 3000 2000 1000 0 Gambar 4.1 Chart Dimensi Wilayah 3. Berdasarkan Dimensi Bank 2011 2012 2013 Dimensi bank merupakan sebuah tabel dimensi yang digunakan sebagai pengukur jumlah jemaah haji berdasarkan bank atau tempat jemaah haji menabung untuk biaya keberangkatan jemaah haji terhadap periode waktu tertentu. Misalkan, pada tahun 2011 terdapat 373 jiwa jemaah haji yang menabung untuk biaya haji pada bank Sumsel Syariah. 2000 1500 1000 500 0 Gambar 4.2 Chart Dimensi Bank 4. Berdasarkan Dimensi Jemaah Dimensi jemaah merupakan tabel dimensi yang berisikan data jemaah haji yang dapat memberikan informasi berupa data penyakit jemaah haji sampai dengan keterangan apakah jemaah haji berangkat atau tidak berangkat. 8000 6000 4000 2000 0 6300 6300 Gambar 4.3 Chart Dimensi Jemaah dengan Kategori Keterangan 4.2 Penerapan Data Mining Adapun tahapan-tahapan yang dilakukan dalam menerapkan data mining yaitu : 1. Pengumpulan Data 5040 519 538 1291 2011 2012 2013 BATAL 2011 2012 2013 BERANGKAT Pada tahap ini, penulis mengumpulkan data yang diperlukan dalam menerapkan data mining. Adapun data yang digunakan oleh penulis meliputi data history haji pada selama tiga tahun terakhir yaitu 2011, 2012 dan 2012 sebagai data training dan data 2014 sebagai data testing. 2. Pra Proses Data atau Cleansing Data Pada tahap ini, penulis melakukan proses cleansing data yang bertujuan Hal - 5

untuk membersihkan data-data yang tidak diperlukan dalam penelitian. Proses cleansing ini perlu dilakukan agar dapat memilih data yang menjadi fokus penelitian. 3. Transformasi Data Transformasi data merupakan sebuah proses merubah suatu bentuk data ke bentuk lainnya. Hal ini perlu dilakukan, karena dalam melakukan penelitian penulis menggunakan sebuah tools Weka yang hanya dapat menerima atau membaca data dalam format file berekstensi.arff dan.csv, sedangkan pada dasarnya penulis mendapatkan data dalam format file.xls atau dengan kata lain hanya dapat dibaca oleh microsoft office excel dan tidak dapat dibaca oleh Weka sehingga diperlukan transformasi data. berikut dapat dilihat proses transformasi data. 5. Hasil Analisis Setelah analis selesai dilaksanakan maka dapat ditarik beberapa informasi yang telah didapatkan diantaranya. a. Didapatkan hasil prediksi meliputi 819 calon jemaah haji yang akan berangkat dan 34 calon jemaah haji yang batal berangkat. b. Berdasarkan hasil yang telah di prediksi dengan menggunakan WEKA, faktor tabungan haji dan alasan keluarga merupakan faktor yang paling dominan mempengaruhi seorang jemaah haji akan berangkat atau batal. Untuk melihat gambaran hasil prediksi yang telah dilakukan dengan menggunakan WEKA dapat dilihat pada gambar dibawah ini. data.xls data.csv data.arff Gambar 4.5 Hasil Prediksi Data Testing Gambar 4.4 Transformasi Data 4. Implementasi Menggunakan WEKA Dalam melakukan analisis penulis menggunakan tools WEKA untuk mendapatkan hasil prediksi. adapun langkah-langkah yang dilakukan meliputi : a. Input data training b. Pemilihan algoritma nearest neighbor c. Input data testing d. Hasil dari prediksi Pada gambar diatas dapat dilihat jumlah jemaah haji yang telah diprediksi menggunakan WEKA. 5 Penutup 5.1 Kesimpulan Kesimpulan yang dapat diambil dari perancangan data warehouse dan hasil analisis algoritma nearest neighbour pada Kementrian Agama Kantor Wilayah Sumatera Selatan antara lain : a. Pada tahun 2011, 2012 dan tahun 2013 stroke adalah penyakit terbanyak yang Hal - 6

menjadi penyebab jemaah haji batal berangkat. Berdasarkan alasan keluarga, setiap tahunnya (2011, 2012 dan 2013) terdapat peningkatan jumlah jemaah haji yang batal berangkat dengan penyebab alasan keluarga. b. Bank Sumsel adalah Bank yang paling banyak dijadikan sebagai tempat untuk tabungan haji oleh jemaah haji, tercatat pada tahun 2011 memiliki 1900 nasabah jemaah haji, pada tahun 2012 dengan 1897 nasabah jemaah haji dan pada tahun 2013 dengan 1740 nasabah jemaah haji. Berdasarkan kategori keterangan dan wilayah, Kota Palembang merupakan Kota dengan jumlah jemaah haji yang paling banyak berangkat dan batal selama 3 (tiga) tahun yaitu 2011, 2012 dan 2013. Sedangkan untuk jumlah jemaah haji yang paling sedikit batal terletak pada Kabupaten OKU Selatan pada tahun 2011 dan Empat Lawang pada tahun 2012 dan tahun 2013. Untuk jumlah jemaah haji yang paling sedikit berangkat tercatat pada Kabupaten Empat Lawang pada tahun 2011, 2012 dan 2013. c. Berdasarkan data testing yang diujikan dengan jumlah data sebanyak 853 record didapatkan hasil prediksi meliputi 819 calon jemaah haji yang akan berangkat dan 34 calon jemaah haji yang batal berangkat. d. Faktor tabungan haji dan alasan keluarga merupakan faktor yang paling dominan mempengaruhi seorang jemaah haji akan berangkat atau batal. Sedangkan untuk faktor penyakit, hanya beberapa penyakit saja yang mempengaruhi calon jemaah haji akan batal berangkat, sebagai contoh pada faktor penyakit jika terdapat penyakit DIABETES calon jemaah masih akan berangkat akan tetapi jika penyakit KANKER maka calon jemaah haji akan batal berangkat. e. Kondisi terburuk adalah jika pada faktor tabungan haji BELUM LUNAS, penyakit KANKER, alasan keluarga YA maka dapat diprediksi bahwa calon jemaah akan batal berangkat berdasarkan hasil analisis dengan algoritma nearest neighbour. 5.2 Saran Berdasarkan informasi yang telah disajikan, penulis berharap pihak Kementrian Agama Kantor Wilayah Sumatera Selatan dapat dijadikan acuan dalam mengambil tindakan atau keputusan yang tepat untuk dilakukan. Untuk pengembangan lebih lanjut ada baiknya ditambahkan algoritma lainnya untuk memprediksi calon jemaah haji agar dapat melihat bagaimana perbandingan prediksi antara keduanya. DAFTAR PUSTAKA [1] Connolly, Thomas, C. B 2010, Database System : A Practical Approach to Design, Implementation, and Management Fifth Edition, Pearson Education Inc. [2] Han, J, Kamber, M & Pei, J 2011, Data Mining : Concepts and Techniques Third Edition, Elsevier, United States Of America. [3] Inmon, W, H 2005, Building The Data Warehouse Fourth Edition, Wiley Publishing, Inc., United States Of America. [4] Kimball, R & Ross, M 2013, The Data Warehouse Toolkit Third Edition, John Wiley and Sons, Canada. [5] Kusrini 2009, Algoritma Data Mining, Andi Offset,Yogyakarta. [6] Ponniah, Paulraj 2001, Data Warehousing Fundamentals : A Comprehensive Guide for IT Professionals, A Wiley- Interscience Publication, New York. [7] Sulanta, Feri 2010, Data Mining : Meramalkan Bisnis Perusahaan, Elex Media Komputindo, Jakarta. [8] Wirama, K, Sudianto, H & Hermawan, Y 2009, The Essential Business Intelligence in Microsoft SQL Server 2008, Indc, Jakarta. Hal - 7