[Data Warehouse] [6/C2 & 6/D2]

dokumen-dokumen yang mirip
BAB II LANDASAN TEORI

Visual Index Presentasi Online 5 September 2012

BAB IV PERANCANGAN SISTEM

PERANCANGAN DATABASE UNTUK MENDUKUNG PROTOTYPE DATA WAREHOUSE PADA PUSAT DISTRIBUSI DAN CADANGAN PANGAN, KEMENTERIAN PERTANIAN

BAB III LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

PENTAHO SEBAGAI SOLUSI MASALAH PENGOLAHAN DATABASE (Pentaho as a Solution of Database Processing Problems)

Pentingnya Data Warehouse dalam Dunia Bisnis. By : Feris Thia PT. Putera Handal Indotama

PERANCANGAN DATA WAREHOUSE CALON MAHASISWA BARU POLITEKNIK NEGERI LHOKSEUMAWE

TUTORIAL FUNDAMENTAL OF REPORTING With Pentaho Report Designer

IMPLEMENTASI OLAP PADA DATA PENJUALAN BBM MENGGUNAKAN PENTAHO TRIYONO

MODELLING OF DATA WAREHOUSE ON FOOD DISTRIBUTION CENTER AND RESERVES IN THE MINISTRY OF AGRICULTURE

PERANCANGAN APLIKASI BUSINESS INTELLIGENCE PADA SISTEM INFORMASI DISTRIBUSI PT PERTAMINA LUBRICANT MENGGUNAKAN PENTAHO

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

INTELIGENSI BISNIS SQL SERVER 2014

HASIL DAN PEMBAHASAN. Nama dan deskripsi atribut tabel tempfact_indeksprestasi

BAB II TINJAUAN PUSTAKA

BAB III METODE PENELITIAN

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB IV HASIL DAN PEMBAHASAN

Anggota Kelompok 3 :

Sebuah lingkungan untuk machine learning, data mining, text mining dan predictive analytics. Machine learning

3.5 Arsitektur Data Warehouse Data Source Data Warehouse Surveilans Terpadu Penyakit (STP) kabupatenbantul

BAB I PENDAHULUAN. dan pendidikannya. Tidak terkecuali pada Universitas Widyatama yang sudah. untuk laporan kepada pimpinan Universitas Widyatama.

ANALISIS DAN PERANCANGAN DATA WAREHOUSE PERPUSTAKAAN (STUDI KASUS: PERPUSTAKAAN UNIVERSITAS BINADARMA PALEMBANG)

BAB 1 I PENDAHULUAN. terbarukan untuk mengelola dan mengolah data tersebut. Perkembangan database

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Business Intelligence dengan SQL Server 2008 R2

BUSINESS INTELLIGENCE

BAB I PENDAHULUAN. berbagai macam metode dan teknologi, sehingga sebuah sistem

Data Analysis with Mondrian

ANALISA DATA TRANSAKSIONAL PADA E-COMMERCE DENGAN TEKNOLOGI OLAP (ON-LINE ANALYTICAL PROCESS)

Pengantar Pentaho Data Integration (Kettle)

OLAP - PERTEMUAN 8 OLAP

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA. yang akan dibuat adalah sebagai berikut : Sistem Monitoring Pertumbuhan Balita Berbasis Web. Wahyuningsih

PERANCANGAN DAN IMPLEMENTASI DATA WAREHOUSE MENGGUNAKAN SCHEMA SNOWFLAKE UNTUK MENGETAHUI TREND PRODUKSI DAN PEMASARAN PRODUK

[Data Warehouse] [6/C2 & 6/D2]

BAB I PENDAHULUAN 1.1 Latar Belakang

PERANCANGAN DATA WAREHOUSE PENGOLAHAN PERSEDIAAN BUKU PT. GRAMEDIA ASRI MEDIA MAKASSAR

BAB I PENDAHULUAN. I.1 Pendahuluan

BAB III LANDASAN TEORI

PENDAHULUAN TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA

BAB II LANDASAN TEORI. Basis Data Terdistribusi didefinisikan sebagai sebuah collection of multiple,

FAST berarti sistem ditargetkan untuk memberikan response terhadap user dengan secepat mungkin, sesuai dengan analisis yang dilakukan.

Big Data dengan Hadoop Oleh : Agus Priyanto, M.Kom

BAB II LANDASAN TEORI Sistem Informasi Pembelian dan Penjualan. terlebih dahulu akan menjelaskan pengertian masing-masing dari kata sebagai

BAB III ANALISA DAN PERANCANGAN SISTEM

Basis Data Oracle - Business Intelligence System. Ramos Somya, M.Cs.

[Data Warehouse] [6/C2 & 6/D2]

1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. didukung dengan pernyataan dari Poe (1998) yang menyatakan bahwa banyak

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

TUGAS DATA WAREHOUSE & DATA MINING OLAP, OPERASI OLAP & MOLAP

PEMBANGUNAN BUSINESS INTELLIGENCE SUPRA DESA DAN KAWASAN PERDESAAN UNTUK PERENCANAAN PEMBANGUNAN TUGAS AKHIR

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI. Sitem adalah kumpulan dari elemen-elemen yang berinteraksi untuk mencapai tujuan. keluaran. Berikut gambaran umum sebuah sistem.

[Data Warehouse] [6/C2 & 6/D2]

BAB 2 LANDASAN TEORI. Komputer dapat diartikan sebagai mesin yang melakukan tugas-tugas tertentu yang

DATAWAREHOUSE. Sukarsa:Pasca Elektro Unud. I Made Sukarsa

BAB III LANDASAN TEORI. sistem, pengertian sistem informasi, sumber dari sistem informasi, dan metodemetode. lainnya yang dipakai dalam pembahasan.

REPORTING SERVICES SEBAGAI SISTEM ALTERNATIF DALAM PEMBUATAN LAPORAN

Bab 4 Hasil dan Pembahasan

BAB 4 RANCANGAN SISTEM YANG DIUSULKAN

BAB II LANDASAN TEORI

BAB III LANDASAN TEORI. user management seperti yang diuraikan oleh definisi-definisi berikut.

ABSTRAK. Kata Kunci: ETL, Data Warehouse, Visualisasi Data, Bagan. Universitas Kristen Maranatha

BAB I PENDAHULUAN I.1 Latar Belakang

UNIVERSITAS BINA NUSANTARA. Jurusan Teknik Informatika Program Studi Ilmu Komputer Skripsi Sarjana Komputer Semester Genap tahun 2003/2004

Perancangan Sistem Informasi Eksekutif

BAB 4 IMPLEMENTASI DAN EVALUASI

PERANCANGAN DATA WAREHOUSE E-PROCUREMENT PADA INSTANSI PEMERINTAHAN

BAB III LANDASAN TEORI. kumpulan dari elemen-elemen yang satu dengan yang lain berinteraksi dan

BAB II TINJAUAN PUSTAKA

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI. untuk menyelesaikan suatu sasaran yang tertentu (Jogiyanto, 2001)

ANALISIS PERBANDINGAN PENGEMBANGAN DASHBOARD SISTEM DENGAN MENGGUNAKAN FUSION CHART, QLIKVIEW DAN PENTAHO

MODUL PRAKTIKUM PEMROGRAMAN BASIS DATA

BAB II TINJAUAN PUSTAKA. Suatu sistem adalah suatu jaringan kerja dari prosedur-prosedur yang saling

IMPLEMENTASI REPLIKASI DATABASE MICROSOFT SQL SERVER POSTGRESQL UNTUK PENERAPAN SINGLE SIGN ON (SSO) SKRIPSI. Disusun oleh :

BAB I BAB I PENDAHULUAN

BAB II LANDASAN TEORI. di jaman sekarang, namun apakah Anda mengetahui sejarah nya itu?. Mungkin,

BAB I PENDAHULUAN 1.1 Latar Belakang

Microsoft Data Access Components (MDAC) Oleh : Edi Sugiarto, S.Kom, M.Kom

ABSTRAK. Kata Kunci : Business Intelligence, Data Warehouse

PEMBANGUNAN SISTEM INFORMASI PEMESANAN PAKET TOUR PADA PERANGKAT MOBILE (STUDI KASUS : ARUNA TRAVEL)

BAB II LANDASAN TEORI

UKDW BAB I PENDAHULUAN

LANDASAN TEORI. Dunia informasi di Indonesia sedang dan harus. berubah. Saat ini, dunia pemasaran tidak dapat

Fandi Cahyo Saputro ( )

PERANCANGAN LibraryUMS-CMS MENGGUNAKAN CODEIGNITER


KEKURANGAN KELEBIHAN APLIKASI DATA BASE

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. sebuah sistem pencarian lokasi kuliner berbasis mobile web untuk wilayah

BAB II. KAJIAN PUSTAKA

BAB II LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Transkripsi:

[Data Warehouse] [6/C2 & 6/D2] [ Chapter 9] Praktek Ekstrak, Transform, Load (ETL) Dengan Pentaho Data Integration Dedy Alamsyah, S.Kom, M.Kom [NIDN : 0410047807]

Pentaho Data Integration Pentaho adalah kumpulan aplikasi Business Intelligence yang bersifat free open source software (FOSS) dan berjalan di atas platform Java. Aplikasi-aplikasi Pentaho dikembangkan oleh Pentaho corp yang berpusat di Orlanda, Amerika Serikat. Selain sifatnya gratis dan adopsi yang semakin hari semakin luas, dukungan Pentaho bisa didapatkan dari Pentaho corp dalam bentuk Service Level Agreement (SLA) dan dipaketkan dalam versi Enterprise Edition yang sifatnya annual subscription atau perlu kontrak tahunan. Selain itu jika Anda tetap menggunakan community edition yang gratis, maka bisa mendapatkan support dari banyak partner Pentaho di seluruh dunia termasuk di Indonesia.

1. Pentaho Reporting Merupakan aplikasi perancangan Ad Hoc Report di Pentaho. Engine reporting yang bisa di-embed di aplikasi Java. Multi Platform. Dapat mengambil source dari berbagai relational engine. Lihat link berikut untuk database relasional yang didukung oleh Pentaho Reporting. Dapat mengambil source OLAP yang didukung driver OLAP4J seperti Mondrian, SQL Server Analysis Service, PALO Molap, SAP BW, dan lainnya. Memiliki kemampuan mengambil source Pentaho Data Integration step. Ini menjadikan source yang dapat diambil hampir menjadi tidak terbatas. Dilengkapi designer yang intuitif dan koleksi chart yang lengkap untuk keperluan analisa. Output dalam format Format PDF, Excel, HTML dan CSV.

2. Pentaho Analysis / Mondrian OLAP Server OLAP server open source terpopuler dan digunakan di berbagai produk BI open source (Pentaho dan Jasper). Multi Platform. Mondrian merupakan tipe ROLAP (Relational OLAP) dimana semua perintah data query diterjemahkan via SQL dan ditujukan kepada datamart. Mendukung datamart dengan rancangan multi dimensional Star Schema maupun Snowflake Schema. Mendukung query MDX (Multidimensional Expression) sebagai standar industri. Didukung oleh beberapa aplikasi interface baik web based maupun desktop seperti JPivot, Pentaho Reporting, Pentaho Analysis Tools, dan Pentaho Analyzer. Semua interface di atas memiliki kemampuan drill down / roll up serta drill through untuk melihat detil penyusun sel-sel nilai analisis.

3. Pentaho Data Integration / Kettle Utilitas ETL (Extract, Transform and Load) open source paling populer. Designer GUI yang intuitif dan sangat mudah digunakan. Multi Platform. Script ETL dapat disimpan dalam bentuk filesystem maupun repository. Mendukung multi pipelining sehingga load balance maupun optimasi pekerjaan data warehouse dapat dilakukan dengan mudah. Mendukung clustering (master-slave) engine ETL Terdiri atas lebih dari 200 steps yang mencakup job (workflow kontrol) dan transformation (data worfklow). Mendukung Apache Virtual Filesystem (Apache VFS) sehingga filesystem seperti HTTP Webdav, FTP, SFTP, dan lain sebagainya dapat dengan mudah diakses dengan konfigurasi yang minimal.

4. Pentaho Data Mining / Weka Utilitas data mining yang sangat populer dan digunakan untuk predictive analysis Multi Platform. Mendukung data sumber / source berformat ARFF (Attribute-Relation File Format), XRRF (XML attribute Relation File Format), CSV (Comma Separated Value), maupun table / view dari relasional database. Mendukung standar PMML (Predictive Model Markup Language). Mendukung data nominal dan numerik (continue maupun discrete). Mendukung algoritma yang cukup banyak untuk operasi dasar data mining seperti Classification, Clustering dan Association. Algoritma tersebut diantaranya adalah J48, M5P, SimpleCart, SimpleKMeans, Apriori, dsbnya. Utilitas grafis yang membantu pengolahan dan pemahaman data mulai dari preprocessing, data visualization dalam bentuk plot maupun curve, tree visualization, dsbnya.

5. Pentaho BI Server / Platform Server BI yang berjalan sebagai web application portal yang terdiri dari layanan web service, workflow pada space JVM (Java Virtual Machine), dan sebagai user interface untuk laporan operasional maupun analisis. Multi Platform. Workflow berupa integrasi dari produk Pentaho yang telah disebutkan sebelumnya (Pentaho Data Integration, Pentaho Reporting, dan Pentaho Analysis) dalam bentuk solution. Scheduler berjalan di atas platform BI ini untuk melakukan proses batching, misalkan mengirim laporan dalam bentuk PDF ataupun Excel secara periodik. Script JSP (Java Server Pages) dapat dengan mudah diintegrasikan ke dalam platform. User dapat memiliki space sendiri untuk menyimpan report dan tipe solution lainnya. Ad hoc report yang bisa digunakan untuk membuat rancangan report on the fly tanpa keterlibatan IT.

Kettle (Pentaho Data Integration) Kettle adalah aplikasi ETL (Extract, Transformation and Load) yang sangat populer dan merupakan salah satu ETL terbaik di pasar BI dunia saat ini. Aplikasi Kettle sendiri merupakan bagian dari aplikasi BI Pentaho. Sebelumnya proyek ini berdiri sendiri dan kemudian diakuisisi oleh Pentaho pada tahun 2006. Sejak diakuisisi oleh Pentaho, Kettle dikenal juga dengan Pentaho Data Integration (PDI). Kettle bersifat free (no lisensi)

Bagian-bagian dari PHI (Kettle) Kettle terdiri dari 4 aplikasi, yaitu : Spoon, yaitu aplikasi grafis berbasis swing yang digunakan untuk merancang file skema job dan transformation Pan, yaitu script yang digunakan untuk menjalankan file skema transformation melalui terminal / command line Kitchen, yaitu script yang digunakan untuk menjalankan file skema job melalui terminal / command line Carte, yaitu temporary web server yang digunakan untuk mengeksekusi job/transformation secara cluster atau parallel Kesemua aplikasi tersebut di atas dijalankan melalui shell atau batch script yang berkaitan.

Kettle (Pentaho Data Inegration) Fitur-fitur Kettle antara lain : Memiliki utilitas grafik yang dapat digunakan merancang skema step atau langkah kontrol dan transformasi data. Multi platform - karena dikembangkan di atas Java yang notabene berjalan di banyak platform. Bersifat concurrent, dalam arti row-row data diambil oleh suatu step dan diserahkan ke step lain secara parallel. Artinya tidak menunggu sampai suatu koleksi data diambil secara keseluruhan terlebih dahulu. Scalable - dapat beradaptasi dengan penambahan kapasitas memori RAM atau pun storage (scale up) dan dapat dengan penambahan node komputer atau cluster lain (scale out). Koleksi step transformation dan job yang cukup banyak Extensible, artinya kita dapat membuat step transformation dan job baru dengan Java Dukungan luas berbagai produk database yang terkenal di pasaran baik itu proprietary maupun free open source seperti Oracle, SQL Server, MySQL, dan lain sebagainya.

Langkah-Langkah Menginstall dan Menjalankan Kettle 1. Install JRE terbaru (versi 7 ke atas) 2. Download Kettle https://sourceforge.net/projects/pentaho/files/data%20integration/ 3. Setting path Environtment untuk JAVA di sistem windows 4. Extract Pentaho Data Integration 5. Double click Spoon.Bat

Home

Transformation

Selesai Ada pertanyaan???