Lifecycle Analitik Data

dokumen-dokumen yang mirip
Introduction to Big Data

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Brainware. SDM Sistem Informasi dan Organisasi

TIN409 - Enterprise Resources Planning Materi #14 Ganjil 2014/2015. TIN409 - Enterprise Resources Planning

BAB 3 Analisa dan Perancangan Sistem

BAB 2 LANDASAN TEORI

Analisis dan Perancangan Sistem Hanif Al Fatta M.kom

RENCANA PEMBELAJARAN SEMESTER

PROYEK PENGEMBANGAN SISTEM INFORMASI MANAJEMEN PENGELOLAAN APARTEMENT UNSRI BERBASIS WEBSITE

Hanif Fakhrurroja, MT

BAB I PENDAHULUAN.

BAB II LANDASAN TEORI. teknis yang dikosentrasikan untuk produk atau layanan yang spesifik. Helpdesk

BUSINESS INTELLIGENCE. Management Database & Informasi

BAB IV PERANCANGAN SISTEM

BAB 6 METODOLOGI SIKLUS HIDUP SISTEM

PERANCANGAN DATA WAREHOUSE E-PROCUREMENT PADA INSTANSI PEMERINTAHAN

BAB 3 METODOLOGI PENELITIAN

3. ANALISA KEPERLUAN PERANGKAT LUNAK

BAB III METODOLOGI. proses penyusunan perencanaan strategi, terdapat beberapa komponen yang perlu. diperhatikan. Komponen-komponen tersebut adalah :

BAB II LANDASAN TEORI

BAB I PENDAHULUAN. hal proses pengolahan data, baik itu data siswa, guru, administrasi sekolah maupun data

DECISION SUPPORT SYSTEMS COMPONENTS

BAB 2 LANDASAN TEORI

BAB II LANDASAN TEORI. karyawan, jumlah jam kerja dalam seminggu, nomor bagian persediaan, atau

Hanif Fakhrurroja, MT

Untuk menggambarkan kegiatan rekayasa persyaratan pokok dan hubungan mereka. Untuk memperkenalkan teknik untuk elisitasi persyaratan dan analisis.

PENERAPAN BUSINESS INTELLIGENCE PADA SISTEM INFORMASI PENJUALAN BARANG PT. WINSA (STUDI KASUS DI PT. WINSA PALEMBANG)

REKAYASA PERANGKAT LUNAK

Pendahuluan: Decision Support system STMIK BANDUNG

Tujuan Perkuliahan. PENGANTAR RPL (Pert. 2 chapter 1 Pressman) Agenda. Definisi Software (Perangkat Lunak) Lunak) 23/09/2010

STMIK GI MDP. Program Studi Sistem Informasi Skripsi Sarjana Komputer Semester Genap Tahun 2009/2010

MODEL DESAIN & DOKUMENTASI DESAIN

BAB 3 ANALISA SISTEM YANG SEDANG BERJALAN

Bab 1 Pendahuluan 1.1 Latar Belakang Masalah

Perancangan Aplikasi Basis Data. by: Ahmad Syauqi Ahsan

Pengembangan Sistem Informasi

Sistem Penunjang Keputusan, Pertemuan Ke-3

Nama : Rendi Setiawan Nim :

PROJECT CHARTER RANCANG BANGUN SISTEM PENERIMAAN DAN SELEKSI PEGAWAI MENGGUNAKAN METODE MANAGEMENT BY OBJECTIVE

PERANCANGAN SISTEM.

WORKSHOP SMOS

IMPLEMENTASI DAN PENGUJIAN

UKDW BAB I PENDAHULUAN

Testing is the exposure of a system to trial input to see wheter it produces corect output Adalah proses eksekusi suatu program dengan maksud

A. Model Desain Perangkat Lunak

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization

Konsep Business Inteligence. (Bag. 2) Ade Sarah H., M.Kom

Lecture s Structure. Proses Data Warehouse. Proses Data Warehouse

BAB II LANDASAN TEORI. lingkungan, interaksi unsur dengan suatu tujuan yang akan dicapai. Berikut ini pengertian sistem menurut beberapa ahli:

FASE PERENCANAAN. MPSI sesi 4

PENDAHULUAN PENGEMBANGAN SISTEM INFORMASI

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMERINTAH KOTA BATAM MELALUI DINAS KOMUNIKASI DAN INFORMATIKA KOTA BATAM

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGANTAR RUP & UML. Pertemuan 2

Manajemen Proyek Minggu 2

BAB 1 PENDAHULUAN. banyak. Dengan banyaknya data tersebut, sehingga sulit menghasilkan laporan yang

BAB 3 METODOLOGI PEMECAHAN MASALAH

BAB I PENDAHULUAN. informasi yang akurat sangat dibutuhkan dalam kehidupan sehari-hari, sehingga

BAB 1 PENDAHULUAN. tersebut adalah metode pemodelan (notation), proses (process) dan tool yang

Pertemuan 3 Metodologi Pengembangan Sistem Informasi

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Enterprise Systems For Management

Metrik Proses dan Proyek Perangkat Lunak KARMILASARI

PENGEMBANGAN SISTEM INFORMASI PENGENDALIAN PEMBANGUNAN DAERAH PADA BADAN PERENCANAAN PEMBANGUNAN DAERAH PROVINSI JAWA TENGAH.

BAB III ANALISA DAN PERANCANGAN SISTEM. permasalahan yang ada sebagai dasar untuk membuat sebuah solusi yang

PROPOSAL PROGRAM APLIKASI. System Payroll & General Ledger PT MCS Internasional

Decision Support System (DSS)

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

M. M. Ubaidillah Ubaidillah.wordpress.com

PROSES EXTRACT, TRANSFORM DAN LOAD PADA DATA WAREHOUSE

BAB I PENDAHULUAN Latar Belakang

Pengembangan Sistem Informasi

DATA WAREHOUSE USULAN PEMANFAATAN DATA WAREHOUSE UNTUK SISTEM IRIGASI OTOMATIS PADA DESA KELATING, KERAMBITAN, TABANAN

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. Perusahaan-perusahaan kini tengah berusaha melakukan terobosanterobosan

BAB IV IMPLEMENTASI DAN PENGUJIAN

ERP (Enterprise Resource Planning) Pertemuan 6

2. Aktivitas yang bersifat temporer, selalu ada pembatasan dalam pelaksanaan dan juga skalanya a. Proyek d. Informasi b. Manajemen e. Data c.

BAB III METODE PENELITIAN. maka perlu dibuat langkah-langkah penelitian. Langkah-langkah penelitian

2.2.4 Nilai Informasi Pengertian Sistem Informasi Manfaat Sistem Informasi Komponen Sistem Informasi

BAB I PENDAHULUAN. memberikan pengaruh besar terhadap kelangsungan bisnis bank tersebut.

BAB IV ANALISIS DAN PERANCANGAN SISTEM

KNOWLEDGE MANAGEMENT PENGERTIAN DAN MANFAATNYA PADA ORGANISASI. Oleh :

PERTEMUAN 13 STRATEGI PENGUJIAN PERANGKAT LUNAK

Pembangunan Sistem lnformasi (2)

BAB III LANDASAN TEORI

BAB I PENDAHULUAN Latar Belakang Masalah

PROJECT MANAGEMENT PLAN RANCANG BANGUN SISTEM INFORMASI PENERIMAAN DAN SELEKSI PEGAWAI MENGGUNAKAN METODE MANAGEMENT BY OBJECTIVE

SDLC SYSTEM DEVELOPMENT LIFE CYCLE. Materi ke-2. Pengembangan Sistem Informasi 5KA28 // 4KA14

BAB I PENDAHULUAN 1.1 Latar Belakang

RENCANA PEMBELAJARAN SEMESTER (RPS)TAHUN AKADEMIK 2014/2015 FAKULTAS TEKNIK PROGRAM STUDI : SISTEM INFORMASI

STRATEGI PENGEMBANGAN PERANGKAT LUNAK SI Oleh : Hanif Al Fatta

BAB II LANDASAN TEORI

BAB VI KESIMPULAN DAN REKOMENDASI

BAB II LANDASAN TEORI. Basis Data Terdistribusi didefinisikan sebagai sebuah collection of multiple,

BAB III DECISION SUPPORT SYSTEM

TESTING & IMPLEMENTASI SISTEM 4KA. Mengukur Produktivitas Perangkat Lunak. helen.staff.gunadarma.ac.id

BAB III METODOLOGI PENELITIAN

Transkripsi:

20 September 2016 Lifecycle Analitik Data Imam Cholissodin imam.cholissodin@gmail.com

Pokok Bahasan 1. Pengantar 2. Key Roles Kunci Sukses Proyek Analitik 3. Lifecycle Analitik Data: Discovery, Data Preparation, Model Planning, Model Building, Communicate Results, Operationalize 4. Introduction to R Software 5. Tugas

Pengantar Fakta-fakta terkait dengan kondisi existing Perusahaan: Informasi apa saja yang bisa digali dari Big Data pada perusahaan di atas? Strategi apa saja yang bisa dilakukan dari masingmasing perusahaan di atas terkait Analitik Data. o o Key Roles Kunci Sukses Proyek Analitik Lifecycle Analitik Data

Pengantar Key Roles Kunci Sukses Proyek Analitik Lifecycle Analitik Data: 1. Discovery: 2. Data Preparation 3. Model Planning 4. Model Building 5. Communicate Results 6. Operationalize

Key Roles Proyek Analitik Key Roles Kesuksesan Proyek Analytics o Business User: Seseorang yang memahami wilayah domain (kondisi existing) dan dapat mengambil manfaat besar dari hasil proyek analitik, dengan cara konsultasi dan menyarankan tim proyek pada scope proyek, hasil, dan operasional output (terkait dengan cara mengukur suatu variabel). Biasanya yang memenuhi peran ini adalah analis bisnis, manajer lini, atau ahli dalam hal pokok yang mendalam.

Key Roles Proyek Analitik Key Roles Kesuksesan Proyek Analytics o Project Sponsor: Bertanggung jawab terkait asal proyek. Memberi dorongan, persyaratan proyek dan mendefinisikan masalah core bisnis. Umumnya menyediakan dana dan konsep pengukur tingkat nilai output akhir dari tim kerja. Menetapkan prioritas proyek dan menjelaskan ouput yang diinginkan.

Key Roles Proyek Analitik Key Roles Kesuksesan Proyek Analytics o Project Manager: Memastikan bahwa pencapaian utama projek dan tujuan terpenuhi tepat waktu dan sesuai dengan kualitas yang diharapkan.

Key Roles Proyek Analitik Key Roles Kesuksesan Proyek Analytics o Business Intelligence Analyst: Menyediakan keahlian dalam domain bisnis berdasarkan pemahaman yang mendalam mengenai data, indikator kinerja utama (KPI), metrik kunci, dan intelijen bisnis dari perspektif pelaporan. Analis Business Intelligence umumnya membuat dashboard (panel kontrol) dan laporan dan memiliki pengetahuan tentang sumber data dan mekanismenya.

Key Roles Proyek Analitik Key Roles Kesuksesan Proyek Analytics o Database Administrator (DBA): Set up dan mengkonfigurasi database untuk mendukung kebutuhan analitik. Tanggung jawab ini mungkin termasuk menyediakan akses ke database keys atau tabel dan memastikan tingkat keamanan yang sesuai berada di tempat yang berkaitan dengan penyimpanan data.

Key Roles Proyek Analitik Key Roles Kesuksesan Proyek Analytics o Data Engineer: Memilki keterampilan teknis yang mendalam untuk membantu penyetelan query SQL untuk pengelolaan data dan ekstraksi data, dan mendukung untuk konsumsi data ke dalam sandbox analitik. Data Engineer melakukan ekstraksi data aktual dan melakukan manipulasi data yang cukup besar untuk memfasilitasi kebutuhan proyek analitik. Insinyur data (Data Engineer) bekerja sama dengan ilmuwan data (Data Scientist) untuk membantu membentuk data yang sesuai dengan cara yang tepat untuk analisis.

Key Roles Proyek Analitik Key Roles Kesuksesan Proyek Analytics o Data Scientist (Ilmuan Data): Menyediakan keahlian untuk teknik analitis, pemodelan data, dan menerapkan teknik analitis yang valid untuk masalah yang diberikan. Memastikan melalui keseluruhan analitik tujuannya dapat terpenuhi. Merancang dan mengeksekusi metode analitis dan melakukan pendekatan lainnya dengan data yang tersedia untuk proyek tersebut.

Lifecycle Analitik Data Gambaran Umum dari Lifecycle Analitik Data: Apakah saya memiliki informasi yang cukup untuk menyusun rencana analitik dan share untuk peer review? Apakah saya memiliki data yang cukup dan berkualitas baik untuk memulai membangun model? Apakah model ini cukup handal? Apakah hasil model ini sukses atau gagal? Apakah saya memiliki ide yang lebih baik tentang jenis model yang akan dicoba? Dapatkah saya memperbaiki kembali rencana untuk proyek analitik?

1. Discovery Fase 1 adalah Discovery: Pada tahap ini, tim lmuwan data (Data Scientist) harus belajar, mencari dan menyelidiki fakta-fakta, masalah (identifikasi problem base), mengembangkan konteks dan pemahaman, dan belajar tentang sumber data yang dibutuhkan dan yang telah tersedia untuk kesuksesan proyek analitik. Selain itu, tim merumuskan hipotesis awal yang nantinya dapat diuji dengan data.

1. Discovery Fase 1 adalah Discovery: Tim belajar domain bisnis, termasuk kriteria dari data history yang relevan, seperti, apakah organisasi atau unit bisnis telah mencoba proyek serupa di masa lalu (apa saja yang sudah mereka pelajari dari data). Tim menilai sumber daya yang tersedia untuk mendukung proyek tersebut dari segi SDM, teknologi, waktu, dan data. Kegiatan penting dalam fase ini meliputi membingkai masalah bisnis sebagai tantangan analitik yang dapat dibahas dalam fase berikutnya dan merumuskan hipotesis awal (IHs) untuk menguji dan mulai mempelajari data.

2. Data Preparation Fase 2 adalah Data Preparation: Tahap ini membutuhkan adanya sandbox analitik, di mana tim dapat bekerja dengan data dan melakukan analitik selama proyek tersebut. tim perlu melaksanakan proses ekstrak, load dan transformasi (ELT) atau ekstrak, transform dan load (ETL) untuk menyiapkan data ke sandbox. ETLT adalah proses integrasi data untuk mentransfer data mentah dari server sumber ke sebuah gudang data pada server target dan kemudian menyiapkan informasi untuk keperluan hasil akhir.

2. Data Preparation Data Sandbox, dalam konteks Big Data, adalah platform terukur dan berkembang yang digunakan untuk mengeksplorasi informasi besar suatu perusahaan. Hal ini memungkinkan perusahaan untuk mewujudkan nilai investasi yang sebenarnya dalam Big Data. Sebuah sandbox data, utamanya dieksplorasi oleh tim Data Scientist yang menggunakan platform sandbox stand-alone, misal untuk analitik data marts, logical partitions pada suatu media penyimpanan di perusahaan. platform Data sandbox menyediakan komputasi yang diperlukan bagi para ilmuwan Data (Data Scientist) untuk mengatasi beban kerja analitik yang biasanya kompleks.

3. Model Planning Tahap 3 adalah Model Planning, di mana tim menentukan metode, teknik, dan alur kerja. Mereka berniat untuk mengikuti tahap pembentukan model berikutnya. Tim mengeksplorasi data untuk belajar tentang hubungan antara variabel dan kemudian memilih variabel kunci dan model yang paling cocok untuk digunakan.

4. Model Building Tahap 4 adalah Model Building, tim mengembangkan dataset untuk pengujian (testing), pelatihan (training), dan tujuan produksi (menghasilkan data baru dari data yang ada). Selain itu, dalam fase ini tim membangun dan mengeksekusi model yang didasarkan pada kerja yang dilakukan di dalam fase Model Planning. Tim juga mempertimbangkan apakah ini alat yang ada akan cukup untuk menjalankan model, atau jika itu akan membutuhkan lingkungan yang lebih robust untuk mengeksekusi model dan alur kerja (misalnya, hardware yang cepat, teknik dekomposisi data dan pemrosesan paralel, jika dapat diterapkan).

5. Communicate Results Pada fase 5 adalah Communicate Results, tim bekerja sama dengan pemangku kepentingan (stakeholders) utama, menentukan apakah hasil proyek tersebut sukses atau mengalami kegagalan berdasarkan kriteria yang dikembangkan di Fase 1. Tim harus mengidentifikasi temuan kunci, mengukur nilai bisnis, dan mengembangkan narasi untuk meringkas dan menyampaikan temuan kepada para pemangku kepentingan.

6. Operationalize Pada fase 6 adalah Operationalize, tim memberikan laporan akhir, pengarahan, kode, dan dokumen teknis. Selain itu, tim dapat menjalankan pilot project untuk menerapkan model dalam lingkungan produksi. Pilot Project adalah sebuah studi percontohan, proyek percontohan atau studi pendahuluan skala kecil yang dilakukan untuk mengevaluasi kelayakan, waktu, biaya, efek samping, dan efek ukuran dalam upaya untuk memprediksi ukuran sampel yang tepat dan memperbaiki design penelitian sebelum kepada proyek penelitian skala penuh.

Introduction to R Tentang Software R: o Free o Didukung dan dimaintain oleh para ahli dibidangnya o tersedia di semua platform o perbaikannya terus-menerus (continuous) o Tersedia di www.r-project.org Software R berisi: o Basic operations (assignment operation: a <- 2+sqrt(5)) o Data creation + I/O (read.csv("c:/data/yearly_sales.csv")) o Component extraction (d[r,]: rth row of object d) o Plots o Basic statistics (mean, stdev) o Regression analysis o Etc.

Introduction to R Tentang R Console dan R Editor: Create new or existing scripts (text files) - these will be saved Terminal output & temporary input - usually unsaved

Tugas Kelompok 1. Jelaskan apa yang dimaksud dengan Data Sandbox pada konteks Big Data! 2. Jelaskan perbedaan antara Data Science dengan Business Intelligence! 3. Jelaskan perbedaan antara Data Science dengan Data Engineer! 4. Dari beberapa macam Key Roles Kunci Sukses Proyek Analitik, manakah 2 pekerjaan paling banyak dibutuhkan pada saat ini, terutama diperusahaan besar? 5. Dari Gambaran Umum dari Lifecycle Analitik Data, Buatlah studi kasus dengan mengambil salah satu perusahaan besar yang ada di Indonesia atau perusahaan Asing di dunia untuk melakukan fase ke-1, yaitu Discovery. Berikan penjelasan detail terkait hasil penyelidikan anda dari: a. Fakta-fakta (Analisis kondisi existing yang ada disana) b. Permasalahan yang ditemukan (identifikasi problem base) c. Dari hasil penjabaran permasalahan pada point (b), manakah permasalahan yang menurut anda paling komplek? Jelaskan!

20 September 2016 Terimakasih Imam Cholissodin imam.cholissodin@gmail.com