Sebuah lingkungan untuk machine learning, data mining, text mining dan predictive analytics. Machine learning

dokumen-dokumen yang mirip
BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

BAB III METODE PENELITIAN

BAB II TINJAUAN PUSTAKA. yang akan dibuat adalah sebagai berikut : Sistem Monitoring Pertumbuhan Balita Berbasis Web. Wahyuningsih

ADempiere. Persiapan sebelum instalasi ADempiere, adalah sebagai berikut :

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. Fakultas Komunikasi dan Informatika Universitas Muhammadiyah Surakarta [1].

Praktikum 1 - Pengantar Quantum GIS

BAB 2 LANDASAN TEORI. Komputer berasal dari bahasa Latin computare yang artinya menghitung. Jadi

BAB 2 LANDASAN TEORI. Istilah komputer (computer) berasal dari bahasa latin computere yang berarti

Visual Basic (VB) Tatik yuniati. Abstrak.

Belajar Data Mining dengan RapidMiner. Penyusun: Dennis Aprilla C Donny Aji Baskoro Lia Ambarwati I Wayan Simri Wicaksana Editor: Remi Sanjaya

KLASIFIKASI PRESTASI AKADEMIK MAHASISWA FKI UMS MENGGUNAKAN METODE DECISION TREE

R Commander - Rcmdr. A. Instalasi & Menu dalam Rcmdr 1. Instalasi

Menggunakan Microsoft Access (perhatikan untuk red text)

soal tes + ujian asil + ujian BUKU PANDUAN SISTEM MANAJEMEN KONTEN PADA PLATFORM MOODLE Buku Panduan CMS pada Platform Moodle 1

Modul Pembelajaran SPSS (Statistical Package for the Social Sciences)

Menginstall MYSQL SERVER 5.6 pada Windows 8. Sebelum nya download sql offline installer pada link ini (windows 8 32 bit Support)

3.2 Membuat SQL Azure Server

[Data Warehouse] [6/C2 & 6/D2]

Sebelum membahas mengenai pemrograman LabVIEW, sebaiknya pembaca mengenal istilah istilah penting berikut ini.

Microsoft Excel Pivot Table dalam MS. Excel Grace Gata, S.Kom., M.Kom. Modul ke: Fakultas Ilmu Komunikasi

KEKURANGAN KELEBIHAN APLIKASI DATA BASE

BAB 2 TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

APLIKASI BASIS DATA BERBASIS MICROSOFT ACCESS

BAB 2 LANDASAN TEORI

BAB V IMPLEMENTASI DAN PEMBAHASAN

PANDUAN PENGGUNAAN. Joomla! Versi 1.5. Oleh: Anon Kuncoro Widigdo

I. Praktek: Transformation Untuk Membaca 1 File Excel

BAB II LANDASAN TEORI

PEMBUATAN DATABASE DENGAN DBDESIGNER

Ringkasan Bab 1. Bab 1 ini akan membahas pemakaian dasar Access secara menyeluruh. Topik-topiknya antara lain:

MANUAL PENGOPERASIAN JSTOCKINVENTORY Twitter

PRAKTIKUM 1 PENGENALAN SQL SERVER 2000

PENGEMBANGAN PROJECT MICROCONTROLLER DENGAN ARDUINO IDE

SIPP Dokumen Petunjuk Teknis. Aplikasi Sistem Informasi Laporan Bulanan Perusahaan Pembiayaan

Gambar 4.37 Layar Untuk Pembuatan Kolom

X. PENGANTAR DATABASE

Aplikasi Web Dinamis Lanjut

BAB IV IMPLEMENTASI DAN ANALISA

TUGAS 1 APLIKASI WEB DINAMIS LANJUTAN. Mengenal Composer dan Github

Mengenal Tabel, Membuat Tabel, Mengedit Tabel, Memasukkan Data Kedalam Tabel

BAB III METODE PENELITIAN

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

Instalasi & Konfigurasi MySQL Server

Panduan Membuat Data Flow Diagram, Entity Relationship Diagram, dan Database Menggunakan Power Designer

LAMPIRAN : CARA MENJALANKAN PROGRAM

PENDAHULUAN TENTANG NETBEANS

WEB DINAMIS 1 MANAJEMEN DATABASE MYSQL. Agustina Purwatiningsih., S.Kom

CHAPTER #10 Databinding dengan ADO.NET

Softaculous. 4. Setting IMAP dan SMTP seperti contoh dibawah ini:

Tutorial Lazarus Pemrograman Pascal Console, Visual dan Database Husni, husni.trunojoyo.ac.id, komputasi.wordpress.com

Bab 4 Hasil Implementasi dan Analisis

MODUL VII DATABASE DAN MICROSOFT SQL SERVER 2000

BAB I PENGENALAN SPSS DAN EVIEWS

Sebelum kita membahas tentang Microsoft Access ada baiknya jika kita terlebih dahulu mengetahui apa yang dimaksud dengan database.

IMPLEMENTASI PEMROGRAMAN VISUAL BASIC DENGAN DATABASE ACCESS

BAB II LANDASAN TEORI

Batch Processing A. BATCH, ONLINE, REAL TIME PROCESSING

DASAR-DASAR SQL SERVER 2005

BAB IV DISKRIPSI KERJA PRAKTEK

BAB 2 LANDASAN TEORI. Istilah komputer (computer) berasal dari bahasa Latin Computare yang berarti

TUGAS 1 Aplikasi Web Dinamis Lanjut Composer dan Github

BAB I PERSYARATAN PRODUK

Project 9: Memperbaiki Partition Table dengan TestDisk (25 points)

Pengenalan SPSS 15.0

SMS Gateway. oleh: Kaka E. Prakasa Nanang Syaifudin

MODUL 1 INSTALASI PAKET JAVA DAN PROGRAM SEDERHANA

Flexi Conference Client User Manual

BAB 2 LANDASAN TEORI. Istilah komputer ( computer ) berasal dari bahasa latin computere yang berarti

Pengembangan Sistem Analisis Visual Untuk Meningkatkan Kualitas Informasi dan Pengambilan Keputusan dengan Tools BI TABLEAU

KONVERSI DATA TRAINING TENTANG PEMILIHAN KELAS MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI

Install Italc Di Windows XP

BAB 4 IMPLEMENTASI DAN TESTING Perkiraan Kebutuhan Piranti Keras (Hardware) b. Memory DDR 512MB

PENGENALAN VISUAL FOXPRO

Mengeksplorasi Database PostgreSQL dengan PgAdmin III

BAB 4 PERANCANGAN DAN IMPLEMENTASI. operasi Linux Fedora Core 4 dengan menggunakan bahasa pemrograman Java.

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB II. KAJIAN PUSTAKA

Pertemuan 11 Pengenalan DBMS dan MySQL

1. Masukkan file ETOURGUIDE.APK ke dalam memory card. 4. Pada saat muncul konfirmasi, pilih Install. 5. Tunggu hingga proses instalasi selesai

PENGERTIAN PHP DAN MYSQL

EDISI MEI 2004, Volume IX, No. 2 ISSN : Oleh: Kristophorus Hadiono dan Hari Murti

MODUL 8 Mengoperasikan Perangkat Lunak Basis Data

BAB 2 LANDASAN TEORI

PERANGKAT LUNAK BANTU TRY OUT UJIAN NASIONAL BERBASIS MULTI USER MENGGUNAKAN VISUAL BASIC 6.0 DAN MYSQL

KONFIGURASI MAIL SERVER DENGAN MERCURY

Instalasi RazorSQL pada Debian Wheezy

Pemrograman Web Week 1. Team Teaching

CARA MENJALANKAN PROGRAM

Otodidak. MySQL untuk Pemula

BAB IV IMPLEMENTASI DAN EVALUASI. mempersiapkan kebutuhan system (baik hardware maupun software), persiapan

1. MENGENAL VISUAL BASIC

APLIKASI WEB DINAMIS LANJUT TUGAS 1

TABEL DATABASE TABEL - KODE BARANG TOKO INFOMART BARANG - NAMA BARANG - HARGA

Syarat Menjalankan Program pada aplikasi Desktop. Prosedur Menjalankan Program Pada aplikasi Desktop

M. Choirul Amri

Mengembangkan Website Berbasis Wordpress

Transkripsi:

MENGENAL RAPIDMINER

RapidMiner Sebuah lingkungan untuk machine learning, data mining, text mining dan predictive analytics. Machine learning Salah satu disiplin ilmu dari Computer Science yang mempelajari bagaimana membuat komputer/mesin mempunyai suatu kecerdasan. Data mining Proses mengekstrak pola-pola dari data set yang besar dengan mengombinasikan metoda statistika, kecerdasan buatan dan database.

RapidMiner Text mining Mirip dengan text analytics, yaitu proses untuk mendapatkan informasi bermutu tinggi dari teks. Predictive analytics Teknik-teknik statistika yang menganalisa fakta masa kini dan masa lalu untuk memprediksi kejadian di masa depan.

RapidMiner Open source berlisensi AGPL (GNU Affero General Public License) versi 3. Dimulai pada 2001 oleh Ralf Klinkenberg, Ingo Mierswa, dan Simon Fischer di Artificial Intelligence Unit dari University of Dortmund. Di-host oleh SourceForge sejak 2004. Peringkat satu sebagai tool data mining untuk proyek nyata pada poll oleh KDnuggets, sebuah koran data-mining, pada 2010-2011.

RapidMiner Menyediakan prosedur data mining dan machine learning termasuk: ETL (extraction, transformation, loading), data preprocessing, visualisasi, modelling dan evaluasi. Proses data mining tersusun atas operatoroperator yang nestable, dideskripsikan dengan XML, dan dibuat dengan GUI. Ditulis dalam bahasa pemrograman Java. Mengintegrasikan proyek data mining Weka dan statistika R.

Instalasi Sistem Microsoft Windows Download file installer rapidminer-xxxinstall.exe di http://rapidi.com/content/view/26/84/. Double-click file installer dan ikuti instruksinya. Sistem lain Install Java versi 1.5 atau lebih. Download dan ekstrak arsip zip Java binary. Definisikan RAPIDMINER_HOME. Run dengan scripts/rapidminergui.

Terminologi Dasar Atribut dan atribut target Atribut: karakteristik atau fitur dari data yang menggambarkan sebuah proses atau situasi. ID, atribut biasa. Atribut target: atribut yang menjadi tujuan untuk diisi oleh proses data mining. Label, cluster, weight. Peran atribut (attribute role) Label, cluster, weight, ID, biasa

Terminologi Dasar Tipe nilai (value type) nominal: nilai secara kategori numeric: nilai numerik secara umum integer: bilangan bulat real: bilangan nyata text: teks bebas tanpa struktur binominal: nominal dua nilai polynominal: nominal lebih dari dua nilai date_time: tanggal dan waktu date: hanya tanggal time: hanya waktu

Terminologi Dasar Data dan metadata Data menyebutkan obyek-obyek dari sebuah konsep. Ditunjukkan sebagai baris dari tabel. Metadata menggambarkan karakteristik dari konsep tersebut. Ditunjukkan sebagai kolom dari tabel. Modelling Penggunaan metoda data mining terhadap data. Hasilnya disebut model.

Desain Proses Analisa Fleksibilitas dan fungsionalitas Sangat fleksibel untuk mendefinisikan proses analisa secara visual dengan GUI. Meliputi lebih dari 500 fungsionalitas data mining dalam bentuk operator-operator. Skalabilitas Mulai versi 4.6 ~.. fokus utama pada skalabilitas untuk data ukuran besar. Konsep view untuk data mirip seperti database. Transformasi data on-the-fly tanpa copy. 100 juta data set bukanlah data yang besar.

Desain Proses Analisa Format data Terhubung sangat baik dengan berbagai sumber data: Oracle, IBM DB2, Microsoft SQL Server, MySQL, PostgreSQL, Ingres, Excel, Access, SPSS, CSV files dan berbagai format lain. Bersama-sama dengan operator-operator untuk data preprocessing, bisa digunakan juga sebagai tool ETL (extraction, transformation, loading) dengan hasil yang menakjubkan.

Repositori Pertama Menjalankan RapidMiner untuk pertama kali, akan menanyakan pembuatan repositori baru. Repositori ini berfungsi sebagai lokasi penyimpanan terpusat untuk data dan proses analisa kita.

Perspektif dan View Sebuah perspektif berisi pilihan elemenelemen GUI, yang disebut view, yang dapat dikonfigurasi secara bebas. Elemen-elemen ini dapat diatur bagaimanapun juga sesuka kita. Tiga perspektif: Perspektif selamat datang (welcome perspective). Perspektif desain (design perspective). Perspektif hasil (result perspective).

Perspektif dan View

Perspektif Desain Perspektif pusat di mana semua proses analisa dibuat dan dimanage. Pindah ke perspektif desain dengan: Klik tombol paling kiri. Atau gunakan menu View Perspectives Design. View: Operators, Repositories, Process, Parameters, Help, Comment, Overview, Problems, Log

Perspektif Desain

View Operator Semua tahapan kerja (operator) ditampilkan di sini secara berkelompok, dan bisa diikutsertakan di dalam proses analisa.

View Operator Process control Untuk mengontrol aliran proses, seperti loop atau conditional branch. Utility Untuk mengelompokkan subprocess, juga macro dan logger. Repository Access Untuk membaca dan menulis repositori.

View Operator Import Untuk membaca data dari berbagai format eksternal. Export Untuk menulis data ke berbagai format eksternal. Data Transformation Untuk transformasi data dan metadata.

View Operator Modelling Untuk proses data mining yang sesungguhnya seperti klasifikasi, regresi, clustering, aturan asosiasi dll. Evaluation Untuk menghitung kualitas dari modelling.

View Operator

View Repositori Komponen pusat yang menyediakan servis untuk manajemen dan penstrukturan proses analisa, baik data, metadata, proses maupun hasil.

View Proses Menampilkan tahap-tahap individual operator di dalam proses analisa dan juga interkoneksi di antara mereka.

View Proses

View Parameter Operator-operator mungkin memerlukan parameter untuk bisa berfungsi. Setelah sebuah operator dipilih di view Proses, parameternya ditampilkan di view ini.

View Parameter

View Help dan Comment View Help menampilkan deskripsi dari operator. View Comment menampilkan komentar yang dapat diedit terhadap operator.

View Help dan Comment

View Overview Menampilkan seluruh area kerja dan menyorot seksi yang ditampilkan saat ini dengan sebuah kotak kecil.

View Overview

View Problem Menampilkan setiap pesan warning dan error.

View Log Menampilkan pesan log selama melakukan desain dan eksekusi proses.

View Problem dan Log

Operator dan Proses Proses data mining pada dasarnya adalah mendefinisikan proses analisa dengan menyatakan urutan tahap kerja individual. Komponen dari proses ini disebut operator, yang didefinisikan dengan: Deskripsi input. Deskripsi output. Aksi yang dilakukan. Parameter yang diperlukan.

Operator dan Proses Sebuah operator bisa disambungkan melalui port masukan (kiri) dan port keluaran (kanan). Indikator status dari operator: Lampu status: merah (tak tersambung), kuning (lengkap tetapi belum dijalankan), hijau (sudah behasil dijalankan). Segitiga warning: bila ada pesan status. Breakpoint: bila ada breakpoint sebelum/sesudahnya. Comment: bila ada komentar. Subprocess: bila mempunyai subprocess.

Operator dan Proses Sebuah proses analisa yang terdiri dari beberapa operator. Warna aliran data menunjukkan tipe obyek yang dilewatkan.

Membuat Proses Baru Pilih menu File New Pilih repositori dan lokasi, lalu beri nama.

Struktur Repositori Repositori terstruktur ke dalam proyekproyek. Masing-masing proyek terstruktur lagi ke dalam data, processes, dan results.

Proses Analisa Pertama

Proses Analisa Pertama Generate Sales Data proses sangat sederhana, yang hanya men-generate data.

Transformasi Metadata Metadata dari terminal output.

Transformasi Metadata Generate Attributes men-generate atribut baru.

Transformasi Metadata Parameter dari operator Generate Attributes.

Transformasi Metadata Menghitung atribut baru total price sebagai perkalian dari amount dan single price.

Transformasi Metadata

Transformasi Metadata Select Attributes untuk memilih subset dari atribut.

Transformasi Metadata Parameter untuk operator Select Attributes.

Transformasi Metadata Atribut individu maupun subset bisa dipilih atau dihapus.

Menjalankan Proses Proses dapat dijalankan dengan: Menekan tombol Play. Memilih menu Process Run. Menekan kunci F11.

Melihat Hasil

Referensi 1. Wikipedia, http://en.wikipedia.org/wiki/rapidminer 2. RapidMiner Installation Guide, http://rapidi.com/content/view/17/40/ 3. RapidMiner 5.0 Manual, Rapid-I, 2010, http://www.rapidi.com 4. Slide Materi Romi Satrio Wahono (www.ilmukomputer.com)