Mesin Pembelajaran. Achmad Basuki PENS ITS 2006

dokumen-dokumen yang mirip
Metode Bayes. Achmad Basuki PENS ITS 2006

PROBABILITAS DAN TEOREMA BAYES

Metode Bayes. Tim Machine Learning

BAB II TEORI PENUNJANG

Decision Tree. Achmad Basuki, Iwan Syarif Politeknik Elektronika Negeri Surabaya PENS-ITS 2003

BAB II LANDASAN TEORI

PERANCANGAN PERANGKAT LUNAK PREDIKTOR CUACA BERBASIS LOGIKA FUZZY

Sebelumnya... Sistem Pakar berbasis Logika Fuzzy

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Belajar Mudah Algoritma Data Mining : C4.5

Fitur Bentuk Pada Citra. Achmad Basuki, Nana R PENS-ITS, 2008

ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan. Tabel 3.1. Keputusan Bermain Tenis

Konsep Dasar Pemrograman

BAB III ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. client-server yang terintegrasi dengan component ADO pada Delphi. Pada program

BAB IV PERANCANGAN DAN IMPLEMENTASI PERANGKAT LUNAK

2

PERAMALAN CUACA KOTA SURABAYA TAHUN 2011 MENGUNAKAN METODE MOVING AVERAGE DAN KLASIFIKASI NAIVE BAYES

BAB V IMPLEMENTASI SISTEM

APLIKASI JARINGAN SYARAF TIRUAN UNTUK MEMPREDIKSI VOLUME PEMAKAIAN AIR BERSIH DI KOTA PONTIANAK

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB 3 METODE PENELITIAN

Algoritma Sorting (Selection Insertion)

Penerapan metode..., Novi Indriyani, FASILKOM UI, Universitas Indonesia

ditinjau dari masalah yang ada, objek penelitian dan metode yang digunakan percobaan pada beban dan tegangan input yang berbeda dalam dua keadaan loop

Prediksi Curah Hujan Di Kota Pontianak Menggunakan Parameter Cuaca Sebagai Prediktor Pada Skala Bulanan, Dasarian Dan Harian Asri Rachmawati 1)*

MATERI IV ARRAY. Materi Praktikum Pemograman Bahasa C++ dengan menggunakan variabel Array

Pertemuan 5: Pengenalan Variabel Array

BAB XIII MENGECEK KESAMAAN DUA VEKTOR

Kecerdasan Buatan Materi 6. Iterative Dichotomizer Three (ID3)

Algoritma Kohonen dalam Mengubah Citra Graylevel Menjadi Citra Biner

Copyright 2005 PENS-ITS C H A P T E R

BAB III PERANCANGAN DAN PEMBUATAN PERANGKAT LUNAK

MODUL 11 PHP&MYSQL UPDATE & SEARCHING

Strategi Menggunakan Algoritma Genetika

Membangkitkan Bilangan Acak Menggunakan Matlab

TUGAS PENGENALAN POLA K-MEANS CLUSTERING. Disusun Oleh : Putrisia Hendra Ningrum Adiaty (06/195033/PA/11129)

BAB 3 PE GEMBA GA METODE DA ALGORITMA PEMESI A MULTI AXIS

PENGELOMPOKAN DATA ANGIN PUTING BELIUNG DENGAN MENGGUNAKAN LVQ

Membangkitkan Bilangan Acak Menggunakan Matlab. Achmad Basuki

Presentasi Tugas Akhir

Studi Prakiraan Beban dan Potensi Pemanfaatan PV untuk Mengurangi Beban Puncak di Penyulang Unsyiah Menggunakan ANN

BAB III ANALISIS DAN DESAIN SISTEM

BAB 4 IMPLEMENTASI DAN HASIL PENELITIAN. Pada bab 4 ini akan dijelaskan hasil rancangan sistem aplikasi optimizer, yaitu

PERANCANGAN SOFTSENSOR KADAR GAS BUANG PADA STACK HASIL KELUARAN HRSG (HEAT RECOVERY STEAM GENERATOR) DENGAN METODE JARINGAN SYARAF TIRUAN

PERANCANGAN SISTEM PENGENAL DIGIT ANGKA METER AIR MENGGUNAKAN JARINGAN SYARAF TIRUAN KOHONEN

BAB 1 PENDAHULUAN. satu hal yang sangat dominan dan terjadi dengan sangat pesat. Informasi

Algoritma C4.5. Untuk memudahkan penjelasan mengenai algoritma C4.5 berikut ini disertakan contoh kasus yang dituangkan dalam Tabel 1.

2.3 Algoritma Tidak Berhubungan dengan Bahasa Pemrograman Tertentu

TUTORIAL PHP MYSQL Langkah Tepat menjadi Web Developer Handal, menguasai PHP dan MySQL, jalan terbaik membuat website dan aplikasi berbasis web

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB III PERANCANGAN SISTEM

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

Analisis Kepuasan Konsumen Terhadap Pelayanan GOR VIO s Kranggan Permai Bekasi

NAIVE BAYES. Artinya Peluang kejadian X bersyarat Y ditentukan dari peluang Y terhadap X, peluang X, dan peluang Y. Posterior Evidence

ALGORITMA GENETIKA. Suatu Alternatif Penyelesaian Permasalahan Searching, Optimasi dan Machine Learning

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

BAB III ANALISIS DAN PERANCANGAN SISTEM

BAB IV PERANCANGAN. IV.1 Evaluasi Usulan untuk Perancangan Iteratif

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

Universitas gunadarma. pascal. Bab 4- bab 10. Hana Pertiwi S.T

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

INFERENCE & EXPLANATION TEKNIK PENARIKAN KESIMPULAN & MEMBERI PENJELASAN

BAB 3 PERANCANGAN PROGRAM

BAB 4 IMPLEMENTASI DAN EVALUASI. perangkat keras dan perangkat lunak yang digunakan untuk pemakaian aplikasi yang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III ANALISA DAN DESAIN SISTEM

Modul-7 CRUD & Searching. Pemograman Web TEKNIK INFORMATIKA UNIVERSITAS PASUNDAN BANDUNG

SISTEM PAKAR IDENTIFIKASI KENDARAAN MENGGUNAKAN METODE INFERENSI

PRAKTIKUM 1 SINYAL, SYSTEM, DAN KONTROL PENGENALAN MATLAB 1. Percobaan 1 Vektor Penulisan vektor di MATLAB

BAB 3 ANALISIS DAN PERANCANGAN

Pengklasifikasian Kemampuan Akademik Mahasiswa

BAB II INDUCT/RIPPLE-DOWN RULE (RDR)

BAB 2 LANDASAN TEORI. Pengenalan suara (voice recognition) dibagi menjadi dua jenis, yaitu

BAB III ANALISIS DAN PERANCANGAN. Subbab ini akan berisi pembahasan mengenai cara kerja algoritma Welch-

Database desain juga termasuk diagram ER (Entity-hubungan model). Diagram ER adalah diagram yang membantu merancang database secara efektif dan

BAB III METODE PENELITIAN

PENERAPAN FUZZY INFERENCE SYSTEM PADA PREDIKSI CURAH HUJAN DI SURABAYA UTARA

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA BAB III METODE PENELITIAN. Penelitian ini dilakukan dalam kurung waktu setahun.

BAB 4 PENGUJIAN DAN EVALUASI. dengan menggunakan 15 tanda tangan yang berasal dari 1 user yang masing masing

MODUL 8 APLIKASI NEURAL NETWORK DAN FUZZY LOGIC PADA PERKIRAAN CUACA

BAB III PERANCANGAN SISTEM

APLIKASI HOPFIELD NEURAL NETWORK UNTUK PRAKIRAAN CUACA

PENGENALAN STATEMEN BASIC. Pertemuan VIII

BAB IV APLIKASI JARAK MAHALANOBIS

1 Pendahuluan. 1.1 Latar Belakang Masalah

ANALISA TEKNIK PENENTUAN ATRIBUT DALAM MEMBUAT POHON KEPUTUSAN PADA PENAMBANGAN DATA

Classification. Decision Tree. Decision Tree. Konsep Decision Tree. Penggunaan Decision Tree. When To Consider Decision Tree?

SISTEM PENGENALAN TULISAN TANGAN REAL TIME MENGGUNAKAN METODE DOMINANT POINT DAN JARINGAN SYARAF TIRUAN LEARNING VECTOR QUANTIZATION

BAB IV HASIL DAN PEMBAHASAN

Trick Import Data Member Menggunakan Kingsoft Office Spreedsheet

Estimasi Suhu Udara Bulanan Kota Pontianak Berdasarkan Metode Jaringan Syaraf Tiruan

Transkripsi:

Mesin Pembelajaran Achmad Basuki PENS ITS 2006

Ide Mesin Pembelajaran Fakta harian dalam 6 hari dan keputusan untuk berolah-raga sebagai berikut: # Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 Cerah Normal Pelan Ya 3 Hujan Tinggi Pelan Tidak 4 Cerah Normal Kencang Ya 5 Hujan Tinggi Kencang Tidak 6 Cerah Normal Pelan Ya (1) Ketika cuaca cerah, apakah akan berolah-raga? (2) Ketika cuaca cerah dan temperatur normal, apakah akan berolah-raga? Penyajian keputusan berdasarkan fakta inilah yang mengilhami konsep dari mesin pembelajaran

Data Training Key Attribut Target Day Cuaca Temperatur Kecepatan Angin Berolah-raga D1 Cerah Normal Pelan Ya D2 Cerah Normal Pelan Ya D3 Hujan Tinggi Pelan Tidak D4 Cerah Normal Kencang Ya D5 Hujan Tinggi Kencang Tidak D6 Cerah Normal Pelan Ya Attribut adalah kolom data, ada atribut dan target Instance adalah isi dari attribut sebagai contoh attribut cuaca mempunyai instance cerah dan hujan, sering ditulis dengan cuaca={cerah,hujan} Record/tuple adalah baris data

Pengisian Data Dalam Matlab Day Cuaca Temperatur Kecepatan Angin Berolah-raga D1 Cerah Normal Pelan Ya D2 Cerah Normal Pelan Ya D3 Hujan Tinggi Pelan Tidak D4 Cerah Normal Kencang Ya D5 Hujan Tinggi Kencang Tidak D6 Cerah Normal Pelan Ya dttraining(1,:) = { D1, cerah, normal, pelan, ya } dttraining(2,:) = { D2, cerah, normal, pelan, ya } dttraining(3,:) = { D3, hujan, tinggi, pelan, tidak } dttraining(4,:) = { D4, cerah, normal, kencang, ya } dttraining(5,:) = { D5, hujan, tinggi, kencang, tidak } dttraining(6,:) = { D6, cerah, normal, pelan, ya }

Menyimpan dan Memanggil Data Untuk menyimpan data training yang sudah dibuat: save datatraining dttraining nama file nama variabel yang disimpan Untuk memanggil data training yang sudah disimpan: load datatraining nama file

Mengambil Ukuran data Setiap data di dalam MATLAB dinyatakan sebagai matrik, sehingga dapat diambil ukuran data yang berupa jumlah baris data dan jumlah kolom (attribut). ndata=size(dttraining,1); nattribut=size(dttraining,2); ndata adalah jumlah data (baris) nattribut adalah jumlah attribut (kolom)

Membaca Instance Keputusan % Instance pertama diambil dari data pertama ninstance=1; instance{1}=dttraining{1,nattribut}; % Membaca semua baris data for i=2:ndata % Cek apa instance data ke I adalah instance baru sw=0; for k=1:ninstance if strcmp(dttraining{i,nattribut},instance{k})==1 sw=1; end end end % Jika instance baru, maka tambahkan data instance if(sw==0) ninstance=ninstance+1; instance(ninstance)=dttraining(i,nattribut); end

Data Konsisten # Cuaca Temperatur Kecepatan Angin Berolah-raga 3 Hujan Tinggi Pelan Tidak 5 Hujan Tinggi Kencang Tidak Attribut cuaca dan temperatur mempunyai nilai yang sama dalam satu keputusan (berolah-raga), maka data ini adalah data yang konsisten. # Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 Cerah Tinggi Pelan Ya 4 Hujan Normal Kencang Ya 6 Cerah Normal Pelan Ya Tidak satupun attibut yang mempunyai nilai yang sama dalam satu keputusan (berolah-raga), maka data ini adalah data yang tidak konsisten.

Data Bias # Cuaca Temperatur Kecepatan Angin Berolah-raga 1 Cerah Normal Pelan Ya 2 Cerah Normal Pelan Ya 3 Hujan Normal Pelan Ya 4 Cerah Normal Pelan Tidak Perhatikan data ke 4, data ini mempunyai keputusan yang berbeda dengan data 1 dan data 2, tetapi instance pada semua attributnya sama, sehingga data ini disebut dengan data bias.

Hipotesa Hipotesa dituliskan dengan: H(attribut 1, attribut 2,, attribut n ) = keputusan H(cuaca=cerah, temperatur=normal, kec.angin=pelan) = ya Hipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, temperatur=normal dan kec.angin=pelan, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,normal,pelan)=ya H(cuaca=cerah, kec.angin=pelan) = ya Hipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, dan kec.angin=pelan, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,*,pelan)=ya H(cuaca=cerah) = ya Hipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,*,*)=ya

Penulisan Hipotesa Dalam Matlab Penulisan untuk hipotesa H(cerah, normal, pelan)=ya dalam MATLAB adalah: H(1,:) = { cerah, normal, pelan } Penulisan ini menggunakan format cell-array dengan array 1 baris dan 3 kolom (sesuai jumlah attribut yang dimasukkan). Nilai 1 berarti keputusan untuk YA. Untuk hipotesa dengan keputusan tidak seperti H(hujan)=tidak dituliskan dengan indeks 2 sebagai berikut: H(2,:) = { hujan, *, * }

Ide Mesin Pembelajaran Pada dasarnya semua algoritma yang dikembangkan dalam mesin pembelajaran adalah algoritma yang menghasilkan hipotesa dari suatu keputusan berdasarkan data pembelajaran yang diberikan.

Find-S Find-S adalah suatu metode paling sederhana yang dapat digunakan untuk mendapatkan suatu hipotesa berdasarkan data. Find-S mencari kesamaan nilai attribut untuk memperoleh suatu hipotesa Kelemahan dari Find-S adalah data yang digunakan harus bersifat konsisten dan tidak bias??? (Terlalu sulit untuk dapat memperoleh data semacam ini pada persoalan nyata)

(1) Langkah Find-S Day Cuaca Temperatur Kecepatan Angin Berolah-raga D1 Cerah Normal Pelan Ya D2 Cerah Normal Pelan Ya D3 Hujan Tinggi Pelan Tidak D4 Cerah Normal Kencang Ya D5 Hujan Tinggi Kencang Tidak D6 Cerah Normal Pelan Ya Untuk memperoleh hipotesa dengan Find-S dari data training di atas, langkah pertama yang harus dilakukan adalah memcah data berdasarkan keputusannya, sehingga akan diperoleh 2 data: pertama untuk keputusan=ya dan kedua untuk keputusan=tidak

(2) Langkah Find-S Day Cuaca Temperatur Kecepatan Angin Berolah-raga D1 Cerah Normal Pelan Ya D2 Cerah Normal Pelan Ya D4 Cerah Normal Kencang Ya D6 Cerah Normal Pelan Ya Day Cuaca Temperatur Kecepatan Angin Berolah-raga D3 Hujan Tinggi Pelan Tidak D5 Hujan Tinggi Kencang Tidak Dari hasil pemisahan tersebut, terlihat bahwa data training tersebut Konsisten dan tidak bias. Langkah berikutnya adalah membuat hipotesa untuk masing-masing keputusan. Pembuatan hipotesa ini dilakukan dengan mengambil data pertama sebagai hipotesa awal yang dianggap sebagai hipotesa spesifik, dan diteruskan hingga data terakhir dengan memperhatikan kesamaan sampai didapatkan hipotesa umum.

[3] Langkah Find-S Langkah ini digunakan untuk menentukan hipotesa dari keputusan=ya Day Cuaca Temperatur Kecepatan Angin Berolah-raga D1 Cerah Normal Pelan Ya D2 Cerah Normal Pelan Ya D4 Cerah Normal Kencang Ya D6 Cerah Normal Pelan Ya 1 2 3 4 Hipotesa awal disamakan dengan data pertama: H(Cerah, Normal, Pelan) = Ya Data kedua, tidak ada perubahan karena semua nilai instancenya sama: H(Cerah, Normal, Pelan) = Ya Data ketiga, ada perubahan di attribut kec angin, sehingga : H(Cerah, Normal, *) = Ya Data keenam, ada perubahan di attribut kec angin, sehingga : H(Cerah, Normal, *) = Ya

[4] Langkah Find-S Langkah ini digunakan untuk menentukan hipotesa dari keputusan=tidak Day Cuaca Temperatur Kecepatan Angin Berolah-raga D3 Hujan Tinggi Pelan Tidak D5 Hujan Tinggi Kencang Tidak 1 2 Hipotesa awal disamakan dengan data pertama (D3): H(Hujan, Tinggi, Pelan) = Tidak Data kelima, ada perubahan di kec.angin H(Cerah, Normal, *) = Tidak

Hasil Find-S Day Cuaca Temperatur Kecepatan Angin Berolah-raga D1 Cerah Normal Pelan Ya D2 Cerah Normal Pelan Ya D3 Hujan Tinggi Pelan Tidak D4 Cerah Normal Kencang Ya D5 Hujan Tinggi Kencang Tidak D6 Cerah Normal Pelan Ya Hasil Find-S adalah: H(Cerah, Normal, *) = Ya H(Hujan, Tinggi, *) = Tidak

Contoh Keputusan Dari Hipotesa Bila cuaca cerah, apakah akan berolahraga? HIPOTESA H(Cerah, Normal, *) = Ya H(Hujan, Tinggi, *) = Tidak CEK JAWAB : YA

Proses Dilakukan Untuk Setiap Instance for n=1:ninstance % Menyeleksi data sesuai instance ke-i nh=0; for i=1:ndata if strcmp(dttraining{i,nattribut},instance{n})==1 nh=nh+1; datah(nh,:)=dttraining(i,:); end end % Proses Find-S untuk menentukan hipotesa % dari keputusan ke-i end

Proses Find-S % Hipotesa awal diambil dari data pertama dari data terseleksi hipotesis(n,:)=datah(1,2:nattribut-1); % Proses pembentukan hipotesa berdasarkan semua % data terseleksi for i=2:nh for j=2:nattribut-1 % Penentuan apakah ada instance yang berbeda % pada attribut yang sama % Bila ada maka hipotesa dijadikan * % Proses ini hanya dilakukan untuk hipotesa bukan * if strcmp(hipotesis(n,j-1),'*')==0 if strcmp(hipotesis{n,j-1},datah{i,j})==0 hipotesis{n,j-1}='*'; end end end end

Algoritma Berikutnya BAGAIMANA BILA DATA TIDAK KONSISTEN DAN BIAS? METODE BAYES ALGORITMA GENETIKA JARINGAN SYARAF TIRUAN