Pengenalan Pola Ekstraksi dan Seleksi Fitr PTIIK - 4
Corse Contents Collet Data Objet to Dataset 3 Ekstraksi Fitr 4 Seleksi Fitr
Design Cyle Collet data Choose featres Choose model Train system Evalate system Apa sensor yang hars kita gnakan? Bagaimana mengmplkan data? Bagaimana mengetahi fitr apa yang dipilih, dan bagaimana kita memilihnya...? (Misal transformasi data fitr dengan PCA) Apa lassifier yang akan dignakan? Apakah ada lassifier yang terbaik...? Bagaimana kita melakkan proses Training? Bagaimana mengevalasi kinerja sistem? Bagaimana memvalidasi hasil? Berapakah tingkat keperayaan hasil keptsan?
Collet Data Mengambil nilai data dari objek, Tipe data berdasarkan penskalaan datanya : Data Kalitatif : Data yang bkan berpa angka,. Terbagi da : Nominal : Data yang paling rendah dalam level pengkran data. Contoh : Jenis kelamin, Merk mobil, Nama tempat Ordinal : Ada tingkatan data. Contoh : Sangat setj, Setj, krang setj, tidak setj. Data Kantitatif : Data berpa angka dalam arti sebenarnya. Terbagi da : Data Interval, Contoh : Interval temperatr rang adalah sbb : Ckp panas jika antara 5C-8 C, Panas jika antara 8 C- C, Sangat panas jika antara C-4 C. Data Rasio, Tingkat pengkran paling tinggi ; bersifat angka dalam arti sesngghnya. Contoh : Tinggi badan, Berat badan, Usia.
Objet to Dataset Ilstrasi transformasi data dari objek yang diamati : Keterangan : M menyatakan banyak data, N menyatakan banyak fitr. Ektraksi fitr dilakkan jika data yang diamati masih berpa data mentah (masih berpa kmplan itra). Fitr yang diambil adalah yang merpakan iri khas yang membedakan sat objek dengan objek lainnya.
Seleksi Fitr Problem : kompleksitas komptasi terhadap pengenalan pola pada rang dimensi yang tinggi. Solsi : mapping data ke dalam rang dimensi yang lebih rendah
Seleksi Fitr Pengrangan dimensi data dapat dilakkan dengan : Mengkombinasikan Fitr (seara linear mapn nonlinear) Memilih himpnan bagian dari fitr-fitr yang tersedia Kombinasi Linier merpakan pendekatan yang menarik karena metode tersebt dilakkan dengan perhitngan yang sederhana dan terlaak seara analitis
Seleksi Fitr Diberikan x ϵ R N, dengan tjan ntk menari transformasi linier U sehingga y = U T x ϵ R K where K<N
Seleksi Fitr Da pendekatan klasik ntk menghitng transformasi linier yang optimal : Prinipal Components Analysis (PCA): menari proyeksi yang menyediakan informasi sebanyak mngkin dalam data dengan pendekatan leastsqares. Linear Disriminant Analysis (LDA): menari proyeksi terbaik yang dapat memisahkan data dengan pendekatan least-sqares. Tjan PCA : mengrangi dimensi data dengan mempertahankan sebanyak mngkin informasi dari dataset yang asli
Seleksi fitr menggnakan PCA PCA memproyeksikan data sepanjang sat arah dimana data tersebt memiliki varians yang tinggi Arah tersebt ditentkan oleh eigenvetors dari matriks ovariane yang memiliki nilai eigenvales terbesar. Nilai besaran dari eigenvales merpakan nilai varians data sepanjang arah dari eigenvetor (garis lrs merah dan bir)
Seleksi Fitr Pendekatan vektor dengan menemkan basis ke dalam rang dimensi yang lebih rendah Representasi rang Dimensi-Lebih Tinggi : x a v a v... a v N N v, v,..., v N merpakan basis dari rang dimensi N Represenasi rang Dimensi-Lebih Rendah : ˆ x b b... b K K,,..., K merpakan basis dari rang dimensi K
Seleksi fitr menggnakan PCA Pengrangan dimensi berdampak pada hilangnya informasi PCA mempertahankan sebanyak mngkin informasi, dengan ara meminimalkan error : Bagaimana aranya menentkan sb-rang dimensi yang lebih rendah yang terbaik? Eigenvektor yang terbaik dari matriks ovarians x Eigenvale yang terbesar Disebt sebagai Prinipal Components
Seleksi fitr menggnakan PCA Misalkan x, x,..., x M terdapat dalam vektor N x. Menari Mean (nilai rata-rata) dari data. Menghitng Zero Mean (setiap nilai pada data sampel dikrangi nilai rata-rata tiap fitr yang terkait) 3. Membangn matriks Covarians dengan mengkalikan matriks Zero Mean dengan transposenya 4. Menghitng eigenvale 5. Menghitng matriks eigenvektor 6. Mengrangi dimensi sebesar K dimensi yang didapatkan dari eigenvale yang terbesar pertama
Seleksi fitr menggnakan PCA Langkah : Menari Mean Global (nilai rata-rata) x x x... M Langkah : Menghitng Zero Mean x M M i M x i i x i x
Seleksi fitr menggnakan PCA Langkah 3: Membangn matriks Covarians dengan mengkalikan matriks Zero Mean dengan transposenya Poplasi Sampel M i i T i M C M i i T i M C
Seleksi fitr menggnakan PCA Langkah 4 : Menghitng eigenvale dari C CU U det( I C) I CU I U CU I U ( I C) U Hasil :,,...,, 3 N
Seleksi fitr menggnakan PCA Langkah 5 : Menghitng eigenvektor Dari eigenvale yang dihitng pada langkah 4, disbstitsikan ke rms : ( I C) U Selesaikan dengan menemkan nilai U Hasil :,,...,, 3 N
Seleksi fitr menggnakan PCA Langkah 6 : Mengrangi dimensi sebesar K dimensi Pilihlah fitr sebanyak K berdasarkan nilai eigenvale terbesar xˆ merpakan hasil transformasi dari x
Seleksi fitr menggnakan PCA Pemilihan nilai K menggnakan kriteria berikt : Pada ontoh kass diatas, dapat dikatakan bahwa kita menyediakan 9% ata 95% informasi dari data yang tersedia Jika K=N, maka kita menyediakan % dari data yang tersedia
Seleksi fitr menggnakan PCA Vektor asal x dapat dibangn kembali menggnakan komponen prisipal-nya PCA meminimalkan error dari rekonstrksi prinsipal tersebt: Hal it dapat ditnjkkan bahwa error sama dengan :
Contoh PCA : Menghitng EigenVale Misal diketahi dataset : Mean global Zero Mean x 5 4 7 5 3 3 7 9 3 Kovarian C x P 4 N No Fitr Fitr Kelas P P Mobil P P Rmah P Banyak T P _ Data x x P x P x D, misal x x P x x D = P P P Banyak P _ 4 P P Data 5 3 9
EigenVale det C I 34 46 69 493 7 9 69 9) 7( 9 69 9) ( 7 3 3* 9) ( 7 9 3 3 7 det 9 3 3 7 * det 37.378 8.63564 46 8.688 8.63564 46 8 46 96 6 46 * 4**34 46 46) ( 4,,,, a a b b 9 3 3 7 det 9 3 3 7 * det 37.378 8.688 Matrik EigenVale
EigenVektor 37.378 8.688 Matrik EigenVale CU U ) ( ) ( Vektor eigen didapatkan dengan persamaan : ) (9 3 3 ) (7 9 3 3 7 C Matrik kovarian : Untk λ = 8.688 maka :.378 3 3 8.378
EigenVektor Untk λ = 8.688 maka : 8.378 3 3.378 Solsi non trivial sistem persamaan ini adalah : 8.378 3 Misalkan 3 8.378 a maka 8.378a 3 Jadi vektor eigen ntk λ = 8.688 adalah : a U 8.378a 3 dimana a adalah bilangan sembarang yang tidak nol. Untk λ = 37.378 maka : -.378 3 3-8.378 Solsi non trivial sistem persamaan ini adalah :.378 3 Misalkan 3.378 b maka 3b. 378 Jadi vektor eigen ntk λ = 37.378 adalah : 3b U. 378 b dimana b adalah bilangan sembarang yang tidak nol.
EigenVektor Vektor eigen ntk λ = 8.688 adalah : a U 8.378a 3 misalkan a = -.843 maka Jadi Vektor eigen globalnya adalah : U -.843.5389.5389.843 U -.843.5389 Vektor eigen ntk λ = 37.378 adalah : 3b U. 378 b misalkan b =.843 maka. U.5389.843
Evalasi Error dan Penentan Jmlah K Transformasi data, fitr x x ˆ k U k x xˆ Tentkan nilai K dengan 9% informasi data yang kita gnakan Dari nilai K yang ditentkan akan diperoleh fitr yang dijadikan sebagai proses pengenalan pola
Disksi Tentkan hasil transformasi dataset berikt! No Fitr Fitr Fitr 3 Kelas 8 3 4 Apel 4 9 Jerk
Latihan Tentkan hasil transformasi dataset berikt dengan Threshold = 95% ntk nilai K! No Fitr Fitr Fitr 3 Kelas 7 Padi 6 5 4 Jagng 3 3 6 Gandm 4 8 Kedelai
Ketentan Bar Bagi kelompok yang datasetnya banyak yang kalitatif silakan ganti dataset Bagi kelompok yang fitrnya melebihi maka hilangkan fitr yang lain dan jadikan hanya fitr saja ata ari dataset yang memiliki fitr maksimal fitr Bagi kelompok yang datanya melebihi maka ambil data saja, dengan atatan jmlah data di setiap kelas hars seimbang
Tgas Lakkan perhitngan PCA terhadap data yang telah dikmplkan pada tgas sebelmnya
afif.spianto@b.a.id 8 33 834 734 / 88 6 7 4