Analisis Diskriminan

dokumen-dokumen yang mirip
aljabar geo g metr me i

BAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN

PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA. Tatik Widiharih Jurusan Matematika FMIPA UNDIP

Minggu II STATISTIKA MULTIVARIATE TERAPAN

HASIL DAN PEMBAHASAN. dengan hipotesis nolnya adalah antar peubah saling bebas. Statistik ujinya dihitung dengan persamaan berikut:

ANALISIS KORELASI KANONIK PERILAKU BELAJAR TERHADAP PRESTASI BELAJAR SISWA SMP (STUDI KASUS SISWA SMPN I SUKASARI PURWAKARTA)

MATERI DAN METODE. Tabel 2. Jumlah Kuda yang Diamati Berdasarkan Lokasi dan Jenis Kelamin

BAB. IX ANALISIS REGRESI FAKTOR (REGRESSION FACTOR ANALYSIS)

JURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN :

VI. ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI USAHA PEMBESARAN LELE DUMBO DI CV JUMBO BINTANG LESTARI

BAB III METODE PENELITIAN

II. TINJAUAN PUSTAKA 2.1 Analisis Korelasi Kanonik

: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M.

ANALISIS DISKRIMINAN FISHER POPULASI GANDA UNTUK KLASIFIKASI NASABAH KREDIT

PENDUGA PENCILAN BOGOR 2013

Canonical Correlation. I Made Sumertajaya

MODEL MODEL LEBIH RUMIT

Aplikasi Model Black Litterman dengan Pendekatan Bayes (Studi kasus : portofolio dengan 4 saham dari S&P500) 1. Retno Subekti 2

BAB II TINJAUAN PUSTAKA. konsep-konsep dasar pada QUEST dan CHAID, algoritma QUEST, algoritma

BAB 1 PENDAHULUAN. 1.1 Latar belakang

TINJAUAN PUSTAKA. bebas digunakan jarak euclidean - sedangkan bila terdapat. korelasi antar peubah digunakan jarak mahalanobis - -

PENDAHULUAN. Latar Belakang. Tujuan Penelitian

MATERI DAN METODE. Gambar 2. Ayam Kampung Jantan (a) dan Ayam Kampung Betina (b) dari Daerah Ciamis

HASIL DAN PEMBAHASAN

BAB III KALMAN FILTER DISKRIT. Kalman Filter adalah rangkaian teknik perhitungan matematika (algoritma)

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan

Oleh: Agus Mohamad Soleh. Departemen Statistika FMIPA IPB. Abstrak

Analisis Regresi: Regresi Linear Berganda

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Lampiran 1. Perhitungan Manual Uji T 2 Hotelling Berbagai Ukuran Tubuh pada Kuda Delman Jantan Manado vs Tomohon. Rumus: T 2 = X X S X X

Oleh : Fuji Rahayu W ( )

Analisis Regresi 1. Pokok Bahasan Pengujian pada Regresi Ganda

Bab 2 LANDASAN TEORI

Penerapan Garis Berat Segitiga Centroid untuk Menentukan Kelompok pada Analisis Diskriminan

menggunakan analisis regresi dengan metode kuadrat terkecil. Model analisis data panel yang dievaluasi kemudian adalah model gabungan, model

BAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal

Forum Statistika dan Komputasi, Oktober 2009 p : ISSN :

ANALISIS DISKRIMINAN PADA KLASIFIKASI DESA DI KABUPATEN TABANAN MENGGUNAKAN METODE K-FOLD CROSS VALIDATION

BAB 2 LANDASAN TEORI. bebas X yang dihubungkan dengan satu peubah tak bebas Y.

PENDAHULUAN TINJAUAN PUSTAKA

TINJAUAN PUSTAKA Analisis Biplot Biasa

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BAB 4 HASIL DAN PEMBAHASAN. Pada bab ini dijelaskan dan disajikan tentang RSUP Fatmawati Jakarta secara

BAB II LANDASAN TEORI

Minimum Variance Unbiased Estimator (MVUE) K-Fold Cross Validation

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 4, Tahun 2015, Halaman Online di:

Analisis Regresi 2. Pokok Bahasan : Review Regresi Linier Sederhana dan Berganda

TINJAUAN PUSTAKA Analisis Gerombol

BAB II LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

VI. PEMBAHASAN. dengan metode kemungkinan maksimum, tetapi terhadap

SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE :

Analisis Regresi 2. Pokok Bahasan : Asumsi sisaan dan penanganannya

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

, dengan. Karakteristik dari vektor peubah acak X dan Y sebagai berikut:

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

Algoritme Least Angle Regression untuk Model Geographically Weighted Least Absolute Shrinkage and Selection Operator

Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil

PEMODELAN KINERJA LEMBAGA PERANGKAT DAERAH

TINJAUAN PUSTAKA Perilaku Pemilih Partai Politik

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol

(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN

BAB V HASIL DAN PEMBAHASAN

ANALISIS DISKRIMINAN KUADRATIK PADA PENJURUSAN MADRASAH ALIYAH NEGERI (MAN) 1 JEMBER SKRIPSI. Oleh. Puphus Inda Wati NIM

BAB 2 LANDASAN TEORI

Syarat Fritz John pada Masalah Optimasi Berkendala Ketaksamaan. Caturiyati 1 Himmawati Puji Lestari 2. Abstrak

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

6. PENGGUNAAN REGRESI SPLINES ADAPTIF BERGANDA UNTUK STATISTICAL DOWNSCALING LUARAN GCM

Analisis Komponen Utama (Principal component analysis)

TINJAUAN PUSTAKA. i dari yang terkecil ke yang terbesar. Tebaran titik-titik yang membentuk garis lurus menunjukkan kesesuaian pola

BAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA. Analisis komponen utama adalah metode statistika multivariat yang

PROSIDING SEMINAR NASIONAL STATISTIKA UNIVERSITAS DIPONEGORO 2013 ISBN:

ANALISIS FAKTOR (FACTOR ANALYSIS)

BAB 2 LANDASAN TEORI

Analisis Peubah Ganda

BAB 2 LANDASAN TEORI. teknik yang umum digunakan untuk menganalisis. hubungan antara dua atau lebih variabel adalah analisis regresi.

REGRESI LINIER GANDA. Fitriani Agustina, Math, UPI

BAB I PENDAHULUAN Latar Belakang Masalah

BAB 1 PENDAHULUAN. memperoleh solusi yang optimal (Eddy Herjanto, 2007: 43). kendala dan fungsi tujuan yang digunakan untuk mendiskripsikan

BAB 2 LANDASAN TEORI Pengertian Data Deret Berkala

BAB III EXTENDED KALMAN FILTER DISKRIT. Extended Kalman Filter adalah perluasan dari Kalman Filter. Extended

PORTFOLIO EFISIEN & OPTIMAL

Perbandingan Analisis Diskriminan dan Analisis Regresi Logistik Ordinal dalam Prediksi Klasifikasi Kondisi Kesehatan Bank

MODEL-MODEL LEBIH RUMIT

STK 511 Analisis statistika. Materi 7 Analisis Korelasi dan Regresi

ANALISIS DISKRIMINAN LINEAR MENGGUNAKAN LIKELIHOOD RATIO TEST. (Skripsi) Oleh. Meri Handayani

III RELAKSASI LAGRANGE

PENERAPAN ANALISIS FAKTOR DAN ANALISIS DISKRIMINAN UNTUK MENENTUKAN KUALITAS PRODUK SUSU BALITA DENGAN GRAFIK KENDALI Z-MR

TINJAUAN PUSTAKA. Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan

BAB II TINJAUAN PUSTAKA

(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN. melalui pos. Ada beberapa keuntungan yang dapat diperoleh, diantaranya

MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO

Resume Regresi Linear dan Korelasi

Transkripsi:

Analisis Diskriminan

Tujuan Utama Memperoleh fungsi diskriminan, yaitu fungsi yang mampu digunakan membedakan suatu objek masuk ke dalam populasi tertentu berdasarkan pengamatan terhadap objek tersebut

Contoh Fungsi Diskriminan Dengan melihat gejala-gejala yang nampak pada seseorang, dokter bisa menduga penyakit apa yang diderita orang tersebut. Dengan melihat warna, merasakan, dan menghirup asap rokok, penilai bisa mengetahui kelas kualitas tembakau. Dengan mengetahui berbagai indikator yang berupa variabel derivatif keuangan sebuah bank, kita bisa menilai kesehatan bank tersebut.

Fungsi Diskriminan Merupakan kombinasi dari beberapa peubah, satu peubah saja umumnya tidak mencukupi Dari banyak peubah, menggunakan fungsi diskriminan diperoleh sebuah indeks Berdasarkan kriteria tertentu, dengan indeks ini kita mengklasifikasikan objek

Fungsi Diskriminan Tidak selalu (bahkan jarang) diperoleh fungsi diskriminan dengan tingkat ketepatan yang sempurna Fungsi Diskriminan memiliki ukuran yang menggambarkan tingkat ketepatan

Fungsi Diskriminan X mampu menjadi pembeda, tetapi Y tidak Y mampu menjadi pembeda, tetapi X tidak

Fungsi Diskriminan X dan Y saja tidak mampu menjadi pembeda, tetapi kombinasi linearnya bisa Membutuhkan fungsi nonlinear dari X dan Y untuk bisa membedakan

Pendekatan Fisher Hanya untuk 2 populasi pendekatan Fisher bisa dituliskan sebagai berikut: Cari a sehingga jarak antara E(a x) = a 1 di 1 dengan E(a x) = a 2 di 2 maksimum, atau memaksimumkan a 1 a 2 dengan kendala a a = 1.

Pendekatan Fisher a = -1 ( 1-2 ) dan kita akan mengelompokkan x ke 1 jika a x h, dan kebalikannya kita masukkan x ke dalam 2, dengan h = a ( 1 + 2 ) / 2. Dengan kata lain, x akan dimasukkan ke populasi yang paling dekat dengannya.

Pendekatan Fisher -- ILUSTRASI Dalam rangka mengatur penangkapan ikan salmon, sangat diinginkan bisa mengidentifikasi apakah ikan yang tertangkap berasal dari Alaska atau Kanada. Lima puluh ikan diambil dari setiap tempat, dan pertumbuhan diameternya diukur ketika ikanikan itu hidup di air tawar dan ketika hidup di air laut. Tujuannya adalah untuk mengetahui apakah ikan yang tertangkap di kemudian hari berasal dari Alaska atau dari Kanada (Minitab, Inc).

Pendekatan Fisher -- ILUSTRASI

Pendekatan Fisher -- ILUSTRASI Dengan demikian, jika kita memiliki suatu pengamatan baru x = (x 1, x 2 ) maka kita akan memasukkannya ke populasi 1 (ikan dari Alaska) jika -0.0521 x 1 + 0.0137 x 2-0.5657 dan jika sebaliknya maka kita masukkan ke populasi ke-2. Sebagai teladan, jika diperoleh sebuah ikan dengan nilai pengamatan x = (103, 405), maka nilai a x = -0.0521 (103) + 0.0137 (405) = 10.918, dan kita masukkan ke dalam populasi 1

Pendekatan Fisher -- ILUSTRASI

Pendekatan Fisher -- ILUSTRASI Cara lain untuk melakukan klasifikasi adalah menggunakan konsep jarak terhadap vektor rataan populasi yang paling dekat. Artinya jika ada suatu pengamatan baru x = (x 1, x 2 ), maka pengamatan atau objek baru ini akan kita masukkan ke dalam populasi ke-1 ( 1 ) hanya jika jarak x terhadap vektor rataan populasi ke-1 lebih dekat daripada jarak x terhadap vektor rataan populasi ke-2. Jarak antara x terhadap vektor rataan diperoleh menggunakan formula mahalanobis, yaitu:

Pendekatan Fisher -- ILUSTRASI Misalkan untuk pengamatan x = (103, 405) seperti pada ilustrasi sebelumnya d 1 (x) = 0.5421 d 2 (x) = 1.3322 sehingga karena d 1 (x) < d 2 (x) maka x diklasifikasikan berasal dari populasi 1 (ikan dari Alaska).

Pendekatan Fisher -- ILUSTRASI Pendekatan lain yang juga dapat digunakan adalah menggunakan peluang posterior. Suatu pengamatan x = (x 1, x 2 ) akan diklasifikasikan ke dalam populasi 1 hanya jika peluang posteiornya lebih besar dari pada peluang posterior masuk ke 2, dan sebaliknya. Peluang posterior masuk ke dalam j adalah P(j x) = e 1 d 2 2 1 e 1 d 2 ( x) 2 j ( x) e 1 d 2 2 2 ( x)

Pendekatan Fisher -- ILUSTRASI Kembali pada x ilustrasi di atas dihasilkan P(1 x) = 0.677 dan P(2 x) = 0.323. Sehingga karena P(1 x) > P(2 x) maka x sekali lagi diklasifikasikan berasal dari Alaska.

Analisis Diskriminan untuk k Populasi yang Menyebar Normal Ada konsep sebaran prior Seringkali juga perlu mempertimbangkan biaya salah klasifikasi Mencari fungsi yang meminimumkan expected cost of missclassification k t 1 t k s 1 P( s t) c( s t)

Analisis Diskriminan Linear Asumsi : multivariate normal dengan matriks ragam-peragam sama di setiap populasi Asumsi : Biaya salah klasifikasi sama besar di setiap populasi

Analisis Diskriminan Linear aturan yang paling sederhana pada klasifikasi bisa dinyatakan dalam fungsi kuadrat jarak yaitu d t (x) = (x - t ) -1 (x - t ) 2 ln( t ) Suatu objek x diklasifikasikan kepada populasi yang terdekat, yang dihitung menggunakan formula di atas. Atau, x akan diklasifikasikan berasal dari populasi ke-t jika 2 d t2 (x) = min d ( x) j 1,..., k j

Analisis Diskriminan Linear Seperti halnya pada bagian terdahulu, mengklasifikasikan objek pengamatan ke populasi yang terdekat setara dengan mengklasifikasikan objek ke populasi dengan peluang posterior yang paling besar. Pada kasus k buah populasi, peluang tersebut besarnya diperoleh dari P(t x) = k e j 1 1 d 2 e 2 t 1 d 2 ( x) 2 j ( x) t = 1, 2,, k

Menduga Tingkat Salah Klasifikasi Error Rate, dugaan tingkat kesalahan di populasi ke-s adalah ER ˆ ( s) k t 1, t s P( t s)

Menduga Tingkat Salah Klasifikasi Pendugaan Tingkat Kesalahan dengan Validasi Silang jika ada n objek pengamatan, maka hanya (n 1) pengamatan yang digunakan sebagai gugus data pembentukan fungsi diskriminan satu pengamatan sisanya digunakan untuk evaluasi proses di atas diulang sebanyak n kali, satu kali untuk setiap data yang disisihkan proporsi kesalahan adalah dugaan tingkat kesalahan

Menduga Tingkat Salah Klasifikasi posterior probability error rate Simple PPER Stratified PPER

Analisis Diskriminan Kuadratik Multivariate normal namun matriks ragamperagamnya tidak sama

Penyeleksian Peubah pada Analisis Diskriminan Dimulai dengan memilih satu peubah yang paling penting, dan dilanjutkan dengan pemilihan peubah penting lain satu demi satu menggunakan suatu kriteria tertentu. Salah satu kriterianya adalah dengan menentukan taraf nyata tertentu sebagai batas. Kriteria lain adalah dengan menganggap peubah yang sudah terpilih bersifat tetap, dan menghitung korelasi parsial peubah yang akan dipilih, serta sebelumnya sudah ditentukan batasan besaran korelasi parsial yang bisa diterima. Proses ini akan berhenti jika tidak ada lagi peubah yang memenuhi kriteria yang telah ditentukan. Prosedur yang seperti ini dikenal sebagai prosedur forward selection.

Penyeleksian Peubah pada Analisis Diskriminan Dimulai dengan model penuh, yaitu memuat semua peubah. Di setiap tahap dilakukan pembauangan peubah yang paling tidak penting satu demi satu dengan kriteria yang sama dengan prosedur forward. Proses diteruskan hingga tidak ada lagi peubah yang dikeluarkan. Prosedur ini dikenal sebagai prosedur backward selection.

Penyeleksian Peubah pada Analisis Diskriminan Kombinasi antara kedua prosedur di atas, dikenal sebagai stepwise selection. Di setiap tahap dimungkinkan ada peuabh yang masuk sekaligus ada peubah yang dikeluarkan, berdasarkan kriteria tertentu yang ditetapkan pada awal proses.

Terima Kasih atas perhatiannya