Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November

dokumen-dokumen yang mirip
FAKTOR-FAKTOR YANG MEMPENGARUHI PENJURUSAN SISWA MELALUI ANALISIS DISKRIMINAN. Nerli Khairani Lia Anggriani Siregar. Abstrak

PERBANDINGAN ANALISIS DISKRIMINAN LINIER, DISKRIMINAN LINIER ROBUST

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

Volume I No. 1, Februari 2016 ISSN

PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA

SKRIPSI. Disusun Oleh: Ana Kartikawati NIM. J2E009024

BAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD)

Metode Minimum Covariance Determinan Pada Analisis Regresi Linier Berganda Dengan Kasus Pencilan

HASIL DAN PEMBAHASAN

SKRIPSI. Oleh : LAILI ISNA NUR KHIQMAH NIM :

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

JURNAL MATEMATIKA DAN PEMBELAJARANNYA 2016 VOLUME 2, NO. 1. ISSN

BAB I PENDAHULUAN. Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini

DEPARTEMEN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SUMATERA UTARA MEDAN

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Pada Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah

Azzakiy Fiddarain ABSTRACT

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 1, Tahun 2014, Halaman 1-10 Online di:

Klasifikasi Kecamatan Berdasarkan Nilai Akhir SMA/MA di Kabupaten Aceh Selatan Menggunakan Analisis Diskriminan

ANALISIS DISKRIMINAN PADA KLASIFIKASI DESA DI KABUPATEN TABANAN MENGGUNAKAN METODE K-FOLD CROSS VALIDATION

FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS)

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. belajar kimia SMA Negeri 1 Jogonalan Kabupaten Klaten.

PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA

Sarimah. ABSTRACT

SKRIPSI ERLINDA SIREGAR

BAB 2 LANDASAN TEORI

Model Regresi Multivariat untuk Menentukan Tingkat Kesejahteraan Kabupaten dan Kota di Jawa Timur

IDENTIFIKASI VARIABEL DOMINAN YANG BERPENGARUH TERHADAPINDEKS PEMBANGUNAN GENDER

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. Sekolah Menengah Atas (disingkat SMA), adalah jenjang pendidikan

PERBANDINGAN METODE COEFFICIENT OF DETERMINATION RATIO DAN REGRESI DIAGNOSTIK DALAM MENDETEKSI OUTLIER PADA ANALISIS REGRESI LINIER BERGANDA

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

BAB 2 LANDASAN TEORI

KAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN

ANALISIS DISKRIMINAN KUADRATIK PADA PENJURUSAN MADRASAH ALIYAH NEGERI (MAN) 1 JEMBER SKRIPSI. Oleh. Puphus Inda Wati NIM

BAB IV STUDI KASUS. Indeks merupakan daftar harga sekarang dibandingkan dengan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI. 1. Analisis regresi linier sederhana 2. Analisis regresi linier berganda. Universitas Sumatera Utara

ANALISIS DISKRIMINAN FISHER POPULASI GANDA UNTUK KLASIFIKASI NASABAH KREDIT

(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN

MODUL 5 ANALISIS DISKRIMINAN

aljabar geo g metr me i

ANALISIS KORELASI KANONIK PERILAKU BELAJAR TERHADAP PRESTASI BELAJAR SISWA SMP (STUDI KASUS SISWA SMPN I SUKASARI PURWAKARTA)

Forum Statistika dan Komputasi, Oktober 2009 p : ISSN :

Perbandingan Analisis Diskriminan dan Analisis Regresi Logistik Ordinal dalam Prediksi Klasifikasi Kondisi Kesehatan Bank

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan

Analisis Diskriminan

BAB 2 LANDASAN TEORI

KAJIAN TERHADAP TINGKAT PEMERATAAN PENDIDIKAN MENGGUNAKAN ANALISIS BIPLOT KLASIK DAN BIPLOT KEKAR

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. Minat dan Pengetahuan Dasar Pemesinan serta satu variabel terikat

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST UNTUK DATA INFLASI KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

PENDUGA PENCILAN BOGOR 2013

: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M.

MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO

X 3 : Flow Top (Aliran Atas) (lt/min) X 4 : Speed (Kecepatan) (m/min)

BAB IV HASIL DAN PEMBAHASAN

PENGKAJIAN PEMBENTUKAN MODEL KLASIFIKASI DALAM PENGELOMPOKKAN JURUSAN SISWA DI SMA

Oleh : Arief Yudissanta ( ) Pembimbing : Prof. Susanti Linuwih Mstat.PHD

BAB IV HASIL ANALISA DAN PEMBAHASAN

SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE :

Statistika Industri II TIP - FTP UB

PERBANDINGAN TINGKAT EFISIENSI ANTARA METODE KUADRAT TERKECIL DENGAN METODE MINIMUM COVARIANCE DETERMINANT

(R.2) KAJIAN PREDIKSI KLASIFIKASI OBYEK PADA VARIABEL RESPON BINER

BAB II KAJIAN PUSTAKA. dicatat, atau diobservasi sepanjang waktu secara berurutan. Periode waktu dapat

BAB III METODE PENELITIAN. Jenis penelitian ini adalah kuantitatif. Penelitian kuantitatif merupakan

BAB III ANALISIS DAN INTERPRETASI HASIL PENELITIAN. Sebelum melakukan penelitian sebaiknya dilakukan pengujian terlebih dahulu

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

REGRESI LOGISTIK (LOGISTIC REGRESSION)

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

PEMODELAN KINERJA LEMBAGA PERANGKAT DAERAH

Judul : Perbandingan Metode MCD Bootstrap dan. Analisis Regresi Linear Berganda. Pembimbing : 1. Dra. Ni Luh Putu Suciptawati,M.Si

Bab 1 PENDAHULUAN. 1.1 Latar Belakang

BAB III CONTOH KASUS. Pada bab ini akan dibahas penerapan metode robust dengan penaksir M

PENERAPAN ANALISIS FAKTOR DAN ANALISIS DISKRIMINAN UNTUK MENENTUKAN KUALITAS PRODUK SUSU BALITA DENGAN GRAFIK KENDALI Z-MR

BAB I PENDAHULUAN. dependen disebut dengan regresi linear sederhana, sedangkan model regresi linear

BAB 2 LANDASAN TEORI

DISKRIMINAN LINIER UNTUK KLASIFIKASI PERUSAHAAN MANIPULATOR DAN NON-MANIPULATOR. (Studi Kasus Di Bursa Efek Indonesia Tahun 2013)

BAB IV ANALISA DAN PEMBAHASAN

TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

ISSN: JURNAL GAUSSIAN, Volume 5, Nomor 1, Tahun 2016, Halaman 1-10 Online di:

PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB)

APLIKASI ANALISIS DISKRIMINAN UNTUK MENENTUKAN FUNGSI PENGELOMPOKAN PADA PROGRAM PEMBAGIAN KARTU KELUARGA SEJAHTERA (KKS)

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

Uji statistik multivariat digunakan untuk menguji

HASIL DAN PEMBAHASAN. dengan hipotesis nolnya adalah antar peubah saling bebas. Statistik ujinya dihitung dengan persamaan berikut:

BAB II TINJAUAN PUSTAKA. 2.1 Perbandingan antara Regresi Logistik dengan Analisis Diskriminan

Kata Kunci: Model Regresi Logistik Biner, metode Maximum Likelihood, Demam Berdarah Dengue

BAB III METODE PENELITIAN. Permintaan Beras di Kabupaten Kudus. Faktor-Faktor Permintaan Beras. Analisis Permintaan Beras

III. METODE PENELITIAN. bulan Januari tahun 2015 di SMA Negeri 1 Terbanggi Besar. Penelitian. dilakukan selama 5 minggu pembelajaran (5X pertemuan).

B. Lokasi dan Waktu Penelitian Penelitian ini dilaksanakan di SMA N 1 Kaliwungu yang beralamat di Kecamatan Kaliwungu Kabupaten Kendal pada

BAB IV HASIL DAN PEMBAHASAN. Pada bagian ini akan dijabarkan mengenai gambaran umum subjek, hasil

BAB II KAJIAN TEORI. Sebuah Matriks adalah susunan segi empat siku-siku dari bilangan-bilangan.

, dengan. Karakteristik dari vektor peubah acak X dan Y sebagai berikut:

Transkripsi:

Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014 192 Perbandingan Analisis Diskriminan Linier, Diskriminan Linier Robust dan Regresi Logistik Biner (Studi Kasus Pada Penjurusan Bidang IPA / IPS Siswa Tingkat SMA Negeri 1 Bangorejo Banyuwangi) Marino 1, I Made Tirta 2, Yuliani Setia Dewi 3 1) Guru Matematika SMA Negeri 1 Bangorejo Banyuwangi, Dinas Pendidikan Banyuwnagi marinoyustari@yahoo.co.id 2 Staf Pengajar Jurusan Magister Matematika FMIPA Universitas Jember, 3 Staf Pengajar Jurusan Magister Matematika FMIPA Universitas Jember, Abstrak Penelitian ini membandingkan analisis diskriminan linier, diskriminan linier robust dan regresi logistik biner untuk mengelompokan siswa SMA Negeri 1 Bangorejo kedalam kelompok IPA/IPS. Data yang digunakan adalah data nilai raport dan psikotes siswa kelas X semester 2 tahun pelajaran 2012-2013 SMAN 1 Bangorejo Banyuwangi. Data yang digunakan merupakan data terkontaminasi outlier sebesar 6,70%. Untuk mengetahui performa terhadap keberadaan outlier, maka dilakukan simulasi secara berulang-ulang mengaplikasikan analisis diskriminan linier, diskriminan linier robust dan regresi logistik biner dengan besar sampel bervariasi yaitu n 1 =4 n 2 =8 n 3 =120 dan n 4 =120 responden dan besar outlier yang bervariasi yaitu 5%, 10%, 15% dan 20%. Dari hasil simulasi ditunjukkan bahwa regresi logisltik biner mempunyai ketepatan klasifikasi yang paling baik. Pengelompokan IPA atau IPS di SMA N. 1 Bangorejo dengan jumlah sampel keseluruhan (224 responden), dengan menggunakan analisis logistik biner mempunyai ketepatan klasifikasi sebesar 85,714%. Kata Kunci: outlier, diskriminan linier, diskriminan linier robust, regresi logistik. Abstract This research is compare linear discriminant analysis, robust linear discriminant and biner logistic regression to classify the students of SMA N 1 Bangorejo into social/ science group. Data used is the data from report book scores and phsycotest of the tenth grade students at the second semester in education year 2012-2013 of SMA N 1 Bangorejo Banyuwangi, the data used contains outlier 6.70%. To know the performance to the outliers, then done many times the simulation is estimated using linear discriminant analysis, robust linear discriminant and biner logistic regression. Sample used are n 1 =4 n 2 =8 n 3 =80 and n 4 =120 respondents and outlier are varied from 5%, 10%, 15% and 20%. From the simulation shows that the biner logistic regression has the best classification accuracy. The classification to science or social at SMA N 1 Bangorejo with the whole samples (224 respondents), using logistic biner analysis has the classification accuracy 85,714%. 1 Pendahuluan Sesuai kurikulum yang berlaku di seluruh Indonesia, maka siswa kelas X SMA yang naik ke kelas XI akan mengalami pemilihan jurusan/penjurusan. Penjurusan yang tersedia di SMA meliputi Ilmu Alam (IPA), Ilmu Sosial (IPS), dan Ilmu Bahasa. Dalam hal ini SMA Negeri 1 Bangorejo Banyuwangi hanya membuka dua jurusan yaitu

Marino, et. al. Perbandingan Analisis Diskriminan Linier... 193 Jurusan IPA dan Jurusan IPS, sehingga siswa dikelompokan dalam dua kelompok yaitu kelompok IPA atau IPS. Menurut Gudono [3], bahwa peneliti yang ingin meneliti bangkrut/tidak bangkrut atau macet/lancar bisa menggunakan analisis diskriminan atau regresi logistik, tetapi karena analisis diskriminan sangat dipengaruhi oleh pengamatan outlier sehingga penaksirnya menjadi kurang tepat pada saat data telah terkontaminasi oleh outlier [5]. Agar analisis diskriminan tetap optimal dalam pengklasifikasian menggunakan penaksir robust disebut sebagai analisis diskriminan robust [1]. Outlier pada data multivariat umumnya menggunakan ukuran jarak mahalanobis, pengamatandideteksi sebagai outlier jika jarak mahalanobisnya adalah: d MDi = (x i x ) T S 1 (x i x ) > 2 x p;α dalam hal ini dan adalah vektor rata-rata dan matriks kovariansi. Notasi adalah nilai distribusi khi kuadrat dengan parameter [4]. Outlier yang disebabkan oleh variabel independen, dinamakan outlier leverage. Outlier leverage dideteksi dengan menggunakan jarak robust (d RDi ) untuk setiap pengamatan ke-i, jarak robust didefinisikan pada persamaanberikut: dimanadanadalah vektor ratarata dan matriks kovarians dari sebagian data yang mempunyai determinan matriks kovariansinya terkecil. Pendeteksian outlier leverage menggunakan jarak robust (d RDi ) untuk setiap pengamatan ke-i dapat dituliskan sebagai berikut: d RDi = (x i x mcd) T S 1 mcd (x i x mcd ), dimana x MCD dan S 1 MCDadalah vektor rata-rata dan matriks kovarians dari sebagian data yang mempunyai determinan matriks kovariansinya terkecil. Pendeteksian outlier leverage menggunakan jarak robust (d RDi ) untuk setiap pengamatan ke-i dapat dituliskan sebagai berikut[8]: laverage=( jika d RDi C,maka pengamatan bukanoutlier(diberi kode 0) jikad RDi >C,maka pengamatanmerupakanoutlier(diberi kode 1)) dengan C = x 2 p:α, C dinyatakan sebagai nilai cut-off. Outlier berdasarkan diagnostic plot data pengamatan dibedakan menjadi empat tipe yaitu bad leverage, outlier orthogonal, pengamatan biasa dan good leverage. Bad leverage (terletak pada kuadran 1), merupakan suatu titik yang memiliki nilai jarak robust dan nilai jarak mahalanobis yang lebih besar dari nilai cut-off. Keberadaan titik bad leverage dapat merubah garis regresi sehingga dapat mempengaruhi hasil secara keseluruhan maka tindakan yang sebaiknya dilakukan adalah menghapus pengamatan [5]. 2 Tinjauan Pustaka 2.1 Analisis Diskriminan Linier Biasa Analisis diskriminan digunakan pada saat kondisi (1) sampel bisa dikelompokkan ke dalam dua atau lebih grup, (2) masing-masing grup tersebut memiliki fitur atau variabel yang bisa digunakan untuk meramal keanggotaan unit sampel ke dalam salah satu grup [3]. Asumsi Umum Analisis Diskriminan Linier yaitu (1) Berdistribusi normal multivarit, (2) matriks varians harus sama (equal variances) [4]. Rumus fungsi diskriminan untuk ini secara umum adalah: y = β 1 x 1 + β 2 x 2 + + β p x p1, = (x 1 x 2 )S 1 x Dimana: x 1 = rata rata kelompok 1 x 2 = rata rata kelompok 2

Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014 194 S 1 = invers kovarian gabungan 2.2 Analisis Diskriminan Linier Robust Konsep dasar analisis diskriminan linier robust yang menggunakan penaksir fast- MCD ialah dengan mengganti x dan S pada rumus jarak mahalanobis yaitu d MDi = (x i x ) T S 1 (x i x ) dengan x mcd dan S mcd yang merupakan vektor rata-rata dan matriks kovariansi dengan metode fast-mcd. Salah satu penaksir robust untuk vektor rata-rata dan matriks kovariansi adalah penaksir Minimum Covariance Determinant (MCD). Analisis diskriminan linier robust dengan menggunakan penaksir fast-mcd ialah dengan mengganti x dan S pada rumus diskriminan fungsi diskriminan dengan x mcd dan S mcd yang merupakan vektor rata-rata dan matriks kovariansi dengan metode fast-mcd [5], rumus fungsi diskriminan linier robust masing-masing kelompok adalah y 1R (x) = x 1mcd S 1 mcd x 1 2 x 1mcd S 1 x 1mcd + ln (p 1 ) y 2R (x) = x 2mcdS 1 mcd x 1 2 x 2mcd S 1 x 2mcd + ln (p 2 ) Prediksi responden akan termasuk dalam kelompok π k jika skor diskriminan linier robust y kr (x) = max{ y jr (x); j = 1, 2}. 2.3 Regresi Logistik Secara umum model probabilitas regresi logistik dengan melibatkan beberapa variabel prediktor (x) dapat diformulakan sebagai berikut : x x... 0 1 1 2 2 kxk ( x) e x x... 1 2 kxk 1 0 1 2 e Prediksi responden dari nilai π(x) 5 maka diprediksikan masuk IPA sedangkan bila nilai π(x) < 5 maka diprediksikan masuk IPS. Berdasarkan latar belakang di atas, maka permasalahan dalam penelitian ini adalah (1) Bagaimana pengaruh outlier terhadap model analisis diskriminan, analisis diskriminan robust dan regresi logistik biner?; (2) Bagaimana analisis diskriminan, analisis diskriminan robust dan regresi logistik biner dalam memprediksikan pengklasifikasian penjurusan IPA atau IPS siswa di SMA Negeri 1 Bangorejo? 3 Metode Penelitian 3.1 Jenis dan Sumber Data Data yang digunakan dalam penelitian ini adalah data sekunder yaitu nilai raport dan nilai psikotes siswa kelas X (sepuluh) semester 2 tahun pelajaran 2012/2013 yang diperoleh dari Sekolah Menengah Atas Negeri 1 Bangorejo Banyuwangi. Variabel respon (Y) dalam penelitian terdiri dari dua kategori yaitu kategori 1 adalah jurusan IPA dan kategori 0 adalah jurusan IPS. Sedangkan variabel prediktor (X) adalah nilai raport semester 2 dan nilai psikotes siswa tahun pelajaran 2012/2013 nilai mata pelajaran sebagai syarat dalam pemilihan jurusan adalah nilai mata pelajaran matematika, fisika, kimia, biologi, sejarah, geografi, ekonomi, sosiologi dan nilai psikotes.

Marino, et. al. Perbandingan Analisis Diskriminan Linier... 195 3.2 Langkah-langkah Penelitian Melakukan pengumpulan data selanjutnya data diuji ada tidaknya outlier dengan metode MCD, data dipisahkan antara data yang mengandung outlier dan tidak, untuk simulasi dilakukan dengan menggunakan data yang tidak mengandung outlier diambil secara acak masing-masing sebanyak 5 (lima) kali sebesar n 1 =4 n 2 =8 n 3 =120 dan n 4 =160 responden selanjutnya dianalisa menggunakan metode yaitu analisis diskriminan linier, analisis diskriminan linier robust dan regresi logistik biner, dari data simulasi akan diambil secara acak sebesar 5%, 10%, 15% dan 20% responden selanjutnya diganti dengan data outlier (diambil secara acak), yang besarnya sesuai dengan responden yang diambil, selanjutnya diestimasi dengan menggunakan ketiga metode yaitu analisis diskriminan linier, analisis diskriminan linier robust dan regresi logistik biner selanjutnya dicari model yang paling tepat untuk pengelompokan IPA atau IPS. Untuk interpretasi digunakan data keseluruhan yang diestimasi dengan analisis diskriminan linier, analisis diskriminan linier robust, regresi logistik biner yang sebelumnya dilakukan uji asumsi yaitu distribusi normal multivariat, uji asumsi homogenitas, uji vektor nilai rataan, uji asumsi mutikolinieritas, selanjutnya menentukan model dari ketepatan klasifikasi yang paling tepat. 4 Hasil dan Pembahasan 4.1 Performa Analisis Diskriminan, Analisis Diskriminan Robust dan Regresi Logistik Biner Dalam menentukan model analisis diskriminan, analisis diskriminan robust dan regresi logistik biner dilakukan simulasi dari data yang diperoleh dari nilai raport semester 2 dan nilai psikotes siswa tahun pelajaran 2012-2013. Simulasi data dilakukan uji berulang-ulang maisng-masing sebanyak 5 (lima) kali dengan besar sampel n 1 =4 n 2 =8 n 3 =120 dan n 4 =160 responden dan besar outlier yang bervariasi yaitu 5%, 10%, 15% dan 20%. Setelah dilakukan estimasi dengan menggunakan analisis diskriminan linier biasa, diskriminan linier robust dan regresi logistik biner maka didapatkan ratarata hasil ketepatan klasifikasi pada Tabel 1 dan Tabel 2. Tabel 1. Perbandingan Ketepatan Klasifikasi dari Berbagai Sampel Mengandung Outlier Outlier 5% Outlier 10% Outlier 15% Outlier 20% Besar Sampel R. Log R. Log R. Log R. Log Biasa Robust Biasa Robust Biasa Robust Biasa Robust 40 87,500 85,000 9500 89,000 87,000 92,000 91,000 87,500 91,000 88,500 85,500 89,500 80 84,500 8117 83,500 84,000 8000 85,500 86,000 75,250 85,750 85,500 79,250 88,750 120 82,500 81,333 83,833 83,500 83,833 84,833 86,500 83,000 87,167 84,583 87,666 86,667 160 82,125 82,875 84,250 81,375 82,500 84,750 84,375 85,375 85,500 83,375 86,250 85,750

Persentase Ketepatan Klasifikasi Persentase Ketepatan Klasifikasi Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014 196 Tabel 2. Perbandingan Ketepatan Klasifikasi dari Berbagai Sampel Tidak Mengandung Outlier Besar Responden Biasa Tidak ada Outlier Berdasarkan Tabel 1 dan Tabel 2 dapat dibuat Grafik 1 Robust Regresi Log 40 85,500 81,500 85,500 80 83,500 81,750 84,250 120 83,667 82,667 82,333 160 83,375 82,000 83,000 Ketepatan Klasifikasi Berdasarkan Variasi Outlier Outlier 20% 40 60 80 100120140160 Outlier 5% 90 85 80 90 85 Outlier 0% Outlier 10% 75 Outlier 15% 80 75 40 60 80 100120140160 Variasi Sampel 40 60 80 100120140160 Ketepatan Klasifikasi Berdasarkan Variasi Sampel Sampel 40 0.00 0.05 0.10 0.15 0.20 Sampel 80 90 85 80 Sampel 120 Sampel 160 75 90 85 80 75 0.00 0.05 0.10 0.15 0.20 Variasi Outlier Grafik 1 Grafik Ketepatan Klasifikasi

Marino, et. al. Perbandingan Analisis Diskriminan Linier... 197 Dari Tabel 1, Tabel 2 dan Grafik 1 Perbandingan ketepatan klasifikasi ketiga metode terhadap outlier yaitu: a. Analisis regresi logistik biner secara umum mempunyai ketepatan klasifikasi yang lebih baik dibanding analisis diskriminan linier biasa dan analisis diskriminan linier robust pada saat data yang mengandung outlier. b. Analisis diskriminan linier robust mempunyai ketepatan klasifikasi lebih besar jika dibandingkan dengan analisis diskriminan linier biasa untuk data yang besar (160 responden) dengan besar outlier yang semakin besar. Analisis diskriminan linier biasa mempunyai ketepatan klasifikasi yang cenderung lebih baik dibanding analisis diskriminan robust maupun regresi logistik biner untuk data yang tidak mengandung outlier. 4.2 Analisis Data Sampel Keseluruhan n = 224 Dalam memprediksikan pengklasifikasian penjurusan IPA atau IPS siswa di SMA Negeri 1 Bangorejo akan dilakukan estimasi dengan metode analisis diskriminan linier biasa, diskriminan linier robust dan regresi logistik biner. 4.2.1 Pengujian Asumsi Analisis Diskriminan Linier Asumsi pada analisis diskriminan antara lain: (1) asumsi tidak ada outlier untuk menguji keberadaan outlier menggunakan metode MCD pada penelitian ini data yang dianalisis mengandung outlier sebesar 6,70%; (2) asumsi distribusi normal multivariat untuk menguji distribusi normal multivariat menggunakan plot jarak mahalanobisdan khi-kuadrat pencaran titik yang mendekati garis lurus dan lebih dari 50% yaitu sebesar 55,357% jadi data penjurusan siswa memenuhi asumsi distribusi multivariat normal; (3) asumsi homogenitas uji homogenitas digunakan uji Box s M nilai statistik Box s M sebesar 9020 dengan pendekatan khi-kuadrat pada taraf signifikansi 5% sebesar 61,656 nilai uji Box s M lebih besar dari pada nilai sebaran khi-kuadrat, sehingga matriks varians kovarians grup adalah heterogen. Menurut Mattjik dan Sumertajaya [6] sangat sulit sekali untuk dapat memenuhi persyaratan equal variances dan multivariate normal distribution yang dalam praktek tidak pernah diuji. Berdasar pada hal diatas maka dalam karya ilmiah ini, penulis dalam mengestimasi data akan mengabaikan/ melanggar asumsi tersebut; (4) asumsi vektor nilai rataan digunakan untuk mengetahui apakah terdapat perbedaan yang signifikan setiap variabel bebas antar kelompok pada taraf signifikansi 5% yang menyertakan seluruh variabel menggunakan MANOVA dengan uji Wilk s Lamda, nilai uji statistik Wilk s Lamda sebesar 467 dengan nilai F maksimum sebesar 2829 dan taraf signifikansi di bawah 5% yaitu 2,2x10-16 menunjukan bahwa ada perbedaan yang signifikan antar kelompok/ jurusan untuk setiap variabel bebas. 4.2.2 Analisis Diskriminan Linier Biasa Data Keseluruhan Fungsi Analisis Diskriminan dengan Data Sampel Keseluruhan Z= 127x 1 +121x 2 +130x 3 +049x 4 +047x 5-027x 6-023x 7-061x 8 +109x 9 Nilai Optimum Cutting Score (Z cu ) sebesar 39,971 memprediksi responden yang nilai diskriminan (Z) yang kurang dari Z cu masuk dalam kelompok IPS sedangkan yang nilai diskriminan (Z) yang lebih besar dari Z cu masuk dalam kelompok IPA.

Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014 198 Tabel 3 Hasil Pengklasifikasian Analisis Diskriminan Linier dari Data Keseluruhan Keanggotaan yang kenyataan Keanggotaan yang diprediksi IPS IPA Jumlah IPS 103 6 109 IPA 28 87 115 Jumlah 131 93 224 Total persentase ketepatan klasifikasi sebesar 84,821% atau persentase misklasifikasi sebesar 15,179%. 4.2.3 Analisis Diskriminan Linier Robust Fungsi analisis diskriminan linier robust dengan sampel yang mengandung outlier sebagai berikut: fungsi analisis diskriminan linier robust kelompok IPA y 1 (x) = -5,417x 1 +14,660x 2 +22,999x 3 +26,541x 4 +6,177x 5 +3,874x 6 +8,807x 7 +9,049x 8 +4,693x 9-3766,586 fungsi analisis diskriminan linier robust kelompok IPS y 2 (x) = -5,596x 1 +14,274x 2 +22,543x 3 +25,823x 4 +6,034x 5 +3,986x 6 +9,009x 7 +9,114x 8 +4,488x 9-3635,699 Klasifikasi responden bila nilai diskriminan robust yang lebih besar nilai y 1 (x) terklasifikasi masuk IPA sedangkan bila lebih besar nilai y 2 (x) terklasifikasi masuk IPS. Tabel 4 Hasil Pengklasifikasian Analisis Diskriminan Linier Robust Keanggotaan yang diprediksi IPS IPA Jumlah Keanggotaan yang kenyataan IPS 95 14 109 IPA 19 96 115 Jumlah 114 110 224 Total persentase ketepatan klasifikasi sebesar 85,268% Sedangkan persentase misklasifikasi sebesar 14,732%. 4.2.4 Analisis Regresi Logistik Biner Asumsi untuk analisis logistik biner adalah tidak terjadi multikolinieritas antar variabel. Uji Multikolinieritas menggunakan VIF j = 1 (1 R j 2 ), dimana VIF j adalah VIF untuk variabel ke-j, R j 2 adalah koefisien dari model determinan variabel ke-j. Tabel 5 Nilai koefisien determinasi dan VIF No Urut Variabel dependen R 2 VIF 1 y 4670-2 x 1 5580 2,262512 3 x 2 4307 1,756581 4 x 3 2634 1,357660 5 x 4 5724 2,338565

Marino, et. al. Perbandingan Analisis Diskriminan Linier... 199 6 x 5 1245 1,142237 7 x 6 3837 1,622500 8 x 7 1075 1,120431 9 x 8 2193 1,280896 10 x 9 2552 1,342574 Berdasarkan Tabel 5 dari nilai VIF untuk semua variabel (x i ) kurang dari 10 maka dapat dianggap tidak signifikansi atau tidak ada multikolinieritas antar variabel. Model Analisis Regresi Logistik Biner. Hasil pengujian model regresi logistik dengan variabel dependen penjurusan IPA dan IPS (Y) diperoleh model peluang untuk masuk dalam kelompok IPA sebagai berikut: exp( -126, 307+ 325x1+ 396x2+ 332x3+ 479x4+ 0102, x5 Prediksi responden dari nilai 076x6 084x7 0146, x8+ 217x9 ) π(x) 1 exp( -126, 307+ 325x + 396x + 332x + 479x + 0102, x 076x 6 1 084x 7 2 0146, x + 217x 8 3 9 ) π(x) 5 maka diprediksikan masuk IPA sedangkan bila nilai π(x) < 5 maka diprediksikan masuk IPS. Tabel 6 Hasil Pengklasifikasian Regresi Logistik dari Data yang Mengandung Outlier Keanggotaan yang diprediksi IPS IPA Jumlah Keanggotaan yang kenyataan 4 IPS 97 12 109 IPA 20 95 115 Jumlah 117 107 224 Total persentase ketepatan klasifikasi sebesar 85,714% dan total persentase misklasifikasi sebesar 14,286%. Dalam memprediksikan pengklasifikasian penjurusan IPA atau IPS siswa di SMA Negeri 1 Bangorejo dengan jumlah data sampel keseluruhan, dengan menggunakan metode analisis diskriminan linier, analisis diskriminan linier robust dan regresi logistik biner diperoleh ketepatan klasifikasi untuk regresi logistik yang paling besar yaitu sebesar 85,714%. 5 Penutup 5.1 Kesimpulan Berdasarkan hasil dan pembahasan yang diperoleh maka dapat diambil suatu kesimpulan sebagai berikut. 5.1.1 Berdasarkan uji simulasi data yang dilakukan berulang-ulang dengan jumlah sampel dan besar outlier yang berbeda, analisis regresi logistik biner mempunyai ketepatan klasifikasi yang lebih baik dibanding analisis diskriminan linier maupun analisis diskriminan linier robust pada saat data yang mengandung outlier. responden) dengan besar outlier yang semakin besar. 5.1.2 Pengelompokan jurusan IPA atau IPS di SMA Negeri 1 Bangorejo dengan jumlah data 224 responden terkontaminasi outlier 6,70% menggunakan analisis logistik biner mempunyai ketepatan klasifikasi lebih baik dan tidak banyak asumsi yang dilakukan, ketepatan klasifikasi yang diperoleh sebesar 85,714%. 5

Prosiding Seminar Nasional Matematika, Universitas Jember, 19 November 2014 200 5.2 Saran Penelitian ini dapat dikembangkan dengan banyaknya kelompok lebih dari 2 kelompok/jurusan dan menggunakan variabel yang sesuai dengan aturan ataupun kebutuhan sekolah. Daftar Pustaka [1] Budyanra. 2010. Ketepatan Pengklasifikasian Fungsi Diskriminan Linier Robust Dua Kelompok Dengan Metode Fast Minimum Covariance Determinant (FAST- MCD), TesisProgram Pascasarjana Universitas Padjadjaran Bandung. [2] Filzmoser,P., 2004.A Multivariate Outlier Detection Method, Departement of Statistics and Probability Theory, Vienna, Austria [3] Gudono.2012. Analisis Data Multivariat, Jogjakarta: Fakultas Ekonomi dan Bisnis UGM. [4] Hair, J. F. Jr., Anderson, R. E., Tatham, R. L. and Black W. C. 2006.Multivariate Data Analysis.5th ed. New Jersey: Prentice Hall [5] Hubert M. dan Driessen K. V. 2002. Fast and Robust Discriminant Analysis,Computational Statistics anda Data Analysis,Vol. 45, hal.301-320 [6] Mattjik A. A., dan Sumertajaya. I. M. 2011. Sidik Peubah Ganda Dengan menggunakan SAS, Bogor: IPB Press. [7] Maja P., Mateja B. dan Sandra.T. 2004. Comparason of Logistic Regression and Linear Discriminant Analisis: A Simulation Study, Metodološki zvezki, Vol. 1, No. 1, 143-161 [8] Mukti K., Marisi A., dan Muhlasah N. M. 2012. Mendeteksi Outlier Dengan Metode Minimum Covariance Determinant, Portal Jurnal Ilmiah Universitas Tanjungpura, Vol. 01, No. 1, hal 31 40.