DISCRIMINANT ANALYSIS

DISCRIMINANT ANALYSIS STATISTIK LANJUT MAGISTER PROFESI F.PSI.UI Liche Seniati 1

Discriminant Analysis Merupakan teknik parametrik yang digunakan untuk menentukan bobot dari prediktor yg paling baik untuk membedakan dua atau lebih kelompok kasus, yang tidak terjadi secara kebetulan (Cramer, 2004). DA dipakai untuk menjawab pertanyaan bagaimana individu dapat dimasukkan ke dalam kelompok berdasarkan beberapa variabel. DA adalah metode untuk mencari dasar pengelompokan individu berdasarkan lebih dari 1 IV. 2

Discriminant Analysis Persamaan fungsi diskriminan yang dihasilkan untuk memberikan peramalan yang paling tepat untuk mengklasifikasi individu ke dalam kelompok berdasarkan skor IV. DA juga merupakan salah satu bentuk Multiple Regression Analysis, dimana DV berupa kategori Jumlah fungsi diskriminan tergantung dari jumlah prediktor (IV) atau jumlah kelompok dikurang 1 (yang paling kecil) 3

Tahap-tahap Perhitungan Analisis Diskriminan 1. Menghitung Nilai Rata-rata IV pada setiap kelompok (deskriptif). 2. Menghitung Nilai Uji-F untuk melihat perbedaan skor IV (prediktor) pada setiap kelompok. 3. Menghitung Nilai Homogenitas Kovarians Dalam Kelompok (dengan Box s M). 4. Mencari Eigenvalue untuk setiap Discriminant Function => rasio yg dpt dijelaskan dgn fungsi. 4

Tahap-tahap Perhitungan Analisis Diskriminan 5. Mencari Nilai Canonical Discriminant Function Coefficients utk setiap fungsi => utk mendptkan bobot dari setiap IV. 6. Mencari Nilai Signifikansi dari Discriminant Function (Wilks lambda) => sign. fungsi 7. Menentukan klasifikasi (persentase kasus yang dapat diidentifikasi dengan benar) 5

Contoh Contoh (dalam Cramer, 2004): VB: skor anxious, restless, depressed, and hopeless VT: kelompok pasien (normal, cemas, depresi) Analisis diskriminan pada penelitian ini dilakukan untuk melihat prediktor yang paling baik untuk mengelompokkan pasien berdasarkan jenis gangguan Pada penelitian ini ada 3 kelompok pasien sehingga akan diperoleh dua fungsi diskriminan. 6

Output SPSS untuk Analisis Diskriminan KELP Normal Cemas Depresi Total ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS ANXIOUS RESTLESS DEPRESSE HOPELESS Group Statistics Mean Std. Deviation Kesimpulan: 2.20 1.30 2.40.55 2.00 1.00 2.00.71 4.00.71 3.60 1.14 2.20.84 2.60.89 2.60.89 2.60 1.14 4.20.84 3.80.84 2.93 1.22 2.87 1.06 2.80 1.32 2.80 1.08 Kelompok Pasien Normal memiliki skor yang paling rendah dalam semua VB Kelompok Pasien Cemas memiliki skor Anxious dan Restless yang paling tinggi Kelompok Pasien Depresi memiliki skor Depressed dan Hopeless yang paling tinggi 7

Tests of Equality of Group Means ANXIOUS RESTLESS DEPRESSE HOPELESS Wilks' Lambda F df1 df2 Sig..573 4.467 2 12.035.737 2.138 2 12.161.393 9.250 2 12.004.488 6.300 2 12.013 Kesimpulan: Ada perbedaan Skor VB yang signifikan pada setiap kelompok pasien. 8

Test Results Box's M 37.535 F Approx. df1 df2 Sig..907 20 516.896.578 Tests null hypothesis of equal population covarianc Box's Test of Equality of Covariance Matrices Kesimpulan: F tidak signifikan berarti kovarians dalam setiap kelompok adalah homogen, sehingga perhitungan selanjutnya dapat dilakukan (asumsi terpenuhi) 9

Summary of Canonical Discriminant Functions Function 1 2 a. Eigenvalues Canonical Eigenvalue % of Variance Cumulative % Correlation 2.809 a 77.4 77.4.859.820 a 22.6 100.0.671 First 2 canonical discriminant functions were used in the analysis. Nilai Eigenvalue menunjukkan perbandingan varians antar kelompok dengan varians dalam kelompok. Semakin besar nilai Eigenvalue berarti semakin besar fungsi diskriminan (pengaruh masing-masing VB). Output di atas menunjukkan bahwa fungsi diskriminan pertama lebih besar daripada fungsi diskriminan kedua. Selain itu, terlihat bahwa fungsi diskriminan pertama menjelaskan 77,4% dari total varians VB dan 22,6% utk fungsi kedua. 10

Wilks' Lambda Test of Function(s) 1 through 2 2 Wilks' Lambda Chi-square df Sig..144 20.330 8.009.549 6.289 3.098 Output ini menunjukkan signifikansi dari fungsi diskriminan (yang dilihat dari nilai Wilks Lambda dan χ 2 ) Pada output di atas, fungsi diskriminan pertama dan kedua (secara bersama) adalah signifikan. Namun jika hanya fungsi diskriminan kedua yang diperhitungkan (dengan menghilangkan fungsi diskriminan pertama) maka fungsi kedua tidak signifikan. 11

Standardized Canonical Discriminant Function Coefficients ANXIOUS RESTLESS DEPRESSE HOPELESS DEPRESSE HOPELESS ANXIOUS RESTLESS Structure Matrix Function 1 2 -,421,753 -,391,299,646,101,681,292 Function 1 2,719*,330,538*,537 -,234,849* -,180,569* *. Largest absolute correlation between each variable and any discriminant function Interpretasi: Tabel pertama dan tabel kedua menunjukkan bahwa depressed dan hopeless merupakan fungsi diskriminan pertama, sedangkan anxious dan restless merupakan fungsi diskriminan kedua. Secara lebih khusus, tabel kedua menunjukkan korelasi antara setiap variabel dengan setiap fungsi diskriminan. (menunjukkan variabel yg dpt menjadi diskriminan) 12

Canonical Discriminant Function Coefficient Function 1 2 ANXIOUS -,421,753 RESTLESS -,397,304 DEPRESSE,723,113 HOPELESS,834,358 (Constant) -1,986-4,401 Unstandardized coefficients Output ini digunakan untuk membuat persamaan fungsi diskriminan Fungsi diskriminan I = -1,986 + -0,421(anxious) + -0,397(restless) + 0,723(depressed) + 0,834(hopeless) Fungsi diskriminan II = -4,401 + 0,753(anxious) + 0,304(restless) + 0,113(depressed) + 0,358(hopeless) 13

Interpretasi Analisis diskriminan dilakukan untuk mengetahui apakah dari 4 prediktor, yaitu feeling anxious, restless, depressed, dan hopeless, dapat menentukan apakah individu akan didiagnosis normal, anxious, dan depressed. Dari dua fungsi diskriminan yang diperoleh, fungsi pertama memberikan sumbangan sebesar 77% terhadap varians DV, fungsi kedua menjelaskan 23% terhadap varians DV. 14

Latihan: Seorang peneliti ingin melihat apakah skor tes kemampuan verbal dan skor tes kemampuan numerik dapat membedakan seorang mahasiswa memiliki IPK tinggi atau rendah. Group Statistics IPK Rendah Tinggi Total VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK Valid N (listwise) Mean Std. Deviation Unweighted Weighted 67.067 12.8745 12 12.000 65.917 13.7110 12 12.000 84.250 10.6355 12 12.000 82.333 11.3184 12 12.000 75.658 14.5051 24 24.000 74.125 14.8823 24 24.000 15

Tests of Equality of Group Means VERBAL NUMERIK Wilks' Lambda F df1 df2 Sig..634 12.706 1 22.002.683 10.231 1 22.004 Kesimpulan: Berdasarkan Nilai Wilks Lambda, Nilai F, dan Signifikansi : Ada perbedaan Skor Tes Kemampuan Verbal dan Skor Tes Kemampuan Numerik yang signifikan antara kelompok dengan IPK Tinggi dan IPK Rendah 16

Pooled Within-Groups Matrices a VERBAL NUMERIK Covariance VERBAL 139.433-6.502 NUMERIK -6.502 158.049 Correlation VERBAL 1.000 -.044 NUMERIK -.044 1.000 a. The covariance matrix has 22 degrees of freedom. Kesimpulan: Berdasarkan Covarince: matriks kovarians antara variabel verbal dan numerik berbeda untuk masing-masing perbandingan Berdasarkan Correlation: tidak ada korelasi antara variabel verbal dan numerik (variabel bebas tidak saling berkorelasi) 17

IPK Rendah Tinggi Total Covariance Matrices a VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK VERBAL NUMERIK 165.753 15.292 15.292 187.992 113.114-28.295-28.295 128.106 210.397 67.371 67.371 221.484 a. The total covariance matrix has 23 degrees of freedom. Box's M F Test Results Approx. df1 df2 Sig. 1.467.441 3 87120.000.724 Tests null hypothesis of equal population covariance matrice Kesimpulan: Hasil analisis matriks kovarians menunjukkan bahwa nilai kovarians cukup besar untuk masingmasing kelompok status dengan dua variabel diskriminan. Hasil Box s M menunjukkan kovarians pada kedua kelompok adalah sama, sehingga memenuhi asumsi kovarians dalam analisis diskriminan 18

Variables Entered/Removed a,b,c,d Step 1 2 Wilks' Lambda Exact F Entered Statistic df1 df2 df3 Statistic df1 df2 Sig. VERBAL.634 1 1 22.000 12.706 1 22.000.002 NUMERIK.478 2 1 22.000 11.446 2 21.000.000 At each step, the variable that minimizes the overall Wilks' Lambda is entered. a. Maximum number of steps is 4. b. Minimum partial F to enter is 3.84. c. Maximum partial F to remove is 2.71. d. F level, tolerance, or VIN insufficient for further computation. Kesimpulan: Hasil Analisis Diskriminan dengan Metode Stepwise, Nilai Statistik F dan Signifikansinya menunjukkan bahwa Skor Rata-rata Tes Kemampuan Verbal maupun Skor Tes Kemampuan Numerik adalah berbeda pada kelompok IPK Tinggi dan kelompok IPK Rendah. 19

Step 1 2 VERBAL VERBAL NUMERIK Variables in the Analysis Tolerance F to Remove 1.000 12.706 Wilks' Lambda.998 8.959.683.998 6.823.634 Step 0 1 VERBAL NUMERIK NUMERIK Variables Not in the Analysis Min. Wilks' Tolerance Tolerance F to Enter Lambda 1.000 1.000 12.706.634 1.000 1.000 10.231.683.998.998 6.823.478 Wilks' Lambda Step 1 2 Number of Exact F Variables Lambda df1 df2 df3 Statistic df1 df2 Sig. 1.634 1 1 22 12.706 1 22.000 1.733E-03 2.478 2 1 22 11.446 2 21.000 4.348E-04 20

Summary of Canonical Discriminant Functions Function 1 a. Eigenvalues Canonical Eigenvalue % of Variance Cumulative % Correlation 1.090 a 100.0 100.0.722 First 1 canonical discriminant functions were used in the analysis. Wilks' Lambda Test of Function(s) 1 Wilks' Lambda Chi-square df Sig..478 15.481 2.000 Kesimpulan: Dari Tabel Wilks Lambda terlihat bahwa skor tes kemampuan verbal dan skor tes kemampuan numerik pada kedua kelompok (IPK tinggi dan rendah) adalah berbeda secara signifikan. Dari Tabel Eigenvalues dan Wilks Lambda Fungsi Diskriminan Kanonikal terlihat bahwa variabel diskriminator (tes verbal dan tes numerikal) memiliki hubungan yang erat dengan IPK. 21