ANALISIS FAKTOR (FACTOR ANALYSIS)
PENDAHULUAN Analisis faktor: mengkaji hubungan internal dari gugus variabel Data: peubah-peubah yang dianalisis berkorelasi tinggi didalam grupnya sendiri dan berkorelasi rendah dengan yang berbeda grup Tujuan: untuk mempelajari beberapa sifat yang mendasar namun tidak dapat terobservasi kuantitasnya Tokoh: Charles Spearman yang mengemukakan dalil bahwa korelasi internal dapat diwakili dengan menggunakan sebuah peubah atau faktor yang dinamakan dengan faktor g. Selanjutnya faktor ini dikenal sebagai faktor kepintaran umum (general intelegence)
FORMULASI MODEL FAKTOR Misal vektor acak X dengan p komponen memiliki rataan µ dan matriks peragam (covariance) Σ. Pada umumnya model analisis faktor adalah: X 1 - µ 1 = l 11 F 1 + l 1 F + +l 1m F m + ε 1 X - µ = l 1 F 1 + l F + +l m F m + ε : X p - µ p = l p1 F 1 + l p F + +l pm F m + ε p : :
FORMULASI MODEL FAKTOR (lanjutan) Dalam bentuk matriks: (X - µ) = L F + ε (px1) (pxm) (mx1) (px1) Keterangan: µ = vektor rataan L = matriks konstanta yang tidak diketahui nilainya (loading factor) F = vektor acak ε = vektor unsur galat (faktor khusus)
FORMULASI MODEL FAKTOR (lanjutan) Dengan asumsi: E(F) = 0, E(ε) = 0 Cov(F) = E(FF ) = I Cov(ε) = E(ε ε ) = ψ = diag(ψ 1, ψ,, ψ p ) F dan ε saling bebas Cov(ε,F) = E(ε,F) = 0
FORMULASI MODEL FAKTOR (lanjutan) Struktur peragam dari model faktor orthogonal: Cov(X) = LL + ψ atau var(x i ) = l i + + l im + ψ i cov(x i,x k ) = l i1 l k1 + + l im l km Cov(X,F) = L atau cov(x i,f j ) = l ij
FORMULASI MODEL FAKTOR (lanjutan) Pembuktian struktur peragam: Cov(X-µ) = cov(l F+ε).1 = cov(l F)+cov(ε)+cov(L F+ε) = L cov(f) L + ψ +L cov(l F+ε) = L L + ψ Cov(X,F) = cov(l F+ε ; F). = cov(l F ; F)+cov(ε ; F) = L cov(f) = L (korelasi antara X dengan faktor)
FORMULASI MODEL FAKTOR (lanjutan) Komunalitas ke-i merupakan bagian dari ragam peubah ke-i yang dapat dijelaskan oleh m faktor umum. h i = l i1 + l i + + l im dan σ ii = h i + ψ i ; I = 1,,,p
PERMASALAHAN Ada tiga hal penting yang menjadi pokok permasalahan dalam analisis faktor, yaitu: Mengidentifikasi struktur Menduga parameter (loading faktor dan ragam sistematik Interpretasi faktor
PENDUGAAN PARAMETER Metode Metode non-iteratif Metode iteratif Metode komponen utama Metode faktor utama Analisis Citra Analisis faktor kanonik non-iteratif Metode kemungkinan maksimum Metode kuadrat terkecil tak terboboti Metode komponen utama iteratif Harris Metode analisis faktor alpha
KONSEP PENDUGAAN Metode Komponen Utama Misalkan R adalah matriks korelasi contoh berukuran pxp, karena matriks R simetrik dan definit positif maka bisa dituliskan sebagai berikut: R = Γ Λ Γ dengan: Λ= diag(λ 1,λ, λ p ) dan λ 1 >λ > >λ p >0 adalah akar ciri dari matriks R, serta Γ Γ = Γ Γ =I p Γ= matriks orthogonal pxp yang kolom-kolomnya adalah vektor ciri matriks R yaitu, T 1,T,,T p yang berpadanan dengan vektor ciri λ 1,λ,,λ p
Metode Komponen Utama (lanjutan) Misalkan k adalah banyaknya komponen utama yang dipilih, maka matriks L^ didefinisikan sebagai berikut: (pxp) L^ = λ 1 Γ 1 λ Γ λ k Γ k R didekati dengan L^ L^ =Σ k i=1λ i Γ i Γ i dimana Γ i adalah kolom ke-i pada matriks Γ
Metode Komponen Utama (lanjutan) Matriks diagonal ragam khusus ψ diduga dengan ψ^, yaitu matriks diagonal yang unsurnya diambil dari R= L^ L^ 1 1 0 0 0 1 0 0... 0 1 ˆ h p h h...
Metode Komponen Utama (lanjutan) Ukuran kebaikan suai dari model faktor adalah sebagai berikut: RMS_overall = (1/p(1-p))Σ i p =1 Σ j p =1 res ij Semakin kecil nilai RMS_overall mengindikasikan kebaikan suai yang tinggi. Model terbaik berdasarkan kriteria ini adalah jika diperoleh RMS-overall < 0.05 dengan banyaknya faktor bersama yang paling sedikit.
ILUSTRASI Data harga saham terdiri dari n=100 harga mingguan dengan p=5 saham. Dengan menggunakan metode AKU didapatkan dua komponen utama. Secara spesifik penduga loading faktor adalah koefisien komponen utama (vektor ciri dari R) dibandingkan dengan akar kuadrat dari akar ciri yang bersesuaian.
Variabel Allied Chemical DuPont Union Carbide Exxon Texaco.1..3.4.5 Total proporsi kumulatif keragaman yang dapat dijelaskan Tabel pendugaan loading faktor,komunalitas dan total proporsi keragaman yang dijelaskan dari setiap faktor untuk m=1 dan m= Solusi satu faktor ~ 1 Solusi dua faktor F i h i F 1 F 1 0.783 0.39 0.783-0.17 0.773 0.794 0.713 0.71 ~ 0.40 0.37 0.49 0.49 0.773 0.794 0.713 0.71-0.458-0.34 0.47 0.54 0.571 0.571 0.733 ~ ~ i 1 h i 0.34 0.19 0.31 0.7 0.
Proporsi untuk total keragaman dengan menggunakan solusi dua faktor lebih besar daripada hanya menggunakan satu faktor. Faktor pertama merepresentasikan kondisi ekonomi secara umum dan dapat disebut faktor pasar. Faktor kedua merupakan kontras antra saham perusahaan kimia dengan saham perusahaan minyak (pada faktor perusahaan kimia memiliki loading negatif yang relatif besar dan perusahaan minyak memiliki loading positif yang relatif besar). Dengan demikian faktor kedua dapat disebut faktor industri karena sebagai pembeda harga saham di industri yang berbeda.
Komunalitas Dengan m=, Matriks residual untuk solusi faktor adalah 0.66 0.17) ( (0.783) ~ ~ ~ 1 11 h i 0 0.3 0.017 0.01 0.017 0.3 0 0.019 0.055 0.069 0.017 0.019 0 0.1 0.164 0.01 0.055 0.1 0 0.17 0.017 0.069 0.164 0.17 0 ~ ' ~~ LL R
Metode Kemungkinanan Maksimum Metode kemungkinan maksimum (MKM) mengasumsikan bahwa matriks ragam-peragam atau matriks korelasi semua peubah bersifat non-singular. Fungsi kepekatan bagi S adalah: n1 n1 p1 n1 1 tr ( S ) S e L(S)=c dengan c adalah konstanta. Sehingga log-likelihood dari L dan ψ, jika Σ = LL + ψ adalah: n 1 ln c { tr[( LL' ) 1 S} ln ( LL' ) Penduga kemungkinan maksimum bagi L dan ψ diperoleh dengan memaksimumkan persamaan diatas dengan kendala k(k-1)/ persyaratan keunikan (Johnson&Wichern,1998). 1 S ]}
Penentuan banyaknya faktor bersama Uji Nisbah Kemungkinan (likelihood ratio test) Hipotesis nol yang diuji pada uji nisbah kemungkinan ini adalah: H 0 : Σ = LL +ψ, r(l)=k diketahui L ^ Misalkan, dan = + adalah penduga kemungkinan maksimum bagi L, ψ dan Σ, jika H0 benar, maka nilai maksimum untuk log dari fungsi kemungkinannya adalah: L L
Uji Nisbah Kemungkinan (likelihood ratio test): (lanjutan) S S S S tr n c L H 1 1 * ln 1 ln 0 p n c * 1 L L H 0 ln ln Statistik uji nisbah kemungkinan yaitu Menyebar khi-kuadrat dengan k p k p db 1 Jadi, hipotesis nol ditolak jika k p k p db H L L 0 1 ; ln
Penentuan banyaknya faktor bersama (lanjutan) Akaike s information Criterion(AIC) Statistik AIC untuk model dengan k faktor didefinisikan sebagai berikut: AIC(k)=-ln L(k)+[p(k+1)-k(k-1)] Model berfaktor k dengan k adalah nilai yang berpadanan dengan AIC (k) yang paling kecil dianggap sebagai model terbaik
Data harga saham dianalisa kembali dengan menggunakan metode maksimum likelihood dengan tetap memakai dua model faktor Komunalitas dengan menggunakan metode maksimum likelihood adalah: ˆ ˆ ˆ i i1 i (0.684) (0.189) h 0.50 Matriks residualnya adalah: R LL ˆ ˆ' 0 0.005 0.004 0.04 0,004 0.005 0 0.003 0.004 0.000 0.004 0.003 0 0.031 0.004 0.04 0.004 0.031 0 0.000 0.004 0.000 0.004 0.000 0
Tabel pendugaan faktor loading, komunalitas, ragam khusus dan total proporsi keragaman contoh yang dapat dijelaskan Variabel Maksimum likelihood Komponen utama Penduga faktor ~ ~ i 1 h i Penduga faktor ~ ~ i 1 h i Allied Chemical DuPont Union Karbide Exxon Texaco.1..3.4.5 Total proporsi kumulatif keragaman contaoh yang dapat dijelaskan 0.684 0.694 0.681 0.61 0.79 0.189 0.517 0.48-0.073-0.44 0.50 0.5 0.47 0.61 0.18 0.783 0.773 0.794 0.713 0.71-0.17-0.458-0.34 0.41 0.54 0.485 0.598 0.571 0.733 0.34 0.19 0.31 0.7 0.
Interpretasi Elemen matriks residual pada maximum likelihood lebih kecil dari pada matriks residual pemfaktoran komponen utama. Total proporsi kumulatif keragaman pada faktor komponen utama lebih besar dibandingkan faktor maximum likelihood. Maka tidak mengherankan bila kriteria pemfaktoran komponen utama lebih dipilih. Loading yang didapatkan dari analisis faktor komponen utama berhubungan dengan komponen utama yang mengoptimumkan keragaman.
Lanjutan Pada solusi maximum likelihood semua variabel pada faktor pertama memiliki loading yang positif dan relatif besar. Faktor tersebut disebut faktor pasar. Faktor loading yang kedua memiliki tanda yang konsisten dengan kontras atau faktor industri, tapi magnitudonya relatif kecil dibeberapa kasus. Mungkin dapat diidentifikasikan bahwa faktor ini adalah pembandingan antara DuPont dan Texaco
ROTASI FAKTOR Dipergunakan untuk memudahkan interpretasi Merupakan transformasi ortogonal dari loading factors L*= LT dimana TT =T T=I Beberapa jenis transformasi yaitu, varimax, oblique, quartimax, dan lain-lain
ROTASI FAKTOR (lanjutan) Rotasi Varimax Merupakan rotasi yang paling sering dipergunakan pada aplikasi. Merupakan transformasi ortogonal yang diperoleh dengan cara memaksimumkan: k p * p 1 l ij 1 lij 1 p i1 hi p i 1 hi j
ROTASI FAKTOR (lanjutan) Rotasi Oblique Digunakan apabila transformasi ortogonal terhadap matriks loading faktor menghasilkan faktor yang masih sulit diinterpretasikan.
ROTASI FAKTOR (lanjutan) yang memaksimumkan Rotasi quartimax Transformasi ortogonal dengan tujuan memperoleh L Adalah matriks loading faktor yang ingin ditransformasi menggunakan matriks ortogonal menjadi sehingga 1 Pk Mencapai maximum. i L * 1 Pk L i j l 1 Pk * 4 ij Pk 4 * * 4 l ij l ij l ij * 1 j i j i j i l * ij
Data harga saham dianalisa kembali dengan menggunakan metode maksimum likelihood dengan tetap memakai dua model faktor Komunalitas dengan menggunakan metode maksimum likelihood adalah: ˆ ˆ ˆ i i1 i (0.684) (0.189) h 0.50 Matriks residualnya adalah: 0 0.005 0.005 0 R LL ˆ ˆ' 0.004 0.003 0.04 0.004 0,004 0.000 0.004 0.003 0 0.031 0.004 0.04 0.004 0.031 0 0.000 0.004 0.000 0.004 0.000 0
Tabel pendugaan faktor loading, komunalitas, ragam khusus dan total proporsi keragaman contoh yang dapat dijelaskan Variabel Maksimum likelihood Komponen utama Allied Chemical DuPont Union Karbide Exxon Texaco.1..3.4.5 Total proporsi kumulatif keragaman contaoh yang dapat dijelaskan 0.684 0.694 0.681 0.61 0.79 Penduga faktor F1 0.189 0.517 0.48-0.073-0.44 0.50 0.5 0.47 0.61 0.18 Penduga faktor ~ ~ i 1 h i F F1 F 0.783 0.773 0.794 0.713 0.71-0.17-0.458-0.34 0.41 0.54 0.485 0.598 0.571 0.733 ~ ~ i 1 h i 0.34 0.19 0.31 0.7 0.
Interpretasi Elemen matriks residual pada maximum likelihood lebih kecil dari pada matriks residual pemfaktoran komponen utama. Total proporsi kumulatif keragaman pada faktor komponen utama lebih besar dibandingkan faktor maximum likelihood. Maka tidak mengherankan bila kriteria pemfaktoran komponen utama lebih dipilih. Loading yang didapatkan dari analisis faktor komponen utama berhubungan dengan komponen utama yang mengoptimumkan keragaman.
Lanjutan Pada solusi maximum likelihood semua variabel pada faktor pertama memiliki loading yang positif dan relatif besar. Faktor tersebut disebut faktor pasar. Faktor loading yang kedua memiliki tanda yang konsisten dengan kontras atau faktor industri, tapi magnitudonya relatif kecil dibeberapa kasus. Mungkin dapat diidentifikasikan bahwa faktor ini adalah pembandingan antara DuPont dan Texaco