BAB III ANALISIS DISKRIMINAN. Analisis diskriminan (discriminant analysis) merupakan salah satu metode

BAB III ANALISIS DISKRIMINAN 3. Analss Dsrmnan Analss dsrmnan (dscrmnant analyss) merupaan salah satu metode yan dunaan dalam analss multvarat. Dalam analss dsrmnan terdapat dua jens varabel yan terlbat yatu varabel bebas dan varabel terat. Varabel bebas dalam analss dsrmnan berupa data metr (nterval dan raso) sedanan varabel teratnya berupa data nonmetr (nomnal dan ordnal). Oleh arena tu, analss dsrmnan termasu e dalam analss multvarat metode dependens (Sharma, 996). Analss dsrmnan adalah ten multvarat untu memsahan objeobje dalam elompo yan berbeda dan menelompoan obje baru e dalam elompo-elompo tersebut (Johnson, 956). Analss dsrmnan dapat dunaan ja varabel teratnya terdr dar dua elompo atau lebh. Apabla varabel teratnya lebh dar dua elompo, maa metode yan dunaan adalah analss dsrmnan multpel (multple dscrmnant analyss). Ada dua tujuan utama dalam pemsahan elompo dalam analss dsrmnan, yatu (Rencher, 2002) :. Aspe desrptf atau menambaran pemsahan elompo, d mana funs lner varabel (funs dsrmnan) dunaan untu menambaran atau menjelasan perbedaan-perbedaan antara dua atau lebh elompo. Tujuan dar ambaran analss dsrmnan melput dentfas ontrbus p varabel 45

46 untu memsahan elompo dan mencar hasl yan optmal d mana ponpon tersebut dapat menjelasan ambaran terba setap elompo. 2. Aspe preds atau menelompoan observas e dalam elompo, d mana funs lner atau uadrat varabel (funs penelompoan) dunaan untu menentuan unt sampel ndvdu e dalam salah satu dar beberapa elompo. Nla-nla yan duur dalam vetor observas dar ndvdu atau obje aan devaluas oleh funs penelompoan untu mencar elompo d mana ndvdu dpastan termasu d dalamnya. Ada beberapa asus analss dsrmnan, d antaranya:. Analss Dsrmnan Lner (Lnear Dscrmnant Analyss). Analss dsrmnan lner dunaan ja data p buah varabel bebas berdstrbus normal multvarat dan setap elomponya meml matrs varans ovarans yan sama. 2. Analss Dsrmnan Kuadrat (Quadratc Dscrmnant Analyss). Analss dsrmnan uadrat dunaan ja data p buah varabel bebas berdstrbus normal multvarat tetap matrs varans ovaransnya tda sama dalam setap elomponya. 3. Analss Dsrmnan Fsher (Fsher Dscrmnant Analyss). Analss dsrmnan Fsher dunaan ja data p buah varabel bebas tda berdstrbus normal multvarat tetap matrs varans ovaransnya sama dalam setap elomponya.

47 4. Analss Dsrmnan Nonparametr (Nonparametrc Dscrmnant Analyss). Analss dsrmnan nonparametr dunaan ja data p buah varabel bebas tda berdstrbus normal multvarat dan matrs varans ovaransnya tda sama dalam setap elomponya. Analss dsrmnan melbatan ombnas lner dar dua atau lebh varabel bebas untu membentu suatu funs dsrmnan yan dapat dunaan untu membedaan suatu elompo denan elompo lannya. Kombnas lner untu analss dsrmnan meml bentu persamaan lner, yatu: L = b0 + b X + b2 X 2 +... + bp X p (3.) d mana, L = score dsrmnan, b = bobot (weht) dan X = varabel bebas. Dalam tujuan utama analss dsrmnan, yatu aspe desrptf, funs dsrmnan yan terbentu dunaan untu membedaan suatu elompo denan elompo lannya dalam suatu populas. Selan untu membedaan elompo, funs dsrmnan jua dapat dunaan untu masalah penelompoan yatu dalam aspe preds, funs yan terbentu adalah funs penelompoan yan dunaan untu menelompoan observas e dalam elompo yan telah ada. Funs penelompoan n dsebut jua funs dsrmnan, namun funs dsrmnan n tda sama denan funs dsrmnan pada aspe desrptf. Pada proses penelompoan analss dsrmnan, setap observas sebelumnya sudah detahu masu e dalam salah satu elompo dar beberapa elompo yan ada. Denan deman, aan muncul onsep esalahan

48 penelompoan. Dar onsep nlah dapat detahu seberapa banya penelompoan yan dlauan oleh analss dsrmnan tersebut. Proses penelompoan dalam analss dsrmnan dlauan denan cara membentu suatu funs penelompoan masn-masn elompo, selanjutnya dhtun suatu sor setap observas dar masn-masn funs penelompoan tersebut yan dsebut denan sor dsrmnan. Penelompoan menunaan sor dsrmnan dlauan denan membuat suatu aturan penelompoan untu menetahu observas masu e dalam elompo yan ada. Berut aan dbahas aturan penelompoan dalam analss dsrmnan. 3.2 Aturan Penelompoan Msalan sebuah populas Ω terdr dar elompo π, π 2, K, π denan masn-masn wlayah (reon) R, R2, K, R. Suatu penuuran terdr dar p varabel bebas, X = x, x2, K, x p dlauan pada setap elompo sebanya n observas atau obje, = { x, x 2,, x } x K ; m =, 2, K, p. Perbedaan antar m m m mn elompo dapat dlhat dar funs epadatannya, f ( ) x ja observas berasal dar elompo, π ; =, 2, K, denan peluan pror p d mana p =. = Besarnya baya/reso salah penelompoan ada bla observas yan berasal dar elompo ( π ) delompoan sebaa elompo ( π ) dnotasan denan c ( ) denan peluan ( ) P ;, =, 2, K,.

49 Berut aan dbahas beberapa metode untu memperoleh aturan penelompoan observas atau obje e dalam salah satu elompo dar beberapa elompo yan ada pada analss dsrmnan. 3.2. Metode ECM Mnmum Nla harapan dar salah penelompoan (Expected Cost of Msclassfcaton = ECM) dbanun oleh ta omponen, yatu peluan pror p, baya/reso salah menelompoan c ( ) dan peluan salah menelompoan P ( ). Baya/reso salah penelompoan aan bernla sama denan nol atau c ( ) = 0 ja =. Msalan R adalah hmpunan semua x yan delompoan sebaa π, maa peluan salah penelompoan ( P ( ) ) adalah peluan bersyarat menelompoan observas sebaa π padahal observas tersebut berasal dar π, yatu: untu ;,, 2,, P = f x dx, ( ) ( ) R = K, peluan bersyarat P ( ) P ( ) =. =

50 Baya/reso salah penelompoan dapat ddefnsan sebaa matrs baya. Msalan suatu populas terdr dar dua elompo π dan π 2, maa matrs bayanya adalah Populas yan benar Dlasfasan sebaa 2 0 2 2 2 0 Untu populas yan terdr dar elompo π, π 2, K, π, maa ECM bersyarat dar x yan berasal dar yan delompoan e dalam 2, atau 3,, atau adalah ECM() = 2 2 + 3 3 + +. = 2 = P( ) c( ) Denan menalan setap ECM bersyarat (ECM() ; =, 2, K, ) denan masn-masn peluan prornya ( p ; =, 2, K, ), maa dperoleh total baya/reso salah penelompoan (Total Cost of Msclassfcaton = TCM), yatu: TCM = ECM() + 2 ECM(2) + + ECM( ) TCM = p P( ) c( ) p 2 P( 2) c( 2 + ) + K + p P( ) c( ) = 2 = = 2 TCM = p P ( ) c ( ) (3.2) = =

5 Plh, 2,, aar TCM bernla mnmum, sehna dperoleh aturan penelompoan yan optmal sebaa berut: Result. Aturan penelompoan denan metode ECM mnmum adalah elompoan x e dalam, =,2,, d mana But. p f ( x ) c( ) bernla mnmum. (3.3) = Ja terdapat satu atau lebh, dplh salah satu d antaranya. Dalam metode ECM, peluan pror populas detahu. Oleh arena tu, dapat ddefnsan peluan posteror berdasaran teor Bayesan (lampran 7). Peluan posteror dar observas yan berasal dar, P ( π x ) adalah P ( π x) = l= Ja observas tersebut delompoan sebaa, maa eruan harapannya adalah = j pl fl l= ( ) p f x p f ( x) l p f ( x) l ( x) ( ) c j Untu memnmuman eruan harapan tersebut, plh j aar nla eruan harapan mnmum. Kta menanap p f ( ) c( j ).. x untu semua j = j

52 dan memlh j yan meml baya/reso salah penelompoannya ( ) mnmum sehna aan menyebaban nla p f ( ) c( j ) x menjad mnmum. Oleh arena tu, elompoan x e dalam, =,2,, d mana = j ( ) ( ) < ( ) ( ) p f x c p f x c j, = = j atau denan ata lan elompoan x e dalam, =,2,, d mana p f ( x ) c( ) bernla mnmum. = Bla omponen baya/reso salah penelompoan c ( ) dabaan atau dasumsan sama untu setap elompo, maa dar persamaan TCM aan dhaslan aturan total peluan salah penelompoan (Total Probablty of Msclassfcaton = TPM). 3.2.2 Metode TPM Mnmum Krtera lan dar ECM yatu bla baya/reso salah penelompoan c ( ) dabaan atau dasumsan sama untu setap elomponya dapat dunaan untu memperoleh aturan penelompoan optmal, yatu denan memlh R, R2, K, R untu memnmuman total peluan salah penelompoan (Total Probablty of Msclassfcaton = TPM).

53 Msalan suatu populas terdr dar dua elompo π dan π 2, maa TPMnya adalah TPM = P( Salah penelompoan observas π atau salah penelompoan observas π ) 2 TPM = P ( observas berasal dar π dan salah penelompoan ) + P ( observas berasal dar π dan salah penelompoan ) TPM = ( ) + ( ) adalah denan p f x d x p f x d x. R 2 2 2 R 2 Untu populas yan terdr dar elompo π, π 2, K, π, maa TPMnya ( ) = ( ) f x dx P. R TPM = = R p f ( x) dx (3.4) Kta jua dapat menelompoan observas e dalam elompo yan meml peluan posteror masmum. Menurut aturan Bayes (lampran 7), peluan posteror dar observas yan berasal dar, P ( π x ) adalah P ( π x) = l= p f l p f ( x) l ( x). (3.5)

54 Aturan TPM adalah aturan ECM bla baya/reso salah penelompoan c ( ) dabaan atau dasumsan sama untu setap elomponya, maa aturan penelompoan yan optmal denan metode yan memnmuman TPM adalah: Result 2. Aturan penelompoan denan metode TPM mnmum adalah elompoan x e dalam ja atau, setara denan, p f ( x) > p f ( x ) untu semua, (3.6) elompoan x e dalam ja But. ln p f ( x) > ln p f ( x ) untu semua. (3.7) Andaan semua baya/reso salah penelompoan adalah sama atau dabaan, maa persamaan pada result (asus aturan ECM mnmum) menjad p f x = yan merupaan aturan TPM mnmum. TPM yatu jumlah semua peluan ( ) penelompoan yan bersfat salah penelompoan. Oleh arena tu, elompoan x e dalam, =,2,, d mana p f ( x ) bernla mnmum. = Nla tersebut aan bernla mnmum ja p f ( x ) bernla masmum, n menyebaban peluan posterornya menjad masmum. Hal n merupaan salah satu rtera dalam mendapatan aturan penelompoan yan optmal.

55 Jad elompoan x e dalam ja p f ( x ) bernla masmum. Atau denan ata lan elompoan x e dalam ja p f ( x) > p f ( x ) untu semua, atau, setara denan, elompoan x e dalam ja ln p f ( x) > ln p f ( x ) untu semua. 3.2.3 Penelompoan denan Populas Normal Multvarat Pada asus d mana f ( ) x, =,2,, meml funs epadatan normal multvarat denan vetor rata-rata dan matrs varans ovarans denan bentu: f x = exp x µ Σ x µ ( ) ( 2π ) ( ) ( ) p 2 2 Σ 2, =,2,,. (3.8) Ja semua baya/reso salah penelompoan adalah sama ( =0, = ; ), maa aturan penelompoan yan optmal yan memnmuman ECM (sama denan aturan TPM mnmum) menjad elompoan x e dalam ja p p f ( x ) = ln p ( ) ln ( 2π ) lnσ ( x µ ) Σ ( x µ ) ln Catatan : 2 2 2 = ln Σ x µ Σ x µ (3.9) ( ) ( ) p 2 ln 2 ( ) = masln p f x

56 x µ Σ x µ = x = xσ x + µ Σ x µ Σ µ. L ( ) ( ) d ( ) 2 2 2 But. ln p f ( x) = ln p exp x µ Σ x µ ( 2π ) ( 2π ) ( 2π ) ( ) ( ) p 2 2 Σ 2 ln p f ( x) = ln p + ln exp x µ Σ x µ Σ 2 ( ) ( ) p 2 2 ln p f ( x) = ln p + ln + ln + x µ Σ x µ Σ 2 ( ) ( ) p 2 2 p ( ) ( ) 2 2 x = p + π + Σ ( x µ ) Σ ( x µ ) ln p f ln ln ln 2 ln ln ln p f p p π 2 2 2 ( x) = ln ln ( 2 ) lnσ ( x µ ) Σ ( x µ ) Konstanta ( p 2) ln ( 2 ) elompo. Maa persamaan d atas menjad π dapat dabaan arena bernla sama untu semua ln p f x ln lnσ x µ Σ x µ. ( ) = p ( ) ( ) 2 2 Dar result 2 dperoleh ln p f ( ) > ln p f ( ) supremum dar p f ( ) ln x, sehna ln p f 2 x x, maa p f ( ) ( ) = mas ln p f ( ) ln x merupaan nla x x. Analss dsrmnan yan memenuh asums dstrbus normal multvarat terdr dar dua macam, yatu analss dsrmnan lner dan analss dsrmnan uadrat. 3.2.4 Analss Dsrmnan Lner

57 Analss dsrmnan lner (Lnear Dscrmnant Analyss = LDA) dunaan apabla observas X memenuh asums dstrbus normal multvarat dan homoentas matrs varans ovarans. Berdasaran persamaan (3.9) dapat ddefnsan sor dsrmnan lner. Karena matrs varans ovarans sama untu setap elomponya maa substtusan Σ =Σ, untu =,2,,. Oleh arena tu, untu populas e- sor dsrmnan lner ddefnsan sebaa: d ( ) ln x = Σ xσ x + µ Σ x µ Σ µ + ln p. (3.0) L 2 2 2 L L L Dua suu pertama aan bernla sama untu ( x), ( x),, ( x) d d2 d maa suu tersebut dapat dabaan. Sor dsrmnan lner menjad d ( ) K, x = µ Σ x 2µ Σ µ + ln p (3.) L Ja dan tda detahu, maa unaan x sebaa tasran vetor rata-rata dan unaan S ab sebaa tasran matrs varans ovarans abunan, yatu: S ab = ( n ) + ( n2 ) 2 + L+ ( n ) S S S n + n + L+ n 2. (3.2) Maa tasran ˆ L L d ( x ) dapat dperoleh dar sor dsrmnan lner d ( x ) yan dbentu berdasaran tasran matrs varans ovarans abunan yatu: dˆ ( ) x = x S x x S x + ln p (3.3) L ab 2 ab denan

58 x = vetor rata-rata sampel elompo e- S = matrs varans ovarans sampel elompo e- n = uuran sampel elompo e-. Oleh arena tu, tasran aturan penelompoannya adalah elompoan x e dalam ja ( 2 ) Sor dsrmnan lner ˆ L ( ) ˆ L ( ) ˆ L mas, ( ),, ˆ L d x = d x d x d ( x) K. (3.4) 3.2.5 Analss Dsrmnan Kuadrat Analss dsrmnan uadrat (Quadratc Dscrmnant Analyss = QDA) dunaan apabla observas X memenuh asums dstrbus normal multvarat tetap tda memenuh homoentas matrs varans ovarans (Σ tda sama). Berdasaran persamaan (3.9) dapat ddefnsan sor dsrmnan uadrat. Karena matrs varans ovarans tda sama untu setap elomponya, maa untu populas e- sor dsrmnan uadrat ddefnsan sebaa: d x = Σ x µ Σ x µ + ln p, =,2,,. (3.5) ( ) ln ( ) ( ) Q 2 2 Maa aturan penelompoannya adalah elompoan x e dalam ja ( 2 ) Q Q Q Q sor dsrmnan uadrat d ( x) = mas d ( x), d ( x),, d ( x) Ja dan tda detahu, maa tasran d ˆ Q ( ) Q uadrat d ( ) x adalah K. (3.6) x dar sor dsrmnan

59 dˆ x = ln S x x S x x + ln p, =,2,,, (3.7) ( ) ( ) ( ) Q 2 2 denan x = vetor rata-rata sampel elompo e- S = matrs varans ovarans sampel elompo e- n = uuran sampel elompo e-. Oleh arena tu, tasran aturan penelompoannya adalah elompoan x e dalam ja ( 2 ) sor dsrmnan uadrat ˆQ ( ) ˆQ ( ) ˆQ mas, ( ),, ˆQ d x = d x d x d ( x) K. (3.8) 3.2.6 Metode Jara Kuadrat Jara uadrat dperoleh dar persamaan (3.5) denan menabaan suu onstan, ln 2 Σ. Ja nla populas tda detahu, maa bentu tasran jara uadrat dar x e vetor rata-rata sampel e- x adalah. Untu asus matrs varans ovarans yan sama dalam setap elomponya atau Σ = Σ2 = L = Σ = Σ, yatu: D x = x x S x x, =, 2,...,. (3.9) ( ) ( ) ( ) 2 ab 2. Untu asus matrs varans ovarans yan tda sama dalam setap elomponya, yatu: D x = x x S x x, =,2,...,. (3.20) ( ) ( ) ( ) 2

60 Maa aturan penelompoannya adalah elompoan x e dalam atau, elompoan x e dalam 2 π ja D ( ) 2 π ja ( ) 2 x + ln p bernla masmum. (3.2) D x bernla mnmum (3.22) Ja peluan pror elompo e- tda detahu, maa aturan penelompoan basa menetapan p = p2 = L = p = atau suu ln p dapat dhlanan. (3.23) 3.3 Evaluas Hasl Penelompoan Ada suatu prosedur untu menetahu tnat etepatan penelompoan, d antaranya Actual Error Rate (AER) dan Apparent Error Rate (APER). Prosedur tersebut berdasaran dar matrs onfus. Matrs onfus menunjuan eanotaan elompo pada enyataan melawan eanotaan elompo yan dpreds. Untu observas dar dan 2 observas dar 2, maa matrs onfusnya adalah Keanotaan pada enyataan Keanotaan yan dpreds 2 = 2 2 = 2 2 2 2 D mana = jumlah tem yan delompoan secara benar sebaa tem = jumlah tem yan salah delompoan sebaa tem 2

6 2 = jumlah tem 2 yan delompoan secara benar sebaa tem 2 2 = jumlah tem 2 yan salah delompoan sebaa tem 3.3.. Apparent Error Rate (APER) Error Rate pada Apparent Error Rate (APER) merupaan propors salah penelompoan pada data trann sample. APER dapat denan mudah dhtun denan matrs onfus. Maa evaluas hasl penelompoan menunaan Apparent Error Rate (APER) adalah APER = = = n M n. (3.24) D mana n M adalah banyanya observas trann sample yan salah penelompoan pada elompo e-. n adalah banyanya observas pada elompo e-. Ketepatan penelompoannya adalah APER (3.25) 3.3.2. Actual Error Rate (AER) Error Rate pada Actual Error Rate (AER) merupaan propors salah penelompoan pada data sampel valdas atau holdout sample. Prosedur holdout

62 Lachenbruch dapat dunaan untu menetahu tnat etepatan penelompoan melalu Actual Error Rate (AER), d mana tasran dar espetas Actual Error Rate (AER) adalah: D mana ( H ) nm ˆ ( AER = ) =, =,2,..., E. (3.26) n = n adalah banyanya observas holdout yan salah penelompoan pada ( H ) M elompo e-. n adalah banyanya observas pada elompo e-. Ketepatan penelompoannya adalah ( ) Eˆ AER. (3.27)