Peerapa Metode Aalisis Regresi Logistik Bier Da Classificatio Ad Regressio Tree (CART) Pada Faktor yag Mempegaruhi Lama Masa Studi Mahasiswa Applicatio Of Biary Logistic Regressio Ad Classificatio Ad Regressio Tree (CART) Methods O Factors Affectig Legth Of Study Period Of Studets Chairuisa 1, Yuki Novia Nasutio 2, da Ika Puramasari 3 1 Laboratorium StatistikaTerapa FMIPA Uiversitas Mulawarma 2,3 Jurusa Matematika FMIPA Uiversitas Mulawarma 1 E-mail: aisa.adhifa24@gmail.com Abstract Biary Logistic Regressio is oe of the logistic regressio aalysis which is used to aalyze the relatioship betwee a dichotomous depedet variable with several idepedet variables. Classificatio ad Regressio Tree (CART) is oe of the methods that developed to perform classificatio aalysis o depedet variables either o omial, ordial, or cotiuous scale. I this research, Biary Logistic Regressio method ad Classificatio ad Regressio Tree (CART) applied to the data of the studets at Faculty of Math ad Natural Sciece Mulawarma Uiversity graduated i year 2016 to determie the characteristic of studet which is classified accordig to two categories that is the study period less tha or equal to 5 years ad study period more tha 5 Years, with five idepedet variables amely GPA Graduates X 1, Geder X 2, Type of Juior School X 3, Domicile X 4, ad Maor X 5. Factors that ifluece the study period of the studets based o Biary Logistic Regressio method are GPA, Geder, Secodary School Type ad Maor. The result of classificatio by usig CART method is the studet who have the study period less tha or equal to 5 Years is a studet from Chemistry maor or have GPA betwee 3,51 ad 4,00, while the study period more tha 5 Year is the studet who have GPA betwee 2,00 ad 2,75; 2,76 ad 3,50. I terms of classificatio accuracy, Biary Logistic Regressio method was able to accurately predict the observatio as much as 75.0%, while the CART method was able to accurately predict the observatio as much as 77.27%. Keywords : CART, Accuracy of Classificatio, Study Period, Biary Logistic Regressio. Pedahulua Pedidika petig bagi setiap orag sebagai bekal utuk dapat melagsugka kehidupaya. Petigya pedidika bagi setiap orag di dalam sebuah egara aka memberika pegaruh positif terhadap egara tersebut karea dega pedidika aka meigkatka kualitas sumber daya mausia sehigga bagi egara tetu aka meambah daya saig terhadap egara lai. Berdasarka Peratura Meteri Pedidika da Kebudayaa Republik Idoesia Nomor 49 Tahu 2014 tetag Stadar Nasioal Pergurua Tiggi yag tertulis pada Pasal 17 Nomor 3 masa studi terpakai bagi mahasiswa dega beba belaar program Diploma IV atau Saraa adalah selama 5 tahu. Fakultas Matematika da Ilmu Pegetahua Alam (FMIPA) Uiversitas Mulawarma merupaka salah satu fakultas dega umlah mahasiswa yag relatif bayak da memiliki empat Jurusa atara lai Statistika, Kimia, Biologi, da Fisika. Pada keyataaya, cukup bayak mahasiswa yag masa studiya paag dikareaka bayak faktor-faktor yag mempegaruhi ketidaktepata waktu kelulusa mahasiswa tersebut. Sehigga perlu dilakuka aalisis utuk megetahui faktor apa saa yag mempegaruhi lama masa studi mahasiswa FMIPA. Regresi logistik bier merupaka salah satu regresi logistik yag diguaka utuk megaalisis hubuga atara satu variabel terikat da beberapa variabel bebas, dega variabel terikatya berupa data kualitatif dikotomi yaitu berilai 1 utuk meyataka keberadaa sebuah karakteristik da berilai 0 utuk meyataka ketidakberadaa sebuah karakteristik (Hosmer & Lemeshow, 2000). CART adalah salah satu metode atau algoritma dari salah satu tekik eksplorasi data yaitu tekik poho keputusa. CART dikembagka utuk melakuka aalisis klasifikasi pada variabel terikat baik yag omial, ordial maupu kotiu (Breima dkk, 1993). Berdasarka hal-hal yag telah diuraika, maka Peulis tertarik utuk membahas tetag pegguaa Metode Regresi Logistik Bierda Classificatio ad Regressio Tree (CART) dalam megaalisis lama masa studi mahasiswa Fakultas Matematika da Ilmu Pegetahua Alam (FMIPA) Uiversitas Mulawarma dega variabel-variabel yag mempegaruhi lama masa studi mahasiswa. Regresi Logistik Bier Aalisis Regresi Logistik Bier memiliki tuua utuk medapatka model terbaik da sederhaa yag meggambarka hubuga atara variabel terikat dega variabel-variabel bebas, dega variabel terikatya yag bersifat dikotomi da variabel bebasya dapat berupa variabel kualitatif da kuatitatif(hosmer da Lemeshow, 2000). Program Studi Statistika FMIPA Uiversitas Mulawarma 125
Syarat utama dalam regresi logistik bier adalah variabel terikatya berupa variabel bier yaitu variabel diskrit dega dua ilai. Misalya diambil ilustrasi, bila variabel terikat tidak teradi diberi ilai 0 da bila variabel terikat teradi diberi ilai 1, sedagka variabel bebasya dapat berupa variabel kuatitatif. Utuk ilai variabel bebas bertipe kualitatif biasaya disebut uga variabel boeka (dummy) da dilakuka pemberia suatu agka agar dapat diaalisis. Variabel kualitatif ii berupa variabel dikotomi atau dapat berupa variabel polikotomus. Utuk variabel berupa kuatitatif didefiisika secara lagsug da biasaya disebut variabel kotiu. Peaksira Parameter Regresi Logistik Bier Dalam Hosmer da Lemeshow (2000), peaksira parameter pada model regresi logistik yag mempuyai variabel terikat dikotomi adalah megguaka metode Maximum Likelihood Estimatio (MLE). Pada dasarya metode MLE meetapka asumsi distribusi Beroulli da obek pegamata salig bebas atau memberika ilai taksira parameter dega memaksimumka fugsi likelihood (likelihood fuctio). Dalam betuk persamaa matematis, persamaa logistik diyataka dalam betuk berikut : p 0 x 1 e (1) ( x) p 0 x 1 1 e Fugsi ii merupaka probabilitas dari data dalam meghasilka ilai estimasi parameter. Jika y=1, maka P( y 1 x) e p 0 x 1 p 0 x 1 1 e Jika y=0, maka 1 P( y 0 x) 0 1 e Betuk fugsi likelihoodya adalah : xi x yi p x 1 da, L β 1 xi (2) i1 1 i dega L β = likelihood. Utuk memaksimalka fugsi likelihood, rumus tersebut diubah ke dalam betuk log likelihood dega otasi l β utuk memudahka peyelesaia persamaa matematisya dapat diperoleh persamaa : l β = yi l xi 1 yi l1 xi i1 (3) Peguia Parameter Peguia parameter dalam regresi petig utuk dilakuka. Hal ii dikareaka peguia tersebut diguaka utuk meetuka apakah variabel bebas dalam model sigifika terhadap variabel terikat. Peguia dapat dilakuka secara: Ui Simulta Meurut Hosmer da Lemeshow (2000), ui simulta bertuua utuk megetahui pegaruh variabel bebas secara seretak atau simulta terhadap variabel terikat. Lagkah peguiaya adalah sebagai berikut : Hipotesis : H 0 : β 1 = β 2 = = β P = 0 H 1 : Palig sedikit ada satu β 0, (miimal ada satu variabel bebas yag berpegaruh secara simulta terhadap variabel terikat) dimaa = 1,2,, p Statistik Ui : Statistik ui yag diguaka adalah G, yaki likelihood ratio : G i 2 0 yi l ˆ i 1 yi l1 ˆ i 1 l1 0 l l 1 Statistik ui G ii megikuti distribusi chi-square dega db adalah deraat bebas yag merupaka bayakya variabel bebas dalam model. Keputusa ui diperoleh dega membadigka G da ilai χ 2 (H 0 ditolak ika ilai G χ 2 (α,db ) ). Ui Parsial Dalam Hosmer da Lemeshow (2000), ui parsial dilakuka dega megui setiap β secara idividual aka meuuka apakah suatu variabel bebas layak utuk masuk dalam model atau tidak. Hipotesis : H 0 :β = 0, (tidak ada pegaruh variabel bebas ke- terhadap variabel terikat) H 1 : β 0, (ada pegaruh variabel bebas ke- terhadap variabel terikat) dimaa = 1, 2,...,p Statistik Ui : ˆ W,dega SE ˆ var ˆ (5) SE ˆ (4) Statistik ui Wald megikuti distribusi ormal sehigga memperoleh keputusa peguia, ilai W dibadigka dega ilai Z α/2 (H 0 ditolak ika ilai W Z α/2 atau p-value α). Ui Kesesuaia Model Dalam Hosmer da Lemeshow (2000), ui statistik Goodess of Fit diguaka utuk megetahui kesesuaia model. Lagkah Ui Goodess of Fit adalah sebagai berikut : Hipotesis : H 0 : Tidak ada perbedaa atara hasil pegamata dega ilai dugaa H 1 : Ada perbedaa atara hasil pegamata dega ilai dugaa 126 Program Studi Statistika FMIPA Uiversitas Mulawarma
Statistik Ui : Cˆ g k 1 ' Ok k k (6) ' ˆ 1 k k k 2 Utuk variabel bebas yag bersifat polikotomus, metode yag dipilih adalah megguaka koleksi desai variabel (Dummy variabel). Jika H 0 bear, maka distribusi statistik ui C megikuti distribusi chi-square dega deraat bebas g-2.daerah peolaka H 0 adalah ika C χ 2 (α,g 2) atau p-value α. Peafsira Koefisie Model Regresi Logistik Dalam megiterpretasika atau meafsirka koefisie β pada regresi logistik, hal yag harus selalu diperhatika adalah eis variabel bebasya, berupa dikotomi, polikotomus atau kotiu. Odds ratio (ψ) diguaka utuk megitrepretasi model regresi logistik. Utuk variabel bebas yag bersifat dikotomi, diasumsika ilai x adalah 0 da 1, sehigga dalam model aka terdapat dua ilai π(x) da dua ilai 1 π(x). Tabel 1. Nilai Model Regresi Logistik utuk Variabel Bebas bersifat Bier Variabel Bebas (x) Variabel terikat (y) y = 1 y = 0 x = 1 x = 0 π 1 = eβ 0+β 1 1 + e β π 0 = eβ0 0+β 1 1 + e β 0 1 1 1 π 1 = 1 + e β 1 π 0 = 0+β 1 1 + e β 0 (Sumber : Hosmer da Lemeshow, 2000) Odds ratio utuk teradiya variabel terikat di atara variabel bebas yag mempuyai ilai x=1 adalah : P y = 1 x = 1) P y = 0 x = 1) = π(1) 1 π(1) Sedagka Odds ratio utuk teradiya variabel terikat di atara variabel bebas yag mempuyai x=0 adalah : P y = 1 x = 0) P y = 0 x = 0) = π(0) 1 π(0) Odds ratio adalah rata-rata besarya kecederuga variabel terikat berilai tertetu ika x=1 dibadigka dega x=0, dilambagka dega ψ da diyataka dalam persamaa : π (1) (1 π 1 ) ψ = π (0) = π(1)/(1 π 1 ), π(0)/(1 π 0 ) (1 π 0 ) Iterpretasi odds-ratio (ψ) adalah meelaska beberapa kali lipat keaika atau peurua peluag y=1, ika ilai variabel bebas (X) berubah sebesar ilai tertetu ilai odds ratio selalu positif. Log odds ratio merupaka perbedaa atau selisih ilai logistik. Dega mesubsitusika model regresi logistik pada Tabel 1, maka odds ratio meadi : ψ = e β 1 Sehigga log odds ratio meadi : l ψ = β 1 (Hosmer da Lemeshow, 2000) Classificatio ad Regressio Tree (CART) CART adalah salah satu metode atau algoritma dari salah satu tekik eksplorasi data yaitu tekik poho keputusa. Metode ii dikembagka oleh Leo Breima, Jerome H. Friedma, Richard A. Olshe da Charles J. Stoe sekitar Tahu 1980-a. CART meghasilka suatu poho klasifikasi ika variabel terikatya kategorik, da meghasilka poho regresi ika variabel terikatya kotiu. Tuua utama CART adalah utuk medapatka suatu kelompok data yag akurat sebagai peciri dari suatu pegklasifikasia (Timofeev, 2004). Meurut Breima, dkk (1993), keuggula dari CART adalah tidak perlu dipeuhiya asumsi sebara oleh semua variabel, serta algoritmaya yag lagsug dapat meagai masalah data hilag. CART uga tidak dipegaruhi oleh pecila, koliieritas, heteroskedastisitas yag biasaya mempegaruhi metode parametrik. Dalam CART, pecila aka diisolasi ke dalam ode (simpul) tertetu sehigga tidak mempegaruhi peyekata, karea megguaka variabel yag koliier sebagai peyekat buata. Poho klasifikasi merupaka metode peyekata data secara berulag (rekursif) da secara bier, karea selalu membagi kumpula data meadi dua sekata. Setiap sekata data diyataka sebagai simpul (ode) dalam poho yag terbetuk. Hasil dari proses peyekata ii direpresetasika dalam suatu struktur poho seperti terlihat pada Gambar 1 (Breima dkk,1993). Lewis (2000) meyebut simpul asal (root) sebagai simpul iduk (paret ode), simpul iduk dapat disekat meadi simpul aak (childre ode). Gambar 1. Struktur Poho Klasifikasi Pada Gambar 1, A, B da C merupaka variabel-variabel peelas yag terpilih utuk meadi simpul. A merupaka simpul asal atau simpul iduk, semetara B da C merupaka simpul aak dimaa C uga merupaka simpul akhir yag tidak bercabag lagi. Semetara t merupaka suatu ilai yag merupaka ilai tegah atara dua ilai amata variabel x secara beruruta. Adapu beberapa lagkah-lagkah peerapa dalam CART, yaitu Pembetuka Program Studi Statistika FMIPA Uiversitas Mulawarma 127
Poho Klasifikasi, Pemagkasa Poho Klasifikasi, da Peetua Poho Klasifikasi Pembetuka Poho Klasifikasi Proses pembetukapohoklasifikasi terdiri atas 3 tahapa, yaitu pemiliha pemilah, peetua simpul termial, da peadaa label kelas. Pemiliha Pemilah (Classifier) Utuk membetuk poho klasifikasi diguaka sampel data Learig (L) yag masih bersifat heteroge. Rumus kemugkia pemilah disaika sebagai berikut : Variabel bebas kotiu = 1 pemilaha (7.a) Variabel bebas kategori omial= 2 L 1 1 (7.b) Variabel bebas kategori ordial = L 1 (7.c) dimaa : = Bayakya data pada satu variabel bebas L = Data Learig Sampel tersebut aka dipilah berdasarka atura pemilaha da kriteria goodess of split. Pemiliha pemilah bergatug pada eis poho atau lebih tepatya tergatug pada eis variabel terikatya. Utuk megukur tigkat keheterogea suatu kelas dari suatu simpul tertetu dalam poho klasifikasi dikeal dega istilah impurity measure i(t). Metode fugsi impurity measurei (t) yag serig diguaka adalah Ideks Gii : i t = i p t p k t (8) dimaa : k, = Kelas p t = Probabilitas bersyarat kelas yag berada pada simpul t Goodess Of Split merupaka suatu evaluasi pemiliha oleh pemilah s pada simpul t. Goodess Of Split φ(s, t)didefiisika sebagai peurua keheterogea. Kualitas ukura dari seberapa baik pemilah s dalam meyarig data meurut kelas merupaka ukura peurua keheterogea dari suatu kelas da didefiisika sebagai : φ s, t = i s, t = i t p L i t L p R i t R (9) dega : i t = Fugsi keheterogea ideks Gii φ s, t = Kriteria Goodess Of Split p L i t L = Proporsi pegamata dari simpul t meuu simpul kiri p R i t R = Proporsi pegamata dari simpul t meuu simpul kaa Pemilah yag meghasilka ilai i s, t lebih tiggi merupaka pemilah yag lebih baik karea hal ii memugkika utuk mereduksi keheterogea secara lebih sigifika. Partisi t L da t R, merupaka partisi dari simpul t meadi dua himpua bagia salig lepas dimaa p L da p R adalah proporsi masig-masig peluag simpul. Karea t L t R = t maka ilai i s, t mempresetasika perubaha dari keheterogea dalam simpul t yag semata-mata disebabka oleh pemilah s. Pegembaga poho dilakuka dega mecari semua kemugkia pemilah pada simpul t 1 sehigga ditemuka pemilah s yag memberika ilai peurua keheterogea tertiggi yaitu : i s, t 1 = max s S i s, t 1 (10) (Breima dkk, 1993). Peetua Simpul Suatu simpul t aka meadi simpul termial atau tidak, aka dipilah kembali bila pada simpul t tidak terdapat peurua keheterogea secara berarti atau adaya batasa miimum seperti haya terdapat satu pegamata pada tiap simpul aak. Umumya umlah kasus miimum dalam suatu termial akhir adalah 5, da apabila hal itu telah terpeuhi maka pegembaga poho dihetika (Lewis, 2000). Peadaa Label Kelas Peadaa label kelas pada simpul termial dilakuka berdasarka atura umlah terbayak, yaitu : N (t) p o t = max p t = max (11) N(t) dega p t adalah proporsi kelas pada simpul t, N (t) adalah umlah pegamata kelas pada simpul t da N(t) adalah umlah pegamata pada simpul t. Label kelas simpul termial t adalah o yag memberi ilai dugaa kesalaha pegklasifikasia simpul t terbesar. Proses pembetuka poho klasifikasi berheti saat terdapat haya satu pegamata dalam tiap-tiap simpul aak atau adaya batasa miimum, semua pegamata dalam tiap simpul aak idetik, da adaya batasa umlah level/kedalama poho maksimal. Setelah terbetuk poho maksimal, tahap selautya adalah pemagkasa poho utuk mecegah terbetukya poho klasifikasi yag berukura besar da kompleks. Ideks Gii (Gii Idex) Atura pemisaha Gii (ideks Gii) adalah atura yag palig luas atau palig serig diguaka. Atura ii megikuti fugsi impurity i(t), dimaa fugsi impurity adalah suatu fugsi yag diguaka utuk megukur keakurata model dega memberika idikasi kehomogea kelas-kelas pada data sehigga pada simpul akhir (termial ode) aka didapatka data yag lebih muri. Berdasarka persamaa (8), rumus Ideks Gii adalah : i t = p t p k t k Ideks Gii memiliki iterpretasi yag mearik. Sebagai gati pegguaa atura pluralitas utuk megklasifikasika obek dalam t simpul, megguaka atura yag memberika suatu obek yag dipilih secara acak dari simpul 128 Program Studi Statistika FMIPA Uiversitas Mulawarma
(ode) ke kelas dega probabilitas p t. Probabilitas memperkiraka bahwa item sebearya di kelas k adalah p k t. Jika simpul t dibelah meadi 2 buah subset L da R dega ukura masig-masig 1 da 2, ideks gii dari pembelaha tersebut didefiisika sebagai berikut : gii pembela ha t = 1 L + 2 i t R (12) dimaa : gii pembela ha = Nilai ideks Gii setiap variabel i t L = Nilai ideks Gii subset L i t R = Nilai ideks Gii subset R = Bayakya seluruh data 1 2 = Bayakya data pada subset L = Bayakya data pada subset R Ideks Gii ii sederhaa da cepat dihitug, ideks ii uga dapat meggabugka ilai kesalaha variabel simetri dega cara alami. Pemagkasa Poho Klasifikasi Utuk medapatka poho yag layak maka perlu dilakuka pemagkasa (pruig) yaitu suatu peelitia ukura poho tapa megorbaka ketepata melalui peguraga simpul poho sehigga dicapai ukura poho yag layak. Dega kata lai pemagkasa poho dilakuka utuk medapatka poho akhir yag lebih sederhaa. Ukura pemagkasa yag diguaka utuk memperoleh ukura poho yag layak adalah Cost Complexity Miimum (Breima dkk, 1993). Sebagai ilustrasi, utuk sembarag poho T yag merupaka subpoho dari poho terbesar T max diperoleh ukura complexity-ya yaitu T yag meyataka bayakya simpul akhir pada poho T tersebut. Dalam regresi biasa, T aalog dega deraat bebas model. Utuk suatu α 0, yag disebut sebagai parameter complexity yaki ukura tetag cost bagi peambaha satu simpul akhir pada poho T, maka besarya Resubtitutio estimasi poho T pada kompleksitas α adalah : ~ R ( t) R( T ) T (13) dimaa : R α (t) = Resubtitutio suatu poho T pada kompleksitas α R(T) = Resubtitutio Estimate (Proporsi kesalaha pada sub poho) α = Kompleksitas Parameter (Complexity Parameter) T = Ukura bayakya simpul termial poho T(complexity) Resubtitutio suatu poho T pada kompleksitas αmerupaka kombiasi liier dari Resubtitutio Estimate da ilai kompleksitas poho yag dibetuk. Cost complexity pruig meetuka suatu poho bagia T(α) yag memiimumka R α (t) pada seluruh poho bagia utuk setiap ilai α. Nilai kompleksitas α aka secara perlaha meigkat selama proses pemagkasa. Selautya mecari poho bagia max (T α < T) yag memiimumka R α (t) yaitu : R ( T( )) mi R ( T) (14) TTMAX Jika R(T) diguaka sebagai kriteria peetua poho optimal maka aka cederug poho terbesar adalah T 1, sebab semaki besar poho, maka semaki kecil ilai R(T). Yag perlu diperhatikadalam pemagkasa buka T max melaika T 1, yaki suatu sub poho yag memeuhi kriteria R T 1 = R(T max ). Utuk medapatka T 1 dari T max, ambil t L da t R yag merupaka simpul aak kiri da simpul aak kaa dari T max yag dihasilka dari simpul iduk t. Kemudia hitug ilai t L da t R megguaka persamaa R( T) r( t) P( t) (15) Dega ilai r t = 1 max P t da P t adalah peluag beberapa obek yag berada dalam simpul, begitu diperoleh dua simpul aak da simpul idukya yag memeuhi persamaa R( T ) R( t L ) R( t R ) (16) maka pagkas simpul aak t L da t R tersebut (Breima dkk, 1993). Peetua Poho Klasifikasi Optimal Poho klasifikasi yag berukura besar aka memberika ilai peduga peggati palig kecil, sehigga poho ii cederug dipilih utuk meduga ilai respo. Tetapi ukura poho yag besar aka meyebabka ilai kompleksitas yag tiggi karea struktur data yag digambarka cederug kompleks, sehigga perlu dipilih poho optimal yag berukura sederhaa tetapi memberika ilai peduga peggati cukup kecil. Ada dua eis peduga peggati yaitu peduga sampel ui idepedet (idepedet test sample estimate) da peduga validasi silag lipat V (cross validatio V-fold estimate). Peduga validasi silag lipat V serig diguaka apabila pegamata yag dilakuka tidak cukup besar atau sampel kurag dari 3000. Pegamata dalam L dibagi secara acak meadi V bagia yag salig lepas dega ukura kurag lebih sama besar utuk setiap kelasya. Poho T (V) dibetuk dari L L V dega v = 1,2,...,V. Misalka d v (x) adalah hasil pegklasifikasia, v peduga sampel ui utuk R(T 1 ) yaitu : ts ( V ) 1 ( V ) R ( Tt ) X ( d ( x x L ) ( ) ) (17) V Nv dega Nv N adalah umlah pegamata V dalam L V. Kemudia dilakuka prosedur yag sama megguaka seluruh L, maka peduga validasi silag lipat V utuk T (V) t adalah : V Cv 1 ts ( v) R ( Tt ) R ( T ) (18) V v1 Program Studi Statistika FMIPA Uiversitas Mulawarma 129
Poho klasifikasi optimum dipilih T dega Cv Cv R T ) mi R ( T ) (19) ( * t t Ketepata Klasifikasi Kriteria perbadiga tekik klasifikasi didasarka pada kesalaha klasifikasi yag dikeal dega Apparet Error Rate (APER) merupaka ilai dari besar kecilya umlah observasi yag salah dalam pegklasifikasia berdasarka suatu fugsi klasifikasi (Johso da Wiche, 2007). Tabel 2. Klasifikasi Aktual da Prediksi Kelas Prediksi Kelas Aktual y=0 y=1 y=0 00 01= 0-00 y=1 10= 1-11 11 APER = 00+ 11 0 + 1 100%(20) Hasil da Pembahasa 1. Aalisis Statistika Deskriptif Karakteristik yag digambarka pada aalisis deskriptif adalah IPK, eis kelami, eis sekolah meegah, daerah asal, urusa Lama Studi 38% 62% <= 5 Tahu > 5 Tahu Gambar 2. Persetase Lama Studi Gambar 2 meuukka lama studi mahasiswa FMIPA Uiversitas Mulawarma Tahu 2016. Dari 188 mahasiswa, sebesar 62 % atau 116 mahasiswa FMIPA Uiversitas Mulawarma masuk dalam kategori 1 yaitu lama studi 5 Tahu. 2. Aalisis Regresi Logistik Bier Model regresi logistik bier sesuai pada persamaa (1) dega 5 variabel bebas diperoleh hasil estimasi parameter model regresi sebagai berikut : π x = e 1,199 1,809 X 1 1 21,688 X 1 2 1,207 X2+1,828 X3 0,144 X4+X 5 1 +2,368 X 5 2 +0,126 X 5 3 1 + e 1,199 1,809 X 1 1 21,688 X 1 2 1,207 X2+1,828 X3 0,144 X4+X 5 1 +2,368 X 5 2 +0,126 X 5 3 Tabel 3 meuukka Pegkodea Desai Variabel Polikotomus. Berdasarka Tabel 3 yag meadi IPK Mahasiswa respodeya adalah 3,51 IPK 4,00 kedua desai variabel yag terbetuk yaitu D 1 da D 2 keduaya aka sama dega 0, ketika IPK dari respode adalah 2,76 IPK 3,50 D 1 aka sama dega 1 da D 2 masih sama dega 0; ketika IPK dari respodeya adalah 2,00 IPK 2,75, maka D 1 aka sama dega 0 da D 2 = 1. Tabel 3.Variabel Racaga Utuk IPK Mahasiswa IPK Variabel Racaga Mahasiswa D 1 D 2 3, 51 IPK 4, 00 0 0 2, 76 IPK 3, 50 1 0 2, 00 IPK 2, 75 0 1 Tabel 4.Variabel Racaga Utuk Jurusa Jurusa Variabel Racaga D 1 D 2 D 3 Biologi 0 0 0 Fisika 1 0 0 Kimia 0 1 0 Matematika 0 0 1 Berdasarka Tabel 4 yag meadi Jurusa respodeya adalah Biologi ketiga desai variabel yag terbetuk yaitu D 1, D 2 da D 3 ketigaya aka sama dega 0 ; ketika Jurusa dari respode adalah FisikaD 1 aka sama dega 1, D 2 masih sama dega 0 da D 3 masih sama dega 0 ; ketika Jurusa dari respodeya adalah Kimia maka D 1 aka sama dega 0 da D 2 sama dega 1 da D 3 samadega 0 ; ketika Jurusa dari respodeya adalah Matematika maka D 1 aka sama dega 0 da D 2 sama dega 1 da D 3 sama dega 1. Peguia Sigifikasi Parameter Ui Simulta Hipotesis H 0 : β 1(1) = β 1(2) = β 2 = β 3 = β 4 = β 5(1) = β 5(2) = β 5(3) = 0 (secara simulta variabel bebas tidak berpegaruh terhadap variabel terikat). H 1 :Palig sedikit ada satu β 0, dega = 1,2,...,5 (miimal ada satu variabel bebas yag berpegaruh secara simulta terhadap variabel terikat). Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui G (Likelihood Ratio Test) pada Persamaa (4), dimaa : 1 = 116 ( Mahasiswa Lama Studi 5 Tahu ) 0 = 72 ( Mahasiswa Lama Studi > 5 Tahu ) = 188 ( Jumlah Mahasiswa Lulus Tahu 2016) Perhituga : Berdasarka perhituga megguaka software SPSS 20 diperoleh : G = 358,962 Daerah Peolaka 2 Meolak H 0 ika ilai G χ (0,05;5) = 11,07 Keputusa da Kesimpula 130 Program Studi Statistika FMIPA Uiversitas Mulawarma
Berdasarka hasil perhituga diperoleh ilai G = 358,962 dimaa ilai G = 358,962 2 χ (0,05;5) = 11,07 maka dapat putuska bahwa meolak H 0 sehigga dapat disimpulka bahwa miimal ada satu variabel bebas yag berpegaruh terhadap variabel terikat. Ui Parsial Tabel 5. Ui Parsial Variabel Kostata da Variabel Bebas Var ˆ Wald p-value Keputusa X 1(1) -1,809 10,775 0,001 Meolak H 0 X 1(2) -21,68 0,000 1,000 Meerima H 0 X 2 1,207 7,483 0,006 Meolak H 0 X 3 1,828 4,746 0,029 Meolak H 0 X 4-1,144 0,135 0,713 Meerima H 0 X 5(1) 0,000 0,000 1,000 Meolak H 0 X 5(2) 2,368 19,601 0,000 Meolak H 0 X 5(3) 0,126 0,058 0,809 Meerima H 0 C -1,199 1,223 0,269 Meerima H 0 Hipotesis H 0 : β 0 = 0 (tidak ada pegaruh variabel kostata terhadap variabel terikat). H 1 : β 0 0 (ada pegaruh variabel kostata terhadap variabel terikat) Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui Wald pada Persamaa (5) Daerah Peolaka Meolak H 0 ika ilai p-value α atau ilaiw Z α/2 Keputusa da Kesimpula Berdasarka Tabel 5 diperoleh ilai p-value utuk variabel kostata adalah sebesar 0,269, da ilai Ui Wald = 1,223<Z 0,05/2 = 1,960 maka dapat disimpulka bahwa tidak ada pegaruh variabel kostata terhadap variabel terikat. Hipotesis H 0 : β = 0 (tidak ada pegaruh variabel bebas ke- terhadap variabel terikat). H 1 : β 0 (ada pegaruh variabel bebas ke- terhadap variabel terikat) dimaa = 1,2,...,5. Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui Wald pada Persamaa (5) Daerah Peolaka Meolak H 0 ika ilai p-value α atau ilai W Z α/2 Keputusa da Kesimpula Berdasarka Tabel 6 diperoleh ilai p-value utuk variabel X 1(1), X 1 2, X 2, X 3, X 4, X 5(1), X 5(2), X 5(3), masig-masig adalah 0,001 ; 1,000 ; 0,006 ; 0,029 ; 0,713 ; 1,000 ; 0,000 ; da 0,809 da ilai Ui Wald adalah 10,775 ; 000 ; 7,483 ; 4,746 ; 0,135 ; 0,000 ; 19,601 ; 0,058 maka dapat disimpulka bahwa variabel yag berpegaruh secara parsial terhadap lama studi adalah IPK (X 1(1) ), Jeis Kelami (X 2 ), Jeis Sekolah Meegah (X 3 ) da Jurusa (X 5(2) ). Model Terbaik Regresi Logistik Bier Berdasarka hasil output SPSS 20 model terbaik dega megguaka metode Backward Wald diperoleh tabel sebagai berikut : Tabel 6. Nilai Model Regresi Logistik Variabel ˆ P-value X 1(1) -1,820 0,001 X 2-1,221 0,006 X 3 1,816 0,030 X 5(2) 2,359 0,000 Diperoleh model sebagai berikut : π x = eβ 1(1)X 1(1) +β 2 X 2 +β 3 X 3 +β 5(2) X 5(2) 1 + e β 1(1)X 1(1) +β 2 X 2 +β 3 X 3 +β 5(2) X 5(2) Tabel 6 meuukka bahwa model sudah baik. Karea semua variabel memiliki ilai p- value < 0,05. Sehigga dapat disimpulka bahwa faktor-faktor yag sagat berpegaruh pada lama studi adalah IPK (X 1(1) ), Jeis Kelami (X 2 ), Jeis Sekolah Meegah (X 3 ) da Jurusa (X 5(2) ). Sehigga model regresi logistik terbaik utuk memprediksi kepuasa pelagga adalah: π x = e 1,820 X 1 1 1,221 X 2 +1,816 X 3 +2,359X 5(2) 1 + e 1,820 X 1 1 1,221 X 2 +1,816 X 3 +2,359X 5(2) Ui Kesesuaia model Hipotesis H 0 : Model sudah sesuai (Tidak ada perbedaa atara hasil pegamata dega hasil dugaa) H 1 : Model belum sesuai (Ada perbedaa atara hasil pegamata dega hasil dugaa) Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui Goodess of Fit pada Persamaa (6) Daerah Peolaka Meolak H 0 ika p-value 0,05 atau ilai C χ 2 (α,g 2) Keputusa da Kesimpula Berdasarka Tabel Ui Hosmer da Lemeshow, meuukka bahwa ilai p-value = 0,478 >α = 0,05da ilai C = 6,545 < χ 2 = 14,067 maka dapat diputuska (0,05,7) bahwa gagal meolak H 0 sehigga dapat disimpulka bahwa tidak ada perbedaa atara hasil pegamata dega ilai dugaa atau model regresi tersebut layak utuk diguaka. Program Studi Statistika FMIPA Uiversitas Mulawarma 131
Iterpretasi Model Berikut merupaka tabel ilai odds ratio masig-masig variabel. Tabel 7 Kotribusi Variabel X Terhadap Y Variabel Exp( ˆ ) X 1(1) 0,162 X 2 3,390 X 3 6,145 X 5(2) 10,583 Tabel 7 meelaska bahwa : 1. Mahasiswa yag ilai IPK 2,76 IPK 3,50 memiliki peluag sebesar 0,162 kali lebih kecil meempuh Lama Studi 5 Tahu dibadigka dega mahasiswa yag ilai IPK adalah 3,51 IPK 4,00. 2. Mahasiswa dega eis kelami Perempua memiliki peluag sebesar 3,390 kali lebih lebihbesar meempuh Lama Studi 5 Tahu dibadigka dega dega mahasiswa dega eis kelami Laki-Laki. 3. Mahasiswa dega eis sekolah meegah SMA memiliki peluag sebesar 6,145 kali lebih besar utuk meempuh Lama Studi 5 Tahu dibadigka dega dega mahasiswa dega eis sekolah meegah SMK. 4. Mahasiswa yag berasal dari urusa Kimia memiliki peluag sebesar 10,583 kali lebih besar meempuh Lama Studi 5 Tahu dibadigka dega mahasiswa yag berasal dari urusa Biologi. Ketepata Klasifikasi Model Berikut adalah hasil perhituga ketepata klasifikasi model : 53 + 88 100% = 75 % 188 Berdasarka perhituga ketepata klasifikasi diperoleh 75 % yag artiya poho klasifikasi yag terbetuk mampu memprediksi dega tepat pegamata sebesar 75%. 3. Classificatio ad Regressio Tree (CART) Pembetuka Poho Klasifikasi N = 96 Dalam proses pembetuka poho klasifikasi, terdapat 3 tahapa yaitu pemiliha pemilah, peetua simpul termial, da peadaa label kelas. Pemiliha Pemilah Perhituga pemilah pada setiap variabel yaitu dega megguaka persamaa (7.b) utuk variabel peelas kategori omial yaitu variabel Jeis Kelami (X 2 ), Jeis Sekolah Meegah (X 3 ), Daerah Asal (X 4 ), da Jurusa (X 5 ), da persamaa (7.c) utuk variabel peelas kategori ordial yaitu Variabel IPK (X 1 ). Adapu IPK = (2,...) > 5 Tahu 61 63.5 <= 5 Tahu 35 36.5 W = 96.000 pemiliha pemilah dilakuka dega meghitug ilai IdeksGiisetiapkemugkiapemilah. Tabel 8. Rekapitulasi Idex Gii utuk 5 Variabel Bebas Variabel Nilai Idex Gii IPK kemugkia ke-1 0,4260 IPK kemugkia ke-2 0.4685 Jeis Kelami 0,4528 Jeis Sekolah Meegah 0,4504 Asal Daerah 0,4723 Jurusa kemugkia ke-1 0,4572 Jurusa kemugkia ke-2 0,4418 Jurusa kemugkia ke-3 0,3928 Jurusa kemugkia ke-4 0,4714 Jurusa kemugkia ke-5 0,4538 Jurusa kemugkia ke-6 0,4444 Jurusa kemugkia ke-7 0,4122 Dari hasil perhituga ilai ideks Gii kelima variabel bebas, dapat diketahui bahwa variabel yag memiliki ilai ideks Gii terkecil adalah variabel Jurusa dega ilai ideks Gii 0,3928. Sehigga variabel Jurusa kemugkia ke-3 yaitu Biologi, Fisika, da Matematika dipilih sebagai pemilah pertama seperti Gambar 3. JURUSAN = (Biologi,...) Node 2 IPK = (2,76 <= IPK <= 3.50, 2.00 <= IPK <= 2.75) Gambar 3. Variabel Pemilah Node 3 Pertama Class = <= 5 Tahu Setelah terbetuk da Class terpilih Cases % kriteria > 5 Tahu 8 11.8 pemiliha terbaik, maka simpul <= 5 Tahu yag 60 88.2berisi 188 W = 68.000 obek W = 120.000data dipilah meadi 2 N = 68 simpul. Simpul N = 120 termial 1 terbetuk akibat kriteria variabel Jurusa Biologi, Fisika, da Matematika. Sedagka simpul IPK = (3,...) 2 terbetuk akibat kriteria variabel Jurusa Kimia Node 2 sesuai dega gambar 3. Class = <= 5 Tahu Karea perhituga maual cukup rumit > 5 Tahu 3 12.5 da membutuhka waktu yag lama, maka <= 5 Tahu 21 87.5 diguaka batua W = 24.000 softwarespmv8.0 utuk N = 24 memudahka peeliti dalam meetuka pemilah. Peetua Simpul Tahap kedua yaitu tahap peetua simpul termial. Simpul t dikataka sebagai simpul termial ika tidak terdapat peurua keheterogea yag berarti sehigga tidak aka dipilah lagi. Berdasarka Gambar 4, dapat diketahui bahwa poho klasifiksi maksimal yag terbetuk mempuyai kedalama 7. Sedagka simpul termial yag dihasilka oleh poho klasifikasi maksimal adalah 12 simpul termial. > 5 Tahu 64 53.3 <= 5 Tahu 56 46.7 JURUSAN = (Biologi,Fisika,Matematika) > 5 Tahu 72 38.3 <= 5 Tahu 116 61.7 W = 188.000 N = 188 JURUSAN = (Kimia) 132 Program Studi Statistika FMIPA Uiversitas Mulawarma
Gambar 4. Poho Klasifikasi Maksimal Peadaa Label Kelas Tahap ketiga adalah peadaa label kelas, berdasarka pada persamaa (11). Sebagai cotoh, pada gambar 3, utuk simpul 1. P (Lama Studi 5 Tahu t)= 116 188 = 0,6170 P (Lama Studi > 5 Tahu t)= 72 188 = 0,3829 Sehigga simpul iduk diberi label kelas lama studi 5 Tahu, karea peluag kelas tersebut lebih besar dari pada peluag kelas laiya. Pemagkasa Poho Klasifikasi Proses pemagkasa poho klasifikasi dimulai dega megambil t R yag merupaka simpul aak kaa da t L yag merupaka simpul aak kiri dari T max yag dihasilka dari simpul iduk t. Jika diperoleh dua simpul aak da simpul iduk yag memeuhi persamaa (16), maka simpul aak t R da t L dipagkas. Gambar 5. Poho Klasifikasi Maksimal yag dipagkas Gambar 5 terdapat simpul yag aka dipagkas yaitu simpul ke 7, simpul tersebut megalami pemagkasa karea simpul iduk da Node Class 1 = > 5 Tahu simpul aakya memeuhi persamaa (16). Maka Class JURUSAN = > 5 Tahu = JURUSAN (Biologi,Fisika,Matematika) = proses perhituga pemagkasa adalah sebagai Class (Biologi,Fisika,Matematika) = > 5 Tahu > 5 Tahu 72 38.3 JURUSAN = berikut. <= 5 Tahu 116 61.7 (Biologi,Fisika,Matematika) > 5 Tahu 72 38.3 W = 188.000 Class <= Cases 5 Tahu% 116 61.7 N = 188 Simpul iduk > 5 (simpul Tahu 72 W = 38.3 188.000 7) : <= 5 Tahu 116 N 61.7 = 188 Dalam simpul 7 W terdapat = 188.000 2 kelas yaitu kelas lama JURUSAN = (Biologi,...) N = 188 studi 5 Tahu da kelas lama studi JURUSAN > = (Kimia) 5 Tahu. JURUSAN = (Biologi,...) Node 2 JURUSAN = (Biologi,...) Maka ilai probabilitas tiap kelas dalam simpul 2 IPK = JURUSAN = Node (Kimia) Node 2 3 Class = (2,76 > 5 <= Tahu JURUSAN = (Kimia) Node 2 IPK <= 3.50, Class = <= 5 Tahu dega Class IPK = > megguaka 5 Tahu persamaa (11) adalah : 2.00 <= IPK <= 2.75) Node Class 3 Cases % IPK = (2,76 <= IPK Class <= 3.50, Cases % Node 3Class > = 5 Tahu <= 5 P (Lama Studi 5 t 7 ) = 21 Tahu8 11.8 (2,76 <= 2.00 IPK <= <= IPK 3.50, > <= 5 Tahu 2.75) 64 53.3 Class = <= 5 Class Tahu <= 5 Tahu Cases 60% <= 5 Tahu 56 46.7 24 = 88.2 2.00 <= IPK Class <= 2.75) Cases % Class Cases > 5 Tahu % W = 868.000 11.8 0,875 Class > 5 Tahu Cases % 64 W = 120.000 53.3 > 5 Tahu <= 58 Tahu 11.8 60 N = 6888.2 > 5 Tahu 64 53.3 <= 5 Tahu 56 N = 46.7 120 <= 5 Tahu 60 88.2 W = 68.000 <= 5 Tahu 56 46.7 W = 68.000 W = 120.000 N = 68 P (Lama Studi > 5 Tahu t 7 ) = 3 W = 120.000 N = 120 N = 68 N = 120 24 = 0,125 IPK = (2,...) IPK = (3,...) kemudia, IPK = (3,...) IPK = (3,...) Node 2 = <= 5 Tahu r t 7 = 1 Class 0,875 Cases % = 0,125 Node 2 Node > 5 Tahu 2 Class = <= 5 Tahu 3 12.5 Class Nilai probabilitas obek yag berada dalam simpul <= = <= 5 Tahu 5 Tahu 21 87.5 W = 96.000 Class Cases W = 24.000 % > 5 Tahu 3 12.5 8 N adalah = 96 > 5 Tahu 3 : <= 5 Tahu 21 87.5 N = 12.5 24 IPK IPK = (2,...) = (2,...) Node > 5 1 Tahu 61 63.5 Class = > <= 55 Tahu Class Cases Tahu % 35 36.5 Class Tahu Cases 61 63.5 % > 5 5 > Tahu 5 Tahu35 61 36.5 63.5 <= <= W 5 Tahu = 96.000 35 36.5 N W = 96 = 96.000 N = 96 W <= = 24.000 5 Tahu 21 87.5 N = 24 W = 24.000 N = 24 P t 7 = N t 7 N = 24 188 = 0,1276 Oleh karea itu, R t 7 = r t 7. P t 7 = 0,125 0,1276 = 0,01595 Simpul aak (simpul 8) : Simpul 8 memiliki ilai max P( t) sebesar 0,8, sehigga : r r L = 1 max P t = 1 0,8 = 0,2 P t L adalah peluag bayakya obek pada simpul aak sebelah kiri, sehigga: P t L = N t L N = 15 188 = 0,0797 Oleh karea itu, R t L = r t L. P t L = 0,2 0,0797 = 0.01595 Simpul aak (simpul termial 9) : Simpul termial 9 memiliki ilai max P( t) sebesar 1, sehigga : r r R = 1 max P t = 1 1 = 0 P t R adalah peluag bayakya obek pada simpul aak sebelah kaa, sehigga: P t R = N t R N = 9 188 = 0,047 Oleh karea itu, R t R = r t R. P t R = 0 0,047 = 0 Dega demikia, persamaa (16) : R t = R t L + R t R 0,01595 = 0,01595 + 0 0,01595 = 0,01595 Terpeuhi utuk simpul 7, sehigga dilakuka pemagkasa. Proses ii diulagi lagi sampai tidak ada lagi pemagkasa yag mugki teradi, sehigga diperoleh ukura poho yag layak da memeuhi cost complexitymiimum. Poho Klasifikasi Optimal Poho klasifikasi optimal utuk data lama masa studi dapat dilihat pada Gambar 6 yag diperoleh melalui lagkah pemagkasa yag telah dilakuka sebelumya. IPK = (2,...) Class = <= 5 Tahu Gambar 6. Poho Klasifikasi Optimal > 5 Tahu 61 63.5 <= 5 Tahu 35 36.5 W = 96.000 N = 96 JURUSAN = (Biologi,...) Node 2 IPK = (2,76 <= IPK <= 3.50, 2.00 <= IPK <= 2.75) > 5 Tahu 64 53.3 <= 5 Tahu 56 46.7 W = 120.000 N = 120 JURUSAN = (Biologi,Fisika,Matematika) > 5 Tahu 72 38.3 <= 5 Tahu 116 61.7 W = 188.000 N = 188 IPK = (3,...) Node 2 > 5 Tahu 3 12.5 <= 5 Tahu 21 87.5 W = 24.000 N = 24 JURUSAN = (Kimia) Node 3 Class = <= 5 Tahu > 5 Tahu 8 11.8 <= 5 Tahu 60 88.2 W = 68.000 N = 68 Program Studi Statistika FMIPA Uiversitas Mulawarma 133
Berdasarka Gambar 6 dapat diketahui bahwa variabel peelas yag meadi pemilah utama pada poho klasifikasi optimal adalah variabel Jurusa (X 5 ). Pegamata simpul utama (simpul 1) dipilah meadi dua simpul aak berdasarka variabel Jurusa Biologi, Fisika da Matematika. Dari 188 pegamata pada simpul, sebayak 68 pegamata dipilah ke simpul kaa (simpul termial 3), simpul ii tidak dipilah lagi karea telah homoge. Sedagka sebayak 120 pegamata dipilah ke simpul kiri (simpul 2). Simpul 2 dipilah lagi berdasarka variabel pemilah IPK (2,00 IPK 2,75 da 2,76 IPK 3,50). Dari 120 pegamata pada simpul 2, sebayak 24 pegamata dipilah kesimpul kaa (simpul termial 2), sebayak 96 pegamata dipilah kesimpul kiri (simpul termial 1). Adapu iterpretasi hasil utuk masigmasig simpul termial adalah sebagai berikut : 1. Simpul 1 Simpul termial 1 terdiri dari 96 pegamata yag diprediksi sebagai kelompok mahasiswa yag lama studiya > 5 Tahu. Karakteristik mahasiswa dari simpul ii adalah mahasiswa yag memiliki ilai IPK 2,00 IPK 2,75 da 2,76 IPK 3,50. 2. Simpul 2 Simpul termial 2 terdiri dari 24 pegamata yag diprediksi sebagai kelompok mahasiswa yag lama studiya 5 Tahu. Karakteristik mahasiswa dari simpul ii adalah mahasiswa yag memiliki ilai IPK 3.51 IPK 4.00 3. Simpul 3 Simpul termial 3 terdiri dari 68 pegamata yag diprediksi sebagai kelompok mahasiswa yag lama studiya 5 Tahu. Karakteristik mahasiswa dari simpul ii adalah mahasiswa yag berasal dari urusa Kimia. Ketepata Klasifikasi Poho klasifikasi optimal yag telah terpilih tadi kemudia diui tigkat keakurataya dalam megelompokka data, yaitu diperoleh ketepata pegklasifikasi sebesar : 61 + 81 100% = 77,27 % 188 Berdasarka perhituga ketepata klasifikasi diperoleh 77,27 % yag artiya poho klasifikasi yag terbetuk mampu memprediksi dega tepat pegamata sebesar 77,27 %. Mahasiswa FMIPA Uiversitas Mulawarma adalah IPK, Jeis Kelami, Jeis Sekolah Meegah da Jurusa. 2. Berdasarka hasil peelitia megguaka metode CART, Hasil pegklasifikasia yag diperoleh adalah mahasiswa yag lama studiya 5 Tahu adalah mahasiswa yag berasal dari urusa Kimia atau memiliki IPK 3.51 IPK 4.00. Sedagka mahasiswa yag lama studiya > 5 Tahu yaitu mahasiswa yag memiliki IPK 2.00 IPK 2.75 ; 2.76 IPK 3.50. 3. Pada kasus Lama Studi Mahasiswa FMIPA Uiversitas Mulawarma kiera CART lebih baik dibadigka dega Regresi Logistik Bier. Hal ii dapat dilihat dari ketepata klasifikasi CART sebesar 77,27 % sedagka ketepata klasifikasi Regresi Logistik Bier 75 %. Daftar Pustaka Breima, L., J.H Friedma, R.A. Olse, ad C.J Stoe. (1993). Classificatio ad Regressio Trees. New York: Chapma & Hall. Hosmer, D. W. & Lemeshow, S. (2000). Applied Logistic Regressio. New York : Joh Wiley & Sos, Ic. Johso, R.A & DW Wiche, (2007). Applied Multivariat Statistical Sixth Editio, Pretice Hall Iteratioal Ic, New Jersey. Lewis, R.J. (2000). A Itroductio to Classificatio ad Regressio Tree (CART) Aalysis. Aual Meetig of the Society for Academic Emergecy Medicie i Sa Frasisco. Califoria: Departmet of Emergecy Medicie. Timofeev, Roma. (2004). Classificatio ad Regressio Tree (CART) Theory ad Applicatios. A Master Tesis. CASE- Ceter of Applied Statistics ad Ecoomics. Berli : Humboldt Uiversity. Kesimpula Berdasarka hasil aalisis da pembahasa yag dilakuka, kesimpula yag diperoleh dari peelitia ii, yaitu : 1. Berdasarka hasil peelitia megguaka metode Regresi Logistik Bier, Faktor faktor yag mempegaruhi Lama Studi 134 Program Studi Statistika FMIPA Uiversitas Mulawarma