Jurnal EKSPONENSIAL Volume 8, Nomor 2, Nopember 2017 ISSN

dokumen-dokumen yang mirip
TINJAUAN PUSTAKA Pengertian

9 Departemen Statistika FMIPA IPB

TRANSFORMASI BOX-COX PADA ANALISIS REGRESI LINIER SEDERHANA

1200 (0,535) (0,465) (1200 1).0,05 + (0,535) (0,465)

BAB 2 LANDASAN TEORI

BAB V ANALISA PEMECAHAN MASALAH

BAB III METODE PENELITIAN

PENGUJIAN HIPOTESIS. Atau. Pengujian hipotesis uji dua pihak:

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Pertemuan Ke-11. Teknik Analisis Komparasi (t-test)_m. Jainuri, M.Pd

BAB 2 LANDASAN TEORI

REGRESI LINIER DAN KORELASI. Variabel bebas atau variabel prediktor -> variabel yang mudah didapat atau tersedia. Dapat dinyatakan

Jurnal Gradien Vol. 11 No. 2 Juli 2015 :

Analisis Regresi Ordinal Untuk Mengetahui Faktor-Faktor Yang Mempengaruhi Kualitas Pelayanan Kesehatan Pada Komunitas Latino

Kata Kunci : CHAID, IPM, regresi logistik ordinal.

BAB III METODE PENELITIAN. penelitian yaitu PT. Sinar Gorontalo Berlian Motor, Jl. H. B Yassin no 28

BAB III METODE PENELITIAN Penelitian ini dilakukan di kelas X SMA Muhammadiyah 1 Pekanbaru. semester ganjil tahun ajaran 2013/2014.

BAB I PENDAHULUAN. 1.1 Latar Belakang. Universitas Sumatera Utara

Pengujian Normal Multivariat T 2 Hotteling pada Faktor-Faktor yang Mempengaruhi IPM di Jawa Timur dan Jawa Barat Tahun 2007

BAB VIII MASALAH ESTIMASI SATU DAN DUA SAMPEL

Logistic Regression Analysis To Determine Factors Affecting The Grade Point Average (GPA) Of FMIPA Student Of Sam Ratulangi University Of Manado

PENGGGUNAAN ALGORITMA GAUSS-NEWTON UNTUK MENENTUKAN SIFAT-SIFAT PENAKSIR PARAMETER DAN

Perbandingan Metode Regresi Robust Estimasi Least Trimmed Square, Estimasi Scale, dan Estimasi Method Of Moment

SEBARAN t dan SEBARAN F

Perbandingan Power of Test dari Uji Normalitas Metode Bayesian, Uji Shapiro-Wilk, Uji Cramer-von Mises, dan Uji Anderson-Darling

PERBANDINGAN KLASIFIKASI PENYAKIT HIPERTENSI MENGGUNAKAN REGRESI LOGISTIK BINER DAN ALGORITMA C4.5 (Studi Kasus UPT Puskesmas Ponjong I, Gunungkidul)

PROSIDING ISBN:

PENDUGA RASIO UNTUK RATA-RATA POPULASI MENGGUNAKAN KUARTIL VARIABEL BANTU PADA PENGAMBILAN SAMPEL ACAK SEDERHANA DAN PENGATURAN PERINGKAT MEDIAN

STATISTICS. Hanung N. Prasetyo Week 11 TELKOM POLTECH/HANUNG NP

Pendugaan Selang: Metode Pivotal Langkah-langkahnya 1. Andaikan X1, X

BAB 2 LANDASAN TEORI. Statistika merupakan salah satu cabang penegtahuan yang paling banyak mendapatkan

Pemilihan Model Terbaik

Perbandingan Beberapa Metode Pendugaan Parameter AR(1)

Pendugaan Parameter. Debrina Puspita Andriani /

III. METODOLOGI PENELITIAN. Populasi dalam penelitian ini adalah semua siswa kelas XI IPA SMA Negeri I

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI INDEKS PEMBANGUNAN GENDER (IPG) DENGAN MENGGUNAKAN REGRESI PROBIT

4.7 TRANSFORMASI UNTUK MENDEKATI KENORMALAN

BAB 1 PENDAHULUAN. Analisis regresi menjadi salah satu bagian statistika yang paling banyak aplikasinya.

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

IV. METODE PENELITIAN

Bab III Metoda Taguchi

PENGGUNAAN METODE BAYESIAN OBYEKTIF DALAM PEMBUATAN GRAFIK PENGENDALI p-chart

BAB II TINJAUAN TEORITIS

BAB 3 ENTROPI DARI BEBERAPA DISTRIBUSI

BAB 1 PENDAHULUAN Latar Belakang

BAB 6: ESTIMASI PARAMETER (2)

BAB II LANDASAN TEORI. Dalam tugas akhir ini akan dibahas mengenai penaksiran besarnya

BAB III 1 METODE PENELITAN. Penelitian dilakukan di SMP Negeri 2 Batudaa Kab. Gorontalo dengan

BAB III TAKSIRAN KOEFISIEN KORELASI POLYCHORIC DUA TAHAP. Permasalahan dalam tugas akhir ini dibatasi hanya pada penaksiran

Bab 3 Metode Interpolasi

III. METODOLOGI PENELITIAN. Penelitian ini dilaksanakan di MTs Muhammadiyah 1 Natar Lampung Selatan.

PENERAPAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA REGRESI POISSON

II. LANDASAN TEORI. Sampling adalah proses pengambilan atau memilih n buah elemen dari populasi yang

Mata Kuliah : Matematika Diskrit Program Studi : Teknik Informatika Minggu ke : 4

Penyelesaian: Variables Entered/Removed a. a. Dependent Variable: Tulang b. All requested variables entered.

Pengendalian Proses Menggunakan Diagram Kendali Median Absolute Deviation (MAD)

Nama : INDRI SUCI RAHMAWATI NIM : ANALISIS REGRESI SESI 01 HAL

LIMIT. = δ. A R, jika dan hanya jika ada barisan. , sedemikian hingga Lim( a n

6. Pencacahan Lanjut. Relasi Rekurensi. Pemodelan dengan Relasi Rekurensi

METODE PENELITIAN. dalam tujuh kelas dimana tingkat kemampuan belajar matematika siswa

IV METODE PENELITIAN 4.1 Lokasi dan waktu 4.2. Jenis dan Sumber Data 4.3 Metode Pengumpulan Data

BAB I PENDAHULUAN. Matematika merupakan suatu ilmu yang mempunyai obyek kajian

A. Pengertian Hipotesis

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

Materi 5 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya

STATISTIKA ANALISIS REGRESI DAN KORELASI LINIER SEDERHANA

BAB III METODE PENELITIAN

III. METODOLOGI PENELITIAN. Penelitian ini dilakukan di SMA Negeri 1 Way Jepara Kabupaten Lampung Timur

I. DERET TAKHINGGA, DERET PANGKAT

ANALISIS REGRESI LOGISTIK ORDINAL TERHADAP FAKTOR-FAKTOR YANG MEMPENGARUHI PREDIKAT KELULUSAN MAHASISWA S1 DI ITS SURABAYA

REGRESI DAN KORELASI

Pedahulua Hipotesis: asumsi atau dugaa semetara megeai sesuatu hal. Ditutut utuk dilakuka pegeceka kebearaya. Jika asumsi atau dugaa dikhususka megeai

Pendekatan Nilai Logaritma dan Inversnya Secara Manual

ESTIMASI. (PENDUGAAN STATISTIK) Ir. Tito Adi Dewanto. Statistika

BAB III METODOLOGI 3.1 Tempat dan Waktu Penelitian 3.2 Bahan dan Alat 3.3 Metode Pengumpulan Data Pembuatan plot contoh

mempunyai sebaran yang mendekati sebaran normal. Dalam hal ini adalah PKM (penduga kemungkinan maksimum) bagi, ˆ ˆ adalah simpangan baku dari.

Nama : INDRI SUCI RAHMAWATI NIM : ANALISIS REGRESI SESI 01 HAL

BAB III METODE PENELITIAN

Statistika Inferensia: Pendugaan Parameter. Dr. Kusman Sadik, M.Si Dept. Statistika IPB, 2015

BAB II LANDASAN TEORI. Pada bagian ini akan dibahas tentang teori-teori dasar yang. digunakan untuk dalam mengestimasi parameter model.

PENAKSIRAN. Penaksiran Titik. Selang Kepercayaan untuk VARIANSI. MA2181 ANALISIS DATA Utriweni Mukhaiyar 17 Oktober 2011

POSITRON, Vol. II, No. 2 (2012), Hal. 1-5 ISSN : Penentuan Energi Osilator Kuantum Anharmonik Menggunakan Teori Gangguan

Probabilitas dan Statistika Teorema Bayes. Adam Hendra Brata

BAB V METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. Penelitian ini merupakan jenis penelitian deskriptif-kuantitatif, karena

IMPLEMENTASI RUMUS SOBEL PADA WEB DENGAN TOPIK REGRESI LINIER MENGGUNAKAN VARIABEL INTERVENING

Kompleksitas dari Algoritma-Algoritma untuk Menghitung Bilangan Fibonacci

BAB III METODOLOGI DAN PELAKSANAAN PENELITIAN. Perumusan - Sasaran - Tujuan. Pengidentifikasian dan orientasi - Masalah.

III. METODE PENELITIAN. kelas VIII semester ganjil SMP Sejahtera I Bandar Lampung tahun pelajaran 2010/2011

Hazmira Yozza Izzati Rahmi HG Jurusan Matematika FMIPA Unand

ESTIMASI PARAMETER REGRESI SPATIAL AUTOREGRESSIVE MODEL. Nurul Muthiah, Raupong, Anisa Program Studi Statistika, FMIPA, Universitas Hasanuddin ABSTRAK

BAB V UKURAN GEJALA PUSAT (TENDENSI CENTRAL)

Modul Kuliah statistika

III. METODOLOGI PENELITIAN. Penelitian ini dilakukan di SMA Negeri 1 Way Jepara Kabupaten Lampung Timur

TEORI PENAKSIRAN. Bab 8. A. Pendahuluan. Kompetensi Mampu menjelaskan dan menganalisis teori penaksiran

UKURAN PEMUSATAN DATA

JURNAL MATEMATIKA DAN KOMPUTER Vol. 6. No. 2, 77-85, Agustus 2003, ISSN : DISTRIBUSI WAKTU BERHENTI PADA PROSES PEMBAHARUAN

BAB 3 METODE PENELITIAN. Disini penerapan kriteria optimasi yang digunakan untuk menganalisis

PENGARUH VARIASI PELUANG CROSSOVER DAN MUTASI DALAM ALGORITMA GENETIKA UNTUK MENYELESAIKAN MASALAH KNAPSACK. Sutikno

Transkripsi:

Peerapa Metode Aalisis Regresi Logistik Bier Da Classificatio Ad Regressio Tree (CART) Pada Faktor yag Mempegaruhi Lama Masa Studi Mahasiswa Applicatio Of Biary Logistic Regressio Ad Classificatio Ad Regressio Tree (CART) Methods O Factors Affectig Legth Of Study Period Of Studets Chairuisa 1, Yuki Novia Nasutio 2, da Ika Puramasari 3 1 Laboratorium StatistikaTerapa FMIPA Uiversitas Mulawarma 2,3 Jurusa Matematika FMIPA Uiversitas Mulawarma 1 E-mail: aisa.adhifa24@gmail.com Abstract Biary Logistic Regressio is oe of the logistic regressio aalysis which is used to aalyze the relatioship betwee a dichotomous depedet variable with several idepedet variables. Classificatio ad Regressio Tree (CART) is oe of the methods that developed to perform classificatio aalysis o depedet variables either o omial, ordial, or cotiuous scale. I this research, Biary Logistic Regressio method ad Classificatio ad Regressio Tree (CART) applied to the data of the studets at Faculty of Math ad Natural Sciece Mulawarma Uiversity graduated i year 2016 to determie the characteristic of studet which is classified accordig to two categories that is the study period less tha or equal to 5 years ad study period more tha 5 Years, with five idepedet variables amely GPA Graduates X 1, Geder X 2, Type of Juior School X 3, Domicile X 4, ad Maor X 5. Factors that ifluece the study period of the studets based o Biary Logistic Regressio method are GPA, Geder, Secodary School Type ad Maor. The result of classificatio by usig CART method is the studet who have the study period less tha or equal to 5 Years is a studet from Chemistry maor or have GPA betwee 3,51 ad 4,00, while the study period more tha 5 Year is the studet who have GPA betwee 2,00 ad 2,75; 2,76 ad 3,50. I terms of classificatio accuracy, Biary Logistic Regressio method was able to accurately predict the observatio as much as 75.0%, while the CART method was able to accurately predict the observatio as much as 77.27%. Keywords : CART, Accuracy of Classificatio, Study Period, Biary Logistic Regressio. Pedahulua Pedidika petig bagi setiap orag sebagai bekal utuk dapat melagsugka kehidupaya. Petigya pedidika bagi setiap orag di dalam sebuah egara aka memberika pegaruh positif terhadap egara tersebut karea dega pedidika aka meigkatka kualitas sumber daya mausia sehigga bagi egara tetu aka meambah daya saig terhadap egara lai. Berdasarka Peratura Meteri Pedidika da Kebudayaa Republik Idoesia Nomor 49 Tahu 2014 tetag Stadar Nasioal Pergurua Tiggi yag tertulis pada Pasal 17 Nomor 3 masa studi terpakai bagi mahasiswa dega beba belaar program Diploma IV atau Saraa adalah selama 5 tahu. Fakultas Matematika da Ilmu Pegetahua Alam (FMIPA) Uiversitas Mulawarma merupaka salah satu fakultas dega umlah mahasiswa yag relatif bayak da memiliki empat Jurusa atara lai Statistika, Kimia, Biologi, da Fisika. Pada keyataaya, cukup bayak mahasiswa yag masa studiya paag dikareaka bayak faktor-faktor yag mempegaruhi ketidaktepata waktu kelulusa mahasiswa tersebut. Sehigga perlu dilakuka aalisis utuk megetahui faktor apa saa yag mempegaruhi lama masa studi mahasiswa FMIPA. Regresi logistik bier merupaka salah satu regresi logistik yag diguaka utuk megaalisis hubuga atara satu variabel terikat da beberapa variabel bebas, dega variabel terikatya berupa data kualitatif dikotomi yaitu berilai 1 utuk meyataka keberadaa sebuah karakteristik da berilai 0 utuk meyataka ketidakberadaa sebuah karakteristik (Hosmer & Lemeshow, 2000). CART adalah salah satu metode atau algoritma dari salah satu tekik eksplorasi data yaitu tekik poho keputusa. CART dikembagka utuk melakuka aalisis klasifikasi pada variabel terikat baik yag omial, ordial maupu kotiu (Breima dkk, 1993). Berdasarka hal-hal yag telah diuraika, maka Peulis tertarik utuk membahas tetag pegguaa Metode Regresi Logistik Bierda Classificatio ad Regressio Tree (CART) dalam megaalisis lama masa studi mahasiswa Fakultas Matematika da Ilmu Pegetahua Alam (FMIPA) Uiversitas Mulawarma dega variabel-variabel yag mempegaruhi lama masa studi mahasiswa. Regresi Logistik Bier Aalisis Regresi Logistik Bier memiliki tuua utuk medapatka model terbaik da sederhaa yag meggambarka hubuga atara variabel terikat dega variabel-variabel bebas, dega variabel terikatya yag bersifat dikotomi da variabel bebasya dapat berupa variabel kualitatif da kuatitatif(hosmer da Lemeshow, 2000). Program Studi Statistika FMIPA Uiversitas Mulawarma 125

Syarat utama dalam regresi logistik bier adalah variabel terikatya berupa variabel bier yaitu variabel diskrit dega dua ilai. Misalya diambil ilustrasi, bila variabel terikat tidak teradi diberi ilai 0 da bila variabel terikat teradi diberi ilai 1, sedagka variabel bebasya dapat berupa variabel kuatitatif. Utuk ilai variabel bebas bertipe kualitatif biasaya disebut uga variabel boeka (dummy) da dilakuka pemberia suatu agka agar dapat diaalisis. Variabel kualitatif ii berupa variabel dikotomi atau dapat berupa variabel polikotomus. Utuk variabel berupa kuatitatif didefiisika secara lagsug da biasaya disebut variabel kotiu. Peaksira Parameter Regresi Logistik Bier Dalam Hosmer da Lemeshow (2000), peaksira parameter pada model regresi logistik yag mempuyai variabel terikat dikotomi adalah megguaka metode Maximum Likelihood Estimatio (MLE). Pada dasarya metode MLE meetapka asumsi distribusi Beroulli da obek pegamata salig bebas atau memberika ilai taksira parameter dega memaksimumka fugsi likelihood (likelihood fuctio). Dalam betuk persamaa matematis, persamaa logistik diyataka dalam betuk berikut : p 0 x 1 e (1) ( x) p 0 x 1 1 e Fugsi ii merupaka probabilitas dari data dalam meghasilka ilai estimasi parameter. Jika y=1, maka P( y 1 x) e p 0 x 1 p 0 x 1 1 e Jika y=0, maka 1 P( y 0 x) 0 1 e Betuk fugsi likelihoodya adalah : xi x yi p x 1 da, L β 1 xi (2) i1 1 i dega L β = likelihood. Utuk memaksimalka fugsi likelihood, rumus tersebut diubah ke dalam betuk log likelihood dega otasi l β utuk memudahka peyelesaia persamaa matematisya dapat diperoleh persamaa : l β = yi l xi 1 yi l1 xi i1 (3) Peguia Parameter Peguia parameter dalam regresi petig utuk dilakuka. Hal ii dikareaka peguia tersebut diguaka utuk meetuka apakah variabel bebas dalam model sigifika terhadap variabel terikat. Peguia dapat dilakuka secara: Ui Simulta Meurut Hosmer da Lemeshow (2000), ui simulta bertuua utuk megetahui pegaruh variabel bebas secara seretak atau simulta terhadap variabel terikat. Lagkah peguiaya adalah sebagai berikut : Hipotesis : H 0 : β 1 = β 2 = = β P = 0 H 1 : Palig sedikit ada satu β 0, (miimal ada satu variabel bebas yag berpegaruh secara simulta terhadap variabel terikat) dimaa = 1,2,, p Statistik Ui : Statistik ui yag diguaka adalah G, yaki likelihood ratio : G i 2 0 yi l ˆ i 1 yi l1 ˆ i 1 l1 0 l l 1 Statistik ui G ii megikuti distribusi chi-square dega db adalah deraat bebas yag merupaka bayakya variabel bebas dalam model. Keputusa ui diperoleh dega membadigka G da ilai χ 2 (H 0 ditolak ika ilai G χ 2 (α,db ) ). Ui Parsial Dalam Hosmer da Lemeshow (2000), ui parsial dilakuka dega megui setiap β secara idividual aka meuuka apakah suatu variabel bebas layak utuk masuk dalam model atau tidak. Hipotesis : H 0 :β = 0, (tidak ada pegaruh variabel bebas ke- terhadap variabel terikat) H 1 : β 0, (ada pegaruh variabel bebas ke- terhadap variabel terikat) dimaa = 1, 2,...,p Statistik Ui : ˆ W,dega SE ˆ var ˆ (5) SE ˆ (4) Statistik ui Wald megikuti distribusi ormal sehigga memperoleh keputusa peguia, ilai W dibadigka dega ilai Z α/2 (H 0 ditolak ika ilai W Z α/2 atau p-value α). Ui Kesesuaia Model Dalam Hosmer da Lemeshow (2000), ui statistik Goodess of Fit diguaka utuk megetahui kesesuaia model. Lagkah Ui Goodess of Fit adalah sebagai berikut : Hipotesis : H 0 : Tidak ada perbedaa atara hasil pegamata dega ilai dugaa H 1 : Ada perbedaa atara hasil pegamata dega ilai dugaa 126 Program Studi Statistika FMIPA Uiversitas Mulawarma

Statistik Ui : Cˆ g k 1 ' Ok k k (6) ' ˆ 1 k k k 2 Utuk variabel bebas yag bersifat polikotomus, metode yag dipilih adalah megguaka koleksi desai variabel (Dummy variabel). Jika H 0 bear, maka distribusi statistik ui C megikuti distribusi chi-square dega deraat bebas g-2.daerah peolaka H 0 adalah ika C χ 2 (α,g 2) atau p-value α. Peafsira Koefisie Model Regresi Logistik Dalam megiterpretasika atau meafsirka koefisie β pada regresi logistik, hal yag harus selalu diperhatika adalah eis variabel bebasya, berupa dikotomi, polikotomus atau kotiu. Odds ratio (ψ) diguaka utuk megitrepretasi model regresi logistik. Utuk variabel bebas yag bersifat dikotomi, diasumsika ilai x adalah 0 da 1, sehigga dalam model aka terdapat dua ilai π(x) da dua ilai 1 π(x). Tabel 1. Nilai Model Regresi Logistik utuk Variabel Bebas bersifat Bier Variabel Bebas (x) Variabel terikat (y) y = 1 y = 0 x = 1 x = 0 π 1 = eβ 0+β 1 1 + e β π 0 = eβ0 0+β 1 1 + e β 0 1 1 1 π 1 = 1 + e β 1 π 0 = 0+β 1 1 + e β 0 (Sumber : Hosmer da Lemeshow, 2000) Odds ratio utuk teradiya variabel terikat di atara variabel bebas yag mempuyai ilai x=1 adalah : P y = 1 x = 1) P y = 0 x = 1) = π(1) 1 π(1) Sedagka Odds ratio utuk teradiya variabel terikat di atara variabel bebas yag mempuyai x=0 adalah : P y = 1 x = 0) P y = 0 x = 0) = π(0) 1 π(0) Odds ratio adalah rata-rata besarya kecederuga variabel terikat berilai tertetu ika x=1 dibadigka dega x=0, dilambagka dega ψ da diyataka dalam persamaa : π (1) (1 π 1 ) ψ = π (0) = π(1)/(1 π 1 ), π(0)/(1 π 0 ) (1 π 0 ) Iterpretasi odds-ratio (ψ) adalah meelaska beberapa kali lipat keaika atau peurua peluag y=1, ika ilai variabel bebas (X) berubah sebesar ilai tertetu ilai odds ratio selalu positif. Log odds ratio merupaka perbedaa atau selisih ilai logistik. Dega mesubsitusika model regresi logistik pada Tabel 1, maka odds ratio meadi : ψ = e β 1 Sehigga log odds ratio meadi : l ψ = β 1 (Hosmer da Lemeshow, 2000) Classificatio ad Regressio Tree (CART) CART adalah salah satu metode atau algoritma dari salah satu tekik eksplorasi data yaitu tekik poho keputusa. Metode ii dikembagka oleh Leo Breima, Jerome H. Friedma, Richard A. Olshe da Charles J. Stoe sekitar Tahu 1980-a. CART meghasilka suatu poho klasifikasi ika variabel terikatya kategorik, da meghasilka poho regresi ika variabel terikatya kotiu. Tuua utama CART adalah utuk medapatka suatu kelompok data yag akurat sebagai peciri dari suatu pegklasifikasia (Timofeev, 2004). Meurut Breima, dkk (1993), keuggula dari CART adalah tidak perlu dipeuhiya asumsi sebara oleh semua variabel, serta algoritmaya yag lagsug dapat meagai masalah data hilag. CART uga tidak dipegaruhi oleh pecila, koliieritas, heteroskedastisitas yag biasaya mempegaruhi metode parametrik. Dalam CART, pecila aka diisolasi ke dalam ode (simpul) tertetu sehigga tidak mempegaruhi peyekata, karea megguaka variabel yag koliier sebagai peyekat buata. Poho klasifikasi merupaka metode peyekata data secara berulag (rekursif) da secara bier, karea selalu membagi kumpula data meadi dua sekata. Setiap sekata data diyataka sebagai simpul (ode) dalam poho yag terbetuk. Hasil dari proses peyekata ii direpresetasika dalam suatu struktur poho seperti terlihat pada Gambar 1 (Breima dkk,1993). Lewis (2000) meyebut simpul asal (root) sebagai simpul iduk (paret ode), simpul iduk dapat disekat meadi simpul aak (childre ode). Gambar 1. Struktur Poho Klasifikasi Pada Gambar 1, A, B da C merupaka variabel-variabel peelas yag terpilih utuk meadi simpul. A merupaka simpul asal atau simpul iduk, semetara B da C merupaka simpul aak dimaa C uga merupaka simpul akhir yag tidak bercabag lagi. Semetara t merupaka suatu ilai yag merupaka ilai tegah atara dua ilai amata variabel x secara beruruta. Adapu beberapa lagkah-lagkah peerapa dalam CART, yaitu Pembetuka Program Studi Statistika FMIPA Uiversitas Mulawarma 127

Poho Klasifikasi, Pemagkasa Poho Klasifikasi, da Peetua Poho Klasifikasi Pembetuka Poho Klasifikasi Proses pembetukapohoklasifikasi terdiri atas 3 tahapa, yaitu pemiliha pemilah, peetua simpul termial, da peadaa label kelas. Pemiliha Pemilah (Classifier) Utuk membetuk poho klasifikasi diguaka sampel data Learig (L) yag masih bersifat heteroge. Rumus kemugkia pemilah disaika sebagai berikut : Variabel bebas kotiu = 1 pemilaha (7.a) Variabel bebas kategori omial= 2 L 1 1 (7.b) Variabel bebas kategori ordial = L 1 (7.c) dimaa : = Bayakya data pada satu variabel bebas L = Data Learig Sampel tersebut aka dipilah berdasarka atura pemilaha da kriteria goodess of split. Pemiliha pemilah bergatug pada eis poho atau lebih tepatya tergatug pada eis variabel terikatya. Utuk megukur tigkat keheterogea suatu kelas dari suatu simpul tertetu dalam poho klasifikasi dikeal dega istilah impurity measure i(t). Metode fugsi impurity measurei (t) yag serig diguaka adalah Ideks Gii : i t = i p t p k t (8) dimaa : k, = Kelas p t = Probabilitas bersyarat kelas yag berada pada simpul t Goodess Of Split merupaka suatu evaluasi pemiliha oleh pemilah s pada simpul t. Goodess Of Split φ(s, t)didefiisika sebagai peurua keheterogea. Kualitas ukura dari seberapa baik pemilah s dalam meyarig data meurut kelas merupaka ukura peurua keheterogea dari suatu kelas da didefiisika sebagai : φ s, t = i s, t = i t p L i t L p R i t R (9) dega : i t = Fugsi keheterogea ideks Gii φ s, t = Kriteria Goodess Of Split p L i t L = Proporsi pegamata dari simpul t meuu simpul kiri p R i t R = Proporsi pegamata dari simpul t meuu simpul kaa Pemilah yag meghasilka ilai i s, t lebih tiggi merupaka pemilah yag lebih baik karea hal ii memugkika utuk mereduksi keheterogea secara lebih sigifika. Partisi t L da t R, merupaka partisi dari simpul t meadi dua himpua bagia salig lepas dimaa p L da p R adalah proporsi masig-masig peluag simpul. Karea t L t R = t maka ilai i s, t mempresetasika perubaha dari keheterogea dalam simpul t yag semata-mata disebabka oleh pemilah s. Pegembaga poho dilakuka dega mecari semua kemugkia pemilah pada simpul t 1 sehigga ditemuka pemilah s yag memberika ilai peurua keheterogea tertiggi yaitu : i s, t 1 = max s S i s, t 1 (10) (Breima dkk, 1993). Peetua Simpul Suatu simpul t aka meadi simpul termial atau tidak, aka dipilah kembali bila pada simpul t tidak terdapat peurua keheterogea secara berarti atau adaya batasa miimum seperti haya terdapat satu pegamata pada tiap simpul aak. Umumya umlah kasus miimum dalam suatu termial akhir adalah 5, da apabila hal itu telah terpeuhi maka pegembaga poho dihetika (Lewis, 2000). Peadaa Label Kelas Peadaa label kelas pada simpul termial dilakuka berdasarka atura umlah terbayak, yaitu : N (t) p o t = max p t = max (11) N(t) dega p t adalah proporsi kelas pada simpul t, N (t) adalah umlah pegamata kelas pada simpul t da N(t) adalah umlah pegamata pada simpul t. Label kelas simpul termial t adalah o yag memberi ilai dugaa kesalaha pegklasifikasia simpul t terbesar. Proses pembetuka poho klasifikasi berheti saat terdapat haya satu pegamata dalam tiap-tiap simpul aak atau adaya batasa miimum, semua pegamata dalam tiap simpul aak idetik, da adaya batasa umlah level/kedalama poho maksimal. Setelah terbetuk poho maksimal, tahap selautya adalah pemagkasa poho utuk mecegah terbetukya poho klasifikasi yag berukura besar da kompleks. Ideks Gii (Gii Idex) Atura pemisaha Gii (ideks Gii) adalah atura yag palig luas atau palig serig diguaka. Atura ii megikuti fugsi impurity i(t), dimaa fugsi impurity adalah suatu fugsi yag diguaka utuk megukur keakurata model dega memberika idikasi kehomogea kelas-kelas pada data sehigga pada simpul akhir (termial ode) aka didapatka data yag lebih muri. Berdasarka persamaa (8), rumus Ideks Gii adalah : i t = p t p k t k Ideks Gii memiliki iterpretasi yag mearik. Sebagai gati pegguaa atura pluralitas utuk megklasifikasika obek dalam t simpul, megguaka atura yag memberika suatu obek yag dipilih secara acak dari simpul 128 Program Studi Statistika FMIPA Uiversitas Mulawarma

(ode) ke kelas dega probabilitas p t. Probabilitas memperkiraka bahwa item sebearya di kelas k adalah p k t. Jika simpul t dibelah meadi 2 buah subset L da R dega ukura masig-masig 1 da 2, ideks gii dari pembelaha tersebut didefiisika sebagai berikut : gii pembela ha t = 1 L + 2 i t R (12) dimaa : gii pembela ha = Nilai ideks Gii setiap variabel i t L = Nilai ideks Gii subset L i t R = Nilai ideks Gii subset R = Bayakya seluruh data 1 2 = Bayakya data pada subset L = Bayakya data pada subset R Ideks Gii ii sederhaa da cepat dihitug, ideks ii uga dapat meggabugka ilai kesalaha variabel simetri dega cara alami. Pemagkasa Poho Klasifikasi Utuk medapatka poho yag layak maka perlu dilakuka pemagkasa (pruig) yaitu suatu peelitia ukura poho tapa megorbaka ketepata melalui peguraga simpul poho sehigga dicapai ukura poho yag layak. Dega kata lai pemagkasa poho dilakuka utuk medapatka poho akhir yag lebih sederhaa. Ukura pemagkasa yag diguaka utuk memperoleh ukura poho yag layak adalah Cost Complexity Miimum (Breima dkk, 1993). Sebagai ilustrasi, utuk sembarag poho T yag merupaka subpoho dari poho terbesar T max diperoleh ukura complexity-ya yaitu T yag meyataka bayakya simpul akhir pada poho T tersebut. Dalam regresi biasa, T aalog dega deraat bebas model. Utuk suatu α 0, yag disebut sebagai parameter complexity yaki ukura tetag cost bagi peambaha satu simpul akhir pada poho T, maka besarya Resubtitutio estimasi poho T pada kompleksitas α adalah : ~ R ( t) R( T ) T (13) dimaa : R α (t) = Resubtitutio suatu poho T pada kompleksitas α R(T) = Resubtitutio Estimate (Proporsi kesalaha pada sub poho) α = Kompleksitas Parameter (Complexity Parameter) T = Ukura bayakya simpul termial poho T(complexity) Resubtitutio suatu poho T pada kompleksitas αmerupaka kombiasi liier dari Resubtitutio Estimate da ilai kompleksitas poho yag dibetuk. Cost complexity pruig meetuka suatu poho bagia T(α) yag memiimumka R α (t) pada seluruh poho bagia utuk setiap ilai α. Nilai kompleksitas α aka secara perlaha meigkat selama proses pemagkasa. Selautya mecari poho bagia max (T α < T) yag memiimumka R α (t) yaitu : R ( T( )) mi R ( T) (14) TTMAX Jika R(T) diguaka sebagai kriteria peetua poho optimal maka aka cederug poho terbesar adalah T 1, sebab semaki besar poho, maka semaki kecil ilai R(T). Yag perlu diperhatikadalam pemagkasa buka T max melaika T 1, yaki suatu sub poho yag memeuhi kriteria R T 1 = R(T max ). Utuk medapatka T 1 dari T max, ambil t L da t R yag merupaka simpul aak kiri da simpul aak kaa dari T max yag dihasilka dari simpul iduk t. Kemudia hitug ilai t L da t R megguaka persamaa R( T) r( t) P( t) (15) Dega ilai r t = 1 max P t da P t adalah peluag beberapa obek yag berada dalam simpul, begitu diperoleh dua simpul aak da simpul idukya yag memeuhi persamaa R( T ) R( t L ) R( t R ) (16) maka pagkas simpul aak t L da t R tersebut (Breima dkk, 1993). Peetua Poho Klasifikasi Optimal Poho klasifikasi yag berukura besar aka memberika ilai peduga peggati palig kecil, sehigga poho ii cederug dipilih utuk meduga ilai respo. Tetapi ukura poho yag besar aka meyebabka ilai kompleksitas yag tiggi karea struktur data yag digambarka cederug kompleks, sehigga perlu dipilih poho optimal yag berukura sederhaa tetapi memberika ilai peduga peggati cukup kecil. Ada dua eis peduga peggati yaitu peduga sampel ui idepedet (idepedet test sample estimate) da peduga validasi silag lipat V (cross validatio V-fold estimate). Peduga validasi silag lipat V serig diguaka apabila pegamata yag dilakuka tidak cukup besar atau sampel kurag dari 3000. Pegamata dalam L dibagi secara acak meadi V bagia yag salig lepas dega ukura kurag lebih sama besar utuk setiap kelasya. Poho T (V) dibetuk dari L L V dega v = 1,2,...,V. Misalka d v (x) adalah hasil pegklasifikasia, v peduga sampel ui utuk R(T 1 ) yaitu : ts ( V ) 1 ( V ) R ( Tt ) X ( d ( x x L ) ( ) ) (17) V Nv dega Nv N adalah umlah pegamata V dalam L V. Kemudia dilakuka prosedur yag sama megguaka seluruh L, maka peduga validasi silag lipat V utuk T (V) t adalah : V Cv 1 ts ( v) R ( Tt ) R ( T ) (18) V v1 Program Studi Statistika FMIPA Uiversitas Mulawarma 129

Poho klasifikasi optimum dipilih T dega Cv Cv R T ) mi R ( T ) (19) ( * t t Ketepata Klasifikasi Kriteria perbadiga tekik klasifikasi didasarka pada kesalaha klasifikasi yag dikeal dega Apparet Error Rate (APER) merupaka ilai dari besar kecilya umlah observasi yag salah dalam pegklasifikasia berdasarka suatu fugsi klasifikasi (Johso da Wiche, 2007). Tabel 2. Klasifikasi Aktual da Prediksi Kelas Prediksi Kelas Aktual y=0 y=1 y=0 00 01= 0-00 y=1 10= 1-11 11 APER = 00+ 11 0 + 1 100%(20) Hasil da Pembahasa 1. Aalisis Statistika Deskriptif Karakteristik yag digambarka pada aalisis deskriptif adalah IPK, eis kelami, eis sekolah meegah, daerah asal, urusa Lama Studi 38% 62% <= 5 Tahu > 5 Tahu Gambar 2. Persetase Lama Studi Gambar 2 meuukka lama studi mahasiswa FMIPA Uiversitas Mulawarma Tahu 2016. Dari 188 mahasiswa, sebesar 62 % atau 116 mahasiswa FMIPA Uiversitas Mulawarma masuk dalam kategori 1 yaitu lama studi 5 Tahu. 2. Aalisis Regresi Logistik Bier Model regresi logistik bier sesuai pada persamaa (1) dega 5 variabel bebas diperoleh hasil estimasi parameter model regresi sebagai berikut : π x = e 1,199 1,809 X 1 1 21,688 X 1 2 1,207 X2+1,828 X3 0,144 X4+X 5 1 +2,368 X 5 2 +0,126 X 5 3 1 + e 1,199 1,809 X 1 1 21,688 X 1 2 1,207 X2+1,828 X3 0,144 X4+X 5 1 +2,368 X 5 2 +0,126 X 5 3 Tabel 3 meuukka Pegkodea Desai Variabel Polikotomus. Berdasarka Tabel 3 yag meadi IPK Mahasiswa respodeya adalah 3,51 IPK 4,00 kedua desai variabel yag terbetuk yaitu D 1 da D 2 keduaya aka sama dega 0, ketika IPK dari respode adalah 2,76 IPK 3,50 D 1 aka sama dega 1 da D 2 masih sama dega 0; ketika IPK dari respodeya adalah 2,00 IPK 2,75, maka D 1 aka sama dega 0 da D 2 = 1. Tabel 3.Variabel Racaga Utuk IPK Mahasiswa IPK Variabel Racaga Mahasiswa D 1 D 2 3, 51 IPK 4, 00 0 0 2, 76 IPK 3, 50 1 0 2, 00 IPK 2, 75 0 1 Tabel 4.Variabel Racaga Utuk Jurusa Jurusa Variabel Racaga D 1 D 2 D 3 Biologi 0 0 0 Fisika 1 0 0 Kimia 0 1 0 Matematika 0 0 1 Berdasarka Tabel 4 yag meadi Jurusa respodeya adalah Biologi ketiga desai variabel yag terbetuk yaitu D 1, D 2 da D 3 ketigaya aka sama dega 0 ; ketika Jurusa dari respode adalah FisikaD 1 aka sama dega 1, D 2 masih sama dega 0 da D 3 masih sama dega 0 ; ketika Jurusa dari respodeya adalah Kimia maka D 1 aka sama dega 0 da D 2 sama dega 1 da D 3 samadega 0 ; ketika Jurusa dari respodeya adalah Matematika maka D 1 aka sama dega 0 da D 2 sama dega 1 da D 3 sama dega 1. Peguia Sigifikasi Parameter Ui Simulta Hipotesis H 0 : β 1(1) = β 1(2) = β 2 = β 3 = β 4 = β 5(1) = β 5(2) = β 5(3) = 0 (secara simulta variabel bebas tidak berpegaruh terhadap variabel terikat). H 1 :Palig sedikit ada satu β 0, dega = 1,2,...,5 (miimal ada satu variabel bebas yag berpegaruh secara simulta terhadap variabel terikat). Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui G (Likelihood Ratio Test) pada Persamaa (4), dimaa : 1 = 116 ( Mahasiswa Lama Studi 5 Tahu ) 0 = 72 ( Mahasiswa Lama Studi > 5 Tahu ) = 188 ( Jumlah Mahasiswa Lulus Tahu 2016) Perhituga : Berdasarka perhituga megguaka software SPSS 20 diperoleh : G = 358,962 Daerah Peolaka 2 Meolak H 0 ika ilai G χ (0,05;5) = 11,07 Keputusa da Kesimpula 130 Program Studi Statistika FMIPA Uiversitas Mulawarma

Berdasarka hasil perhituga diperoleh ilai G = 358,962 dimaa ilai G = 358,962 2 χ (0,05;5) = 11,07 maka dapat putuska bahwa meolak H 0 sehigga dapat disimpulka bahwa miimal ada satu variabel bebas yag berpegaruh terhadap variabel terikat. Ui Parsial Tabel 5. Ui Parsial Variabel Kostata da Variabel Bebas Var ˆ Wald p-value Keputusa X 1(1) -1,809 10,775 0,001 Meolak H 0 X 1(2) -21,68 0,000 1,000 Meerima H 0 X 2 1,207 7,483 0,006 Meolak H 0 X 3 1,828 4,746 0,029 Meolak H 0 X 4-1,144 0,135 0,713 Meerima H 0 X 5(1) 0,000 0,000 1,000 Meolak H 0 X 5(2) 2,368 19,601 0,000 Meolak H 0 X 5(3) 0,126 0,058 0,809 Meerima H 0 C -1,199 1,223 0,269 Meerima H 0 Hipotesis H 0 : β 0 = 0 (tidak ada pegaruh variabel kostata terhadap variabel terikat). H 1 : β 0 0 (ada pegaruh variabel kostata terhadap variabel terikat) Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui Wald pada Persamaa (5) Daerah Peolaka Meolak H 0 ika ilai p-value α atau ilaiw Z α/2 Keputusa da Kesimpula Berdasarka Tabel 5 diperoleh ilai p-value utuk variabel kostata adalah sebesar 0,269, da ilai Ui Wald = 1,223<Z 0,05/2 = 1,960 maka dapat disimpulka bahwa tidak ada pegaruh variabel kostata terhadap variabel terikat. Hipotesis H 0 : β = 0 (tidak ada pegaruh variabel bebas ke- terhadap variabel terikat). H 1 : β 0 (ada pegaruh variabel bebas ke- terhadap variabel terikat) dimaa = 1,2,...,5. Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui Wald pada Persamaa (5) Daerah Peolaka Meolak H 0 ika ilai p-value α atau ilai W Z α/2 Keputusa da Kesimpula Berdasarka Tabel 6 diperoleh ilai p-value utuk variabel X 1(1), X 1 2, X 2, X 3, X 4, X 5(1), X 5(2), X 5(3), masig-masig adalah 0,001 ; 1,000 ; 0,006 ; 0,029 ; 0,713 ; 1,000 ; 0,000 ; da 0,809 da ilai Ui Wald adalah 10,775 ; 000 ; 7,483 ; 4,746 ; 0,135 ; 0,000 ; 19,601 ; 0,058 maka dapat disimpulka bahwa variabel yag berpegaruh secara parsial terhadap lama studi adalah IPK (X 1(1) ), Jeis Kelami (X 2 ), Jeis Sekolah Meegah (X 3 ) da Jurusa (X 5(2) ). Model Terbaik Regresi Logistik Bier Berdasarka hasil output SPSS 20 model terbaik dega megguaka metode Backward Wald diperoleh tabel sebagai berikut : Tabel 6. Nilai Model Regresi Logistik Variabel ˆ P-value X 1(1) -1,820 0,001 X 2-1,221 0,006 X 3 1,816 0,030 X 5(2) 2,359 0,000 Diperoleh model sebagai berikut : π x = eβ 1(1)X 1(1) +β 2 X 2 +β 3 X 3 +β 5(2) X 5(2) 1 + e β 1(1)X 1(1) +β 2 X 2 +β 3 X 3 +β 5(2) X 5(2) Tabel 6 meuukka bahwa model sudah baik. Karea semua variabel memiliki ilai p- value < 0,05. Sehigga dapat disimpulka bahwa faktor-faktor yag sagat berpegaruh pada lama studi adalah IPK (X 1(1) ), Jeis Kelami (X 2 ), Jeis Sekolah Meegah (X 3 ) da Jurusa (X 5(2) ). Sehigga model regresi logistik terbaik utuk memprediksi kepuasa pelagga adalah: π x = e 1,820 X 1 1 1,221 X 2 +1,816 X 3 +2,359X 5(2) 1 + e 1,820 X 1 1 1,221 X 2 +1,816 X 3 +2,359X 5(2) Ui Kesesuaia model Hipotesis H 0 : Model sudah sesuai (Tidak ada perbedaa atara hasil pegamata dega hasil dugaa) H 1 : Model belum sesuai (Ada perbedaa atara hasil pegamata dega hasil dugaa) Taraf Sigifikasi α = 0,05 atau 5 % Statistik Ui Ui Goodess of Fit pada Persamaa (6) Daerah Peolaka Meolak H 0 ika p-value 0,05 atau ilai C χ 2 (α,g 2) Keputusa da Kesimpula Berdasarka Tabel Ui Hosmer da Lemeshow, meuukka bahwa ilai p-value = 0,478 >α = 0,05da ilai C = 6,545 < χ 2 = 14,067 maka dapat diputuska (0,05,7) bahwa gagal meolak H 0 sehigga dapat disimpulka bahwa tidak ada perbedaa atara hasil pegamata dega ilai dugaa atau model regresi tersebut layak utuk diguaka. Program Studi Statistika FMIPA Uiversitas Mulawarma 131

Iterpretasi Model Berikut merupaka tabel ilai odds ratio masig-masig variabel. Tabel 7 Kotribusi Variabel X Terhadap Y Variabel Exp( ˆ ) X 1(1) 0,162 X 2 3,390 X 3 6,145 X 5(2) 10,583 Tabel 7 meelaska bahwa : 1. Mahasiswa yag ilai IPK 2,76 IPK 3,50 memiliki peluag sebesar 0,162 kali lebih kecil meempuh Lama Studi 5 Tahu dibadigka dega mahasiswa yag ilai IPK adalah 3,51 IPK 4,00. 2. Mahasiswa dega eis kelami Perempua memiliki peluag sebesar 3,390 kali lebih lebihbesar meempuh Lama Studi 5 Tahu dibadigka dega dega mahasiswa dega eis kelami Laki-Laki. 3. Mahasiswa dega eis sekolah meegah SMA memiliki peluag sebesar 6,145 kali lebih besar utuk meempuh Lama Studi 5 Tahu dibadigka dega dega mahasiswa dega eis sekolah meegah SMK. 4. Mahasiswa yag berasal dari urusa Kimia memiliki peluag sebesar 10,583 kali lebih besar meempuh Lama Studi 5 Tahu dibadigka dega mahasiswa yag berasal dari urusa Biologi. Ketepata Klasifikasi Model Berikut adalah hasil perhituga ketepata klasifikasi model : 53 + 88 100% = 75 % 188 Berdasarka perhituga ketepata klasifikasi diperoleh 75 % yag artiya poho klasifikasi yag terbetuk mampu memprediksi dega tepat pegamata sebesar 75%. 3. Classificatio ad Regressio Tree (CART) Pembetuka Poho Klasifikasi N = 96 Dalam proses pembetuka poho klasifikasi, terdapat 3 tahapa yaitu pemiliha pemilah, peetua simpul termial, da peadaa label kelas. Pemiliha Pemilah Perhituga pemilah pada setiap variabel yaitu dega megguaka persamaa (7.b) utuk variabel peelas kategori omial yaitu variabel Jeis Kelami (X 2 ), Jeis Sekolah Meegah (X 3 ), Daerah Asal (X 4 ), da Jurusa (X 5 ), da persamaa (7.c) utuk variabel peelas kategori ordial yaitu Variabel IPK (X 1 ). Adapu IPK = (2,...) > 5 Tahu 61 63.5 <= 5 Tahu 35 36.5 W = 96.000 pemiliha pemilah dilakuka dega meghitug ilai IdeksGiisetiapkemugkiapemilah. Tabel 8. Rekapitulasi Idex Gii utuk 5 Variabel Bebas Variabel Nilai Idex Gii IPK kemugkia ke-1 0,4260 IPK kemugkia ke-2 0.4685 Jeis Kelami 0,4528 Jeis Sekolah Meegah 0,4504 Asal Daerah 0,4723 Jurusa kemugkia ke-1 0,4572 Jurusa kemugkia ke-2 0,4418 Jurusa kemugkia ke-3 0,3928 Jurusa kemugkia ke-4 0,4714 Jurusa kemugkia ke-5 0,4538 Jurusa kemugkia ke-6 0,4444 Jurusa kemugkia ke-7 0,4122 Dari hasil perhituga ilai ideks Gii kelima variabel bebas, dapat diketahui bahwa variabel yag memiliki ilai ideks Gii terkecil adalah variabel Jurusa dega ilai ideks Gii 0,3928. Sehigga variabel Jurusa kemugkia ke-3 yaitu Biologi, Fisika, da Matematika dipilih sebagai pemilah pertama seperti Gambar 3. JURUSAN = (Biologi,...) Node 2 IPK = (2,76 <= IPK <= 3.50, 2.00 <= IPK <= 2.75) Gambar 3. Variabel Pemilah Node 3 Pertama Class = <= 5 Tahu Setelah terbetuk da Class terpilih Cases % kriteria > 5 Tahu 8 11.8 pemiliha terbaik, maka simpul <= 5 Tahu yag 60 88.2berisi 188 W = 68.000 obek W = 120.000data dipilah meadi 2 N = 68 simpul. Simpul N = 120 termial 1 terbetuk akibat kriteria variabel Jurusa Biologi, Fisika, da Matematika. Sedagka simpul IPK = (3,...) 2 terbetuk akibat kriteria variabel Jurusa Kimia Node 2 sesuai dega gambar 3. Class = <= 5 Tahu Karea perhituga maual cukup rumit > 5 Tahu 3 12.5 da membutuhka waktu yag lama, maka <= 5 Tahu 21 87.5 diguaka batua W = 24.000 softwarespmv8.0 utuk N = 24 memudahka peeliti dalam meetuka pemilah. Peetua Simpul Tahap kedua yaitu tahap peetua simpul termial. Simpul t dikataka sebagai simpul termial ika tidak terdapat peurua keheterogea yag berarti sehigga tidak aka dipilah lagi. Berdasarka Gambar 4, dapat diketahui bahwa poho klasifiksi maksimal yag terbetuk mempuyai kedalama 7. Sedagka simpul termial yag dihasilka oleh poho klasifikasi maksimal adalah 12 simpul termial. > 5 Tahu 64 53.3 <= 5 Tahu 56 46.7 JURUSAN = (Biologi,Fisika,Matematika) > 5 Tahu 72 38.3 <= 5 Tahu 116 61.7 W = 188.000 N = 188 JURUSAN = (Kimia) 132 Program Studi Statistika FMIPA Uiversitas Mulawarma

Gambar 4. Poho Klasifikasi Maksimal Peadaa Label Kelas Tahap ketiga adalah peadaa label kelas, berdasarka pada persamaa (11). Sebagai cotoh, pada gambar 3, utuk simpul 1. P (Lama Studi 5 Tahu t)= 116 188 = 0,6170 P (Lama Studi > 5 Tahu t)= 72 188 = 0,3829 Sehigga simpul iduk diberi label kelas lama studi 5 Tahu, karea peluag kelas tersebut lebih besar dari pada peluag kelas laiya. Pemagkasa Poho Klasifikasi Proses pemagkasa poho klasifikasi dimulai dega megambil t R yag merupaka simpul aak kaa da t L yag merupaka simpul aak kiri dari T max yag dihasilka dari simpul iduk t. Jika diperoleh dua simpul aak da simpul iduk yag memeuhi persamaa (16), maka simpul aak t R da t L dipagkas. Gambar 5. Poho Klasifikasi Maksimal yag dipagkas Gambar 5 terdapat simpul yag aka dipagkas yaitu simpul ke 7, simpul tersebut megalami pemagkasa karea simpul iduk da Node Class 1 = > 5 Tahu simpul aakya memeuhi persamaa (16). Maka Class JURUSAN = > 5 Tahu = JURUSAN (Biologi,Fisika,Matematika) = proses perhituga pemagkasa adalah sebagai Class (Biologi,Fisika,Matematika) = > 5 Tahu > 5 Tahu 72 38.3 JURUSAN = berikut. <= 5 Tahu 116 61.7 (Biologi,Fisika,Matematika) > 5 Tahu 72 38.3 W = 188.000 Class <= Cases 5 Tahu% 116 61.7 N = 188 Simpul iduk > 5 (simpul Tahu 72 W = 38.3 188.000 7) : <= 5 Tahu 116 N 61.7 = 188 Dalam simpul 7 W terdapat = 188.000 2 kelas yaitu kelas lama JURUSAN = (Biologi,...) N = 188 studi 5 Tahu da kelas lama studi JURUSAN > = (Kimia) 5 Tahu. JURUSAN = (Biologi,...) Node 2 JURUSAN = (Biologi,...) Maka ilai probabilitas tiap kelas dalam simpul 2 IPK = JURUSAN = Node (Kimia) Node 2 3 Class = (2,76 > 5 <= Tahu JURUSAN = (Kimia) Node 2 IPK <= 3.50, Class = <= 5 Tahu dega Class IPK = > megguaka 5 Tahu persamaa (11) adalah : 2.00 <= IPK <= 2.75) Node Class 3 Cases % IPK = (2,76 <= IPK Class <= 3.50, Cases % Node 3Class > = 5 Tahu <= 5 P (Lama Studi 5 t 7 ) = 21 Tahu8 11.8 (2,76 <= 2.00 IPK <= <= IPK 3.50, > <= 5 Tahu 2.75) 64 53.3 Class = <= 5 Class Tahu <= 5 Tahu Cases 60% <= 5 Tahu 56 46.7 24 = 88.2 2.00 <= IPK Class <= 2.75) Cases % Class Cases > 5 Tahu % W = 868.000 11.8 0,875 Class > 5 Tahu Cases % 64 W = 120.000 53.3 > 5 Tahu <= 58 Tahu 11.8 60 N = 6888.2 > 5 Tahu 64 53.3 <= 5 Tahu 56 N = 46.7 120 <= 5 Tahu 60 88.2 W = 68.000 <= 5 Tahu 56 46.7 W = 68.000 W = 120.000 N = 68 P (Lama Studi > 5 Tahu t 7 ) = 3 W = 120.000 N = 120 N = 68 N = 120 24 = 0,125 IPK = (2,...) IPK = (3,...) kemudia, IPK = (3,...) IPK = (3,...) Node 2 = <= 5 Tahu r t 7 = 1 Class 0,875 Cases % = 0,125 Node 2 Node > 5 Tahu 2 Class = <= 5 Tahu 3 12.5 Class Nilai probabilitas obek yag berada dalam simpul <= = <= 5 Tahu 5 Tahu 21 87.5 W = 96.000 Class Cases W = 24.000 % > 5 Tahu 3 12.5 8 N adalah = 96 > 5 Tahu 3 : <= 5 Tahu 21 87.5 N = 12.5 24 IPK IPK = (2,...) = (2,...) Node > 5 1 Tahu 61 63.5 Class = > <= 55 Tahu Class Cases Tahu % 35 36.5 Class Tahu Cases 61 63.5 % > 5 5 > Tahu 5 Tahu35 61 36.5 63.5 <= <= W 5 Tahu = 96.000 35 36.5 N W = 96 = 96.000 N = 96 W <= = 24.000 5 Tahu 21 87.5 N = 24 W = 24.000 N = 24 P t 7 = N t 7 N = 24 188 = 0,1276 Oleh karea itu, R t 7 = r t 7. P t 7 = 0,125 0,1276 = 0,01595 Simpul aak (simpul 8) : Simpul 8 memiliki ilai max P( t) sebesar 0,8, sehigga : r r L = 1 max P t = 1 0,8 = 0,2 P t L adalah peluag bayakya obek pada simpul aak sebelah kiri, sehigga: P t L = N t L N = 15 188 = 0,0797 Oleh karea itu, R t L = r t L. P t L = 0,2 0,0797 = 0.01595 Simpul aak (simpul termial 9) : Simpul termial 9 memiliki ilai max P( t) sebesar 1, sehigga : r r R = 1 max P t = 1 1 = 0 P t R adalah peluag bayakya obek pada simpul aak sebelah kaa, sehigga: P t R = N t R N = 9 188 = 0,047 Oleh karea itu, R t R = r t R. P t R = 0 0,047 = 0 Dega demikia, persamaa (16) : R t = R t L + R t R 0,01595 = 0,01595 + 0 0,01595 = 0,01595 Terpeuhi utuk simpul 7, sehigga dilakuka pemagkasa. Proses ii diulagi lagi sampai tidak ada lagi pemagkasa yag mugki teradi, sehigga diperoleh ukura poho yag layak da memeuhi cost complexitymiimum. Poho Klasifikasi Optimal Poho klasifikasi optimal utuk data lama masa studi dapat dilihat pada Gambar 6 yag diperoleh melalui lagkah pemagkasa yag telah dilakuka sebelumya. IPK = (2,...) Class = <= 5 Tahu Gambar 6. Poho Klasifikasi Optimal > 5 Tahu 61 63.5 <= 5 Tahu 35 36.5 W = 96.000 N = 96 JURUSAN = (Biologi,...) Node 2 IPK = (2,76 <= IPK <= 3.50, 2.00 <= IPK <= 2.75) > 5 Tahu 64 53.3 <= 5 Tahu 56 46.7 W = 120.000 N = 120 JURUSAN = (Biologi,Fisika,Matematika) > 5 Tahu 72 38.3 <= 5 Tahu 116 61.7 W = 188.000 N = 188 IPK = (3,...) Node 2 > 5 Tahu 3 12.5 <= 5 Tahu 21 87.5 W = 24.000 N = 24 JURUSAN = (Kimia) Node 3 Class = <= 5 Tahu > 5 Tahu 8 11.8 <= 5 Tahu 60 88.2 W = 68.000 N = 68 Program Studi Statistika FMIPA Uiversitas Mulawarma 133

Berdasarka Gambar 6 dapat diketahui bahwa variabel peelas yag meadi pemilah utama pada poho klasifikasi optimal adalah variabel Jurusa (X 5 ). Pegamata simpul utama (simpul 1) dipilah meadi dua simpul aak berdasarka variabel Jurusa Biologi, Fisika da Matematika. Dari 188 pegamata pada simpul, sebayak 68 pegamata dipilah ke simpul kaa (simpul termial 3), simpul ii tidak dipilah lagi karea telah homoge. Sedagka sebayak 120 pegamata dipilah ke simpul kiri (simpul 2). Simpul 2 dipilah lagi berdasarka variabel pemilah IPK (2,00 IPK 2,75 da 2,76 IPK 3,50). Dari 120 pegamata pada simpul 2, sebayak 24 pegamata dipilah kesimpul kaa (simpul termial 2), sebayak 96 pegamata dipilah kesimpul kiri (simpul termial 1). Adapu iterpretasi hasil utuk masigmasig simpul termial adalah sebagai berikut : 1. Simpul 1 Simpul termial 1 terdiri dari 96 pegamata yag diprediksi sebagai kelompok mahasiswa yag lama studiya > 5 Tahu. Karakteristik mahasiswa dari simpul ii adalah mahasiswa yag memiliki ilai IPK 2,00 IPK 2,75 da 2,76 IPK 3,50. 2. Simpul 2 Simpul termial 2 terdiri dari 24 pegamata yag diprediksi sebagai kelompok mahasiswa yag lama studiya 5 Tahu. Karakteristik mahasiswa dari simpul ii adalah mahasiswa yag memiliki ilai IPK 3.51 IPK 4.00 3. Simpul 3 Simpul termial 3 terdiri dari 68 pegamata yag diprediksi sebagai kelompok mahasiswa yag lama studiya 5 Tahu. Karakteristik mahasiswa dari simpul ii adalah mahasiswa yag berasal dari urusa Kimia. Ketepata Klasifikasi Poho klasifikasi optimal yag telah terpilih tadi kemudia diui tigkat keakurataya dalam megelompokka data, yaitu diperoleh ketepata pegklasifikasi sebesar : 61 + 81 100% = 77,27 % 188 Berdasarka perhituga ketepata klasifikasi diperoleh 77,27 % yag artiya poho klasifikasi yag terbetuk mampu memprediksi dega tepat pegamata sebesar 77,27 %. Mahasiswa FMIPA Uiversitas Mulawarma adalah IPK, Jeis Kelami, Jeis Sekolah Meegah da Jurusa. 2. Berdasarka hasil peelitia megguaka metode CART, Hasil pegklasifikasia yag diperoleh adalah mahasiswa yag lama studiya 5 Tahu adalah mahasiswa yag berasal dari urusa Kimia atau memiliki IPK 3.51 IPK 4.00. Sedagka mahasiswa yag lama studiya > 5 Tahu yaitu mahasiswa yag memiliki IPK 2.00 IPK 2.75 ; 2.76 IPK 3.50. 3. Pada kasus Lama Studi Mahasiswa FMIPA Uiversitas Mulawarma kiera CART lebih baik dibadigka dega Regresi Logistik Bier. Hal ii dapat dilihat dari ketepata klasifikasi CART sebesar 77,27 % sedagka ketepata klasifikasi Regresi Logistik Bier 75 %. Daftar Pustaka Breima, L., J.H Friedma, R.A. Olse, ad C.J Stoe. (1993). Classificatio ad Regressio Trees. New York: Chapma & Hall. Hosmer, D. W. & Lemeshow, S. (2000). Applied Logistic Regressio. New York : Joh Wiley & Sos, Ic. Johso, R.A & DW Wiche, (2007). Applied Multivariat Statistical Sixth Editio, Pretice Hall Iteratioal Ic, New Jersey. Lewis, R.J. (2000). A Itroductio to Classificatio ad Regressio Tree (CART) Aalysis. Aual Meetig of the Society for Academic Emergecy Medicie i Sa Frasisco. Califoria: Departmet of Emergecy Medicie. Timofeev, Roma. (2004). Classificatio ad Regressio Tree (CART) Theory ad Applicatios. A Master Tesis. CASE- Ceter of Applied Statistics ad Ecoomics. Berli : Humboldt Uiversity. Kesimpula Berdasarka hasil aalisis da pembahasa yag dilakuka, kesimpula yag diperoleh dari peelitia ii, yaitu : 1. Berdasarka hasil peelitia megguaka metode Regresi Logistik Bier, Faktor faktor yag mempegaruhi Lama Studi 134 Program Studi Statistika FMIPA Uiversitas Mulawarma