PERINGATAN!!! Bismillaahirrahmaanirraahiim Assalamu alaikum warahmatullaahi wabarakaatuh



dokumen-dokumen yang mirip
Masalah Overdispersi dalam Model Regresi Logistik Multinomial

PEMODELAN DENGAN REGRESI LOGISTIK. Secara umum, kedua hasil dilambangkan dengan (sukses) dan (gagal)

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

BAB III REGRESI TERSENSOR (TOBIT) Model regresi yang didasarkan pada variabel terikat tersensor disebut

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

Generalized Ordinal Logistic Regression Model pada Pemodelan Data Nilai Pesantren Mahasiswa Baru FMIPA Universitas Islam Bandung Tahun 2017

BAB II TINJAUAN PUSTAKA

PERINGATAN!!! Bismillaahirrahmaanirraahiim Assalamu alaikum warahmatullaahi wabarakaatuh

BAB III PERLUASAN MODEL REGRESI COX PROPORTIONAL HAZARD DENGAN VARIABEL TERIKAT OLEH WAKTU

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

FAKTOR-FAKTOR YANG MEMPENGARUHI KEBERHASILAN BELAJAR MAHASISWA PENDIDIKAN MATEMATIKA DENGAN REGRESI LOGISTIK

BAB ΙΙ LANDASAN TEORI

ESTIMASI PARAMETER MODEL REGRESI POISSON TERGENERALISASI TERBATAS DENGAN METODE MAKSIMUM LIKELIHOOD

PERINGATAN!!! Bismillaahirrahmaanirraahiim Assalamu alaikum warahmatullaahi wabarakaatuh

ANALISIS PEUBAH RESPONS KATEGORIK DENGAN MODEL REGRESI ORDINAL

PENERAPAN REGRESI POISSON DAN BINOMIAL NEGATIF DALAM MEMODELKAN JUMLAH KASUS PENDERITA AIDS DI INDONESIA BERDASARKAN FAKTOR SOSIODEMOGRAFI

BAB 2 LANDASAN TEORI. Istilah regresi pertama kali digunakan oleh Francis Galton. Dalam papernya yang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEPUTUSAN KONSUMEN MEMBELI SUATU PRODUK DENGAN METODE ANALISIS REGRESI LOGISTIK ORDINAL

Bab 2 LANDASAN TEORI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Bab 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis Galton. Dia

ANALISA PENGARUH PEMBERIAN KREDIT TERHADAP PENINGKATAN PENDAPATAN PENGUSAHA MIKRO DI SURAKARTA (PADA KOPERASI SIMPAN PINJAM LUMBUNG ARTHA)

BAB 2 TINJAUAN TEORITIS

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BAB II LANDASAN TEORI. : Ukuran sampel telah memenuhi syarat. : Ukuran sampel belum memenuhi syarat

BAB II METODE ANALISIS DATA. memerlukan lebih dari satu variabel dalam membentuk suatu model regresi.

TINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan

di masa yang akan datang dilihat dari aspek demografi dan kepuasannya. PENDAHULUAN

BAB I PENDAHULUAN. Analisis regresi merupakan suatu metode yang digunakan untuk

BAB 2 LANDASAN TEORI. digunakan sebagai konsep statistik pada tahun 1877 oleh Sir Francis Galton. Dia

GENERALIZED LINEAR MODELS (GLM) UNTUK DATA ASURANSI DALAM MENENTUKAN HARGA PREMI

BAB 2 LANDASAN TEORI

PENGARUH KONSENTRASI KEPEMILIKAN, UKURAN PERUSAHAAN, KOMPOSISI DEWAN KOMISARIS DAN SPESIALISASI INDUSTRI KAP TERHADAP MANAJEMEN LABA

Pengujian Overdispersi pada Model Regresi Poisson (Studi Kasus: Laka Lantas Mobil Penumpang di Provinsi Jawa Barat)

III. METODE PENELITIAN

BAB II TINJAUAN PUSTAKA. (b) Variabel independen yang biasanya dinyatakan dengan simbol

ANALISIS PEUBAH RESPONS KONTINU NON NEGATIF DENGAN REGRESI INVERSE GAUSSIAN SKRIPSI

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

MODEL REGRESI PROBIT BIVARIAT SKRIPSI

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI. disebut dengan bermacam-macam istilah: variabel penjelas, variabel

Kata Kunci: Model Regresi Logistik Biner, metode Maximum Likelihood, Demam Berdarah Dengue

BAB I PENDAHULUAN. mengetahui fenomena yang akan terjadi pada periode mendatang akan

(R.2) KAJIAN PREDIKSI KLASIFIKASI OBYEK PADA VARIABEL RESPON BINER

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

PENGARUH HARGA, PELAYANAN DAN LOKASI TERHADAP LOYALITAS KONSUMEN PADA TOKO OLI SUMBER REJEKI SUKOHARJO SKRIPSI

BAB 2 LANDASAN TEORI

IV. METODE PENELITIAN. Penelitian dilakukan di Desa Tugu Utara dan Kelurahan Cisarua,

BAB II KAJIAN TEORI. Analisis survival atau analisis ketahanan hidup adalah metode yang

MODEL REGRESI LOGISTIK BINER DENGAN METODE PENALIZED MAXIMUM LIKELIHOOD. Edi Susilo, Anna Islamiyati, Muh. Saleh AF. ABSTRAK

PENGARUH KEPUASAN KONSUMEN TERHADAP KESETIAAN MEREK PADA RESTORAN STEAK MOEN-MOEN

KATA PENGANTAR. dan karunia-nya. Solawat beserta salam senantiasa tercurah limpahkan pada

BAB 2 LANDASAN TEORI

PENGUJIAN KESAMAAN BEBERAPA MODEL REGRESI NON LINIER GEOMETRI (Studi Kasus : Data Emisi CO 2 dan Gross Nation Product di Malaysia, Bhutan, dan Nepal)

PEMODELAN REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSION PADA REGRESI POISSON

BAB 2 LANDASAN TEORI

ANALISIS FAKTOR YANG MEMPENGARUHI KONSUMEN DALAM MEMBELI PRODUK PERDANA TRI (Study Empiris Mahasiswa Universitas Muhammadiyah Surakarta)

BAB I PENDAHULUAN. Pada bab ini akan dibahas mengenai latar belakang tema yang diambil dalam

PENGARUH PROMOSI, POTONGAN HARGA, DAN PELAYANAN TERHADAP VOLUME PENJUALAN PADA PERUSAHAAN RITEL ALFAMART (Study Kasus Alfamart : PT.

ANALISIS REGRESI LOGISTIK ORDINAL PADA FAKTOR-FAKTOR BERPENGARUH TERHADAP PENYAKIT MATA KATARAK BAGI PASIEN PENDERITA DI KLINIK MATA UTAMA GRESIK

BAB 2 LANDASAN TEORI. Regresi pertama kali dipergunakan sebagai konsep statistik pada tahun 1877 oleh Sir francis

BAB 1 PENDAHULUAN. ii Bagaimana rata-rata atau nilai tengah dibuat oleh Stimulan eksternal.

BAB III MODEL REGRESI DATA PANEL. Pada bab ini akan dikemukakan dua pendekatan dari model regresi data

BAB III MODEL GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION SEMIPARAMETRIC (GWLRS)

BAB 2 LANDASAN TEORI

BAB 2 TINJAUAN TEORITIS. Regresi pertama kali digunakan sebagi konsep statistika pada tahun 1877 oleh sir Francis Galton.

PENGARUH NILAI RATA-RATA UJIAN NASIONAL DAN UJIAN SEKOLAH TERHADAP PRESTASI BELAJAR MAHASISWA PROGRAM STUDI PENDIDIKAN BIOLOGI FKIP UMS ANGKATAN 2010

BAB II TINJAUAN PUSTAKA. penulisan skripsi. Teori penunjang tersebut adalah: Regresi logistik, analisis survival,

MODEL REGRESI COX PROPORTIONAL HAZARD PADA LAJU TAMAT MAHASISWA JURUSAN MATEMATIKA UNIVERSITAS ANDALAS

PROFILE ANALYSIS VIA MULTIDIMENSIONAL SCALING (PAMS) DAN APLIKASINYA UNTUK MENGGAMBARKAN POLA PROFIL NILAI UJIAN SEKOLAH SKRIPSI

PENGARUH PENDAPATAN ASLI DAERAH (PAD), DANA ALOKASI UMUM (DAU), DANA ALOKASI KHUSUS (DAK), DAN SISA LEBIH PEMBIAYAAN ANGGARAN

Regresi Poisson dan Penerapannya Untuk Memodelkan Hubungan Usia dan Perilaku Merokok Terhadap Jumlah Kematian Penderita Penyakit Kanker Paru-Paru

BAB II TINJAUAN PUSTAKA. level, model regresi tiga level, penduga koefisien korelasi intraclass, pendugaan

APLIKASI REGRESI MULTINOMIAL LOGISTIK PADA INDEKS MASSA TUBUH (IMT) SKRIPSI

PENGARUH RASIO AKTIVITAS, LIKUIDITAS, DAN PROFITABILITAS TERHADAP RETURN ON ASSET (ROA) (STUDI PADA PERUSAHAAN FOOD AND BEVERAGE DI BEI )

ANALISIS PENGARUH HARGA DAN PROMOSI TERHADAP KEPUASAN KONSUMEN PADA PRODUK NATASHA SKIN CARE DI SOLO

PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA

BAB III METODE PENELITIAN

BAB 2 LANDASAN TEORI

BAB Ι PENDAHULUAN. 1.1 Latar Belakang

BAB 2 TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

Informasi Fisher pada Algoritme Fisher Scoring untuk Estimasi Parameter Model Regresi Logistik Ordinal Terboboti Geografis (RLOTG)

BAB 2 LANDASAN TEORI. regresi adalah sebuah teknik statistik untuk membuat model dan menyelediki

BAB 2 LANDASAN TEORI

( Studi Kasus pada KPP PRATAMA Sukoharjo ) SKRIPSI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

BAB III METODE THEIL. menganalisis hubungan antara variabel bebas dan variabel terikat yang dinyatakan

BAB 2 LANDASAN TEORI. Peramalan (Forecasting) adalah suatu kegitan yang memperkirakan apa yang akan

STATISTIKA 2 IT

BAB III. Model Regresi Linear 2-Level. Sebuah model regresi dikatakan linear jika parameter-parameternya bersifat

PENGARUH INFORMASI ARUS KAS OPERASI TERHADAP RETURN SAHAM DENGAN PERSISTENSI LABA SEBAGAI VARIABEL INTERVENING

BAB II LANDASAN TEORI. landasan pembahasan pada bab selanjutnya. Pengertian-pengertian dasar yang di

Transkripsi:

PERINGATAN!!! Bismillaahirrahmaanirraahiim Assalamu alaikum warahmatullaahi wabarakaatuh 1 Skripsi digital ini hanya digunakan sebagai bahan referensi 2 Cantumkanlah sumber referensi secara lengkap bila Anda mengutip dari Dokumen ini 3 Plagiarisme dalam bentuk apapun merupakan pelanggaran keras terhadap etika moral penyusunan karya ilmiah 4 Patuhilah etika penulisan karya ilmiah Selamat membaca!!! Wassalamu alaikum warahmatullaahi wabarakaatuh UPT PERPUSTAKAAN UNISBA

PENAKSIRAN PARAMETER DARI MODEL REGRESI BETA UNTUK DATA PROPORSI DENGAN MENGGUNAKAN METODE KEMUNGKINAN MAKSIMUM SKRIPSI Oleh : BETA PUTRI WIJAYA NPM: 10060108003 PROGRAM STUDI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS ISLAM BANDUNG 2012 M / 1433 H

PENAKSIRAN PARAMETER DARI MODEL REGRESI BETA UNTUK DATA PROPORSI DENGAN MENGGUNAKAN METODE KEMUNGKINAN MAKSIMUM SKRIPSI Diajukan untuk memenuhi salah satu persyaratan guna Memperoleh Gelar Sarjana Sains pada Program Studi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Islam Bandung Oleh: BETA PUTRI WIJAYA NPM: 10060108003 PROGRAM STUDI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS ISLAM BANDUNG 2012 M / 1433 H

SURAT PERNYATAAN Yang bertanda tangan di bawah ini : Nama : Beta Putri Wijaya NPM : 10060108003 Status : Mahasiswa Semester Delapan Program Studi Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Islam Bandung Judul Skripsi : PENAKSIRAN PARAMETER DARI MODEL REGRESI BETA UNTUK DATA PROPORSI DENGAN MENGGUNAKAN METODE KEMUNGKINAN MAKSIMUM Menyatakan dengan sesungguhnya bahwa skripsi atau karya tulis ilmiah ini benar-benar hasil karya sendiri bukan jiplakan dari hasil karya orang lain Demikian pernyataan ini saya buat dengan sebenar-benarnya, dengan harapan yang berkepentingan menjadi maklum adanya Bandung, September 2012 Yang Membuat Pernyataan Beta Putri Wijaya

JUDUL : PENAKSIRAN PARAMETER DARI MODEL REGRESI BETA UNTUK DATA PROPORSI DENGAN MENGGUNAKAN METODE KEMUNGKINAN MAKSIMUM NAMA : BETA PUTRI WIJAYA NPM : 10060108003 Setelah membaca skripsi ini secara seksama, menurut pertimbangan kami telah memenuhi persyaratan ilmiah sebagai skripsi Pembimbing I Pembimbing II Nusar Hajarisman, MSi NIKD940200 Siti Sunendiari,Dra,MSi NIKD880076 Mengetahui, Dekan F-MIPA Unisba Ketua Jurusan Statistika F-MIPA Unisba M Yusuf Fajar, Drs, MSi NIP195610261986021001 Suliadi, MSi, PhD NIK D970267 Tanggal Lulus : 6 September 2012

ABSTRAK Beta Putri Wijaya, 10060108003 Penaksiran Parameter Dari Model Regresi Beta Untuk Data Proporsi Dengan Metode Kemungkinan Maksimum Di bawah bimbingan Nusar Hajarisman,MSi dan Siti Sunendiari,MSi Skripsi ini menyajikan suatu variabel respons yang berbentuk proporsi yang nilainya berada dalam selang terbuka (0, 1) dapat dihubungkan dengan sejumlah variabel prediktor melalui model regresi beta Model ini merupakan bagian dari generalized linear model (GLM) dimana variabel respons megikuti distribusi beta yang merupakan anggota dari keluarga eksponensial Parameter regresi dari model regresi beta diinterpretasikan dalam bentuk rata-rata dari respons, dan saat menggunakan fungsi hubung logit, parameter regresi ini diinterpretasikan sebagai odds rasio Penaksiran parameter model menggunakan metode kemungkinan maksimum, dimana proses penaksirannya harus diselesaikan secara numerik Dalam skripsi ini penaksiran parameter model regresi beta dilakukan melalui metode penskoran Fisher berdasarkan pada vektor skor dan matriks informasi Fisher untuk menaksir perilaku kelulusan mahasiswa dalam mengikuti Tingkat Persiapan Bersama di Institut Pertanian Bogor tahun akademik 1997/1998, dimana hanya jenis kelamin dan nilai ebtanas murni yang dapat mempengaruhi perilaku kelulusan mahasiswa tersebut Kata Kunci: distribusi beta, model linear umum, metode kemungkinan maksimum, odds rasio, dan fungsi logit

MOTTO DAN PERSEMBAHAN Motto Artinya : Bahwa tiada yang orang dapatkan, kecuali yang ia usahakan, Dan bahwa usahanya akan kelihatan nantinya (QS An Najm ayat 39-40) Persembahan Dengan rasa syukur yang mendalam skripsi ini kupersembahkan untuk Kedua orang tuaku tercinta Papa dan Mama, ini anakmu mencoba memberikan yang terbaik untukmu Betapa diri ini ingin melihat kalian bangga padaku Betapa tak ternilai kasih sayang dan pengorbanan kalian padaku, Maaf bila selama ini anakmu nakal dan tidak mau mendengar apa kata orang tuanya Dalam hati ini aku sayang kalian Kakakku Eka dan Winda terimakasih atas dukungan kalian yang selalu siap membantuku, selalu peduli dan terus mendukungku Sahabat-sahabatku tersayang,teman seperjuanganku dikampus, Rizky, Sarah, Fitri, dan Riris terimakash untuk motivasi dan dukunganya Dan yang terkasih dan tersayang, Ardi terimakasih untuk segala dukungan, motivasi dan pengertiannya

KATA PENGANTAR Bismillahirahmanirrahiim Puji dan syukur penulis panjatkan kehadirat Allah SWT, atas nikmat, rahmat serta hidayah-nya, tidak lupa shalawat serta salam tercurah pada Nabi Muhammad SAW, dengan karunia-nya sehingga penulis dapat menyelesaikan kuliah di Program Studi Statistika Universitas Islam Bandung serta menyusun dan menyelesaikan skripsi yang merupakan salah satu syarat untuk memenuhi kelulusan kuliah pada Program Studi Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam di Universitas Islam Bandung Penulis menyadari skripsi ini belum dikatakan sempurna, hal ini dikarenakan keterbatasan pengetahuan, pengalaman, maupun kemampuan yang dimiliki, Oleh karena itu penulis mengharapkan semua pihak dapat memberikan saran-saran penyempurnaan yang berguna bagi penulis khususnya dan bagi pembaca pada umumnya Dengan seluruh kerendahan hati dan penuh rasa hormat penulis mengucapkan terima kasih dan penghargaan sebesar-besarnya kepada : 1 Bapak Nusar Hajarisman,MSi, selaku dosen pembimbing I yang telah memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini i

2 Ibu Siti Sunendiari,Dra,MSi, selaku dosen pembimbing II yang telah memberikan sumbangan pikiran, pengetahuan, ilmu dan kesempatan serta kemudahan bagi penulis untuk dapat menyelesaikan skripsi ini 3 Bapak M Yusuf Fajar, Drs, MSi, selaku Dekan FMIPA Universitas Islam Bandung 4 Bapak R Dachlan Muchlis, Drs, MT, selaku wakil dekan FMIPA Universitas Islam Bandung 5 Bapak Suliadi, MSi, PhD, selaku Ketua Program Studi Statistika FMIPA Universitas Islam Bandung 6 Bapak Dr Suwanda, MS, selaku dosen wali Statistika Universitas Islam Bandung angkatan 2008 yang telah meluangkan waktu dan kesabarannya dalam memberi pengarahan, ilmu, serta bimbingan selama ini 7 Dosen-Dosen Program Studi Statistika, yang telah memberikan banyak bekal ilmu pengetahuan selama perkuliahan 8 Bapak Mastur, Ibu Tineu, dan bagian administrasi FMIPA yang selalu membantu penulis dalam proses administrasi perkuliahan dan sidang skripsi 9 Akang dan Teteh Asisten Lab Statistika terima kasih atas segala bantuan, dukungan dan waktu luang dalam membantu skripsi ini 10 Teman-teman Program Studi Statistika angkatan 2005, 2006, 2007, 2008, 2009, 2010 dan 2011 Universitas Islam Bandung, terima kasih untuk suka duka, bantuan, kebersamaan dan persahabatan kita 11 Dan semua pihak yang telah membantu dalam penyusunan skripsi ini ii

Semoga Allah SWT senantiasa memberikan rahmat dan karunia untuk memberi balasan atas semua bantuan fikiran yang telah diberikan kepada penulis Besar harapan bahwa skripsi ini dapat memberikan manfaat bagi pembaca Akhir kata dengan ketulusan dan kerendahan hati, penulis panjatkan dan semoga Allah SWT membalas budi baik serta melimpahkan rahmat-nya kepada semua pihak yang telah memberikan bantuannya, Amin Jazakumullaahu khairun katsira Billahitaufiqwalhidayah Wassalamu alaikum Wr Wb Bandung, September 2012 Penulis iii

DAFTAR ISI Halaman KATA PENGANTAR i DAFTAR ISI iv DAFTAR TABEL vi DAFTAR GAMBAR vii DAFTAR LAMPIRAN viii BAB I PENDAHULUAN 11 Latar Belakang Masalah 1 12 Tujuan dan Manfaat Penelitian 3 13 Kerangka Penulisan 4 BAB II PENAKSIR MODEL REGRESI BETA 21 Pendahuluan 5 22 Generalized Linear Model (GLM) 6 221 Distribusi Keluarga Eksponensial 7 222 Unsur-unsur dalam GLM 8 23 Prosedur Penaksiran Parameter dalam GLM 9 24 Distribusi Beta 10 25 Model Regresi Beta 11 26 Penaksir Kemungkinan Maksimum Untuk Regresi Beta 14 27 Regresi Logistik 17 271 Uji Kecocokan Model 18 272 Uji Signifikansi Parameter Model 20 BAB III METODOLOGI PENELITIAN 31 Data dan Sumber Data 22 32 Tahapan Penelitian 25 iv

33 Algoritma Penskoran Fisher 26 BAB IV HASIL DAN PEMBAHASAN 41 Pendahuluan 29 42 Deskriptif Data 30 43 Hasil- hasil Pada Model Regresi Logistik 34 44 Hasil- hasil Pada Model Regresi Beta 37 45 Pembahasan Hasil- hasil dari Kedua Model Regresi 40 BAB V KESIMPULAN DAN SARAN 51 Kesimpulan 43 52 Saran 45 DAFTAR PUSTAKA 46 LAMPIRAN 47 v

DAFTAR TABEL NoTabel Halaman Tabel 31 Daftar Nama Variabel dan Kategori dari Variabel 23 Tabel 32 Daftar Proporsi Kelulusan Mahasiswa 24 Tabel 41 Model Regresi Logistik Variabel Tunggal 35 Tabel 42 Tabel 43 Penaksir Koefisien, Standar Error, dan Statistik Chikuadrat Berdasarkan Hasil Pada Tabel 41 36 Penaksir Koefisien, Standar Error, dan Statistik Chikuadrat Berdasarkan Hasil Pada Tabel 42 36 Tabel 44 Model Regresi Beta Variabel Tunggal 38 Tabel 45 Tabel 46 Penaksir Koefisien, Standar Error, dan Uji t Berdasarkan Hasil Pada Tabel 44 39 Penaksir Koefisien, Standar Error, dan Uji t Berdasarkan Hasil Pada Tabel 45 39 vi

DAFTAR GAMBAR No Gambar Halaman Gambar 31 Diagram Alir Penskoran Fisher 28 Gambar 41 Diagram Lingkaran Jenis Kelamin 31 Gambar 42 Diagram Lingkaran Cara Lolos Seleksi ke IPB 31 Gambar 43 Box Plot Nilai Rata-rata Ijazah 32 Gambar 44 Box Plot Nilai Ebtanas Murni 32 Gambar 45 Diagram Lingkaran Daerah Asal Sekolah 33 Gambar 46 Diagram Lingkaran Status Asal sekolah 33 vii

DAFTAR LAMPIRAN No Lampiran Halaman Lampiran 1 Notasi 47 Lampiran 2 Data Proporsi Kelulusan Mahasiswa 48 Lampiran 3 Hasil Output SAS Model Regresi Beta 49 Lampiran 4 Hasil Output SAS Model Regresi Logistik 52 viii

BAB I PENDAHULUAN 11 Latar Belakang Masalah Analisis regresi adalah metode statistika yang digunakan untuk menyelidiki atau memodelkan hubungan antar variabel bebas dan variabel tak bebas Analisis regresi telah banyak diterapkan dalam ilmu sosial dan eksak Apabila kita dihadapkan pada suatu masalah penaksir atau peramalan nilai variabel, katakanlah variabel itu Y dan variabel satunya X, dengan pengambilan suatu sampel acak berukuran n dari populasi [(x i,y i ), untuk i =1,2,,n], maka data yang diperoleh dapat diplotkan untuk menghasilkan diagram pencar Apabila titiktitik dalam diagram pencar itu mengikuti garis lurus, hal ini menunjukan bahwa kedua variabel tersebut berhubungan secara linier, dengan secara matematik hubungan linier yang terbentuk dalam persamaan garis lurus disebut garis regresi linier Persamaaan tersebut dinyatakan oleh: ݕ = ߚ + ߚ ଵ ݔ + ߝ ; = 1,2,, (11) dimana ߚ menyatakan intersep atau perpotongan dengan sumbu tegak, ߚ ଵ adalah kemiringan (slope) atau gradiennya, y adalah variabel tak bebas atau sering juga disebut sebagai variabel respon, x adalah variabel bebas atau prediktor, dan ε i merupakan variabel acak yang memperhitungkan kegagalan model untuk kecocokan data secara tepat 1

Tujuan utama analisis regresi adalah melihat hubungan antara variabel respon dengan satu atau lebih variabel prediktor Bentuk hubungan antara kedua variabel tersebut yang dinyatakan dalam model regresi digunakan utamanya untuk melihat bagaimana pengaruh dari satu atau lebih variabel prediktor terhadap variabel respon Jika diasumsikan bahwa ε i mengikuti distribusi normal dengan rata-rata 0 dan variansi 2 ditulis ߝ (0, ߪ ଶ (ܫ di dalam metode kuadrat terkecil Ketika asumsi terpenuhi, maka penaksir kuadrat terkecil mempunyai sifat-sifat kualitas penaksir yang baik, artinya penaksir tak bias dan bervariansi minimum, maka penaksir kuadrat terkecil ini akan sama dengan hasil dari metode kemungkinan maksimum Apabila dihadapkan dengan variabel respons yang berbentuk proporsi, tentu saja penggunaan metode kuadrat terkecil biasa (ordinary least square) bukan merupakan solusi yang tepat untuk memodelkan data yang variabel responsnya (y*) berbentuk proporsi Hal ini bisa terjadi karena dua alasan, masalah non-linearitas, dimana model regresi linear biasa akan memberikan nilai taksiran y* di luar wilayah (0, 1), serta masalah heteroskedastisitas, dimana varians y* adalah tidak konstan Untuk mengatasi masalah tersebut biasanya diselesaikan dengan cara menggunakan pendekatan kemungkinan maksimum berdasarkan pada fungsi kemungkinan dari distribusi binomial sebagai dasar pada pemodelan regresi logistik Namun selain menggunakan pendekatan pemodelan regresi logistik, pendekatan lain yang dapat digunakan adalah melalui pemodelan regresi beta Model yang diusulkan dalam skripsi ini tentu saja berdasarkan asumsi bahwa 2

variabel respons mengikuti distribusi beta karena model regresi beta merupakan model yang memberikan penaksir parameter yang akurat dan efisien dibandingkan dengan metode kuadrat terkecil biasa, ketika variabel respons yang diamati distribusinya tidak simetris, atau pada saat terjadi masalah heteroskedastisitas Distribusi beta sangat fleksibel dan berbagai fenomena ketidakpastian dapat dimodelkan dengan menggunakan distribusi beta ini Fleksibilitas ini mendorong berkembangnya penggunaan distribusi beta secara empiris dalam berbagai bidang aplikasi Distribusi beta dicirikan oleh dua buah parameter bentuk, dimana melalui transformasi aljabar sederhana dari kedua parameter dapat ditunjukkan bahwa parameter dalam distribusi beta merupakan parameter rata-rata dan parameter presisi Dengan cara tersebut, model regresi beta dapat memberikan penaksir parameter yang berhubungan dengan perubahan dalam rata-rata dan dispersi dari variabel respons Dari uraian diatas maka dalam skripsi ini akan dibahas mengenai bentuk pemodelan regresi beta, penaksiran parameter dalam model regresi beta dengan menggunakan metode pendekatan kemungkinan maksimum 12 Tujuan dan Manfaat Penelitian Tujuan umum dari penulisan skripsi ini ialah untuk menggambarkan hubungan fungsional antara variabel respon dengan variabel prediktor, dimana variabel responnya berbentuk proporsi yang mengikuti distribusi beta Oleh karena variabel responnya berbentuk proporsi maka pada umumnya variabel respon tersebut dimodelkan dengan model regresi logistik, tetapi dalam skripsi ini 3

juga variabel tersebut dapat dimodelkan dengan model regresi beta dengan demikian tujuan khusus dari skripsi ini yaitu : Menaksir parameter yang ada dalam model dengan regresi logistik Menaksir parameter yang ada dalam model dengan regresi beta Membandingkan hasil-hasil yang diperoleh model regresi logistik dan model regresi beta Solusi dari hasil penelitian ini diharapkan mampu bermanfaat bagi perkembangan ilmu statistika dan penerapannya di berbagai bidang, khususnya mereka yang tertarik untuk memodelkan data berbentuk proporsi 13 Kerangka Penulisan Untuk mempermudah pemahaman mengenai pembahasan skripsi ini maka dibuatlah kerangka penulisan sebagai berikut : Bab I Pendahuluan, pada bab ini menjelaskan tentang latar belakang masalah, tujuan beserta manfaat penelitian, dan kerangka penulisan Bab II dari skripsi ini berisikan penjelasan tentang tinjauan pustaka yang dipakai dalam penelitian yang diuraikan dalam teori-teori mengenai pengertian GLM, distribusi beta, model regresi beta, penaksir kemungkinan maksimum untuk beta Bab III Metoda Penelitian, pada bab III ini diuraikan mengenai data dan sumber data yang digunakan, dan langkah-langkah penelitian Bab IV Pembahasan, bab ini menguraikan tentang hasil perhitungan yang dilakukan berdasarkan data yang diperoleh dengan menggunakan metodemetode yang sudah dibahas pada bab sebelumnya, dilanjutkan dengan pembahasan terhadap hasil tersebut Bab V Kesimpulan saran, bab ini merupakan bab penutup dari skripsi ini yang berisikan tentang kesimpulan dan saran 4

BAB II PENAKSIRAN MODEL REGRESI BETA 21 Pendahuluan Model linier pada umunya berbentuk (21) + = dengan asumsi bahwa unsur-unsur dari e adalah berdistribusi normal identik dan saling bebas, ߪ, 0 )ܦܫ ~ ଶ ), merupakan basis dari kebanyakan analisis untuk data-data kontinu Dengan adanya berbagai kelebihan dalam teori statistik dan perangkat lunak komputer, kita dapat menggunakan metoda analog dengan pengembangan model linear dalam beberapa situasi sebagai berikut: Variabel respons mempunyai distribusi selain distribusi normal mereka mungkin dapat berbentuk kategori daripada kontinu Hubungan antara variabel respons dengan penjelasnya tidak perlu berbentuk linear sederhana seperti dalam (21) Salah satu dari kelebihannya yang telah banyak dikenal juga sebagai sifatsifat yang baik dari distribusi normal dibagi ke dalam kelas yang lebih luas dari suatu distribusi yang disebut juga sebagai distribusi dari keluarga eksponensial Kelebihan yang kedua adalah perluasan dari metoda numerik untuk penaksiran parameter, dari kombinasi linear seperti Xβ dalam (21) kepada fungsi dari kombinasi linear seperti ψ(xβ) Dalam teori prosedur penaksirannya adalah langsung Dalam prakteknya prosedur penaksiran ini melibatkan suatu komputasi tertentu sehingga tidak hanya menjadi lebih mudah dengan perkembangan 5

program komputer untuk optimisasi numerik dari fungsi non-linear Prosedur seperti ini sudah ada dalam paket-paket statistik seperti GLIM (Baker dan Nelder, 1978) 22 Generalized Model Linear (GLM) Istilah model linear umum atau generalized linear model (GLM) biasanya merujuk pada model regresi biasa untuk variabel respons kontinu pada variabel prediktor kontinu dan/atau kategorik Model ini juga termasuk model regresi multipel maupun model ANOVA atau ANCOVA (hanya untuk efek tetap) Bentuknya adalah (22) ) ଶ ߪ,ߚ ݔ) ~ ݕ dimana x i berisi kovariat yang diketahui dan β adalah koefisien yang akan ditaksir Model ini dapat ditaksir dengan menggunakan metode kuadrat terkecil dan metode kuadrat terkecil diboboti Istilah GLM merujuk pada kelas model yang lebih besar yang dipopulerkan oleh McCullagh dan Nelder (1989) Dalam model ini, variabel respons y i diasumsikan mengikuti distribusi dari keluarga eksponensial dengan rata-rata µ i, yang biasanya diasumsikan sebagai suatu fungsi (seringkali bentuknya nonlinear) dari ݔ ߚ Beberapa penulis mengatakan bentuknya adalah nonlinear karena µ i seringkali merupakan fungsi nonlinear dari kovariat, tetapi McCullagh dan Nelder (1983) mempertimbangkan fungsi tersebut sebagai bentuk yang linear, karena kovariat ini mempengaruhi distribusi dari y i hanya melalui kombinasi linear dari ݔ ߚ Perangkat lunak yang pertama kali dikembangkan untuk mencocokan model ini disebut GLIM, akan tetapi saat ini sudah tersedia 6

paket komputer yang dapat digunakan, termasuk didalamnya adalah melalui SAS/IML Selain distribusi normal, model yang mungkin untuk variabel respons dalam GLM diantaranya adalah binomial, Poisson, Gamma, ataupun Inverse Gaussian Dalam skripsi ini akan difokuskan pembahasannya pada distribusi beta 221 Distribusi Keluarga Eksponensial Perhatikan bila satu buah variabel acak Y yang mempunyai fungsi (massa) peluang, maka variabel ini disebut diskrit, atau bila satu buah variabel acak Y yang mempunyai fungsi densitas peluang, maka variabel ini disebut kontinu, yang bergantung pada satu buah parameter θ Suatu distribusi merupakan anggota dari keluarga eksponensial apabila mempunyai bentuk sebagai berikut: (ߠ) ߠݕ ቋ(,ݕ) + ቊݔ = (ߠ,ݕ) ( ) (ߠ) ቊݔ = (23) (ߠ,ݕ) ൠ ݕ ߠ ݔቋ ( ) ( ) dimana θ disebut juga sebagai parameter kanonik dan φ disebut juga sebagai parameter dispersi Rata-rata E(y) = µ merupakan fungsi dari θ itu sendiri, sehingga θ merupakan parameter yang diamati, sedangkan φ biasanya dianggap sebagai suatu gangguan Kemudian a( ), b( ), dan c( ) merupakan suatu fungsi yang diketahui dan masing-masing mencirikan anggota distribusi dari keluarga eksponensial Perlu diketahui bahwa nilai harrapan y, E(y), hanya bergantung pada parameter θ dan bukan pada parameter φ 7

222 Unsur unsur dalam GLM Seluruh model linear umum akan mempunyai tiga buah komponen, yaitu : a Komponen acak Komponen ini menggambarkan distribusi dari variabel respons yang diamati Variabel respon y 1, y 2,, y n merupakan sampel acak yang distribusinya berasal dari keluarga eksponensial, seperti normal, binomial, Poisson, gamma, dan banyak lainnya Distribusi keluarga eksponensial seluruhnya bergantung pada vektor parameter θ dimana fungsi loglikelihoodnya dapat ditulis kembali dalam bentuk seperti berikut : (ߠ) = (ߠ)ܮ (24) [(ݕ log[ (, + ݕߠ + ( ) ( ) dimana θ adalah parameter kanonik atau natural, φ adalah parameter skala, serta a( ), b( ), dan c( ) masing-masing mencirikan anggota distribusi dari keluarga eksponensial b Komponen sistematik Komponen ini menggambarkan bagaimana kovariat dimasukan ke dalam model sebagai nilai harapan dari y, µ= E(y) Di dalam model linear umum ini nilai dari µ akan bervariasi menurut taraf dari variabel penjelasnya Komponen sistematik dapat dituliskan dalam bentuk seperti berikut: ൦ = ݔ ߚ + + ଶ ݔ ଶ ߚ + ଵ ݔ ଵ ߚ + ߚ = ߚ = ߟ ൪ (25) ߟ Kombinasi linear dari variabel penjelas ini disebut juga sebagai prediktor linear Beberapa {x j } dapat berbentuk lainnya di dalam model, misalnya x 3 = x 1 x 2 untuk menyatakan bentuk interaksi antara variabel x 1 dan x 2 dalam ଵ ߟ ଶ ߟ 8

memberikan efek pada y, atau mungkin dapat berbentuk x 2 = x 1 2 untuk menyatakan adanya bentuk kurva dari variabel x 1 c Fungsi hubung Komponen ini menyatakan, bagaimana µ= E(y) berhubungan dengan variabel penjelas (X) di dalam prediktor linear Kita dapat memodelan rata-rata µ secara langsung atau memodelkan suatu fungsi monoton g(µ i ) Persamaan model menyatakan bahwa : (26) ߚ = ߟ = ) ߤ) Untuk beberapa fungsi g monoton, yang biasa disebut sebagai fungsi penghubung (link function) 23 Prosedur Penaksiran Model dalam GLM Dalam regresi linier sederhana, metode yang paling banyak digunakan untuk menaksir parameter itu adalah metode kuadrat terkecil Pada metode tersebut kita pilih suatu nilai β 0 dan β 1 tertentu yang akan meminimumkan jumlah kuadrat error dari nilai pengamatan Y dari nilai taksirannya berdasarkan model tertentu Di bawah asumsi yang biasa untuk regresi linier, metode kuadrat terkecil menghasilkan penaksir dengan sejumlah persyaratan secara statistik tertentu Jika metode ini diterapkan pada model dengan variabel biner, maka penaksir tersebut tidak akan mempunyai sifat yang sama Metode umum penaksiran yang membawa kepada fungsi kuadrat terkecil di bawah model regresi linier (jika bentuk galatnya menyebar normal) disebut dengan kemungkinan maksimum Metode ini akan memberikan landasan pada suatu pendekatan pada penaksiran dengan model regresi logistik Metode kemungkinan maksimum akan memberikan nilai-nilai untuk parameter-parameter 9

yang tidak diketahui yang mana akan memaksimumkan peluang yang diperoleh melalui sekumpulan data pengamatan Untuk dapat menerapkan metode ini, maka kita perlu membentuk suatu fungsi yang disebut dengan fungsi kemungkinan (likelihood function) Fungsi ini menyatakan peluang dari data pengamatan sebagai fungsi dari parameter yang tidak diketahui tersebut Penaksir kemungkinan maksimum dari parameter-parameter itu dipilih sedemikian rupa sehingga dapat memaksimumkan fungsi tersebut Metode penskoran Fisher merupakan salah satu metode yang paling banyak digunakan untuk menyelesaikan persamaan non linear Metode ini juga dapat digunakan untuk menentukan titik maksimum dari suatu fungsi, sebagaimana permasalahan dalam menentukan penaksir kemungkinan maksimum Prosedur penaksiran parameter melalui prosedur ini memerlukan turunan parsial pertama dan kedua dari fungsi kemungkinan, dimana turunan pertama dan kedua dari fungsi kemungkinan masing-masing disebut sebagai statistik skor (score statistics) dan matriks informasi (I) Statistik skor adalah suatu ukuran untuk menguji keberartian parameter, dimana statistik ini berbentuk kuadratik yang berdasarkan pada vektor turunan pertama parsial dari fungsi log kemungkinan terhadap β, yang dievaluasi pada saat H 0 : β = β 0 Sedangkan matriks informasi merupakan nilai harapan yang berharga negatif dari matriks turunan kedua parsial dari fungsi log kemungkinan 24 Distribusi Beta Dalam teori probabilitas dan statistik, distribusi beta adalah distribusi probabilitas yang didefinisikan pada interval (0, 1) oleh dua parameter positif, bentuk parameter biasanya dilambangkan dengan a dan b Fungsi densitas dari 10

suatu variabel acak Y yang berdistribusi Beta, dengan parameter a dan b, dapat ditulis sebagai berikut : Γ( + ) > 0 0, > 1, < ݕ < 0 ; ଵ (ݕ (1 ଵݕ ቐΓ( )Γ( ) = (ݕ) ݕ ݕ ; 0 (27) dimana Г() merupakan fungsi gamma Rata-rata dan variansi dari distribusi Beta dengan parameter a dan b masing-masing adalah : = ( )ܧ + (28) dan = ( )ݎ ݒ ( + ) ଶ ( + + 1) (29) 25 Model Regresi Beta Pada bagian ini dibahas mengenai suatu model regresi untuk respons yang mengikuti distribusi beta Fungsi densitas dari distribusi beta diberikan dalam Pers (27), dengan parameter a dan b Akan tetapi untuk keperluan pemodelan, maka biasanya akan sangat berguna apabila memodelkan rata-rata dari variabel respons Selain itu pula biasanya perlu mendefinisikan model sedemikian rupa sehingga model ini berisi suatu parameter dispersi Untuk membentuk model regresi beta dengan menyertakan rata-rata respons bersamaan dengan parameter dispersinya, maka perlu dilakukan reparameterisasi dari fungsi densitas beta = ߤ Misalkan ( ) dan ߢ = ( + ), sehingga diperoleh bahwa = ߢߤ dan Dengan demikian, berdasarkan Pers (28) dan (29) diketahui ߢ(ߤ (1 = bahwa : (210) ߤ = ( )ܧ 11

dan = ( )ݎ ݒ (ߤ 1 )ߤ + 1 ߢ (211) dimana µ adalah rata-rata dari variabel respons dan κ dapat diinterpretasikan sebagai parameter dispersi, dalam arti bahwa untuk µ tertentu, maka nilai dari κ lebih besar akan memberikan varians bagi variabel respons yang lebih kecil Setelah dilakukan reparameterisasi tersebut, maka fungsi untuk variabel acak Y yang mengikuti distribusi beta menjadi : = (ݕ) (ߢ) Γ (212) 1 < ݕ < 0 ; (ଵ ఓ) ଵ (ݕ (1 ఓ ଵݕ (ߢ(ߤ Γ((1 (ߢߤ) Γ Parameterisasi semacam ini menyatakan bahwa 0 < < ߤ 1 dan <ߢ 0, dan juga 0 > (ߤ 1 )ߢ = 0 dan <ߢߤ bahwa = dapat dengan mudah ditunjukkan Untuk membentuk model regresi beta dilakukan pendekatan GLM dengan menggunakan dua fungsi hubung yaitu, satu fungsi hubung digunakan untuk parameter lokasi ߤ dan fungsi hubung yang lainnya digunakan untuk parameter dispersi ߢ Menurut Smithson dan Verkuilen (2005) bahwa fungsi ini merupakan fungsi non linear, halus (smooth), dan monoton yang memetakan dari ruang yang tidak berbatas (unbounded) dari prediktor linear ke dalam ruang sampel yang diamati, dalam hal ini terbatas pada interval terbuka (0, 1) Misalkan X dan Z adalah matriks kovariat (mungkin bisa identik), dengan x i dan z i merupakan vektor baris ke-i dari kedua matriks tersebut Dimisalkan pula dan masingmasing adalah vektor koefisien regresi beta GLM untuk parameter lokasi biasanya adalah (213) = ) ߤ) 12

dimana ( )adalah fungsi hubung monoton, suatu fungsi yang mempunyai turunan Fungsi hubung yang digunakan oleh Pers (213) adalah menggunakan fungsi hubung logit Bentuk umum dari hubungan antara rata-rata dan varians adalah (214) ) ߢ)ݑ( ߤ)ߥ = ଶ ߪ dimana v dan u adalah fungsi yang bersifat non-negatif Parameter dispersi ߢ diasumsikan sebagai suatu bentuk yang dapat dimodelkan sebagai (215) = ) ߢ) h dimana h merupakan fungsi hubung yang lain, yaitu dalam hal ini menggunakan fungsi hubung log dimana variabel z i yang dinyatakan dalam Pers (215) berupa vektor satu Untuk variabel respons yang berdistribusi beta, maka rata-ratanya harus berada dalam selang terbuka, sehingga diperlukan suatu fungsi hubung yang dapat memenuhi kondisi tersebut Salah satu pilihan fungsi hubung yang dapat digunakan adalah fungsi hubung logit, karena fungsi hubung ini mampu memetakan (0, ߤ 1) ke dalam ruang sampel yang sesuai dengan distribusinya Fungsi hubung logit ini juga biasa digunakan sebagai fungsi hubung dalam model regresi logistik Dengan demikian, model regresi beta dapat dikatakan sebagai bentuk umum dari model regresi logistik ketika variabel respon yang diamati berbentuk proporsi Parameter dispersi κ harus bernilai positif karena setelah direpatameterisasi parameter µ dan κ bernilai positif Fungsi hubung log yang dapat memenuhi sifat tersebut, yaitu (216) = ) ߢ) log 13

sehingga nilai taksiran untuk parameter dispersinya dimodelkan dalam bentuk (217) ൯ exp൫ = ߢ ߜ disini digunakan tanda negatif untuk membuat interpretasi mengenai koefisien ߜ merupakan parameter dispersi, maka suatu ߢ menjadi lebih mudah Oleh karena yang bernilai positif mengindikasikan variansi yang lebih kecil, dan hal ini tentu saja menjadi sulit dalam interpretasinya 26 Penaksir Kemungkinan Maksimum Untuk Regresi Beta Misalkan Y i,, Y n adalah variabel acak saling bebas, dimana untuk setiap Y i, untuk i = 1,, n mengikuti densitas yang diberikan dalam Pers (212) dengan rata-rata ߤ dan parameter dispersi ߢ yang tidak diketahui Model diperoleh dengan cara mengasumsikan bahwa rata-rata y t dapat ditulis sebagai berikut (218) ߟ = ߚ ݔ ) = ߤ) ଵ dimana ߚ) = ଵ, ߚ ) adalah vektor dari parameter regresi, dan x i1,, x ip merupakan data pengamatan pada k buah kovariat, untuk <, yang diasumsikan tetap (fixed) dan diketahui bahwa varians dari respons y merupakan fungsi dari,ߤ dan akibatnya juga merupakan fungsi dari nilai kovariatnya Dengan demikian, varians yang tidak konstan secara tidak langsung akan diakomodasikan ke dalam model Disini terlihat parameter rata-rata dibatasi pada selang terbuka (0, 1), sehingga diperlukan suatu fungsi hubung yang akan memetakan parameter dari interval ke dalam ruang bilangan nyata Fungsi hubung logit merupakan fungsi hubung kanonik dan akan mengembalikan penaksir parameter ke dalam bentuk log odds rasio 14

Fungsi hubung logit ߤ) ) didefinisikan sebagai : ߤ ) = log ൬ ߤ)ݐ = ) ߤ) = ൰ exp൫ = ߤ ߤ 1 ൯ ( ) exp 1 + (219) Dalam hal ini, parameter regresi mempunyai interpretasi yang penting Misalkan bahwa nilai dari prediktor ke-i meningkat sebesar c unit, dan variabel ߤ prediktor lainnya dianggap tidak berubah, serta merupakan rata-rata dari variabel y di bawah suatu nilai kovariat yang baru, sedangkan ߤ menyatakan ratarata y di bawah nilai kovariat yang asli, maka dapat ditunjukkan bahwa : ) ߤ /(1 ߤ = ൯ ߚexp൫ (ߤ 1 )/ߤ (220) Artinya, ߚexp൫ ൯ adalah sama dengan odds rasio, sama dengan interpretasi dalam model regresi logistik Fungsi log-likelihood untuk ruang sampel model regresi beta memiliki bentuk : dimana (221) (ߢ, ߤ) = (ߜ,ߚ) ଵ ݕ ( 1 ߢ ߤ) + {ߢ( ߤ Γ{(1 (ߢ ߤ) Γ log (ߢ) Γ = (ߢ, ߤ) (222) ) ݕ log(1 1} ߢ( ߤ {(1 + Atau dapat dituliskan dalam bentuk persamaan seperti berikut : Γ൫ ఋ ൯ = log (, :ߜ,ߚ) ఋ ቆ ఋ log Γ log Γ ቆ + ఋ ቆ 1 + ௫ቇ 1 + ቇ 1 + ௫ 1ቇlog ݕ ఋ ቆ ఋ + 1 + ௫ 1ቇlog ݕ + ቆ (223) ) ݕ 1ቇlog(1 + 1 15

Misalkan ݏ = ݕ} / (1 ݕ )} dan ߤ = ߤ) ߤ ((1 (ߢ (ߢ( Kemudian, vektor skor yang merupakan turunan pertama dari fungsi log-likelihood terhadap parameter dan, diberikan oleh : (ߢ, ߤ) = (ߜ,ߚ) ߠ (ߢ, ߤ) ߚ (ߢ, ߤ) ߜ ) ߤ ݏ) ߢ = ൮ ߤ ௧ ݏ) ߤ ൲ (224) ) + log(1 ݕ ) ൫(1 ߤ + ൯ߢ( ψ(ߢ) ଵ dimana X adalah matriks data dari variabel prediktor berukuran dengan unsur baris ke-t adalah ݔ dan = ቂ ଵ ߤ) ` ଵ ),, ଵ ߤ) ` )ቃ dan vektor (ߜ,ߚ) = parameter Tahap selanjutnya adalah menentukan matriks informasi Misalkan diketahui }, dengan ݓ,, ଵ ݓ} = 1 {(ߢ( ߤ `(1 + (ߢ ߤ)` }ߢ = ݓ )} ଶ ߤ)` } = ( ଵ,, ) dengan = ߤ)` }ߢ ߤ(ߢ `(1 ߤ ߤ 1 )(ߢ( )}, dimana `( ) merupakan fungsi trigamma Dimisalkan pula = { ଵ,, }, dengan (ߢ)` ଶ ) ߤ 1 )(ߢ( ߤ `((1 + ଶ ߤ(ߢ ߤ)` = Dengan demikian matriks informasi Fisher, yang merupakan turunan kedua dari minus ekspetasi fungsi log-likelihood yang diberikan dalam Pers (222) terhadap parameter,ߚ) (ߜ diberikan oleh 16

(ߜ,ߚ) ଶ (ߜ,ߚ) ଶ ߚ ܧ = (ߜ,ߚ)ܫ ߜ ߚ ଶ (ߜ,ߚ) ଶ (ߜ,ߚ) ଶ ଶ ߜ ߚ ߜ (225) dimana డమ (ఉ,ఋ) డఉ మ (ఉ,ఋ) డమ, ߢ = డఉడఋ (ఉ,ఋ) dan డమ, = డఋ మ bahwa parameter ߚ dan ߜ bersifat tidak orthogonal Namun di sini,() = Pada saat ukuran sampel besar, maka vektor penaksir parameter ( መߜ akan mengikuti akan mengikuti pendekatan distribusi normal, መߚ) = ` ߠ multivariat, atau dapat dinyatakan sebagai ~ߠ ቆቀ ߜ ߚ ቁ,,ߚ)ܫ] ଵ [(ߜ ቇ, dimana መߚ dan መߜ masing-masing adalah penaksir kemungkinan maksimum Perlu ditambahkan juga bahwa,ߚ)ܫ] [(ߜ ଵ dapat digunakan untuk memperoleh galat baku asimptotik bagi penaksir kemungkinan maksimum Penaksir kemungkinan maksimum bagi β dan ߜ yang diperoleh dari = (ߜ,ߚ) U 0 bukan merupakan persamaan tertutup Dengan demikian solusinya harus diselesaikan secara numerik dengan menggunakan algoritma optimisasi nonlinear, seperti metode penskoran Fisher 27 Regresi Logistik Regresi logistik adalah salah satu bagian dari analisis regresi, yang digunakan untuk memprediksi peluang kejadian suatu peristiwa dengan mencocokan data pada fungsi logit Metode ini merupakan model linier umum yang digunakan untuk regresi binomial Seperti analisis regresi pada umunya, metode ini menggunakan beberapa variabel bebas berupa data berskala interval dan atau kategorik Regresi logistik tidak memerlukan asumsi normalitas, 17

heteroskedastitsitas dan autokorelasi, dikarenakan variabel tak bebas yang terdapat pada regresi logistik merupakan variabel biner (0 dan 1) Bentuk umum model peluang regresi logistik diformulasikan sebagai berikut : = (ݔ)ߨ exp൫ ൯ ( ) exp + 1 (226), 1 (ݔ)ߨ adalah peluang kejadian sukses dengan nilai peluang 0 (ݔ)ߨ dimana dan β adalah koefisien parameter merupakan fungsi yang non linier, sehingga perlu dilakukan transformasi (ݔ)ߨ kedalam bentuk logit untuk memperoleh fungsi yang linier Dengan melakukan transformasi dari logit,(ݔ)ߨ maka didapat persamaan yang lebih sederhana,yaitu : గ(௫) (227) ൫ଵ గ(௫)൯ = log (x) = Langkah-langkah yang ada dalam penggunaan analisis regresi logistik yaitu statistik kecocokan model dan uji signifikansi parameter model 271 Uji Kecocokan Model (Goodness Of Fit ) Suatu alat statistik yang digunakan untuk pengujian kecocokan model berguna untuk memilih sebuah model yang hasilnya paling cocok untuk data yang diperoleh Nilai p-value yang tinggi berarti, model merupakan model yang terbaik Metode yang digunakan untuk goodness of fit pada data kategorik adalah statistik chi-kuadrat Pearson, dan statistik chi-kuadrat Deviance dengan hipotesis uji sebagai berikut: H 0 : Model cocok dengan data H 1 : Model tidak cocok dengan data 18

dimana statistik chi-kuadrat Pearson : ଶ = ݕ) Ƹ ) Ƹ (1 Ƹ ) ଵ (228) dan statistik chi-kuadrat Devians : = 2 ܦ ଵ ݕ log ൬ ݕ ݕ ൰+ ( ݕ ) log ൬ 1 ݕ ݕ 1 ൰ൠ (229) Baik statistik chi-kuadrat Pearson dan statistik chi-kuadrat Devians keduanya mengikuti distribusi chi kuadrat Dengan demikian kriteria uji untuk menguji dapat dirumuskan seperti berikut : Jika nilai statistik chi kuadrat Pearson pada Pers (228) dibandingkan dengan nilai chi kuadrat pada derajat bebas ( ( tertentu atau nilai signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat pearson lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih besar dari α, maka hipotesis dari hal ini berarti H 0 diterima, yang berati model cocok dengan data Dan apabila sebaliknya nilai chi kuadrat Pearson lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi lebih kecil sama dengan α, maka hipotesis H 0 ditolak, yang berarti model tidak cocok dengan data Jika nilai statistik chi kuadrat Devians pada Pers (229) dibandingkan dengan nilai chi kuadrat pada derajat bebas ( ( tertentu atau nilai signifikansi dibandingkan dengan α, dimana apabila nilai chi kuadrat Devians lebih kecil daripada nilai chi-kuadrat, atau nilai signifikansi lebih besar dari α, maka hipotesis dari hal ini berarti H 0 diterima, yang berati 19

model cocok dengan data Dan apabila sebaliknya nilai chi kuadrat Devians lebih besar sama dengan nilai chi-kuadrat, atau nilai signifikansi lebih kecil sama dengan α, maka hipotesis H 0 ditolak, yang berarti model tidak cocok dengan data 272 Uji Signifikansi Parameter Model Untuk memeriksa peranan variabel-variabel penjelas (X) dalam model, dilakukan penguiian terhadap parameter model (β) Penguiian secara simultan dilakukan menggunakan uji G, sedangkan secara parsial menggunakan statistik uji T 2 Statistik uji G adalah uji rasio kemungkinan ( likelihood ratio test) yang digunakan untuk menguji peranan variabel penjelas di dalam model secara bersama-sama Rumus umum statistik uji G untuk menguii hipotesis : H 0 : β 1 = β 2 = = β k = 0 H 1 : minimal ada satu β yang tidak sama dengan 0 Melalui uji statistik seperti berikut : dimana : ܮ 2 ln = ܩ ܮ (230) Lo = maksimum likelihood dari model reduksi atau model yang terdiri dari konstatnta saja Lp = maksimum likelihood dari model penuh (full) atau dengan semua variabel bebas Statistik G ini secara teoritis mengikuti sebaran chi-kuadrat dengan derajat bebas k Kriteria keputusan yang diambil yaitu menolak H 0 bila nilai statistik G lebih besar dari chi-kuadrat Sementara itu, uji T 2 digunakan untuk menguji parameter β j secara parsial Hipotesis yang diuji adalah : 20

H 0 : β j = 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi terhadap model) H 1 : β j 0 (variabel bebas ke-j tidak mempunyai pengaruh secara signifikansi terhadap model) Formula untuk statistik uji T 2 adalah : ߚ ଶ = ቆ መߚ൫ܧ ൯ ቇ ଶ (231) Secara teori statistik uji T 2 ini mengikuti sebaran normal baku jika H 0 benar Kriteria keputusan adalah H 0 ditolak jika statistik uji T 2 > z α/2 21

BAB III METODOLOGI PENELITIAN 31 Data dan Sumber Data Data yang digunakan dalam skripsi ini merupakan data skunder yang berasal dari sebuah tesis yang berjudul Kajian Perbandingan Model Regresi Beta-binomial dengan Model Regresi Logistik dan Penerapannya untuk Menduga Pola Kelulusan Mahasiswa IPB-TPB tahun akademik 1997/1998 Populasi dalam penelitian adalah mahasiswa mahasiswa pada program tingkat persiapan bersama di Institut Pertanian Bogor (IPB) Mahasiswa mahasiswa yang dimaksud adalah mahasiswa program strata satu (S1) yang telah diterima di IPB pada tahun akademik 1997/1998, baik yang diterima melalui saringan ujian masuk perguruan tinggi negeri (UMPTN) maupun jalur penelusuran minat dan bakat (atau dikenal pula dengan jalur PMDK) Data akan diambil dari Program Tingkat Persiapan Bersama IPB dengan banyak pengamatan 2216 pengamatan Data yang diperlukan untuk menganalisis pola kelulusan mahasiswa dalam mengikuti sejumlah mata kuliah yang diselenggarakan pada tingkat persiapan bersama di Institut Pertanian Bogor (IPB), yaitu semua mata kuliah yang diambil oleh mahasiswa pada semester satu dan dua 22

Tabel 31 Daftar Nama Variabel dan Kategori dari Variabel No Nama Variabel Kategori Notasi 1 ID 2 Jenis Kelamin (JK) 0 = Perempuan 1 = Laki - laki X1 3 Cara lolos seleksi ke IPB (Jalur) 0 = PMDK 1 = UMPTN X2 4 Nilai rata-rata ijazah X3 5 Nilai ebtanas murni/nem X4 6 Daerah asal sekolah 0 = Kabupaten 1 = Kotamadya X5 7 Status sekolah 0 = Swasta 1 = Negeri X6 8 Banyaknya mata kuliah yang lulus R 9 Banyaknya mata kuliah yang diambil N 10 Proporsi banyaknya mata kuliah yang lulus y* Nusar Hajarisman (1998) Kajian Perbandingan Model Regresi Beta-Binomial dengan Model regresi Logistik dan Penerapannya untuk Menduga Pola Kelulusan Mahasiswa IPB-TPB tahun 1997/1998 Variabel ID merupakan nomor induk mahasiswa IPB, baik yang berjenis kelamin laki-laki ataupun perempuan Variabel Cara lolos seleksi ke IPB (jalur) dapat melalui dua tes yaitu PMDK dan UMPTN, dimana Variabel nilai rata-rata ijazah dan Variabel nilai ebtanas murni (NEM) harus sesuai dengan persyaratan yang ditentukan oleh pihak kampus yaitu IPB Variabel Daerah asal sekolah ialah tempat asal SMU calon mahasiswa itu berada di wilayah kabupaten atau kotamadya, dengan Variabel status sekolah swasta atau negeri Pada dasarnya mahasiswa hanya mengambil banyaknya mata kuliah yang ada pada semester 1 dan 2, yang bertujuan untuk mengetahui berapa banyaknya mata kuliah yang lulus dari semester tersebut setelah mengikuti program tingkat persiapan bersama di Institut Pertanian Bogor (IPB) Dari hasil program tersebut akan didapat hasil proporsi kelulusan dari banyaknya mata kuliah yang diambil oleh peserta dimana data proporsi kelulusan tersebut disajikan pada Tabel 32 23

Tabel 32 Data proporsi kelulusan Mahasiswa dalam mengambil sejumlah mata kuliah yang diselenggarakan pada Tingkat Persiapan Bersama di Institut Pertanian Bogor pada tahun 1997/1998 Obs ID JK Jalur Ijasah NEM Asal Sekolah Status Sekolah Mata Kuliah Yang lulus Mata Kuliah yang diambil Proporsi mata kuliah yang lulus 1 A00497001 0 1 730 4375 1 0 15 15 100 2 A00497002 0 1 850 5086 1 0 15 15 100 3 A00497003 0 1 870 5489 1 0 15 15 100 4 A00497004 1 1 820 5181 1 0 15 15 100 5 A00497005 0 1 731 4113 1 1 15 15 100 6 A00497006 0 0 800 5204 1 0 15 15 100 7 A00497007 0 1 760 4178 1 0 15 15 100 8 A00497008 0 1 750 4838 1 0 15 15 100 9 A00497009 0 1 770 5581 1 0 15 15 100 10 A00497010 0 1 760 4682 1 0 15 15 100 2209 G07497028 1 1 740 4092 1 1 3 15 020 2210 G07497029 1 1 670 3468 1 1 1 15 007 2211 G07497030 1 1 760 4010 1 1 7 15 047 2212 G07497031 1 1 790 4670 0 0 6 15 040 2213 G07497032 1 1 670 4064 0 0 4 15 027 2214 G07497033 1 1 640 4160 0 0 8 15 053 2215 G07497034 1 1 718 4139 0 1 1 15 007 2216 G07497035 1 1 730 5218 0 0 10 15 067 Dari Tabel 32 terlihat bahwa nilai dari proporsi mencakup nilai 0 dan 1, yang mana didalam model regresi beta berada dalam selang (0,1) yaitu tidak mencakup nilai 0 dan 1 Maka untuk mengatasi permasalahan tersebut dengan menggunakan persamaan seperti berikut, y = [y(n 1) + s]/n, dimana s adalah konstan antara 0 dan 1 yaitu 05 menurut Smithson dan Verkuilen (2005) Dari hasil persamaan berikut maka didapat nilai proporsi yang baru tidak mencakup 0 dan 1, yang disajikan pada Tabel dilampiran 2 24

32 Tahapan Penelitian Tahapan yang digunakan dalam menentukan model regresi beta pada data proporsi yaitu : 1 Mendeskripsikan data penelitian 2 Memodelkan data penelitian dengan regresi logistik, dengan tahapan sebagai berikut : a Mengidentifikasi variabel yang signifikan melalui statistik uji T 2 untuk masing-masing variabel prediktor Proses ini disebut juga sebagai analisis variabel tunggal dengan mengambil taraf signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989) b Variabel yang dianggap signifikan pada tahap pertama, kemudian dianalisis secara simultan (proses ini disebut sebagai analisis variabel ganda) Pada proses ini menggunakan statistik uji chikuadrat pada taraf signifikansi sebesar 10% c Sebelum membuat kesimpulan akhir, untuk setiap variabel yang dianggap tidak signifikan pada tahap kedua akan diperiksa kembali signifikansi variabel tersebut terhadap model dengan menggunakan uji rasio kemungkinan 3 Memodelkan data penelitian dengan regresi beta, melalui Pers (213) dan (217) dimana metode numerik yang digunakan penskoran Fisher, dengan tahapan sebagai berikut : a Mengidentifikasi variabel yang signifikan melalui statistik uji T 2 untuk masing-masing variabel prediktor Proses ini disebut juga 25

sebagai analisis variabel tunggal dengan mengambil taraf signifikansi sebesar 30% (Hosmer dan Lemeshow, 1989) b Variabel yang dianggap signifikan pada tahap pertama, kemudian dianalisis secara simultan (proses ini disebut sebagai analisis variabel ganda) Pada proses ini menggunakan statistik uji chikuadrat pada taraf signifikansi sebesar 10% c Sebelum membuat kesimpulan akhir, untuk setiap variabel yang dianggap tidak signifikan pada tahap kedua akan diperiksa kembali signifikansi variabel tersebut terhadap model dengan menggunakan uji rasio kemungkinan 33 Algoritma Penskoran Fisher Salah satu metode penaksiran model adalah dengan menggunakan penskoran Fisher, dimana model ini untuk menyelesaikan persamaan nonlinier Metode ini dapat digunakan untuk menentukan titik maksimum dari suatu fungsi, sebagaimana permasalahan dalam menentukan penaksir parameter dengan metode kemungkinana maksimum Berikut ini prosedur penskoran Fisher untuk menentukan penaksir β yang dapat memaksimumkan fungsi kemungkinan, yang sebut saja fungsi u(β*) Pertama-tama perhatikan bahwa n buah pengamatan akan digunakan untuk menaksir nilai-nilai dari p buah parameter, β 1, β 2,, β p, serta bentuk fungsi kemungkinan L(β) Turunan sebanyak p buah dari fungsi log kemungkinan terhadap β 1, β 2,, β p, disebut sebagai statistik skor atau disebut juga sebagai skor efisien (efficient score), dan dapat dipasangkan untuk memberikan vektor statistik skor p x 1, dimana komponen ke-j adalah 26

u(β), untuk j = 1, 2,, p Vektor ini dinotasikan sebagai ߚ /(ߚ)ܮ Misalkan I(β) adalah matriks berukuran p x p pada turunan kedua dari log L(β), dimana unsur-unsur ke-(j, k) dari matriks tersebut ܧ : adalah డమ (ఉ) ൠ డఉ డఉ, untuk j = 1, 2,, p dan k = 1, 2,, p Matriks I(β) ini kadang-kadang disebut juga sebagai matriks Informasi Perhatikan u(β), yaitu vektor skor statistik yang dievaluasi pada penaksir kemungkinan maksimum β, β Dengan menggunakan deret Taylor, dimana harga β* diperkirakan akan mendekati β, akan diperoleh: (31) ) ߚ ߚ)( ߚ)ܫ + ) ߚ)ݑ (ߚ)ݑ Penaksir kemungkinan maksimum bagi β akan memenuhi persamaan berikut: (ߚ)ܮ ቤ ߚ ఉ = 0 (32) untuk j = 1, 2,, p, sehingga u(β) = 0 Dari Pers (31) dapat diketahui bahwa: ) ߚ)ݑ( ߚ) ଵ ܫ + ߚ ߚ Penentuan β yang dicapai melalui proses iterasi ditentukan oleh: ൯ (௧) ߚ൫ݑ൯ (௧) ߚ൫ ଵ ܫ + (௧) ߚ = (௧ ଵ) ߚ (33) Proses iterasi selesai jika selisih antar iterasi sudah sangat kecil Agresti (1990) menyebutkan salah satu kriteria kekonvergenan ߚ (௧) ke β, yaitu: ߚቚ (௧ ଵ) መߚ ቚ ߚቚ (௧) መߚ ቚ ଶ, untuk setiap j, c > 0 (34) 27

Untuk lebih mudah dapat dilihat pada Gambar 31 dibawah ini Mulai Tentukan nilai awal ߠ Hitung vector skor dan Matriks informasi Hitung 1 ൯ߢ, ߤ൭ 2 ൫ ܧ (௧) + ߠ = (௧ ଵ) ߠ ߠ ൱൩, ߤቆ ൫ ൯ߢ ߠ ቇ TIDAK Evaluasi apakah หߠ (௧ ଵ) ߠ (௧) ห< Dimana c=00001 Konvergen en? YA Berhenti Gambar 31 Diagram Alir Penskoran Fisher 28

BAB IV HASIL DAN PEMBAHASAN 41 Pendahuluan Pada bab ini akan dibahas penerapan model regresi beta untuk menduga pola kelulusan mahasiswa dalam mengambil sejumlah mata kuliah Dalam penelitian ini akan diamati proporsi lulus tidaknya seorang mahasiswa dalam mengikuti sejumlah mata kuliah Pengamatan seperti ini perlu dicarikan suatu metode untuk menganalisis hubungan antara proporsi tingkat kelulusan mahasiswa dengan sejumlah variabel prediktor yang dianggap mampu menjelaskan proporsi tingkat kelulusan mahasiswa tersebut Sehingga dalam penelitian ini digunakan dua tahapan yaitu yang pertama, data yang diperoleh akan dianalisis melalui metoda baku, dalam hal ini adalah dengan menggunakan metoda regresi logistik biasa Pada tahap kedua, baru akan dilakukan analisis dengan menggunakan metoda atau model regresi beta Pada masing-masing tahap analisis, sebelumnya kita harus mendeskripsikan mengenai variabel-variabel yang ada, setelah itu ada dua hal yang dapat dilakukan sehubungan dengan pemilihan model yang dianggap baik Hal-hal yang akan dilakukan itu penaksiran model (termasuk didalamnya penaksiran parameter di dalam model, serta pengujian keberartian parameter di dalam model) Metoda penaksiran yang digunakan baik dalam model regresi logistik maupun dalam model regresi beta adalah dengan menggunakan metoda kemungkinan maksimum, melalui metoda iterasi seperti metoda Penskoran Fisher 29

Pada proses pengujian keberartian parameter yang berada di dalam model biasanya menyangkut perumusan hipotesis statistik untuk menentukan apakah variabel-variabel prediktor yang digunakan secara berarti berhubungan dengan variabel responnya Perbandingan antara nilai pengamatan dari variabel respon terhadap nilai taksiran yang diperoleh dari model dengan atau tanpa variabel yang diamati dan berdasarkan pada fungsi log-likelihood merupakan suatu ukuran untuk menguji keberatian parameter dalam model Perbandingan parameter yang berdasarkan pada dua buah log-likelihood ini disebut juga sebagai uji rasio likelihood (Hosmer dan Lemeshow, 1989) Sedangkan McCullagh dan Nelder (1983) menyebut statistik ini sebagai devians, yang menyebar secara chi-kuadrat dengan derajat bebas (n - p) Adapun ukuran lain yang digunakan untuk menguji keberartian parameter ini, yaitu dengan menggunakan uji chi-kuadrat untuk regresi logistik dan menggunakan uji t yang pada dasarnya menunjukkan seberapa jauh pengaruh satu variabel bebas secara individual dalam menerangkan variasi variabel respon Tujuan dari uji t adalah untuk menguji koefisien regresi secara individual pada regresi beta Statistik-statistik tersebut nantinya akan digunakan pada proses pemilihan variabel yang akan masuk ke dalam model 42 Deskripsi Data Dalam deskripsi data ini penulis mendeskripsikan variabel - variabel prediktor yang terdapat pada data proporsi kelulusan banyaknya mata kuliah yang diambil oleh mahasiswa pada tahun akademik 1997/1998 Untuk lebih singkat deskripsi data akan di visualisasikan melalui Gambar 41: 30

Gambar 41 Diagram Lingkaran Jenis Kelamin Dari Gambar 41 terlihat bahwa perbandingan persentase perempuan dan laki-laki yang masuk ke IPB pada tahun akademik 1997/1998 relatif seimbang, yaitu: 5451% dan 4549% Gambar 42 Diagram Lingkaran Cara Lolos Seleksi ke IPB Dari Gambar 42 terlihat di Institut Pertanian Bogor merupakan salah satu perguruan tinggi negeri di Indonesia yang menyelenggarakan penyaringan mahasiswanya melalui dua jalur, yaitu jalur Ujian Masuk Perguruan Tinggi Negeri (UMPTN) dan jalur Penelusuran Minat dan Bakat IPB (PMDK), dimana hampir 91,47% diantara mahasiswa yang masuk ke IPB adalah yang melalui jalur UMPTN 31

Gambar 43 Box Plot Nilai Rata-rata Ijazah Dari Gambar 43 terlihat latar belakang prestasi pendidikan mahasiswa selama mereka masih duduk di bangku SLTA ditunjukkan oleh nilai rata-rata ijazah, dimana nilai rata-rata ijazah adalah sebesar 745 dengan simpangan baku sebesar 045472, yang mempunyai nilai minimal sebesar 600 dan nilai maksimal sebesar 900 Angka-angka tersebut menunjukkan bahwa mahasiswa TPB-IPB tahun akademik 1997/1998 mempunyai latar belakang prestasi akademik yang cukup baik Gambar 44 Box Plot Nilai Ebtanas Murni 32

Dari Gambar 44 terlihat latar belakang prestasi pendidikan mahasiswa selama mereka masih duduk di bangku SLTA ditunjukkan oleh Nilai Ebtanas Murni (NEM), dimana Nilai Ebtanas Murni (NEM) adalah sebesar 4431 dengan simpangan baku sebesar 6041, yang mempunyai nilai minimal sebesar 2393 dan nilai maksimal sebesar 6229 Angka-angka tersebut menunjukkan bahwa mahasiswa TPB-IPB tahun akademik 1997/1998 mempunyai latar belakang prestasi akademik yang cukup baik Gambar 45 Diagram Lingkaran Daerah Asal Sekolah Dari Gambar 45 terlihat bahwa sebagian besar mahasiswa IPB pada tahun akademik 1997/1998 masih didominasi oleh para siswa yang berasal dari daerah kotamadya dibandingkan dengan kabupaten yaitu sebesar 7031%, dan 2969% Gambar 46 Diagram Lingkaran Status Asal sekolah 33