J-Statistika Vol 4 No PERBANDINGAN METODE MAXIMUM LIKELIHOOD ESTIMATION (MLE) DENGAN BAYESIAN PADA REGRESI LOGISTIK MULTINOMIAL Prmadina Kanah Ariska -mail : blaar_statistika@yahoo.com ABSTRAK Rgrsi logistik multinomial klasik mnggunakan mtod Maximum Liklihood untuk mngstimasi paramtr - paramtrnya. Sdangkan pada rgrsi logistik multinomial dngan mnggunakan mtod Baysian, distribusi prior dipadukan dngan liklihood datanya untuk mndapatkan distribusi postrior. Distribusi postrior trsbut akan digunakan untuk mngstimasi paramtr paramtrnya. Pnrapan dua mtod ini dilakukanpada pnlitian ini untuk mngklasifikasikan siswa SMAN Grati Pasuruan pada 3 urusan yang tlah dittapkan olh pihak skolah yaitu urusan IPA, IPS dan Bahasa. Variabl prdiktor yang digunakan ada 5 yaitu tuntas IPA, tuntas IPS, tuntas Bahasa, IQ dan minat. Dari klima variabl prdiktor trsbut trnyata variabl yang brpngaruh scara signifikan pada pnurusan siswa adalah variabl tuntas bahasa dan IQ. Misklasifikasi pada rgrsi logistik multinomial klasik lbih bsar dibandingkan pada rgrsi logistik multinomial mtod Baysian. Misklasifikasi dngan mtod prtama adalah sbsar 46,% sdangkan dngan mnggunakan mtod kdua yaitu mtod Baysian, misklasifikasinya adalah sbsar 39,5%. Shingga dalam pnlitian ini, rgrsi logistik multinomial dngan mtod Baysian lbih baik dalam pmodlan urusan di SMAN Grati Pasuruan ika dibandingkan dngan rgrsi logistik Multinomial klasik. Kata kunci: Rgrsi logistik Multinomial, Baysian, Misklasifikasi, Jurusan. Pndahuluan Rgrsi Logistik Multinomial mrupakan salah satu mtod yang diusulkan untuk mngatasi masalah pnurusan SMA. Altrnatif pilihan sbagai nilai rspon yang lbih dari dua yaitu IPA, IPS dan Bahasa, mrupakan altrnatif yang mngikuti distribusi multinomial. Shingga nantinya siswa akan bisa diklompokkan k dalam 3 klompok urusan ssuai dngan faktor-faktor yang mmpngaruhinya. Namun, kasus yang sringkali tradi adalah bahwasanya probabilitas siswa dari suatu klas trtntu untuk bisa masuk k salah satu urusan, tidaklah sama. Hal ini bisa disbabkan olh faktor lain yang brbda pada masing-masing klas. Misal karna prbdaan guru yang mngaar, suasana klas, mtod pngaaran dan lain sbagainya. Shingga, probabilitas sorang siswa untuk masuk k salah satu urusan mmiliki distribusi trtntu. Hal ini bisa diatasi dngan mtod Baysian yang mmprlakukan paramtrnya sbagai variabl. Pndkatan algoritma komputasional Markov Chain Mont Carlo (MCMC) digunakan untuk mmprmudah analisis, karna mtod ini dapat mnaksir distribusi marginal masing masing paramtr suatu variabl random yang brdimnsi tinggi. Mtod ini dapat digunakan walaupun bntuk distribusi postrior yang didapatkan sangat komplks. Sknario sampling yang digunakan adalah Gibbs Samplr. Gibbs Samplr adalah suatu tknik simulasi untuk mmbangkitkan variabl random dari suatu distribusi trtntu scara langsung, tanpa prlu mnghitung dnsitasnya. Madigan, Gnkin, Lwis, dan Fradkin (25) mnlaskan bahwa pada 2 umumnya, distribusi Prior yang sringkali digunakan adalah distribusi Gaussian dngan man dan varian. Pnggunaan rgrsi logistik multinomial ditrapkan pada pntapan urusan di SMAN Grati Pasuruan. Variabl indpndn sorang siswa diprhitungkan masuk k urusan trtntu antara lain nilai ktuntasan siswa pada stiap bidang di smstr trakhir klas X, IQ dan minat siswa. Modl pntapan urusan SMA ini akan dianalisis dngan mnggunakan rgrsi logistik Multinomial dan Rgrsi logistik Multinomial dnga mtod Baysian. Dua mtod ini akan dibandingkan untuk mngtahui misklasifikasi yang diprolh. 2. Rgrsi Logistik Multinomial Rgrsi logistik mrupakan suatu pndkatan modl matmatis yang dapat digunakan untuk mnyatakan hubungan dari bbrapa variabl X trhadap variabl dpndnnya yang brsifat katgori (Klinbaum, 994). Prluasan rgrsi logistik dngan variabl dpndn yang lbih dari dua katgori disbut dngan Rgrsi Logistik multinomial. Rgrsi Logistik multinomial banyak digunakan untuk mngidntifikasi hubungan antara variabl rspon dan variabl prdiktor. Pada variabl rspon trdapat lbih dari 2 katgori, shingga mmiliki distribusi multinomial (Fahmir dan Tutz, 994). Bila trdapat J katgori rspon maka modl yang didapatkan sbanyak J. Dimisalkan trdapat tiga katgori rspon Y yaitu,, dan 2, Y = mrupakan rfrnsi/dasar, maka didapatkan modl logit sbagai brikut :
8 Prmadina Kanah Ariska Jika x ) = P(Y= xi) ; =,, 2 ; mnyatakan probabilitas katgori rspon k- pada p variabl ( i prdiktor yang dinyatakan dalam vktor xi maka scara umum probabilitas katgori rspon k- pada p variabl prdiktor yang dinyatakan dalam vktor x i adalah sbagai brikut : xpg ( xi ) (2.) xp g ( x ) ( xi ) P( Y xi ) J k ( i) k i yang mana g x, i =, 2,...p. Untuk klasifikasi suatu pngamatan nilai x ) pada prsamaan di atas akan diadikan pdoman pngklasifikasian. Suatu pngamatan akan masuk dalam rspon katgori brdasarkan nilai x ) yang trbsar. ( i 3. Distribusi Prior Prmasalahan utama dalam pndkatan Bays adalah mmilih distribusi prior g( ) yang mnunukkan ktidakpastian tntang paramtr yang tidak diktahui. Distribusi prior dapat diprolh mlalui data masa lalu yang tlah ada dan distribusi prior ini biasa disbut dngan distribusi prior data basd (DB). Jika data masa lalu tidak trsdia, distribusi prior dipilih brdasarkan kprcayaan pnliti, dan dstribusi prior nis ini disbut prior non data basd (NDB). Brkaitan dngan bntuk distribusi hasil idntifikasi pola data, distribusi prior dibagi mnadi: a. Distribusi prior skawan (conugat prior) mngacu pada acuan analitis modl trutama dalam pmbntukan fungsi liklihoodnya. Shingga dalam pnntuan prior skawan slalu difikirkan mngnai pnntuan pola distribusi prior yang mmpunyai bntuk skawan dngan fungsi dnsitas pmbangun fungsi liklihoodnya. b. Distribusi prior tidak skawan (non conugat prior) apabila pmbrian prior pada suatu modl tidak mngindahkan pola pmbntuk fungsi liklihoodnya. Brkaitan dngan pnntuan masing-masing paramtr pada distribusi prior trsbut diklompokkan mnadi: a. Disribusi prior informatif mngacu pada pmbrian paramtr dari distribusi prior yang tlah dipilih. Baik prior yang dipilih skawan ataukah tidak, pmbrian nilai paramtr pada distribusi prior ini akan sangat mmpngaruhi bntuk distribusi postrior yang akan didapatkan. Pmilihan prior informativ ini didasarkan pada informasi dari data yang diprolh. (Zhu, Mu dan Lu, Arthur, 24) b. Distribusi pror noninformatif, pmilihannya tidak didasarkan pada data yang ada, atau prior yang tidak mngandung informasi tntang. (Tahir, Muhammad dan Hussain, Zawar, 2) 4. Torma Bays Bsaran paramtr,,...,, 2 p ( i dalam sbuah populasi yang mmuat variabl random X dapat disaikan dalam bntuk aturan probabilitas, dalam torma Bays akan disaikan sbagai brikut : l( x ) p( ) p x p( x) (4.) Prsamaan diatas sring dikatakan sbagai mtod untuk updat informasi prior paramtr, p ( ) dngan mnggunakan informasi sampl yang trdapat pada liklihood data, l ( x ), untuk mmprolh informasi postrior, x p, yang akan digunakan dalam kputusan. Pnybut, (x) p adalah suatu konstanta pnormal (normalizd constant). Shingga postrior bisa dituliskan sbagai x l( x ) p( ) p. Prsamaan ini mnunukkan bahwa distribusi postrior proporsional trhadap prior kali liklihood datanya. Shingga distribusi probabilitas postrior trdiri atas smua informasi tntang paramtr (Glman, 995) 5. Markov Chain Mont Carlo (MCMC) Markov Chain Mont Carlo (MCMC) mrupakan suatu mtod simulasi yang mnggunakan sifat rantai Markov untuk mndapatkan data sampl suatu variabl random brdasarkan sknario sampling yang mngikuti sifat markov. Mtod MCMC trsbut digunakan untuk mmprmudah analisis karna mtod ini dapat
9 Prbandingan Antara Mtod Maximum Liklihood Estimation (MLE) dngan Baysian Pada Rgrsi Logistik Multinomial mnaksir paramtr paramtr suatu analisis suatu variabl random yang brdimnsi tinggi shingga mtod ini dapat digunakan ika bntuk postrior yang didapatkan sangat komplks. 6. Pntapan Jurusan pada Skolah Mnngah Trdapat brbagai macam kritria (multi critria) pada pnntuan urusan skolah di SMA. Brikut ktrangan pnntuan dan plaksanaan pnurusan srta kritria-kritria yang diprlukan. Kritria pnurusan program mliputi : a. Nilai akadmik, Psrta didik yang naik klas XI dan akan mngambil program trtntu yaitu : Ilmu Pngtahuan Alam (IPA) atau Ilmu Pngtahuan Sosial (IPS) atau Bahasa : bolh mmiliki nilai yang tidak tuntas paling banyak 3 (tiga) mata plaaran pada mata plaaran-mata plaaran yang bukan mnadi ciri khas program trsbut. Psrta didik yang naik k klas XI, dan yang brsangkutan mndapat nilai tidak tuntas 3 (tiga) mata plaaran, maka nilai trsbut harus diadikan dasar untuk mnntukan program yang dapat diikuti olh psrta didik. Ciri khas program IPA antara lain matmatika, kimia, biologi, dan fisika. Ciri khas program IPS adalah konomi, gografi, sosiologi dan sarah. Sdangkan ciri khas program bahasa adalah bahasa Indonsia, bahasa Inggris dan TI (Tknologi Informasi) (SK tntang kritria knaikan klas nomor 42.3/63/43.7.5.3./27) b. Minat Psrta Didik Untuk mngtahui minat psrta didik dapat dilakukan mlalui angkt/kusionr dan wawancara, atau cara lain yang dapat digunakan untuk mndtksi minat, dan bakat. c. IQ Variabl IQ uga digunakan untuk prtimbangan pnurusan. Dalam hal ini kmampuan sorang anak trkait daya analitis, kmampuan numrik dan yang lain bisa dilihat. Shingga anak akan bisa di sarankan untuk masuk k salah satu urusan yang tlah dittapkan. 7. Mtodologi Pntapan urusan di SMAN Grati Pasuruan dilakukan pada saat siswa naik k klas XI. Pntapan urusan trsbut brdasarkan pada nilai rata-rata UAS smstr saat di klas X. Disamping itu uga dilakukan ts IQ dan pmbrian kuosionr untuk mngtahui minat dari masing-masing siswa. Jumlah siswa scara ksluruhan sbanyak 39 siswa yang nantinya akan mnmpati klas Bahasa, 3 klas IPA dan 4 klas IPS dngan rata-rata trdapat 4 siswa pr klasnya. Variabl rspon trdiri atas 3 katgori. Katgori urusan IPA, katgori urusan IPS dan katgori 2 urusan bahasa. Maximum Liklihood mrupakan mtod yang akan digunakan untuk mngstimasi paramtr. Stlah diprolh paramtr-paramtr pmbntuk modl, maka akan dianalisa variabl yang signifikan dan dilakukan intrprtasi trkait dngan variabl indpndn trsbut trhadap variabl rsponnya. Sdangkan mtod yang kdua adalah rgrsi logistik Multinomial mtod Baysian. Dua mtod ini akan dibandingkan misklasifikasinya. Misklasifikasi yang paling sdikit mrupakan mtod yang lbih baik digunakan. 8. Analisa Data Jumlah klas X yang ada pada SMAN Grati Pasuruan adalah 8 klas. Siswa kdlapan klas trsbut akan ditmpatkan pada tiga nis urusan ktika mrka naik k klas XI. Tiga urusan trsbut adalah urusan IPA sbanyak 3 klas, urusan IPS sbanyak 4 klas dan urusan bahasa sbanyak klas. Gambar 8. mrupakan distribusi siswa klas X tahun 27/28 yang mnmpati masing masing urusan pada klas XI. 3 25 23 24 23 24 24 2 2 8 2 9 7 2 5 4 IPA IPS BAHASA 2 9 5 5 4 6 4 4 6 2 3 4 5 6 7 8 Gambar 8. Distribusi siswa klas X pada tiap tiap urusan
Prmadina Kanah Ariska Distribusi siswa yang masuk k masing masing urusan mmiliki pola yang brbda bda. Siswa yang paling banyak masuk urusan IPA brasal dari klas X. dan X.5. Sdangkan siswa yang masuk k urusan IPS banyak yang brasal dari klas X.3, X.7 dan X.8. Untuk klas X.2, X.4 dan X.6 mmiliki komposisi siswa yang masuk IPA dan IPS yang hampir sbanding. Prbdaan ini bisa diakibatkan olh pola pmblaaran guru yang brbda antara klas ganil dan klas gnap. Jika dipisahkan mnurut tiap urusan, maka distribusi pluang untuk bisa masuk k tiap urusan nampak pada Gambar 8.2. Pada urusan IPS, siswa yang masuk urusan ini, untuk masing-masing klas hampir sragam dibandingkan dngan urusan lain. Hal ini bisa dilihat dari nilai standar dviasi yang kcil. Scara fakta, urusan IPS mmang mmiliki klas yang lbih banyak dibandingkan dngan dua urusan lainnya. Shingga pluangnya lbih bsar. Scara umum, rata rata pluang untuk masuk k urusan trtntu hampir sama yaitu sbsar,2. Namun yang mmbdakan disini adalah nilai standar dviasinya. Shingga mmang sangat mmungkinkan untuk mnlaah kontribusi tiap klas yang bisa masuk k masing masing urusan. Dari Gambar 8.2 ini, nantinya akan diadikan dasar pnrapan rgrsi logistik multinomial dngan mnggunakan mtod Baysian yang akan dibandingkan dngan rgrsi logistik multinomial klasik. Frquncy 5 4 3 2 Histogram of DISTRIBUSI PELUANG Normal KATEGORI BAHASA IPA IPS Man StDv N.263.89 8.25.52 8.275.2659 8 -.8..8.6.24.32 DISTRIBUSI PELUANG Gambar 8.2 Histogram Distribusi Pluang Tiap Tiap Jurusan 8. Pnntuan Modl Rgrsi Logistik Multinomial Pmilihan modl rgrsi logistik multinomial akan dilakukan dngan pnguian trhadap paramtr paramtrnya. Dalam hal ini akan dilakukan trlbih dahulu rgrsi logistik multinomial univariabl untuk mngtahui signifikansi masing masing variabl prdiktor ika dirgrsikan dngan variabl rsponnya scara univariabl. Hasil rgrsi logistik multinomial univariabl ditunukkan pada Tabl 8.. Tabl 8. Rgrsi Logistik Multinomial Univariabl Variabl Prdiktor Chi Squar Sig. Tuntas IPA 4,36,6 Tuntas Bahasa 3,49, IQ 9,538,8 Minat,527,822 Scara univariabl, dngan 5%, variabl prdiktor yang signifikan adalah tuntas bahasa dan IQ. Variabl tuntas IPS tidak mmiliki nilai Chi Squar karna draat bbasnya adalah nol. Hal ini disbabkan, smua siswa mmiliki nilai ktuntasan IPS yang lbih dari 3. Olh karna itu, untuk mngtahui faktor faktor yang mmpngaruhi pnurusan siswa, brikut akan dilakukan analisis rgrsi multinomial scara multivariabl dngan mnggunakan Backward Ellimination dan Forward Entry. Kdua ini digunakan untuk mmastikan variabl prdiktor yang akan digunakan mmang diyakini brpngaruh trhadap variabl rspon. Karna trkadang variabl prdiktor brnilai signifikan pada mtod backward namun blum tntu dngan mnggunakan Forward. Dngan mtod Forward mnunukkan bahwa variabl yang dimasukkan kdalam modl adalah variabl tuntas Bahasa dan IQ. Hal ini uga trdapat pada mtod Backward. Pada mtod Backward, variabl
Prbandingan Antara Mtod Maximum Liklihood Estimation (MLE) dngan Baysian Pada Rgrsi Logistik Multinomial yang tidak msuk kdalam modl adalah variabl tuntas IPA, tuntas Bahasa dan minat. Shingga dari dua mtod ini bisa disimpulkan bahwa variabl yang signifikan adalah tuntas Bahasa dan IQ. Brikut ui signifikansi mlalui ui Srntak dan ui individu. Dalam pnguian srntak, ui signifikansi modl diprgunakan liklihoodratio tst dngan hipotsis sbagai brikut : H :... 2 5 H : minimal ada satu k ; k =, 2,..., 5 2 Nilai adalah 24,9 dngan signifikansi sbsar, yang brarti didapatkan kputusan (4;,5) untuk tolak H. Dari kputusan ini diktahui bahwa scara srntak modl signifikan pada tingkat kprcayaan 95 %. Hasil yang ditunukkan olh Liklihood Ratio Tst ini bisa dilaskan masing masing olh variabl prdiktor yang trpilih kdalam modl sprti pada Tabl 8.2. Tabl 8.2 Liklihood Ratio Tst Modl Fitting Critria Liklihood Ratio Tst Effct (-2 log liklihood of rducd modl) Chi Squar df Sig. Intrcpt 87,38, Tuntas Bahasa,962 4,58 2, IQ 98,9,628 2,5 P valu untuk tuntas bahasa dan IQ kurang dari 5%. Hal ini brarti variabl tuntas bahasa dan IQ mrupakan variabl yang lbih baik dalam mmbntuk modl dibandingkan dngan modl yang hanya mmasukkan intrcpt saa. Olh karna itu akan dilakukan ui individu Wald Tst (Hosmr dan Lmshow, 2). Ui ini diprgunakan untuk mngtahui variabl prdiktor mana yang signifikan scara individu. Dngan diprgunakan hipotsis sbagai brikut : H : k = H : k ; k =, 2,...5 nilai statistik ui W untuk masing-masing paramtr ditunukkan pada Tabl 8.3. Tabl 8.3 Nilai Statistik Ui W Jurusan Variabl Prdiktor Kofisin Odds Ratio P valu (IPS) 2 (Bahasa) Intrcpt -,55,356 [Tuntas_bahasa=),54 3,72,5* [Tuntas_bahasa=). [IQ=),635,887,* [IQ=). Intrcpt -,857,* [Tuntas_bahasa=),635,888,4* [Tuntas_bahasa=). [IQ=),6 3,9,22 [IQ=) Ktrangan : * signifikan pada =,5 Dari pnguian paramtr ini maka modl yang diprolh dari rgrsi logistik multinomial adalah yang mlibatkan 2 variabl prdiktor yaitu tuntas bahasa dan IQ. Modl rgrsinya sbagai brikut : ( y x).55.54 X3.635.857.635 X 3. 6
2 Prmadina Kanah Ariska.55.54 X 3.635 ( y x).55.54 X 3.635.857.635 X 3.6.857.635 X 3.6 ( y 2 x).55.54 X 3.635.857.635 X 3.6 Tabl 8.3 mnunukkan bahwa sorang siswa yang mmiliki nilai tuntas bahasa yang kurang dari 3, lbih cndrung untuk mmilih IPS daripada IPA. Bgitupula untuk siswa yang IQ nya dibawah rata-rata (IQ<) maka dia lbih cndrung untuk mmilih IPS daripada IPA. Siswa ini uga lbih cndrung untuk mmilih program bahasa dibandingkan dngan IPA. Atau bisa disimpukan bahwa siswa yang mmiliki IQ diatas rata rata lbih cndrung mmilih program IPA daripada mmilih IPS ataukah bahasa. 8.2 Pnntuan Modl Rgrsi Logistik Multinomial Mtod Baysian Pada mtod Baysian, hal yang prlu dittapkan trlbih dahulu adalah masalah distribusi priornya. Prior ini akan digunakan untuk mmbntuk postriornya. Chib & Charlin (995) mnggunakan Psudoprior untuk mmbntuk fungsi postriornya. Ssuai dngan namanya, Psudoprior bukan prior yang sbnarnya namun psudoprior mampu mmbrikan ktpatan pada dnsity yang dimaksud, yang diprlukan nantinya untuk mmbntuk spsifikasi modl. Untuk mnntukan psudoprior, hal yang dilakukan prtama kali adalah mrgrsikan masing masing variabl indpndn dan variabl rsponnya. Dalam pnlitian ini, variabl yang signifikan adalah variabl tuntas bahasa dan IQ. Pada lampiran 3 trlihat bahwa paramtr untuk tuntas bahasa brdistribusi normal (,96,,37) dan untuk variabl IQ uga brdistribusi normal (,557,,255). Paramtr paramtr ini akan dimasukkan k program winbugs. Pada program ini, paramtr untuk variabl indpndn yang prtama yaitu IQ dinamakan dngan bta dan paramtr untuk variabl tuntas bahasa dinamakan Gamma. Sdangkan intrcpt nya dalam hal ini disbut sbagai alpha. Hasil running program winbugs dngan updat 5. adalah sbagai brikut : Tabl 8.4 Nod Statistics dari modl pada Softwar Winbugs MC Nod Man SD rror 2,5% Mdian 97,5% Start Sampl alpha[2].644.3568.38.9669.642 2.354 4 46 alpha[3] -.378.5498.22 -.27 -.75.8895 4 46 bta[2,2] -.637.269.7 -.6 -.63 -.9 4 46 bta[2,3] -.58.488.96 -.988 -.53 -.3568 4 46 gamma[2,2] -.64.388.5 -.86 -.66 -.5579 4 46 gamma[2,3] -.585.5248.82 -.58 -.644.556 4 46 Pnguian paramtr paramtr pada program Winbugs mnggunakan Highst Postrior Distribution (HPD). Pada tabl 8.4 diatas bisa dilihat pada nilai antara 2.5% dan 97.5%. Jika mngandung nilai nol maka paramtr tidak signifikan. Dngan hipotsis sbagai brikut : Ui hipotsis : H : Tidak ada paramtr yang signifikan H : Minimal trdapat satu paramtr yang signifikan Dari Tabl 8.4, trlihat bahwa paramtr yang signifikan adalah alpha[2], bta[2,2], bta[2,3], dan gamma[2,2]. Shingga modl yang diprolh untuk rgrsi logistik multinomial Baysian ini adalah : ( y x),378,58 X 3,585, 644,64 X 3, 637,378,58 X 3,585 ( y x),378,58 X 3,585,644,64 X 3,637,644,64 X 3,637 X ( 4 y 2 x),378,58 X 3,585,644,64 X 3,637 8.3 Prbandingan Misklasifikasi Modl Rgrsi Logistik Multinomial Klasik dngan Rgrsi Logistik Multinomial mtod Baysian. Untuk mngtahui, mtod rgrsi logistik multinomial klasik dngan mtod Baysian, akan dilakukan prhitungan misklasifikasi pada kdua mtod trsbut. Pada Tabl 8.5 trlihat bahwa misklasifikasi pada modl rgrsi logistik multinomial yang tradi cukup bsar yaitu skitar 46,%. Sdangkan dngan mnggunakan
3 Prbandingan Antara Mtod Maximum Liklihood Estimation (MLE) dngan Baysian Pada Rgrsi Logistik Multinomial rgrsi logistik Multinomial baysian, misklasifikasinya lbih kcil dibandingkan dngan mtod prtama, yaitu sbsar 39,5%. Tabl 8.5 Tabl Misklasifikasi Rgrsi Logistik Multinomial Klasik Prdiksi Obsrvasi 2 Prcnt corrct 72 48 6,% 65 6,6% 2 9 25,% Ovrall Prcntag 45,8% 54,2%,% 53,9% Pada rgrsi logistik multinomial klasik, pnyumbang misklasifikasi yang paling bsar adalah pnurusan trhadap siswa bahasa. Prdiksi yang dibrikan adalah % padahal ada skitar 34 siswa yang masuk urusan bahasa. Namun pada rgrsi logistik multinomial mtod Baysian, misklasifikasi ini bisa diminimalkan. Pada Tabl 8.6 mnunukkan bahwa prdiksi siswa yang masuk urusan Bahasa adalah 55,88%. Shingga dalam hal ini, rgrsi logistik multinomial mtod Baysian lbih baik digunakan untuk mmodlkan plaksanaan pnurusan siswa di SMAN Grati Pasuruan. Tabl 8.6 Tabl Misklasifikasi Rgrsi Logistik Multinomial Baysian Prdiksi Obsrvasi 2 Prcnt corrct 72 48 6,% 63 2 6,8% 2 9 6 9 55,88% Ovrall Prcntag 45,4% 48,9% 5,96% 6,5% 9. Ksimpulan Ksimpulan dari pmbahasan yang tlah dilakukan adalah :. Dari klima variabl prdiktor yang digunakan, trnyata trdapat hanya dua variabl prdiktor yang signifikan. Dua variabl prdiktor trsbut adalah tuntas bahasa dan IQ. Siswa yang mmiliki nilai tuntas bahasa yang kurang dari 3, lbih cndrung untuk mmilih IPS daripada IPA. Bgitupula untuk siswa yang IQ nya dibawah rata-rata maka dia lbih cndrung untuk mmilih IPS daripada IPA. Siswa ini uga lbih cndrung untuk mmilih program bahasa dibandingkan dngan IPA. 2. Faktor faktor yang mmpngaruhi pnurusan siswa adalah tuntas bahasa dan IQ. Nilai paramtr pada rgrsi logistik multinomial mtod Baysian hampir sama dngan mtod klasik. Dalam hal ini, siswa yang mmiliki nilai tuntas bahasa kurang dari 3, lbih mmilih program Bahasa dibandingkan dngan IPA. Atau bisa disimpukan bahwa siswa yang mmiliki IQ diatas rata rata lbih cndrung mmilih program IPA daripada mmilih IPS ataukah bahasa. 3. Misklasifikasi pada rgrsi logistik multinomial klasik lbih bsar dibandingkan pada rgrsi logistik multinomial mtod Baysian. Misklasifikasi dngan mtod prtama adalah sbsar 46,% sdangkan dngan mnggunakan mtod kdua yaitu mtod Baysian, misklasifikasinya adalah sbsar 39,5%. Daftar Pustaka Carlin dan Chib. (995). Baysian Modl Choic via Markov Chain Mont Carlo Mthods, Journal of th Royal Statistical Socity, Sris B, Volum 57, 473-484. Dpdiknas (27). SK kritria Knaikan Klas bagi Siswa Klas X dan XI tahun 26/27. Grati Pasuruan. Fahmir,L dan Tutz, G. (994), Multivariat Statistical Modlling Basd on Gnralizd Linir Modls, Springr-Vrlag. Hosmr, D. W dan Lmshow. (2), Applid Logistik Rgrssion, scond dition, John Wily and Sons. Inc, Nw York. Klinbaum, David G. (994). Logistic Rgrssion, a slf Larning Txt. Springr Vrlag nw york.
4 Prmadina Kanah Ariska Madigan, David. Gnkin, Alxandr. Lwis, David D dan Fradkin, Dmitry (25). Baysian Multinomial Logistic Rgrssion for Author Idntification, Rutgr univrsity. Madigan, David. Gnkin, Alxandr. Lwis, David D dan Fradkin, Dmitry (25). Baysian Multinomial Logistic Rgrssion for Author Idntification, Rutgr univrsity, Amrika Srikat. Tahir, Muhammad dan Hussain, Zawar. (2). Comparison of Non Informativ Priors for Numbr of Dfcts (Poisson) Modl. Dpartmnt of Statistics, Govrnmnt Dgr Collg, Pindhi Ghb, Pakistan. Zhu, Mu dan Lu, Arthur. (24). Th Countr Intuitiv Non Informativ Prior for th Brnoulli Family. Journal of Statistics Education Volum 2, Nomor 2, Univrsity of Watrloo.