Supleme Resposi Pertemua ANALISIS DATA KATEGORIK (STK351 9 Departeme Statistika FMIPA IPB Pokok Bahasa Sub Pokok Bahasa Referesi Waktu Pegatar Aalisis utuk Data Respo Kategorik Data respo kategorik Sebara peluag data kategorik Iferesia megeai proporsi Iferesia utuk data diskret A Itroductio to Categorical Data Aalysis ( d Editio Agresti (7 Jumat 3 Nov 1 15.45 17.45 Peubah kategorik mempuyai skala pegukura yag terdiri dari beberapa kategori. Skala pegukura utuk peubah kategorik dapat berupa skala omial maupu ordial. Sebagai cotoh utuk data kategorik dega skala omial adalah jeis kelami ( laki-laki atau perempua, jeis tempat tiggal ( rumah, rumah susu, atau aparteme da lailai. Sedagka peubah kepuasa ( kecewa, meegah atau puas da tigkat pedidika ( SD, SMP, SMA atau Sarjaa merupaka cotoh data kategorik dega skala ordial. Lebih legkap megeai skala ii dapat dipelajari lagi pada bab I. Peubah respo atau serig disebut sebagai peubah tidak bebas atau peubah Y dapat berupa data kategorik ataupu umerik. Model statistika utuk respo kategorik megaalisis bagaimaa peubah respo terpegaruh oleh peubah-peubah pejelas (atau peubah bebas atau peubah X. Misalya model tetag kepuasa dapat diprediksi melalui peubah harga, daya taha, da lai-lai. Sebara Peluag Data Kategorik Dalam aalisis data kategorik, sebara yag palig medasar adalah sebara biomial da multiomial. Misalka suatu kejadia dikataka sukses bila y = 1 da dikataka gagal apabila y =. Peluag sukses P(1=P(Y=1=, sehigga peluag gagal P(=P(Y==. Betuk kejadia yag haya terdiri dari dua kemugkia Sukses atau Gagal, atau 1 atau merupaka sebara Beroulli. Misalka ada Y kejadia sukses pada percobaa yag salig bebas, da adalah peluag sukses, maka Y meyebar biom dega parameter (,. Peluag y ditulis : Atau P( y P( Y y (1 y! P( y P( Y y (1 y!( y! y y y y, y =, 1,,, Sebagai cotoh, bayagka suatu kejadia dalam pelempara uag logam yag setimbag bersisi agka da gambar. Lima uag logam dilempar bersama-sama. Tetuka mata peluag tidak ada satupu gambar yag mucul. Misalka Y adalah
bayakya sisi gambar yag mucul, sehigga =5 da =.5. Sehigga utuk kejadia tidak ada satupu gambar yag mucul adalah Y=. Peluagya adalah : 5 5 P( Y.5 1.5.315 Peluag mucul gambar pada satu koi adalah : 5 1 51 P( Y 1.5 1.5.1565 1 Sedagka peluag mucul gambar tidak lebih pada dua koi adalah : P( Y P( Y P( Y 1 P( Y.5 Sebara biomial utuk percobaa da peluag sukses mempuyai rata-rata (mea da simpaga baku : E( Y, (1 Utuk cotoh di atas, 5(.5.5 da 5(.5(1.5 1.118. Jika besar, sebara biom medekati sebara ormal dega parameter (1. da Respo pada beberapa pegamata kadag kala terdiri dari lebih dari dua kemugkia. Misalya status korba dalam kecelakaa lalu litas mugki saja berupa selamat tapa cedera, cedera riga, cedera parah, atau megiggal duia. Jika pegamata salig bebas, sebara disebut multiomial. Misalka c adalah bayakya kategori repo dega peluag masig-masig { 1,,, c } dega 1. Utuk pegamata, peluag multiomial bahwa sebaya 1 berada pada kategori 1, pada kategori,..., c pada kategori c, dega, adalah : P(,,, j! 1 c 1 1!! c! 1 Misalka kita mempuya 1 magkuk yag berisi 1 bola : dua merah, 3 hijau da 5 biru. Selajutya kita ambil secara acak empat bola dari magkuk tersebut dega pegembalia. Berapa peluag terambil dua bola hijau da dua bola biru? Pada kasus ii : 4, 1 merah, hijau, 3 biru da 1 /1., 3 /1.3, 3 5 /1.5. Sehigga peluag terambil dua bola hijau da dua bola biru adalah : 4! P (!(!(! (,, (. (.3 (.5.135 c c j / 5
Iferesia Megeai Proporsi Fugsi kemugkia da pedugaa kemugkia terbesar Misalka pada = 1 pegamata kejadia sukses y =. Jika peluag sukses adalah, maka kejadia tersebut mempuyai peluag : 1! P( Y (1 (1 (!(1! 1 1 Peluag data teramati, sebagai fugsi dari parameter, ii disebut fugsi kemugkia (likelihood fuctio. Utuk y= kejadia sukses pada =1 pegamata, fugsi 1 kemugkia biom adalah l( (1. Sebagai cotoh misalya =.4, maka 1 l(.4 (1.4.6. Sebuah dugaa parameter kemugkia terbesar (maximum likelihood estimate of a parameter adalah ilai parameter dimaa peluag dari data teramati mecapai maksimum. Dega kata lai, ilai parameter dimaa fugsi kemugkiaya mecapai maksimum. Secara umum, pada respo biom, dugaa kemugkia maksimum bagi sama dega p y /. Pegujia proporsi biomial Pada sebara biomial, peduga bagi merupaka peduga kemugkia terbesar, yaitu proporsi, p. Sebara pearika cotoh bagi p mempuyai rataa da simpaga baku : E( p, p (1 Utuk hipotesis awal H :, statistik uji yag diguaka adalah : z p (1 Bila ukura cotoh besar, statistik uji z meyebar ormal baku dega rataa ol da simpaga baku satu. Sebagai cotoh perhatika kasus berikut ii. Di duia telekomuikasi dikeal istilah chur aalysis yag bertujua utuk melihat kemugkia pelagga utuk pidah ke operator lai. Misalya pada bula tertetu diketahui ada sebayak 347 pelagga yag keluar (chur sebayak 347 pelagga dari total cotoh acak 6 pelagga. Apakah dapat kita kataka bahwa chur rate, perbadiga atara pelagga yag chur dega total pelagga, adalah sebesar 4%?. Pada kasus ii, hipotesis yag aka diuji adalah : H :.4 H 1 :.4 Utuk y 347 da 6, maka proporsi p 347 / 6.39. Maka.4(1.4 SE ( p.8, sehigga statistik uji 6.39.4 z 1.5..8 3 / 5
Pada taraf yata 5%, titik kritis sebara ormal adalah 1.96. Karea ilai mutlak statistik uji z lebih kecil dari titik kritis, maka terima H da simpulka bahwa data medukug peryataa bahwa chur rate adalah 4%. Selag kepercayaa proporsi biomial Misalka SE ( 1 p adalah galat baku dari proporsi p da ukura cotoh besar. Selag kepercayaa 1(1α% dua arah utuk adalah : p z SE ( p / 1, SE1 ( p p(1 p Utuk cotoh di atas, selag kepercayaa 95% bagi chur rate adalah :.39(1.39.39 1.96, atau.39.15 atau (.375,.45. 6 Terlihat bahwa ilai.4 berada di dalam selag kepercayaa, sehigga kosiste dega hasil pegujia hipotesis yag telah dilakuka sebelumya. Uji Wald, Score da Perbadiga-Kemugkia utuk Data Diskret Misalka merupaka parameter da hipotesis H 1 : = aka diguaka utuk meguji sigifikasi. Uji Wald Misalka SE( ˆ adalah galat baku bagi dugaa, ˆ. Sebagai cotoh, utuk ˆ(1 ˆ pegujia parameter : SE( ˆ, ˆ y p, maka ˆ z SE( ˆ medekati sebara ormal baku dega rataa ol da simpaga baku. Padaaya, z aka medekati sebara khi-kuadrat dega derajat bebas satu. Statistik z ii disebut sebagai statistik Wald..39(1.39 Utuk kasus chur rate di atas, ( ˆ SE.79. Dega demikia 6.39.4 diperoleh : z 1.7, atau z ( 1.7 1.6..79 Nilai kritis khi-kuadrat dega derajat bebas satu da taraf yata 5% adalah 3.841. Dega demikia hipotesis awal diterima. Hasil uji ii kosiste dega hasil uji proporsi. 4 / 5
Uji Score Uji score sagat mirip dega uji Wald. Perbedaaya terletak pada perhituga galat baku. Pada uji score, galat baku dihitug dega asumsi bahwa hipotesis ol bear. Dega kata lai, galat baku yag diguaka adalah SE(. Sebagai cotoh, utuk pegujia (1 ˆ parameter : SE(, ˆ. Sehigga z. Statistik uji score adalah z SE( yag medekati sebara khi-kuadrat dega derajat bebas satu..4(1.4 Utuk kasus chur rate di atas, SE(.8. Dega demikia 6.39.4 diperoleh : z 1.5, atau z ( 1.5 1.56..8 Nilai kritis khi-kuadrat dega derajat bebas satu pada taraf yata 5% adalah 3.841. Dega demikia hipotesis awal diterima. Hasil uji ii kosiste dega hasil uji proporsi da uji Wald. Uji perbadiga-kemugkia (likelihood-ratio Alteratif lai yag dapat diguaka dalam iferesia data diskret adalah uji perbadiga-kemugkia (likelihood-ratio. Uji ii megguaka fugsi kemugkia dari melalui perbadiga (1 ilai kemugkia maksimum bagi parameter dega asumsi hipotesis ol bear da ( ilai kemugkia maksumum bagi parameter dega asumsi baik hipotesis ol maupu hipotesis alteratif bisa bear. Statistik uji yag diguaka adalah L l l l1 yag meyebar khi-kuadrat dega derajat bebas satu. Utuk kasus chur rate di atas, jika H : =.4 bear, peluag biomial utuk y = 347 adalah 6! l (347!(57653! yag aka dibadigka dega Sehigga statistik uji : 6! l1 (347!(57653! 347 57653 (.4 (.96.455 347 57653.39.961.831.455 L l 1.1.831 Nilai kritis khi-kuadrat dega derajat bebas satu pada taraf yata 5% adalah 3.841. Dega demikia hipotesis awal diterima. Hasil uji ii kosiste dega hasil tiga uji sebelumya. CUIWW (Correct Us If We re Wrog Prepared by : Nur Adi Setiabudi, S. Stat Edited by : Didi Saepudi E.O.F 5 / 5