7 BAB LANDASAN TEORI. Kosep Dasar Peaksira Parameter Statistik iferesi adalah Statistik yag dega segala iformasi dari sampel diguaka utuk mearik kesimpula megeai karakteristik populasi dari maa sampel itu diambil. Statistik iferesi diguaka utuk memprediksi keadaa dari suatu populasi berdasarka sampel yag diambil da berusaha utuk meyimpulka karakteristik dari suatu populasi tersebut. Utuk ii kelakua populasi dipelajari berdasarka data yag diambil baik secara samplig ataupu sesus. Dalam keyataaya megigat berbagai faktor, utuk keperlua tersebut diambil sebuah sampel yag represetatif lalu berdasarka pada hasil aalisis terhadap data sampel kesimpula megeai populasi dibuat. Kelakua populasi yag aka ditijau hayalah megeai parameter populasi da sampel yag diguaka adalah sampel acak. Data sampel dikumpulka da diaalisis, ilai-ilai yag perlu yaitu statistik, dihitug da dari ilai-ilai statistik tersebut dapat disimpulka bagaimaa parameter bertigkah laku, da parameter yag aka ditaksir adalah rata-rata da variasi (Surwako, 007). Metode peaksira parameter didasarka pada asumsi bahwa distribusi probabilitas ormal dapat diguaka dega ketetua 30, jika <30 dega syarat distribusi populasi adalah ormal da simpaga populasi diketahui (Adi Supagat, 008). Secara umum peaksira adalah dugaa atas sesuatu yag aka terjadi dalam kodisi tidak pasti (Surwako, 007). Setiap pegusaha selalu membuat berbagai peaksira utuk kegiata-kegiata pokok usahaya. Misalya, pegusaha biro perjalaa wisata aka membuat perkiraa atas besarya rata-rata biaya setiap perjalaa bagi dua orag, bagia pemasara perusahaa seme membuat perkiraa berapa zak seme pejuala tahu depa, dll. Semaki tepat peaksira atau perkiraa terhadap output yag dihasilka, maka semaki efektif da efisie alokasi sumber-sumber daya yag dimiliki oleh pegusaha utuk medukug realisasi output yag dihasilka.
8 Sifat atau ciri peaksir yag baik, adalah tidak bias, variasi miimum, kosiste, da statistik cukup. Tidak bias Misalka Θ * adalah estimator yag ilai θ *-ya adalah estimasi titik dari parameter populasi tak diketahui θ.tetu diigika bahwa sebara cuplika Θ * aka memiliki mea yag sama dega parameter yag diestimasi. Parameter yag seperti ii disebut bersifat takbias (Roald & Raymod 995). Dega kata lai peaksir tak bias bagi parameter θ jika jika E ( θ *) θ, jika dikataka peaksir bias bagi parameter θ, E ( θ*) θ. Namu peaksir bias dapat diubah mejadi peaksir takbias jika ruas kaa dikalika atau ditambahka dega kostata tertetu.. Variasi Miimum Apabila terdapat dua buah peaksir yag takbias, maka kedua peaksir tersebut aka dibadigka dalam hal variasiya. Misalka dua peaksir tak bias yaitu θ * θ * utuk θ. Jika θ * mempuyai variasi yag lebih kecil dibadig dega θ *, maka θ * dikataka peaksir takbias bervariasi miimum. da 3. Kosiste Jika θ * adalah peaksir utuk θ yag didasarka pada sampel acak berukura, maka θ * dikataka kosiste bagi parameter θ, jika lim p x ( θ * θ < ε ) (.) peetua peaksir kosiste ii dapat dilakuka dega megguaka ketidaksamaa Chebyshev s, lim p x µ (.) k ( X < k )
9 4. Statistik Cukup Statistik T T x, x,..., x ) dikataka cukup bagi parameter, jika fugsi kepadata peluag bersyarat: P ( ( x, x,..., x ) x T(x, x,..., x ) t tidak bergatug pada θ. Estimasi ilai parameter memiliki dua cara, yaitu peaksir titik (poit estimatio) da estimasi selag (iterval estimatio).. Peaksira Titik (poit estimatio) Peaksira dari sebuah parameter populasi yag diyataka oleh sebuah bilaga tuggal disebut peaksir titik dari parameter tersebut (Murray & Larry, 999). Peaksira titik sebuah parameter: sebuah ilai yag diperoleh dari sampel da diguaka sebagai peaksir dari parameter yag ilaiya tidak diketahui. Misalka x...,, x, x merupaka sampel acak berukura dari x, maka statistik θ h( x, x,..., x ) yag berkaita dega θ diamaka peaksir dari θ. Setelah * sampel diambil, ilai-ilai yag dihitug dari sampel itu diguaka sebagai taksira titik bagi θ. Beberapa taksira titik yag dihitug dari data sampel utuk parameter populasi yag bersesuaia.. Rerata populasi µ, taksira titikya adalah µ * x. Variasi populasi, taksira titikya adalah * s 3. Simpaga baku populasi, taksira titikya adalah * s. Peaksira Selag (iterval estimatio). Peaksira dari parameter populasi yag diyataka oleh dua buah bilaga di atara posisi parameterya diperkiraka berada disebut sebagai peaksira iterval dari parameter tersebut (Murray & Larry, 999). Misalka µ da masig-masig adalah mea da deviasi stadar dari distribusi samplig suatu statistik S. Maka jika distribusi samplig dari S
0 medekati ormal ( 30), maka didapat statsitik sampel aktual S yag berada di dalam iterval µ - sampai dega µ +. Atas dasar ii masig-masig iterval ii sebagai iterval kepercayaa (cofidece iterval) utuk megestimasi rata-rata. Bilaga-bilaga dari kedua ujug iterval ii masig-masig dikeal sebagai batas kepercayaa (cofidece limit). Jika statsitik S adalah mea sampel x, maka batas-batas kepercayaa 90%, 95% da 99% utuk meaksir mea populasi µ masig-masig dirumuska sebagai x ±,65, x ±,96 da x ±,58. Dalam betuk yag lebih umum, batas kepercayaaya dirumuska sebagai x ± z, z adalah yag bergatug kepada tigkat kepercayaa tertetu. Jika koefisie kepercayaa diyataka dega α maka 0<α <. Harga α yag diguaka tergatug pada persoala yag dihadapi da berapa besar si peeliti igi yaki dalam membuat peryataaya. Yag biasa diguaka adalah 0,90, 0,95 da 0,99, yaki α 0,90, α 0,95 da 0,99. Utuk meetuka taksira parameter θ dega koefisie kepercayaa α, maka sebuah sampel acak diambil, lalu dihitug statistikya.. Distribusi Normal Distribusi ormal adalah distribusi probabilitas kotiu yag grafikya disebut kurva ormal seperti pada gambar.. Sebuah distribusi ormal dapat dideskripsika secara peuh oleh rata-rata da variasya. Distribusi ormal meggambarka dega cukup baik bayak gejala yag mucul di alam, idustri, da peelitia. Pegukura fisik di bidag seperti percobaa meteorologi, peelitia curah huja, da pegukura suku cadag yag diproduksi dapat diteragka megguaka distribusi ormal. Disampig itu galat dalam pegukura ilmiah dapat dihampiri dega sagat baik oleh distribusi ormal. Pada tahu 733, Abraham DeMoivre meemuka persamaa matematika kurva ormal. Ii merupaka dasar bagi teori statistika iduktif. Distribusi ormal serig pula disebut distribusi Gauss utuk meghormati Karl Friedrich Gauss (777-855), yag juga meemuka persamaya waktu meeliti galat dalam pegukura yag berulag-ulag megeai baha yag sama.
Karakteristik dari variabel acak kotiu berbeda dega variabel acak diskrit. Variabel acak kotiu mecakup semua bilaga, baik utuh maupu pecaha. Oleh karea itu tidak dapat dipisahka ilai yag satu dega yag lai. Itulah sebabya fugsi variabel acak kotiu serig disebut fugsi kepadata, karea tidak ada ruag kosog diatara dua ilai tersebut. Dega kata lai realitasya keberadaa satu buah agka dalam variabel acak kotiu jika ditijau dari seluruh ilai adalah sagat kecil, bahka medekati ol. Karea itu tidak bisa dicari probabilitas satu buah ilai dalam variabel acak kotiu, tetapi yag dapat dilakuka adalah mecari probabilitas diatara dua buah ilai. Distribusi kotiu mempuyai fugsi matematis tertetu, jika fugsi tersebut digambar, maka aka berbetuk kurva kepadata dega sifat sebagai berikut :. Probabilitas ilai x dalam variabel tersebut terdapat dalam retag atara 0 da. Probabilitas total dari semua ilai x adalah sama dega satu (sama dega luas daerah di bawah kurva) Fugsi kepadata merupaka dasar utuk mecari ilai probabilitas diatara dua ilai variabel. Probabilitas di atara dua ilai adalah luas daerah di bawah kurva di atara dua ilai dibadigka dega luas daerah total di bawah kurva. Dapat dicari luas daerah tersebut dega megguaka itegral tertetu (difiit itegral). Suatu variabel acak kotiu X yag distribusiya berbetuk loceg disebut peubah acak ormal. Persamaa matematika distribusi peluag peubah ormal kotiu bergatug pada dua parameter µ da, yaitu rataa da variasya. Fugsi padat variabel acak ormal X dega rataa µ da variasi, adalah x µ f ( x) e (.3) π Yag meyataka bahwa : π suatu kostata matematika yag ilaiya medekati 3,459 e suatu kostata matematika yag ilaiya medekati,788 µ parameter, merupaka rata-rata utuk distribusi parameter, merupaka variasi utuk distribusi
da ilai x mempuyai batas berdistribusi ormal. < x <, maka dikataka bahwa variabel acak X Sifat-sifat petig distribusi ormal:. grafikya selalu ada di atas sumbu datar x.. betukya simetrik terhadap x µ 3. mempuyai satu modus, jadi kurva uimodal, tercapai pada x µ sebesar 0,3989 4. grafikya medekati (berasimtutka) sumbu datar x dimulai dari x µ + 3 ke kaa da x µ 3 ke kiri 5. luas daerah grafik selalu sama dega satu uit persegi Utuk tiap pasag µ da, sifat-sifat di atas seluruh dipeuhi, haya betuk kurvaya saja yag berlaia. Jika maki besar, kurvaya maki redah (platikurtik) da utuk maki kecil, kurvaya maki tiggi (leptokurtik). µ Gbr. Kurva ormal Utuk megatasi kesulita dalam meghitug itegral fugsi padat ormal maka dibuat tabel luas kurva ormal sehigga memudahka pegguaaya. Aka tetapi, tidak aka mugki membuat tabel yag berlaia utuk setiap ilai µ da. Utuglah, seluruh pegamata setiap variabel acak ormal X dapat ditrasformasika mejadi himpua pegamata baru satu variabel acak ormal Z dega rataa ol da variasi. Hal ii dapat dikerjaka dega trasformasi. µ Z X (.4)
3 Bilamaa X medapat suatu ilai x, ilai Z padaaya diberika oleh. ( µ) z x. Jadi bila X berilai atara xx da xx maka variabel acak Z aka berilai atara ( µ) z x da z ( µ) x. Karea itu dapat ditulis x < X < x ) π x x e x µ dx exp z z π z dz z z f ( x) dz p ( z < Z < ) (.4) z Dega Z terlihat merupaka suatu variabel acak ormal dega rataa ol da variasi. x x z z x < x < x ) z < z < z ) Gbr. Distribusi ormal asli da yag telah ditrasformasika x < x < x ) z < x < z ).3 Distribusi Sampel Bidag statistika iferesi pada dasarya berkea dega perampata da prediksi, hasil suatu percobaa statistika dapat dicatat dalam betuk umerik ataupu aksara. Bila sepasag dadu dilatumla da jumlahya merupaka hal yag igi diselidiki maka hasilya dicatat dalam betuk umerik. Keseluruha pegamata yag igi diteliti, berhigga atau tidak, membetuk apa yag disebut populasi atau uiversum. Kata populasi pegamata yag diperoleh dari peelitia statistik yag meyagkut mausia. Sekarag statistikawa
4 megguaka kata tersebut utuk meyataka seluruh pegamata tetag hal yag igi diselidiki, terlepas apa itu meyagkut orag, biatag, ataupu beda laiya. Bayakya pegamata dalam populasi diamaka ukura. Suatu populasi terdiri atas keseluruha pegamata yag mejadi perhatia (Roald & Raymod, 995). Dalam bidag iferesial statistik statistikawa igi mearik kesimpula megeai suatu populasi dalam hal tidak mugki atau tidak praktis megamati himpua seluruh pegamata yag membetuk populasi tersebut. Sebagai cotoh dalam usaha meetuka rata-rata pajag umur bola lampu merk tersebut agar masih ada sisaya dijual. Biaya yag amat tiggi juga merupaka kedala dalam memeriksa seluruh populasi. Karea itu peeliti megguaka sebagia pegamata dari populasi dalam mearik iferesi tetag populasi tersebut. Sampel adalah suatu bagia himpua dari populasi (Roald & Raymod, 995). Dalam megambil sampel acak berukura dari suatu populasi f ( x ), didefiisika variabel acak x i,i,,...,, sebagai pegukura atau ilai sampel ke i yag diamati, variabel acak x jadiya merupaka suatu sampel acak populasi,x,... x x,x,... x f ( x ) dega ilai umerik, bila pegukura dikerjaka dega megulagi percobaa kali secara bebas dalam keadaa yag pada dasarya sama, maka dapat diaggap bahwa ke- variabel acak berdistribusi f(x). Ii berarti bahwa f ( x ), f ( x ),...f ( x ). x,x,... x x,x,... x bebas da masig-masig masig-masig berdistribusi peluag Misalka x merupaka variabel acak bebas yag masig-masig,x,... x berdistribusi peluag f ( x ). x,x,... x didefiisika sebagai sampel acak ukura dari populasi f ( x ) da distribusi peluag gabugaya ditulis sebagai: f ( x,x,...,x ) f ( x ),( x ),...,( x ) (Roald & Raymod 995).
5.4 Maksimum Likelihood Peaksira kemugkia maksimum merupaka salah satu pedekata yag petig dalam sebuah statistika iferesi. Metode terbaik yag dapat diguaka dalam meetuka peaksir titik sebuah parameter. Misalka X adalah peubah acak kotiu dega fugsi kepadata peluag berbetuk f ( x, θ ), dega θ adalah suatu parameter yag tidak diketahui. Misalka x merupaka sebuah sampel acak berukura, fugsi,x,... x likelihood dari sampel acak itu adalah: L( θ ) f ( x, θ ), f ( x, θ ),...f ( x, ) (.5) θ Fugsi likelihood adalah fugsi dari parameter yag tidak diketahui θ. Utuk memudahka dalam megaalisis maka fugsi likelihood L( θ ) diberi l. Peaksir maksimum likelihood dari θ adalah ilai θ yag memaksimumka fugsi likelihood L( θ ). Dalam aplikasi L( θ ) meujukka fugsi desitas probabilitas bersama dari sampel radom. Jika S ruag parameter yag merupaka iterval terbuka da L( θ ) merupaka fugsi yag dapat dituruka serta diasumsika maksimum pada S maka persamaa maksimum likelihoodya adalah. ( θ ) 0 ( θ ) L (.6) Jika peyelesaia dari persamaa tersebut ada, maka maksimum dari L( θ ) dapat terpeuhi. Apabila tak terpeuhi maka fugsi L( θ ) dapat dibuat logaritma aturalya, dega ketetua jika l L( θ ) maksimum maka L( θ ) juga maksimum, sehigga persamaa logaritma atural likelihoodya adalah l L ( θ ) 0 (.7) ( θ )
6.5 Metode Bayes Bila A da B adalah dua kejadia sembarag pada S da berlaku A B 0 maka A da B dikataka dua kejadia yag salig lepas. Dua kejadia tersebut tidak mugki terjadi secara bersamaa seperti pada gambar.3 dibawah ii: Gbr.3 Kejadia yag salig lepas Dega demikia probabilitas A B adalah : ( A B) A) B) P + Peristiwa A dapat ditulis sebagai gabuga dua buah kejadia yag salig lepas adalah: E A da E c A maka A( E A ) ( E c A) da dapat dibuat dalam betuk gambar.4 di bawah ii: Gbr.4 Gabuga dua kejadia yag salig lepas Dega megguaka probabilitas bersyarat maka : A) P[ ( E A) ( E A) ] c E A) E c A) E A) + E c A) c c P ( E) A E) + E ) A E ) (.8)
7 Peristiwa B,...,, B Bk merupaka suatu sekata (partisi) dari ruag sampel S dega B i ) 0 utuk i,,,k maka setiap peristiwa A aggota S berlaku: A) Diguaka bila igi diketahui probabilitas B A), B A)., rumus sebagai berikut : k B A) i i i k B ) A B ) i i k (.9) B A) dega A B) Br ) A Br ) Br A) ; r,,.. k k k B A) B ) A B ) i i i i i (.0) Peluag B r disebut peluag a-priori, peluag (B r B) disebut peluag a-posteriori. Metode Bayes adalah metode yag dapat diguaka utuk meaksir parameter distribusi ormal. Bayes memperkealka suatu metode dimaa kita perlu megetahui betuk distribusi awal (prior) dari populasi yag dikeal dega metode Bayes. Sebelum mearik sampel dari suatu populasi terkadag kita peroleh iformasi megeai parameter yag aka diestimasi. Iformasi ii kemudia digabugka dega iformasi dari sampel utuk diguaka dalam megestimasi parameter populasii da parameter populasi berasal dari suatu distribusi, sehigga ilaiya tidaklah tuggal da merupaka variabel radom. Bayes megguaka iterpretasi probabilitas secara subyektif di dalam aalisa statistika formal. Pedekata Bayes terhadap metode estimasi statistik meggabugka iformasi yag dikadug dalam sampel dega iformasi lai yag telah tersedia sebelumya. Dari segi asumsi statistikawa klasik memadag bahwa parameter populasi mempuyai harga tertetu yag tidak diketahui sehigga peryataa probabilitas tetag parameter populasi tidak mempuyai arti..5. Distribusi Prior Distribusi awal (prior) adalah keteraga tambaha megeai θ, misalya bahwa θ diketahui berubah sesuai dega distribusi peluag f ( θ ) dega rataa awal µ 0 da varias 0 yaitu diaggap bahwa θ merupaka ilai peubah acak θ dega
8 distribusi peluag f ( θ ) da igi ditaksir ilai θ tertetu utuk populasi yag diambil sampelya. Peluag yag dikaitka dega distribusi awal ii disebut peluag pribadi, karea megukur derajat keyakia seseorag megeai letak parameter yag igi ditaksir da estimator meguaka pegalama da pegetahua sebagai dasar utuk memperoleh peluag pribadi yag berasal dari distribusi awal..5. Distribusi Posterior Tekis bayes megguaka distribusi awal f ( θ ) bersama dega fugsi gabuga sampel f(x, x,, x : θ ) utuk meghitug distribusi posterior f(θ x, x,, x ). Distribusi posterior (pasca) terdiri atas keteraga dari distribusi awal yag subjektif maupu distribusi sampel yag objektif da meyataka derajat keyakia kita megeai letak parameter θ setelah sampel diamati. f(x, x,, x θ ) sama dega f(x, x,, x : θ ) utuk distribusi peluag gabuga sampel bilamaa igi meujukka bahwa parameter juga merupaka peubah acak. Distribusi gabuga sampel x,x,... x da parameter θ adalah: f(x, x,, x,θ ) f(x, x,, x ;θ )f(θ ). Sehigga distribusi margialya sebagai berikut : g(x, x,, x ) θ f ( f ( x,x,...x ; θ ) x,x,...x ; θ )dθ ( bila diskrit ) ( bila kotiu ) jadi distribusi posteriorya dapat ditulis sebagai berikut: (.) f(x, x,, x,θ) f ( θ x, x,... x ) (.) g(x, x,, x ) Distribusi posterior f(θ x, x,, x ) diyataka dega θ *, disebut peaksira bayes utuk θ (Roald & Raymod, 995).
9.5.3 Meetuka Selag Taksira Bayes Selag atau iterval bayes (-α )00% utuk parameter θ dapat dibuat dega meghitug selag yag titik tegahya berada pada rataa distribusi pasca yag megadug (-α )00% peluag pasca. Sehigga selag a<θ <b aka disebut selag bayes (-α )00% utuk θ bila b θ* θ* f(θ x, x,, x : θ ) dθ a f(θ x, x,, x : θ ) dθ α (.3) Rataa Posterior µ* adalah estimasi bayes dari rataa populasi µ, da selag bayes (-α)00% utuk µ dapat dibuat dega meghitug selag µ* - Z α/ * < µ < µ* + Z α/ * (.4).6 Batas Tolerasi Selag kepercayaa utuk parameter θ, yaitu selag yag berbetuk ˆ θ < θ < θˆ, bila ˆ θ da ˆ θ tergatug pada ilai statistik Θˆ utuk sebuah sampel tertetu da juga pada distribusi sampel dari Θˆ. Ii berarti batas kepercayaa dihitug sedemikia rupa sehigga proporsi tertetu dari selag yag dihitug dari seluruh sampel yag dapat dibuat dega ukura yag sama megadug parameter populasi θ. Utuk memperoleh taksira yag lebih tiggi derajat kepercayaaya, diguaka iterval atau selag taksira disertai ilai koefisie kepercayaa yag dikehedaki. Jika simpaga baku diketahui da populasiya berdistribusi ormal, maka iterval taksiraya adalah: p µ x zα < < x + zα ( α) (.5) Keteraga α adalah koefisie kepercayaa α z α bilaga z didapat dari table ormal baku utuk peluag
30 Persamaa (.) di atas dapat diyataka dalam betuk lai, adalah utuk memperoleh (-α )00% iterval kepercayaa parameter µ dapat megguaka persamaa berikut: x zα < µ < x + zα (.6) luas Bila zα meyataka ilai z sehigga daerah di sebelah kaaya mempuyai α maka didapat dua batas kepercayaa sebagai berikut: θ* x z da α θ* x + z α Gbr.5 Batas keprcayaa pada distribusi ormal Jika x dipakai sebagai taksira utuk μ, maka kita bisa yaki (cofidet) dega tigkat keyakia (cofidece level) 00(-α)% bahwa error (E x-μ ) yg terjadi tidak aka lebih besar dari z seperti pada gambar.6 di bawah ii: α Gambar.6 Iterval kepercayaa rata-rata populasi Sebagai cotoh, bila semua sampel dega ukura yag sama diambil dari suatu distribusi ormal, 95% dari semua selag yag ditetuka oleh batas kepercayaa x ±,96 aka megadug parameter µ. Karea itu dega
3 kepercayaa 95% selag x ±,96, yag dihitug dari suatu sampel tertetu, aka megadug parameter µ. Suatu cara utuk meetapka batas utuk ilai tuggal dalam populasi ialah dega meetuka suatu selag kepercayaa utuk suatu proporsi tertetu dari pegukura. Ii palig baik dijelaska dega membayagka suatu keadaa yag meyagkut pegambila sampel acak dari suatu keadaa yag meyagkut pegambila sampel acak dari suatu distribusi ormal dega rataa µ da variasi yag diketahui. Jelas suatu batas mecakup bagia tegah 95% dari populasi pegamata adalah µ ±,96 (.7) Ii disebut selag tolerasi, da memag cakupa 95% dari pegamata yag diukur adalah tepat. Aka tetapi, dalam praktek µ da jarag diketahui, jadi peggua terpaksa megguaka x ± ks, (.8) Da sekarag, selag berbetuk peubah acak da karea itu cakupa dari proporsi populasi yag dipeuhi selag tadi tidak lagi tepat. Akhibatya selag kepercayaa 00( γ )% berlaku utuk peryataa tersebut karea x ± ks tidak dapat diharapka selalu mecakup setiap proporsi tertetu. Batas tolerasi utuk pegukura yag berdistribusi ormal dega rataa µ da simpaga baku yag keduaya tidak diketahui, batas tolerasi diberika oleh x ± ks, k ditetuka sedemikia rupa sehigga dapat ditegaska dega 00( γ )% kepercayaa bahwa batas tersebut megadug palig sedikit pegukura. α proporsi