Penerapan SAS/IML Algoritma EM, Pembangkitan sebaran normal ganda, dan Bootstrap

dokumen-dokumen yang mirip
SAS/BASE & PROC untuk Analisis Statistika

BAB I PENDAHULUAN. sewajarnya untuk mempelajari cara bagaimana variabel-variabel itu dapat

ESTIMASI PARAMETER PADA MULTIPLE REGRESI MENGGUNAKAN MAKSIMUM LIKELIHOOD SKRIPSI SITI MAISAROH RITONGA

PENGARUH MIXED DISTRIBUTION PADA PENDEKATAN QUASI-LIKELIHOOD DALAM MODEL LINEAR 1)

Statistik Bisnis 2. Week 6 Two-Sample Test Population Proportions and Variances

Pertemuan 10 STATISTIKA INDUSTRI 2. Multiple Linear Regression. Multiple Linear Regression. Multiple Linear Regression 19/04/2016

Non Linear Estimation and Maximum Likelihood Estimation

MA3081 STATISTIKA MATEMATIK(A) Bab 2: Distribusi Samp

II. TINJAUAN PUSTAKA. Dalam bab ini akan dibahas beberapa konsep dasar, definisi-definisi serta teorema

Lampiran 1. Kuesioner Self Efficacy (I) dan Persepsi Manajemen Perusahaan (II) Pendidikan terakhir : SMA / D3 / S1 / S2 / S3 / Lainnya,.

Pemeriksaan Sebaran Data Bagus Sartono

PENDUGA RASIO UNTUK VARIANSI POPULASI MENGGUNAKAN KOEFISIEN VARIASI DAN KOEFISIEN KURTOSIS PADA PENGAMBILAN SAMPEL ACAK SEDERHANA

Diskripsi: Types of Statistics dan Penyajian Data

Gambaran Duplikasi Penomoran Rekam Medis. Gambaran Kualifikasi Pendidikan. Gambaran Pengetahuan. Statistics pemberian nomor. N Valid 60.

Kasus. Survey terhadap remaja usia tahun apakah pernah melakukan kerja paruh waktu (part-time)??

Model Black Litterman dengan Estimasi Theil Mixed

Perbandingan Metode Bootstrap Dan Jackknife Resampling Dalam Menentukan Nilai Estimasi Dan Interval Konfidensi Parameter Regresi

UJI RATA-RATA SATU SAMPEL MENGGUNAKAN R UNTUK MENGETAHUI PENGARUH MODEL BELAJAR TERHADAP HASIL BELAJAR MATA KULIAH ANALISIS VEKTOR

Pengantar Statistika Matematika II

Statistik Bisnis 2. Week 4 Fundamental of Hypothesis Testing Methodology

Analisis Data Panel Tidak Lengkap Model Komponen Error Dua Arah dengan Metode Minimum Variance Quadratic Unbiased Estimation (MIVQUE) SKRIPSI

ADLN Perpustakaan Universitas Airlangga

LAMPIRAN A DATA TRY OUT

PENENTUAN UKURAN CONTOH DAN REPLIKASI BOOTSTRAP UNTUK MENDUGA MODEL REGRESI LINIER SEDERHANA

Medan, Juli Penulis

LAMPIRAN. Jumlah Tabungan, Deposito, dan Kredit Tahun (dalam Rp 000)

ESTIMASI PARAMETER DAN INTERVAL KREDIBEL DENGAN MODEL REGRESI LINIER BERGANDA BAYESIAN

dimana n HASIL DAN PEMBAHASAN

Pengantar Statistika Matematika II

Teknik Ensemble dengan Additive Noise pada Estimasi Parameter Model Autoregressive Spasial

Statistik Bisnis. Week 9 Confidence Interval Estimation

PENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI

Lampiran Hasil Output SPSS. Statistics. Skor Kepuasan Pasien Rawat Jalan. Valid 200 Missing 0 Mean Skor Kepuasan Pasien Rawat Jalan Frequenc y

KEPERCAYAAN DIRI. Corrected Item-Total Correlation

PENDUGAAN DATA HILANG DENGAN MENGGUNAKAN DATA AUGMENTATION. Abstract

PERBANDINGAN METODE BOOTSTRAP DAN JACKKNIFE DALAM MENGESTIMASI PARAMETER REGRESI LINIER BERGANDA (COMPARISON OF BOOTSTRAP AND JACKKNIFE METHODS TO

BAB IV ANALISIS HASIL DAN PEMBAHASAN

BAB III METODOLOGI PENELITIAN

Analisis Korelasi & Regresi

(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN

Sarimah. ABSTRACT

KAJIAN METODE IMPUTASI DALAM MENANGANI MISSING DATA. Triyani Hendrawati Staf Pengajar Statistika Universitas Padjadjaran

PERBANDINGAN KINERJA DIAGRAM KONTROL MULTIVARIAT UNTUK VARIABILITAS BERDASARKAN MATRIKS KOVARIANSI DAN MATRIKS KORELASI. Abstrak

SUBSAMPLE IN BIG DATA BASED SOME METHOD

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

Pelanggaran Asumsi Normalitas Model Multilevel Pada Galat Level yang Lebih Tinggi. Bertho Tantular 1)

SKALA UJI COBA. SKALA I No Pernyataan Tanggapan 1. Saya senang dengan penampilan saya SS S E TS STS 2. Saya merasa tidak memiliki kemampuan yang dapat

Inferensia Statistik parametrik VALID?? darimana sampel diambil

Rencana Penerimaan Sampel (Acceptance Sampling)

PENERAPAN MODEL REGRESI LINIER BAYESIAN UNTUK MENGESTIMASI PARAMETER DAN INTERVAL KREDIBEL

ESTIMASI PARAMETER µ DAN σ 2 PADA DISTRIBUSI EKSPONENSIAL TERGENERALISIR DUA VARIABEL MENGGUNAKAN FUNGSI PEMBANGKIT MOMEN SKRIPSI

BAB 3 PENGOLAHAN DATA

ABSTRAK. Kata kunci: e-commerce, relative advantage, compatibility, complexity, adoption. iii Universitas Kristen Maranatha

BAB 5 SIMPULAN DAN SARAN

ESTIMASI INTERVAL KEPERCAYAAN (CONFIDENCE INTERVAL) PARAMETER MODEL PROSES GEOMETRIK WEIBULL PADA ANALISIS UJI HIDUP UNTUK DATA TERSENSOR TIPE II

Model Regresi Zero Inflated Poisson Pada Data Overdispersion

BAB IV ANALISIS DAN PEMBAHASAN

BAB I. REGRESI LINIER BERGANDA

ABSTRAK. Teknologi pengkode sinyal suara mengalami kemajuan yang cukup. pesat. Berbagai metode telah dikembangkan untuk mendapatkan tujuan dari

PERBANDINGAN MODEL ARIMA DAN MODEL REGRESI DENGAN RESIDUAL ARIMA DALAM MENERANGKAN PERILAKU PELANGGAN LISTRIK DI KOTA PALOPO

Sebaran Peluang kontinyu Sebagian besar kegiatan di alam ini mengikuti sebaran kontinyu Salah satu sebaran kontinyu adalah sebaran normal. Sebaran nor

Statistik Bisnis. Week 13 Chi-Square Test

LAMPIRAN 1 LAMPIRAN KUESIONER

Penaksiran Mean Stratum pada Sampling Acak Stratifikasi dengan Menggunakan Metode Empirical Bayes

PERBANDINGAN METODE PENDUGAAN PARAMETER DALAM PEMODELAN PERSAMAAN STRUKTURAL LA MBAU

PENAKSIRAN PARAMETER µ DAN σ PADA DISTRIBUSI NORMAL MENGGUNAKAN METODE BAYES DAN MAKSIMUM LIKELIHOOD SKRIPSI SUNARTO URJOYO PURBA

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB III. METODE PENELITIAN

PREDIKSI PELAPORAN PENCURIAN KENDARAAN BERMOTOR BERBASIS LINIER REGRESI BERGANDA DI KOTA SEMARANG

Jika terdapat k variabel bebas, x dan Y merupakan variabel tergantung, maka diperoleh model linier dari regresi berganda seperti rumus [3.1]. [3.

BAB IV ANALISIS HASIL DAN PEMBAHASAN

MA4081 PENGANTAR PROSES STOKASTIK Topik Khusus: M

Lampiran 1. Perkembangan GDP Riil Pertanian (Constant 2000, Juta US$) Negara Berkembang Tahun Indonesia Thailand Cina India Brasil Argentina Meksiko

ABSTRAK. Kata Kunci : Artificial Neural Network(ANN), Backpropagation(BP), Levenberg Marquardt (LM), harga emas, Mean Squared Error(MSE), prediksi.

KUESIONER PENELITIAN

BAB IV ANALISIS HASIL DAN PEMBAHASAN

Sampling Theory. Spiegel, M R, Schiller,J. Schaum's outline of probability and statistics.third Edition. United State: McGraw Hill ;2009.

E-Jurnal Matematika Vol. 2, No.3, Agustus 2013, ISSN:

Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas

Statistik Bisnis 1. Week 9 Discrete Probability

BAB II. REGRESI LINIER BERGANDA DENGAN VARIABEL DUMMY

Penaksiran Parameter Model Kalibrasi Linier yang Berdistribusi Skew-Normal dengan Algoritma-EM

LAMPIRAN A: SKALA PENELITIAN A-1 Skala Dukungan Sosial Orangtua

KAJIAN ESTIMASI PARAMETER MODEL AUTOREGRESIF TUGAS AKHIR SM 1330 NUR SHOFIANAH NRP

Mengolah Data Bidang Industri

LAMPIRAN A SKALA PENELITIAN

Penggunaan Metode Bootstrap dalam Regresi Cox Proportional Hazards pada Ketahanan Hidup Pasien Diabetes mellitus

PENERAPAN METODE BOOTSTRAP RESIDUAL DALAM MENGATASI BIAS PADA PENDUGA PARAMETER ANALISIS REGRESI

ABSTRAK. Kata-kata kunci: biaya pemasaran dan penjualan. viii. Universitas Kristen Maranatha

BAB IV ANALISIS HASIL DAN PEMBAHASAN

REGRESI MULTIVARIATE

1) Kriteria Ekonomi Estimasi model dikatakan baik bila hipotesis awal penelitian terbukti sesuai dengan tanda dan besaran dari penduga.

L A M P I R A N. Universitas Sumatera Utara

SIMULASI PENGUKURAN KETEPATAN MODEL VARIOGRAM PADA METODE ORDINARY KRIGING DENGAN TEKNIK JACKKNIFE. Oleh : DEWI SETYA KUSUMAWARDANI

TINJAUAN PUSTAKA. Model Linier dengan n pengamatan dan p variable penjelas biasa ditulis sebagai

oleh YUANITA KUSUMA WARDANI M

PENDUGAAN AREA KECIL TERHADAP PENGELUARAN PER KAPITA DI KABUPATEN SRAGEN DENGAN PENDEKATAN KERNEL SKRIPSI

SKRIPSI ERLINDA SIREGAR

KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD)

Transkripsi:

Penerapan SAS/IML Algoritma EM, Pembangkitan sebaran normal ganda, dan Bootstrap τρ

Application EM Algorithm Complete-data specification f(x Φ) f x Φ = b x eφt(x) a(φ) E-step : Estimate the complete data sufficient statistics t(x) by finding t (p) = E t(x) y, Φ (p) M-step : Determine Φ (p+1) as solution of the equations E t x Φ = t (p)

In Regression Analysis estimation of missing data So, assume the regression model behave y = Xβ + ε; ε~n(0,1) E-step M-step : estimation of missing data, in criteria t(x) Χ, for independent variable, and t(x) Y, for dependent variable : the maximum likelihood estimator for β is equal to find the β for maximize the equations below L = n 2 ln 2π n 2 lnσ2 1 2σ 2 y Xβ y Xβ So, the result is β = X X 1 X y

Latihan 1 Suppose we have data for regression analysis below Y X 313 31 384 38 484 48 523 52 633 63 673 67 754 75 844 84 894 89 993 99 When we have incomplete data, estimate the missing value using EM algorithm Y X 313 31 384 38 484 48 523. 633 63 673. 754 75 844 84 894. 993 99 Y = b0 + b1 X

Jawaban 1 data reg; input y x; cards; 313 31 384 38 484 48 523. 633 63 673. 754 75 844 84 894. 993 99 ; run; proc iml; use reg; read all var{y} into y; read all var{x} into x; x0 = {100,100,100}; n = nrow(y);e = 10;x1 = x;i = 1; do while(e > 0.00001); x[loc(x1=.)]=x0; *tahapan E; xb = J(n,1,1) x; beta = inv(xb`*xb)*xb`*y; *tahapan M; xbaru = (y - beta[1])/beta[2]; x2 = xbaru[loc(x1=.)]; e = sum(abs(x2-x0)); x0 = x2; i = i+1; end; print x2 i;

Sebaran Normal Ganda (Multivariate Normal) Suatu vektor peubah acak Y menyebar normal ganda dituliskan dengan Y~MVN(μ, Σ) Y = Y 1 Y p ; μ = μ 1 μ p ; Σ = 2 σ 1 σ 1p σ p1 σ2 p

Sifat Sebaran MVN Kombinasi linier dari semua komponen peubah x juga menyebar normal. Jika X MVN (, ), maka kombinasi linear : a X = a 1 X 1 + a 2 X 2 +...+ a p X p menyebar MVN(a, a a) Jika X N p (, ) maka semua anak gugus dari X juga menyebar normal Jika X 1 dan X 2 saling bebas, dan menyebar MVN 1 ( 1, 11 ) dan MVN 2 ( 2, 22 ) maka sebaran bersyarat [X 1 X 2 ] adalah normal ganda : 1 11 0 MVN1 2, 2 0 22

Penerapan pembangkitan MVN Algoritma pembangkitan Y~MVN(μ, Σ): Bangkitkan Z i ~ N(0,1); i = 1,2, p dengan cov(z i,z j ) = 0 dan simpanlah sebagai vektor z Carilah matriks T sehingga Σ = T T Hitunglah Y = μ + T z maka Y~MVN(μ, Σ)

Ilustrasi 2 Misalkan akan dibangkitkan vektor peubah acak Y~MVN(μ, Σ) dengan μ = 1 4 10 ; Σ = 2 0.5 1 0.5 1 0.2 1 0.2 1

Jawaban 2 data data1; input s1 s2 s3 means; cards; 2-0.5-1 1-0.5 1 0.2 4-1 0.2 1 10 ; run; proc iml; use data1; read all var{s1 s2 s3} into sigma; read all var{means} into mu; p = nrow(sigma); n = 1000; *banyaknya bil acak yg dibangkitkan; T = half(sigma); do i=1 to n; z = rannor(j(p,1,1)); y = mu + T`*z; y1 = y`; hasily = hasily//y1; end; create datamvn from hasily; append from hasily; quit; proc means data=datamvn; run;

Ilustrasi 3 Misalkan akan dibangkitkan vektor peubah acak Y~MVN(μ, Σ) dengan σ 1 =2, σ 2 =5, σ 3 =10 μ = 100 40 10 ; ρ = 1 0.5 0.9 0.5 1 0.2 0.9 0.2 1

Jawaban 3 data data2; input r1 r2 r3 means sd; cards; 1-0.5-0.9 100 2-0.5 1 0.2 40 5-0.9 0.2 1 10 10 ; run; proc iml; use data2; read all var{r1 r2 r3} into R; read all var{means} into mu; read all var{sd} into sd; p = nrow(r); n = 1000; D = diag(sd); DRD = D*R*D`; *sigma; T = half(drd); do i=1 to n; z = rannor(j(p,1,1)); y = mu+t`*z; y1 = y`; hasily = hasily//y1; end; create datamvn2 from hasily; append from hasily; quit; proc corr data=datamvn2; run;

Bootstrap

Definition method for assigning measures of accuracy to sample estimates allows estimation of the sampling distribution of almost any statistic using only very simple methods Generally, it falls in the broader class of resampling methods

Situations where bootstrapping is useful When the theoretical distribution of a statistic of interest is complicated or unknown When the sample size is insufficient for straightforward statistical inference When power calculations have to be performed, and a small pilot sample is available

Types of bootstrap scheme Case Resampling Bootstrap is generally useful for estimating the distribution of a statistic (e.g. mean, variance) without using normal theory (e.g. z-statistic, t- statistic)

Ilustrasi 4 Diketahui data3 yang berisi contoh 120 tinggi badan yang menyebar N(160,100) Lakukanlah proses bootstrap untuk memperoleh sebaran empirik bootsrap dari rataan contohnya.

Jawaban 4 data data3; do i=1 to 120; tinggi = 160+10*rannor(1); output; end; run; proc iml; use data3; read all var{tinggi} into tinggi; n = 120;ulangan = 1000; contoh = ceil(120*ranuni(j(n,ulangan,1))); do i = 1 to ulangan; ci = contoh[,i]; tinggis = tinggi[ci,]; tinggiss= tinggiss tinggis; end; M = tinggiss[:,]; create meanb var{m}; append; quit; proc univariate data=meanb;histogram M;run; proc means data=meanb mean std;var M;run;

Terima kasih