IDENTIFIKASI PENCILAN DAN PETA PENCILAN PADA ANALISIS KOMPONEN UTAMA UNTUK DATA MENJULUR ANNA FAUZIYAH DEPARTEMEN STATISTIKA

Ukuran: px
Mulai penontonan dengan halaman:

Download "IDENTIFIKASI PENCILAN DAN PETA PENCILAN PADA ANALISIS KOMPONEN UTAMA UNTUK DATA MENJULUR ANNA FAUZIYAH DEPARTEMEN STATISTIKA"

Transkripsi

1 IDENTIFIKASI PENCILAN DAN PETA PENCILAN PADA ANALISIS KOMPONEN UTAMA UNTUK DATA MENJULUR ANNA FAUZIYAH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 212

2 ABSTRAK ANNA FAUZIYAH. Identifikasi Pencilan dan Peta Pencilan pada Analisis Komponen Utama untuk Data Menjulur. Dibimbing oleh KUSMAN SADIK dan I MADE SUMERTAJAYA. Analisis Komponen Utama (AKU) merupakan salah satu analisis peubah ganda yang pada dasarnya mentransformasikan secara linier peubah asal menjadi peubah baru yang dinamakan komponen utama. Akan tetapi, AKU yang didasarkan pada matriks ragam peragam ini sangat sensitif terhadap keberadaan pencilan. Sensitifitas terhadap pencilan pada Klasik dapat diatasi dengan AKU yang kekar (K) yang bekerja sangat baik pada data yang memiliki sebaran simetrik atau tidak menjulur. Apabila data peubah asal menjulur maka banyak titik data yang sebenarnya bukan pencilan dianggap sebagai pencilan atau sebaliknya. Kemudian dikembangkanlah pendekatan K yang cocok untuk data menjulur dengan mendefinisikan berbagai kriteria baru untuk menggambarkan pencilan yaitu KAO. Penelitian ini menggunakan empat metode yaitu Klasik, KMCD, K, dan KAO untuk mengetahui perbandingan efektifitas keempat metode tersebut dalam mengidentifikasi pencilan pada data menjulur. Keempat metode tersebut dicobakan pada dua set data yang dikontaminasi pencilan dengan proporsi %, %, %, dan 1%. Hasil yang diperoleh dari penelitian ini menunjukkan bahwa metode KAO mampu mengatasi pengaruh kehadiran pencilan pada data menjulur karena memiliki tingkat kesalahan identifikasi yang paling kecil. Hal tersebut diperkuat dengan adanya peta pencilan yang memberikan gambaran secara visual dalam pengidentifikasian pencilan. Kata kunci : data menjulur, pencilan, analisis komponen utama kekar, peta pencilan.

3 IDENTIFIKASI PENCILAN DAN PETA PENCILAN PADA ANALISIS KOMPONEN UTAMA UNTUK DATA MENJULUR ANNA FAUZIYAH Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 212

4 Judul Nama NIM : Identifikasi Pencilan dan Peta Pencilan pada Analisis Komponen Utama untuk Data Menjulur : Anna Fauziyah : G1483 Menyetujui, Pembimbing I, Pembimbing II, Dr. Ir. Kusman Sadik, M.Si NIP : Dr. Ir. I Made Sumertajaya, MS NIP : Mengetahui : Ketua Departemen, Dr. Ir. Hari Wijayanto, M.Si NIP : Tanggal Lulus:

5 PRAKATA Tiada kata yang paling indah selain puji dan syukur kepada Tuhan Yang Maha Esa atas segala rahmat dan karunia-nya sehingga karya ilmiah yang berjudul Identifikasi Pencilan dan Peta Pencilan pada Analisis Komponen Utama untuk Data Menjulur ini dapat terselesaikan. Ucapan terima kasih tak lupa penulis ucapkan kepada berbagai pihak yang telah membantu sehingga karya ilmiah ini selesai dengan baik, yaitu : 1. Bapak Dr. Ir. Kusman Sadik, M.Si dan Bapak Dr. Ir. I Made Sumertajaya, MS atas kesabarannya dalam membimbing, memberi saran, serta motivasi sehingga karya ilmiah ini dapat diselesaikan 2. Seluruh dosen pengajar di Departemen Statistika 3. Ayahanda Yayat Suryatna, Ibunda Eeng Emalia serta kakak-kakak Dewi Noviyanti dan Nisa Sofianti yang selalu memberikan kasih sayang, semangat, dan doa 4. Ibu Markonah, Ibu Tri, Ibu Aat, Bang Ibay, Bang Iyus dan staf tata usaha lainnya yang telah banyak membantu. Rekan-rekan di Departemen Statistika IPB angkatan 4 khususnya Keluarga Pandhewi (Dinia Wihansah, Mulya Sari, Hanik Aulia, dan Hana Maretha), Ramadhiyan Firdan, Iin Puspitasari, Ratih Noviani, dan Hadi Septian atas segala kebersamaan, canda tawa, kenangan indah, dan masukan-masukan yang telah mengisi kehidupan penulis selama di kampus. Teman bimbingan skripsi yaitu Aji Setyawan, Tri Hardi Putra, dan Arni Nurwida atas semangat dan kebersamaannya 7. Teman-teman kostan SQ yaitu Mega, Delvi, Fatchah, Nengsih, Hilma, Ulan, Puji, Putri, Yuang, Fitri, Irma, Feby, Lia, Reffa dan Devi atas dukungan, semangat dan doa kepada penulis 8. Semua pihak yang tidak mungkin disebutkan satu persatu yang telah membantu penulis selama ini. Semoga karya ilmiah ini dapat bermanfaat bagi semua pihak yang membutuhkan. Penulis mohon maaf atas segala kekurangan dan kesalahan yang terdapat dalam karya ilmiah ini. Bogor, November 212 Anna Fauziyah

6 RIWAYAT HIDUP Penulis dilahirkan di Kuningan, pada tanggal 8 April 199 dari Bapak Yayat Suryatna dan Ibu Eeng Emalia. Penulis merupakan putri ketiga dari tiga bersaudara. Penulis memulai pendidikannya di SD Negeri 1 Jambar dan lulus pada tahun 22. Kemudian penulis melanjutkan pendidikan di SMP Negeri 2 Kuningan hingga tahun 2. Setelah menyelesaikan studinya di SMA Negeri 1 Kuningan pada tahun 28, penulis diterima sebagai mahasiswa Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI) pada tahun yang sama. Selama satu tahun pertama di IPB, penulis melalui Tahap Persiapan Bersama (TPB). Pada tahun 29, penulis diterima sebagai mahasiswa Departemen Statistika dengan minor Ilmu Ekonomi dan Studi Pembangunan. Selama kuliah, penulis aktif dalam organisasi kemahasiswaan yaitu sekretaris divisi Komunikasi dan Informasi Lembaga Struktural Bina Desa BEM KM IPB selama dua periode pada tahun 29-2, anggota Departemen Sains Himpunan Profesi Gamma Sigma Beta Departemen Statistika FMIPA IPB Periode 211. Penulis juga aktif dalam kegiatan kemahasiswaan yang diadakan oleh Departemen Statistika maupun Fakultas Matematika dan Ilmu Pengetahuan Alam, antara lain Spirit FMIPA 2 (Divisi Medis), The th Statistika Ria 2 (Divisi LO), Pesta Sains FMIPA 2 (Divisi K4), Welcome Ceremony Statistics (WCS) 211 serta Lomba Jajak Pendapat Statistika 211 (Sekretaris Umum). Pada bulan Februari-April 212 penulis diberikan kesempatan untuk praktik lapang di PT. Infomedia Nusantara.

7 vii DAFTAR ISI Halaman DAFTAR TABEL... viii DAFTAR GAMBAR... viii DAFTAR LAMPIRAN... viii PENDAHULUAN 1 Latar Belakang... 1 Tujuan... 1 TINJAUAN PUSTAKA 1 Data Menjulur... 1 Pencilan... 2 Analisis Komponen Utama... 3 Analisis Komponen Utama Kekar... 3 Analisis Komponen Utama Kekar untuk Data Menjulur... 4 Peta Pencilan... 4 METODOLOGI Data... Metode... HASIL DAN PEMBAHASAN Karakteristik Data... Identifikasi Pencilan pada n 1 =... Identifikasi Pencilan pada n 2 =... 8 Peta Pencilan... 9 Penerapan Klasik dan KAO... KESIMPULAN DAN SARAN 11 Kesimpulan Saran DAFTAR PUSTAKA LAMPIRAN... 13

8 viii DAFTAR TABEL Halaman 1. Nilai medcouple tiap peubah Persentase kesalahan identifikasi pencilan pada data menjulur n 1 =, p= dan k= Persentase kesalahan identifikasi pencilan pada data menjulur n 2 =, p= dan k= Ringkasan hasil komponen utama pada berbagai metode... DAFTAR GAMBAR Halaman 1. Peta pencilan Persentase Kesalahan I pada n 1 = Persentase Kesalahan II pada n 1 = Persentase Kesalahan I pada n 2 = Persentase Kesalahan II pada n 2 = Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan % pada (a) Klasik, (b) KMCD, (c) K, (d) KAO Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan % pada (a) Klasik, (b) KMCD, (c) K, (d) KAO.... DAFTAR LAMPIRAN Halaman 1. Skema algoritma penelitian Rumus adjusted outlyingness (AO) Histogram data hasil pembangkitan Nilai korelasi antar peubah pada n 1 = dan p= Nilai korelasi antar peubah pada n 2 = dan p= Kesalahan identifikasi pencilan pada data menjulur n 1 =, p=, dan k= Kesalahan identifikasi pencilan pada data menjulur n 2 =, p=, dan k= Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan 1% (a) Klasik, (b) KMCD, (c) K, (d) KAO Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan 1% (a) Klasik, (b) KMCD, (c) K, (d) KAO... 24

9 1 PENDAHULUAN Latar Belakang Konsep dasar dari Analisis Komponen Utama (AKU) adalah pereduksian dimensi sekumpulan peubah asal menjadi peubah baru yang berdimensi lebih kecil yang saling bebas dan tetap mempertahankan informasi yang terkandung di dalamnya. Peubah baru tersebut disebut komponen utama. Akan tetapi, AKU yang didasarkan pada matriks ragam peragam ini sangat sensitif terhadap keberadaan pencilan. Hubert et al. (2) memperkenalkan pendekatan Analisis Komponen Utama Kekar (K) atau Robust Principal Component Analysis () yang menghasilkan komponen utama yang tidak dipengaruhi oleh pencilan. K menggabungkan konsep Projection Pursuit (PP) dengan Minimum Covariance Determinant (MCD). PP digunakan untuk inisiasi reduksi dimensi awal sedangkan MCD digunakan sebagai penduga matriks ragam peragam yang kekar. Pada tahap akhir K dilakukan pembobotan ulang dengan menggunakan penduga MCD. Jika pembobotan ulang tersebut tidak dilakukan maka metode tersebut dinamakan KMCD. KMCD menghasilkan subruang AKU yang sama dengan K tetapi tidak dengan nilai dari akar ciri dan vektor cirinya. Sensitifitas terhadap pencilan pada Klasik dapat diatasi dengan K yang bekerja sangat baik pada data yang memiliki sebaran simetrik atau tidak menjulur. Apabila data peubah asal menjulur maka banyak titik data yang sebenarnya bukan pencilan dianggap sebagai pencilan atau sebaliknya. Hubert et al. (29) mengembangkan pendekatan K yang cocok untuk data menjulur dengan mendefinisikan berbagai kriteria baru untuk menggambarkan pencilan. Pendekatan ini terdiri dari langkah-langkah yang sama dengan K sebelumnya akan tetapi pada pendekatan baru ini dilakukan beberapa modifikasi. Perbedaan mendasar dari pendekatan K baru ini dengan pendekatan K sebelumnya yaitu terletak pada penggantian perhitungan keterpencilan pada K yang menggunakan rumus Stahel-Donoho (K) dengan menggunakan rumus perhitungan keterpencilan baru yaitu adjusted outlyingness (KAO). Tujuan Penelitian ini bertujuan untuk: 1. Membandingkan efektifitas metode Klasik, KMCD, K, dan KAO dalam mengidentifikasi pencilan pada data menjulur yang memiliki berbagai proporsi pencilan 2. Menerapkan peta pencilan pada data menjulur 3. Menerapkan Klasik dan KAO pada data menjulur. TINJAUAN PUSTAKA Data Menjulur Bentuk dan ketidaksimetrian dari sebuah sebaran dapat diukur dari kemiringannya. Sebaran yang simetrik memiliki kemiringan nol, sebaran yang tidak simetrik yang ekornya menjulur ke kanan memiliki kemiringan positif, sedangkan sebaran yang ekornya menjulur ke kiri memiliki kemiringan negatif. Koefisien kemiringan klasik b 1 dari kumpulan data peubah tunggal X n ={x 1, x 2,..., x n } diambil dari sebaran kontinu yang didefinisikan sebagai berikut: b 1 X n = m 3(X n ) m 2 (X n ) 3 2 dimana m 2 merupakan momen empiris kedua dan m 3 merupakan momen empiris ketiga dari data. Akan tetapi, b 1 sangat sensitif terhadap pencilan dalam data sehingga harus menggunakan koefisien kemiringan yang kekar. Brys et al. (24) memperkenalkan ukuran kemiringan yang kekar terhadap pencilan yaitu medcouple. Nilai medcouple berkisar antara -1 sampai 1. Jika nilainya maka sebarannya tidak menjulur (simetrik). Misalkan X n ={x 1, x 2,..., x n } diambil dari sebaran kontinu dan kemudian diurutkan sehingga x 1 x 2... x n, maka median untuk X n adalah: m n = (x n 2 +x (n 2)+1) )/2, jika n genap x (n+1)/2, jika n ganjil berikut nilai MC n (medcouple): jika x i x j maka: MC n = med xi m n x j h(x i, x j ) h x i, x j = x j- m n - m n - x i x j x i

10 2 jika x i =x j =m n maka diberikan fungsi kernel h. Misalkan m 1 <... < m k melambangkan indeks dari pengamatan yang kembar dengan median m n dan x ml = m n untuk l = 1,..., k maka: h(m i, m j ) = -1 jika i + j - 1 < k jika i + j - 1 = k +1 jika i + j - 1 > k Salah satu contoh sebaran menjulur adalah sebaran normal inverse Gaussian (NIG). Sebaran tersebut merupakan kasus khusus dari sebaran generalized hyperbolyc (GH) yang didefinisikan sebagai Gaussian generalized inverse Gaussian mixing distribution yang sering digunakan pada bidang keuangan. Jika X~N µ, σ 2 maka 1/X bukan sebaran NIG. Sebaran GH didefinisikan sebagai berikut: gh x:λ,α,β,δ,µ = a λ,α,β,δ δ 2 + x-μ 2 x a λ, α, β, δ = dengan: K λ-1 2 (α δ 2 + x-μ 2 ) exp β x-μ α 2 β 2 λ 2 2πα λ 1 2 δ λ K λ δ α 2 β 2 δ, β < α jika λ > δ >, β < α jika λ = δ >, β α jika λ < Misalkan peubah acak X menyebar X~NIG α, β, δ,μ yang memiliki fungsi kepekatan peluang, nilai harapan, dan ragam sebagai berikut : f x x = αδ π exp δ α2 -β 2 +β x-μ β α E X = μ+δ (1-( β α) 2 ) 1 2 Var X = δ 2 α -1 β α 2 K 1 (α δ 2 + x-μ 2 1-( β α) δ 2 + x-μ 2 dengan x, µ ε R, δ, β α dimana: µ : parameter lokasi δ : parameter skala α, β : parameter bentuk yang menentukan panjang ekor dan kemenjuluran K 1 merupakan fungsi modifikasi Bassel dari persamaan: K n+ 1 2 x = π 2 x-1 2e -x (1+ n i=1 n+i! (2x) i ) n-i i! dengan x, µ ε R, δ, β < α dimana: K λ x = K -λ x maka K -1 2 x = K 1 2 x = π 2 x -1/2 e -x λ = n+ 1, n =, 1, 2, 2 Fungsi modifikasi Bassel hanya memperbolehkan pada kasus ketika λ=-1/2 dan λ=1. Pada λ=-1/2 diperoleh sebaran NIG sedangkan pada λ=1 diperoleh sebaran hyperbolic (HYP). Peubah acak NIG ganda menyebar NIG p α, β, tδ,tμ, untuk t >, berikut adalah fungsi kepekatan peluang, nilai harapan, dan ragamnya: f x (x) = 2δ α 2π p+1 2 exp δα E X = μ+δ ζ Π 1 2 K (p+1)/2 (α δ 2 +x' -1 x (δ 2 +x' -1 x (p+1)/4 Var X = δ 2 ζ -1 ζ +x -1 ζ Π 1 2 ' Π 1 2 dengan x, µ, β ε R p, δ >, α 2 > β β, ϵ R p, ζ = δ α 2 -β' β, Π = β 1 2 (α 2 -β ' β) 1 2, dan = δ 2 dimana: : matriks definit positif ζ : parameter kemenjuluran Π : parameter yang menentukan panjang ekor Σ : matriks ragam peragam (Prause 1999) Pencilan Pencilan adalah pengamatan ekstrim dan merupakan titik data yang tidak khas dari seluruh pengamatan data (Montgomery & Peck 1992). Dengan cara yang sama, Johnson (27) mendefinisikan pencilan sebagai suatu pengamatan pada rangkaian data yang terlihat tidak konsisten terhadap sisaan dari data tersebut. Menurut Draper dan Smith (1992), pencilan merupakan pengamatan yang nilai mutlak sisaannya jauh lebih besar daripada sisaan-sisaan lainnya dan bisa jadi terletak tiga atau empat simpangan baku atau lebih jauh lagi dari rata-rata sisaannya. Pada umumnya pendeteksian pencilan untuk peubah ganda berbasis pada asumsi sebaran yang simetrik. Menurut Hubert dan Van der Veeken (28), pada data yang

11 3 sebarannya tidak simetrik atau menjulur pendeteksian pencilan dilakukan dengan menggunakan adjusted outlyingness (AO) dari data peubah ganda. Pada prakteknya AO tidak dapat dihitung dengan memproyeksikan pengamatan pada semua vektor peubah tunggal a. Oleh karena itu, harus dibatasi dengan cara memilih satu set arah acak. Simulasi menunjukkan bahwa banyaknya arah yang efisien dan hemat dalam waktu komputasi adalah sebanyak m=2p arah. Arah acak dihasilkan sebagai arah yang tegak lurus terhadap subruang yang direntang oleh p-pengamatan secara acak yang diambil dari kumpulan data. Setelah AO dihitung untuk setiap pengamatan, maka tahap selanjutnya yaitu memutuskan apakah pengamatan tersebut adalah pencilan atau bukan. Sebaran AO pada umumnya tidak diketahui (tetapi biasanya miring ke kanan karena dibatasi oleh nol). Oleh karena itu, dihitunglah diagram kotak garis yang disesuaikan (adjusted boxplot) dari nilai AO dan mendeklarasikan pencilan jika AO melebihi batas atas diagram kotak garis yang disesuaikan. cut off = Q e 3MC IQR dimana: Q 3 : kuartil ketiga dari AO i IQR : jangkauan antar kuartil MC : nilai medcouple. Analisis Komponen Utama Jollife (22) mendefinisikan bahwa ide sentral dari analisis komponen utama adalah untuk memperkecil dimensi dari peubah asal sehingga diperoleh peubah baru yang disebut komponen utama. Komponen tersebut tidak saling berkorelasi dan tetap mempertahankan sebagian besar informasi yang terkandung pada peubah asalnya. Menurut Johnson (27), komponen utama merupakan kombinasi linear terboboti dari p peubah acak X 1, X 2,..., X p yang mampu menerangkan data secara maksimum. Vektor acak x =[x 1, x 2,..., x p ] menyebar menurut sebaran tertentu dengan vektor nilai tengah µ dan matriks ragam peragam Σ. Komponen utama ke-j dari p peubah dapat dinyatakan sebagai: Y j =a 1j x 1 +a 2j x 2 + +a pj x p = a'x dan keragaman komponen utama ke-j adalah : λ 1, λ 2,, λ p adalah akar ciri dimana λ 1 λ 2 λ p. Total keragaman komponen utama adalah λ 1 + λ λ p = tr (Σ). Vektor ciri a sebagai pembobot dari transformasi linear peubah asal diperoleh dari persamaan: Σ λ j I a j = ; j = 1, 2,, p Analisis Komponen Utama Kekar Analisis Komponen Utama Klasik berbasis pada matriks ragam peragam yang sangat sensitif terhadap pencilan. Hubert et al. (2) memperkenalkan analisis komponen utama yang kekar terhadap pencilan. K merupakan kombinasi dua ide yaitu antara Projection Pursuit (PP) dan penduga ragam peragam yang kekar. Konsep PP digunakan dalam tahap inisiasi reduksi dimensi awal. Konsep penduga ragam peragam yang kekar menggunakan Minimum Covariance Determinant (MCD) kemudian diterapkan pada data dengan dimensi yang lebih rendah. Secara umum algoritma K terdiri dari tahap-tahap berikut: 1. Mereduksi ruang data, terutama ketika p n, dimana p merupakan jumlah peubah penjelas dan n adalah jumlah observasi. Langkah ini dilakukan dengan Metode Dekomposisi Nilai Singular terhadap mean-centered data matriks dengan rumus: X n,p 1 n μ ' ' = U n,r D r,r V r,p' dengan μ merupakan vektor rataan klasik, r =rank(x n,p 1 n μ ' ), D adalah matriks diagonal berukuran r x r, dan U U=I ro =V V, dimana I r adalah matriks identitas berukuran r x r 2. Menemukan h keterpencilan terkecil (least outlyingness), tahap ini dilakukan dengan memilih ½ < α < 1 untuk mendapatkan nilai h=max{[αn],[(n+k max +1)/2]}, dimana k max merupakan jumlah maksimum komponen yang akan dihitung. Selanjutnya keterpencilan dihitung dengan rumus Stahel-Donoho: Outl O (x i ) = max vεb x i ' v-μmcd (x j ' v) MCD (x j ' v) dengan μ MCD dan MCD merupakan penduga nilai tengah dan simpangan baku MCD, h pengamatan dengan nilai keterpencilan terkecil dihitung vektor nilai Var Y j = λ j ; j = 1,2,, p

12 4 tengah (μ 1 ) dan matriks ragam peragamnya ( ) 3. Matriks ragam peragam didekomposisi sehingga diperoleh komponen utamanya. Sebanyak k komponen utama pertama dipilih dan semua data diproyeksikan pada subruang V berdimensi-k yang direntang oleh k vektor ciri pertama sehingga diperoleh X n,k 4. Untuk setiap pengamatan, dihitung jarak ortogonalnya (OD): OD i () = x i - x i,k dengan x i,k merupakan proyeksi dari x i pada subruang V. Kemudian diperoleh subruang kekar penduga V 1 sebagai subruang yang direntang oleh k vektor ciri dominan dari 1, yang mana matriks ragam peragam semua pengamatan x i OD () i c OD. Nilai cut off sebesar c OD = (μ + σz.97 ) 3 2 dimana μ dan σ diduga dari MCD dan z.97 adalah 97.% kuantil dari sebaran gaussian. Selanjutnya, semua data diproyeksikan pada subruang V 1. Menghitung kembali penduga nilai tengah dan matriks ragam peragam pada subruang berdimensi-k dengan menggunakan pembobot MCD pada data yang diproyeksikan. Pendugaan ini menggunakan algoritma FAST-MCD yang diadaptasi (Rousseeuw 1999). Komponen utama akhir adalah vektor ciri dari matriks ragam peragam tersebut. AKU Kekar MCD (KMCD) merupakan analisis dimana tahap akhir pada algoritma K di atas tidak dilakukan. Akar ciri kekar yang dihasilkan saling berkorespondensi dengan vektor ciri kekar dari matriks ragam peragam dari h pengamatan yang memiliki keterpencilan terkecil. Hal tersebut menghasilkan subruang AKU yang sama dengan K tetapi tidak dengan nilai dari akar ciri dan vektor cirinya. Analisis Komponen Utama Kekar untuk Data Menjulur AKU Klasik dan K keduanya digunakan pada data yang simetrik. Hal tersebut mengharuskan data peubah asal memiliki sebaran yang simetrik. Jika tidak terpenuhi maka dapat dilakukan transformasi terhadap peubah asal misalnya dengan menggunakan transformasi Box-Cox, tetapi peubah yang ditransformasi akan lebih sulit diinterpretasikan. Pada situasi seperti itu maka dilakukan analisis pada peubah asal dengan menggunakan teknik AKU yang cocok untuk data yang tidak simetrik. Pada K dilakukan modifikasi dimana analisis tersebut dapat digunakan pada data menjulur dengan mendefinisikan berbagai kriteria baru untuk menggambarkan pencilan. Menurut Hubert et al. (29), terdapat tiga modifikasi yang dilakukan pada K untuk data menjulur yaitu: 1. Mengganti perhitungan keterpencilan pada K sebelumnya dengan perhitungan keterpencilan baru yang disebut AO. Perhitungan tersebut berdasarkan pada adjusted boxplot. AO memiliki penyebut yang berbeda untuk memberi tanda pada data menjulur. Rumus AO disajikan pada Lampiran 1 2. Mengubah nilai cut off jarak ortogonal yaitu menggunakan nilai terbesar dari OD yang lebih kecil dari Q 3 ({OD}) + 1. e 3MC({OD}) IQR({OD}) 3. Selain menerapkan pembobotan pada penduga MCD, dilakukan juga perhitungan AO pada K untuk data menjulur pada subruang V 1 berdimensi-k kemudian menghitung nilai tengah dan matriks ragam peragam dari h pengamatan dengan AO terkecil. Peta Pencilan Selain menghitung komponen utama, K juga menggambarkan pencilan. Secara umum, pencilan merupakan pengamatan yang tidak mematuhi pola umum data. Pada Gambar 1 dapat dilihat bahwa dalam konteks AKU dapat dibedakan tiga jenis pencilan yaitu: 1. Amatan berpengaruh baik yaitu amatan yang terletak pada subruang komponen utama tetapi jauh dari pengamatan biasa (pengamatan 1 dan 2) 2. Pencilan ortogonal yaitu amatan yang memiliki jarak ortogonal yang besar ke subruang komponen utama sementara proyeksinya terletak pada subruang komponen utama (pengamatan 3 dan 4) 3. Amatan berpengaruh buruk yaitu amatan yang memiliki jarak ortogonal yang besar dan proyeksi pada ruang komponen utama jauh dari pengamatan biasa (pengamatan dan ). Jarak ortogonal adalah jarak antara pengamatan dan proyeksi dalam k-dimensi subruang V 1. Peta pencilan memplotkan jarak ortogonal dengan jarak skor (score distance). Garis ditarik untuk membedakan antara observasi yang memiliki jarak ortogonal antara jarak skor besar dan kecil.

13 SD i = k 2 t ij l j j=1 t i = P ' p,k(x i μ x ) dimana: t i : tingkat kekekaran P ' p,k : matriks loading dengan kolom ortogonal (vektor ciri) μ x : dugaan nilai tengah kekar l j : akar ciri dari MCD pada algoritma K. Gambar 1 Peta pencilan METODOLOGI Data Data yang digunakan dalam penelitian ini diperoleh dari data simulasi. Data simulasi yang digunakan merupakan data menjulur dari hasil pembangkitan bilangan acak normal inverse Gaussian (NIG) dengan kontaminasi berbagai proporsi pencilan. Metode Penelitian ini dilakukan dengan langkahlangkah sebagai berikut: 1. Membangkitkan data menjulur yaitu data yang menyebar NIG p α, β, tδ,tμ,. Dimana µ adalah parameter lokasi, δ adalah parameter skala, α adalah parameter bentuk yang menentukan panjang ekor, β merupakan parameter kemenjuluran, adalah matriks definit positif, dan t >. Jumlah peubah yang dibangkitkan sebanyak peubah dengan n 1 = dan n 2 =. Kemudian diberikan beberapa proporsi pencilan. Proporsi pencilan yang diberikan adalah % (tanpa pencilan), %, %, dan 1% sehingga terbentuk delapan set data Langkah-langkah dalam penyiapan data adalah sebagai berikut: 1.1 Penyiapan data simulasi dengan membangkitkan data menjulur yaitu data yang menyebar NIG α, β, δ,μ. Proses pembangkitan dilakukan dengan algoritma sebagai berikut: a. Membangkitkan data menjulur X~NIG(α, β, δ,μ) sebanyak n 1 = dan n 2 = b. Mengulangi langkah a sebanyak p atau kali dengan parameter yang sama sehingga diperoleh peubah X berukuran dan yaitu X 1, X 2,..., X c. Peubah X 1, X 2,..., X membentuk matriks berdimensi dan d. Menentukan nilai korelasi awal pada peubah X 1, X 2,..., X sehingga kesepuluh peubah tersebut saling berkorelasi e. Mengecek kemenjuluran dari dua set data tersebut dengan melihat nilai medcouple dari masingmasing peubah 1.2 Penyiapan data pencilan dan set data. Pembangkitan pencilan dilakukan dengan cara pengekstriman data pengamatan biasa pada h peubah dari p peubah pada setiap pengamatan yang terpilih dimana h<p. Proses pembangkitan dilakukan dengan algoritma sebagai berikut: a. Mempersiapkan dua set data menjulur X 1, X 2,..., X berdimensi dan yang akan dikontaminasi oleh berbagai proporsi pencilan b. Melakukan identifikasi pencilan pada dua set data tersebut dengan menggunakan adjusted outlyingness (AO). Jika AO i cut off yang ditentukan maka pengamatan tersebut dikatakan sebagai pencilan c. Melakukan pengekstriman pada pengamatan yang memiliki nilai AO i terbesar sesuai dengan proporsi pencilan yang diinginkan yaitu %, %, %, dan 1% sehingga terdapat empat set data menjulur berukuran dan empat set data menjulur berukuran. 2. Melakukan identifikasi pencilan dengan menggunakan metode Klasik, KMCD, K, dan KAO untuk setiap data pada langkah 1. Kemudian membandingkan hasil dari keempat

14 metode tersebut. Hal yang dibandingkan adalah jumlah pencilan yang teridentifikasi pada setiap metode 3. Membandingkan peta pencilan yang dihasilkan oleh metode Klasik, KMCD, K, dan KAO 4. Melakukan penerapan Klasik dan KAO pada data menjulur dengan proporsi pencilan % untuk n=, p=. Melakukan penerapan Klasik pada data menjulur dengan proporsi pencilan % untuk n=, p= tetapi pencilan yang teridentifikasi dihilangkan. Membandingkan hasil Klasik dan KAO pada langkah 4 dan. Hal yang dibandingkan adalah akar ciri dan proporsi kumulatif komponen utama pertama. Skema algoritma penelitian dapat dilihat pada Lampiran 1. Pengolahan data dilakukan dengan menggunakan perangkat lunak MATLAB 7.7.(R28b) dan Microsoft Excel 27. Metode Klasik, KMCD, K, dan KAO dilakukan menggunakan program MATLAB yang terdapat pada situs l dan HASIL DAN PEMBAHASAN Karakteristik Data Data yang dibangkitkan merupakan data menjulur dari sebaran NIG α, β, δ,μ dengan parameter lokasi µ=, parameter skala σ=1, parameter panjang ekor γ=1 dan parameter kemenjuluran δ =.8. Data tersebut memiliki ukuran n 1 = dan n 2 = dengan p= untuk setiap ukuran. Histogram dari data hasil pembangkitan dapat dilihat pada Lampiran 2. Histogram tersebut menggambarkan bahwa data menjulur ke kanan karena pada awal pembangkitan parameter kemenjuluran data telah ditetapkan dengan nilai positif. Tabel 1 menunjukkan besarnya kemenjuluran data pada setiap peubah. Nilai medcouple melebihi nilai sehingga data dapat dikatakan menjulur. Nilai medcouple berkisar antara -1 sampai 1. Jika nilainya maka sebaran datanya tidak menjulur (simetrik). Besarnya korelasi antar peubah dapat dilihat pada Lampiran 3 dan 4. Lampiran 3 menunjukkan bahwa terdapat korelasi yang signifikan pada kesepuluh peubahnya (X1- X). Sedangkan pada Lampiran 4 terdapat korelasi yang tidak signifikan antara peubah X2 dan X (.14), antara peubah X3 dan X (.1), antara peubah X4 dan X9 (.23) serta peubah X dan X9 (.133). Tabel 1 Nilai medcouple tiap peubah Peubah n 1 = n 2 = X X X X X X X X X X Simulasi dilakukan dengan menggunakan metode Klasik, KMCD, K, dan KAO. Karena semua simulasi dilakukan pada set data yang mengandung pencilan sebesar %, %, %, dan 1%, maka α yang digunakan untuk setiap metode adalah sebesar 8%. Identifikasi Pencilan pada n 1 = Tabel 2 menunjukkan kesalahan identifikasi pencilan pada data menjulur dengan n 1 = data, p= dimensi dan rank k=2 (k adalah banyaknya komponen utama yang diambil) dikontaminasi dengan data yang diekstrimkan. Kesalahan I merupakan kesalahan dimana pencilan teridentifikasi sebagai data bukan pencilan. Sedangkan, Kesalahan II merupakan kesalahan dimana data bukan pencilan teridentifikasi sebagai pencilan. Metode yang baik adalah metode yang mengidentifikasi data secara tepat. Pada data tanpa pencilan (proporsi pencilan %) dan data dengan proporsi % tidak terdapat Kesalahan I untuk keempat metode (Gambar 2). Artinya, keempat metode tersebut mengidentifikasi pencilan secara tepat. Pada proporsi pencilan %, KAO memiliki persentase Kesalahan I sebesar 4%. Artinya, KAO mengidentifikasi pencilan sebagai data bukan pencilan sebanyak 1 pencilan dari 2 pencilan yang dikontaminasikan. Sedangkan, pada data dengan proporsi pencilan 1%, KAO memiliki persentase Kesalahan I yaitu sebesar.33%. Pada Tabel 2 terlihat bahwa keempat metode yaitu Klasik, KMCD, K, dan KAO memiliki persentase Kesalahan II yang beragam. Pada proporsi pencilan %, Klasik memiliki

15 7 Tabel 2 Persentase kesalahan identifikasi pencilan pada data menjulur n 1 =, p= dan k=2 Persentase Kesalahan I Proporsi Pencilan Klasik KMCD K KAO %.%.%.%.% %.%.%.% 4.% %.%.%.%.% 1%.%.%.%.33% % 8.2% 9.2% 1.%.% Persentase Kesalahan II % 2.74%.74% 12.3%.% %.%.% 11.11%.44% 1%.% 3.29% 8.47%.% Persentase Kesalahan Total.94% 2.23% 47.21%.37% Gambar 2 Persentase Kesalahan I pada n 1 = persentasi Kesalahan II yang beragam. Pada proporsi pencilan %, Klasik memiliki Kesalahan II sebesar 8.2%. Artinya, Klasik mengidentifikasi data bukan pencilan sebagai pencilan sebanyak 41 pencilan dari data bukan pencilan (data pengamatan biasa). Pada KMCD terdapat Kesalahan II sebesar 9.2%. Artinya, KMCD mengidentifikasi data bukan pencilan sebagai pencilan sebanyak 4 pencilan dari data bukan pencilan. Sedangkan pada K terdapat Kesalahan II yang relatif tinggi yaitu sebesar 1%. Artinya, K mengidentifikasi data bukan pencilan sebagai pencilan sebanyak 7 pencilan dari data bukan pencilan. Berbeda dengan KAO yang memiliki Kesalahan II yang cukup kecil dibandingkan dengan ketiga metode yang lainnya yaitu sebesar.%. Artinya, KAO mengidentifikasi data bukan pencilan sebagai pencilan sebanyak 3 pencilan dari data bukan pencilan. Pada data dengan proporsi pencilan %, tidak terdapat Kesalahan II untuk KAO. Sedangkan pada ketiga metode lainnya yaitu Klasik, KMCD, dan K memiliki Kesalahan II masing-masing sebesar 2.74%,.74%, dan 12,3%. Ketika proporsi pencilan ditambahkan menjadi % dan 1%, Klasik tidak mencatat Kesalahan II. Artinya, Klasik mengidentifikasi data bukan pencilan secara tepat. Pada KMCD terdapat Kesalahan II sebesar % ketika proporsi pencilan meningkat menjadi %. Pada K terdapat Kesalahan II sebesar 11.11%. Sedangkan pada KAO terdapat sedikit Kesalahan II yaitu sebesar.44%. Pada proporsi pencilan 1% KMCD dan K memiliki Kesalahan II masing-masing sebesar 3.29% dan 8.47%. Secara keseluruhan K memiliki Kesalahan II yang paling tinggi yaitu diatas 8% diikuti oleh KMCD dan Klasik. Sedangkan KAO memiliki Kesalahan II yang relatif kecil yaitu dibawah 1% (Gambar 3). K memiliki Kesalahan Total terbesar yaitu sebesar 47.21% diikuti KMCD dan Klasik yang memiliki Kesalahan Total masing-masing sebesar 2.23% dan.94%. Berbeda dengan ketiga metode lainnya, KAO memiliki Kesalahan Total paling kecil yaitu sebesar.37%. Kesalahan I dan Kesalahan II pada data n 1 = dapat dilihat lebih rinci pada Lampiran. Gambar 3 Persentase Kesalahan II pada n 1 =

16 8 Tabel 3 Persentase kesalahan identifikasi pencilan pada data menjulur n 2 =, p= dan k=2 Persentase Kesalahan I Persentase Kesalahan II Proporsi Pencilan Klasik KMCD K KAO %.%.%.%.% %.%.%.%.% %.%.%.%.% 1%.7%.%.%.7% % 8.% 14.% 18.% 3.% % 4.21%.3% 1.79% 2.11% % 7.78%.% 1.%.% 1%.% 3.3% 8.24%.% Persentase Kesalahan Total 2.% 38.% 7.8% 11.77% Identifikasi Pencilan pada n 2 = Pada Tabel 3 menunjukkan set data menjulur dengan n 2 =, p= dan k=2. Data dengan proporsi pencilan sebanyak %, %, dan % tidak mencatat Kesalahan I ketika menggunakan metode Klasik, KMCD, K, dan KAO. Artinya, keempat metode tersebut mengidentifikasi pencilan secara tepat pada proporsi pencilan %, %, dan %. Akan tetapi, Klasik mencatat Kesalahan I sebesar.7% pada proporsi pencilan 1%. Artinya, Klasik mengidentifikasi pencilan sebagai data bukan pencilan sebanyak 1 pencilan dari 1 pencilan yang dikontaminasikan. Selain itu KAO juga memiliki Kesalahan I sebesar.7%. bukan pencilan sebagai pencilan sebanyak 14 pencilan dari data bukan pencilan. Sedangkan pada K terdapat Kesalahan II yang relatif tinggi yaitu sebesar 18%. Artinya, K mengidentifikasi data bukan pencilan sebagai pencilan sebanyak 18 pencilan dari data bukan pencilan. KAO memiliki Kesalahan II sebesar 3%, lebih kecil bila dibandingkan dengan ketiga metode lainnya. Artinya, KAO mengidentifikasi data bukan pencilan sebagai pencilan sebanyak 3 pencilan dari data bukan pencilan. Gambar Persentase Kesalahan II pada n 2 = Gambar 4 Persentase Kesalahan I pada n 2 = Pada Tabel 3 terlihat bahwa keempat metode yaitu Klasik, KMCD,K, dan KAO memiliki persentasi Kesalahan II yang beragam sama seperti pada data n 1 =. Pada proporsi pencilan %, Klasik memiliki Kesalahan II sebesar 8%. Artinya, Klasik mengidentifikasi data bukan pencilan sebagai pencilan sebanyak 8 pencilan dari data bukan pencilan. Pada KMCD terdapat Kesalahan II sebesar 14.%. Artinya, KMCD mengidentifikasi data Kesalahan II pada data dengan proporsi pencilan % tidak jauh berbeda dengan data yang memiliki proporsi pencilan %. Pada Klasik, KMCD, K, dan KAO memiliki Kesalahan II masingmasing sebesar 4.21%,.3%, 1.79%, dan 2.11%. Ketika proporsi pencilan ditambahkan menjadi % dan 1%, KAO tidak mencatat Kesalahan II. Artinya, KAO mengidentifikasi secara tepat data bukan pencilan. Begitu pula pada Klasik yang tidak mencatat Kesalahan II ketika proporsi pencilan meningkat menjadi 1%. Pada proporsi pencilan %, Klasik memiliki Kesalahan II sebesar 7.78%. Pada

17 9 Gambar Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan % pada (a) Klasik, (b) KMCD, (c) K, (d) KAO KMCD terdapat kesalahan sebesar %. Sedangkan pada K terdapat Kesalahan II yaitu sebesar 1.%. Pada proporsi pencilan 1%, KMCD dan K memiliki Kesalahan II masing-masing sebesar 3.3% dan 8.24%. Secara keseluruhan K memiliki Kesalahan Total terbesar yaitu sebesar 7.8% diikuti KMCD dan Klasik yang memiliki Kesalahan Total masing-masing sebesar 38.% dan 2.%. Sedangkan, KAO memiliki Kesalahan Total paling kecil yaitu sebesar 11.77%. Hasil tersebut tidak berbeda jauh dengan hasil pada n 1 =. Persentase Kesalahan Total pada n 1 = dan n 2 = menunjukkan bahwa KAO memiliki kesalahan yang paling kecil dalam mengidentifikasi pencilan. Kesalahan I dan Kesalahan II pada data n 2 = dapat dilihat lebih rinci pada Lampiran. Peta pencilan Peta pencilan merupakan peta yang memplotkan jarak ortogonal dengan jarak skor. Peta ini membedakan pencilan menjadi tiga jenis yaitu amatan berpengaruh baik, pencilan ortogonal, dan amatan berpengaruh buruk. Gambar menunjukkan peta pencilan pada saat proporsi pencilan % pada n 1 =, p= dengan k=2 dimensi. Gambar (a) merupakan peta pencilan untuk Klasik. Peta tersebut menggambarkan 13 amatan berpengaruh baik, pencilan ortogonal sebanyak 12 pencilan, dan 3 amatan berpengaruh buruk. Peta pencilan KMCD pada Gambar (b) memplotkan jarak ortogonal dengan urutan pengamatannya dan hanya menggambarkan pencilan secara keseluruhan. Peta tersebut menggambarkan sebanyak 7 pencilan. Gambar (c) merupakan peta pencilan K. Peta ini menggambarkan 33 amatan berpengaruh baik, pencilan ortogonal sebanyak 3 pencilan, dan 1 amatan berpengaruh buruk. Peta pencilan KAO pada Gambar (d) menggambarkan 4 amatan berpengaruh baik, pencilan ortogonal sebanyak 12 pencilan, dan 1 amatan berpengaruh buruk. Peta pencilan dengan proporsi pencilan %, %, dan 1% terlampir pada Lampiran 7, 8, dan 9. Gambar 7 merupakan peta pencilan pada saat proporsi pencilan % pada n 2 =, p= dengan k=2 dimensi. Peta pencilan Klasik pada Gambar 7(a) menggambarkan 4 amatan berpengaruh baik, pencilan ortogonal sebanyak 3 pencilan, dan 2 amatan berpengaruh buruk. Gambar 7(b) merupakan peta pencilan KMCD. Peta tersebut menggambarkan sebanyak 1 pencilan. Gambar 7(c) merupakan peta pencilan K yang menggambarkan amatan berpengaruh baik, pencilan ortogonal sebanyak 9 pencilan, dan amatan berpengaruh buruk. Peta pencilan KAO pada Gambar 7(d)

18 Gambar 7 Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan % pada (a) Klasik, (b) KMCD, (c) K, (d) KAO menggambarkan 3 amatan berpengaruh baik, pencilan ortogonal sebanyak 2 pencilan, dan 2 amatan berpengaruh buruk. Peta pencilan dengan proporsi pencilan %, %, dan 1% terlampir pada Lampiran, 11, dan 12. Secara keseluruhan peta pencilan Klasik, KMCD, dan K pada n 1 = dan n 2 = hampir sama karena pada peta pencilan ketiga metode tersebut terlalu banyak menggambarkan pengamatan biasa sebagai pencilan dan sebaliknya. Sedangkan pada peta pencilan KAO, pencilan yang Komponen Klasik Akar Ciri Klasik tanpa pencilan KAO digambarkan cukup sesuai dengan proporsi pencilan yang dikontaminasikan. Penerapan Klasik dan KAO Klasik dan K merupakan analisis yang digunakan untuk data simetrik. Oleh karena itu data peubah asal harus memiliki sebaran yang simetrik. Jika datanya tidak simetrik maka akan banyak titik data yang sebenarnya bukan pencilan dianggap sebagai pencilan dan sebaliknya. Pada penelitian ini dilakukan penerapan Tabel 4 Ringkasan hasil komponen utama pada Klasik, Klasik tanpa pencilan, dan KAO Klasik Proporsi Kumulatif Klasik tanpa pencilan KAO

19 11 p= yang dikontaminasi pencilan sebesar %. Klasik pada data menjulur dengan n=, Kemudian analisis tersebut juga diterapkan pada data ketika pencilan yang teridentifikasi dihilangkan. Pencilan yang dihilangkan adalah pencilan yang teridentifikasi yaitu sebanyak 38 pencilan (lihat Lampiran 4). Selain itu dilakukan juga penerapan analisis komponen utama kekar untuk data menjulur (KAO) pada n=, p= yang dikontaminasi pencilan sebesar %. Tabel 4 menunjukkan ringkasan hasil analisis komponen utama pada Klasik, Klasik tanpa pencilan, dan KAO. Hal yang dibandingkan yaitu akar ciri dan proporsi kumulatif komponen utama pertama. Klasik menghasilkan akar ciri pertama sebesar dan mampu menerangkan keragaman data sebesar.488 atau 48.8%. Ketika pencilan yang teridentifikasi dihilangkan, Klasik menghasilkan akar ciri pertama yang nilainya lebih kecil yaitu sebesar 12.8 dan mampu menerangkan keragaman data sebesar.4 atau 4%. Proporsi kumulatif data yang diterangkan Klasik menurun ketika pencilan yang teridentifikasi dihilangkan. Hal tersebut terjadi karena data dengan pencilan memiliki keragaman lebih tinggi daripada data tanpa pencilan. Sedangkan KAO menghasilkan akar ciri pertama sebesar 27. dan proporsi kumulatif data yang diterangkannya yaitu sebesar,27 atau 2.7%. Nilai akar ciri pertama komponen utama pada KAO mampu menerangkan keragaman data yang lebih besar bila dibandingkan dengan nilai akar ciri pertama komponen utama pada Klasik dan Klasik tanpa pencilan. Menurut Johnson (27) salah satu kriteria penentuan banyaknya jumlah komponen utama yang digunakan adalah dengan mengambil sejumlah komponen utama yang mampu menjelaskan 8% total keragaman dari data. Peubah yang digunakan pada penelitian ini sebanyak buah. Pada Klasik diperlukan sebanyak komponen utama. Pada Klasik tanpa pencilan diperlukan sebanyak komponen utama. Sedangkan pada KAO hanya diperlukan sebanyak 4 komponen utama. KESIMPULAN DAN SARAN Kesimpulan Analisis komponen utama kekar untuk data menjulur (KAO) menunjukkan hasil yang lebih baik dalam mengidentifikasi pencilan pada data menjulur daripada Klasik, K, dan KMCD. KAO mengidentifikasi pencilan secara tepat dan konsisten dibandingkan dengan ketiga metode lainnya yang menganggap titik data pencilan sebagai pencilan (Kesalahan I) dan titik data bukan pencilan sebagai pencilan (Kesalahan II). Klasik, KMCD, dan K didesain untuk data simetrik sehingga kurang tepat jika digunakan pada data menjulur. KAO mampu mengatasi pengaruh kehadiran pencilan pada data menjulur dengan n 1 = maupun data dengan n 2 = karena memiliki Kesalahan Total paling kecil. Hal tersebut diperkuat dengan adanya peta pencilan yang memberikan gambaran secara visual dalam pendeteksian pencilan. Saran Penetapan α yang digunakan untuk setiap metode perlu ditetapkan secara tepat agar terdapat keseimbangan antara kekekaran dan efisiensi dalam komputasi karena semakin kecil α semakin kekar K tetapi semakin tidak akurat. DAFTAR PUSTAKA Brys G, Hubert M, Struyf A. 24. A Robust Measure of Skewness. Journal of Computational and Graphical Statistics. 13: Draper NR, Smith H Analisis Regresi Terapan Edisi Kedua. Sumantri B. penerjemah. Jakarta: Gramedia Pustaka Utama. Terjemahan dari: Applied Regression Analysis. Hubert M, Rousseeuw PJ, Vanden-Branden K. 2. : A New Approach to Robust Principal Component Analysis. Technometrics. 47: Hubert M, Rousseeuw PJ, Verdonck T. 29. Robust PCA for Skewed Data and Its Outlier Map. Computational Statistics & Data Analysis. 3: Hubert M, Van der Veeken S. 28. Outlier Detection for Skewed Data. Journal of Chemometrics. 22: Johnson RA, Wichern DW. 27. Applied Multivariate Statistical Analysis. Ed ke-. New Jersey : Prentice Hall. Inc. Jolliffe IT. 22. Principal Component Analysis. Ed ke-2. New York: Springer- Verlag. Inc. Montgomery DC, Peck EA Introduction to Linear Regression

20 12 Analysis. Ed ke-2. New York: John Wiley & Sons. Inc. Prause K The generalized hiperbolic model: estimation, financial derivatives, and risk measures [disertasi]. Freiburg: Albert-Ludwigs Universitat Rousseeuw PJ. Driessen KV A Fast Algorithm for the Minimum Covariance Determinant Estimator. Technometrics. 41:

21 LAMPIRAN

22 Lampiran 1 Skema algoritma penelitian Bangkitkan data menjulur X~NIG(,.8,1,) sebanyak n 1 = dan n 2 = Ulangi sebanyak kali dengan parameter yang sama sehingga diperoleh peubah X berukuran dan yaitu X 1, X 2,..., X Tentukan nilai korelasi awal pada peubah X 1, X 2,..., X sehingga kesepuluh peubah tersebut saling berkorelasi Cek kemenjuluran dari dua set data dengan melihat nilai medcouple dari masing-masing peubah TIDAK YA Terdapat empat set data menjulur berukuran dan empat set data menjulur berukuran yang sudah dikontaminasi Melakukan pengekstriman pada pengamatan yang memiliki nilai AO i terbesar sesuai dengan proporsi pencilan yang diinginkan yaitu %, %, %, dan 1% Hitung nilai adjusted outlyingness (AO). Jika AO i cut off yang ditentukan maka pengamatan tersebut dikatakan sebagai pencilan Peubah X 1, X 2,..., X membentuk matriks berdimensi dan Lakukan identifikasi pencilan dengan menggunakan metode Klasik, KMCD, K, dan KAO Metode Klasik, KMCD, K, dan KAO menghasilkan peta pencilan Persiapkan data menjulur dengan proporsi pencilan % untuk n=, p= Persiapkan data menjulur dengan proporsi pencilan % untuk n=, p= tapi pencilan yang teridentifikasi dihilangkan Bandingkan hasilnya Bandingkan hasilnya Lakukan metode Klasik dan KAO Lakukan metode Klasik 14

23 1 Lampiran 2 Rumus adjusted outlyingness (AO) AO i =max v B x i ' v-med(x j ' v) c 2 -med x j ' v I[x i ' v>med x j ' v ]+(med x j ' v -c 1 v I[x i ' v<med x j ' v ] dimana: c 1 : pengamatan terkecil yang lebih besar dari Q 1-1.e -4MC IQR c 2 : pengamatan terbesar yang lebih kecil dari Q 3 +1.e 3MC IQR Q 1 : kuartil pertama Q 3 : kuartil ketiga IQR : jangkauan antar kuartil MC : medcouple Lampiran 3 Histogram data hasil pembangkitan Nilai 1 Nilai Frekuensi (a) Histogram data n 1 =, p= (b) Histogram data n 2 =, p= Lampiran 4 Nilai korelasi antar peubah pada n 1 = dan p= Frekuensi X1 X2 X3 X4 X X X7 X8 X9 X X1 r 1. nilai-p. X2 r.8 1. nilai-p.. X3 r nilai-p... X4 r nilai-p.... X r nilai-p..... X r nilai-p X7 r nilai-p X8 r nilai-p X9 r nilai-p X r nilai-p

24 Lampiran Nilai korelasi antar peubah pada n 2 = dan p= X1 X2 X3 X4 X X X7 X8 X9 X X1 r 1. nilai-p. X2 r nilai-p.. X3 r nilai-p... X4 r nilai-p..2.. X r nilai-p X r nilai-p..148*.2*... X7 r nilai-p X8 r nilai-p X9 r nilai-p....19*..187*... X r nilai-p Keterangan. *Korelasi tidak signifikan pada taraf nyata. 1

25 17 Lampiran Kesalahan identifikasi pencilan pada data menjulur n 1 =, p=, dan k=2 Proporsi pencilan % % % 1% Metode Klasik KMCD Data Hasil Deteksi Bukan Pencilan Pencilan Total Kesalahan I Kesalahan II Pencilan Bukan Pencilan % 8.2% Pencilan Bukan Pencilan 4 44.% 9.2% K Pencilan Bukan Pencilan 7 42.% 1.% KAO Klasik KMCD Pencilan Bukan Pencilan %.% Pencilan 2 2 Bukan Pencilan % 2.74% Pencilan 2 2 Bukan Pencilan %.74% K Pencilan 2 2 Bukan Pencilan % 12.3% KAO Klasik KMCD Pencilan %.% Bukan Pencilan Pencilan.%.% Bukan Pencilan 4 4 Pencilan Bukan Pencilan %.% K Pencilan Bukan Pencilan 4 4.% 11.11% KAO Klasik KMCD Pencilan Bukan Pencilan %.44% Pencilan 7 7.%.% Bukan Pencilan Pencilan 7 7 Bukan Pencilan % 3.29% K Pencilan 7 7 Bukan Pencilan % 8.47% KAO Pencilan %.% Bukan Pencilan 42 42

26 18 Lampiran 7 Kesalahan identifikasi pencilan pada data menjulur n 2 =, p=, dan k=2 Proporsi pencilan % % % 1% Metode Klasik KMCD Data Hasil Deteksi Bukan Pencilan Pencilan Total Kesalahan I Kesalahan II Pencilan Bukan Pencilan 8 92.% 8.% Pencilan Bukan Pencilan 14 8.% 14.% K Pencilan Bukan Pencilan % 18.% KAO Klasik KMCD Pencilan Bukan Pencilan 3 97.% 3.% Pencilan Bukan Pencilan % 4.21% Pencilan Bukan Pencilan 8 9.%.3% K Pencilan Bukan Pencilan % 1.79% KAO Klasik KMCD Pencilan Bukan Pencilan % 2.11% Pencilan Bukan Pencilan % 7.78% Pencilan Bukan Pencilan %.% K Pencilan Bukan Pencilan % 1.% KAO Klasik Pencilan Bukan Pencilan 9 9.%.% Pencilan %.% Bukan Pencilan 8 8 Pencilan 1 1 KMCD Bukan Pencilan % 3.3% K Pencilan 1 1 KAO Bukan Pencilan % 8.24% Pencilan %.% Bukan Pencilan 8 8

27 Orthogonal distance Orthogonal distance Orthogonal distance Orthogonal distance (2 LV) 19 Lampiran 8 Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO CPCA (a) Index (b) (c) (d)

28 Orthogonal distance Orthogonal distance Orthogonal distance Orthogonal distance (2 LV) 2 Lampiran 9 Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO CPCA (a) Index (b) (c) (d)

29 Orthogonal distance Orthogonal distance Orthogonal distance Orthogonal distance (2 LV) 21 Lampiran Peta pencilan data menjulur n 1 =, p= dan k=2 dengan proporsi pencilan 1% (a) Klasik, (b) KMCD, (c) K, (d) KAO CPCA Index (a) (b) (c) (d)

30 Orthogonal distance Orthogonal distance Orthogonal distance Orthogonal distance (2 LV) 22 Lampiran 11 Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO CPCA Index (a) (b) (c) (d)

31 Orthogonal distance Orthogonal distance Orthogonal distance Orthogonal distance (2 LV) 23 Lampiran 12 Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan % (a) Klasik, (b) KMCD, (c) K, (d) KAO CPCA (a) Index (b) (c) 1 2 (d)

32 Orthogonal distance Orthogonal distance Orthogonal distance Orthogonal distance (2 LV) 24 Lampiran 13 Peta pencilan data menjulur n 2 =, p= dan k=2 dengan proporsi pencilan 1% (a) Klasik, (b) KMCD, (c) K, (d) KAO CPCA Index (a) (b) (c) 1 2 (d)

(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN

(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN 4 karena adanya perbedaan satuan pengukuran antar peubah. 1.. Memastikan tidak adanya pencilan pada data dengan mengidentifikasi adanya pencilan pada data. Pengidentifikasian pencilan dilakukan dengan

Lebih terperinci

MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO

MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2011 RINGKASAN MAGRI HANDOKO. Manajemen

Lebih terperinci

METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE

METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2010 RINGKASAN

Lebih terperinci

Forum Statistika dan Komputasi, Oktober 2009 p : ISSN :

Forum Statistika dan Komputasi, Oktober 2009 p : ISSN : , Oktober 2009 p : 26-34 ISSN : 0853-8115 Vol 14 No.2 METODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) (Variance-Covariance Matrix Estimation Method for Principal Component

Lebih terperinci

HASIL DAN PEMBAHASAN. dengan hipotesis nolnya adalah antar peubah saling bebas. Statistik ujinya dihitung dengan persamaan berikut:

HASIL DAN PEMBAHASAN. dengan hipotesis nolnya adalah antar peubah saling bebas. Statistik ujinya dihitung dengan persamaan berikut: . Menyiapkan gugus data pencilan dengan membangkitkan peubah acak normal ganda dengan parameter µ yang diekstrimkan dari data contoh dan dengan matriks ragam-peragam yang sama dengan data contoh. Proses

Lebih terperinci

TINJAUAN PUSTAKA. Gambar 1 Diagram kotak garis

TINJAUAN PUSTAKA. Gambar 1 Diagram kotak garis TINJAUAN PUSTAKA Diagram Kotak Garis Metode diagram kotak garis atau boxplot merupakan salah satu teknik untuk memberikan gambaran tentang lokasi pemusatan data, rentangan penyebaran dan kemiringan pola

Lebih terperinci

BAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA. Analisis komponen utama adalah metode statistika multivariat yang

BAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA. Analisis komponen utama adalah metode statistika multivariat yang BAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA Analisis komponen utama adalah metode statistika multivariat yang bertujuan untuk mereduksi dimensi data dengan membentuk kombinasi linear

Lebih terperinci

PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA

PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 1-5 ISSN: 2303-1751 PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA NI WAYAN

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Principal Component Analysis (PCA)merupakan salah satu teknik pereduksian dimensi data. Data yang direduksi saling berkorelasi satu sama lain.pca muncul sebagai solusi

Lebih terperinci

PEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA

PEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA PEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 RINGKASAN TENDI

Lebih terperinci

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA Ni Putu Iin Vinny Dayanti 1, Ni Luh Putu Suciptawati 2, Made

Lebih terperinci

KAJIAN TERHADAP TINGKAT PEMERATAAN PENDIDIKAN MENGGUNAKAN ANALISIS BIPLOT KLASIK DAN BIPLOT KEKAR

KAJIAN TERHADAP TINGKAT PEMERATAAN PENDIDIKAN MENGGUNAKAN ANALISIS BIPLOT KLASIK DAN BIPLOT KEKAR E-Jurnal Matematika Vol. 4 (2), Mei 2015, pp. 37-42 ISSN: 2303-1751 KAJIAN TERHADAP TINGKAT PEMERATAAN PENDIDIKAN MENGGUNAKAN ANALISIS BIPLOT KLASIK DAN BIPLOT KEKAR Ni Luh Ardila Kusumayanti 1, I Komang

Lebih terperinci

FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS)

FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS) FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS) Yuditia Ari Prabowo, Yuliana Susanti, dan Santoso Budi Wiyono

Lebih terperinci

, dengan. Karakteristik dari vektor peubah acak X dan Y sebagai berikut:

, dengan. Karakteristik dari vektor peubah acak X dan Y sebagai berikut: 3 TINJAUAN PUSTAKA Analisis Korelasi Kanonik Analisis korelasi kanonik (AKK) yang diperkenalkan oleh Hotelling pada tahun 1936, bertujuan untuk mengidentifikasi dan menghitung hubungan linier antara dua

Lebih terperinci

JURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN :

JURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN : PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA Tatik Widiharih Jurusan Matematika FMIPA UNDIP Abstrak Multikolinearitas yang tinggi diantara peubah-peubah bebas,

Lebih terperinci

IDENTIFIKASI DAN PENANGANAN PENGARUH PENCILAN PADA ANALISIS KOMPONEN UTAMA WIDYA NINGSIH

IDENTIFIKASI DAN PENANGANAN PENGARUH PENCILAN PADA ANALISIS KOMPONEN UTAMA WIDYA NINGSIH IDENTIFIKASI DAN PENANGANAN PENGARUH PENCILAN PADA ANALISIS KOMPONEN UTAMA WIDYA NINGSIH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 21 ABSTRAK WIDYA

Lebih terperinci

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier

BAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier BAB II TINJAUAN PUSTAKA 2.1 Analisis Regresi Linier Berganda Analisis regresi pertama kali dikembangkan oleh Sir Francis Galton pada abad ke-19. Analisis regresi dengan satu peubah prediktor dan satu peubah

Lebih terperinci

S 10 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis)

S 10 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis) PROSIDING ISBN : 978 979 6353 6 3 S 0 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis) Wirayanti ), Adi Setiawan ), Bambang Susanto

Lebih terperinci

KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD)

KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD) KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD) Budyanra Jurusan Statistika, Sekolah Tinggi Ilmu Statistik, Jakarta

Lebih terperinci

Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas

Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas Vol. 14, No. 1, 93-99, Juli 2017 Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas Nurhasanah Abstrak Regresi berganda dengan peubah bebas saling berkorelasi (multikolinearitas)

Lebih terperinci

PENDUGA PENCILAN BOGOR 2013

PENDUGA PENCILAN BOGOR 2013 PERBANDINGAN PENDUGA MINIMUM COVARIANCE DETERMINANT (MCD) DENGAN MAXIMUMM LIKELIHOOD ESTIMATION (MLE) PADA ANALISIS DISKRIMINANN UNTUK DATA YANG MENGANDUNGG PENCILAN TRI HARDI PUTRA DEPARTEMEN STATISTIK

Lebih terperinci

METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER

METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 03, No. 3 (2014), hal 163-168. METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER

Lebih terperinci

BAB I PENDAHULUAN. Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini

BAB I PENDAHULUAN. Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini BAB I PENDAHULUAN 1.1 Latar belakang Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini bertujuan agar mendekati kebenaran kesimpulan yang diperoleh dari nilai taksiran sementara (hipotesis).

Lebih terperinci

PENDETEKSIAN OUTLIER PADA CAPITAL ASSET PRICING MODEL (CAPM) MENGGUNAKAN LEAST TRIMMED SQUARES (LTS) Elis Ratna Wulan 1, Enung Nurhayati 2

PENDETEKSIAN OUTLIER PADA CAPITAL ASSET PRICING MODEL (CAPM) MENGGUNAKAN LEAST TRIMMED SQUARES (LTS) Elis Ratna Wulan 1, Enung Nurhayati 2 Edisi Juli 014 Volume VIII No. 1 ISSN 1979-8911 PENDETEKSIAN OUTLIER PADA CAPITAL ASSET PRICING MODEL (CAPM) MENGGUNAKAN LEAST TRIMMED SQUARES (LTS) Elis Ratna Wulan 1, Enung Nurhayati 1, Jurusan Matematika,

Lebih terperinci

HETEROSKEDASTISITAS DALAM ANALISIS REGRESI LINIER SKRIPSI. Oleh: YOGIE DANA INSANI NIM

HETEROSKEDASTISITAS DALAM ANALISIS REGRESI LINIER SKRIPSI. Oleh: YOGIE DANA INSANI NIM HETEROSKEDASTISITAS DALAM ANALISIS REGRESI LINIER SKRIPSI Diajukan Untuk Memenuhi Persyaratan Penyelesaian Program Sarjana Sains Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas

Lebih terperinci

KAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN

KAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN KAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN Nurul Gusriani 1), Firdaniza 2), Novi Octavianti 3) 1,2,3) Departemen Matematika FMIPA Universitas Padjadjaran, Jalan Raya Bandung- Sumedang Km. 21

Lebih terperinci

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA Ni Luh Putu Ratna Kumalasari 1, Ni Luh Putu Suciptawati 2,, Made Susilawati

Lebih terperinci

PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA. Tatik Widiharih Jurusan Matematika FMIPA UNDIP

PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA. Tatik Widiharih Jurusan Matematika FMIPA UNDIP PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA Tatik Widiharih Jurusan Matematika FMIPA UNDIP Abstrak Multikolinearitas yang tinggi diantara peubah-peubah bebas,

Lebih terperinci

ANALISIS KOMPONEN UTAMA DENGAN MENGGUNAKAN MATRIK VARIAN KOVARIAN YANG ROBUST

ANALISIS KOMPONEN UTAMA DENGAN MENGGUNAKAN MATRIK VARIAN KOVARIAN YANG ROBUST ANALISIS KOMPONEN UTAMA DENGAN MENGGUNAKAN MATRIK VARIAN KOVARIAN YANG ROBUST Irwan Sujatmiko, Susanti Linuwih, dan Dwi Atmono A.W. Jurusan Statistika ITS Kampus ITS Sukolilo Surabaya 6 Abstract. The present

Lebih terperinci

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di: ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman 295-304 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PERBANDINGAN DISKRIMINAN KUADRATIK KLASIK DAN DISKRIMINAN KUADRATIK

Lebih terperinci

TINJAUAN PUSTAKA. Model Regresi Linier Ganda

TINJAUAN PUSTAKA. Model Regresi Linier Ganda TINJAUAN PUSTAKA Model Regresi Linier Ganda Hubungan antara y dan X dalam model regresi linier umum adalah y = X ß + e () dengan y merupakan vektor pengamatan pada peubah respon (peubah tak bebas) berukuran

Lebih terperinci

ANALISIS DISKRIMINAN KUADRATIK KEKAR (Studi Kasus : Divisi Regional Perum BULOG Tahun 2009) MAYA WULAN ARINI

ANALISIS DISKRIMINAN KUADRATIK KEKAR (Studi Kasus : Divisi Regional Perum BULOG Tahun 2009) MAYA WULAN ARINI ANALISIS DISKRIMINAN KUADRATIK KEKAR (Studi Kasus : Divisi Regional Perum BULOG Tahun 2009) MAYA WULAN ARINI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

PERTEMUAN 2 STATISTIKA DASAR MAT 130

PERTEMUAN 2 STATISTIKA DASAR MAT 130 PERTEMUAN 2 STATISTIKA DASAR MAT 130 Data 1. Besaran Statistika berbicara tentang data dalam bentuk besaran (dimensi) Besaran adalah sesuatu yang dapat dipaparkan secara jelas dan pada prinsipnya dapat

Lebih terperinci

1. PENDAHULUAN PADA PRODUKSI JAGUNG DI JAWA TENGAH

1. PENDAHULUAN PADA PRODUKSI JAGUNG DI JAWA TENGAH MODEL REGRESI ROBUST ESTIMASI DENGAN PEMBOBOT FAIR PADA PRODUKSI JAGUNG DI JAWA TENGAH Oktaviana Wulandari, Yuliana Susanti, dan Sri Sulistijowati Handajani Program Studi Matematika FMIPA UNS ABSTRAK.

Lebih terperinci

TINJAUAN PUSTAKA Spesifikasi Model Berbagai model dalam pemodelan persamaan struktural telah dikembangkan oleh banyak peneliti diantaranya Bollen

TINJAUAN PUSTAKA Spesifikasi Model Berbagai model dalam pemodelan persamaan struktural telah dikembangkan oleh banyak peneliti diantaranya Bollen 4 TINJAUAN PUSTAKA Spesifikasi Model Berbagai model dalam pemodelan persamaan struktural telah dikembangkan oleh banyak peneliti diantaranya Bollen (1989). Namun demikian sebagian besar penerapannya menggunakan

Lebih terperinci

ANALISIS REGRESI ROBUST PADA DATA MENGANDUNG PENCILAN DENGAN METODE LEAST MEDIAN SQUARE

ANALISIS REGRESI ROBUST PADA DATA MENGANDUNG PENCILAN DENGAN METODE LEAST MEDIAN SQUARE ANALISIS REGRESI ROBUST PADA DATA MENGANDUNG PENCILAN DENGAN METODE LEAST MEDIAN SQUARE SKRIPSI Oleh Hufron Haditama NIM 051810101096 JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS

Lebih terperinci

ESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER

ESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER ESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER Siswanto 1, Raupong 2, Annisa 3 ABSTRAK Dalam statistik, melakukan suatu percobaan adalah salah satu cara untuk mendapatkan

Lebih terperinci

viii METODE REGRESI LEAST TRIMMED SQUARES PADA DATA YANG MENGANDUNG PENCILAN ANNI FITHRIYATUL MAS UDAH

viii METODE REGRESI LEAST TRIMMED SQUARES PADA DATA YANG MENGANDUNG PENCILAN ANNI FITHRIYATUL MAS UDAH viii METODE REGRESI LEAST TRIMMED SQUARES PADA DATA YANG MENGANDUNG PENCILAN ANNI FITHRIYATUL MAS UDAH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

Semakin besar persentase CCR yang dihasilkan, maka tingkat akurasi yang dihasilkan semakin tinggi (Hair et. al., 1995).

Semakin besar persentase CCR yang dihasilkan, maka tingkat akurasi yang dihasilkan semakin tinggi (Hair et. al., 1995). 3 fungsi diskriminan cukup untuk memisahkan k buah kelompok. Karena fungsi-fungsi diskriminan tidak saling berkorelasi, maka komponen aditif dari V masing-masing didekati dengan khi-kuadrat dengan V j

Lebih terperinci

PENERAPAN METODE REGRESI GULUD DAN REGRESI KOMPONEN UTAMA DALAM MENGATASI PENYIMPANGAN MULTIKOLINEARITAS PADA ANALISIS REGRESI LINEAR BERGANDA

PENERAPAN METODE REGRESI GULUD DAN REGRESI KOMPONEN UTAMA DALAM MENGATASI PENYIMPANGAN MULTIKOLINEARITAS PADA ANALISIS REGRESI LINEAR BERGANDA PENERAPAN METODE REGRESI GULUD DAN REGRESI KOMPONEN UTAMA DALAM MENGATASI PENYIMPANGAN MULTIKOLINEARITAS PADA ANALISIS REGRESI LINEAR BERGANDA Sri Siska Wirdaniyati 1), Edy Widodo ) 1) Mahasiswa Prodi

Lebih terperinci

PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA

PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 6-10 ISSN: 2303-1751 PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA I PUTU EKA IRAWAN 1, I KOMANG

Lebih terperinci

BAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN

BAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN BAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN 3.1 Deteksi Pencilan Multivariat Pengidentifikasian pencilan pada kasus multivariat tidaklah mudah untuk dilakukan,

Lebih terperinci

KAJIAN PENGARUH NOISE DALAM ANALISIS KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH YANG BERKORELASI FAJRIANZA ADI NUGRAHANTO

KAJIAN PENGARUH NOISE DALAM ANALISIS KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH YANG BERKORELASI FAJRIANZA ADI NUGRAHANTO KAJIAN PENGARUH NOISE DALAM ANALISIS KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH YANG BERKORELASI FAJRIANZA ADI NUGRAHANTO DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Reduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan Analisis Komponen Utama

Reduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan Analisis Komponen Utama Reduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan Analisis Komponen Utama Ferry Kondo Lembang Jurusan Matematika FMIPA UNPATTI ferrykondolembang@yahoo.co.id Abstrak Reduksi dimensi adalah bagian

Lebih terperinci

Analisis Komponen Utama (Principal component analysis)

Analisis Komponen Utama (Principal component analysis) Analisis Komponen Utama (Principal component analysis) A. LANDASAN TEORI Misalkan χ merupakan matriks berukuran nxp, dengan baris-baris yang berisi observasi sebanyak n dari p-variat variabel acak X. Analisis

Lebih terperinci

METODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) YANI SURYANI

METODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) YANI SURYANI METODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) YANI SURYANI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009 RINGKASAN

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Pada bab ini akan diuraikan mengenai landasan teori yang akan digunakan dalam bab selanjutnya. 2.1 Matriks Sebuah matriks, biasanya dinotasikan dengan huruf kapital tebal seperti A,

Lebih terperinci

PERBANDINGAN METODE COEFFICIENT OF DETERMINATION RATIO DAN REGRESI DIAGNOSTIK DALAM MENDETEKSI OUTLIER PADA ANALISIS REGRESI LINIER BERGANDA

PERBANDINGAN METODE COEFFICIENT OF DETERMINATION RATIO DAN REGRESI DIAGNOSTIK DALAM MENDETEKSI OUTLIER PADA ANALISIS REGRESI LINIER BERGANDA Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 04, No. 3 (2015), hal 153 158. PERBANDINGAN METODE COEFFICIENT OF DETERMINATION RATIO DAN REGRESI DIAGNOSTIK DALAM MENDETEKSI OUTLIER PADA ANALISIS

Lebih terperinci

Didin Astriani P, Oki Dwipurwani, Dian Cahyawati (Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sriwijaya)

Didin Astriani P, Oki Dwipurwani, Dian Cahyawati (Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sriwijaya) (M.2) ANALISIS BIPLOT UNTUK MENGETAHUI KARAKTERISTIK PUTUS SEKOLAH PENDIDIKAN DASAR PADA MASYARAKAT MISKIN ANTAR WILAYAH KECAMATAN DI KABUPATEN OGAN ILIR Didin Astriani P, Oki Dwipurwani, Dian Cahyawati

Lebih terperinci

PERBANDINGAN METODE MKT, LTS, WIN, DAN THEIL PADA PENDUGAAN PARAMETER REGRESI APABILA GALATNYA MENYEBAR EKSPONENSIAL HELGA ARINA PRAMUDITYA

PERBANDINGAN METODE MKT, LTS, WIN, DAN THEIL PADA PENDUGAAN PARAMETER REGRESI APABILA GALATNYA MENYEBAR EKSPONENSIAL HELGA ARINA PRAMUDITYA PERBANDINGAN METODE MKT, LTS, WIN, DAN THEIL PADA PENDUGAAN PARAMETER REGRESI APABILA GALATNYA MENYEBAR EKSPONENSIAL HELGA ARINA PRAMUDITYA STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

PERBANDINGAN ANALISIS BIPLOT KLASIK DAN ROBUST BIPLOT PADA PEMETAAN PERGURUAN TINGGI SWASTA DI JAWA TIMUR

PERBANDINGAN ANALISIS BIPLOT KLASIK DAN ROBUST BIPLOT PADA PEMETAAN PERGURUAN TINGGI SWASTA DI JAWA TIMUR Jur. Ris. & Apl. Mat. I (207), no., xx-xx Jurnal Riset dan Aplikasi Matematika e-issn: 258-054 URL: journal.unesa.ac.id/index.php/jram PERBANDINGAN ANALISIS BIPLOT KLASIK DAN ROBUST BIPLOT PADA PEMETAAN

Lebih terperinci

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan

BAB I PENDAHULUAN. Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Analisis regresi merupakan sebuah alat statistik yang memberi penjelasan tentang pola hubungan (model) antara dua peubah atau lebih (Draper dan Smith, 1992).

Lebih terperinci

BAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal

BAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal BAB III ANALISIS FAKTOR 3.1 Definisi Analisis faktor Analisis faktor adalah suatu teknik analisis statistika multivariat yang berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal

Lebih terperinci

Penggunaan Kernel PCA Gaussian dalam Penyelesaian Plot Multivariat Non Linier. The Use of Gaussian PCA Kernel in Solving Non Linier Multivariate Plot

Penggunaan Kernel PCA Gaussian dalam Penyelesaian Plot Multivariat Non Linier. The Use of Gaussian PCA Kernel in Solving Non Linier Multivariate Plot Penggunaan Kernel PCA Gaussian dalam Penyelesaian Plot Multivariat Non Linier Bernhard M. Wongkar 1, John S. Kekenusa 2, Hanny A.H. Komalig 3 1 Program Studi Matematika, FMIPA, UNSRAT Manado, bernhard.wongkar2011@gmail.com

Lebih terperinci

EFISIENSI ESTIMASI SCALE (S) TERHADAP ESTIMASI LEAST TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH

EFISIENSI ESTIMASI SCALE (S) TERHADAP ESTIMASI LEAST TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH EFISIENSI ESTIMASI SCALE (S) TERHADAP ESTIMASI LEAST TRIMMED SQUARES (LTS) PADA PRODUKSI PADI DI PROVINSI JAWA TENGAH May Cristanti, Yuliana Susanti, dan Sugiyanto Program Studi Matematika FMIPA UNS ABSTRAK.

Lebih terperinci

STUDI KOMPARATIF METODE KUADRAT TERKECIL DENGAN METODE REGRESI ROBUST PEMBOBOT WELSCH PADA DATA YANG MENGANDUNG PENCILAN

STUDI KOMPARATIF METODE KUADRAT TERKECIL DENGAN METODE REGRESI ROBUST PEMBOBOT WELSCH PADA DATA YANG MENGANDUNG PENCILAN Jurnal Matematika UNAND Vol. 2 No. 4 Hal. 18 26 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND STUDI KOMPARATIF METODE KUADRAT TERKECIL DENGAN METODE REGRESI ROBUST PEMBOBOT WELSCH PADA DATA YANG MENGANDUNG

Lebih terperinci

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN KELOMPOK BAHAN MAKANAN DI JAWA TENGAH PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST UNTUK DATA INFLASI KELOMPOK BAHAN MAKANAN DI JAWA TENGAH SKRIPSI Oleh: ERNA PUSPITASARI NIM :24010210130059 JURUSAN STATISTIKA FAKULTAS SAINS

Lebih terperinci

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah

BAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah BAB I PENDAHULUAN 1.1 Latar Belakang Analisis regresi linier berganda merupakan analisis yang digunakan untuk menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah respon Y yang

Lebih terperinci

PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN

PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN E-Jurnal Matematika Vol. 3, No.2 Mei 2014, 45-52 ISSN: 2303-1751 PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN NI PUTU NIA IRFAGUTAMI 1, I GUSTI

Lebih terperinci

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,

BAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi, BAB II LANDASAN TEORI Beberapa teori yang diperlukan untuk mendukung pembahasan diantaranya adalah regresi linear berganda, pengujian asumsi analisis regresi, metode kuadrat terkecil (MKT), outlier, regresi

Lebih terperinci

PENGENDALIAN PROSES VARIABILITAS MULTIVARIAT MELALUI VEKTOR RAGAM (STUDI KASUS : IPK DAN LAMA STUDI LULUSAN MATEMATIKA UNIVERSITAS ANDALAS)

PENGENDALIAN PROSES VARIABILITAS MULTIVARIAT MELALUI VEKTOR RAGAM (STUDI KASUS : IPK DAN LAMA STUDI LULUSAN MATEMATIKA UNIVERSITAS ANDALAS) Jurnal Matematika UNAND Vol. 3 No. 4 Hal. 104 111 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PENGENDALIAN PROSES VARIABILITAS MULTIVARIAT MELALUI VEKTOR RAGAM (STUDI KASUS : IPK DAN LAMA STUDI LULUSAN

Lebih terperinci

pendekatan dalam penelitian ini dinilai cukup beralasan.

pendekatan dalam penelitian ini dinilai cukup beralasan. Tabel Hasil pendugaan model pengaruh tetap dengan Y sebagai peubah respon dan X, X dan X sebagai C -. 00 X -5 0.50 X.05 00 X 00 R 0.6 Adjusted R 0.6 Hasil pendugaan model data panel dengan Y sebagai peubah

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Aljabar Matriks 2.1.1 Definisi Matriks Matriks adalah suatu kumpulan angka-angka yang juga sering disebut elemen-elemen yang disusun secara teratur menurut baris dan kolom sehingga

Lebih terperinci

PERBANDINGAN KINERJA DIAGRAM KONTROL MULTIVARIAT UNTUK VARIABILITAS BERDASARKAN MATRIKS KOVARIANSI DAN MATRIKS KORELASI. Abstrak

PERBANDINGAN KINERJA DIAGRAM KONTROL MULTIVARIAT UNTUK VARIABILITAS BERDASARKAN MATRIKS KOVARIANSI DAN MATRIKS KORELASI. Abstrak PERBANDINGAN KINERJA DIAGRAM KONTROL MULTIVARIAT UNTUK VARIABILITAS BERDASARKAN MATRIKS KOVARIANSI DAN MATRIKS KORELASI Dwi Yuli Rakhmawati, Muhammad Mashuri 2,2) Institut Teknologi Sepuluh Nopember dwiyuli_rakhmawati@yahoo.com,

Lebih terperinci

BAB. IX ANALISIS REGRESI FAKTOR (REGRESSION FACTOR ANALYSIS)

BAB. IX ANALISIS REGRESI FAKTOR (REGRESSION FACTOR ANALYSIS) BAB. IX ANALII REGREI FAKTOR (REGREION FACTOR ANALYI) 9. PENDAHULUAN Analisis regresi faktor pada dasarnya merupakan teknik analisis yang mengkombinasikan analisis faktor dengan analisis regresi linier

Lebih terperinci

(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN

(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN (R.14) MEODE MINIMUM COVARIANCE DEERMINAN PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN Dini Aderlina, Firdaniza, Nurul Gusriani Jurusan Matematika FMIPA Universitas Padjadjaran Jl. Raya

Lebih terperinci

Minggu XI ANALISIS KOMPONEN UTAMA. Utami, H

Minggu XI ANALISIS KOMPONEN UTAMA. Utami, H Minggu XI ANALISIS KOMPONEN UTAMA Utami, H Outline 1 Pendahuluan 2 Tujuan 3 Analisis Komponen Utama 4 Contoh Utami, H Minggu XIANALISIS KOMPONEN UTAMA 2 / 16 Outline 1 Pendahuluan 2 Tujuan 3 Analisis Komponen

Lebih terperinci

TINJAUAN PUSTAKA. Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan

TINJAUAN PUSTAKA. Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan 4 II. TINJAUAN PUSTAKA 2.1 Konsep Dasar Matriks 2.1.1 Matriks Matriks adalah suatu susunan bilangan berbentuk segi empat. Bilangan-bilangan dalam susunan itu disebut anggota dalam matriks tersebut. Suatu

Lebih terperinci

Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil

Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil Ronny Susetyoko, Elly Purwantini Politeknik Elektronika Negeri Surabaya

Lebih terperinci

Klasifikasi Kecamatan Berdasarkan Nilai Akhir SMA/MA di Kabupaten Aceh Selatan Menggunakan Analisis Diskriminan

Klasifikasi Kecamatan Berdasarkan Nilai Akhir SMA/MA di Kabupaten Aceh Selatan Menggunakan Analisis Diskriminan Statistika, Vol. 15 No. 2, 87-97 November 215 Klasifikasi Kecamatan Berdasarkan Nilai Akhir SMA/MA di Kabupaten Aceh Selatan Menggunakan Analisis Diskriminan Fitriana A.R. 1, Nurhasanah 2, Ririn Raudhatul

Lebih terperinci

PENERAPAN ANALISIS KOMPONEN UTAMA DALAM PENENTUAN FAKTOR DOMINAN YANG MEMPENGARUHI PRESTASI BELAJAR SISWA (Studi Kasus : SMAN 1 MEDAN)

PENERAPAN ANALISIS KOMPONEN UTAMA DALAM PENENTUAN FAKTOR DOMINAN YANG MEMPENGARUHI PRESTASI BELAJAR SISWA (Studi Kasus : SMAN 1 MEDAN) Saintia Matematika Vol. 1, No. 6 (2013), pp. 507 516. PENERAPAN ANALISIS KOMPONEN UTAMA DALAM PENENTUAN FAKTOR DOMINAN YANG MEMPENGARUHI PRESTASI BELAJAR SISWA (Studi Kasus : SMAN 1 MEDAN) Juliarti Hardika,

Lebih terperinci

PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA

PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR

Lebih terperinci

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan

TINJAUAN PUSTAKA. Analisis regresi adalah suatu metode analisis data yang menggambarkan II. TINJAUAN PUSTAKA 2.1 Analisis Regresi Analisis regresi adalah suatu metode analisis data yang menggambarkan hubungan fungsional antara variabel respon dengan satu atau beberapa variabel prediktor.

Lebih terperinci

MODEL-MODEL LEBIH RUMIT

MODEL-MODEL LEBIH RUMIT MAKALAH MODEL-MODEL LEBIH RUMIT DISUSUN OLEH : SRI SISKA WIRDANIYATI 65 JURUSAN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS ISLAM INDONESIA 04 BAB I PENDAHULUAN. Latar Belakang

Lebih terperinci

PENERAPAN METODE GENERALIZED RIDGE REGRESSION DALAM MENGATASI MASALAH MULTIKOLINEARITAS

PENERAPAN METODE GENERALIZED RIDGE REGRESSION DALAM MENGATASI MASALAH MULTIKOLINEARITAS e-jurnal Matematika Vol. 2, No. 1, Januari 2013, 54-59 PENERAPAN METODE GENERALIZED RIDGE REGRESSION DALAM MENGATASI MASALAH MULTIKOLINEARITAS NI KETUT TRI UTAMI 1, I KOMANG GDE SUKARSA 2, I PUTU EKA NILA

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Analisis regresi merupakan suatu metode yang digunakan untuk mengetahui hubungan satu arah antara variabel prediktor dan variabel respon yang umumnya dinyatakan

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Analisis Regresi adalah analisis statistik yang mempelajari bagaimana memodelkan sebuah model fungsional dari data untuk dapat menjelaskan ataupun meramalkan suatu

Lebih terperinci

ANALISIS KORELASI KANONIK ANTARA CURAH HUJAN GCM DAN CURAH HUJAN DI INDRAMAYU. Oleh : Heru Novriyadi G

ANALISIS KORELASI KANONIK ANTARA CURAH HUJAN GCM DAN CURAH HUJAN DI INDRAMAYU. Oleh : Heru Novriyadi G ANALISIS KORELASI KANONIK ANTARA CURAH HUJAN GCM DAN CURAH HUJAN DI INDRAMAYU Oleh : Heru Novriyadi G4004 PROGRAM STUDI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI. Oleh : SITI NURBAITI G

KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI. Oleh : SITI NURBAITI G KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI Oleh : SITI NURBAITI G14102022 DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007 ABSTRAK SITI

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan Dalam industri modern ekspektasi pelanggan menjadi suatu acuan pentimg dari kualitas produk. Oleh karena itu dalam proses produksi tidak hanya mementingkan

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN Konsentrasi lemak ikan (%) Kandungan zat aktif (absorban) HASIL DAN PEMBAHASAN Deskripsi Data Berdasarkan data yang digunakan dalam penelitian ini, akan dilakukan pengidentifikasian multikolinieritas.

Lebih terperinci

BAB III MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST. Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis

BAB III MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST. Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis BAB III MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis komponen utama robust sebagai konsep pendukung serta metode Minimum

Lebih terperinci

HASIL DAN PEMBAHASAN

HASIL DAN PEMBAHASAN HASIL DAN PEMBAHASAN Implementasi Biplot Kanonik dan Analisis Procrustes dengan Mathematica Biplot biasa dengan sistem perintah telah terintegrasi ke dalam beberapa program paket statistika seperti SAS,

Lebih terperinci

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST UNTUK DATA INFLASI KELOMPOK BAHAN MAKANAN DI JAWA TENGAH

PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST UNTUK DATA INFLASI KELOMPOK BAHAN MAKANAN DI JAWA TENGAH ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 3, Tahun 2014, Halaman 343-352 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST

Lebih terperinci

METODE PENELITIAN Sumber Data

METODE PENELITIAN Sumber Data 13 METODE PENELITIAN Sumber Data Data yang digunakan dalam penelitian ini merupakan hasil simulasi melalui pembangkitan dari komputer. Untuk membangkitkan data, digunakan desain model persamaan struktural

Lebih terperinci

HASIL DAN PEMBAHASAN. Algoritma Cepat Penduga GS

HASIL DAN PEMBAHASAN. Algoritma Cepat Penduga GS HASIL DAN PEMBAHASAN Algoritma Cepat Penduga GS Sebagaimana halnya dengan algoritma cepat penduga S, algoritma cepat penduga GS dikembangkan dengan mengkombinasikan algoritma resampling dan algoritma I-step.

Lebih terperinci

Analisis Peubah Ganda

Analisis Peubah Ganda Analisis Peubah Ganda Analisis Komponen Utama Dr. Ir. I Made Sumertajaya, M.Si Pengamatan Peubah Ganda - memerlukan sumberdaya lebih, dalam analisis - informasi tumpang tindih pada beberapa peubah Apa

Lebih terperinci

III. METODE PENELITIAN. topik penelitian secara keseluruhan. Dalam kaitannya dengan hal ini, metode

III. METODE PENELITIAN. topik penelitian secara keseluruhan. Dalam kaitannya dengan hal ini, metode III. METODE PENELITIAN Metode penelitian merupakan pendekatan umum untuk membangun topik penelitian secara keseluruhan. Dalam kaitannya dengan hal ini, metode penelitian merupakan sistem atas peraturan-peraturan

Lebih terperinci

PEMAKAIAN VARIABEL INDIKATOR DALAM PEMODELAN. Mike Susmikanti *

PEMAKAIAN VARIABEL INDIKATOR DALAM PEMODELAN. Mike Susmikanti * PEMAKAIAN VARIABEL INDIKATOR DALAM PEMODELAN Mike Susmikanti * ABSTRAK PEMAKAIAN VARIABEL INDIKATOR DALAM PEMODELAN. Pemodelan dalam penelitian berbagai bidang khususnya bidang industri, merupakan kebutuhan

Lebih terperinci

Karakteristik Pendugaan Emperical Best Linear Unbiased Prediction (EBLUP) Pada Pendugaan Area Kecil

Karakteristik Pendugaan Emperical Best Linear Unbiased Prediction (EBLUP) Pada Pendugaan Area Kecil Prosiding Semirata FMIPA Universitas Lampung, 2013 Karakteristik Pendugaan Emperical Best Linear Unbiased M. Adi Sidauruk, Dian Kurniasari, Widiarti Jurusan Matematika, FMIPA Universitas Lampung E-mail:

Lebih terperinci

MENGATASI MASALAH MULTIKOLINEARITAS DAN OUTLIER DENGAN PENDEKATAN ROBPCA (STUDI KASUS ANALISIS REGRESI ANGKA KEMATIAN BAYI DI JAWA TIMUR)

MENGATASI MASALAH MULTIKOLINEARITAS DAN OUTLIER DENGAN PENDEKATAN ROBPCA (STUDI KASUS ANALISIS REGRESI ANGKA KEMATIAN BAYI DI JAWA TIMUR) MENGATASI MASALAH MULTIKOLINEARITAS DAN OUTLIER DENGAN PENDEKATAN ROBPCA (STUDI KASUS ANALISIS REGRESI ANGKA KEMATIAN BAYI DI JAWA TIMUR) Sony Sunaryo (sonny_s@statistika.its.ac.id) Setiawan Jurusan Statistika,

Lebih terperinci

PENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI

PENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI PENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Universitas Negeri Malang

Universitas Negeri Malang 1 Penerapan Metode Regresi New Stepwise untuk Mengetahui Faktor- Faktor yang Mempengaruhi Kekuatan Metallic Box (Studi Kasus di PT. PINDAD (Persero) Turen) Universitas Negeri Malang E-mail: Nisahidayatul@gmail.com

Lebih terperinci

REGRESI ROBUST UNTUK MENGATASI OUTLIER PADA REGRESI LINIER BERGANDA. Isma Hasanah

REGRESI ROBUST UNTUK MENGATASI OUTLIER PADA REGRESI LINIER BERGANDA. Isma Hasanah REGRESI ROBUST UNTUK MENGATASI OUTLIER PADA REGRESI LINIER BERGANDA Isma Hasanah isma_semangat@yahoo.co.id Agustini Tripena, Br. Sb Universitas Jenderal Soedirman ABSTRACT. Regression analysis is statistic

Lebih terperinci

PENERAPAN MODEL REGRESI LINIER BAYESIAN UNTUK MENGESTIMASI PARAMETER DAN INTERVAL KREDIBEL

PENERAPAN MODEL REGRESI LINIER BAYESIAN UNTUK MENGESTIMASI PARAMETER DAN INTERVAL KREDIBEL PENERAPAN MODEL REGRESI LINIER BAYESIAN UNTUK MENGESTIMASI PARAMETER DAN INTERVAL KREDIBEL Vania Mutiarani 1, Adi Setiawan, Hanna Arini Parhusip 3 1 Mahasiswa Program Studi Matematika FSM UKSW, 3 Dosen

Lebih terperinci

PERBANDINGAN TRANSFORMASI BOX-COX DAN REGRESI KUANTIL MEDIAN DALAM MENGATASI HETEROSKEDASTISITAS

PERBANDINGAN TRANSFORMASI BOX-COX DAN REGRESI KUANTIL MEDIAN DALAM MENGATASI HETEROSKEDASTISITAS E-Jurnal Matematika Vol. 4 (1), Januari 2015, pp. 8-13 ISSN: 2303-1751 PERBANDINGAN TRANSFORMASI BOX-COX DAN REGRESI KUANTIL MEDIAN DALAM MENGATASI HETEROSKEDASTISITAS Ni Wayan Yuni Cahyani 1, I Gusti

Lebih terperinci

Kata Kunci: Bagan kendali Multivariat np, karakteristik kecacatan, tahap start-up stage, tahap pengendalian proses

Kata Kunci: Bagan kendali Multivariat np, karakteristik kecacatan, tahap start-up stage, tahap pengendalian proses Jurnal Matematika UNAND Vol. VI No. 1 Hal. 161 167 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PENGONTROLAN KUALITAS PRODUK MENGGUNAKAN METODE BAGAN KENDALI MULTIVARIAT NP DALAM USAHA PENINGKATAN

Lebih terperinci

g(x, y) = F 1 { f (u, v) F (u, v) k} dimana F 1 (F (u, v)) diselesaikan dengan: f (x, y) = 1 MN M + vy )} M 1 N 1

g(x, y) = F 1 { f (u, v) F (u, v) k} dimana F 1 (F (u, v)) diselesaikan dengan: f (x, y) = 1 MN M + vy )} M 1 N 1 Fast Fourier Transform (FFT) Dalam rangka meningkatkan blok yang lebih spesifik menggunakan frekuensi dominan, akan dikalikan FFT dari blok jarak, dimana jarak asal adalah: FFT = abs (F (u, v)) = F (u,

Lebih terperinci

PENGGEROMBOLAN DUA TAHAP DESA-DESA DI JAWA TENGAH ALIFTA DIAH AYU RETNANI

PENGGEROMBOLAN DUA TAHAP DESA-DESA DI JAWA TENGAH ALIFTA DIAH AYU RETNANI PENGGEROMBOLAN DUA TAHAP DESA-DESA DI JAWA TENGAH ALIFTA DIAH AYU RETNANI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012 RINGKASAN ALIFTA DIAH AYU RETNANI.

Lebih terperinci

METODE PARTIAL LEAST SQUARES UNTUK MENGATASI MULTIKOLINEARITAS PADA MODEL REGRESI LINEAR BERGANDA

METODE PARTIAL LEAST SQUARES UNTUK MENGATASI MULTIKOLINEARITAS PADA MODEL REGRESI LINEAR BERGANDA Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 03, No. 3 (2014), hal 169 174. METODE PARTIAL LEAST SQUARES UNTUK MENGATASI MULTIKOLINEARITAS PADA MODEL REGRESI LINEAR BERGANDA Romika Indahwati,

Lebih terperinci