IDENTIFIKASI DAN PENANGANAN PENGARUH PENCILAN PADA ANALISIS KOMPONEN UTAMA WIDYA NINGSIH
|
|
- Yuliana Makmur
- 6 tahun lalu
- Tontonan:
Transkripsi
1 IDENTIFIKASI DAN PENANGANAN PENGARUH PENCILAN PADA ANALISIS KOMPONEN UTAMA WIDYA NINGSIH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 21
2 ABSTRAK WIDYA NINGSIH. Identifikasi dan Penanganan Pengaruh Pencilan pada Analisis Komponen Utama. Dibimbing oleh I MADE SUMERTAJAYA dan UTAMI DYAH SYAFITRI. Analisis komponen utama (AKU) merupakan salah satu alat kunci dalam analisis statistika peubah ganda. Analisis tersebut bertujuan membentuk beberapa komponen yang masing-masing mengandung keragaman maksimal dari data yang tidak dijelaskan oleh komponen lain. Metode klasik komponen utama sangat dipengaruhi oleh kehadiran pencilan karena AKU didasarkan pada matriks kovarian yang sensitif terhadap pencilan. Pengaruh keberadaan pencilan mampu diakomodasi dengan menggunakan metode AKU yang kekar terhadap data pencilan. Metode yang dipakai adalah Robust Principle Component Analysis (ROBPCA) atau Analisis Komponen Utama Kekar (AKU-K). AKU-K menggabungkan konsep projection pursuit dan penduga kovarian Minimum Covariance Deteminant (MCD). Penelitian ini bertujuan untuk membandingkan hasil analisis komponen utama metode klasik (AKU) dengan metode kekar (AKU-K), baik pada saat data mengandung pencilan maupun tidak. Proses pembandingan dilakukan menggunakan data simulasi. Hasil simulasi menunjukkan bahwa analisis komponen utama metode AKU-K lebih baik daripada AKU klasik. Pada metode klasik, pengaruh pencilan ditunjukkan oleh akar ciri komponen utama pertama meningkat seiring dengan peningkatan proporsi pencilan sehingga proporsi keragaman kumulatif data yang mampu dijelaskan komponen utama pertama semakin besar. Vektor ciri komponen utama pertama pun didominasi oleh peubah dengan keragaman besar. Sedangkan metode AKU-K mampu mengatasi pengaruh kehadiran pencilan pada data. Akar ciri komponen utama pertama tidak terpengaruh besarnya pencilan sehingga proporsi keragaman kumulatif data yang mampu dijelaskan komponen pertama cenderung stabil. Vektor ciri komponen pertama metode AKU-K memberikan interpretasi yang sama dengan AKU saat tidak ada pencilan. Kata kunci: analisis komponen utama, pencilan, metode kekar, projection pursuit, MCD
3 IDENTIFIKASI DAN PENANGANAN PENGARUH PENCILAN PADA ANALISIS KOMPONEN UTAMA WIDYA NINGSIH Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 21
4 Judul Skripsi Nama NRP : Identifikasi dan Penanganan Pengaruh Pencilan pada Analisis Komponen Utama : Widya Ningsih : G Menyetujui : Pembimbing I, Pembimbing II, Dr. Ir. I Made Sumertajaya, M.Si Utami Dyah Syafitri, S.Si, M.Si NIP NIP Mengetahui : Ketua Departemen, Dr. Ir. Hari Wijayanto, MS NIP Tanggal Lulus :
5 KATA PENGANTAR Puji dan syukur penulis panjatkan kepada Allah SWT atas segala karunia-nya sehingga karya ilmiah ini berhasil diselesaikan. Sholawat dan salam terpanjat kepada Nabi Muhammad S.A.W yang telah menunjukkan cahaya kebenaran. Karya ilmiah ini berjudul Identifikasi dan Penanganan Pengaruh Pencilan pada Analisis Komponen Utama. Semoga karya ilmiah ini dapat memperkaya pengetahuan pada bidang Statistika. Terimakasih penulis ucapkan kepada: 1. Bapak Dr. Ir. I Made Sumertajaya, M.Si dan Ibu Utami Dyah Syafitri, S.Si, M.Si selaku pembimbing, yang dengan sabar memberikan bimbingan, pengarahan, saran dan ilmu kepada penulis. 2. Bapak Dr. Ir. Aji Hamim Wigena, M.Sc selaku penguji luar yang telah memberi arahan dan saran kepada penulis. 3. Ibu, Bapak, kakak-kakak Wiwit Nurlestari dan Widya Ningrum, serta adik Weny Puspitasari. Terimakasih selalu menguatkan dan mendukung penulis sehingga terselesainya karya ilmiah ini. 4. Nur Andi Setiabudi, terimakasih atas waktu, bantuan, dan dukungan yang selalu diberikan kepada penulis. 5. Yani Suryani, terimakasih atas ide-ide dan diskusi yang membuka wawasan penulis. Nurhidayah, Isna Husniyati, Lola Netty, Megawati, Firdaus Hamdani, Fadli Hakim, Marina Febriyanti, Dian Mustika, terimakasih atas bantuan, saran dan semangat selama penyelesaian karya ilmiah ini. 6. Teman-teman STK42, keluarga besar Statistics Centre, keluarga besar KSR PMI Unit I IPB. Terimakasih telah membagi banyak ilmu, pengalaman, semangat, dan kepercayaan. 7. Pakde Ir. Sudarjo dan Bude Siti Nurhadi Sulistyo atas dukungan finansialnya kepada penulis untuk tetap kuliah. Semoga karya ilmiah ini bermanfaat. Bogor, Februari 21 Widya Ningsih
6 RIWAYAT HIDUP Penulis dilahirkan di Tegal pada tanggal 14 Juni 1987 dari pasangan Bapak Sriwitono dan Ibu Siti Nurhadi Setyowati. Penulis merupakan putri ketiga dari empat bersaudara. Tahun 25 penulis lulus dari SMA Negeri 1 Tegal dan pada tahun yang sama lulus seleksi masuk IPB melalui jalur Undangan Seleksi Masuk IPB. Penulis memilih mayor Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam. Selama mengikuti perkuliahan, penulis menjadi asisten mata kuliah Fisika pada tahun ajaran 25/26, mata kuliah Metode Statistika pada semester ganjil tahun ajaran 27/28 dan tahun ajaran 28/29, serta Metode Penarikan Contoh pada semester genap tahun ajaran 28/29. Pada tahun 28 penulis memenangi kompetisi nasional Statistika Ria sebagai juara III. Penulis mengikuti praktek lapang di PT. Mars Indonesia pada bulan Februari-April 29. Selain itu, penulis aktif menjadi anggota Korps Sukarela PMI Unit I IPB (KSR PMI Unit I IPB), Ikatan Mahasiswa Tegal (IMT), Himpunan Profesi Gamma Sigma Beta (GSB), dan Serambi Ruhiyah Mahasiswa FMIPA (SERUM-G). Penulis menerima beasiswa Bantuan Belajar Mahasiswa periode Juli-Desember 26, SPP++ periode Januari-Juni 27, dan Peningkatan Prestasi Akademik.
7 DAFTAR ISI Halaman DAFTAR TABEL... vii DAFTAR GAMBAR... vii DAFTAR LAMPIRAN... vii PENDAHULUAN Latar Belakang... 1 Tujuan... 1 TINJAUAN PUSTAKA Analisis Komponen Utama (AKU)... 1 Pencilan... 1 Analisis Komponen Utama Kekar (AKU-K)... 2 Analisis Komponen Utama dengan Projection Pursuit... 2 Minimum Covariance Determinant (MCD)... 2 BAHAN DAN METODE Bahan... 3 Metode... 3 HASIL DAN PEMBAHASAN Karakteristik Data... 4 Analisis Komponen Utama... 5 Analisis Komponen Utama Kekar... 6 Perbandingan AKU dengan AKU-K... 6 KESIMPULAN DAN SARAN Kesimpulan... 8 Saran... 8 DAFTAR PUSTAKA... 8 LAMPIRAN... 1 vi
8 DAFTAR TABEL Halaman 1. Deskripsi Tiap Peubah Indikator Pencemaran Udara Ringkasan Hasil Analisis Komponen Utama pada Berbagai Proporsi Pencilan Ringkasan Hasil Metode AKU-K pada Berbagai Proporsi Pencilan Keragaman Tiap Peubah pada Berbagai Proporsi Pencilan Koefisien Kombinasi Linear Dua Komponen Utama Pertama pada Data Contoh... 7 DAFTAR GAMBAR Halaman 1. Plot Quantil Chi-Square Data Indikator Pencemaran Udara Proporsi Kumulatif Dua Komponen Utama Pertama Akar Ciri Komponen Utama Pertama... 7 DAFTAR LAMPIRAN Halaman 1. Skema Algoritma AKU-K Script Pembangkitan Data dengan Software Matlab (R26a) Nilai Korelasi Antar Peubah Indikator Pencemaran Udara Jarak Mahalanobis Data Contoh Identifikasi Jumlah Pencilan pada Data Koefisien Kombinasi Linear Komponen Utama Pertama dan Kedua pada Berbagai Proporsi Pencilan Metode Analisis Komponen Utama Klasik (AKU) Koefisien Kombinasi Linear Komponen Utama Pertama dan Kedua pada Berbagai Proporsi Pencilan Metode Analisis Komponen Utama Kekar (AKU-K) vii
9 1 PENDAHULUAN Latar Belakang Analisis komponen utama (AKU) merupakan salah satu teknik pereduksian dimensi data. Data yang direduksi saling berkorelasi satu sama lain. Pembahasan mengenai teknik ini banyak ditemukan pada analisis peubah ganda karena AKU sering digunakan sebagai analisis antara untuk analisis lainnya, seperti analisis regresi, analisis gerombol, dan sebagainya. AKU menjadi populer karena tiga hal, yaitu AKU memiliki kombinasi linear dengan mean square error optimal dalam meringkas serangkaian vektor berdimensi tinggi menjadi rangkaian vektor berdimensi rendah dan kemudian membentuknya kembali. Kedua, parameter model dapat dihitung secara langsung dari data. Ketiga, peringkasan dan penghilangan mudah dioperasikan untuk menunjukkan parameter model (Chen 22). Meskipun memiliki beberapa keunggulan, model AKU memiliki beberapa kelemahan. Fokus utama pada penelitian ini adalah bahwa algoritma AKU masih didasarkan pada asumsi bahwa data tidak mengandung pencilan (Chen 22). AKU klasik akan sangat dipengaruhi oleh kehadiran pencilan karena AKU dibentuk berdasarkan pada matriks kovarian yang juga sangat sensitif terhadap keberadaan data pencilan (Hubert et al. 25). Kelemahan AKU terhadap kehadiran pencilan menyebabkan perkembangan AKU selanjutnya dipengaruhi oleh kebutuhan akan metode AKU yang kekar (robust) terhadap pencilan. Beragam metode dikembangkan untuk membentuk AKU tersebut. Robust Principle Component Analysis atau Analisis Komponen Utama Kekar (AKU-K) merupakan salah satu metode yang dikembangkan oleh Hubert et al. pada tahun 24. AKU-K menggabungkan konsep Projection Pursuit yang dikenalkan oleh Li dan Chen (1985) dengan penduga kovarian yang kekar, yaitu Minimum Covariance Determinant (MCD). Metode inilah yang diterapkan pada penelitian ini. Tujuan Penelitian ini bertujuan untuk membandingkan hasil analisis komponen utama metode klasik (AKU) dengan metode kekar (AKU-K), baik pada saat data mengandung pencilan maupun tidak. Perbandingan dikhususkan pada struktur komponen utama pertama. TINJAUAN PUSTAKA Analisis Komponen Utama (AKU) Analisis komponen utama adalah metode analisis peubah ganda yang bertujuan memperkecil dimensi peubah asal sehingga diperoleh peubah baru (komponen utama) yang tidak saling berkorelasi, tetapi menyimpan sebagian besar informasi yang terkandung pada peubah asal (Jollife 22). Misalkan X 1, X 2,..., X p adalah peubah acak yang menyebar menurut sebaran tertentu dengan vektor nilai tengah µ dan matriks peragam Σ. Komponen utama merupakan kombinasi linier terboboti dari peubah-peubah asal yang mampu menerangkan data secara maksimum. Komponen utama ke-j dari p peubah dapat dinyatakan sebagai Y j = aij x1 + a2 j x a pj x p = a' x dan keragaman komponen utama ke-j adalah : Var ( Yj ) = λ j ; j = 1, 2,..., p λ 1, λ 2,..., λ p adalah akar ciri yang diperoleh dari persamaan Σ λi = dimana λ 1 λ 2... λ p. Vektor ciri a sebagai pembobot dari transformasi linear peubah asal diperoleh dari persamaan (Σ λ j I)a j = ; j = 1, 2,..., p Total keragaman komponen utama adalah λ 1 + λ λ p = tr(σ) dan persentase total keragaman data yang mampu diterangkan oleh λ komponen utama ke-j adalah j 1 %. tr( Σ) Korelasi antara peubah ke-i dengan komponen utama ke-j dinyatakan sebagai ai λ j rx y = dengan λ j adalah akar ciri i j si matriks peragam S (penduga Σ) dan s i adalah simpangan baku peubah ke-i. Pencilan Barnet dan Lewis (1994) mengindikasikan bahwa sebuah pengamatan yang terpencil, atau pencilan, adalah pengamatan yang terlihat menyimpang secara nyata dari anggota lain dimana contoh tersebut diambil. Pencilan merupakan pengamatan yang tidak mengikuti sebagian besar pola dan terletak jauh dari pusat data. Dengan cara yang sama, Johnson (1998) mendefinisikan pencilan sebagai suatu pengamatan pada rangkaian data yang terlihat tidak konsisten terhadap sisaan dari data tersebut., Pencilan menurut Hawkins (198), dalam Ben-Gal (25), merupakan suatu pengamatan yang menyimpang cukup jauh
10 2 dari pengamatan lainnya sehingga menimbulkan kecurigaan bahwa pengamatan tersebut berasal dari sebaran data yang berbeda. Identifikasi data pencilan pada data peubah ganda umumnya menggunakan jarak Mahalanobis. Pengamatan ke-i didefinisikan sebagai pencilan apabila jarak Mahalanobis kuadrat lebih besar dari nilai chi-square pada p peubah (Johnson 1998). Penggunaan jarak Mahalanobis untuk mengidentifikasi pencilan peubah ganda tidak maksimal jika data mengandung lebih dari satu pengamatan pencilan. Hal ini muncul akibat adanya pengaruh masking dan swamping (Barnett & Lewis 1994). Masking terjadi pada saat pengamatan pencilan tidak terdeteksi sebagai pencilan karena adanya pencilan lain yang berdekatan. Swamping terjadi saat pengamatan bukan pencilan teridentifikasi sebagai pengamatan pencilan. Analisis Komponen Utama Kekar (AKU-K) Hubert et al. (25) mengembangkan metode Robust Principle Component Analysis (ROBPCA) atau Analisis Komponen Utama Kekar (AKU-K) dengan menggabungkan konsep projection-pursuit (PP) dengan penduga kovarian yang kekar, yaitu MCD (Minimum Covariance Deteminant). PP digunakan untuk mereduksi dimensi awal. Kemudian, penduga MCD digunakan pada ruang data berdimensi lebih rendah tersebut. Algoritma AKU-K secara garis besar terdiri dari empat tahap sebagai berikut: 1. Memilih ½ < α < 1 untuk mendapatkan nilai h = max{αn,[(n + p + 1)/2]}. 2. Menghitung keterpencilan (outlyingness) setiap data x i dengan rumus Stahel-Donoho sebagai berikut: t t a x i µ ˆ MCD ( a X) O( x i ) = maxp t a R SMCD ( a X) µˆ dan S MCD MCD adalah penduga nilai tengah dan simpangan baku MCD. h pengamatan dengan nilai keterpencilan terkecil dihitung vektor nilai tengah ( ˆµ ) 1 dan matriks kovariannya (S ). 3. Matriks kovarian S didekomposisi sehingga diperoleh komponen utamanya. Sebanyak k komponen utama pertama dipilih dan semua data diproyeksikan pada subruang berdimensi-k yang direntang oleh k vektor ciri pertama sehingga diperoleh X n,k. 4. Pada X n,k dari langkah 3, dihitung kembali penduga nilai tengah ( ˆµ ) dan matriks 2 kovarian MCD (S 1 ) menggunakan algoritma FAST-MCD yang diadaptasi. Komponen utama akhir adalah vektor ciri dari matriks kovarian tersebut (S 1 ). Algoritma AKU-K secara lengkap dapat dilihat pada Lampiran 1. Analisis Komponen Utama dengan Projection-Pursuit Metode projection-pursuit (PP) bertujuan untuk mendapatkan struktur pada data peubah ganda dengan memproyeksikannya pada subruang berdimensi lebih rendah (Huber 1985). PP tepat digunakan untuk menganalisis data dengan jumlah peubah yang besar. Subruang berdimensi rendah dipilih dengan memaksimumkan indeks proyeksi tertentu. AKU berdasarkan PP dikembangkan oleh Li dan Chen (1985) dan telah dikenalkan oleh Huber (1985). Seperti AKU klasik, metode ini mencari suatu arah dengan penyebaran maksimal data diproyeksikan di dalamnya. Pada metode AKU klasik, digunakan penduga ragam sebagai indeks proyeksi. Untuk menghasilkan komponen utama yang kekar, indeks proyeksi diganti dengan penduga kovarian yang kekar S n. Untuk barisan pengamatan x 1,..., x n R, vektor ciri ke-k didefinisikan sebagai t t a k = arg max S n ( a x1,..., a xn ) a = 1, a a1,..., a ak 1 dimana akar ciri ke-k didefinisikan sebagai 2 t t λ k = Sn( ak x1,..., ak xn). Skor komponen utama selanjutnya merupakan proyeksi dari pengamatan dalam vektor ciri. Penduga kovarians kekar dapat diambil dari dekomposisi spektral: C S n = p k = 1 λ a a t k k k Minimum Covariance Determinant MCD (Minimum Covariance Determinant) merupakan penduga yang sangat kekar untuk menduga parameter nilai tengah dan matriks kovarian (Rousseeuw & Driessen 1999). MCD bertujuan mendapatkan h pengamatan dari n objek yang memiliki determinan matriks kovarian terkecil, dimana h bilangan bulat terkecil dari (n + p + 1)/2. Oleh karena itu, terdapat nc h kombinasi yang harus ditemukan untuk mendapatkan penduga MCD. Untuk n kecil, penduga MCD cepat ditemukan. Namun, jika n besar, kombinasi subsampel yang harus ditemukan untuk mendapatkan penduga MCD menjadi sangat banyak. Keterbatasan tersebut menghantarkan pada penemuan algoritma FAST-MCD oleh
11 3 Rousseeuw dan Driessen (1999). Algoritma FAST-MCD secara garis besar adalah sebagai berikut: 1. Ditentukan h, dimana (n + p + 1)/2 h n atau h = (n + p + 1)/2 atau h =.75n. n merupakan banyaknya pengamatan. 2. Diambil sejumlah himpunan bagian dari data secara acak. Himpunan bagian tersebut berukuran (p + 1) dan diperbesar hingga mencapai h menggunakan C-step. 3. Dalam setiap h bagian yang terambil, dilakukan dua C-step. C-step melakukan perhitungan penduga nilai tengah ˆµ dan penduga matriks kovarians ˆΣ dari h pengamatan, kemudian menghitung jarak dari tiap titik sebagai: ˆ 1 d x ) = ( x ˆ µ )' Σ ( x ˆ µ ). ˆ ( ) ( ˆ µ, Σ i i i Himpunan h baru dibentuk dari h pengamatan dengan jarak terkecil. 4. Untuk 1 himpunan bagian h dengan determinan matriks kovarian terkecil, dilakukan C-step hingga konvergen dan himpunan bagian terakhir disimpan dalam H Penduga nilai tengah µˆ MCD dan matriks kovarians Σˆ diperoleh dari H MCD 1 dengan determinan matriks kovarian terkecil. 6. Selanjutnya, dilakukan tahap pembobotan. n n ˆ µ 1 = w i xi / wi i= 1 i= 1 n n ' S 1 = w i ( xi T1 )( xi T1 ) / wi 1 i= 1 i= 1 dimana )(i) 2 χ p,.975 1, jika d ( µˆ, Σˆ w i = MCD MCD, lainnya 7. Terakhir, komponen utama didefinisikan sebagai k vektor ciri dari S 1 yang bersesuaian dengan k akar ciri terbesar dari S 1. BAHAN DAN METODE Bahan Data yang digunakan untuk penelitian ini diperoleh dari contoh data dan data simulasi. Contoh data diperoleh dari Applied Multivariate Statistical Analysis (Johnson & Wichern 1998). Data tersebut merupakan data hasil 42 pengukuran peubah pencemaran udara yang dicatat pada pukul 12 siang di daerah Los Angeles pada hari yang berbeda. Ketujuh peubah yang dipakai sebagai indikator pencemaran udara sebagai berikut: X1= Kecepatan angin X2= Radiasi panas X3= CO X4= NO X5= NO 2 X6= O 3 X7= HC Sedangkan data simulasi merupakan hasil pembangkitan bilangan acak normal ganda dengan nilai korelasi tertentu. Metode Penelitian ini dilakukan dengan langkahlangkah sebagai berikut: 1. Menyiapkan data, yaitu data contoh dan data acak normal ganda dengan parameter berbeda dari data contoh, serta memberikan beberapa proporsi pencilan. Jumlah peubah yang dibangkitkan sebanyak tujuh buah, sedangkan jumlah pengamatan yang digunakan sebanyak 42 objek. Proporsi pencilan yang diberikan adalah % (tanpa pencilan), 1%, 5%, 1%, dan 15%. 2. Melakukan AKU untuk setiap data pada langkah Melakukan interpretasi hasil AKU yang diperoleh dari langkah Membandingkan hasil AKU antara data tanpa pencilan dengan data yang mengandung pencilan pada langkah 2. Struktur AKU yang dibandingkan adalah akar ciri komponen utama pertama, proporsi kumulatif komponen utama pertama, dan koefisien kombinasi linear komponen utama pertama. Perbandingan mencakup identifikasi proporsi pencilan yang mulai memberikan perbedaan struktur dan perbandingan keragaman yang dijelaskan komponen utama pertama. 5. Melakukan AKU-K untuk setiap data pada langkah 1 dengan nilai h disesuaikan dengan jumlah pencilan pada data. Misal, apabila proporsi pencilan sebesar 1%, maka h =.99n atau h = 41 untuk n = Melakukan interpretasi hasil AKU-K pada langkah Membandingkan hasil AKU-K antara data tanpa pencilan dengan data yang mengandung pencilan pada langkah Membandingkan hasil AKU dan AKU-K pada langkah 2 dan 5. Langkah-langkah dalam penyiapan data adalah sebagai berikut: 1. Penyiapan data contoh: 1.1. Mentransformasi setiap peubah menjadi peubah acak normal baku. Transformasi normal baku dilakukan
12 4 karena adanya perbedaan satuan pengukuran antar peubah Memastikan tidak adanya pencilan pada data dengan mengidentifikasi adanya pencilan pada data. Pengidentifikasian pencilan dilakukan dengan membandingkan jarak kuadrat Mahalanobis tiap pengamatan D 2 i untuk setiap pengamatan pada matriks data X 2 2 dengan χ p, 1 α (α =.1). Jika D i > 2 p, 1 α χ, maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 1). t 1 Di = ( x µ ) Σ ( x µ ) µ merupakan vektor nilai tengah X, sedangkan Σ matriks kovarian dari X berdimensi p p. 2. Penyiapan data simulasi: 2.1. Membangkitkan peubah acak normal ganda X dengan parameter berbeda dari data contoh atau X N (µ, Σ). Proses pembangkitkan peubah acak tersebut dilakukan dengan algoritma sebagai berikut: a. Membangkitkan Y N(, 1) sebanyak n atau 42 kali. b. Mengulangi langkah a sebanyak p atau 7 kali sehingga diperoleh 7 peubah acak Y berukuran 42 yaitu Y 1, Y 2,..., Y 7. c. Menentukan nilai µ dan Σ. µ merupakan vektor nilai tengah dan Σ merupakan matriks kovarian berdimensi p p. d. Mencari matriks A yang bersesuaian dengan Σ = AA. Penguraian matriks Σ untuk mendapatkan matriks A dilakukan dengan dekomposisi Cholesky. e. Membangkitkan X N (µ, Σ) dari masing-masing peubah acak Y pada b melalui transformasi x = µ + Ay sehingga diperoleh 7 peubah acak X berukuran 42 yang saling berkorelasi, yaitu X 1, X 2,..., X Peubah acak X 1, X 2,..., X 7 membentuk matriks data berdimensi 42 7 yaitu X yang akan dipakai sebagai data pencilan. 3. Penyiapan dataset: Membentuk matriks data yang akan dipakai dengan memberikan beberapa pencilan pada data contoh sebanyak εn dari data contoh. ε adalah proporsi pencilan yang diberikan, yaitu tanpa pencilan (%), 1%, 5%, 1%, dan 15%. Sedangkan n merupakan banyaknya pengamatan. 4. Melakukan identifikasi pencilan pada dataset yang telah dibentuk untuk memastikan proporsi pencilan yang dikandung masing-masing data. Pengolahan data dilakukan dengan software Matlab (R26a) dan Microsoft Excel 27. Script pembangkitan dan penyiapan data dapat dilihat pada Lampiran 2. Sedangkan AKU-K dilakukan menggunakan program Matlab pada situs dan HASIL DAN PEMBAHASAN Karakteristik Data Data contoh merupakan data pengamatan tujuh peubah pencemaran udara dengan rataan masing-masing peubah ditunjukkan pada Tabel 1. Besarnya korelasi antar peubah dapat dilihat pada Lampiran 3. Lampiran 3 menunjukkan bahwa terdapat korelasi yang signifikan antara peubah radiasi panas dan O 3 pada taraf 5%. Hubungan antara radiasi panas dan O 3 bernilai positif (.319) sehingga peningkatan radiasi panas menyebabkan peningkatan O 3, dan sebaliknya. CO memiliki korelasi positif yang signifikan pada taraf 5% terhadap NO, NO 2, dan O 3. Nilai korelasi antara CO dengan ketiga peubah tersebut masing-masing sebesar.52,.557, dan.411. Selain itu, terdapat pula hubungan yang signifikan antara NO 2 dan HC pada taraf 5% dengan korelasi sebesar.448. Korelasi antara peubah-peubah tersebut tidak besar, tetapi cukup kuat dibuktikan dengan nilai-p yang signifikan pada taraf.5. Tabel 1 Deskripsi Tiap Peubah Indikator Pencemaran Udara Peubah Rataan Standar Deviasi X X X X X X X Plot Quantil Chi-Square pada Gambar 1 menunjukkan pola yang mengikuti garis lurus atau linear sehingga data tersebut dapat dikatakan menyebar normal ganda. Karena
13 5 Tabel 2 Ringkasan Hasil Analisis Komponen Utama pada Berbagai Proporsi Pencilan Akar Ciri Proporsi Kumulatif Proporsi Pencilan Komponen % % % % % % % % % % Determinan Matriks Kovarian Proporsi Pencilan % 1% 5% 1% 15% Determinan data mendekati normal, proses identifikasi pencilan data contoh dapat dilakukan dengan jarak Mahalanobis. Dengan menggunakan 2 titik kritis χ 7,.1, suatu pengamatan disebut pencilan apabila jarak Mahalanobis terhadap nilai tengah melebihi nilai kritis tersebut. Lampiran 4 menunjukkan bahwa tidak ada pencilan pada data contoh. Hal tersebut dikarenakan semua pengamatan memiliki jarak Mahalanobis tidak melebihi d i 2 (i) χ 2 p((n-i+1/2)/n) Gambar 1 Plot Quantil Chi-Square Data Indikator Pencemaran Udara Data contoh yang digunakan merupakan data yang tidak mengandung pencilan. Oleh karena itu, diperlukan data pencilan untuk proses simulasi. Data pencilan dibangkitkan dengan vektor rataan berbeda dari data contoh, yaitu µ = [ 1 1 ]. Sedangkan besarnya korelasi antar peubah dibangkitkan menggunakan korelasi peubah data contoh. Selanjutnya, data dianalisis menggunakan AKU dan AKU-K. Proses awal sebelum dilakukan AKU dan AKU-K adalah pengidentifikasian jumlah pencilan pada masing-masing data pada proporsi pencilan berbeda. Lampiran 5 menunjukkan bahwa jarak Mahalanobis D i hanya mampu mengidentifikasi adanya pencilan pada data dengan proporsi pencilan 1%. Pada data pencilan 1%, proporsi pencilan yang teridentifikasi sama dengan persentase pencilan yang diberikan. Pada saat proporsi pencilan ditingkatkan, tidak ada pengamatan teridentifikasi sebagai pencilan. Hal ini dikarenakan pengaruh masking. Adanya pencilan telah merubah vektor nilai tengah dan matriks kovarian data sehingga mempengaruhi perhitungan jarak Mahalanobis. Analisis Komponen Utama Analisis komponen utama dilakukan pada data contoh setelah dilakukan transformasi masing-masing peubah ke normal baku karena adanya perbedaan satuan antar peubah. Hasil analisis komponen utama pada data contoh (pencilan %) menunjukkan bahwa dua komponen utama pertama hanya mampu menerangkan 53.18% keragaman data. Analisis komponen utama dengan menggunakan matriks kovarian sebagai dasar analisis menghasilkan akar ciri pertama sebesar dan mampu menerangkan keragaman data sebesar.3338 atau 33.38%. Komponen utama kedua memiliki nilai akar ciri sebesar dan menghasilkan proporsi keragaman kumulatif sebesar.5318 atau 53.18% keragaman data.
14 6 Tabel 3 Ringkasan Hasil Metode AKU-K pada Berbagai Proporsi Pencilan Akar Ciri Proporsi Kumulatif Proporsi Pencilan Komponen % % % % % % % % % % Analisis komponen utama pada data dengan pencilan 1% menunjukkan bahwa dua komponen utama pertama telah mampu menerangkan keragaman data sebesar.715 atau 71.5% (Tabel 2). Pada data dengan pencilan 5%, proporsi kumulatif data yang mampu diterangkan dua komponen pertama menjadi sebesar 83.88%. Proporsi kumulatif dua komponen pertama terus meningkat hingga mencapai 87.6% pada pencilan 1% dan 9.28% pada pencilan 15%. Proporsi kumulatif data yang diterangkan kedua komponen pertama meningkat karena adanya peningkatan akar ciri kedua komponen pertama. Kedua komponen pertama merupakan komponen yang mengandung keragaman data terbesar sehingga akar cirinya terpengaruh besarnya keragaman data. Akar ciri hasil AKU pada data pencilan akan meningkat, meskipun pencilan yang diberikan kecil (1%). Hal tersebut terjadi karena data dengan pencilan memiliki keragaman lebih tinggi daripada data tanpa pencilan. Keragaman data meningkat seiring dengan peningkatan proporsi pencilan sebagaimana ditunjukkan oleh peningkatan determinan matriks kovarian data pada Tabel 2. Determinan atau keragaman umum merupakan suatu cara menginformasikan semua ragam dan peragam dalam satu bilangan skalar (Johnson 1998). Analisis Komponen Utama Kekar AKU-K pada data contoh (pencilan %) menghasilkan dua komponen utama pertama yang menerangkan 53.5% keragaman data. Akar ciri komponen pertama bernilai dan memiliki proporsi kumulatif sebesar 33.1%. Komponen kedua memiliki akar ciri sebesar dan menghasilkan proporsi kumulatif sebesar 53.5% keragaman data. Hasil AKU-K pada Tabel 3 menunjukkan bahwa pada data pencilan 1%, proporsi kumulatif keragaman data yang mampu diterangkan dua komponen pertama sebesar 57.21%. Pada data dengan pencilan 5%, dua komponen pertama menerangkan 52.56% keragaman data. Proporsi kumulatif data yang diterangkan oleh dua komponen pertama cenderung stabil meskipun proporsi pencilan ditingkatkan, yaitu sebesar 53.17% pada pencilan 1% dan 53.97% pada pencilan 15%. Kestabilan proporsi kumulatif tersebut dikarenakan akar ciri kedua komponen pertama juga stabil. Kestabilan hasil dikarenakan AKU-K melakukan perhitungan matriks kovarian tidak dari semua data, tetapi dari h pengamatan dengan nilai keterpencilan terkecil. Proporsi Kumulatif Perbandingan AKU dengan AKU-K % 1% 5% 1% 15% Proporsi Pencilan AKU AKU-K Gambar 2 Proporsi Kumulatif Dua Komponen Utama Pertama
15 7 AKU dan AKU-K menghasilkan struktur komponen utama yang tidak jauh berbeda pada data contoh (pencilan %). Proporsi keragaman kumulatif antar kedua metode relatif sama pada data tersebut. Pada data dengan pencilan, proporsi keragaman kumulatif yang mampu diterangkan dua komponen pertama hasil AKU semakin meningkat seiring peningkatan pencilan, sedangkan hasil AKU-K tetap stabil (Gambar 2). Peningkatan juga terjadi pada akar ciri komponen pertama yang dihasilkan AKU, sedangkan akar ciri metode AKU-K cenderung stabil (Gambar 3). Akar Ciri Komponen Pertama % 1% 5% 1% 15% Proporsi Pencilan AKU AKU-K Gambar 3 Akar Ciri Komponen Utama Pertama Tabel 4 Keragaman Tiap Peubah pada Berbagai Proporsi Pencilan Proporsi Pencilan % 1% 5% 1% 15% X X X X X X X Vektor ciri atau koefisien kombinasi linier dua komponen utama metode AKU maupun AKU-K pada data contoh memiliki struktur yang mirip. Perbedaan tanda menggambarkan perbedaan arah vektor. Pada data pencilan, AKU menghasilkan vektor ciri komponen pertama yang didominasi peubah dengan keragaman besar. Tabel 4 menunjukkan bahwa peubah X2 (radiasi panas) dan X6 (O 3 ) memiliki keragaman lebih tinggi dibanding peubah lainnya sehingga terlihat pada Lampiran 6 bahwa koefisien untuk kedua peubah tersebut pada komponen pertama (KU1) lebih besar dibanding peubah lainnya pada semua data pencilan. Beberapa peubah selain X2 dan X6 mengalami perubahan keragaman karena proses simulasi dilakukan dengan mengganti semua nilai pada suatu baris pengamatan dengan nilai dari data pencilan. Oleh karena itu, tidak hanya nilai pada peubah X2 dan X6 yang terganti atau nilai-nilai pada peubah lain juga berbeda dari nilai data contoh, meskipun memiliki nilai tengah yang sama. Metode AKU-K menghasilkan dua komponen pertama dengan struktur koefisien berbeda pada tiap data pencilan (Lampiran 7). Pada data pencilan 1% dan 15%, struktur koefisien KU1 hasil metode AKU-K akan mirip dengan hasil AKU untuk data contoh (pencilan %). Akan tetapi, pada data pencilan 5% dan 1%, metode AKU-K menghasilkan struktur koefisien KU1 berbeda dari hasil AKU data contoh. Perbedaan struktur koefisien komponen utama tersebut akan menyebabkan interpretasi komponen yang berbeda. Tabel 5 Koefisien Kombinasi Linear Dua Komponen Utama Pertama pada Data Contoh AKU AKU-K KU1 KU2 KU1 KU2 X X X X X X X Komponen utama pertama hasil AKU pada data contoh ditunjukkan pada Tabel 5. Komponen tersebut memiliki nilai yang positif untuk X2 hingga X7, sedangkan X1 bernilai negatif. Komponen tersebut merupakan pengaruh ketujuh peubah tersebut pada kadar pencemaran di udara. X3 hingga X7 ( CO, NO, NO 2, O 3, dan HC) merupakan polutan yang ada di udara sehingga kelima peubah tersebut memiliki efek yang sama terhadap kadar pencemaran udara. Semakin tinggi kadar polutan, makin tinggi pula kadar pencemaran udara. X2 atau radiasi panas berperan membantu pembentukan polutan sekunder. Sedangkan X1 atau kecepatan angin
16 8 berpengaruh negatif terhadap kadar pencemaran di udara. Angin menyebabkan ketidakstabilan atmosfer sehingga polutan lebih terdispersi dan menurunkan kadar pencemaran di udara. Pengamatan dengan nilai skor komponen pertama yang tinggi menunjukkan pengamatan dengan kadar pencemaran tinggi. Struktur komponen utama pertama hasil AKU-K pada data contoh sama seperti komponen pertama hasil AKU, tetapi memiliki tanda berbeda. Interpretasi komponen tersebut adalah pengaruh ketujuh peubah terhadap kadar tercemarnya udara. Pengamatan dengan nilai skor komponen utama pertama tinggi dan positif menunjukkan pengamatan dengan kadar pencemaran yang rendah atau tingkat udara bersih tinggi, dan sebaliknya. Komponen utama kedua baik AKU maupun AKU-K memiliki nilai yang tinggi pada peubah X2 dan X6. Oleh karena itu, komponen tersebut diartikan sebagai hubungan antara radiasi panas dan ozon (O 3 ). Ozon merupakan polutan sekunder yang terbentuk dengan bantuan radiasi surya sehingga makin rendah intensitas radiasi yang diterima, makin sedikit jumlah ozon yang terbentuk, dan sebaliknya. Pengamatan dengan nilai skor komponen kedua yang tinggi menunjukkan pengamatan dengan kadar ozon tinggi. Lampiran 7 menunjukkan bahwa komponen pertama pada data pencilan 5% dengan metode AKU-K dicirikan oleh nilai koefisien yang tinggi pada X3 dan X5. Komponen tersebut merupakan hubungan antara CO dan NO 2. Interpretasi tersebut jelas berbeda dibanding interpretasi AKU data contoh. KESIMPULAN DAN SARAN Kesimpulan Analisis komponen utama metode AKU-K menunjukkan hasil yang lebih baik daripada AKU klasik. AKU klasik sangat dipengaruhi oleh kehadiran pencilan sehingga keberadaan pencilan akan memberikan hasil yang berbeda jauh dari hasil sebenarnya, meskipun proporsi pencilan yang diberikan sangat kecil. Akar ciri komponen utama pertama meningkat seiring dengan peningkatan proporsi pencilan sehingga proporsi keragaman kumulatif data yang mampu dijelaskan komponen utama pertama semakin besar. Vektor ciri komponen utama pertama didominasi oleh peubah dengan keragaman besar. Sedangkan metode AKU-K mampu mengatasi pengaruh kehadiran pencilan pada data. Akar ciri komponen utama pertama tidak terpengaruh besarnya pencilan sehingga proporsi keragaman kumulatif data yang mampu dijelaskan komponen pertama cenderung stabil. Vektor ciri komponen pertama metode AKU-K memberikan interpretasi yang sama dengan AKU saat tidak ada pencilan. Saran Pembobotan pengamatan merupakan salah satu bagian dalam algoritma FAST-MCD yang digunakan pada metode AKU-K. Suatu pengamatan diberi bobot satu apabila jarak relatifnya terhadap nilai tengah penduga MCD lebih besar daripada nilai kritisnya, dan diberi bobot nol jika sebaliknya. Pada penelitian selanjutnya, masih perlu dilakukan pengkajian mengenai penggunaan pembobot selain satu dan nol. DAFTAR PUSTAKA Arya PS Air Pollution Meteorology and Dispersion. Oxford: Oxford University Press. Barnett V, Lewis T Outliers in Statistical Data. Chichester: John Wiley & Sons, Ltd. Ben-Gal I. 25. Outlier Detection. Di dalam: Maimon O, Rokach L. Data Mining and Knowledge Discovery Handbook. New York: Springer US. Chen H. 22. Principal Component Analysis with Missing Data and Outliers. ttutorial/tutorialrpca.pdf [15 Apr 29]. Croux C, Ruiz-Gazen A. 25. High Breakdown Estimators for Principal Components: the Projection-Pursuit Approach Revisited. Journal of Multivariate Analysis. 95: Engelen S, Hubert M, Vanden-Branden K. 25. A Comparison of Three Procedures for Robust PCA in High Dimensions. Austrian Journal of Statistics. 34: Huber PJ Projection Pursuit. The Annals of Statistics. 13: Hubert M, Engelen S. 27. Fast Cross Validation of High-Breakdown Resampling Methods for PCA. Computational Statistics and Data Analysis. 51: Hubert M, Rousseeuw PJ, Aelst S van. 28. High-Breakdown Robust Multivariate Methods. Statistical Science. 23:
17 9 Hubert M, Rousseeuw PJ, Vanden-Branden K. 25. ROBPCA: A New Approach to Robust Principal Component Analysis. Technometrics. 47: Johnson RA, Wichern DW Applied Multivariate Statistical Analysis. 4 th Ed. New Jersey: Prentice Hall, Inc. Jolliffe IT. 22. Principal Component Analysis. 2 nd Ed. New York: Springer- Verlag, Inc. Morgan BJT Element of Simulation. London: Chapman and Hall. Rousseeuw PJ, Driessen K van A Fast Algorithm for the Minimum Covariance Determinant Estimator. Technometrics. 41:
18 LAMPIRAN
19 11 Lampiran 1 Skema Algoritma AKU-K Mulai X n,k = [x * 1, x * 2,, x * n ] X = k+1 bagian dari X n,k Ambil 1 H 1 dengan det(s 1 ) kecil Definisikan X = [x 1, x 2,, x n ] h max{αn,[(n+p+1)/2]} dengan ½ < α < 1 t t a xi µ ˆMCD( a X) O(x i) maxp t a R S ( a X) MCD H = [x(o 1 ), x(o 2 ),, x(o h )] dimana O 1 O 2 O h O n ˆµ vektor nilai tengah dari H S matriks kovarian dari H Dekomposisi spektral S : S P L P d ˆµ vektor nilai tengah dari x i * S matriks kovarian dari x i * dimana i H * 1 * ( x ) ( ˆ )' ( ˆ i xi µ S xi ) x i * X n,k ( ˆ µ, So ) µ H 1 = [x(d 1 )*, x(d 2 )*,, x(d h )*] dimana d 1 d 2 d h d n ˆµ vektor nilai tengah dari H 1 1 S 1 matriks kovarian dari H 1 det(s 1 ) = det(s )? tidak S S 1 ya d ˆµ vektor nilai tengah dari X S matriks kovarian dari X H 1 = [x(d 1 )*, x(d 2 )*,, x(d h )*] dimana d 1 d 2 d h d n ˆµ vektor nilai tengah dari H 1 1 S 1 matriks kovarian dari H 1 d * 1 * ( x ) ( ˆ )' ( ˆ i xi µ S xi ) ( ˆ µ, S o ) µ x i * X n,k det(s 1 ) < det(s 2 )? ya S 3 S 1, ˆµ ˆµ 3 1 * 1 * ( x ) ( ˆ )' ( ˆ i xi µ 3 S3 xi 3) x i * X n,k ( ˆ µ 3, S3 ) µ tidak ya d * 1 * ( x ) ( ˆ )' ( ˆ i xi µ 1 S1 xi 1) x i * X n,k ( ˆ µ 1, S1) µ H 2 = [x(d 1 )*, x(d 2 )*,, x(d h )*] dimana d 1 d 2 d h d n ˆµ vektor nilai tengah dari H 2 2 S 2 matriks kovarian dari H 2 det(s 2 ) = det(s 1 )? S 3 S 2, S 2 S 1 tidak ˆµ ˆµ 3 2 Dekomposisi spektral S 4 : S 4 P 2 L 2 P 2 T n,k (X n,r 1 ' n ˆµ ) P 4 2 X n,k (X n,r 1 ' n ˆµ ) P 1 r,k Keterangan. Diulang 25 kali ) n n µ 4 w i x i / w i i = 1 i = 1 n n ) ) ' S4 w i xi µ 4 xi µ 4 / wi 1 i= 1 i= 1 ( )( ) Stop 11
20 12 Lampiran 2 Script Pembangkitan Data dengan Software Matlab (R26a) function [X]=mvn(mu,sigma,n) %Fungsi ini membentuk matriks data yang terdiri dari p variabel dengan mu %dan sigma (korelasi) tertentu. %Input: %mu = vektor berukuran 1xp %sigma = matriks ragam peragam berukuran pxp (matriks definit positif) %n = banyaknya pengamatan %p = banyaknya variabel %Output: %X = matriks data %Membangkitkan bilangan acak menyebar normal(,1) sebanyak p m=size(sigma); p=m(1); for i=1:n Y(i,:)=normrnd(,1,[1 p]);%y matriks berukuran n x p end %Dekomposisi Cholesky sigma=aa a=chol(sigma);%sigma=a'a %Membangkitkan data M = mu(ones(n,1),:);%membangkitkan matriks vektor nilai tengah (nxp) Xt=M'+a'*Y'; X=Xt'; %==================================================================== function z=new(x,y,a) %Fungsi ini menghasilkan matriks baru yang merupakan gabungan dari matriks %x dan y dimana baris ke-p pada x diganti dengan baris ke-p pada y. %Banyaknya baris yg diganti sebesar a% pengamatan. %Banyaknya pengamatan adalah jumlah baris pada x maupun y. %Banyaknya baris dan kolom pada x dan y harus sama. %Input: %x = Matriks data awal %y = Matriks data kontaminan %a = Besarnya proporsi pencilan yang digunakan untuk mengganti data awal %Output: %z = Matriks gabungan sx=size(x); %Mencari dimensi dari matriks x n=sx(1); m=ceil((a/1)*n); z=x; for i=1:m rp=randperm(n); p=rp(1); z(p,:)=y(p,:); %Proses penggantian data end b=cb(z,x); %Mengecek jumlah baris yang terganti %Melakukan penggantian lagi jika jumlah data yang terganti kurang dari %yang seharusnya if b<m s=m-b; for k=1:s rp=randperm(n);p=rp(1); if z(p,:)==y(p,:) k=k-1; else z(p,:)=y(p,:);
21 13 end end end b=cb(z,x); %Melakukan penggantian lagi jika jumlah data yang terganti lebih dari %yang seharusnya if b>m s=m-b; for k=1:s rp=randperm(n);p=rp(1); if z(p,:)==y(p,:) z(p,:)=x(p,:); end end end %==================================================================== function b=cb(x,y) %Fungsi ini menghitung jumlah baris pada matriks x dan y yang berbeda %Input: %x,y = matriks data yang dibandingkan %Output: %b = jumlah baris yang berbeda sx=size(x); rx=sx(1); b=; for i=1:rx if x(i,:)==y(i,:) b=b+; else b=b+1; end end %==================================================================== Lampiran 3 Nilai Korelasi Antar Peubah Indikator Pencemaran Udara X1 X2 X3 X4 X5 X6 X7 X1 r 1. nilai-p. X2 r nilai-p.523. X3 r nilai-p X4 r ** 1. nilai-p X5 r ** nilai-p X6 r *.411 ** nilai-p X7 r ** nilai-p Keterangan. * Korelasi signifikan pada taraf nyata.5. **Korelasi signifikan pada taraf nyata.1.
22 14 Lampiran 4 Jarak Mahalanobis Data Contoh Pengamatan Jarak Pengamatan Jarak Pengamatan Jarak Lampiran 5 Identifikasi Jumlah Pencilan pada Data Proporsi Pencilan % 1% 5% 1% 15% Jumlah Data Pencilan Jumlah Pencilan Teridentifikasi 1 Lampiran 6 Koefisien Kombinasi Linear Komponen Utama Pertama dan Kedua pada Berbagai Proporsi Pencilan Metode Analisis Komponen Utama Klasik (AKU) Proporsi Pencilan Peubah 1% 5% 1% 15% KU1 KU2 KU1 KU2 KU1 KU2 KU1 KU2 X X X X X X X
23 15 Lampiran 7 Koefisien Kombinasi Linear Komponen Utama Pertama dan Kedua pada Berbagai Proporsi Pencilan Metode Analisis Komponen Utama Kekar (AKU-K) Peubah Proporsi Pencilan 1% 5% 1% 15% KU1 KU2 KU1 KU2 KU1 KU2 KU1 KU2 X X X X X X X
(α = 0.01). Jika D i > , maka x i atau pengamatan ke-i dianggap pencilan (i = 1, 2,..., 100). HASIL DAN PEMBAHASAN
4 karena adanya perbedaan satuan pengukuran antar peubah. 1.. Memastikan tidak adanya pencilan pada data dengan mengidentifikasi adanya pencilan pada data. Pengidentifikasian pencilan dilakukan dengan
Lebih terperinciHASIL DAN PEMBAHASAN. dengan hipotesis nolnya adalah antar peubah saling bebas. Statistik ujinya dihitung dengan persamaan berikut:
. Menyiapkan gugus data pencilan dengan membangkitkan peubah acak normal ganda dengan parameter µ yang diekstrimkan dari data contoh dan dengan matriks ragam-peragam yang sama dengan data contoh. Proses
Lebih terperinciMANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO
MANAJEMEN DATA PENCILAN PADA ANALISIS REGRESI KOMPONEN UTAMA MAGRI HANDOKO DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2011 RINGKASAN MAGRI HANDOKO. Manajemen
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Principal Component Analysis (PCA)merupakan salah satu teknik pereduksian dimensi data. Data yang direduksi saling berkorelasi satu sama lain.pca muncul sebagai solusi
Lebih terperinci, dengan. Karakteristik dari vektor peubah acak X dan Y sebagai berikut:
3 TINJAUAN PUSTAKA Analisis Korelasi Kanonik Analisis korelasi kanonik (AKK) yang diperkenalkan oleh Hotelling pada tahun 1936, bertujuan untuk mengidentifikasi dan menghitung hubungan linier antara dua
Lebih terperinciForum Statistika dan Komputasi, Oktober 2009 p : ISSN :
, Oktober 2009 p : 26-34 ISSN : 0853-8115 Vol 14 No.2 METODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) (Variance-Covariance Matrix Estimation Method for Principal Component
Lebih terperinciPERBANDINGAN PENGGEROMBOLAN K-MEANS DAN K-MEDOID PADA DATA YANG MENGANDUNG PENCILAN YANNE FLOWRENSIA
PERBANDINGAN PENGGEROMBOLAN K-MEANS DAN K-MEDOID PADA DATA YANG MENGANDUNG PENCILAN YANNE FLOWRENSIA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 010
Lebih terperinciBAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN
BAB III ANALISIS KORELASI KANONIK ROBUST DENGAN METODE MINIMUM COVARIANCE DETERMINAN 3.1 Deteksi Pencilan Multivariat Pengidentifikasian pencilan pada kasus multivariat tidaklah mudah untuk dilakukan,
Lebih terperinciBAB II TINJAUAN PUSTAKA. satu peubah prediktor dengan satu peubah respon disebut analisis regresi linier
BAB II TINJAUAN PUSTAKA 2.1 Analisis Regresi Linier Berganda Analisis regresi pertama kali dikembangkan oleh Sir Francis Galton pada abad ke-19. Analisis regresi dengan satu peubah prediktor dan satu peubah
Lebih terperinciPENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA
PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA Ni Putu Iin Vinny Dayanti 1, Ni Luh Putu Suciptawati 2, Made
Lebih terperinciANALISIS KOMPONEN UTAMA DENGAN MENGGUNAKAN MATRIK VARIAN KOVARIAN YANG ROBUST
ANALISIS KOMPONEN UTAMA DENGAN MENGGUNAKAN MATRIK VARIAN KOVARIAN YANG ROBUST Irwan Sujatmiko, Susanti Linuwih, dan Dwi Atmono A.W. Jurusan Statistika ITS Kampus ITS Sukolilo Surabaya 6 Abstract. The present
Lebih terperinciKAJIAN TERHADAP TINGKAT PEMERATAAN PENDIDIKAN MENGGUNAKAN ANALISIS BIPLOT KLASIK DAN BIPLOT KEKAR
E-Jurnal Matematika Vol. 4 (2), Mei 2015, pp. 37-42 ISSN: 2303-1751 KAJIAN TERHADAP TINGKAT PEMERATAAN PENDIDIKAN MENGGUNAKAN ANALISIS BIPLOT KLASIK DAN BIPLOT KEKAR Ni Luh Ardila Kusumayanti 1, I Komang
Lebih terperinciKETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD)
KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD) Budyanra Jurusan Statistika, Sekolah Tinggi Ilmu Statistik, Jakarta
Lebih terperinciBAB I PENDAHULUAN. Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini
BAB I PENDAHULUAN 1.1 Latar belakang Beberapa penelitian sering sekali melibatkan banyak variabel. Hal ini bertujuan agar mendekati kebenaran kesimpulan yang diperoleh dari nilai taksiran sementara (hipotesis).
Lebih terperinciMETODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE
METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2010 RINGKASAN
Lebih terperinci(R.14) METODE MINIMUM COVARIANCE DETERMINANT PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN
(R.14) MEODE MINIMUM COVARIANCE DEERMINAN PADA ANALISIS REGRESI LINIER BERGANDA DENGAN KASUS PENCILAN Dini Aderlina, Firdaniza, Nurul Gusriani Jurusan Matematika FMIPA Universitas Padjadjaran Jl. Raya
Lebih terperinciPENDUGA PENCILAN BOGOR 2013
PERBANDINGAN PENDUGA MINIMUM COVARIANCE DETERMINANT (MCD) DENGAN MAXIMUMM LIKELIHOOD ESTIMATION (MLE) PADA ANALISIS DISKRIMINANN UNTUK DATA YANG MENGANDUNGG PENCILAN TRI HARDI PUTRA DEPARTEMEN STATISTIK
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Analisis regresi merupakan suatu metode yang digunakan untuk mengetahui hubungan satu arah antara variabel prediktor dan variabel respon yang umumnya dinyatakan
Lebih terperinciBAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA. Analisis komponen utama adalah metode statistika multivariat yang
BAB III PEREDUKSIAN RUANG INDIVIDU DENGAN ANALISIS KOMPONEN UTAMA Analisis komponen utama adalah metode statistika multivariat yang bertujuan untuk mereduksi dimensi data dengan membentuk kombinasi linear
Lebih terperinciISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:
ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman 295-304 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PERBANDINGAN DISKRIMINAN KUADRATIK KLASIK DAN DISKRIMINAN KUADRATIK
Lebih terperinciPERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST UNTUK DATA INFLASI KELOMPOK BAHAN MAKANAN DI JAWA TENGAH
ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 3, Tahun 2014, Halaman 343-352 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST
Lebih terperinciPERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA
PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA Ni Luh Putu Ratna Kumalasari 1, Ni Luh Putu Suciptawati 2,, Made Susilawati
Lebih terperinciANALISIS DISKRIMINAN KUADRATIK KEKAR (Studi Kasus : Divisi Regional Perum BULOG Tahun 2009) MAYA WULAN ARINI
ANALISIS DISKRIMINAN KUADRATIK KEKAR (Studi Kasus : Divisi Regional Perum BULOG Tahun 2009) MAYA WULAN ARINI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciIDENTIFIKASI PENCILAN DAN PETA PENCILAN PADA ANALISIS KOMPONEN UTAMA UNTUK DATA MENJULUR ANNA FAUZIYAH DEPARTEMEN STATISTIKA
IDENTIFIKASI PENCILAN DAN PETA PENCILAN PADA ANALISIS KOMPONEN UTAMA UNTUK DATA MENJULUR ANNA FAUZIYAH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciKAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN
KAJIAN TELBS PADA REGRESI LINIER DENGAN KASUS PENCILAN Nurul Gusriani 1), Firdaniza 2), Novi Octavianti 3) 1,2,3) Departemen Matematika FMIPA Universitas Padjadjaran, Jalan Raya Bandung- Sumedang Km. 21
Lebih terperinciMETODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) YANI SURYANI
METODE PENDUGAAN MATRIKS RAGAM-PERAGAM DALAM ANALISIS REGRESI KOMPONEN UTAMA (RKU) YANI SURYANI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009 RINGKASAN
Lebih terperinciBAB I PENDAHULUAN. menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis regresi linier berganda merupakan analisis yang digunakan untuk menyelidiki hubungan di antara dua atau lebih peubah prediktor X terhadap peubah respon Y yang
Lebih terperinciFAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS)
FAKTOR-FAKTOR YANG MEMPENGARUHI JUMLAH PENDUDUK DI JAWA TENGAH MENGGUNAKAN MODEL REGRESI ROBUST DENGAN ESTIMASI LEAST MEDIAN OF SQUARES (LMS) Yuditia Ari Prabowo, Yuliana Susanti, dan Santoso Budi Wiyono
Lebih terperinciPERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 1-5 ISSN: 2303-1751 PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA NI WAYAN
Lebih terperinciPERBANDINGAN METODE KEKAR BIWEIGHT MIDCOVARIANCE DAN MINIMUM COVARIANCE DETERMINANT DALAM ANALISIS KORELASI KANONIK FREZA RIANA
PERBANDINGAN METODE KEKAR BIWEIGHT MIDCOVARIANCE DAN MINIMUM COVARIANCE DETERMINANT DALAM ANALISIS KORELASI KANONIK FREZA RIANA SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2012 i PERNYATAAN MENGENAI
Lebih terperinciANALISIS KORELASI KANONIK PERILAKU BELAJAR TERHADAP PRESTASI BELAJAR SISWA SMP (STUDI KASUS SISWA SMPN I SUKASARI PURWAKARTA)
Prosiding Seminar Matematika dan Pendidikan Matematika ISBN: 978-60-61-0-9 hal 693-703 November 016 ANALISIS KORELASI KANONIK PERILAKU BELAJAR TERHADAP PRESTASI BELAJAR SISWA SMP (STUDI KASUS SISWA SMPN
Lebih terperinciBAB III ANALISIS FAKTOR. berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal
BAB III ANALISIS FAKTOR 3.1 Definisi Analisis faktor Analisis faktor adalah suatu teknik analisis statistika multivariat yang berfungsi untuk mereduksi dimensi data dengan cara menyatakan variabel asal
Lebih terperinciBAB III MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST. Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis
BAB III MINIMUM VOLUME ELLIPSOID PADA ANALISIS KOMPONEN UTAMA ROBUST Pada bab ini akan dikaji bahasan utama yaitu pencilan dan analisis komponen utama robust sebagai konsep pendukung serta metode Minimum
Lebih terperinciPERBANDINGAN ANALISIS FAKTOR KLASIK DAN KELOMPOK BAHAN MAKANAN DI JAWA TENGAH
PERBANDINGAN ANALISIS FAKTOR KLASIK DAN ANALISIS FAKTOR ROBUST UNTUK DATA INFLASI KELOMPOK BAHAN MAKANAN DI JAWA TENGAH SKRIPSI Oleh: ERNA PUSPITASARI NIM :24010210130059 JURUSAN STATISTIKA FAKULTAS SAINS
Lebih terperinciPENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA
E-Jurnal Matematika Vol. 2, No.4, Nopember 2013, 6-10 ISSN: 2303-1751 PENERAPAN METODE LEAST MEDIAN SQUARE-MINIMUM COVARIANCE DETERMINANT (LMS-MCD) DALAM REGRESI KOMPONEN UTAMA I PUTU EKA IRAWAN 1, I KOMANG
Lebih terperinciS 10 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis)
PROSIDING ISBN : 978 979 6353 6 3 S 0 Studi Simulasi Tentang Penerapan Grafik Pengendali Berdasarkan Analisis Komponen Utama (Principal Component Analysis) Wirayanti ), Adi Setiawan ), Bambang Susanto
Lebih terperinciReduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan Analisis Komponen Utama
Reduksi Data Luaran GCM Stasiun Amahai Dengan Menggunakan Analisis Komponen Utama Ferry Kondo Lembang Jurusan Matematika FMIPA UNPATTI ferrykondolembang@yahoo.co.id Abstrak Reduksi dimensi adalah bagian
Lebih terperinciMENGATASI MASALAH MULTIKOLINEARITAS DAN OUTLIER DENGAN PENDEKATAN ROBPCA (STUDI KASUS ANALISIS REGRESI ANGKA KEMATIAN BAYI DI JAWA TIMUR)
MENGATASI MASALAH MULTIKOLINEARITAS DAN OUTLIER DENGAN PENDEKATAN ROBPCA (STUDI KASUS ANALISIS REGRESI ANGKA KEMATIAN BAYI DI JAWA TIMUR) Sony Sunaryo (sonny_s@statistika.its.ac.id) Setiawan Jurusan Statistika,
Lebih terperinciDidin Astriani P, Oki Dwipurwani, Dian Cahyawati (Jurusan Matematika Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Sriwijaya)
(M.2) ANALISIS BIPLOT UNTUK MENGETAHUI KARAKTERISTIK PUTUS SEKOLAH PENDIDIKAN DASAR PADA MASYARAKAT MISKIN ANTAR WILAYAH KECAMATAN DI KABUPATEN OGAN ILIR Didin Astriani P, Oki Dwipurwani, Dian Cahyawati
Lebih terperinciPenggunaan Kernel PCA Gaussian dalam Penyelesaian Plot Multivariat Non Linier. The Use of Gaussian PCA Kernel in Solving Non Linier Multivariate Plot
Penggunaan Kernel PCA Gaussian dalam Penyelesaian Plot Multivariat Non Linier Bernhard M. Wongkar 1, John S. Kekenusa 2, Hanny A.H. Komalig 3 1 Program Studi Matematika, FMIPA, UNSRAT Manado, bernhard.wongkar2011@gmail.com
Lebih terperinciMETODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER
Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 03, No. 3 (2014), hal 163-168. METODE ORDINARY LEAST SQUARES DAN LEAST TRIMMED SQUARES DALAM MENGESTIMASI PARAMETER REGRESI KETIKA TERDAPAT OUTLIER
Lebih terperinciTINJAUAN PUSTAKA Kalibrasi Ganda Regresi Kuadrat Terkecil Parsial ( Partial Least Squares/PLS) 1. Model PLS
TINJAUAN PUSTAKA Kalibrasi Ganda Kalibrasi adalah suatu fungsi matematik dengan data empirik dan pengetahuan untuk menduga informasi pada Y yang tidak diketahui berdasarkan informasi pada X yang tersedia
Lebih terperinciAnalisis Komponen Utama (Principal component analysis)
Analisis Komponen Utama (Principal component analysis) A. LANDASAN TEORI Misalkan χ merupakan matriks berukuran nxp, dengan baris-baris yang berisi observasi sebanyak n dari p-variat variabel acak X. Analisis
Lebih terperinciESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER
ESTIMASI REGRESI ROBUST M PADA FAKTORIAL RANCANGAN ACAK LENGKAP YANG MENGANDUNG OUTLIER Siswanto 1, Raupong 2, Annisa 3 ABSTRAK Dalam statistik, melakukan suatu percobaan adalah salah satu cara untuk mendapatkan
Lebih terperinciKAJIAN PENGARUH NOISE DALAM ANALISIS KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH YANG BERKORELASI FAJRIANZA ADI NUGRAHANTO
KAJIAN PENGARUH NOISE DALAM ANALISIS KOMPONEN UTAMA UNTUK PEUBAH-PEUBAH YANG BERKORELASI FAJRIANZA ADI NUGRAHANTO DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciTINJAUAN PUSTAKA. Gambar 1 Diagram kotak garis
TINJAUAN PUSTAKA Diagram Kotak Garis Metode diagram kotak garis atau boxplot merupakan salah satu teknik untuk memberikan gambaran tentang lokasi pemusatan data, rentangan penyebaran dan kemiringan pola
Lebih terperinciTINJAUAN PUSTAKA. Model Regresi Linier Ganda
TINJAUAN PUSTAKA Model Regresi Linier Ganda Hubungan antara y dan X dalam model regresi linier umum adalah y = X ß + e () dengan y merupakan vektor pengamatan pada peubah respon (peubah tak bebas) berukuran
Lebih terperinciHASIL DAN PEMBAHASAN. Algoritma Cepat Penduga GS
HASIL DAN PEMBAHASAN Algoritma Cepat Penduga GS Sebagaimana halnya dengan algoritma cepat penduga S, algoritma cepat penduga GS dikembangkan dengan mengkombinasikan algoritma resampling dan algoritma I-step.
Lebih terperinciANALISIS KINERJA INSTITUT PERTANIAN BOGOR BERDASARKAN SURVEI KEPUASAN MAHASISWA DAN EPBM AHMAD CHAERUS SUHADA
ANALISIS KINERJA INSTITUT PERTANIAN BOGOR BERDASARKAN SURVEI KEPUASAN MAHASISWA DAN EPBM AHMAD CHAERUS SUHADA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciANALISIS KORELASI KANONIK ANTARA CURAH HUJAN GCM DAN CURAH HUJAN DI INDRAMAYU. Oleh : Heru Novriyadi G
ANALISIS KORELASI KANONIK ANTARA CURAH HUJAN GCM DAN CURAH HUJAN DI INDRAMAYU Oleh : Heru Novriyadi G4004 PROGRAM STUDI STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciSKRIPSI. Oleh : LAILI ISNA NUR KHIQMAH NIM :
PERBANDINGAN DISKRIMINAN KUADRATIK KLASIK DAN DISKRIMINAN KUADRATIK ROBUST PADA KASUS PENGKLASIFIKASIAN PEMINATAN PESERTA DIDIK (Studi Kasus di SMA Negeri 1 Kendal Tahun Ajaran 2014/2015) SKRIPSI Oleh
Lebih terperinciPENERAPAN ANALISIS KOMPONEN UTAMA KEKAR DENGAN PENDEKATAN ALGORITMA GRID PADA DATA SPEKTRUM FRONTIER TRANSFORM INFRARED AULIA RIZKI FIRDAWANTI
PENERAPAN ANALISIS KOMPONEN UTAMA KEKAR DENGAN PENDEKATAN ALGORITMA GRID PADA DATA SPEKTRUM FRONTIER TRANSFORM INFRARED AULIA RIZKI FIRDAWANTI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan
BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan Dalam banyak proses industri, selalu ada variabilitas dasar sebanyak tertentu. Apabila variabilitas dasar suatu proses relatif kecil akan dipandang sebagai
Lebih terperinciKata Kunci: Analisis Regresi Linier, Penduga OLS, Penduga GLS, Autokorelasi, Regresor Bersifat Stokastik
Jurnal Matematika UNAND Vol. 3 No. 4 Hal. 168 176 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PERBANDINGAN PENDUGA ORDINARY LEAST SQUARES (OLS) DAN GENERALIZED LEAST SQUARES (GLS) PADA MODEL REGRESI
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI Pada bab ini akan diuraikan mengenai landasan teori yang akan digunakan dalam bab selanjutnya. 2.1 Matriks Sebuah matriks, biasanya dinotasikan dengan huruf kapital tebal seperti A,
Lebih terperinciJURNAL MATEMATIKA DAN KOMPUTER Vol. 4. No. 2, 71-81, Agustus 2001, ISSN :
PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA Tatik Widiharih Jurusan Matematika FMIPA UNDIP Abstrak Multikolinearitas yang tinggi diantara peubah-peubah bebas,
Lebih terperinciPENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Pada Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)
ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman 697-704 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL
Lebih terperinciPENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI
PENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPERBANDINGAN KINERJA DIAGRAM KONTROL MULTIVARIAT UNTUK VARIABILITAS BERDASARKAN MATRIKS KOVARIANSI DAN MATRIKS KORELASI. Abstrak
PERBANDINGAN KINERJA DIAGRAM KONTROL MULTIVARIAT UNTUK VARIABILITAS BERDASARKAN MATRIKS KOVARIANSI DAN MATRIKS KORELASI Dwi Yuli Rakhmawati, Muhammad Mashuri 2,2) Institut Teknologi Sepuluh Nopember dwiyuli_rakhmawati@yahoo.com,
Lebih terperinciMetode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas
Vol. 14, No. 1, 93-99, Juli 2017 Metode Regresi Ridge dengan Iterasi HKB dalam Mengatasi Multikolinearitas Nurhasanah Abstrak Regresi berganda dengan peubah bebas saling berkorelasi (multikolinearitas)
Lebih terperinciMinggu XI ANALISIS KOMPONEN UTAMA. Utami, H
Minggu XI ANALISIS KOMPONEN UTAMA Utami, H Outline 1 Pendahuluan 2 Tujuan 3 Analisis Komponen Utama 4 Contoh Utami, H Minggu XIANALISIS KOMPONEN UTAMA 2 / 16 Outline 1 Pendahuluan 2 Tujuan 3 Analisis Komponen
Lebih terperinciviii METODE REGRESI LEAST TRIMMED SQUARES PADA DATA YANG MENGANDUNG PENCILAN ANNI FITHRIYATUL MAS UDAH
viii METODE REGRESI LEAST TRIMMED SQUARES PADA DATA YANG MENGANDUNG PENCILAN ANNI FITHRIYATUL MAS UDAH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciPERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN
E-Jurnal Matematika Vol. 3, No.2 Mei 2014, 45-52 ISSN: 2303-1751 PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN NI PUTU NIA IRFAGUTAMI 1, I GUSTI
Lebih terperinciMetode Minimum Covariance Determinan Pada Analisis Regresi Linier Berganda Dengan Kasus Pencilan
Metode Minimum Covariance Determinan Pada Analisis Regresi Linier Berganda Dengan Kasus Pencilan Minimum Covariance Determinants Method On Multiple Linear Regression Analysis The Case Outliers Sifriyani
Lebih terperinciPENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN
PENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN (Studi Kasus: Preferensi Mahasiswa Statistika IPB Angkatan 44, 45, dan 46 terhadap Minat Bidang Kerja) DONNY ARIEF SETIAWAN SITEPU
Lebih terperinciMETODE PARTIAL LEAST SQUARES UNTUK MENGATASI MULTIKOLINEARITAS PADA MODEL REGRESI LINEAR BERGANDA
Buletin Ilmiah Mat. Stat. dan Terapannya (Bimaster) Volume 03, No. 3 (2014), hal 169 174. METODE PARTIAL LEAST SQUARES UNTUK MENGATASI MULTIKOLINEARITAS PADA MODEL REGRESI LINEAR BERGANDA Romika Indahwati,
Lebih terperinciPERBANDINGAN ANALISIS BIPLOT KLASIK DAN ROBUST BIPLOT PADA PEMETAAN PERGURUAN TINGGI SWASTA DI JAWA TIMUR
Jur. Ris. & Apl. Mat. I (207), no., xx-xx Jurnal Riset dan Aplikasi Matematika e-issn: 258-054 URL: journal.unesa.ac.id/index.php/jram PERBANDINGAN ANALISIS BIPLOT KLASIK DAN ROBUST BIPLOT PADA PEMETAAN
Lebih terperinciBAB I PENDAHULUAN. lebih variabel independen. Dalam analisis regresi dibedakan dua jenis variabel
BAB I PENDAHULUAN A. Latar Belakang Analisis regresi linier merupakan teknik dalam statistika yang digunakan untuk membentuk model hubungan antara variabel dependen dengan satu atau lebih variabel independen.
Lebih terperinciTINJAUAN PUSTAKA. Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan
4 II. TINJAUAN PUSTAKA 2.1 Definisi Pencilan Dalam proses pengumpulan data, peneliti sering menemukan nilai pengamatan yang bervariasi (beragam). Keberagaman data ini, di satu sisi sangat dibutuhkan dalam
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Aljabar Matriks 2.1.1 Definisi Matriks Matriks adalah suatu kumpulan angka-angka yang juga sering disebut elemen-elemen yang disusun secara teratur menurut baris dan kolom sehingga
Lebih terperinciKlasifikasi Kecamatan Berdasarkan Nilai Akhir SMA/MA di Kabupaten Aceh Selatan Menggunakan Analisis Diskriminan
Statistika, Vol. 15 No. 2, 87-97 November 215 Klasifikasi Kecamatan Berdasarkan Nilai Akhir SMA/MA di Kabupaten Aceh Selatan Menggunakan Analisis Diskriminan Fitriana A.R. 1, Nurhasanah 2, Ririn Raudhatul
Lebih terperinciSemakin besar persentase CCR yang dihasilkan, maka tingkat akurasi yang dihasilkan semakin tinggi (Hair et. al., 1995).
3 fungsi diskriminan cukup untuk memisahkan k buah kelompok. Karena fungsi-fungsi diskriminan tidak saling berkorelasi, maka komponen aditif dari V masing-masing didekati dengan khi-kuadrat dengan V j
Lebih terperinciJURNAL GAUSSIAN, Volume 2, Nomor 2, April 2013, Halaman Online di:
JURNAL GAUSSIAN, Volume, Nomor, April 013, Halaman 119-18 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PENENTUAN KOEFISIEN KORELASI KANONIK DAN INTERPRETASI FUNGSI KANONIK MULTIVARIAT Muhamad
Lebih terperinciPENGGEROMBOLAN DUA TAHAP DESA-DESA DI JAWA TENGAH ALIFTA DIAH AYU RETNANI
PENGGEROMBOLAN DUA TAHAP DESA-DESA DI JAWA TENGAH ALIFTA DIAH AYU RETNANI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012 RINGKASAN ALIFTA DIAH AYU RETNANI.
Lebih terperinciBAB II LANDASAN TEORI. metode kuadrat terkecil (MKT), outlier, regresi robust, koefisien determinasi,
BAB II LANDASAN TEORI Beberapa teori yang diperlukan untuk mendukung pembahasan diantaranya adalah regresi linear berganda, pengujian asumsi analisis regresi, metode kuadrat terkecil (MKT), outlier, regresi
Lebih terperinciAnalisis Peubah Ganda
Analisis Peubah Ganda Analisis Komponen Utama Dr. Ir. I Made Sumertajaya, M.Si Pengamatan Peubah Ganda - memerlukan sumberdaya lebih, dalam analisis - informasi tumpang tindih pada beberapa peubah Apa
Lebih terperinciPENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA DIMAS FAJAR AIRLANGGA
PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA DIMAS FAJAR AIRLANGGA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciHASIL DAN PEMBAHASAN
Konsentrasi lemak ikan (%) Kandungan zat aktif (absorban) HASIL DAN PEMBAHASAN Deskripsi Data Berdasarkan data yang digunakan dalam penelitian ini, akan dilakukan pengidentifikasian multikolinieritas.
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan
BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan Dalam industri modern ekspektasi pelanggan menjadi suatu acuan pentimg dari kualitas produk. Oleh karena itu dalam proses produksi tidak hanya mementingkan
Lebih terperinciPERBANDINGAN BAGAN KENDALI T 2 HOTELLING KLASIK DENGAN T 2 HOTELLING PENDEKATAN BOOTSTRAP PADA DATA BERDISTRIBUSI NON-NORMAL MULTIVARIAT
Jurnal Matematika UNAND Vol. VI No. 1 Hal. 17 4 ISSN : 303 910 c Jurusan Matematika FMIPA UNAND PERBANDINGAN BAGAN KENDALI T HOTELLING KLASIK DENGAN T HOTELLING PENDEKATAN BOOTSTRAP PADA DATA BERDISTRIBUSI
Lebih terperinciTeknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil
Teknik Reduksi Dimensi Menggunakan Komponen Utama Data Partisi Pada Pengklasifikasian Data Berdimensi Tinggi dengan Ukuran Sampel Kecil Ronny Susetyoko, Elly Purwantini Politeknik Elektronika Negeri Surabaya
Lebih terperinciBAB 2 TINJAUAN PUSTAKA = (2.2) =
BAB 2 TINJAUAN PUSTAKA 2.1. Regresi Linear Berganda Regresi linear berganda adalah regresi dimana variabel terikatnya dihubungkan atau dijelaskan dengan lebih dari satu variabel bebas,,, dengan syarat
Lebih terperinciPENERAPAN DISKRIMINAN KANONIK PADA KOMPONEN KIMIA AKTIF TANAMAN OBAT HERBAL (TEMULAWAK, BANGLE, KUNYIT) 1 ABSTRAK
Seminar Nasional Statistika IX Institut Teknologi Sepuluh Nopember, 7 November 2009 PENERAPAN DISKRIMINAN KANONIK PADA KOMPONEN KIMIA AKTIF TANAMAN OBAT HERBAL (TEMULAWAK, BANGLE, KUNYIT) 1 UTAMI DYAH
Lebih terperinciPENDETEKSIAN OUTLIER PADA CAPITAL ASSET PRICING MODEL (CAPM) MENGGUNAKAN LEAST TRIMMED SQUARES (LTS) Elis Ratna Wulan 1, Enung Nurhayati 2
Edisi Juli 014 Volume VIII No. 1 ISSN 1979-8911 PENDETEKSIAN OUTLIER PADA CAPITAL ASSET PRICING MODEL (CAPM) MENGGUNAKAN LEAST TRIMMED SQUARES (LTS) Elis Ratna Wulan 1, Enung Nurhayati 1, Jurusan Matematika,
Lebih terperinciKAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI. Oleh : SITI NURBAITI G
KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI Oleh : SITI NURBAITI G14102022 DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007 ABSTRAK SITI
Lebih terperinciPENENTUAN UKURAN CONTOH DAN REPLIKASI BOOTSTRAP UNTUK MENDUGA MODEL REGRESI LINIER SEDERHANA
Jurnal Matematika UNAND Vol. 3 No. 2 Hal. 53 61 ISSN : 2303 2910 c Jurusan Matematika FMIPA UNAND PENENTUAN UKURAN CONTOH DAN REPLIKASI BOOTSTRAP UNTUK MENDUGA MODEL REGRESI LINIER SEDERHANA OLIVIA ATINRI,
Lebih terperinciANALISIS REGRESI ROBUST PADA DATA MENGANDUNG PENCILAN DENGAN METODE LEAST MEDIAN SQUARE
ANALISIS REGRESI ROBUST PADA DATA MENGANDUNG PENCILAN DENGAN METODE LEAST MEDIAN SQUARE SKRIPSI Oleh Hufron Haditama NIM 051810101096 JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS
Lebih terperinciPEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA
PEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 RINGKASAN TENDI
Lebih terperinciKetakbiasan Dalam Model Analisis Faktor Konfirmatori Pada Metode Pendugaan Kuadrat Terkecil Tak Terboboti (Unweighted Least Square) Untuk Data Ordinal
Prosiding Semirata FMIPA Universitas Lampung, 2013 Ketakbiasan Dalam Model Analisis Faktor Konfirmatori Pada Metode Pendugaan Kuadrat Terkecil Tak Terboboti (Unweighted Least Square) Untuk Data Ordinal
Lebih terperinciPENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA. Tatik Widiharih Jurusan Matematika FMIPA UNDIP
PENANGANAN MULTIKOLINEARITAS (KEKOLINEARAN GANDA) DENGAN ANALISIS REGRESI KOMPONEN UTAMA Tatik Widiharih Jurusan Matematika FMIPA UNDIP Abstrak Multikolinearitas yang tinggi diantara peubah-peubah bebas,
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
5 BAB 2 TINJAUAN PUSTAKA 2.1 Matriks 2.1.1 Definisi Matriks Matriks adalah suatu kumpulan angka-angka yang juga sering disebut elemenelemen yang disusun secara teratur menurut baris dan kolom berbentuk
Lebih terperinciAnalisis Biplot untuk Pemetaan Posisi dan Karakteristik Usaha Pariwisata di Provinsi Bali
Jurnal Matematika Vol. 6 No. 1, Juni 2016. ISSN: 1693-1394 Analisis Biplot untuk Pemetaan Posisi dan Karakteristik Usaha Pariwisata di Provinsi Bali I Gusti Ayu Made Srinadi Jurusan Matematika, Fakultas
Lebih terperinciPENDEKATAN WINSOR PADA ANALISIS REGRESI DENGAN PENCILAN MURIH PUSPARUM
PENDEKATAN WINSOR PADA ANALISIS REGRESI DENGAN PENCILAN MURIH PUSPARUM DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2015 PERNYATAAN MENGENAI SKRIPSI
Lebih terperinciBAB IV KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA n<<p DAN TERDAPAT KEKOLINEARAN-GANDA
BAB IV KAJIAN SIMULASI: PENDEKATAN BAYES PADA DATA n
Lebih terperinci1. PENDAHULUAN PADA PRODUKSI JAGUNG DI JAWA TENGAH
MODEL REGRESI ROBUST ESTIMASI DENGAN PEMBOBOT FAIR PADA PRODUKSI JAGUNG DI JAWA TENGAH Oktaviana Wulandari, Yuliana Susanti, dan Sri Sulistijowati Handajani Program Studi Matematika FMIPA UNS ABSTRAK.
Lebih terperinciPENDETEKSIAN PENGAMATAN PENCILAN DAN BERPENGARUH DENGAN METODE PENGARUH LOKAL GOSEN SITANGGANG
PENDETEKSIAN PENGAMATAN PENCILAN DAN BERPENGARUH DENGAN METODE PENGARUH LOKAL GOSEN SITANGGANG SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan
Lebih terperinciPENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA
PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciSKRIPSI. Disusun Oleh: Ana Kartikawati NIM. J2E009024
PERBANDINGAN ANALISIS DISKRIMINAN LINIER KLASIK DAN ANALISIS DISKRIMINAN LINIER ROBUST UNTUK PENGKLASIFIKASIAN KESEJAHTERAAN MASYARAKAT KABUPATEN/KOTA DI JAWA TENGAH SKRIPSI Disusun Oleh: Ana Kartikawati
Lebih terperinciPERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN
Saintia Matematika Vol. 1, No. 1 (2013), pp. 73 85. PERBANDINGAN METODE LEAST TRIMMED SQUARES DAN PENAKSIR M DALAM MENGATASI PERMASALAHAN DATA PENCILAN Sri Wulandari, Sutarman, Open Darnius Abstrak. Analisis
Lebih terperinciSILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE :
SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE : JURUSAN PENDIDIKAN MATEMATIKA FAKULTAS PENDIDIKAN MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS PENDIDIKAN INDONESIA 2005-2006 MATAKULIAH
Lebih terperinci