: Analisis Diskriminan pada Klasifikasi Desa di Kabupaten. Tabanan Menggunakan Metode K-Fold Cross Validation. 2. I Gusti Ayu Made Srinadi, S.Si, M.

dokumen-dokumen yang mirip
ANALISIS DISKRIMINAN PADA KLASIFIKASI DESA DI KABUPATEN TABANAN MENGGUNAKAN METODE K-FOLD CROSS VALIDATION

ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 1, Tahun 2014, Halaman 1-10 Online di:

SKRIPSI. Oleh : LAILI ISNA NUR KHIQMAH NIM :

PERBANDINGAN HASIL KLASIFIKASI ANALISIS DISKRIMINAN DAN JARINGAN SYARAF TIRUAN

SKRIPSI. Disusun Oleh: Ana Kartikawati NIM. J2E009024

Perbandingan Analisis Diskriminan dan Analisis Regresi Logistik Ordinal dalam Prediksi Klasifikasi Kondisi Kesehatan Bank

PERBANDINGAN ANALISIS DISKRIMINAN FISHER DAN NAIVE BAYES UNTUK KLASIFIKASI RISIKO KREDIT

SKRIPSI ERLINDA SIREGAR

METODE QUEST DAN CHAID PADA KLASIFIKASI KARAKTERISTIK NASABAH KREDIT [SKRIPSI] KOMPETENSI STATISTIKA

MODUL 5 ANALISIS DISKRIMINAN

ABSTRAK. Kata Kunci : copula, produksi padi, ENSO, copula Archimedean, copula Frank

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

Statistika Industri II TIP - FTP UB

ANALISIS DISKRIMINAN FISHER POPULASI GANDA UNTUK KLASIFIKASI NASABAH KREDIT

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

Bab 1 PENDAHULUAN. 1.1 Latar Belakang

1. I Wayan Sumarjaya, S.Si, M.Stats. 2. I Gusti Ayu Made Srinadi, S.Si, M.Si. ABSTRAK

ANALISIS MODEL REGRESI NONPARAMETRIK SIRKULAR-LINEAR BERGANDA KOMPETENSI STATISTIKA SKRIPSI

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

METODE PAUTAN TERBAIK DALAM PENGELOMPOKAN DESA/KELURAHAN DI KOTA DENPASAR MENURUT INDIKATOR PENDIDIKAN KOMPETENSI STATISTIKA SKRIPSI

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

DISKRIMINAN LINIER UNTUK KLASIFIKASI PERUSAHAAN MANIPULATOR DAN NON-MANIPULATOR. (Studi Kasus Di Bursa Efek Indonesia Tahun 2013)

Analisis Diskriminan Kernel dengan Metode Cross Validation

ANALISIS REGRESI NONPARAMETRIK SPLINE MULTIVARIAT UNTUK PEMODELAN INDIKATOR KEMISKINAN DI INDONESIA KOMPETENSI STATISTIKA SKRIPSI

Kata Kunci : Common Effect, Fixed Effect, Tingkat Kesejahteraan Masyarakat (IPM), Regresi Data Panel

BAB I PENDAHULUAN. 1.1 Latar Belakang

PENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI

PERBANDINGAN ANALISIS KLASIFIKASI MENGGUNAKAN METODE K-NEAREST NEIGHBOR

PENDUGAAN MODEL REGRESI SEMIPARAMETRIK MENGGUNAKAN PENDUGA KERNEL [SKRIPSI] KOMPETENSI STATISTIKA

Analisis Cluster, Analisis Diskriminan & Analisis Komponen Utama. Analisis Cluster

FAKTOR-FAKTOR YANG MEMPENGARUHI PENJURUSAN SISWA MELALUI ANALISIS DISKRIMINAN. Nerli Khairani Lia Anggriani Siregar. Abstrak

PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB)

BAB 2 LANDASAN TEORI

PENERAPAN BOOTSTRAP DALAM METODE MINIMUM COVARIANCE DETERMINANT (MCD) DAN LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI LINIER BERGANDA

PENDUGA PENCILAN BOGOR 2013

SKRIPSI. Disusun Oleh : DINI PUSPITA JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

BAB IV PENGOLAHAN DATA

KETEPATAN PENGKLASIFIKASIAN FUNGSI DISKRIMINAN LINIER ROBUST DUA KELOMPOK DENGAN METODE FAST MINIMUM COVARIATE DETERMINANT (FAST MCD)

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN)

BAB I PENDAHULUAN. Sekolah Menengah Atas (disingkat SMA), adalah jenjang pendidikan

ABSTRAK. Kata kunci: DBD, Efek Spasial, Spatial Autoregressive (SAR).

APLIKASI ANALISIS DISKRIMINAN UNTUK MENENTUKAN FUNGSI PENGELOMPOKAN PADA PROGRAM PEMBAGIAN KARTU KELUARGA SEJAHTERA (KKS)

KLASIFIKASI KEIKUTSERTAAN KELUARGA DALAM PROGRAM KELUARGA BERENCANA (KB) DI KOTA SEMARANG MENGGUNAKAN METODE MARS DAN FK-NNC

ANALISIS DERAJAT KESEHATAN MASYARAKAT PROVINSI BALI DENGAN MENGGUNAKAN METODE MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) KOMPETENSI STATISTIKA

PERAMALAN JUMLAH KUNJUNGAN WISATAWAN AUSTRALIA YANG BERKUNJUNG KE BALI MENGGUNAKAN MODEL TIME VARYING PARAMETER (TVP) KOMPETENSI STATISTIKA SKRIPSI

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 3, Tahun 2015, Halaman Online di:

SKRIPSI. Disusun oleh: DHINDA AMALIA TIMUR

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL

PENGARUH MERCHANDISE, STORE ATMOSPHERE, DAN SERVICE TERHADAP PEMILIHAN FORMAT TOKO PADA TOKO PAKAIAN POLO DI SURABAYA

KLASIFIKASI KELULUSAN MAHASISWA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS)

ABSTRAK. Kata Kunci: kredit, klasifikasi, analisis diskriminan kernel

ANALISIS DISKRIMINAN KUADRATIK PADA PENJURUSAN MADRASAH ALIYAH NEGERI (MAN) 1 JEMBER SKRIPSI. Oleh. Puphus Inda Wati NIM

BAB 1 PENDAHULUAN. 1.1 Latar belakang

ISSN: JURNAL GAUSSIAN, Volume 5, Nomor 1, Tahun 2016, Halaman 1-10 Online di:

PERBANDINGAN REGRESI ROBUST PENDUGA MM DENGAN METODE RANDOM SAMPLE CONSENSUS DALAM MENANGANI PENCILAN

Kata Kunci: Autokorelasi, Heteroskedastisitas, Metode Kuadrat Terkecil, Metode Newey West

IMPLEMENTASI METODE BOOTSTRAP DALAM INFERENSI TITIK- TITIK BIPLOT AMMI MODEL AMMI CAMPURAN (MIXED AMMI)

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Pada Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

SKRIPSI. Disusun Oleh : RAHMA NURFIANI PRADITA

ABSTRAK. Kata Kunci: regresi nonparametrik spline, knot, GCV, angka kematian bayi.

ANALISIS REGRESI MULTILEVEL TERHADAP NILAI UJIAN NASIONAL SISWA KOMPETENSI STATISTIKA SKRIPSI NI LUH AYU FITRIANI JURUSAN MATEMATIKA

TESIS MERRY MAGDALENA UNIVERSITAS INDONESIA FAKULTAS EKONOMI PROGRAM STUDI MAGISTER MANAJEMEN JAKARTA DESEMBER 2008

ABSTRACT. Keywords: Six Sigma, DMAIC, FMEA

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI TINGKAT PRESTASI SISWA SMA NEGERI 1 RANTAU UTARA, KABUPATEN LABUHAN BATU SKRIPSI MUHAMMAD YUSUF

JURNAL MATEMATIKA DAN PEMBELAJARANNYA 2016 VOLUME 2, NO. 1. ISSN

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

PERBANDINGAN REGRESI KOMPONEN UTAMA DAN ROBPCA DALAM MENGATASI MULTIKOLINEARITAS DAN PENCILAN PADA REGRESI LINEAR BERGANDA

Analisis Data Panel Tidak Lengkap Model Komponen Error Dua Arah dengan Metode Minimum Variance Quadratic Unbiased Estimation (MIVQUE) SKRIPSI

DISCRIMINANT ANALYSIS

Judul : Perbandingan Metode MCD Bootstrap dan. Analisis Regresi Linear Berganda. Pembimbing : 1. Dra. Ni Luh Putu Suciptawati,M.Si

II. TINJAUAN PUSTAKA. dengan kendala menjadi model penuh tanpa kendala,

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN)

PENERAPAN REGRESI ZERO-INFLATED NEGATIVE BINOMIAL (ZINB) UNTUK PENDUGAAN KEMATIAN ANAK BALITA

HASIL DAN PEMBAHASAN

ANALISIS PERFORMANSI PERUSAHAAN SYARIAH DI BURSA EFEK INDONESIA (BEI) MENGGUNAKAN METODE DISCRIMINANT ANALYSIS DAN SUPPORT VECTOR MACHINE (SVM)

DEPARTEMEN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

FAKTOR-FAKTOR YANG MEMPENGARUHI RANKING SISWA DENGAN MENGGUNAKAN ANALISIS DISKRIMINAN (STUDI KASUS DI SMP NEGERI 10 MEDAN) SKRIPSI

PROSIDING ISSN: M-14 ANALISIS K-MEANS CLUSTER UNTUK PENGELOMPOKAN KABUPATEN /KOTA DI JAWABARAT BERDASARKAN INDIKATOR MASYARAKAT

BOOTSTRAP AGGREGATING (BAGGING) REGRESI LOGISTIK ORDINAL UNTUK MENGKLASIFIKASIKAN STATUS GIZI BALITA DI KABUPATEN KLUNGKUNG

PENERAPAN METODE GENERALIZED RIDGE REGRESSION DALAM MENGATASI MASALAH MULTIKOLINEARITAS

PERBANDINGAN TRANSFORMASI BOX-COX DAN REGRESI KUANTIL MEDIAN DALAM MENGATASI HETEROSKEDASTISITAS

ANALISIS REGRESI LOGISTIK ORDINAL PADA FAKTOR-FAKTOR BERPENGARUH TERHADAP PENYAKIT MATA KATARAK BAGI PASIEN PENDERITA DI KLINIK MATA UTAMA GRESIK

KLASIFIKASI KEIKUTSERTAAN KELUARGA DALAM PROGRAM KELUARGA BERENCANA (KB) DI KOTA SEMARANG MENGGUNAKAN METODE MARS DAN FK-NNC

ESTIMASI PARAMETER PADA MODEL REGRESI LINIER MULTILEVEL DENGAN METODE RESTRICTED MAXIMUM LIKELIHOOD (REML) abang Semarang SKRIPSI.

ABSTRAK. : Mortalitas, estimasi, dan model Lee-Carter.

PEMODELAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION

BAB I PENDAHULUAN. logistik didasarkan pada pendekatan analisis regresi linear merupakan metode yang

PEMODELAN PERSENTASE BALITA GIZI BURUK DI JAWA TENGAH DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENTS ANALYSIS (GWRPCA)

SILABUS PERKULIAHAN METODE STATISTIKA MULTIVARIAT 3 SKS KODE :

BAB II TINJAUAN PUSTAKA. konsep-konsep dasar pada QUEST dan CHAID, algoritma QUEST, algoritma

TUGAS AKHIR PEMODELAN REGRESI SPLINE. (Studi Kasus: Herpindo Jaya Cabang Ngaliyan) KOMPETENSI STATISTIKA I MADE BUDIANTARA PUTRA JURUSAN MATEMATIKA

BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

IMPLEMENTASI METODE PENALIZED MAXIMUM LIKELIHOOD ESTIMATION PADA MODEL REGRESI LOGISTIK BINER SKRIPSI. Oleh Miftahus Sholihin NIM

PERBANDINGAN METODE MCD-BOOTSTRAP DAN LAD- BOOTSTRAP DALAM MENGATASI PENGARUH PENCILAN PADA ANALISIS REGRESI LINEAR BERGANDA

SKRIPSI. Disusun Oleh : YUSUF ARIFKA RAHMAN

ABSTRAK. Kata kunci : Metode Binomial Tree, Opsi Amerika, Variance Matching, Proposional u d = 1, Risk Neutral.

Penerapan Garis Berat Segitiga Centroid untuk Menentukan Kelompok pada Analisis Diskriminan

Analisis Diskriminan

Klasifikasi Kecamatan Berdasarkan Nilai Akhir SMA/MA di Kabupaten Aceh Selatan Menggunakan Analisis Diskriminan

Transkripsi:

Judul : Analisis Diskriminan pada Klasifikasi Desa di Kabupaten Tabanan Menggunakan Metode K-Fold Cross Validation Nama : Ida Ayu Made Supartini Pembimbing : 1. Ir. I Komang Gde Sukarsa, M.Si 2. I Gusti Ayu Made Srinadi, S.Si, M.Si ABSTRAK Kabupaten Tabanan merupakan salah satu kabupaten dari kabupaten dan kota yang ada di Provinsi Bali. Secara administratif Kabupaten Tabanan dibagi menjadi kecamatan dan desa. Wilayah kabupaten mempunyai bagianbagian yang merupakan kawasan perdesaan dan kawasan perkotaan. Analisis Diskriminan adalah metode analisis peubah ganda yang bertujuan untuk memisahkan objek pengamatan yang berbeda dan mengalokasikan objek pengamatan baru ke dalam kelompok yang telah didefinisikan, sehingga analisis diskriminan dapat digunakan untuk mengelompokkan desa ke dalam kelompok perkotaan atau perdesaan. Analisis diskriminan linear mengasumsikan bahwa matriks ragam-peragam adalah homogen, jika asumsi kehomogenan ragam tidak terpenuhi maka dapat digunakan analisis diskriminan kuadratik untuk pengelompokkan. Penelitian ini menggunakan metode k-fold cross validation untuk menghitung keakuratan fungsi diskriminan kuadratik dengan. Fungsi diskriminan kuadratik diperoleh pada dengan nilai APER terkecil ( ). Semua hasil klasifikasi yang diperoleh adalah stabil dan konsisten. Kata kunci: analisis diskriminan kuadratik, k-fold cross validation klasifikasi, perdesaan, perkotaan v

Title : Discriminant Analysis in Village s Classification at Tabanan Regency Using K-Fold Cross Validation Method Name Supervisors : Ida Ayu Made Supartini : 1. Ir. I Komang Gde Sukarsa, M.Si 2. I Gusti Ayu Made Srinadi, S.Si, M.Si ABSTRACT Tabanan Regency is one of regencies and town in Bali Province. Administratively, it is divided into districs and villages. Discriminant analysis is a technique related to the separation of objects into different groups that have been set previously, thus discriminant analysis can be used to classify villlages into urban or rural groups. Linear discriminant analysis assumes that the covariance matrix of the two groups are equals, if the assumption of equality covariance matrix is denied, quadratic discriminant analysis can be used for classification. This research used k-fold crosss validation method for calculating the accuracy of quadratic discriminant function where. Quadratic discriminant function is obtained by with the smallest APER value ( ). All of classification results are stable and consistence. Keywords: Quadratic Disciminant Analysis, K-Fold Cross Validation, classification, rural, urban vi

DAFTAR ISI LEMBAR JUDUL... i LEMBAR PERSEMBAHAN... ii LEMBAR PERNYATAAN... iii LEMBAR PENGESAHAN TUGAS AKHIR... iv ABSTRAK... v ABSTRACT... vi BIODATA ALUMNI... vii KATA PENGANTAR... viii DAFTAR ISI... x DAFTAR TABEL... xiii DAFTAR GAMBAR... xv BAB I PENDAHULUAN... 1 1.1 Latar Belakang... 1 1.2 Rumusan Masalah... 4 1.3 Batasan Masalah... 5 1.4 Tujuan Penelitian... 5 1.5 Manfaat Penelitian... 5 BAB II TINJAUAN PUSTAKA... 7 2.1 Penelitian Sebelumnya... 7 2.2 Analisis Peubah Ganda... 8 2.3 Analisis Diskriminan... 10 2.3.1 Signifikansi Fungsi Diskriminan... 18 2.3.2 Uji Distribusi Normal Ganda... 19 2.3.3 Uji Vektor Nilai Rata-Rata... 20 2.3.4 Uji Kehomogenan Ragam (Box's M)... 21 2.3.5 Pencilan Peubah Ganda... 22 2.3.6 Penduga Maximum Likelihood Estimation (MLE)... 23 2.3.7 Metode Cross Validation... 25 2.3.8 Mengalokasikan Individu Baru untuk Analisis Diskriminan dengan Dua Kelompok... 27 x

xi 2.4 Uji Ketepatan Klasifikasi... 28 2.4.1 Apparent Error Rate (APER)... 29 2.4.2 Uji Keakuratan... 29 2.4.3 Uji Kestabilan... 31 2.5 Penentuan Status Daerah... 31 2.5.1 Daerah Perkotaan dan Daerah Perdesaan... 32 2.5.2 Kriteria Desa Perkotaan... 32 BAB III METODE PENELITIAN... 35 3.1 Sumber Data... 35 3.2 Identifikasi Peubah Penelitian... 35 3.3 Metode Analisis Data... 35 BAB IV HASIL DAN PEMBAHASAN... 37 4.1 Statistik Deskriptif... 37 4.2 Uji Asumsi Dasar Analisis Diskriminan... 38 4.2.1 Uji Distribusi Normal Ganda... 38 4.2.2 Uji Vektor Nilai Rata-Rata... 41 4.2.3 Uji Kehomogenan Matriks Ragam Peragam... 42 4.2.4 Uji Pencilan (Outlier)... 43 4.3 Analisis Diskriminan Bertatar (Stepwise Discriminant Analysis)... 45 4.4 Metode K-Fold Cross Validation... 47 4.4.1 Metode 2-Fold Cross Validation... 48 4.4.2 Metode 3-Fold Cross Validation... 53 4.4.3 Metode 4-Fold Cross Validation... 63 4.5 Uji Ketepatan Klasifikasi... 77 4.5.1 Peluang Kesalahan Klasifikasi (APER)... 77 4.5.2 Uji Keakuratan... 83 4.5.3 Uji Kestabilan... 85 BAB V SIMPULAN DAN SARAN... 87 5.1 Simpulan... 87 5.2 Saran... 88 DAFTAR PUSTAKA... 89

LAMPIRAN... 91 xii

DAFTAR TABEL Tabel 2.1 Tabel Kesalahan Klasifikasi... 29 Tabel 2.2 Variabel, Klasifikasi, Skor, dan Kriteria Desa Perkotaan... 33 Tabel 4.1 Deskriptif Data Klasifikasi Desa di Kabupaten Tabanan... 37 Tabel 4.2 Nilai Jarak Mahalanobis masing-masing data... 39 Tabel 4.3 Hasil Uji Vektor Nilai Rata-Rata... 41 Tabel 4.4 Hasil Uji Box s M... 42 Tabel 4.5 Hasil Uji Stepwise menggunakan Nilai Jarak Mahalanobis... 46 Tabel 4.6 Hasil Uji Stepwise menggunakan Nilai Wilks' Lambda... 46 Tabel 4.7Tabel Prediksi untuk Data Training (K2)... 49 Tabel 4.8 Tabel Prediksi untuk Data Testing (K1)... 51 Tabel 4.9 Tabel Prediksi untuk Data Training (K2 dan K3)... 54 Tabel 4.10 Tabel Prediksi untuk Data Testing (K1)... 56 Tabel 4.11 Tabel Prediksi untuk Data Training (K1 dan K3)... 57 Tabel 4.12 Tabel Prediksi untuk Data Testing (K2)... 59 Tabel 4.13 Tabel Prediksi untuk Data Training (K1 dan K2)... 60 Tabel 4.14 Tabel Prediksi untuk Data Testing (K3)... 62 Tabel 4.15 Tabel Prediksi untuk Data Training (K2, K3 dan K4)... 64 Tabel 4.16 Tabel Prediksi untuk Data Testing (K1)... 66 Tabel 4.17 Tabel Prediksi untuk Data Training (K1,K3 dan K4)... 67 Tabel 4.18 Tabel Prediksi untuk Data Testing (K2)... 69 Tabel 4.19 Tabel Prediksi untuk Data Training (K1,K2 dan K4)... 70 Tabel 4.20 Tabel Prediksi untuk Data Testing (K3)... 72 Tabel 4.21 Tabel Prediksi untuk Data Training (K1,K2 dan K3... 73 Tabel 4.22 Tabel Prediksi untuk Data Testing (K4)... 75 Tabel 4.23 Hasil klasifikasi data training (K2)... 77 Tabel 4.24 Hasil klasifikasi data testing (K1)... 77 Tabel 4.25 Hasil klasifikasi data training (K1)... 78 Tabel 4.26 Hasil klasifikasi data testing (K2)... 78 Tabel 4.27 Hasil klasifikasi data training (K2 dan K3)... 78 Tabel 4.28 Hasil klasifikasi data testing (K1)... 79 xiii

xiv Tabel 4.29 Hasil klasifikasi data training (K1 dan K3)... 79 Tabel 4.30 Hasil klasifikasi data testing (K2)... 79 Tabel 4.31 Hasil klasifikasi data training (K1 dan K2)... 80 Tabel 4.32 Hasil klasifikasi data testing (K3)... 80 Tabel 4.33 Hasil klasifikasi data training (K2, K3 dan K4)... 80 Tabel 4.34 Hasil klasifikasi data testing (K1)... 81 Tabel 4.35 Hasil klasifikasi data training (K1, K3 dan K4)... 81 Tabel 4.36 Hasil klasifikasi data testing (K2)... 81 Tabel 4.37 Hasil klasifikasi data training (K1, K2 dan K4)... 82 Tabel 4.38 Hasil klasifikasi data testing (K3)... 82 Tabel 4.39 Hasil klasifikasi data training (K1, K2 dan K3)... 82 Tabel 4.40 Hasil klasifikasi data testing (K4)... 83 Tabel 4.41 Uji Keakuratan Hasil Klasifikasi... 84 Tabel 4.42 Uji Kestabilan Hasil Klasifikasi... 86

DAFTAR GAMBAR Gambar 2.1 Representasi Metode k-fold Cross Validation... 27 Gambar 4.1 Plot Distribusi Normal Ganda Seluruh Peubah Prediktor... 38 xv

BAB I PENDAHULUAN 1.1 Latar Belakang Seiring dengan perkembangan teknologi komputer dan pengaplikasian perangkat lunak statistika dalam analisis data, ilmu statistika mengalami perkembangan yang pesat dalam hal pengkajian data. Salah satu kajian dalam analisis statistika adalah kajian yang membahas tentang pengelompokkan suatu individu baru ke dalam kelompok yang sudah ada berdasarkan karakteristik data. Analisis peubah ganda yang digunakan untuk tujuan tersebut adalah analisis diskriminan. Analisis diskriminan bisa digunakan pada hubungan dependensi yaitu hubungan antar peubah yang sudah diketahui dengan jelas perbedaan antara peubah respon yang berskala nominal atau ordinal dan peubah penjelas yang berskala interval atau rasio. Analisis Diskriminan adalah metode analisis peubah ganda yang bertujuan untuk memisahkan objek pengamatan yang berbeda dan mengalokasikan objek pengamatan baru ke dalam kelompok yang telah didefinisikan (Johnson & Wichern, 2007). Dua asumsi utama yang harus dipenuhi pada analisis diskriminan adalah sejumlah peubah penjelas harus berdistribusi normal ganda dan memenuhi asumsi kehomogenan ragam. Analisis diskriminan digunakan untuk mengetahui peubah-peubah penciri yang membedakan kelompok populasi yang ada. Kelompok-kelompok yang terbentuk bersifat saling lepas yang artinya bahwa setiap pengamatan hanya dapat dimasukkan ke dalam salah satu kelompok. 1

2 Pada analisis diskriminan, estimasi parameter bisa menggunakan metode Maximum Likelihood Estimation (MLE). Metode Maximum Likelihood Estimation (MLE) digunakan sebagai penduga parameter apabila asumsi sebaran normal ganda terpenuhi. Fungsi yang terbentuk dalam analisis diskriminan disebut fungsi diskriminan. Fungsi diskriminan Fisher mengasumsikan bahwa pengamatan diambil dari populasi yang menyebar normal ganda (Johnson dan Wichern, 2007). Fungsi diskriminan Fisher dibentuk berdasarkan pada pendugaan vektor rata-rata dan matriks ragam-peragam yang diukur dengan kriteria rasio kemungkinan maksimum yang disebut sebagai Wilk s Lambda (Likelihood Ratio Test). Selain estimasi parameter, pada analisis diskriminan bisa dilakukan suatu validasi keakuratan model fungsi diskriminan. Validasi keakuratan model bisa menggunakan metode cross validation. Prinsip dasar metode cross validation adalah membagi keseluruhan data menjadi data training dan data testing. Data training digunakan untuk membentuk model fungsi diskriminan dan data testing digunakan untuk memeriksa apakah model fungsi diskriminan yang diperoleh menggunakan data training dapat diterapkan pada data baru. Penelitian ini akan menggunakan metode k-fold cross validation. Pada metode k-fold cross validation dataset dibagi menjadi sejumlah buah partisi secara acak. Selanjutnya, dilakukan sejumlah -kali eksperimen dengan masing-masing eksperimen menggunakan data partisi ke- sebagai data testing dan menggunakan sisa partisi lainnya sebagai data training. Eksperimen yang akan dilakukan sesuai dengan jumlah partisi yang dilakukan (Davidson & Hinkley, 1997).

3 Analisis diskriminan bisa diterapkan di bidang pendidikan, industri, kesehatan, sosial, ekonomi dan lainnya. Penerapan analisis diskriminan pada penelitian ini yaitu pada klasifikasi wilayah desa di Kabupaten Tabanan. Menurut Badan Pusat Statistik (2010), wilayah Indonesia dibagi ke dalam beberapa tingkat wilayah administratif, yaitu provinsi, kabupaten/kota, kecamatan, dan desa atau disebut dengan nama lain yang merupakan wilayah administratif terkecil. Kabupaten Tabanan merupakan salah satu kabupaten dari 8 kabupaten dan 1 kota yang ada di Provinsi Bali. Secara administratif Kabupaten Tabanan dibagi menjadi 10 kecamatan dan 133 desa. Berdasarkan besarnya wilayah, Kabupaten Tabanan merupakan kabupaten terbesar kedua di Provinsi Bali. Menurut Badan Pusat Statistik Kabupaten Tabanan (2016), luas keseluruhan wilayah Kabupaten Tabanan adalah 839,33 km² (14,90% dari luas provinsi Bali). Wilayah kabupaten mempunyai bagian-bagian yang merupakan kawasan perdesaan dan kawasan perkotaan. Setiap desa mempunyai karakteristik sosial, ekonomi, kondisi dan akses ke fasilitas perkotaan, ciri dan tipologi lingkungan yang berbeda-beda dan akan terus berubah seiring dengan kemajuan tingkat pembangunan di suatu desa. Badan Pusat Statistik menggunakan kondisi yang berbeda dan terus mengalami perubahan tersebut sebagai indikator untuk menggolongkan suatu desa ke dalam desa perkotaan atau desa perdesaan. Pada pelaksanaannya, penentuan apakah suatu desa/kelurahan termasuk daerah perkotaan atau perdesaan dilakukan oleh Badan Pusat Statistik berdasakan Peraturan Kepala Badan Pusat Statistik Nomor 37 Tahun 2010 tentang Klasifikasi Perkotaan dan Perdesaan di Indonesia (Badan Pusat Statistik, 2010).

4 Badan Pusat Statistik sebagai badan penyedia data pembagian wilayah administratif yang telah diklasifikasikan menjadi wilayah desa perkotaan atau desa perdesaan digunakan untuk keperluan statistik dan keperluan lainnya yang berhubungan dengan analisis dan perencanaan pembangunan. Data klasifikasi desa perkotaan dan desa perdesaan digunakan sebagai dasar untuk merencanakan kegiatan sensus atau survey (Badan Pusat Statistik, 2010). Kegunaan lainnya adalah jika terdapat perencanaan pembangunan dalam hal pemekaran wilayah maka berdasarkan Peraturan Kepala Badan Pusat Statistik Nomor 37 Tahun 2010 Pasal 4 menyebutkan bahwa apabila ada pembentukan desa/kelurahan/upt baru, dimana desa/kelurahan baru tidak memiliki desa/kelurahan induk, maka status perkotaan/perdesaan dari desa/kelurahan baru tersebut harus ditentukan dengan mengimplementasikan kriteria wilayah perkotaan yang sama. Menurut Tarigan (2003), perencanaan pembangunan wilayah tersebut mencakup berbagai aspek yang tentunya mempertimbangkan peran keterkaitan antara desa dan kota. Berdasarkan kriteria desa perkotaan dan desa perdesaan yang tercantum dalam peraturan tersebut penulis bermaksud melakukan pengklasifikasian desa di Kabupaten Tabanan ke dalam kelompok daerah perkotaan atau perdesaan dengan teknik analisis diskriminan menggunakan k-fold cross validation. 1.2 Rumusan Masalah Berdasarkan pemaparan latar belakang masalah, rumusan masalah dalam penelitian ini yaitu: 1. Bagaimana model klasifikasi desa di Kabupaten Tabanan yang dihasilkan dengan teknik analisis diskriminan menggunakan k-fold cross validation?

5 2. Bagaimana hasil klasifikasi desa di Kabupaten Tabanan yang dihasilkan dengan teknik analisis diskriminan menggunakan k-fold cross validation? 3. Bagaimana ketepatan hasil klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan Apparent Error Rate (APER)? 1.3 Batasan Masalah Adapun batasan dari penelitian ini yaitu: 1. Penelitian ini menggunakan teknik analisis diskriminan dengan metode k- fold cross validation pada klasifikasi desa di Kabupaten Tabanan. 2. Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari Badan Pusat Statistik Kabupaten Tabanan tahun 2015. 1.4 Tujuan Penelitian Berdasarkan pemaparan rumusan masalah, tujuan dari penelitian ini yaitu: 1. Mengestimasi model klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan k-fold cross validation. 2. Mengetahui hasil klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan k-fold cross validation. 3. Mengetahui ketepatan hasil klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan Apparent Error Rate (APER). 1.5 Manfaat Penelitian Adapun manfaat yang diharapkan peneliti mengenai aplikasi analisis diskriminan dengan metode k-fold cross validation pada klasifikasi desa di Kabupaten Tabanan yaitu:

6 1. Bagi penulis, dapat mengetahui estimasi model klasifikasi dan ketepatan hasil klasifikasi desa di Kabupaten Tabanan dengan teknik analisis diskriminan menggunakan k-fold cross validation. 2. Bagi pembaca, dapat memberikan referensi dalam penelitian selanjutnya mengenai teknik analisis diskriminan menggunakan k-fold cross validation.