PERBANDINGAN ANALISIS KLASIFIKASI MENGGUNAKAN METODE K-NEAREST NEIGHBOR

dokumen-dokumen yang mirip
ISSN: JURNAL GAUSSIAN, Volume 3, Nomor 3, Tahun 2014, Halaman Online di:

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN)

KLASIFIKASI KEIKUTSERTAAN KELUARGA DALAM PROGRAM KELUARGA BERENCANA (KB) DI KOTA SEMARANG MENGGUNAKAN METODE MARS DAN FK-NNC

KLASIFIKASI KELULUSAN MAHASISWA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS)

SKRIPSI. Disusun Oleh : YUSUF ARIFKA RAHMAN

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN)

KLASIFIKASI KEIKUTSERTAAN KELUARGA DALAM PROGRAM KELUARGA BERENCANA (KB) DI KOTA SEMARANG MENGGUNAKAN METODE MARS DAN FK-NNC

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI STATUS KERJA DI KABUPATEN DEMAK Kishartini 1, Diah Safitri 2, Dwi Ispriyanti 3

KLASIFIKASI KELULUSAN MAHASISWA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS)

SKRIPSI. Oleh : PUSPHITA ANNA OCTAVIANI NIM PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM)

PEMODELAN INDEKS HARGA SAHAM GABUNGAN (IHSG) MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS)

SKRIPSI. Disusun Oleh : DINI PUSPITA JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

PEMODELAN PERSENTASE BALITA GIZI BURUK DI JAWA TENGAH DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENTS ANALYSIS (GWRPCA)

UNNES Journal of Mathematics

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI STATUS KERJA DI KABUPATEN DEMAK

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

SKRIPSI. Disusun Oleh : CANDRA SILVIA

PEMODELAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION

PEMODELAN DATA INDEKS HARGA SAHAM GABUNGAN. Disusun Oleh : NOVIA AGUSTINA. Skripsi. Jurusan Statistika Fakultas Sains dan Matematika Undip

PEMODELAN TINGKAT PENGANGGURAN TERBUKA DI PROVINSI JAWA TENGAH MENGGUNAKAN REGRESI SPLINE

BAB IV HASIL DAN PEMBAHASAN. mendapatkan model dan faktor-faktornya, terlebih dahulu akan dibahas. bagaimana mendapatkan sampel dalam penelitian ini.

SKRIPSI. Disusun Oleh : RAHMA NURFIANI PRADITA

PEMODELAN MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) PADA FAKTOR-FAKTOR RESIKO ANGKA KESAKITAN DIARE

SKRIPSI. Disusun oleh: DHINDA AMALIA TIMUR

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) UNTUK KLASIFIKASI KEJADIAN KONSTIPASI TERHADAP PEMBERIAN AIR SUSU IBU DAN PEMBERIAN AIR SUSU FORMULA

KETEPATAN KLASIFIKASI STATUS KERJA DI KOTA TEGAL MENGGUNAKAN ALGORITMA C4.5 DAN FUZZY K-NEAREST NEIGHBOR IN EVERY CLASS (FK-NNC) SKRIPSI

PEMODELAN KASUS KEMISKINAN DI JAWA TENGAH MENGGUNAKAN REGRESI NONPARAMETRIK METODE B-SPLINE

KETEPATAN KLASIFIKASI KEIKUTSERTAAN KELUARGA BERENCANA MENGGUNAKAN REGRESI LOGISTIK BINER DAN REGRESI PROBIT BINER

PENENTUAN MODEL KEMISKINAN DI JAWA TENGAH DENGAN MULTIVARIATE GEOGRAPHICALLY WEIGHTED REGRESSION (MGWR)

Kata Kunci: Komponen Akreditasi, Multivariate Adaptive Regression Spline (MARS)

PERBANDINGAN REGRESI KOMPONEN UTAMA DENGAN REGRESI RIDGE PADA ANALISIS FAKTOR-FAKTOR PENDAPATAN ASLI DAERAH (PAD) PROVINSI JAWA TENGAH

KLASIFIKASI TINGKAT KELANCARAN NASABAH DALAM MEMBAYAR PREMI DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL DAN NAÏVE BAYES SKRIPSI

PERAMALAN JUMLAH TAMU HOTEL DI KABUPATEN DEMAK

ANALISIS DESAIN FAKTORIAL FRAKSIONAL 2k-p DENGAN METODE LENTH

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

PEMODELAN PENDAPATAN ASLI DAERAH (PAD) DI KABUPATEN DAN KOTA DI JAWA TENGAH MENGGUNAKAN GEOGRAPHICALLY WEIGHTED RIDGE REGRESSION

GEOGRAPHICALLY WEIGHTED REGRESSION PRINCIPAL COMPONENT ANALYSIS (GWRPCA) PADA PEMODELAN PENDAPATAN ASLI DAERAH DI JAWA TENGAH

PENDUGAAN ANGKA PUTUS SEKOLAH DI KABUPATEN SEMARANG DENGAN METODE PREDIKSI TAK BIAS LINIER TERBAIK EMPIRIK PADA MODEL PENDUGAAN AREA KECIL SKRIPSI

oleh FAIFAR NUR CHAYANINGTYAS M SKRIPSI ditulis dan diajukan untuk memenuhi sebagian persyaratan memperoleh gelar Sarjana Sains Matematika

PERBANDINGAN ANALISIS DISKRIMINAN FISHER DAN NAIVE BAYES UNTUK KLASIFIKASI RISIKO KREDIT

DISKRIMINAN LINIER UNTUK KLASIFIKASI PERUSAHAAN MANIPULATOR DAN NON-MANIPULATOR. (Studi Kasus Di Bursa Efek Indonesia Tahun 2013)

PEMODELAN REGRESI LINIER MULTIVARIAT DENGAN METODE PEMILIHAN MODEL FORWARD SELECTION

ANALISIS DERAJAT KESEHATAN MASYARAKAT PROVINSI BALI DENGAN MENGGUNAKAN METODE MULTIVARIATE ADAPTIVE REGRESSION SPLINES (MARS) KOMPETENSI STATISTIKA

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI LAJU PERTUMBUHAN PENDUDUK KOTA SEMARANG TAHUN 2011 MENGGUNAKAN GEOGRAPHICALLY WEIGHTED LOGISTIC REGRESSION

PEMODELAN KURS RUPIAH TERHADAP DOLLAR AMERIKA SERIKAT MENGGUNAKAN

ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KEMISKINAN DI JAWA TENGAH MENGGUNAKAN MODEL GALAT SPASIAL

RANCANGAN D-OPTIMAL UNTUK REGRESI POLINOMIAL DERAJAT 3 DENGAN HETEROSKEDASTISITAS

Kata Kunci: Penciri Tingkat Kesejahteraan, Kemiskinan, bagging MARS

BAB II TINJAUAN PUSTAKA. penelitian yang berjudul Penerapan Metode Multivariate Adaptive Regression Splines

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

ANALISIS INFLASI KOTA SEMARANG MENGGUNAKAN METODE REGRESI NON PARAMETRIK B-SPLINE

ANALISIS LAPANGAN PEKERJAAN UTAMA DI JAWA TENGAH BERDASARKAN GRAFIK BIPLOT SQRT (SQUARE ROOT BIPLOT)

SKRIPSI JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

PENDUGAAN AREA KECIL TERHADAP PENGELUARAN PER KAPITA DI KABUPATEN SRAGEN DENGAN PENDEKATAN KERNEL SKRIPSI

SKRIPSI. Oleh : LAILI ISNA NUR KHIQMAH NIM :

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

PERBANDINGAN METODE RUNTUN WAKTU FUZZY-CHEN DAN DI INDONESIA

OPTIMALISASI PROSES PRODUKSI YANG MELIBATKAN BEBERAPA FAKTOR DENGAN LEVEL YANG BERBEDA MENGGUNAKAN METODE TAGUCHI SKRIPSI

PEMODELAN DINAMIS PRODUKSI PADI DI JAWA TENGAH MENGGUNAKAN METODE KOYCK DAN ALMON

ANALISIS REGRESI NONPARAMETRIK KERNEL DAN SAMPEL TERHAPUS-2. (Studi Kasus: Pemodelan Tingkat Inflasi Terhadap Nilai Tukar Rupiah di

PEMODELAN REGRESI SPLINE TRUNCATED UNTUK DATA LONGITUDINAL

ISSN: JURNAL GAUSSIAN, Volume 5, Nomor 1, Tahun 2016, Halaman Online di:

PEMODELAN UPAH MINIMUM KABUPATEN/KOTA DI JAWA TENGAH BERDASARKAN FAKTOR-FAKTOR YANG MEMPENGARUHINYA MENGGUNAKAN REGRESI RIDGE

REGRESI SPLINE SEBAGAI ALTERNATIF DALAM PEMODELAN KURS RUPIAH TERHADAP DOLAR AMERIKA SERIKAT SKRIPSI

SKRIPSI. Disusun Oleh: Ana Kartikawati NIM. J2E009024

APLIKASI SPLINE TRUNCATED DALAM REGRESI NONPARAMETRIK SKRIPSI FIKA KHAIRANI

PEMODELAN REGRESI 3-LEVEL DENGAN METODE ITERATIVE GENERALIZED LEAST SQUARE (IGLS) (Studi Kasus: Lamanya pendidikan Anak di Kabupaten Semarang)

PENENTUAN KOEFISIEN KORELASI KANONIK DAN INTERPRETASI FUNGSI KANONIK MULTIVARIAT

PENERAPAN METODE MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) UNTUK MENENTUKAN FAKTOR YANG MEMPENGARUHI MASA STUDI MAHASISWA FPMIPA UPI

KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL

SKRIPSI. Disusun oleh: Alin Citra Suardi

ANALISIS JALUR TERHADAP FAKTOR-FAKTOR YANG MEMPENGARUHI INDEKS PRESTASI KUMULATIF (IPK) MAHASISWA STATISTIKA UNDIP

ADLN - PERPUSTAKAAN UNIVERSITAS AIRLANGGA

METODE REGRESI DATA PANEL UNTUK PERAMALAN KONSUMSI ENERGI DI INDONESIA

SKRIPSI. Disusun oleh: NOVIAN TRIANGGARA

BAB II TINJAUAN PUSTAKA

SKRIPSI. Oleh: RENGGANIS PURWAKINANTI

SKRIPSI JURUSAN STATISTIKA PERAMALAN INDEKS HARGA KONSUMEN 4 KOTA DI JAWA TENGAH MENGGUNAKAN MODEL GENERALIZED SPACE TIME AUTOREGRESSIVE (GSTAR)

PERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES)

PENERAPAN REGRESI LINIER MULTIVARIAT PADA DISTRIBUSI UJIAN NASIONAL 2014 (Pada Studi Kasus Nilai Ujian Nasional 2014 SMP Negeri 1 Sayung)

PERBANDINGAN MODEL PERTUMBUHAN EKONOMI DI JAWA TENGAH DENGAN METODE REGRESI LINIER BERGANDA DAN METODE GEOGRAPHICALLY WEIGHTED REGRESSION SKRIPSI

ANALISIS PENGARUH JUMLAH UANG BEREDAR DAN NILAI TUKAR RUPIAH TERHADAP INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN PEMODELAN REGRESI SEMIPARAMETRIK KERNEL

ESTIMASI KURVA YIELD OBLIGASI PEMERINTAH KODE FR (FIXED RATE) MENGGUNAKAN CUBIC B-SPLINE

KLASIFIKASI RUMAH LAYAK HUNI DI KABUPATEN BREBES DENGAN MENGGUNAKAN METODE LEARNING QUANTIZATION DAN NAIVE BAYES

PEMILIHAN MODEL REGRESI NONPARAMETRIK TERBAIK UNTUK ANALISIS DATA INFLASI DI JAWA TENGAH SKRIPSI. Oleh: ELYAS DARMAWAN NIM.

KARTIKA HITASARI NIM : JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

SKRIPSI. Disusun Oleh: MARTA WIDYASTUTI

KLASIFIKASI KABUPATEN/KOTA DI JAWA TIMUR BERDASARKAN TINGKAT PENGANGGURAN TERBUKA DENGAN PENDEKATAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS)

PENDUGAAN PENGELUARAN PER KAPITA DI KABUPATEN BREBES

KLASIFIKASI CALON PENDONOR DARAH MENGGUNAKAN METODE NAÏVE BAYES CLASSIFIER

ANALISIS PENGARUH KURS RUPIAH TERHADAP INDEKS HARGA SAHAM GABUNGAN MENGGUNAKAN DISTRIBUTED LAG MODEL SKRIPSI

ANALISIS NILAI RISIKO (VALUE AT RISK) MENGGUNAKAN UJI KEJADIAN BERNOULLI (BERNOULLI COVERAGE TEST) (Studi Kasus pada Indeks Harga Saham Gabungan)

ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)

ANALISIS KELOMPOK DENGAN ALGORITMA FUZZY C-MEANS DAN GUSTAFSON KESSEL CLUSTERING PADA INDEKS LQ45

VERIFIKASI MODEL ARIMA MUSIMAN MENGGUNAKAN PETA KENDALI MOVING RANGE

ADLN PERPUSTAKAAN UNIVERSITAS AIRLANGGA SKRIPSI

MENGIDENTIFIKASI DATA REKAM MEDIS. (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian. Perindustrian, Jakarta) SKRIPSI

METODE LENTH PADA RANCANGAN FAKTORIAL FRAKSIONAL DENGAN ESTIMASI EFEK ALGORITMA YATES

REGRESI SEMIPARAMETRIK SPLINE TRUNCATED DENGAN SOFTWARE R. Abstract. Keywords: Spline Truncated, GCV, Software R.

Transkripsi:

PERBANDINGAN ANALISIS KLASIFIKASI MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) DAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) PADA DATA AKREDITASI SEKOLAH DASAR NEGERI DI KOTA SEMARANG SKRIPSI Oleh : BISRI MERLUARINI 24010210130071 JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2014

PERBANDINGAN ANALISIS KLASIFIKASI MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) DAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) PADA DATA AKREDITASI SEKOLAH DASAR NEGERI DI KOTA SEMARANG Oleh : BISRI MERLUARINI 24010210130071 Diajukan sebagai Salah Satu Syarat untuk Memperoleh Gelar Sarjana Sains pada Jurusan Statistika FSM UNDIP JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG 2014 i

ii

iii

KATA PENGANTAR Puji syukur ke hadirat Allah SWT yang telah melimpahkan karunia-nya sehingga penulis dapat menyelesaikan Tugas Akhir yang berjudul Perbandingan Analisis Klasifikasi Menggunakan Metode K-Nearest Neighbor (K-NN) dan Multivariate Adaptive Regression Spline (MARS) pada Data Akreditasi Sekolah Dasar Negeri di Kota Semarang. Tugas Akhir ini disusun sebagai salah satu syarat untuk memperoleh gelar Sarjana pada Jurusan Statistika Universitas Diponegoro. Tanpa adanya bantuan dari berbagai pihak, Tugas Akhir ini tidak akan berjalan dengan baik. Oleh karena itu penulis menyampaikan terimakasih kepada : 1. Ibu Dra. Dwi Ispriyanti, M.Si selaku Ketua Jurusan Statistika Fakultas Sains dan Matematika Universitas Diponegoro. 2. Ibu Diah Safitri, S.Si., M.Si dan Bapak Abdul Hoyyi, S.Si., M.Si selaku dosen pembimbing I dan dosen pembimbing II yang telah memberikan bimbingan dan pengarahan dalam penulisan Tugas Akhir ini. 3. Bapak dan Ibu dosen Jurusan Statistika Universitas Diponegoro yang telah memberikan ilmu yang bermanfaat. 4. Semua pihak yang tidak dapat disebutkan satu per satu yang telah mendukung penulis dalam menyelesaikan Tugas Akhir ini. Penulis berharap Tugas Akhir ini bermanfaat bagi civitas akademika di Universitas Diponegoro khususnya Jurusan Statistika dan masyarakat umumnya. Semarang, Juni 2014 Penulis iv

ABSTRAK Metode klasifikasi telah sangat berkembang dan dua diantara metode klasifikasi yang telah ada yaitu metode K-Nearest Neighbor (K-NN) dan metode Multivariate Adaptive Regression Spline (MARS). Penelitian ini bertujuan untuk membandingkan pengklasifikasian akreditasi Sekolah Dasar Negeri (SDN) di kota Semarang antara metode K-NN dan MARS. Penelitian ini menggunakan data akreditasi serta hasil penilaian kedelapan komponen akreditasi pada Sekolah Dasar Negeri berakreditasi A (kelompok 1) dan B (kelompok 0) di kota Semarang. Evaluasi hasil klasifikasi menggunakan uji statistik Press s Q, APER, specificity, dan sensitivity. Hasil klasifikasi terbaik metode K-NN adalah jika menggunakan K=5 karena menghasilkan laju error terkecil dan diperoleh informasi bahwa data yang tepat diklasifikasikan berjumlah 159 data dan yang salah diklasifikasikan berjumlah 9 data. Hasil klasifikasi terbaik menggunakan metode MARS adalah jika menggunakan kombinasi BF=32, MI=2, MO=1 karena menghasilkan nilai Generalized Cross Validation (GCV) terkecil dan diperoleh informasi bahwa data yang tepat diklasifikasikan berjumlah 164 data dan yang salah diklasifikasikan berjumlah 4 data. Berdasarkan hasil analisis, diperoleh nilai Press s Q yang menunjukkan bahwa kedua metode sudah baik atau signifikan secara statistik dalam mengklasifikasikan Sekolah Dasar Negeri (SDN) di kota Semarang berdasarkan akreditasinya. Berdasarkan perhitungan APER, specificity, dan sensitivity menunjukkan bahwa pengklasifikasian akreditasi Sekolah Dasar Negeri (SDN) di kota Semarang menggunakan metode MARS lebih baik dibandingkan dengan metode K-NN. Kata kunci: Klasifikasi, K-Nearest Neighbor (K-NN), Multivariate Adaptive Regression Spline (MARS), Evaluasi klasifikasi v

ABSTRACT Classification methods have been developed and two of the existing are K- Nearest Neighbor (K-NN) and Multivariate Adaptive Regression Spline (MARS). The purpose of this research is comparing the classification of public elementary school accreditation in Semarang city with K-NN and MARS methods. This research using accreditation data with the result of eight accreditation components in public elementary school that has A accreditation (group 1) and B accreditation (group 2) in Semarang city. To evaluate the classification method used test statistic Press s Q, APER, specificity, and sensitivity. The best classification results of the K-NN method is when using K=5 because it produces the smallest error rate and obtained information that the correct classification data are 159 and the misclassification data are 9. The best classification result of the MARS method is when using combination BF=32, MI=2, MO=1 because it produces the smallest Generalized Cross Validation (GCV) and obtained information that the correct classification data are 164 and the misclassification data are 4. Based on analyze result, Press s Q showed that both methods are good as classification or statistically significant to classify the public elementary school in Semarang city based of the accreditation. APER, specificity, and sensitivity showed that classify of public elementary school accreditation in Semarang city using MARS method is better than K-NN method. Keywords: Classification, K-Nearest Neighbor (K -NN), Multivariate Adaptive Regression Spline (MARS), Classification evaluation vi

DAFTAR ISI Halaman HALAMAN JUDUL.. i HALAMAN PENGESAHAN.. ii KATA PENGANTAR. iv ABSTRAK ABSTRACT DAFTAR ISI.. v. vi. vii DAFTAR TABEL..... ix DAFTAR LAMPIRAN.. x DAFTAR SIMBOL. xi BAB I PENDAHULUAN 1.1 Latar Belakang.... 1 1.2 Rumusan Masalah... 3 1.3 Batasan Masalah..... 3 1.4 Tujuan Penelitian..... 3 BAB II TINJAUAN PUSTAKA 2.1 Akreditasi..... 5 2.2 Klasifikasi..... 8 2.3 K-Nearest Neighbor (K-NN)... 9 2.4 Multivariate Adaptive Regression Spline (MARS) 11 2.4.1 Anova Dekomposisi. 14 2.4.2 Algoritma MARS.... 15 vii

2.4.3 Klasifikasi pada MARS... 16 2.5 Evaluasi Ketepatan Hasil Klasifikasi 17 BAB III METODOLOGI PENELITIAN 3.1 Sumber Data..... 20 3.2 Variabel Penelitian.... 20 3.3 Metode Analisis Data... 21 BAB IV HASIL DAN PEMBAHASAN 4.1 Metode K-Nearest Neighbor..... 24 4.1.1 Pendugaan Klasifikasi Menggunakan Metode K-NN. 24 4.1.2 Hasil Klasifikasi Menggunakan K-Nearest Neighbor. 26 4.2 Metode MARS.... 27 4.2.1 Pemodelan MARS.... 27 4.2.2 Interpretasi Model MARS..... 29 4.2.3 Pendugaan Klasifikasi Menggunakan Metode MARS 31 4.2.4 Hasil Klasifikasi Menggunakan MARS..... 37 4.3 Evaluasi Ketepatan Klasifikasi. 38 BAB V KESIMPULAN...... 42 DAFTAR PUSTAKA...... 43 LAMPIRAN....... 45 viii

DAFTAR TABEL Halaman Tabel 1. Matriks Konfusi untuk Klasifikasi Dua Kelas. 9 Tabel 2. Hasil Laju Error untuk Percobaan nilai K pada K-NN.. 25 Tabel 3. Hasil Klasifikasi dengan Metode K-NN... 27 Tabel 4. Hasil Klasifikasi dengan Metode MARS. 37 Tabel 5. Perhitungan APER untuk Metode K-NN. 39 Tabel 6. Perhitungan APER untuk Metode MARS... 39 Tabel 7. Perhitungan Specificity dan Sensitivity untuk Metode K-NN... 40 Tabel 8. Perhitungan Specificity dan Sensitivity untuk Metode MARS... 41 ix

DAFTAR LAMPIRAN Halaman Lampiran 1. Data Akreditasi serta Hasil Penilaian kedelapan Komponen akreditasi dari 168 Sekolah Dasar Negeri berakreditasi A dan B yang ada di Kota Semarang 45 Lampiran 2. Syntax Metode K-NN Menggunakan software Matlab R2009a..... 46 Lampiran 3. Output Hasil Klasifikasi Menggunakan K-NN menggunakan software Matlab R2009a. 47 Lampiran 4. Hasil Perhitungan Jarak Euclidean dengan Menggunakan Data Uji adalah Data ke 1 dan Telah Dilakukan Pengurutan dari Terkecil hingga Terbesar 53 Lampiran 5. Hasil Perhitungan Jarak Euclidean dengan Menggunakan Data Uji adalah Data ke 93 dan Telah Dilakukan Pengurutan dari Terkecil hingga Terbesar 54 Lampiran 6. Output dari Metode Multivariate Adaptive Regression Spline (MARS) Menggunakan Software Salford Predictive Modeler 7 (SPM7). 55 Lampiran 7. Nilai GCV untuk seluruh pengombinasian BF, MI, dan MO... 71 Lampiran 8. Tabel Chi-Square 72 x

DAFTAR SIMBOL f 11 : jumlah data dalam kelas 1 yang secara benar dipetakan ke kelas 1 f 10 : jumlah data dalam kelas 1 yang secara salah dipetakan ke kelas 0 f 01 : jumlah data dalam kelas 0 yang secara salah dipetakan ke kelas 1 f 00 : jumlah data dalam kelas 0 yang secara benar dipetakan ke kelas 0 d(x 1,x 2 ) N n : jarak Euclidean antara dua titik : ukuran sampel : jumlah variabel prediktor 0 : koefisien konstan fungsi basis : koefisien dari fungsi basis ke-m M K m : maksimum fungsi basis : derajat interaksi S km : nilainya ± 1 X V(k,m) : variabel prediktor ke v, pilahan ke-k dan subregion ke m t km : nilai knot dari variabel prediktor X V(k,m) Y : matriks y berukuran n x 1 a : matriks berukuran m x 1 : matriks error berukuran n x 1 B : matriks fungsi basis berukuran n x m ± ( ) : fungsi truncated fungsi basis y y i ( i x ) ( x, x * i, j i j ) : penjumlahan semua fungsi basis untuk satu peubah prediktor : penjumlahan semua fungsi basis untuk dua peubah prediktor xi

y ( x, x, x * i, j, k i j k ) : penjumlahan semua fungsi basis untuk tiga peubah prediktor B m GCV(M) x i y i : fungsi basis ke-m : Generalized Cross Validation (kriteria penentuan model terbaik) : variabel prediktor : variabel respon C(M) : trace dari matriks [B (B T B) -1 B T ] + 1 C (Mˆ ) : C(M) + d.m d : unsur pengali fungsi basis, nilai d berada pada interval 2 4 P(Y=1 X) C r : probabilitas dari Y jika diketahui X : banyaknya kelompok : jumlah data yang tepat diklasifikasikan 2 (1) : nilai dari tabel chi square berderajat bebas 1 xii

BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan sebagai salah satu sektor yang paling penting dalam pembangunan nasional berfungsi semaksimal mungkin dalam upaya meningkatkan kualitas hidup masyarakat. Pemerintah terus berupaya untuk meningkatkan mutu pendidikan dengan harapan peserta didik menjadi manusia yang aktif, kreatif, dan terampil memecahkan masalahnya sendiri (Ihsan, 1996). Salah satu upaya meningkatkan mutu pendidikan adalah dengan melakukan penilaian-penilaian terhadap mutu sekolah yang dilakukan oleh Badan Akreditasi Nasional (BAN) di bawah naungan Kementerian Pendidikan Nasional dengan memberikan nilai yang merupakan hasil penilaian berbagai komponen akreditasi. Nilai dari masing-masing komponen menentukan peringkat akreditasi sekolah yang dinyatakan dalam huruf A (sangat baik), B ( baik), C (cukup), dan tidak terakreditasi (Badan Akreditasi Nasional, 2009). Pandangan sebagian besar masyarakat menganggap bahwa sekolah yang baik adalah sekolah negeri dengan akreditasi A atau B. Nilai dari akreditasi sekolah negeri inilah yang menjadi salah satu pertimbangan dalam memilih sekolah. Begitu pula dalam menentukan sekolah dasar, orang tua cenderung memilihkan anaknya sekolah dasar negeri yang memiliki rekam jejak (track record) yang baik. Penyusunan instrumen akreditasi sekolah mengacu pada Standar Nasional Pendidikan yang telah ditetapkan Mendiknas dan dikembangkan oleh Badan Standar Nasional Pendidikan (BSNP). Berdasarkan acuan Permendiknas tersebut, 1

2 Badan Akreditasi Nasional (BAN) menentukan delapan komponen penilaian terhadap akreditasi suatu sekolah yaitu: standar isi, standar proses, standar kompetensi lulusan, standar pendidik dan tenaga kependidikan, standar sarana dan prasarana, standar pengelolaan, standar pembiayaan, serta standar penilaian pendidikan (Badan Akreditasi Nasional, 2009). Ketepatan dalam pengklasifikasian objek sangat penting, metode klasifikasi yang baik adalah metode yang menghasilkan kesalahan yang kecil (Johnson dan Wichern, 2007). Saat ini metode statistika telah sangat berkembang dan dua diantara metode klasifikasi yang telah ada yaitu metode K-Nearest Neighbor (K-NN) dan metode Multivariate Adaptive Regression Spline (MARS). Menurut Prasetyo (2012) metode K-Nearest Neighbor (K-NN) merupakan metode yang melakukan klasifikasi berdasarkan kedekatan lokasi (jarak) suatu data dengan data lain, metode K-NN merupakan metode yang cukup sederhana namun memiliki tingkat akurasi yang tinggi, sedangkan menurut Friedman (1991) metode MARS merupakan metode regresi nonparametrik multivariat dengan data dimensional tinggi yang dapat diterapkan untuk pengklasifikasian suatu subjek tertentu. Berdasarkan penjelasan tersebut, penulis tertarik menggunakan metode K- Nearest Neighbor (K-NN) dan metode Multivariate Adaptive Regression Spline (MARS) untuk mengetahui metode yang lebih baik dalam pengklasifikasian akreditasi Sekolah Dasar Negeri (SDN) di kota Semarang.

3 1.2 Rumusan Masalah Berdasarkan latar belakang tersebut, penulis tertarik menggunakan metode K-Nearest Neighbor (K-NN) dan metode Multivariate Adaptive Regression Spline (MARS) untuk membandingkan pengklasifikasian akreditasi berdasarkan komponen-komponen penilaiannya. 1.3 Batasan Masalah Penelitian ini hanya dibatasi pada data akreditasi Sekolah Dasar Negeri (SDN) di kota Semarang yang status akreditasinya ditetapkan pada tahun 2010 hingga 2012 dan diklasifikasikan menjadi dua kelompok, yaitu kelompok sekolah dengan akreditasi A dan kelompok sekolah dengan akreditasi B. 1.4 Tujuan Penelitian Tujuan dari penelitian ini adalah: 1. Mengetahui hasil klasifikasi akreditasi Sekolah Dasar Negeri (SDN) di kota Semarang menggunakan metode K-Nearest Neighbor (K-NN) dan metode Multivariate Adaptive Regression Spline (MARS). 2. Mengetahui akurasi klasifikasi akreditasi Sekolah Dasar Negeri (SDN) di kota Semarang menggunakan uji statistik Press s Q, APER, specificity, dan sensitivity untuk metode K-Nearest Neighbor (K-NN) dan metode Multivariate Adaptive Regression Spline (MARS)

4 3. Membandingkan pengklasifikasian akreditasi Sekolah Dasar Negeri (SDN) di kota Semarang antara metode K-Nearest Neighbor (K-NN) dan Multivariate Adaptive Regression Spline (MARS)