Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Ukuran: px
Mulai penontonan dengan halaman:

Download "Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor"

Transkripsi

1 Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor PENDAHULUAN Latar Belakang Seleksi Nasional Masuk Perguruan Tinggi Negeri (SNMPTN) merupakan salah satu cara Penerimaan Mahasiswa Baru Program Sarjana pada Perguruan Tinggi Negeri (PTN). SNMPTN dilakukan oleh masing-masing PTN menggunakan sistem nasional terpadu berdasarkan hasil penelusuran prestasi sekolah dan prestasi akademik siswa baik dalam bentuk rapor maupun portofolio akademik yang lain. Setiap siswa yang mengikuti SNMPTN dapat memilih maksimal dua Kampus (Kampus Pilihan I dan Kampus Pilihan II) yang ingin mereka daftar dengan maksimal dua program studi. PTN yang menentukan kelulusan siswa berdasarkan hasil akademik selama di Sekolah Menengah Atas dan sederajat. Siswa yang lolos seleksi dapat masuk pada Kampus Pilihan I atau Kampus Pilihan II. Analis data siswa yang masuk PTN dalam SNMPTN dilakukan untuk mengetahui Kampus Pilihan yang diprediksi akan menerima siswa berdasarkan profil siswa yang mendaftar. Salah satu metode data mining yang dapat digunakan untuk membangun model klasifikasi (classifier) untuk memprediksi kampus pilihan siswa yang masuk PTN adalah k- Nearest Neighbor. Tujuan Tujuan dari tugas akhir ini adalah: 1. Menerapkan metode teknik data mining yaitu klasifikasi dengan menggunakan k-nearest Neighbor sebagai classifier untuk membangun model klasifikasi dari data siswa yang diterima Kampus Pilihan siswa pada SNMPTN. 2. Memprediksi kampus pilihan yang menerima siswa dengan model terbaik yang diperoleh. Ruang Lingkup Ruang lingkup tugas akhir ini difokuskan pada: 1. Penggunaan data siswa yang lolos SNMPTN tahun yang berasal dari web yang menyediakan hasil survei dengan beberapa PTN diantaranya IPB, ITB, ITS, UB, UGM, UI, UNAIR, UNDIP, UNJ, UNNES, UNPAD, UNS, UNSOED, UPI, USU. 2. Penerapan teknik data mining klasifikasi menggunakan metode k -Nearest Neighbor. 3. Hasil prediksi diasumsikan siswa diterima di PTN. Manfaat Melalui tugas akhir ini diketahui model terbaik diharapkan dapat digunakan untuk memprediksi siswa yang dapat diterima pada Kampus Pilihan. Disamping itu juga dapat memotivasi siswa untuk menentukan strategi dalam menentukan Kampus Pilihan.

2 TINJAUAN PUSTAKA Data Mining Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data dengan melakukan penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat dalam basis data. (Han & Kamber 2006). 2 Klasifikasi dan Prediksi Klasifikasi merupakan penempatan objek-objek ke salah satu dari beberapa kategori yang telah ditetapkan sebelumnya. Klasifikasi bertujuan untuk memperoleh aturan klasifikasi yang dapat digunakan untuk memprediksi label kelas dari objek yang tidak yang tidak diketahui label kelasnya. (Li et al 2001) Klasifikasi terdiri atas dua proses yaitu tahap induktif yang merupakan tahap membangun model klasifikasi dari data latih dan tahap deduktif yang merupakan tahap menerapkan model untuk data uji. Klasifikasi mempunyai dua teknik pembelajaran yaitu eager learner yang membuat model berdasarkan atribut input yang dipetakan terhadap kelas label setelah data latih tersedia dan lazy learner yang melakukan proses pemodelan dari data latih ketika ada data uji yang akan diklasifikasikan (Tan et al. 2006). k-nearest Neighbor Kelemahan dari teknik lazy learners adalah hanya mampu mengklasifikasikan data uji jika dan hanya jika atributnya sesuai dengan salah satu data latih. Jika atribut data uji tidak sesuai dengan data latih maka tidak akan diklasifikasikan (Faiza 2009). k-nearest Neighbor merupakan teknik yang lebih fleksibel karena mampu mengklasifikasikan data uji ke dalam kelas label dengan cara mencari data latih yang relatif sama dengan data uji (Tan et al.2006). k-nearest Neighbor merepresentasikan setiap data sebagai titik dalam k-ruang dimensi. Jika ada sebuah data uji maka akan dihitung kedekatan titik data tersebut dengan titik data lainnya pada data latih untuk diklasifikasikan berdasarkan kedekatannya yang didefinisikan dengan ukuran jarak (Han & Kamber 2006). Analis data mendefinisikan ukuran kedekatan atau ukuran kesamaan menggunakan fungsi jarak. Fungsi jarak yang umumnya digunakan adalah jarak Euclidean (Larose 2005). Penentuan klasifikasi data uji berdasar pada kelas utama (majority voting) pada nearest neighbor (Faiza 2009). d(x, y) = (x i y i ) 2 i (1)

3 3 dengan: x = x 1, x 2,, x m y = y 1, y 2,, y m x i y i = selisih data uji dengan data latih m = jumlah atribut Normalisasi Normalisasi diperlukan dalam format data yang berbeda. Salah satu metode normalisasi adalah min-max normalization yang diterapkan untuk atribut kontinu. Formula untuk normalisasi atribut X adalah (Faiza 2009): X = x min (x) max(x) min (x) (2) dengan X* adalah nilai setelah dinormalisasi, X adalah nilai sebelum dinormalisasi, min(x) adalah nilai minimum dari atribut, dan max(x) adalah nilai maksimum dari suatu atribut. k-fold Cross Validation k-fold cross validation dilakukan untuk membagi data latih dan data uji. k-fold cross validation mengulang k-kali untuk membagi sebuah himpunan contoh secara acak menjadi k subset yang saling bebas, setiap ulangan disisakan satu subset untuk pengujian dan subset lainnya untuk pelatihan (Fu 1994). Pada metode tersebut, data awal dibagi menjadi k subset atau fold yang saling bebas secara acak, yaitu S1, S2,..., Sk, dengan ukuran setiap subset kira-kira sama. Pada iterasi ke-i, subset Si diperlukan sebagai data pengujian dan subset lainnya diperlukan sebagai data pelatihan. Prosedur ini diulang sebanyak k-kali sedemikian sehingga setiap subset digunakan untuk pengujian tepat satu kali. Total akurasi ditentukan dengan menjumlahkan akurasi untuk semua k proses tersebut (Ulya 2013). Confusion Matrix Evaluasi model klasifikasi berdasar pada proporsi antara data uji yang diprediksi secara tepat dengan total seluruh prediksi (Tan et al.2006). Informasi mengenai klasifikasi sebenarnya (aktual) dengan klasifikasi hasil prediksi disajikan dalam bentuk tabel yang disebut confusion matrix seperti diperlihatkan pada Tabel 1. Tabel 1 Confusion matrix Kelas Prediksi Kelas Kelas 1 Kelas 2 Aktual Kelas 1 A b

4 4 Kelas 2 C d Jumlah baris dan kolom pada tabel bergantung pada banyaknya kelas target. Akurasi merupakan proporsi jumlah prediksi yang tepat. Contoh perhitungan akurasi untuk tabel tersebut adalah (Faiza 2009).: Akurasi = Jumlah prediksi yang tepat Total prediksi Akurasi = a + d a + b + c + D (3) Imbalance Data Imbalance data merupakan keadaan data dengan salah satu kelas memiliki porsi yang tidak sebanding dengan kelas yang lainnya. Bentuk ketidakseimbangan tersebut pada beberapa data menunjukkan perbandingan yang sangat signifikan jumlah antar kelasnya, yaitu 100:1, 1000:1, bahkan ada yang mencapai :1. Hal tersebut berpengaruh pada algoritme klasifikasi yang menghasilkan akurasi prediksi yang baik pada kelas data yang memiliki jumlah instance besar atau kelas mayoritas tetapi menghasilkan akurasi prediksi yang kurang baik terhadap kelas dengan jumlah instance lebih kecil atau kelas minoritas, sehingga dapat pula terjadi penyimpangan prediksi, yaitu kelas minoritas di prediksikan ke dalam kelas mayoritas. Salah satu solusi dari masalah imbalanced data adalah penggunaan metode sampling yang dapat memberikan distribusi data seimbang untuk setiap kelas (He dan Edwardo dalam Ulya 2013). Sampling Simple Random Sampling atau Teknik acak sederhana adalah teknik acak yang paling dasar. Prinsip teknik acak sederhana, setiap anggota populasi mempunyai kesempatan yang sama (Eriyanto 2007). Metode sampling untuk menangani masalah pada imbalanced data diantaranya adalah undersampling dan oversampling (He dan Edwardo 2009). Undersampling adalah proses membuang sebagian data dari kelas mayoritas agar diperoleh data yang seimbang, sedangkan oversampling adalah proses menduplikasi data dari kelas minoritas untuk mendapatkan data dengan kelas yang seimbang. Dalam kasus Undersampling, dapat menyebabkan classifier melewatkan informasi penting karena sebagian data pada kelas mayoritas dihilangkan (He dan Edwardo dalam Ulya 2013). Teknik oversampling dan undersampling ada beberapa jenis yaitu replikasi, acak dan cluster (Ulya 2013).

5 5 METODE Penelitian ini dilakukan dalam beberapa tahap sebagai berikut: Pengadaan Data Praproses Data Penentuan Data Latih dan Data Uji Perhitungan Akurasi Prediksi Profil Siswa Profil Siswa tanpa Label Kelas Latih Uji Profil Siswa dengan Label Kelas Pembentukan Classifier dengan k-nn Classifier Gambar 1. Diagram Alur Metode Pengadaan Data Data yang digunakan dalam tugas akhir ini adalah Data SNMPTN Undangan tahun 2012 dan 2013 yang didapat dari website Pengelompokan siswa untuk menganalisis penerimaan kampus pilihan siswa dibagi menjadi 4 kategori, yaitu A1 (Kampus Pilihan I Program Studi I), A2 (Kampus Pilihan I Program Studi II), B1 (Kampus Pilihan II Program Studi I) dan B2 (Kampus Pilihan II Program Studi II). Praproses Data Tahapan yang dilakukan dalam praproses diantaranya: 1. Penggabungan data dari data tahun 2013 ke data tahun 2012, sesuai atribut data tahun Pembersihan data, mengatasi data yang missing value dan normalisasi data.

6 3. Pemilihan data dan pengambilan data yang sesuai dengan ruang lingkup penelitian. 4. Transformasi data, mengubah data ke bentuk atau format yang sesuai dengan perangkat lunak yang digunakan. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode uji yang digunakan yaitu pembagian data latih dan data uji dengan proporsi 70% data latih dan 30% data uji dengan simple random sampling setiap kelas dan metode uji 10-fold cross validation. Klasifikasi dengan k-nn Tahapan ini merupakan tahap yang penting karena pada tahap ini teknik klasifikasi diaplikasikan terhadap data. Teknik klasifikasi yang digunakan adalah k-nearest Neighbor. Langkah-langkah pada metode tersebut yaitu: Hitung jarak Euclidean, Pada tahap ini setiap data uji akan dihitung jaraknya ke setiap data latih untuk mengetahui ukuran kedekatan atau ukuran kesamaan antara data uji dengan data latih. Penentuan nilai k, Hal terpenting pada k- Nearest Neighbor adalah menentukan nilai yang tepat untuk k yang menunjukan jumlah tetangga terdekat. Majority voting, Penentuan kelas target untuk data uji berdasarkan kelas yang utama pada tetangga terdekat (Faiza 2009). Dalam penelitian ini, klasifikasi dengan k-nn dilakukan 4 kali percobaan, sebagai berikut: 1. Percobaan menggunakan dataset yang proporsi record pada setiap kelas target imbalance dengan metode uji 70% data latih dan 30% data uji. 2. Percobaan menggunakan dataset yang proporsi record pada setiap kelas target imbalance dengan metode uji 10-fold cross validation. 3. Percobaan menggunakan dataset yang proporsi record pada setiap kelas target balance dengan menggunakan oversampling replikasi dengan metode uji 70% data latih dan 30% data uji. 4. Percobaan menggunakan dataset yang proporsi record pada setiap kelas target balance dengan menggunakan oversampling replikasi dengan metode uji 10-fold cross validation. Selanjutnya akan dibentuk tabel confusion matrix dari setiap classifier untuk mengevaluasi klasifikasi yang dihasilkan metode k-nearest Neighbor. Lingkungan Pengembangan Spesifikasi perangkat keras dan perangkat lunak yang digunakan dalam penelitian yaitu sebagai berikut: Perangkat Keras: 1. Processor Intel Core i3 2. Memori 6 GB 3. Harddisk 500 GB 4. Layar 14 inci 5. Mouse dan Keyboard 6

7 Perangkat Lunak: 1. Sistem operasi Windows 8 2. Microsoft Excel 2013 sebagai lembar pengolahan data tambahan, media merapihkan data penggabungan data, pembersihan data, dan transformasi data. 3. Weka versi untuk melakukan proses data mining k-nn. HASIL DAN PEMBAHASAN Data Data SNMPTN 2012 terdiri dari 16 buah file dengan format pdf yang masing-masing terdiri dari 17 atribut yaitu berisi data catatan profil siswa antara lain: Alamat, Asal SMA/SMK/MA, Jurusan SMA/SMK, Kampus Pilihan I, Prodi Prioritas I di Kampus Pilihan I, Prodi Prioritas II di Kampus Pilihan I, Kampus Pilihan II, Prodi Prioritas I di Kampus Pilihan II, Prodi Prioritas II di Kampus Pilihan II, Rata-rata nilai semester 3 (tiga), Rata-rata nilai semester 4 (empat), Rata-rata nilai semester 5 (lima), Rata-rata nilai semester 6 (enam), peringkat semeste 3, peringkat semester 4, peringkat semester 5 dan piagam sedangkan data SNMPTN 2013 dari 13 buah file dengan format pdf yang masing-masing terdiri dari 23 atribut yaitu berisi data catatan profil siswa yang sama seperti data tahun 2012 tetapi dengan tambahan atribut antara lain: Jumlah alumni, Akreditasi, Prestasi sekolah, nilai semester 1, nilai semester 2, peringkat semester 1 dan peringkat semester 2. Penggabungan dan Pembersihan Data Data SNMPTN tahun 2013 dan 2012 digabung menggunakan Microsoft Excel. Atribut yang digunakan mengikuti atribut yang ada pada data tahun Record yang memiliki missing value diisi dengan mengisi nilai mean untuk atribut kuantitatif/numerik sedangkan modus untuk atribut nominal. Atribut Progam Studi yang tidak diisi maka akan bernilai Kosong. Pemilihan Data Pengabungan data dan pengisian missing value dilakukan pemilihan record data yang digunakan untuk analisis. Record yang mengandung PTN yang tidak termasuk dalam ruang lingkup di hapus. Data akhir yang dihasilkan terdiri dari 1013 record dan 16 atribut (daftar atribut terlampir). Transformasi Data Karena adanya perbedaan range antar atribut maka perlu dilakukan normalisasi. Normalisasi yang dilakukan bergantung jenis datanya. Untuk atribut rata-rata nilai terdapat nilai yang mempunyai range 1-10 dan range Sehingga untuk range 1-10 dilakukan normalisasi min-max ke dalam range menggunakan rumus min-max normalization (persamaan 2). Atribut piagam yang berisi nilai piagam yang dimiliki diubah menjadi Ya untuk memiliki nilai piagam dan Tidak untuk tidak memiliki nilai piagam. 7

8 Aplikasi Teknik Klasifikasi Pada percobaan pertama, menggunakan dataset sebanyak 1013 record yang proporsi record pada setiap kelas target tidak sama dengan metode uji 70% data latih dan sisanya sebanyak 30% data uji. Jumlah record yang digunakan terlihat pada tabel 2. Tabel 2 Jumlah record data pada percobaan 1 Data Latih Data Uji A1 610 record 235 record A2 73 record 30 record B1 40 record 16 record B2 7 record 2 record Total 730 record 283 record Penentuan nilai k tetangga terdekat pada percobaan 1 dilakukan dengan mencoba nilai k mulai dari 1 sampai 16 dengan selang 1 angka dalam metode k-nearest Neighbor. Pada setiap percobaan dengan suatu nilai k dihitung akurasi classifier dan sebaran kelas target. Berdasarkan percobaan nilai k=1 dengan menggunakan Weka, diperoleh bahwa sebaran kelas target mencakup keempat kelas yaitu A1, A2, B1, B2. Jika nilai k dinaikkan menjadi 2, maka sebaran kelas target untuk kelas 4 (B2) tidak tercakup seperti diperlihatkan tabel 3 dan tabel 4. Tabel 3 Confusion Matriks dan Sebaran target dengan k=1 A1 A2 B1 B2 A A B B Sebaran Tabel 4 Confusion Matriks dan Sebaran target dengan k=2 A1 A2 B1 B2 A A B B Sebaran Melihat kondisi tersebut maka k yang dipilih adalah 1 dengan akurasi %, sehingga pada percobaan pertama classifier terbaik diperoleh pada jumlah tetangga terdekat 8

9 1. Setiap record data uji dapat ditentukan kelas targetnya berdasarkan kelas utama pada 1 tetangga terdekat. Berdasarkan tabel 3, kelas A1 yang tepat diklasifikasikan sebagai kelas A1 sebanyak 209 record, kelas A1 yang salah diklasifikasikan sebagai kelas A2 sebanyak 21 record dan kelas A1 yang salah diklasifikasikan sebagai kelas B1 sebanyak 5 record. Kelas A2 yang tepat diklasifikasikan sebagai kelas A2 sebanyak 7 record dan kelas A2 yang salah diklasifikasikan sebagai kelas A1 sebanyak 23 record. Kelas B1 yang tepat diklasifikasikan sebagai kelas B1 sebanyak 4 record, kelas B1 yang salah diklasifikasikan sebagai kelas A1 sebanyak 10 record, kelas B1 yang salah diklasifikasikan sebagai kelas A2 sebanyak 1 record dan kelas B1 yang salah diklasifikasikan sebagai kelas B2 sebanyak 1 record. Kelas B2 yang salah diklasifikasikan sebagai kelas A1 sebanyak 1 record dan kelas B2 yang salah diklasifikasikan sebagai kelas A2 sebanyak 1 record. Berdasarkan tabel 5, terlihat bahwa kelas sebenarnya B2 dapat diprediksi ke semua kelas. Sedangkan kelas lain tidak semua diprediksi ke semua kelas. Berdasarkan persamaan 3, besarnya akurasi adalah: Akurasi = = Pada percobaan kedua, menggunakan seluruh dataset yang proporsi record pada setiap kelas target tidak sama dengan metode uji 10-fold cross validation. Penentuan nilai k tetangga terdekat pada percobaan kedua dilakukan dengan mencoba nilai k mulai dari 1 sampai 16 dengan selang 1 angka dalam metode k-nearest Neighbor. Pada setiap percobaan dengan suatu nilai k dihitung akurasi classifier dan sebaran kelas target. Berdasarkan percobaan nilai k=1 dengan menggunakan Weka, diperoleh bahwa sebaran kelas target mencakup keempat kelas yaitu A1, A2, B1, B2. Jika nilai k dinaikkan menjadi 2, maka sebaran kelas target untuk kelas 4 (B2) tidak tercakup seperti diperlihatkan tabel 5 dan Gambar 6. Tabel 5 Confusion Matriks dan Sebaran target dengan k=1 pada percobaan kedua A1 A2 B1 B2 A A B B Sebaran Tabel 6 Confusion Matriks dan Sebaran target dengan k=2 pada percobaan kedua A1 A2 B1 B2 A A B B Sebaran

10 Melihat kondisi tersebut maka k yang dipilih adalah 1 dengan akurasi %, sehingga pada percobaan kedua classifier terbaik diperoleh pada jumlah tetangga terdekat 1. Setiap record data uji dapat ditentukan kelas targetnya berdasarkan kelas utama pada 1 tetangga terdekat. Berdasarkan tabel 5, kelas A1 yang tepat diklasifikasikan sebagai kelas A1 sebanyak 733 record, kelas A1 yang salah diklasifikasikan sebagai kelas A2 sebanyak 82 record, kelas A1 yang salah diklasifikasikan sebagai kelas B1 sebanyak 28 record dan kelas A1 yang salah diklasifikasikan sebagai kelas B2 sebanyak 2 record. Kelas A2 yang tepat diklasifikasikan sebagai kelas A2 sebanyak 22 record, kelas A2 yang salah diklasifikasikan sebagai kelas A1 sebanyak 80 record dan kelas A2 yang salah diklasifikasikan sebagai kelas B1 sebanyak 1 record. Kelas B1 yang tepat diklasifikasikan sebagai kelas B1 sebanyak 15 record, kelas B1 yang salah diklasifikasikan sebagai kelas A1 sebanyak 37 record, kelas B1 yang salah diklasifikasikan sebagai kelas A2 sebanyak 2 record dan kelas B1 yang salah diklasifikasikan sebagai kelas B2 sebanyak 2 record. Kelas B2 yang salah diklasifikasikan sebagai kelas A1 sebanyak 7 record dan kelas B2 yang salah diklasifikasikan sebagai kelas B1 sebanyak 2 record. Berdasarkan tabel 5, terlihat bahwa kelas sebenarnya B2 diprediksi ke semua kelas. Sedangkan kelas lain tidak semua dapat diprediksi ke semua kelas. Berdasarkan persamaan 3, besarnya akurasi adalah: Akurasi = = Pada percobaan ketiga, menggunakan seluruh dataset yang proporsi record pada setiap kelas target sama dengan menggunakan oversampling replikasi dengan metode uji 70% data latih dan 30% data uji. Jumlah record yang digunakan terlihat pada tabel 7. Tabel 7 Jumlah record data pada percobaan 3 Data Latih Data Uji A1 610 record 235 record A2 610 record 235 record B1 610 record 235 record B2 610 record 235 record Total 2440 record 940 record Penentuan nilai k tetangga terdekat pada percobaan ketiga dilakukan dengan mencoba nilai k mulai dari 1 sampai 20 dengan selang 5 angka dalam metode k-nearest Neighbor menggunakan weka. Akurasi klasifikasi untuk nilai k=1 sampai k=20 diperlihatkan pada Tabel 8. Tabel 8 Akurasi percobaan ketiga K Akurasi % % % % % 10

11 Berdasarkan tabel tersebut (Tabel 8) akurasi yang paling tinggi diperoleh untuk k=10 sehingga pada percobaan ini jumlah tetangga terdekat adalah 10. Untuk mengetahui record yang missclassification digunakan matrix confusion yang diperlihatkan pada Tabel 9. Tabel 9 Confusion Matriks dengan k=10 pada percobaan Ketiga A1 A2 B1 B2 A A B B Berdasarkan tabel 9, kelas A1 yang tepat diklasifikasikan sebagai kelas A1 sebanyak 89 record, kelas A1 yang salah diklasifikasikan sebagai kelas A2 sebanyak 94 record, kelas A1 yang salah diklasifikasikan sebagai kelas B1 sebanyak 46 record dan kelas A1 yang salah diklasifikasikan sebagai kelas B2 sebanyak 6 record. Kelas A2 yang tepat diklasifikasikan sebagai kelas A2 sebanyak 203 record, kelas A2 yang salah diklasifikasikan sebagai kelas A1 sebanyak 24 record dan kelas A2 yang salah diklasifikasikan sebagai kelas B1 sebanyak 8 record. Kelas B1 yang tepat diklasifikasikan sebagai kelas B1 sebanyak 119 record, kelas B1 yang salah diklasifikasikan sebagai kelas A1 sebanyak 29 record, kelas B1 yang salah diklasifikasikan sebagai kelas A2 sebanyak 58 record dan kelas B1 yang salah diklasifikasikan sebagai kelas B2 sebanyak 29 record. Kelas B2 yang salah diklasifikasikan sebagai kelas A2 sebanyak 235 record. Berdasarkan tabel 9, terlihat bahwa kelas sebenarnya B2 diprediksi ke semua kelas. Sedangkan kelas lain tidak semua dapat diprediksi ke semua kelas. Berdasarkan persamaan 3, besarnya akurasi adalah: Akurasi = = Pada percobaan keempat, menggunakan dataset yang proporsi record pada setiap kelas target sama dengan menggunakan oversampling replikasi dengan metode uji 10-fold cross validation menggunakan Weka. Percobaan ini menggunakan k=10 karena dataset sama seperti pada percobaan ketiga. Hasil klasifikasi dengan Weka, diperoleh confusion matrix yang diperlihatkan pada tabel 10. Tabel 10 Confusion Matriks dengan pada percobaan Keempat A1 A2 B1 B2 A A B B Berdasarkan tabel 10, kelas A1 yang tepat diklasifikasikan sebagai kelas A1 sebanyak 259 record, kelas A1 yang salah diklasifikasikan sebagai kelas A2 sebanyak 221 record, kelas A1 yang salah diklasifikasikan sebagai kelas B1 sebanyak 108 record dan kelas A1 yang salah diklasifikasikan sebagai kelas B2 sebanyak 22 record. Kelas A2 yang tepat diklasifikasikan sebagai kelas A2 sebanyak 561 record, kelas A2 yang salah diklasifikasikan 11

12 sebagai kelas B1 sebanyak 41 record dan kelas A2 yang salah diklasifikasikan sebagai kelas B2 sebanyak 8 record. Kelas B1 yang tepat diklasifikasikan sebagai kelas B1 sebanyak 604 record dan kelas B1 yang salah diklasifikasikan sebagai kelas B2 sebanyak 6 record. Kelas B2 yang tepat diklasifikasikan sebagai kelas B2 sebanyak 610 record. Semua record pada kelas B2 tepat diprediksi sebagai kelas B2. Berdasarkan persamaan 3, besarnya akurasi adalah: Akurasi = = Setiap percobaan yang dilakukan menghasilkan sebuah classifier, sehingga dari empat percobaan diperoleh empat buah classifier. Akurasi setiap classifier diperlihatkan pada Tabel 11. Tabel 11 Akurasi empat classifier Percobaan Model yang dihasilkan Akurasi 1 Classifier Classifier Classifier Classifier Akurasi paling tinggi diperoleh pada classifier 4 yang dihasilkan dari percobaan 4 yaitu menggunakan dataset 2440 record yang proporsi record pada setiap kelas target seimbang yang merupakan hasil Oversampling replikasi dengan metode uji 10-fold cross validation. Dengan demikian classifier 4 merupakan classifier terbaik yang dihasilkan dengan metode k Nearest Neighbor. Penggunaan Classifier pada Data Baru untuk klasifikasi Classifier terbaik yang diperoleh digunakan untuk memprediksi label kelas pada data yang baru. Pada Tabel 12 diberikan contoh data baru tanpa label kelas yang akan diterapkan pada classifier. Tabel 12 Data baru tanpa kelas Data 1 Data 2 Data 3 Data 4 Alamat Jombang Bandung Bekasi Surabaya 12 Jurusan IPS IPA IPA IPA K1 UB ITB UB ITB K1P1 HubunganInt ernasional SITH IlmuKomputer SekolahFar masi K1P2 IlmuHukum SITH SistemInformasi Kosong K2 Kosong IPB IPB IPB

13 13 K2P1 Kosong TeknologiIn dustripertan ian IlmuKomputer Statistika Komunikasi &Pengemba nganmasyar akat Komunikasi&Pen gembanganmasya rakat K2P2 Kosong Kosong Sem Sem Sem Rank Rank Rank Piagam Tidak Tidak Ya Tidak Class???? Hasil prediksi data baru tanpa label kelas diperlihatkan pada Tabel 13. Tabel 13 Hasil prediksi data baru tanpa label kelas Record Prediksi 1 A1 2 A2 3 B1 4 A2 KESIMPULAN DAN SARAN Kesimpulan Dari beberapa percobaan yang telah dilakukan diperoleh kesimpulan sebagai berikut: 1. Metode k-nearest Neighbor sebagai teknik dalam data mining dapat digunakan untuk classifier pada data SNMPTN. 2. Classifier terbaik dihasilkan dari percobaan 4 dengan dataset 2440 record yang proporsi record pada setiap kelas target seimbang yang merupakan hasil Oversampling replikasi dengan metode uji 10-fold cross validation. 3. Data yang seimbang atau balance lebih baik untuk klasifikasi daripada data yang imbalance. 4. Akurasi yang diperoleh dari classifier terbaik adalah %. 5. Classifier terbaik yang dihasilkan dapat digunakan untuk memprediksi kampus pilihan yang menerima siswa dengan model terbaik yang diperoleh.

14 Saran ini: Beberapa saran yang dapat dilakukan untuk memperbaiki kekurangan dari penelitian 1. Penggunaan metode lain yang menghasilkan classifier lebih baik. 2. Penggunaan data yang lebih besar lagi yang mencakup semua PTN. 14 DAFTAR PUSTAKA Eriyanto Teknik Sampling Analisis Opini. Yogyakarta (ID): LKiS. Faiza, Ninon Nurul Prediksi Tingkat Keberhasilan Mahasiswa Tingkat I IPB Dengan Metode k-nearest Neighbor. [Skripsi]. Bogor (ID): IPB Ulya, Fiqrotul KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA. [Skripsi]. Bogor (ID): IPB Fu L Neural Network in Computer Intelligence. Singapura: McGraw Hill. Han J, Kamber M Data Mining Concepts and Techniques Second Edition. San Fransisco (US): Morgan Kaufmann Publisher. He H, Edwardo AG Learning from imbalanced data. IEEE Transactions on Knowledge and Data Engineering. 21(9): Larose, Daniel T Discovering Knowledge in Data: An Introduction to Data Mining. John Wiley&Sons, Inc. Tan S, Kumar P, Steinbach M Introduction to Data Mining. Addison Wesley.

15 Lampiran 1 Daftar Atribut Nama Atribut Keterangan Jenis Atribut Alamat Nama Kota/Kabupaten Nominal Jurusan Jurusan SMA Nominal K1 Pilihan Kampus I Nominal K1P1 Pilihan Program Studi I Kampus I Nominal K1P2 Pilihan Program Studi II Kampus I Nominal K2 Pilihan Kampus II Nominal K2P1 Pilihan Program Studi I Kampus II Nominal K2P2 Pilihan Program Studi II Kampus II Nominal Piagam Ya / Tidak Nominal Class A1 / A2 / B1 / B2 Nominal Sem3 Rata-rata nilai semester 3 (Range 1-100) Numerik Sem4 Rata-rata nilai semester 4 (Range 1-100) Numerik Sem5 Rata-rata nilai semester 5 (Range 1-100) Numerik Rank3 Peringkat semester 3 Numerik Rank4 Peringkat semester 4 Numerik Rank5 Peringkat semester 5 Numerik

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

KLUSTERISASI DAN KLASIFIKASI PELANGGAN BERDASARKAN PENGGUNAAN DAYA LISTRIK DAN PERAMALAN KEBUTUHAN DAYA LISTRIK TAHUN 2015

KLUSTERISASI DAN KLASIFIKASI PELANGGAN BERDASARKAN PENGGUNAAN DAYA LISTRIK DAN PERAMALAN KEBUTUHAN DAYA LISTRIK TAHUN 2015 KLUSTERISASI DAN KLASIFIKASI PELANGGAN BERDASARKAN PENGGUNAAN DAYA LISTRIK DAN PERAMALAN KEBUTUHAN DAYA LISTRIK TAHUN 2015 YUANDRI TRISAPUTRA 1 & OKTARINA SAFAR NIDA 2 (SIAP 16) 1 DEPARTEMEN LMU KOMPUTER

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING

EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING EKSPLORASI DAN KLASIFIKASI DESA TERTINGGAL DI INDONESIA MENGGUNAKAN PENDEKATAN DATA MINING Oleh: Yuandri Trisaputra G64120004 2012 Oktarina Safar Nida G14120052 2012 INSTITUT PERTANIAN BOGOR BOGOR 2016

Lebih terperinci

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : BAB 3 METODE PENELITIAN 3.1 Instrumen Penelitian Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : 3.1.1 Bahan Bahan yang digunakan dalam penelitian ini yaitu data siswa kelas SMA

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2. 6 tahap ini, pola yang telah ditemukan dipresentasikan ke pengguna dengan teknik visualisasi agar pengguna dapat memahaminya. Deskripsi aturan klasifikasi akan dipresentasikan dalam bentuk aturan logika

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 1, Januari 2018, hlm. 184-189 http://j-ptiik.ub.ac.id Klasifikasi Standar Produk Baja PT. Krakatau Steel (Persero)

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi 4 Perangkat keras berupa Notebook: Processor intel Core i3 2.2 GHz. RAM kapasitas 2. GB. Harddisk Kapasitas 5 GB. Monitor pada resolusi 1366 x 768 piksel. Merek Acer Aspire 475. Perangkat lunak berupa:

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

PREDIKSI TINGKAT KEBERHASILAN MAHASISWA TINGKAT I IPB DENGAN METODE k-nearest NEIGHBOR NINON NURUL FAIZA

PREDIKSI TINGKAT KEBERHASILAN MAHASISWA TINGKAT I IPB DENGAN METODE k-nearest NEIGHBOR NINON NURUL FAIZA PREDIKSI TINGKAT KEBERHASILAN MAHASISWA TINGKAT I IPB DENGAN METODE k-nearest NEIGHBOR NINON NURUL FAIZA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Jurnal Teknik Komputer Unikom Komputika Volume 3, No.2-2014 TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Selvia Lorena Br Ginting 1), Wendi Zarman

Lebih terperinci

BAB 4 IMPLEMENTASI DAN PENGUJIAN

BAB 4 IMPLEMENTASI DAN PENGUJIAN BAB 4 IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Tahap implementasi merupakan tahap pengimplementasian metode kedalam perangkat lunak simulasi, tahap lanjut dari tahap perancangan simulasi di bab sebelumnya.

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Klasifikasi merupakan salah satu bidang kajian pada machine learning. Klasifikasi adalah proses menemukan sekumpulan model atau fungsi yang menggambarkan dan membedakan konsep

Lebih terperinci

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data Setelah dilakukan analisis clustering maka algoritme tersebut akan dibandingkan berdasarkan cluster yang terbentuk dari hasil analisis cluster-nya. Hasil perbandingan diharapkan dapat membuktikan bahwa

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1  Abstract Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak

PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Abstrak PENGENALAN POLA KEPUASAN MAHASISWA TERHADAP KEGIATAN BELAJAR MENGAJAR (STUDI KASUS DI STMIK AKAKOM YOGYAKARTA) Dini Fakta Sari Teknik Informatika STMIK AKAKOM Yogyakarta dini@akakom.ac.id Abstrak Tenaga

Lebih terperinci

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 Sulidar Fitri Teknik Informatika STMIK AMIKOM Yogyakarta email : inboxfitri@gmail.com Abstraksi Penelitian

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) ABSTRAK

PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) ABSTRAK PENGARUH INCOMPLETE DATA TERHADAP AKURASI VOTING FEATURE INTERVALS-5 (VFI5) Atik Pawestri Sulistyo 1, Aziz Kustiyo 1, Agus Buono 2 1 Departemen Ilmu Komputer, Fakultas Matematika dan IPA Institut Pertanian

Lebih terperinci

HASIL DAN PEMBAHASAN. Praproses

HASIL DAN PEMBAHASAN. Praproses 5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk

Lebih terperinci

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support

Data Mining. Tidak. Mulai. Data transaksi. Pembersihan data. Seleksi data. Transformasi data. Pemberian nilai minimum support 6 Representasi Pengetahuan Tahap ini merupakan tahap akhir dari proses KDD. Sederetan aturan atau rule disajikan kepada pengguna dengan menggunakan algoritme Rule Generation. Mulai Data transaksi Pembersihan

Lebih terperinci

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz Data yang pada awalnya berupa chanel stereo diubah ke dalam chanel mono. Kemudian data tersebut disimpan dengan file berekstensi WAV. Praproses Pada tahap ini dilakukan ekstraksi ciri menggunakan metode

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penerimaan mahasiswa baru merupakan proses yang selalu dilakukan setiap tahunnya oleh Universitas Kristen Duta Wacana Yogyakarta (UKDW). Mahasiswa baru merupakan mahasiswa

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik Morfologi dan Tingkah Laku

Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik Morfologi dan Tingkah Laku Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 4 Nomor 1 halaman 6-13 ISSN: 2089-6026 Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik

Lebih terperinci

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

DATA DAN METODE Data

DATA DAN METODE Data DATA DAN METODE Data Sumber data yang digunakan dalam penelitian berasal dari data mahasiswa tahun angkatan 2000 sampai dengan 2005, dan dari tiga program studi yaitu S1- Sistem Informasi, S1-Teknik Informatika,

Lebih terperinci

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout  Data mining BAB 1 PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, identifikasi masalah, ruang lingkup tugas akhir, maksud dan tujuan tugas akhir, metode penelitian tugas akhir, dan sistematika penulisan

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Penelitian mengenai pengenalan wajah termotivasi oleh banyaknya aplikasi praktis yang diperlukan dalam identifikasi wajah. Pengenalan wajah sebagai salah satu dari teknologi

Lebih terperinci

METODE PENELITIAN. Gambar 2 Tahapan penelitian. Praproses Data

METODE PENELITIAN. Gambar 2 Tahapan penelitian. Praproses Data daerah dalam lingkup R dan f(r) adalah fungsi yang dijalankan pada lingkup R. Mekanisme algoritme Naive adalah sebagai berikut : 1 Menentukan dataset D yang merupakan himpunan seluruh poligon / daerah

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

Tabel 2 Jumlah data prosedur uji. Crop Variable. Jumlah data LAI 104 SPAD 105 yield 64 LAI 104 SPAD 105 yield 64 LAI 62 SPAD 63 yield 34.

Tabel 2 Jumlah data prosedur uji. Crop Variable. Jumlah data LAI 104 SPAD 105 yield 64 LAI 104 SPAD 105 yield 64 LAI 62 SPAD 63 yield 34. 2. Cross validation 5 fold dengan pemisahan data Indramayu dan, menggunakan data berikut: 3. Supplied test set : training:, testing: Hymap training:, testing: Hymap 4. Percentage split dengan data training

Lebih terperinci

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah Selly Artaty Zega Program Studi Teknik Multimedia dan Jaringan, Jurusan Teknik Informatika, Politeknik

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya pembangunan gedung sekolah maupun perguruan tinggi menjadi tanda berkembangnya pendidikan. Jumlah pendaftar

Lebih terperinci

BAB IV PEMBAHASAN. Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni

BAB IV PEMBAHASAN. Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni BAB IV PEMBAHASAN Pada penelitian ini menggunakan data mahasiswa Fakultas Teknik alumni 2013-2015, rentan waktu itu di jadikan sebagai bahan penelitian karena cukup relevan dengan tahun sekarang, faktor

Lebih terperinci

EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA

EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA EKSPLORASI METODE PENENTUAN NILAI END POINT PADA ALGORITMA VOTING FEATURE INTERVALS 5 SETA BAEHERA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2009 EKSPLORASI

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining. Modul Praktikum WEKA Yudi Wibisono (e: yudi@upi.edu ); t: @yudiwbs Ilmu Komputer Universitas Pendidikan Indonesia (cs.upi.edu) Versi BETA : Oktober 2013 http://creativecommons.org/licenses/by-nc-sa/3.0/

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Metode Penelitian Penelitian mengenai peningkatan kecepatan prediksi produksi susu sapi ini menggunakan metode eksperimen dengan metode sebagai berikut: a. Pengumpulan data

Lebih terperinci

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal

Lebih terperinci

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA

PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA ISSN : 2338-4018 PENERAPAN ALGORITMA K-NEAREST NEIGHBORS UNTUK KELULUSAN MAHASISWA PADA STMIK SINAR NUSANTARA SURAKARTA Agus Panoto ( ragilpanoto@gmail.com ) Yustina Retno Wahyu Utami ( yustina.retno@gmail.com

Lebih terperinci

Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang

Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang 1 Penentuan Jurusan Sekolah Menengah Atas Menggunakan Metode K-Nearest Neighbor Classifier Pada SMAN 16 Semarang Ari Sulistiyo 1 1,3 Jurusan Teknik Informatika, FASILKOM UDINUS Jln. Nakula 1 No.5-11 Semarang

Lebih terperinci

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN

Pembersihan Data Lingkungan Pengembangan Sistem HASIL DAN PEMBAHASAN 3 Nilai fuzzy support bagi frequent sequence dengan ukuran k diperoleh dengan mengkombinasikan frequent sequence dengan ukuran k-1. Proses ini akan berhenti jika tidak memungkinkan lagi untuk membangkitkan

Lebih terperinci

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,

Lebih terperinci

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA) ISSN 1858-4667 JURNAL LINK VOL. 27/No. 1/Februari 2018 PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA) Hariadi Yutanto 1, Nurcholis Setiawan 2

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : D22.5411 / Healthcare Datamng Revisi 1 Satuan Kredit Semester : 2 sks Tgl revisi : 1 Agustus 2014 Jml Jam kuliah dalam seminggu

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : 56601 / Data Warehouse dan Data Mng Revisi 1 Satuan Kredit Semester : 3 sks Tgl revisi : 1 September 2014 Jml Jam kuliah

Lebih terperinci

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Seno Setiyawan 1, Yuliana Susanti 2,Tri Atmojo Kusmayadi 3 1,3 Program Studi Matematika FMIPA, Universitas Sebelas Maret 2 Program

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

DATA PREPROCESSING. Budi Susanto (versi 1.2)

DATA PREPROCESSING. Budi Susanto (versi 1.2) DATA PREPROCESSING Budi Susanto (versi 1.2) Kenali Data Anda Atribut Data Memahami tipe atribut Membantu membetulkan data saat integrasi data Deskripsi Statistik Data Memudahkan untuk mengisi nilai yang

Lebih terperinci

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN Devi Sugianti Program Studi Sistem Informasi,STMIK Widya Pratama Jl. Patriot 25 Pekalongan Telp (0285)427816 email

Lebih terperinci

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, BAB II TINJAUAN PUSTAKA 2.1 Terdahulu Dalam penelitian ini, peneliti juga menyertakan beberapa uraian singkat mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, klasifikasi, metode

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN 40 BAB III METODOLOGI PENELITIAN 3.1 DESAIN PENELITIAN Dalam melakukan penelitian, dibutuhkan desain penelitian agar penelitian yang dilakukan dapat berjalan dengan baik. Berikut ini merupakan desain penelitian

Lebih terperinci

SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI

SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian Implementasi Sistem Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkahlangkah melakukan clustering dengan FCM,

Lebih terperinci

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika Siti Mutrofin 1, Arrie Kurniawardhani 2, Abidatul Izzah 3, Mukhamad Masrur 4 Universitas Pesantren Tinggi Darul Ulum

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4. IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.5 Amelia Halim 1) dan Joko Lianto Buliali 2) 1) Program Studi Magister

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu metode penambangan data adalah klasifikasi. Metode klasifikasi memiliki beberapa algoritma dan setiap algoritma klasifikasi pada

Lebih terperinci

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN METODE PENELITIAN Proses Dasar Sistem Proses dasar pengembangan sistem secara umum terdiri dari tahapan sebagai berikut: 1 Praproses. Pada tahap ini dilakukan persiapan yang meliputi seleksi data, transformasi

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN)

KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) DAN FUZZY K-NEAREST NEIGHBOR (FK-NN) ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 4, Tahun 2015, Halaman 1077-1085 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian KLASIFIKASI KELOMPOK RUMAH TANGGA DI KABUPATEN BLORA MENGGUNAKAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Untuk melakukan sebuah penelitian, diperlukan adanya tahapan-tahapan yang tersusun dengan baik dan sistematis agar pelaksanaan penelitian tepat mencapai tujuan yang diharapkan.

Lebih terperinci

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE JURNA TEKNIK, (2014) 1-6 1 AIKASI DATA MINING UNTUK MEMREDIKSI ERFORMANSI MAHASISWA DENGAN METODE KASIFIKASI DECISION TREE Irfan Fahmi, Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri,

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE

SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE SISTEM PENDUKUNG KEPUTUSAN MULTIDIMENSI MENGGUNAKAN K-MEANS CLUSTERING BERBASIS MAHALANOBIS DISTANCE WRS Nurwidodo 1) dan Mochamad Hariadi 2) Jurusan Teknik Elektro FTI, ITS, Surabaya Kampus ITS Keputih,

Lebih terperinci

Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan Lulus Tepat Waktu (Studi Kasus : Fakultas Ilmu Komputer Universitas Brawijaya)

Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan Lulus Tepat Waktu (Studi Kasus : Fakultas Ilmu Komputer Universitas Brawijaya) Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 4, April 2018, hlm. 1726-1732 http://j-ptiik.ub.ac.id Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas

Lebih terperinci

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR Dewi Pramudi Ismi 1), Ardiansyah 2) 1 Program Studi Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

Penerapan Algoritma K-Means dalam Data Mining untuk Peminatan Jurusan Bagi Siswa Kelas X (Studi Kasus: SMA Negeri 29 Jakarta)

Penerapan Algoritma K-Means dalam Data Mining untuk Peminatan Jurusan Bagi Siswa Kelas X (Studi Kasus: SMA Negeri 29 Jakarta) Penerapan Algoritma K-Means dalam Data Mining untuk Peminatan Jurusan Bagi Siswa Kelas X (Studi Kasus: SMA Negeri 29 Jakarta) Universitas Islam Negeri Syarif Hidayatullah Jakarta email: nurhayati@uinjkt.ac.id

Lebih terperinci

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012

PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR PADA ANALISIS DATA STATUS KERJA DI KABUPATEN DEMAK TAHUN 2012 ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman 831-838 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PERBANDINGAN METODE KLASIFIKASI NAÏVE BAYES DAN K-NEAREST NEIGHBOR

Lebih terperinci