BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

BAB 1 PENDAHULUAN 1-1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

BAB I PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II LANDASAN TEORI

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II LANDASAN TEORI

MODUL 12 Model Prediktif

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

TINJAUAN PUSTAKA. Definisi Data Mining

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. program studi para siswa (Ruslan,1986:13). Tujuan dari penjurusan (Ruslan, 1986:14), yaitu

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

BAB II LANDASAN TEORI

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

BAB I PENDAHULUAN 1.1 Latar Belakang

Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan

BAB II LANDASAN TEORI

BAB III METODE PENELITIAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

PERBANDINGAN 3 METODE DALAM DATA MINING UNTUK PREDIKSI PENERIMA BEASISWA BERDASARKAN PRESTASI DI SMA NEGERI 6 SURAKARTA

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Penerapan Data Mining Untuk Menampilkan Informasi Pertumbuhan Berat Badan Ideal Balita dengan Menggunakan Metode Naive Bayes Classifier

BAB I PENDAHULUAN. sistem peredaran darah orang lain. Sebelum ditransfusikan, periksa kembali sifat

BAB III METODOLOGI PENELITIAN. Dataset

DAFTAR ISI Transformasi data... 47

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

BAB 1 PENDAHULUAN Latar Belakang

BAB II TINJAUAN PUSTAKA

Manfaat Pohon Keputusan

KONVERSI DATA TRAINING TENTANG PENYAKIT HIPERTENSI MENJADI BENTUK POHON KEPUTUSAN DENGAN TEKNIK KLASIFIKASI MENGGUNAKAN TOOLS RAPID MINER 4.

PERBANDINGAN DECISION TREE

Belajar Mudah Algoritma Data Mining : C4.5

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB III METODE PENELITIAN

BAB 1 PENDAHULUAN. Universitas Sumatera Utara

APLIKASI PENENTUAN CALON PENDONOR DARAH MENGGUNAKAN METODE ALGORITMA ID3 ( STUDI KASUS PMI KOTA KEDIRI )

BAB III METODOLOGI PENELITIAN

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

ISSN : STMIK AMIKOM Yogyakarta, 6-8Februari 2015

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

SILABUS MATAKULIAH. Revisi : 4 Tanggal Berlaku : 04 September Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

Pemanfaatan Educational Data Mining (EDM)...

Sekip Utara Yogyakarta * 1 2

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

Abidah Elcholiqi, Beta Noranita, Indra Waspada

PENDAHULUAN. Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN. Hal ini dibuktikan dengan adanya fakta yang diungkap oleh World Health

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

Educational Data Mining untuk Mengetahui Pola Minat Kerja Mahasiswa

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

DAFTAR ISI PHP... 15

SISTEM PENUNJANG KEPUTUSAN PENERIMA BEASISWA DENGAN METODE DESCISION TREE C4.5 Pada SMAK YOS SUDARSO BATU

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education data mining salah satunya mengetahui seberapa besar pengaruh bentuk pengajaran terhadap hasil yang telah dicapai oleh siswa. Data mining sendiri merupakan proses untuk menemukan pengetahuan ( knowledge discovery) yang ditambang dari sekumpulan volume data yang besar (Han, 2001). Penelitian tentang prediksi diterima pada perguruan tinggi dilakukan karena selama ini data lulusan siswa diterima perguruan tinggi, data nilai, data identitas siswa belum pernah dilakukan pengolahan (mining). Penelitian ini menggunakan teknik klasifikasi untuk mengklasifikasi data identitas siswa berupa asal sekolah, gaji orang tua, pekerjaan orang tua, jumlah saudara dan nilai yang diperoleh siswa selama masa studi tiga (3) tahun. Data - data ini digunakan membangun sebuah model untuk menganalisis peluang prediksi siswa diterima di perguruan tinggi (studi kasus pada SMAN 1 Ponorogo). Ada banyak teknik yang bisa dilakukan dalam melakukan klasifikasi data, diantaranya bayesian classifier, rule based classifier, decision tree maupun support vektor machine (Han dan Kamber, 2006). Penelitian ini, akan menggunakan algoritma C4.5, Naive Bayes serta Support Vektor Machine didalam melakukan klasifikasi data. Sedangkan untuk pengujian tingkat akurasi model yang terbentuk menggunakan metode k-fold cross validation. Penggunaan teknik ini didasari oleh keperluan untuk mengetahui nilai akurasi model dari metode algoritma C4.5, Naive Bayes dan Support Vektor Machine didalam melakukan proses klasifikasi di penelitian ini. Algoritma C4.5 melakukan proses pembentukan model klasifikasi dengan membangun sebuah struktur model yang menyerupai bentuk pohon. Dimana root (akar) merupakan representasi awal mulai percabangan, branch (cabang) sebagai 1

2 percabangan pemilihan dan leaf (daun) sebagai ujung atau hasil yang diprediksi. Menurut Quinlan (1993) algoritma C4.5 dalam melakukan klasifikasi memiliki beberapa kelebihan. Kelebihan ini antara lain, dapat mengolah data numerik (kontinyu) dan data diskrit, dapat menangani nilai atribut yang hilang, menghasilkan aturan aturan yang mudah diterjemahkan dan tercepat diantara algoritma-algoritma yang menggunakan memori utama di komputer. Sedangkan teknik klasifikasi Naive Bayes merupakan teknik klasifikasi dengan kemampuannya melakukan prinsip peluang statistika dalam melakukan pengkombinasian pengetahuan sebelumnya dengan pengetahuan baru. Prinsip ini kemudian digunakan untuk memecahkan masalah klasifikasi (Tan dkk. 2006). Penggunaan Naive Bayes didasari untuk mengetahui nilai probabilitas dari data hasil klasifikasi yang dihasilkan. Menurut Rish (2006) Naive Bayesian Classifier merupakan salah satu algoritma klasifikasi yang sederhana namun memiliki kemampuan dan akurasi tinggi. Support Vektor Machine (SVM) yang merupakan satu kumpulan teknik klasifikasi dan regresi, pengembangan dari algoritma non-linier. Support Vektor Machine dalam melakukan proses klasifikasi dengan menggunakan pasangan data input dan data output berupa target yang diinginkan, yang dikenal dengan pembelajaran terarah ( supervised learning). Dengan pembelajaran terarah akan diperoleh fungsi dalam menggambarkan bentuk hubungan input dan outputnya. Sehingga fungsi yang diperoleh mempunyai kemampuan dapat digunakan untuk data input diluar data pembelajaran (Cortes, 1995). Di dalam proses awal pembentukan model untuk dilakukan klasifikasi, pembersihan data meliputi data siswa, data nilai siswa dilakukan secara manual. Hasil dari pembersihan data tersebut nantinya akan dijadikan sebuah model yang digunakan dalam pengujian beberapa metode klasifikasi dalam mencari nilai akurasi terbaik. Pengujian nantinya menggunakan aplikasi yang dibangun, selain mengetahui tingkat akurasi metode klasifikasi diantara C4.5, Naive Bayes dan Support Vektor Machine, aplikasi dalam penelitian ini diharapkan dapat dimanfaatkan memberikan informasi awal bagi siswa maupun guru di SMAN 1 Ponorogo.

3 1.2 Rumusan Masalah Dari latar belakang yang dijelaskan diatas, maka rumusan masalah dalam penelitian ini adalah : Bagaimana metode klasifikasi dapat dimanfaatkan untuk memperkirakan keberhasilan siswa diterima di perguruan tinggi dari model data berdasarkan identitas siswa, nilai hasil belajar dan data siswa yang telah diterima di perguruan tinggi? 1.3 Tujuan dan Manfaat Penelitian 1.3.1 Tujuan Penelitian 1. Membuat model prediksi tingkat keberhasilan diterima pada perguruan tinggi menggunakan metode klasifikasi. 2. Membuat aplikasi dari hasil pengujian tingkat akurasi tertinggi yang dapat dimanfaatkan oleh komponen SMAN 1 Ponorogo. 1.3.2 Manfaat Penelitian Dengan penelitian ini diharapkan mengetahui tingkat akurasi dari beberapa metode klasifikasi, serta bagi pihak sekolah yakni siswa dan guru bisa mendapatkan informasi awal dari nilai yang sudah diperoleh selama masa studi tentang peluang diterima pada perguruan tinggi. 1. 4 Batasan Penelitian Batasan masalah pada penelitian ini meliputi antara lain: 1. Data yang digunakan dalam penelitian ini adalah data nilai raport siswa kelas x-xi-xii untuk mata pelajaran ujian akhir nasional (UAN), data identitas siswa, serta data kelulusan dalam kurun waktu 11 tahun. 2. Di dalam kurun waktu tersebut terdapat bentuk penilaian catur wulan dengan jumlah 691 record, dan penilaian semester dengan jumlah 3169 record. 3. Menggunakan metode klasifikasi algoritma C4.5, Naive Bayes dan SVM untuk melakukan pengujian tingkat akurasi model yang dihasilkan, serta dilakukan pembandingan tingkat akurasi yang dihasilkan.

4 1.5 Keaslian Penelitian Saat ini banyak penelitian didalam education data mining yang bertujuan untuk memanfaatkan dan menghasilkan informasi dunia pendidikan terkait prediksi, namun yang terkait pengujian tingkat akurasi dari metode klasifikasi algoritma C4.5 Support Vektor Machine dan Naïve Bayes sebagai pembandingnya terhadap model data siswa SMA diterima pada perguruan tinggi menggunakan nilai catur wulan dan nilai semester, sepengetahuan penulis belum pernah ada yang melaksanakan. Beberapa penelitian dengan menggunakan metode klasifikasi dilakukan di dalam rangka untuk mengukur tingkat akurasi. Penelitian penelitian tersebut dijelaskan pada bab II. 1.6 Metode Penelitian. Penelitian ini dilakukan dengan tahapan sebagai berikut : 1.6.1 Analisis Sistem Pada tahap ini dilakukan analisis sistem, yang pada bagian ini dilakukan analisa data apa saja yang dibutuhkan dan kebutuhan kebutuhan perangkat lunak dari sistem yang akan dibangunn. Setelah tahap analisis dikerjakan dan menghasilkan spesifikasi kebutuhan data dan perangkat lunak, kemudian dilakukan pemodelan sistem. Analisis pada pembangunan sistem dilakukan dengan menggunakan analisis sebab dan dampak, serta analisis dengan metode PIECES. Sedangkan pemodelan sistem dilakukan dengan menggunakan model pengembangan berorientasi objek, serta kemudian dilakukan rancangan antar muka pengguna. 1.6.2 Pengumpulan Data Proses pengumpulan data meliputi 2 katagori, yaitu pengumpulan bahan atau materi berupa buku referensi dan jurnal ilmiah. Sedangkan katagori kedua adalah pengumpulan data siswa, data nilai serta data siswa yang telah lulus. Data siswa dan data nilai siswa yang tersedia diambil dari data buku legder (buku kumpulan nilai dan data siswa selama di SMA) yang tersimpan dibagian tata usaha, serta data siswa yang diterima di perguruan tinggi dibagian konseling (BK). bimbingan

5 1.6.3 Pembangunan Sistem Berdasarkan hasil analisis sistem, maka sistem tersebut akan dibangun. Tahap pembangunan sistem dilakukan untuk membangun sistem yang belum ada sebelumnya di SMAN 1 Ponorogo. Adapun proses pembangunan sistem dari proses klasifikasi dilakukan dengan tahapan awal mengumpulkan data. Setelah data terkumpul kemudian dilakukan ekstraksi yaitu mengambil beberapa variabel data dari data siswa, nilai siswa serta data siswa yang telah lulus. Data data yang telah dilakukan ekstraksi kemudian dilakukan pembersihan, penyatuan dan pengubahan bentuk data. Kelas dalam klasifikasi ini adalah kelas lolos untuk siswa yang mengandung informasi lolos ke perguruan tinggi dan kelas tidak untuk siswa yang tidak lolos di perguruan tinggi. Tahapan berikutnya adalah implementasi dari metode metode algoritma yang digunakan, sehingga komputer dapat melakukan proses klasifikasi menggunakan model data yang terbentuk ke dalam aplikasi antar muka berbasis desktop. 1.6.4 Pengujian Sistem Pengujian sistem dilakukan untuk mengukur tingkat akurasi dari metode algoritma C4.5, Support Vektor Machine dan Naive Bayes dengan menggunakan metode 10 Fold Cross Validation terhadap model data. Bentuk pengujian menggunakan metode k-fold cross validation dilakukan menggunakan aplikasi yang telah dibangun. 1.6.5 Penulisan Laporan Tahapan ini dilakukan untuk penulisan laporan terhadap langkah penelitian yang berbentuk laporan tesis. Dimulai dengan pengumpulan data siswa, nilai siswa dan data kelulusan. Kemudian dilakukan proses analisis sistem dengan melakukan pembersihan data, penggabungan dan pengubahan bentuk data. Pengembangan sistem dilakukan dengan membangun sistem aplikasi. Penggunaan data pengujian untuk mengetahui informasi prediksi.