Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 3, No. 10, Oktober 2019, hlm. 10337-10343 http://j-ptiik.ub.ac.id Implementasi Metode Linear Discriminant Analysis (LDA) Untuk Klasifikasi Pengambilan Mata Kuliah Pilihan Ayu Anggrestianingsih 1, Agus Wahyu Widodo 2, Muhammad Tanzil Furqon 3 Program Studi Teknik Informatika, Email: 1 anggrestianingsihayu@gmail.com, 2 a_wahyu_w@ub.ac.id, 3 m.tanzil.furqon@gmail.com Abstrak Fakultas Ilmu Komputer merupakan salah satu fakultas terbaik yang berada di Universitas Brawijaya. Fakultas Ilmu Komputer (FILKOM) memiliki beberapa jurusan salah satunya adalah jurusan Informatika yang paling banyak diminati oleh mahasiswa FILKOM. Ketika mahasiswa memasuki semester 5, maka mereka diwajibkan untuk memilih keminatan yang sesuai dengan kemampuannya. Bidang studi yang ditawarkan ada beragam salah satunya adalah kecerdasan buatan, dimana pada penelitian ini, akan berfokus pada pengambilan mata kuliah pilihan keminatan pada bidang Kecerdasan Buatan, untuk membantu mahasiswa memilih keminatan yang sesuai dengan kemampuannya. Pada penelitian ini, menggunakan metode Linear Discriminant Analysis (LDA) agar bisa mendapatkan akurasi yang baik untuk pengambilan mata kuliah. Data latih yang digunakan sebanyak 30 data, dimana masing-masing kelas terdiri dari 15 data untuk kelas ya dan 15 data untuk kelas tidak dengan 5 mata kuliah pilihan. Maka didapatkan nilai akurasi untuk masing-masing mata kuliah pilihan seperti Logika Fuzzy 40%, Sistem Pendukung Keputusan 40%, Pengolahan Citra Digital 80%, Algoritma Evolusi 20% dan Sistem Pakar 40%. Kata kunci: pengambilan mata kuliah pilihan, linear discriminant analysis, LDA, Klasifikasi Abstract The Faculty of Computer Science is one of the best faculties at Brawijaya University. The Faculty of Computer Science (FILKOM) has several majors, one of which is the Informatics major which is most in demand by FILKOM students. When students enter semester 5, they are required to choose interests that are in accordance with their abilities. There are a variety of fields of study offered, one of which is artificial intelligence, which in this study, will focus on taking electives of interest in the field of Artificial Intelligence, to help students choose interests in accordance with their abilities. In this study, using the Linear Discriminant Analysis (LDA) method in order to get good accuracy for taking courses. The training data used as many as 30 data, where each class consists of 15 data for yes classes and 15 data for classes not with 5 elective courses. Then obtained accuracy values for each elective course such as 40% Fuzzy Logic, 40% Decision Support System, 80% Digital Image Processing, 20% Evolution Algorithm and 40% Expert System Keywords: taking elective courses, linear discriminant analysis, LDA, classification 1. PENDAHULUAN Fakultas ilmu komputer (FILKOM) yang berada di Universitas Brawijaya, sudah terkenal dengan fakultas yang memiliki Akreditasi A. FILKOM juga memiliki beberapa jurusan diantara jurusan Informatika (IT). Jurusan informatika memiliki beberapa keminatan seperti kecerdasan buatan, dimana untuk mahasiswa yang akan menempuh semester 5 wajib memilih keminatan yang sesuai dengan kemampuannya. Karena banyaknya mata kuliah pilihan yang ditawarkan banyak pula mahasiswa yang asal-asalan dalam memilih mata kuliah pilihan karena tidak paham dengan minatnya. Untuk mengatasi masalah tersebut maka dalam penelitian ini, penulis akan Fakultas Ilmu Komputer Universitas Brawijaya 10337
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 10338 menggunakan metode Linear Discriminant Analysis (LDA) untuk membantu mahasiswa memilih keminatan apa saja yang lebih sesuai untuk diambil berdasarkan nilai prasyarat yang telah diambil sebelumnya. Implementasi Data Mining untuk Prediksi Mahasiswa Pengambilan Mata Kuliah Dengan Algoritma Naïve Bayes yang dilakukan oleh Indra Kurniawan Syahputra (2018) menghasilkan 44,92% untuk mata kuliah Jaringan Nirkabel dan 85,88% untuk mata kuliah Manajemen Hubungan Pelanggan sebagai nilai Accuracy. Pendeteksi jenis autis pada anak usia dini menggunakan metode Linear Discriminant Analysis (LDA) yang dilakukan oleh Edwan Budiman (2017) memiliki nilai akurasi sistem sebesar 88% dengan menggunakan 75 data trainingdan memiliki tiga kelas jenis gejala autis (kelas ringan, kelas sedang, kelas berat) yang disesuaikan oleh keadaan penderita. Rekomendasi Pengambilan Mata Kuliah Pilihan Untuk Mahasiswa Sistem Informasi Menggunakan Algoritma Decision Tree yang dilakukan oleh Putu Pradnyana Iswara (2019) yang menghasilkan nilai akurasi sistem dengan rata-rata 86,90%, 80,62%, 67,49% dan 66,48%, testing yang dilakukan dalam penetian ini sebanyak 5 kali dengan menggunakan metode Decision Tree dan menggunakan data latih pada tahun 2015 untuk data training dan 2016 untuk data testing yang diperoleh dari akademik sistem informatika. Tujuan dari penelitian ini adalah untuk mengimplementasikan metode linear discriminant analysis (LDA) dengan mencari nilai akurasi tertinggi pada masing masing mata kuliah yang diujikan sehingga bisa digolongkan masuk kelas ya atau kelas tidak. 2. DASAR TEORI 2.1 Linear Discriminant Analysis (LDA) Teori statistika yang telah banyak digunakan secara luas baik dalam hal pengolahan citra, pembelajaran mesin dan pengolahan data merupakan metode Linear Discriminant Analysis (LDA). Pada tahun 1936 Linear Discriminant Analysis (LDA) pertama kali dibuat serta dipublikasikan oleh Ronald A. Fisher yang berjudul The Use Of Multiple Measure in Taxonomic Problem yang dirilis melalu sebuah paper. Sebuah statistika terpisah untuk masing-masing obyek yang menggunakan metode ekstraksi fitur yang dipadukan dengan statistika dan perhitungan operasi matematika. (Sholahuddin, Siregar, Supriana, & Hadi, 2010) Untuk melalukan perhitungan linear discriminant analysis (LDA) rumus yang digunakan akan dijabarkan pada Persamaan 1. f i = fungsi discrimiant kelas ke i C -1 x k T P I μ i T = invers dari grup matriks kovarian = matriks transpose dari matriks data uji = peluang munculnya kelas ke-i = transpose rata-rata kelas ke-i 2.2 Akurasi Akurasi yaitu hasil perbandingan antara hasil keluaran (output) dari perhitungan excel dengan hasil keluaran data uji yang telah diujikan oleh pakar memiliki nilai yang sama atau tidak (Gardenia, 2015). Ketika hasil outputan mempunyai nilai yang sama antara perhitungan dan data yang diujikan, maka semakin meningkat pula untuk nilai kebenarannya. Perhitunagan akurasi akan ditampilkan pada persamaan 2. jumlah data 3. DATA PENELITIAN Dalam penelitian ini data yang digunakan adalah data primer pada tahun 2015-2017 untuk training dan testing tahun 2018 yang diperoleh dari akademik fakultas ilmu komputer universitas brawijaya, dimana data latih yang digunakan sebanyak 30 data dan 5 data uji dengan 5 mata kuliah pilihan (Logika Fuzzy, Sistem Pendukung Keputusan, Pengolahan Citra Digital, Sistem Pakar dan Algoritma Evolusi) yang akan diklasifkasi dengan menggunakan metode Linear Discriminant Analysis (LDA). 4. PERANCANGAN 4.1 Preprocessing Data Preproses adalah langkah pertama dari
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 10339 tahapan perancangan, dimana penulis akan menyeleksi data yang sudah terkumpul. Fitur yang digunakan pada penelitian ini terdiri dari 4 fitur yaitu (semester, SKSK, IPK dan nilai prasyarat). Menggunakan 30 data latih yang terdiri dari kelas (ya) dan kelas (tidak) dengan 15 data latih untuk masing-masing kelas. Mata kuliah pilihan yang akan diujikan terdiri dari (Logika Fuzzy, Sistem Pendukung Keputusan, Pengenalan Citra digital, Algoritma Evolusi dan Sistem Pakar) dengan 5 data uji untuk masing-masing mata kuliah pilihan. 4.2 Diagram Alir Linear Discriminant Analysis (LDA) Diagram alir atau flowchart untuk perhitungan menggunakan metode LDA ditunjukkan oleh Gambar 2 Gambar 2 Diagram Alir Linear Discriminant Analysis Untuk menjabarkan metode Linear Discriminant Analysis (LDA) meliputi beberapa proses yaitu sebagai berikut: 1. Membuat matriks rata-rata masingmasing kelas Matriks rata-rata untuk masing-masing kelas diperoleh dari banyaknya kelas yang sama yang kemudian akan digunakan untuk mencari nilai mean corrected yang akan dilakukan untuk langkah selanjutnya. 2. Membuat nilai mean global Nilai mean global diperoleh dari hasil rata-rata keseluruhan dataset yang nantinya akan digunakan untuk tahap selanjunya. 3. Membuat matriks mean corrected Matriks mean corrected diperoleh dari hasil pengurangan data training di masing masing kelas dengan nilai rata-rata mean global. 4. Membuat matriks transpose Matriks transpose didapat dari mean corrected dan kemudian dirubah menjadi matriks transpose. 5. Membuat matriks kovarian perkelas, kovarian grup dan invers Matriks kovariann diperoleh dari perkalian antara matriks transpose dengan matriks mean corrected dan dibagi oleh jumlah data training di tiap-tiap kelas. Kemudian hasil dari matriks kovarian dijadikan matriks kovarian grup yang diperoleh dari perhitungan hasil penjumlahan kovarian dibagi jumlah data yang digunakan. Tahap selanjutnya mencari matriks invers dari kovarian grup. 6. Membuat Probabilitas Prior di setiap kelas Nilai probabilitas prior diperoleh dari membagi jumlah data training di satu kelas dengan jumlah data keseluruhan. 7. Mencari Fungsi Discriminant Proses fungsi discriminant digunakan untuk mecari nilai tertingi pada masing-masing kelas yang diujikan dan sebagai hasil akhir dari proses Linear Discriminant Analysis. 5. PENGUJIAN DAN ANALISIS Pengujian dan analisis terhadap data latih yang telah ditentukan, dengan menggunakan 30 data latih yang terdiri dari 15 data untuk kelas ya dan 15 data untuk kelas tidak dengan mengunakan 5 data uji. Hasil keluran meggunakan metode LDA dengan perhitungan excel yang akan dibandingkan dengan kelas data uji untuk mengetahui valid atau tidaknya hasil keluaran terhadap kelas data uji dan mendapatkan nilai akurasi. Dengan menggunakan 5 mata kuliah pilihan yang terdiri dari Logika Fuzzy, Sistem Pendukung Keputusan, Pengolahan Citra Digital, Algoritma Evolusi dan Sistem Pakar maka keluaran setiap mata kuliah pilihan akan menghasilkan nilai yang berbeda.
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 10340 5.1 Pengujian Akurasi terhadap mata kuliah pilihan Logika Fuzzy Pengujian mata kuliah pilihan logika fuzzy menggunakan data latih sebanyak 30 dan 15 data untuk masing-masing kelas yang ada dan 5 data uji untuk menghitung nilai akurasi. Nilai kelas Ya dan kelas Tidak pada tabel 1 diperoleh dari hasil akhir perhitungan fungsi discriminant pada masing-masing kelas yang kemudian dicari nilai tertinggi antara kelas Ya dan kelas Tidak sehingga menghasilkan class pada kelas data yang diujikan Tabel 1 akan menjabarkan hasil akurasi dengan 30 data training. Tabel 1 Hasil Pengujian Akurasi Mata Kuliah Logika Fuzzy menampilkan hasil akurasi dengan 30 data latih. Tabel 2 Hasil Pengujian Akurasi Mata Kuliah SPK Dari tabel 2 hasil keluaran menggunakan uji sebanyak 2 data, sedangkan yang tidak sesuai ada 3 data. Sesuai dengan persamaan (2) 2 5 40% Dari tabel 1 hasil keluaran menggunakan uji sebanyak 2 data, sedangkan yang tidak sesuai ada 3 data. Sesuai dengan persamaan (2) nilai akurasi untuk mata kuliah pilihan logika fuzzy adalah sebagai berikut 2 5 40% 5.2 Pengujian Terhadap Mata Kuliah Sistem Pendukung Keputusan Pengujian mata kuliah pilihan sistem pendukung keputusan menggunakan data latih sebanyak 30 dan 15 data untuk masingmasing kelas yang ada dan 5 data uji untuk menghitung nilai akurasi. Nilai kelas Ya dan kelas Tidak pada tabel 2 diperoleh dari hasil akhir perhitungan fungsi discriminant pada masing-masing kelas yang kemudian dicari nilai tertinggi antara kelas Ya dan kelas Tidak sehingga menghasilkan class pada kelas data yang diujikan. Tabel 2 akan 5.3 Pengujian Terhadap Mata Kuliah Pengolahan Citra Digital Pengujian mata kuliah pilihan pengolahan citra digital menggunakan data latih sebanyak 30 dan 15 data untuk masing-masing kelas yang ada dan 5 data uji untuk menghitung nilai akurasi. Nilai kelas Ya dan kelas Tidak pada tabel 3 diperoleh dari hasil akhir perhitungan fungsi discriminant pada masing-masing kelas yang kemudian dicari nilai tertinggi antara kelas Ya dan kelas Tidak sehingga menghasilkan class pada kelas data yang diujikan. Tabel 3 akan menampilkan hasil akurasi dengan 30 data latih. Tabel 3 Hasil Pengujian Akurasi Mata Kuliah PCD Dari tabel 3 hasil keluaran menggunakan uji sebanyak 4 data, sedangkan yang tidak sesuai ada 1 data. Sesuai dengan persamaan (2)
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 10341 4 5 80% 5.4 Pengujian terhadap mata kuliah Algoritma Evolusi Pengujian mata kuliah pilihan algoritma evolusi keputusan menggunakan data latih sebanyak 30 dan 15 data untuk masing-masing kelas yang ada dan 5 data uji untuk menghitung nilai akurasi. Nilai kelas Ya dan kelas Tidak pada tabel 4 diperoleh dari hasil akhir perhitungan fungsi discriminant pada masing-masing kelas yang kemudian dicari nilai tertinggi antara kelas Ya dan kelas Tidak sehingga menghasilkan class pada kelas data yang diujikan. Tabel 4 akan menampilkan hasil akurasi dengan 30 data latih. Tabel 4 Hasil Pengujian Akurasi Mata Kuliah Algoritma Evolusi kelas Ya dan kelas Tidak pada tabel 5 diperoleh dari hasil akhir perhitungan fungsi discriminant pada masing-masing kelas yang kemudian dicari nilai tertinggi antara kelas Ya dan kelas Tidak sehingga menghasilkan class pada kelas data yang diujikan. Tabel 5 akan menampilkan hasil akurasi dengan 30 data latih. Tabel 5 Hasil Pengujian Akurasi Mata Kuliah Sistem Pakar Dari tabel 5 hasil keluaran menggunakan uji sebanyak 2 data, sedangkan yang tidak sesuai ada 3 data. Sesuai dengan persamaan (2) 2 5 40% Dari tabel 4 hasil keluaran menggunakan uji sebanyak 1 data, sedangkan yang tidak sesuai ada 4 data. Sesuai dengan persamaan (2) Dari masing masing tabel akurasi di tiap tiap mata kuliah pilihan yang diklasifikasi, maka dapat dibuat grafik agar terlihat pola dari pengujian dengan menngunakan metode Linear Discriminant Analysis dengan menggunakan 5 data latih pada masing masing mata kuliah pilihan. Gambar 3 menampilkan grafik nilai akurasi untuk masing masing mata kuliah pilihan. 1 5 20% 5.5 Pengujian terhadap mata kuliah Sistem Pakar Pengujian mata kuliah pilihan sistem pakar menggunakan data latih sebanyak 30 dan 15 data untuk masing-masing kelas yang ada dan 5 data uji untuk menghitung nilai akurasi. Nilai
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 10342 Gambar 3 Grafik nilai akurasi untuk masing masing mata kuliah pilihan Sesuai dengan gambar 3 nilai akurasi setiap mata kuliah pilihan yang diujikan memiliki akurasi yang berbeda, kecuali untuk mata kuliah pilihan Logika Fuzzy dan SPK memiliki nilai akurasi yang sama yaitu sebanyak 40%, nilai akurasi tertinggi terletak pada mata kuliah pilihan pengolahan citra digital sebesar 80%, sedangkan untuk nilai terendah terletak pada mata kuliah pilihan Algoritma Evolusi sebesar 20% dan Sistem pakar sebanyak 40%, dan dapat disimpulkan bahwa pada tahun 2015-2017 peminat mahasiswa terhadap mata kuliah pilihan yang diambil berada pada pengolahan citra digital. 6. PENUTUP 6.1 Kesimpulan Berdasarkan pada hasil perancangan dan pengujian serta analisis dari penelitian ini, maka dapat disimpulkan sbagai berikut: 1. Dengan menggunakan metode LDA (Linier Discriminant Analysis) untuk mengklasifikasi 4 fitur (Semester, SKSK, IPK, dan Nilai Prasyarat) dangan 2 kelas (Ya dan Tidak) serta 5 mata kuliah pilihan (Logika Fuzzy, Sistem Kecerdasan Buatan, Pengolahan Citra Digital, Algoritma Evolusi, Sistem Pakar) telah terbukti dapat mengklasifikasi data yang ada. 2. Dari skenario pengujian yang ada, tingkat akurasi dengan menggunakan metode LDA tergantung pada kelas data uji. Skenario yang memiliki nilai terbesar yaitu 80% dengan menngunakan 30 data latih serta 5 data uji dengan kelas ya yang mendominasi. 6.2 Saran Saran untuk penelitian yang akan dilakukan selanjutnya adalah sebagai berikut: 1. Untuk mata kuliah pilihan yang akan diklasifikasi sebaiknya lebih diperbanyak lagi. 2. Nilai Akurasi sebaiknya dilakukan berulang kali untuk masing masing mata kuliah pilihan yang diujikan agar nilai akurasinya lebih valid. 3. Untuk penelitian selanjutnya bisa memadukan metode LDA dengan metode yang lainnya, dengan harapan agar nilai akurasi yang didapatkan lebih sempurna. 7. DAFTAR PUSTAKA Anthasenna, I. G., Mahmudy, W. F., & Furqon, M. T. (2014). Jurnal Mahasiswa PTIIK Universitas Brawijaya. Sistem Identifikasi Gendre Musik Dengan Metode Ektraksi Fitur FFT dan Metode Klasifikasi Linear Discriminant Analysis Beserta Similarity Meansure. Azizah, R. N. (2008). Pengenalan Wajah dengan Metode Subspace LDA. Teknik Elektro ITS, 1-6. Budiman, E., Santoso, E., & Afirianto, T. (2019). Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer. Pendeteksi Jenis Autis pada Anak Usia Dini Menggunakan Metode Linear Discriminant Analysis (LDA), 583-592. Gardenia, M., Tursina, & Pratiwi, H. S. (2015). ProgramStudi Teknik Informatika Fakultas Teknik Universitas Tanjungpura. Sistem Pakar Deteksi Autisme Pada Anak Menggunakan Metode Fuzzy Tsukomoto. Harahap, E. H. (2018). Implementasi Algoritma Support Vector Machine (SVM) Untuk Penentuan. Pengembangan Teknologi Informasi dan Ilmu Komputer, 3843-3848. Iswara, P. P., Farhan, F., Kumara, W., & Supianto, A. A. (2019). Jurnal Teknologi Informasi dan Ilmu Komputer (JTIIK). Rekomendasi Pengambilan Mata Kuliah Pilihan Untuk Mahasiswa Sistem Informasi Menggunakan Algoritme Decision Tree, 341-348. Marthasari, G. I. (2017). Implementasi Teknik Data Mining untuk Evaluasi Kinerja Mahasiswa. Teknik Informatika Vol.2 No.2, 20-27. Scholkopf, B. (2001). The Kernel Trick for Distances. Advances in Neural information Processing System. Sholahuddin, A., Siregar, R. E., Supriana, I., & Hadi, S. (2010). Penerapan Metode Linear Discriminant Analysis Pada Pengenalan Wajah Berbasis Kamera. Konferensi Nasional Matematika, Ke- 15 Di UNIMA. Syahputra, I. K., Bachtiar, F. A., & Wicaksono, S. A. (2018). Jurnal Pengembangan
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer 10343 Teknologi Informasi dan Ilmu Komputer. Implementasi Data Mining untuk Prediksi Mahasiswa Pengambil Mata Kuliah dengan Algoritme Naive Bayes, 5902-5910.