HASIL DAN PEMBAHASAN

Ukuran: px
Mulai penontonan dengan halaman:

Download "HASIL DAN PEMBAHASAN"

Transkripsi

1 HASIL DAN PEMBAHASAN Praproses Data Tahap pertama yang dilakukan adalah menyeleksi seluruh data pada kedua dataset dengan memperhatikan keberadaan setiap record data pada keduanya. Jika terdapat record tertentu pada salah satu dataset namun record tersebut tidak terdapat pada dataset yang lain, maka record yang dimaksud akan dihapus karena record tersebut dinilai tidak konsisten. Pada Tabel 5 dan Tabel 6 di bawah ini berisi contoh ketidak-konsistenan data pada dataset mahasiswa dan dataset IPK. Tabel 5. Contoh data pada dataset mahasiswa NRP NAMA TGLHR ALMHS1 KOTA NMSLA Ikrar Achmad B 10/28/1981 Komp. Kopassus Depok SMU 105 Jkt Cindy Rahmawati 7/23/1982 Delima I Blok K-3 Depok SMUN Dyah Andri M 1/4/1981 Sukatani Cimanggis Depok SMU Islam PB.Sudirman Siti Maesaroh 10/19/1981 Jakarta SMUN 97 Ciganjur Yanuar Tri P 1/8/1982 Pinang Kp. Baru Jakarta SMU Borobudur Fransiskus Ony F 2/23/1983 Laki Cimanggis Bogor SMUN I Cimanggis Tabel 6. Contoh data pada dataset IPK I_NRP I_THAK I_SMT I_IPS I_JSKSS I_IPK I_JSKSK Record dengan NRP= yang terdapat pada dataset mahasiswa tidak terdapat pada dataset IPK, maka record tersebut dihapus karena dinilai tidak konsisten keberadaan informasinya. Yang dilakukan selanjutnya adalah seleksi terhadap atribut dataset, dimana diketahui sebanyak 64 atribut terdapat pada dataset mahasiswa dan 7 atribut pada dataset IPK. Seleksi ini dilakukan untuk mendapatkan atribut-atribut

2 dengan nilai yang relevan terhadap status keaktifan studi mahasiswa sehingga untuk selanjutnya atribut-atribut yang dinilai berisi nilai yang tidak relevan tidak lagi disertakan dalam dataset. Di bawah ini disajikan contoh instances dengan beberapa atribut pada dataset mahasiswa seperti tampak pada Tabel 7. Tabel 7. Contoh instances dengan beberapa atribut pada dataset mahasiswa NoForm NoUjiGel NoUji NRP Nama PilJur1 PilJur2 TglDft TryOut WIDYA SIST /30/2001 FALSE M.ARYA NUG /3/2001 TRUE ANDRI SUHA /3/2001 FALSE BONDAN AND /4/2001 FALSE SITI KOMAL /5/2001 FALSE ASNIDA RAT /6/2001 TRUE ACHMAD DJO 502 4/10/ EDO TIAS R 511 4/10/ IKA MARYAN 512 4/10/2001 FALSE ANGELA RUS /12/2001 FALSE NoForm, NoUjiGel, NoUji, NRP, Nama adalah atribut-atribut yang tidak digunakan dalam penelitian karena menjadi tidak relevan jika seorang mahasiswa berpotensi tidak aktif pada waktu yang akan datang ditentukan oleh atribut-atribut tersebut. PilJur1, PilJur2, TglDft dan TryOut dapat dipilih sebagai atribut dalam penelitian, namun tidak terdapat keterangan atau penjelasan yang berkaitan dengan atribut-atribut tersebut baik berupa nilai hasil ujian masuk, lama waktu yang disediakan untuk mendaftar pada setiap gelombang daftar, dan lembaga yang melaksanakan tryout serta kapan dilaksanakannya, maka atribut-atribut yang tertera pada tabel di atas tidak dipilih untuk digunakan dalam penelitian. Pada Tabel 8 di bawah ini, disajikan contoh instances dengan atribut pada dataset IPK. Tabel 8. Contoh instances dengan atribut pada dataset IPK I_NRP I_THAK I_SMT I_IPS I_JSKSS I_IPK I_JSKSK

3 I_NRP I_THAK I_SMT I_IPS I_JSKSS I_IPK I_JSKSK Contoh dataset di atas digunakan untuk melihat prestasi akademik yang diperoleh oleh setiap mahasiswa pada tiap semester yang diambil. Atribut I_IPK adalah satu-satunya atribut yang dipilih karena dinilai sudah mewakili informasi prestasi akademik mahasiswa hingga saat masa akhir studi yang ditempuh. Pada sistem yang berjalan, masa studi yang telah ditempuh oleh setiap mahasiswa dapat dilihat pada atribut I_THAK, I_SMT dan I_JSKSK. Jika mahasiswa dengan NRP tertentu tidak muncul pada tahun akademik selanjutnya baik pada semester ganjil maupun genap maka mahasiswa tersebut dianggap tidak menyelesaikan masa studi yang harus ditempuh. Misal masa studi D3 adalah 7 semester dengan total sks 115 sks, namun mahasiswa yang dimaksud tidak melakukan registrasi pada tahun akademik dan semester yang sedang berjalan dan pada semester selanjutnya hingga masa studi yang berlaku dan total sks yang telah diambil lebih kecil atau sama dengan separuh dari total sks yang berlaku. Tahap seleksi atribut tidak hanya dilakukan untuk mendapatkan konsistensi dan relevansi isi dari atribut yang dimiliki namun juga dilakukan seleksi terhadap atribut yang mengandung missing value atau nilai yang hilang atau kosong, serta atribut yang mengandung data yang redudancy atau data yang duplikat. Jika ditemukan dalam kedua dataset terdapat atribut dengan nilai kosong atau missing value ataupun atribut dengan data yang redudancy, maka data tersebut dihapus, demikian halnya seperti seleksi yang dilakukan sebelumnya terhadap atribut-atribut dalam dataset. Hal ini dilakukan karena atribut yang missing value tidak memberikan informasi apapun jika dipertahankan keberadaannya, demikian pula dengan atribut yang redundancy, maka cukup dipilih salah satunya saja dari data yang redundant karena data tersebut berisi informasi yang sama. Tahap seleksi ini disebut juga dengan tahap pembersihan data atau data cleaning yang bertujuan mendapatkan data yang bersih, sehingga

4 data tersebut dapat digunakan untuk tahap selanjutnya yaitu transformasi data. Pada Gambar 2 telah diperlihatkan bahwa proses data cleaning adalah proses awal yang dikerjakan sebelum melakukan tahap mining. Dari tahap seleksi atribut yang telah dilakukan di atas diperoleh beberapa atribut sementara yang akan digunakan dalam penelitian, yaitu : NRP, Tgllhr, Alamat, Pekerjaan Orangtua, JenisSLA, WilSMU, Anakke, dan Dari yang berasal dari dataset mahasiswa dan atribut IPK dari dataset IPK. Dan jumlah data akhir yang diperoleh adalah sebanyak record data dari total data sebelumnya adalah record data. Selanjutnya adalah menghapus atribut NRP, dimana pada tahap sebelumnya atribut ini digunakan untuk melihat kemunculannya pada tiap semester dan tahun akademik pada dataset IPK, setelah diperoleh informasi yang dicari maka atribut ini sudah tidak lagi diperlukan. Sehingga atribut-atribut yang digunakan hanya tinggal atribut Tgllhr, JenisSLA, PkOrtu, Anakke dan Dari. Tahap berikutnya adalah merubah tipe data dari beberapa atribut tadi, diantaranya adalah atribut Tgllhr, JenisSLA, PkOrtu, Anakke dan atribut Dari. Hal ini dilakukan dengan tujuan agar isi pada setiap atribut lebih mudah dipahami oleh pengguna data maupun pengguna informasi. Pada Tabel 9 di bawah ini ditampilkan contoh instances dengan atribut-atribut yang disebutkan tadi. Tabel 9. Contoh instances dengan atribut yang akan dirubah tipe datanya TGLLAHIR PK_ORTU JNSSLA AKKE DARI 3/4/ /3/ /23/ /24/ /19/ /11/ /1/ /7/ /13/ /1/ /11/ /28/

5 TGLLAHIR PK_ORTU JNSSLA AKKE DARI 10/25/ /23/ Tipe data atribut TglLhr yang semula adalah date diubah menjadi atribut Usia dengan tipe data numeric, sehingga tidak lagi berisi tanggal lahir mahasiswa melainkan berisi usia mahasiswa pada saat awal kuliah pada semester satu. Tipe data JenisSLA, PkOrtu, Anakke dan Dari diubah menjadi bertipe data string, sehingga dapat lebih mudah dipahami isi atribut yang dikandung dan tipe data ini dan sesuai dengan tipe data yang digunakan dalam algoritma decision tree. Atribut Anakke dan atribut Dari dijadikan dalam satu atribut baru bernama Anakke yang berisi informasi kategori urutan anak dalam keluarga. Beberapa atribut pada tabel di atas masih berisi data dalam bentuk kode angka, seperti nampak pada atribut PkOrtu dan JenisSLA. Berikut ini pada Tabel 10 disajikan keterangan kode pada kedua atribut tersebut. Tabel 10. Keterangan kode pada atribut PkOrtu dan JenisSLA Atribut Kode Keterangan PkOrtu 1 TNI 2 PNS 3 Swasta 4 Purnawirawan JenisSLA 1 SMU 2 SMK 3 MA/MAN Setelah perubahan tipe data dan pemberian nama baru dilakukan kepada beberapa atribut maka isi dari atribut yang bersangkutanpun berubah. Berikut ini tampak pada Tabel 11 adalah contoh instances dengan tipe data dan nama atribut yang baru. Tabel 11. Contoh instances dengan tipe data dan nama atribut yang baru USIA PKORTU JNSSLA Anakke 17 TNI smu sulung 18 TNI smu sulung 19 SWASTA smu tengah

6 USIA PKORTU JNSSLA Anakke 21 PURNAWIRAWAN smu tengah 19 PURNAWIRAWAN smu sulung 17 PURNAWIRAWAN smu bungsu 19 PNS smu bungsu 18 PURNAWIRAWAN smu sulung 18 PURNAWIRAWAN smu bungsu 17 PURNAWIRAWAN smu tunggal 20 PNS smu bungsu 19 SWASTA smu bungsu 19 PNS smu tengah 19 PURNAWIRAWAN smu tengah Beberapa tahapan yang telah dilakukan sebelumnya telah memberikan hasil berupa dataset dengan atribut-atribut terpilih yang akan digunakan selanjutnya pada tahap transformasi data. Selengkapnya atribut terpilih tersebut beserta contoh datanya dapat dilihat pada Tabel 12 di bawah ini. Tabel 12. Contoh instances dengan atribut terpilih USIA ALAMAT PKORTU JNSSLA WILSMU Anakke IPK 17 JAKARTA TNI smu jakarta sulung JAKARTA TNI smu jakarta sulung TANGERANG SWASTA smu tangerang tengah JAKARTA PURNAWIRAWAN smu jakarta tengah JAKARTA PURNAWIRAWAN smu jakarta sulung JAKARTA PURNAWIRAWAN smu jakarta bungsu DEPOK PNS smu lainnya bungsu LAINNYA PURNAWIRAWAN smu lainnya sulung JAKARTA PURNAWIRAWAN smu jakarta bungsu JAKARTA PURNAWIRAWAN smu jakarta tunggal DEPOK PNS smu jakarta bungsu JAKARTA SWASTA smu jakarta bungsu JAKARTA PNS smu jakarta bungsu JAKARTA PNS smu jakarta bungsu 2.19 Berikut ini disajikan beberapa keterangan yang berkaitan dengan atributatribut pada tabel di atas, yaitu :

7 a. Usia Merupakan atribut yang berisi usia mahasiswa pada saat masuk kuliah semester satu. Atribut ini adalah atribut pengganti dari atribut sebelumnya yaitu Tgllhr. b. Alamat Merupakan atribut yang berisi alamat tinggal mahasiswa pada saat melakukan registrasi ulang. Untuk selanjutnya atribut ini dikelompokkan dalam enam kategori kota wilayah tinggal yaitu Jakarta, Bogor, Depok, Tangerang, Bekasi, dan Lainnya. Kategori kota lainnya memberikan arti bahwa kota yang dimaksud adalah kota wilayah selain dari lima kota wilayah yang sudah disebutkan tadi. c. PkOrtu Merupakan atribut yang menjelaskan jenis pekerjaan orang tua dari mahasiswa, yang kemudian dikelompokkan dalam empat kategori yaitu Purnawirawan, Swasta, TNI (yang maksud adalah anggota Tentara Nasional Indonesia), dan PNS (Pegawai Negeri Sipil). Pengelompokkan ini didasarkan kepada data sumber tentang jenis pekerjaan orang tua yang dimiliki oleh FIK-UPNVJ. d. JenisSLA Merupakan atribut yang menjelaskan kelompok sekolah lanjutan asal mahasiswa yang dikelompokkan ke dalam jenis sekolah kejuruan (SMK), sekolah menengah umum (SMU), dan sekolah lanjutan atas keagamaan (MA/Madrasah Aliyah). e. WilSMU Berisi alamat wilayah kota sekolah lanjutan asal mahasiswa. Kategori yang dibuat untuk atribut ini adalah sama dengan kategori yang ada pada atribut sebelumnya yaitu alamat, yaitu Jakarta, Bogor, Depok, Tangerang, Bekasi, dan Lainnya. f. Anakke Merupakan atribut yang menjelaskan urutan anak dalam keluarga. Kategori yang dibuat berdasarkan kepada informasi yang ada pada atribut Anakke

8 dan Dari, dengan menganalisa isi terhadap keduanya sehingga atribut yang dihasilkan terbagi ke dalam empat kategori yaitu sulung, tengah, bungsu, dan tunggal. g. IPK Merupakan atribut yang berisi nilai prestasi kumulatif mulai dari semester satu hingga akhir semester yang di tempuh oleh mahasiswa. Terdapat lima kategori IPK yang diberlakukan pada FIK-UPNVJ yaitu IPK < 1.50, , , , dan >= Hasil yang di peroleh dari tahap seleksi atribut di atas telah menghasilkan sejumlah 7 atribut baru dan record data dengan isi data yang tidak lagi redundant, tidak missing value dan data yang digunakan adalah data yang konsisten. Untuk selanjutnya dataset tersebut disebut dengan nama dataset akademik. Tahapan yang akan dikerjakan kemudian adalah transformasi data, yang akan dijelaskan pada sub bahasan selanjutnya. Data Mining Dengan menggunakan metode 3-fold cross validation maka dataset akademik secara acak dibagi ke dalam tiga bagian, yaitu dua bagian sebagai data training dan satu bagian sebagai data testing. Pada Tabel 13 berikut ini disajikan kombinasi dari tiga bagian dataset akademik tersebut. Tabel 13. Kombinasi dataset hasil pemisahan dengan metode 3-fold cross validation Data Training Data Testing Dataset 1 dan Dataset 2 (training 1) Dataset 3 (testing 1) Dataset 1 dan Dataset 3 (training 2) Dataset 2 (testing 2) Dataset 2 dan Dataset 3 (training 3) Dataset 1 (testing 3) Kemudian dataset di atas digunakan untuk mengkonstruksi pohon keputusan (decision tree) yang dimulai dengan pembentukan bagian akar, kemudian data terbagi berdasarkan atribut-atribut yang sesuai untuk dijadikan leaf

9 node. Tahap ini dimulai dengan melakukan seleksi atribut menggunakan formula information gain yang terdapat pada algoritma C5.0 seperti tampak pada halaman 11 Formula 2.1, Formula 2.2 dan Formula 2.3, sehingga diperoleh nilai gain untuk masing-masing atribut, yang mana atribut dengan nilai gain tertinggi akan menjadi parent bagi node-node selanjutnya. Node-node tersebut berasal dari atribut-atribut yang memiliki nilai gain yang lebih kecil dari nilai gain atribut parent. Maka untuk mendapatkan nilai gain dari dua kelas output yang berbeda yaitu aktif dan tidak aktif pada dataset akademik adalah dengan menghitung tingkat impurity kedua kelas tersebut. Berikut ini pada Tabel 14 disajikan contoh data kelas mahasiswa aktif dan tidak aktif berdasarkan atribut JnsSLA. Tabel 14. Contoh data dengan kelas mahasiswa aktif dan tidak aktif berdasarkan atribut JnsSLA JnsSLA Aktif Tidak Aktif SMU SMK MA 20 8 Selanjutnya dengan menggunakan data pada Tabel 14 di atas dicari nilai information gainnya yaitu, I ( 925,250) = log2 log = 0, Jika dalam satu set hanya terdiri dari satu kelas maka entropinya = 0. Jika perbandingan dua kelas rasionya sama maka nilai entropinya=1. Dengan menggunakan formula yang sama dilakukan pemilihan atribut, dimana akan dihitung rasio nilai kelas aktif dan tidak aktif dari seluruh atribut. Salah satu contoh penerapan formula tersebut untuk pemilihan atribut (atribut JnsSLA) adalah sebagai berikut, JnsSLA = SMU, I 801,219 = log log ( ) 0, 75 2 =

10 JnsSLA = SMK, I (,23) = log log 0, 682 JnsSLA = MA, 2 = I (,8) = log log = Maka total entropi atribut JnsSLA : E ( JnsSLA) = ( 0,75) + ( 0,682) + ( 0,862) = 0, 745 Maka nilai Gain atribut JnsSLA : G ( JnsSLA) = 0,739 0,745 = 0, 006 Hasil diatas diperoleh dengan menggunakan data 100% yang berjumlah 1175 dengan keadaan data tidak terbagi ke dalam 3-fold cross validation. Bila diterapkan pada data yang sudah terbagi ke dalam 3-fold cross validation akan memberikan hasil yang berbeda pada setiap kelompok datanya. Untuk tahap selanjutnya hal yang sama yaitu penerapan formula information gain dilakukan terhadap atribut-atribut yang lainnya dalam dataset akademik, sehingga diperoleh atribut dengan nilai gain tertinggi yang kemudian dipilih sebagai simpul pertama pada decision tree yang dikenal dengan nama root/akar. Pada simpul selanjutnya secara berurutan diisi oleh atribut-atribut yang bernilai gain lebih rendah, dan akan berhenti pada simpul akhir yang berisi kelas output dari setiap cabangnya yang dikenal dengan nama leaf/daun. Tabel 15 di bawah ini menyajikan nilai gain dari seluruh atribut pada kelompok data training dan data testing yang mana nilai gain atribut Alamat, PkOrtu, JnsSLA, WilSMU, Anakke, dan IPK yang terdapat dalam tabel adalah hasil pembulatan terhadap nilai aslinya. Tabel 15. Nilai gain seluruh atribut pada kelompok data training dan data testing Dataset Instances Gain Usia Alamat PkOrtu JnsSLA WilSMU Anakke IPK training

11 Dataset Instances Gain Usia Alamat PkOrtu JnsSLA WilSMU Anakke IPK training training rata-rata Pada Tabel 15 diatas tampak bahwa atribut IPK memiliki nilai Gain tertinggi, sehingga atribut ini menjadi atribut root pada decision tree, kemudian dilanjutkan dengan atribut Alamat dan WilSMU yang berfungsi sebagai child node, dan diakhiri oleh label kelas aktif dan tidak aktif yang berfungsi sebagai leaf. Maka dapat dikatakan bahwa parameter penentu pertama seorang mahasiswa berpotensi untuk aktif atau tidak aktif pada waktu yang akan datang dilihat dari IPK yang diperoleh mahasiswa yang bersangkutan, kemudia Alamat tinggal dan WilSMU mahasiswa tersebut. Atribut Usia, PkOrtu, JnsSLA dan Anakke rata-rata nilai gain yang diperoleh sangat kecil jika dibandingkan dengan atribut Alamat, WilSMU dan IPK, sehingga dapat disimpulkan bahwa dukungan informasi yang terkandung dalam atribut tersebut terhadap output yang dicapai sangat kecil. Maka atribut akhir yang terpilih hanya terdiri dari atribut IPK, Alamat, dan WilSMU. Dengan menggunakan tiga atribut terakhir tadi maka diperoleh dengan jelas karakteristik mahasiswa aktif dan tidak aktif beserta aturan yang mengklasifikasikan data tersebut. Pada Gambar 6 berikut ini disajikan hasil klasifikasi pada data testing 3 dengan menggunakan tiga atribut terakhir tadi.

12 Gambar 6. Gambar hasil klasifikasi data testing 3 menggunakan weka classifier Salah satu hasil klasifikasi decision tree seperti pada Gambar 6 diatas menggunakan beberapa parameter yang tersedia pada weka classifier untuk klasifikasi menggunakan algoritma C5.0 ( atau J48 pada weka ) yaitu : - binary splits= false, jika bernilai true maka setiap level hanya terdiri dari dua cabang (pada setiap atribut hanya terdiri dari dua kategori, kategori lain dianggap sebagai kategori pada atibut lain) - confidencefactor = 0.25, atribut dengan nilai gain sama dengan 0.25 atau lebih tinggi maka terpilih sebagai atribut untuk decision tree, sedangkan atribut dengan nilai lebih kecil dari 0.25 akan dipangkas (pruned) dan tidak terpilih sebagai atribut untuk decision tree.

13 - debug = false, jika bernilai true maka classifier akan memberikan informasi yang akan ditampilkan pada layar console. - minnumobj = 2, jumlah minimum instances per leaf. - numfolds=3, data yang akan diklasifikasi dibagi menjadi 3 bagian yaitu 1 bagian data digunakan untuk proses pruning sedangkan 2 bagian data yang lainnya digunakan untuk membentuk decision tree berdasarkan hasil dari bagian data sebelumnya. - reducederrorpruning = false,tidak dilakukan prosedur pruning yang lain - save instance data = false, tidak dilakukan penyimpanan data training untuk visualisasi - seed = 1, digunakan untuk mengacak data saat reduksi error pruning dilakukan - subtreeraising = true, memeriksa posisi subtree pada saat proses pruning dilakukan - unpruned = false, jika bernilai true maka proses pruning tidak dikerjakan. - uselaplace = false,dengan menggunakan metode Laplace akan dihitung jumlah true classified dan missclassified. Pada Gambar 6 diatas terlihat bahwa weka classifier hanya memilih atribut IPK sebagai atribut dalam decision tree, sedangkan atribut lainnya terpangkas dari decision tree. Maka dapat disimpulkan bahwa dengan jumlah dan jenis data yang ada pada testing 3 hanya dibutuhkan atribut IPK untuk mendapatkan kelas output dari dataset tersebut. Hasil klasifikasi pada data testing 3 diatas tampak pula struktur if -then yang menunjukkan susunan aturan-aturan yang diperoleh, berikut pada Gambar 7 ditampilkan kembali bentuk aturan yang dimaksud : Gambar 7. Aturan-aturan klasifikasi hasil data testing 3 Adapun struktur if-then untuk aturan diatas adalah sebagai berikut : If IPK <= 1.77 then Status = Tidak Aktif

14 Else If IPK > 1.77 then Status = Aktif Dan bentuk Gambar 7 diatas dapat pula dilihat dalam bentuk decision tree yang dihasilkan, seperti pada Gambar 8 berikut ini : Gambar 8. Hasil klasifikasi dengan algoritma C5.0 menggunakan weka classifier dalam bentuk struktur pohon keputusan Klasifikasi dengan decision tree (algoritma C5.0) telah menghasilkan beberapa aturan, baik dalam bentuk struktur pohon keputusan maupun dalam bentuk aturan if then. Kegiatan selanjutnya adalah melakukan klasifikasi dengan menggunakan metode K-Nearest Neighbor (KNN) yang mana dalam weka classifier diberi nama IBk. Pada dasarnya tahapan yang dilakukan kali ini menggunakan beberapa parameter yang berisi nilai yang sudah default pada weka classifier, hanya saja untuk parameter KNN akan diisi dengan nilai ganjil mulai dari 1, 3 dan 5. Karena jumlah data/tetangga pada KNN ditentukan oleh user dan untuk mendapatkan hasil yang reasonable maka k berisi data dalam bilangan ganjil, maka dipilihlah jumlah tetangga dengan angka-angka tersebut, dengan asumsi bahwa jumlah tetangga data yang diambil adalah sebanyak 1, 3 dan 5 tetangga data. Parameter-parameter yang dimaksud yaitu : - KNN=1,banyaknya jumlah tetangga data yang diambil. - crossvalidate = false, digunakan untuk menentukan k yang terbaik. - debug = false, jika bernilai true maka classifier akan memberikan informasi yang akan ditampilkan pada layar console. - distanceweighting =no distance weighting, setiap data tetangga yang dipilih tidak diberi bobot. - meansquared = false,akan lebih baik bila digunakan untuk data-data regresi.

15 - nearestneighborsearchalgorithm=linearnnsearch, adalah algoritma standar yang digunakan untuk mencari tetangga data pada weka. - windowsize = 0, jumlah maksimum data yang diklasifikasi tidak terbatas. Hasil yang diperoleh menunjukkan kecenderungan yang lebih baik dalam mengklasifikasikan data, baik dengan jumlah tetangga data=1, 3 atau 5. Setiap data yang diuji diperhatikan tingkat ketepatan dan ketidaktepatan dalam mengklasifikasikan data tersebut dan lama waktu yang dibutuhkan untuk membangun model. Hasil klasifikasi dengan tingkat ketepatan klasifikasi data yang tertinggi dan lama waktu terendah dalam membangun model akan dijadikan sebagai model terbaik. Karena k adalah satu-satunya hyper-paramater dalam KNN yang mana nilainya harus ditentukan dengan coba-coba, maka k yang diambil adalah k=1, k=3 dan k=5. Angka-angka tersebut diambil bertujuan untuk mendapatkan hasil yang reasonable yaitu hasil yang diperoleh memiliki waktu yang singkat dalam membangun model, data terklasifikasi dengan baik. Seperti halnya pada algoritma C5.0, penggunaan algoritme ini dalam data training dan data testing memberikan hasil yang berbeda-beda, dan berikut ini pada Gambar 9 ditampilkan hasil klasifikasi dengan KNN=1 atau jumlah data tetangga yang diambil adalah sebanyak 1 pada data testing 3.

16 Gambar 9. Hasil klasifikasi dengan KNN=1 pada data testing 3 menggunakan weka classifier Pada Gambar 9 di atas sebanyak 82 record data diklasifikasikan sebagai mahasiswa tidak aktif, 309 record data mahasiswa aktif dan 9 record data diklasifikasikan tidak sesuai dengan kelasnya yaitu terdiri dari 3 record data diduga sebagai mahasiswa tidak aktif ternyata adalah mahasiswa aktif serta 6 data diduga sebagai mahasiswa aktif ternyata adalah mahasiswa tidak aktif. Selebihnya hasil uji coba klasifikasi dengan KNN dapat dilihat pada bab lampiran yang terdapat pada tesis ini. Pengujian data dengan KNN relatif lebih singkat untuk dilakukan dibandingkan dengan C5.0. Pada bahasan berikutnya akan dilakukan analisis dengan menggunakan beberapa alat ukur evaluasi seperti yang sudah dijelaskan pada bahasan sebelumnya, terhadap hasil yang diperoleh dengan menggunakan algoritma C5.0 dan KNN. Evaluasi Seperti yang sudah dijelaskan pada bahasan sebelumnya, pada tahap ini akan dilakukan evaluasi terhadap kedua algoritma yang dipakai pada dataset akademik dengan memperhatikan beberapa parameter evaluasi yaitu correctly classified, incorrectly classified, yang mana kedua parameter ini diwakili oleh parameter overall success rate yang terdapat pada confusion matrix. Persentase klasifikasi sesuai dengan kelasnya dan klasifikasi yang tidak sesuai dengan kelasnya diukur menggunakan lift chart dan recall precision sehingga diperoleh

17 informasi yang tersembunyi di dalamnya. Untuk lebih mempermudah pemahaman dalam menganalisa hasil klasifikasi yang disajikan, dilampirkan pula beberapa visualisasi hasil tersebut dalam bentuk grafik yang akan disajikan setelah tabel persentase hasil klasifikasi. Berikut ini pada Tabel 16 disajikan persentase hasil klasifikasi data sesuai dengan kelasnya berdasarkan alat ukur evaluasi berupa confusion matrix yang terdiri dari overall success rate, lift chart, dan recall precision pada C5.0 dan KNN terhadap data training dan data testing. Tabel 16. Persentase hasil klasifikasi berdasarkan alat ukur evaluasi confusion matrix (overall success rate, lift chart, dan recall precision) Dataset Overall success rate Lift chart Recall precision C5.0 K=1 K=3 K=5 C5.0 K=1 K=3 K=5 C5.0 K=1 K=3 K=5 Training Testing Pada Tabel 16 diatas dapat dilihat bahwa kecenderungan hasil terbaik diperoleh pada saat uji coba data menggunakan KNN dengan k=1. Baik pada saat uji coba dengan data training yang jumlah datanya dua kali lebih banyak dari data testing, hasil yang diperoleh tetap menunjukkan nilai tertinggi hingga mencapai lebih dari 95%. Berikut ini pada Gambar 10, Gambar 11, Gambar 12, disajikan grafik yang menunjukkan perbandingan terhadap dua metode diatas ke dalam masing-masing alat ukur evaluasi yang digunakan seperti disebutkan sebelumnya.

18 nilai (%) C5.0 knn=1 knn=3 knn=5 Overall success rate Training Testing Gambar 10. Grafik Overall Success Rate pada dataset akademik menggunakan metode decision tree (C5.0) dan KNN Pada grafik di atas terlihat bahwa keberhasilan klasifikasi yang mencapai nilai hampir 100% menunjukkan bahwa KNN dengan k=1 menjadi lebih baik dibandingkan C5.0, namun keberhasilan tersebut tidak terulang pada saat jumlah k diberikan nilai yang lebih besar. Maka dapat disimpulkan bahwa klasifikasi metode KNN dengan k=1 adalah model terbaik. nilai (% ) c5.0 knn=1 knn=2 knn=3 lift chart training testing Gambar 11. Grafik Lift Chart pada dataset akademik menggunakan metode decision tree (5.0) dan KNN Pada Gambar 11 di atas, kecenderungan hasil yang sama yaitu jumlah kelas positif pada kedua algoritma terjadi pada saat klasifikasi dilakukan dengan

19 menggunakan data training dan testing. Rata-rata jumlah data yang terklasifikasi ke dalam kelas positif mencapai 40% dari seluruh data yang diklasifikasi. nilai (%) C5.0 knn=1 knn=3 knn=5 recall precision Training Testing Gambar 12. Grafik Recall Precision pada dataset akademik menggunakan metode decision tree (5.0) dan KNN Pada grafik di atas data yang di klasifikasi dan sesuai dengan kelasnya rata-rata mencapai nilai hingga 80% lebih, yang menyatakan bahwa seluruh data yang di klasifikasi dapat dikenali dengan sangat baik oleh kedua algoritma. Hal ini dapat disebabkan oleh karena dilakukannya tahap seleksi data dan atribut sebelum dilakukan kegiatan klasifikasi, sehingga seluruh data yang diolah hanyalah data yang bersih dari missing value dan redudancy. Sementara itu sejumlah data yang diklasifikasi namun tidak sesuai dengan kelasnya (missclassified) sebanyak 5%, dan berikut ini pada Gambar 13 disajikan grafik persentase klasifikasi sesuai dengan kelasnya (true classified) dan klasifikasi tidak sesuai dengan kelasnya (missclassified).

20 nilai (%) ketepatan klasifikasi C5.0 knn=1 knn=3 knn=5 true classified missclassified Gambar 13. Grafik persentase true classified dan missclassified Hasil yang diperoleh dalam penelitian ini dengan menggunakan algoritma C5.0 dan KNN menunjukkan bahwa decision tree dengan algoritma C5.0 tetap dinilai lebih baik ini dibandingkan dengan KNN, karena decision tree memberikan output berupa karakteristik data yang terklasifikasi, baik untuk kelas aktif maupun kelas tidak aktif. Sedangkan knn tidak dapat memberikan karakteristik tersebut sehingga tidak diperoleh informasi karakteristik data yang dibutuhkan, melainkan hanya memberikan informasi jumlah data yang dapat terklasifikasi dan tidak terklasifikasi saja.

DATA DAN METODE Data

DATA DAN METODE Data DATA DAN METODE Data Sumber data yang digunakan dalam penelitian berasal dari data mahasiswa tahun angkatan 2000 sampai dengan 2005, dan dari tiga program studi yaitu S1- Sistem Informasi, S1-Teknik Informatika,

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG Andri 1), Yesi Novaria Kunang 2), Sri Murniati 3) 1,2,3) Jurusan Sistem Informasi Universitas

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2. 6 tahap ini, pola yang telah ditemukan dipresentasikan ke pengguna dengan teknik visualisasi agar pengguna dapat memahaminya. Deskripsi aturan klasifikasi akan dipresentasikan dalam bentuk aturan logika

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel

BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel BAB III PEMBAHASAN A. Sumber Data Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan Bermotor (BPKB) serta

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU

PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani Jurusan Sistem Informasi, STMIK MDP Palembang Jln. Rajawali No.14 Palembang 30113 Telp. (0711) 376400, Faks.

Lebih terperinci

Seminar Nasional Aplikasi Teknologi Informasi 2012 (SNATI 2012) ISSN: 1907-5022 Yogyakarta, 15-16 Juni 2012 PENERAPAN KLASIFIKASI DENGAN ALGORITMA CART UNTUK PREDIKSI KULIAH BAGI MAHASISWA BARU Mardiani

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

4 HASIL DA PEMBAHASA

4 HASIL DA PEMBAHASA 4 HASIL DA PEMBAHASA 4.1 Pengumpulan Data Pada proses pengumpulan data, diperoleh data awal berjumlah 5883 mahasiswa non aktif Program Studi Matematika FMIPA-UT dengan 33 atribut kategori dan numerik.

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

POHON KEPUTUSAN DENGAN ALGORITMA C4.5 POHON KEPUTUSAN DENGAN ALGORITMA C4.5 1. Pengantar Algoritma C4.5 Klasifikasi merupakan salah satu proses pada data mining yang bertujuan untuk menemukan pola yang berharga dari data yang berukuran relatif

Lebih terperinci

TEKNIK KLASIFIKASI POHON KEPUTUSAN UNTUK MEMPREDIKSI KEBANGKRUTAN BANK BERDASARKAN RASIO KEUANGAN BANK

TEKNIK KLASIFIKASI POHON KEPUTUSAN UNTUK MEMPREDIKSI KEBANGKRUTAN BANK BERDASARKAN RASIO KEUANGAN BANK TEKNIK KLASIFIKASI POHON KEPUTUSAN UNTUK MEMPREDIKSI KEBANGKRUTAN BANK BERDASARKAN RASIO KEUANGAN BANK 1 Nurma Jayanti Sulistyo Puspitodjati 3 Tety Elida 1 jurusan sistem informasi, universitas gunadarma

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya pembangunan gedung sekolah maupun perguruan tinggi menjadi tanda berkembangnya pendidikan. Jumlah pendaftar

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

HASIL dan PEMBAHASAN. Data

HASIL dan PEMBAHASAN. Data distribusi kelas dan batang yang menggambarkan hasil keluaran dari pengujian. Pengujian dilakukan pada atribut tertentu dari data. Pemilihan atribut dilakukan setiap kali kedalaman tree bertambah. Pemilihan

Lebih terperinci

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA Ade Putra Fakultas Vokasi, Program Studi Komputerisasi Akuntansi Universitas Bina Darma

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan penelitian tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI II.1 Text Mining Text Mining merupakan penerapan konsep dan teknik data mining untuk mencari pola dalam teks, proses penganalisaan teks guna menemukan informasi yang bermanfaat untuk

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS

IMPLEMENTASI DECISION TREE UNTUK MEMPREDIKSI JUMLAH MAHASISWA PENGAMBIL MATAKULIAH DENGAN MENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORMATIKA ITS IPLEENTASI DECISION TREE UNTUK EPREDIKSI JULAH AHASISWA PENGABIL ATAKULIAH DENGAN ENGGUNAKAN STUDI KASUS DI JURUSAN TEKNIK INFORATIKA ITS Romauli anullang - 5108100501 Latar Belakang Pembuatan jadwal pada

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Sebelum melakukan penelitian adapun penulis mencari penelitian penelitian yang memungkinkan terkait dengan penelitian antara lain : 1. Analisis Kinerja Data

Lebih terperinci

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO)

IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) IMPLEMENTASI ALGORITMA ID3 UNTUK KLASIFIKASI PERFORMANSI MAHASISWA (STUDI KASUS ST3 TELKOM PURWOKERTO) Andika Elok Amalia 1), Muhammad Zidny Naf an 2) 1), 2) Program Studi Informatika ST3 Telkom Jl D.I.

Lebih terperinci

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan. BAB I PENDAHULUAN A. Latar Belakang Dengan kemajuan teknologi informasi dewasa ini kebutuhan akan informasi yang akurat sangat dibutuhkan, dikarenakan informasi akan menjadi suatu elemen penting dalam

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout  Data mining BAB 1 PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, identifikasi masalah, ruang lingkup tugas akhir, maksud dan tujuan tugas akhir, metode penelitian tugas akhir, dan sistematika penulisan

Lebih terperinci

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : BAB 3 METODE PENELITIAN 3.1 Instrumen Penelitian Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : 3.1.1 Bahan Bahan yang digunakan dalam penelitian ini yaitu data siswa kelas SMA

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE 1 Fitroh Rizky Muwardah, 2 Ricardus Anggi Pramunendar, M.Cs Program Studi Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro,

Lebih terperinci

Belajar Mudah Algoritma Data Mining : C4.5

Belajar Mudah Algoritma Data Mining : C4.5 Belajar Mudah Algoritma Data Mining : C4.5 Algoritma data mining C4.5 merupakan salah satu algoritma yang digunakan untuk melakukan klasifikasi atau segmentasi atau pengelompokan dan bersifat prediktif.

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1 Data E-mail Pada bagian ini akan disajikan detail jumlah keseluruhan dataset yang digunakan untuk penelitian. Dataset diambil CSDMC21 yang disediakan oleh http://www.csmining.org/

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru

Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru Metode Iterative Dichotomizer 3 ( ID3 ) Untuk Penyeleksian Penerimaan Mahasiswa Baru Wahyudin Program Pendidikan Ilmu Komputer, Universitas Pendidikan Indonesia Abstrak Konsep pohon merupakan salah satu

Lebih terperinci

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh :

ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI. Oleh : ANALISIS PERBANDINGAN ALGORITMA DECISION TREE J48 DAN NAÏVE BAYES DALAM MENGKLASIFIKASIKAN POLA PENYAKIT SKRIPSI Oleh : Frista Yulianora 1401128832 Muchammad Hasbi Latif 1401136065 Rika Jubel Febriana

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

4.1. Pengambilan Data

4.1. Pengambilan Data BAB IV HASIL PENGUJIAN DAN PEMBAHASAN Hasil pengujian adalah hasil final yang berarti penelitian telah selesai dilakukan, semua yang berkaitan dengan pengujian akan dibahas pada bab ini mulai dari pengolahan

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN SISTEM

BAB III ANALISA DAN PERANCANGAN SISTEM BAB III ANALISA DAN PERANCANGAN SISTEM 1.1. Analisa Masalah 3.1.1. Analisa Algoritma Midi (Musical Instrument Digital Interface) merupakan sebuah teknologi yang memungkinkan alat musik elektrik, komputer,

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah Selly Artaty Zega Program Studi Teknik Multimedia dan Jaringan, Jurusan Teknik Informatika, Politeknik

Lebih terperinci

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT

ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT ALGORITMA C4.5 UNTUK PEMODELAN DAERAH RAWAN BANJIR STUDI KASUS KABUPATEN KARAWANG JAWA BARAT Ahmad Khusaeri 1, Septian Ilham 2, Desi Nurhasanah 3, Derrenz Delpidat 4, Anggri 5, Aji Primajaya 6, Betha Nurina

Lebih terperinci

Pohon Keputusan. 6.1 Inductive Learning

Pohon Keputusan. 6.1 Inductive Learning 6 Pohon Keputusan Sometimes you make the right decision, sometimes you make the decision right. Phil McGraw Bab ini akan menelaskan salah satu varian pohon keputusan yaitu ID3 oleh Quinlan [27, 28] yang

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Studi Sebelum menyusun tugas akhir ini dilakukan tinjauan pustaka terlebih dahulu terhadap penelitian-penelitian terkait sebagai bahan referensi. Penelitian tentang

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian 4.1.1 Support Vector Machines (SVM) Setelah melalui proses training dan testing dengan metode Support Vector Machines (SVM), diperoleh hasil yang tertera

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 Sulidar Fitri Teknik Informatika STMIK AMIKOM Yogyakarta email : inboxfitri@gmail.com Abstraksi Penelitian

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG Era komunikasi dengan menggunakan fasilitas internet memberikan banyak kemudahan dalam mendapatkan informasi yang dikehendaki. Dengan demikian semakin banyak orang,

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB III ANALISA DAN PERANCANGAN

BAB III ANALISA DAN PERANCANGAN BAB III ANALISA DAN PERANCANGAN 1.1 Analisa dan Identifikasi Penjurusan mahasiswa merupakan hal krusial, dimana mahasiswa yang memilih jurusan sesuai dengan kompetensi yang dimiliki akan dikatakan berhasil

Lebih terperinci

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION Hamsir Saleh Hamsir.saleh@gmail.com Fakultas Ilmu Komputer Universitas Ichsan Gorontalo Abstrak Memprediksi kebangkrutan

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang

UKDW. BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penerimaan mahasiswa baru merupakan proses yang selalu dilakukan setiap tahunnya oleh Universitas Kristen Duta Wacana Yogyakarta (UKDW). Mahasiswa baru merupakan mahasiswa

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN

BAB IV HASIL DAN PEMBAHASAN BAB IV HASIL DAN PEMBAHASAN Bab ini membahas langkah-langkah dari implementasi dan pembahasan dari hasil penelitian yang telah dilakukan tentang klasifikasi aktivitas menggunakan algoritma k-nearest neighbor

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

3. METODE PENELITIAN

3. METODE PENELITIAN 19 3. METODE PENELITIAN 3.1 Diagram Alir Penelitian Kerangka pemikiran pada penelitian ini dapat digambarkan dalam suatu bagan alir seperti pada Gambar 8. Gambar 8 Diagram Alir Penelitian Pengumpulan Data

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio 21 BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) 3.1 Regresi Logistik Biner Regresi logistik berguna untuk meramalkan ada atau tidaknya karakteristik berdasarkan prediksi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Pada BAB II ini akan disampaikan materi-materi yang berkaitan dengan konsep data mining, yang merupakan landasan bagi pembahasan klasifikasi untuk evaluasi kinerja pegawai. 2. 1 Tinjauan

Lebih terperinci

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 1 PENERAPAN DATA MINING UNTUK REKOMENDASI BEASISWA PADA SMA MUHAMMADIYAH GUBUG MENGGUNAKAN ALGORITMA C4.5 Dina Maurina, Ahmad Zainul Fanani S.Si, M.Kom Jurusan Teknik Informatika FIK UDINUS, Jl. Nakula

Lebih terperinci

Prediksi Ketepatan Waktu Kelulusan Dengan Algoritma Data Mining C4.5

Prediksi Ketepatan Waktu Kelulusan Dengan Algoritma Data Mining C4.5 DOI: http://dx.doi.org/0./fij.vi.0 Prediksi Ketepatan Waktu Kelulusan Dengan Algoritma Data Mining C4.5 Indah Puji Astuti Dosen eknik Informatika, Universitas Muhammadiyah Ponorogo Abstrak Mahasiswa merupakan

Lebih terperinci

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI

PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI PERBANDINGAN ALGORITME FEATURE SELECTION INFORMATION GAIN DAN SYMMETRICAL UNCERTAINTY PADA DATA KETAHANAN PANGAN DELKI ABADI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1 1.1 Latar Belakang BAB I PENDAHULUAN Dalam Peraturan Menteri Agama Republik Indonesia Nomor 30 Tahun 2014 tentang Biaya Kuliah Tunggal dan Uang Kuliah Tunggal pada Perguruan Tinggi Keagamaan Negeri di

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:

Lebih terperinci

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala

Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Materi Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Dosen Pengasuh Dr. Taufik Fuadi Abidin, M.Tech Dr. Muhammad Subianto, M.Si {tfa,subianto}@informatika.unsyiah.ac.id

Lebih terperinci

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI C4.5 ALGORITHM IMPLEMENTATION IN DETERMINING THE DEPARTMENT OF SMK PEMUDA PAPAR KEDIRI Oleh: MARISA FITRI FATMAWATI

Lebih terperinci

BAB IV ANALISA DAN PERANCANGAN

BAB IV ANALISA DAN PERANCANGAN BAB IV ANALISA DAN PERANCANGAN Dalam membangun sistem yang akan dibuat ini, adapun tahapan yang akan dilakukan yaitu : 4.1 Analisa 4.1.1 Pengumpulan Data Sumber data utama yang digunakan dalam penelitian

Lebih terperinci

Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015

Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015 Scientific Journal of Informatics Vol. 2, No. 1, Mei 2015 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 JUDUL ARTIKEL Identifikasi Kualitas Beras dengan Citra Digital Arissa

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL Besse Helmi Mustawinar Teknik Informatika FTKOM Universitas Cokroaminoto Palopo Jl Latamacelling Nomor 19 Palopo,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE JURNA TEKNIK, (2014) 1-6 1 AIKASI DATA MINING UNTUK MEMREDIKSI ERFORMANSI MAHASISWA DENGAN METODE KASIFIKASI DECISION TREE Irfan Fahmi, Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri,

Lebih terperinci

Data Pohon Keputusan Rule

Data Pohon Keputusan Rule BAB 2 TINJAUAN PUSTAKA 2.1. Algoritma Pohon Keputusan Salah satu metode data mining yang umum digunakan adalah pohon keputusan. Metode pohon keputusan mengubah fakta yang sangat besar menjadi pohon keputusan

Lebih terperinci

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO

KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO KLASIFIKASI DATA SPASIAL UNTUK KEMUNCULAN HOTSPOT DI PROVINSI RIAU MENGGUNAKAN ALGORITME ID3 VIKHY FERNANDO DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR

Lebih terperinci

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup 1 BAB I PENDAHULUAN 1.1. Latar Belakang Pendidikan merupakan salah satu faktor utama dalam hidup seorang manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup setiap orang. Namun keberadaan

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci