IMPLEMENTASI DATA MINING DALAM PREDIKSI PERFORMANCE SOFTWARE ENGINEER PT. EMERIO MENGGUNAKAN DECISION TREE

dokumen-dokumen yang mirip
PERBANDINGAN DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

Pengolahan Data. Algoritma C4.5 Menghitung entropi : Data Training (75%) = 220 data Data Testing (25%) = 73 data

BAB III METODE PENELITIAN

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

DATA MINING UNTUK REKOMENDASI KERJA BAGI ALUMI DENGAN ALGORITMA GARC(GAIN BASED ASSOCIATION RULE CLASSIFICTION)

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KAJIAN PERANCANGAN RULE KENAIKAN JABATAN PADA PT. ABC

Kuwat Setiyanto. Abstrak. Kata kunci: Association Rules, Classification Tree, Machine Learning, Proses Data Mining, WEKA

PENERAPAN DATA MINING SEBAGAI MODEL SELEKSI PENERIMA BEASISWA PENUH (STUDI KASUS: STIE PERBANAS SURABAYA)

MENGGUNAKAN DATA MINING

Abidah Elcholiqi, Beta Noranita, Indra Waspada

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

Versi Online tersedia di : JURNAL TECH-E (Online)

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

KOMPARASI ALGORITMA C4.5 DENGAN NAÏVE BAYES DALAM PENGKLASIFIKASIAN TINGKAT PENDIDIKAN ANAK MISKIN. Andi Nurhayati 1, Andi Baso Kaswar 2

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE

BAB 3 METODE PENELITIAN

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

BAB I PENDAHULUAN. terjadi kesalahan dalam proses tersebut, karena tidak didasari oleh suatu acuan tertulis

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algoritma Naïve Bayes (Studi Kasus: Fasilkom Unilak)

Student Clustering Based on Academic Using K-Means Algoritms

PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Algoritma Cart Untuk Memprediksi Status Kelulusan Mahasiswa

ANALISIS PENENTUAN KARYAWAN TERBAIK MENGGUNAKAN METODE ALGORITMA NAIVE BAYES (STUDI KASUS PT. XYZ)

Penggunaan Pohon Keputusan untuk Klasifikasi Tingkat Kualitas Mahasiwa Berdasarkan Jalur Masuk Kuliah

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

IMPLEMENTASI DATA MINING UNTUK MEMPREDIKSI DATA NASABAH BANK DALAM PENAWARAN DEPOSITO BERJANGKA DENGAN MENGGUNAKAN ALGORITMA KLASIFIKASI NAIVE BAYES

IMPLEMENTASI ALGORITMA NAÏVE BAYES UNTUK MEMPREDIKSI DATA ULANG PENSIUN

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

BAB I PENDAHULUAN 1.1 Latar Belakang

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB III METODOLOGI PENELITIAN

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ

Prediksi Ketepatan Waktu Kelulusan Dengan Algoritma Data Mining C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Penerapan Metode Fuzzy C-Means dengan Model Fuzzy RFM (Studi Kasus : Clustering Pelanggan Potensial Online Shop)

SKRIPSI TI S1 FIK UDINUS 1

SATUAN ACARA PERKULIAHAN UNIVERSITAS GUNADARMA

PENERAPAN DATA MINING PADA CDR (CALL DETAILS RECORDS) UNTUK MENGETAHUI PROFILE INTEREST DARI PELANGGAN PT. XYZ

Implementasi Data Mining dengan Algoritma C4.5 untuk Memprediksi Tingkat Kelulusan Mahasiswa

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

IMPLEMENTASI KNOWLEDGE DISCOVERY IN DATABASE (KDD) DALAM SERVICE LEVEL AGREEMENT (SLA) KLAIM PADA ASURANSI KESEHATAN

ALGORITMA NAÏVE BAIYES UNTUK PREDIKSI PROFESI BERDASARKAN SKILL JOB SEEKER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

BAB III METODE PENELITIAN

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PROMOSI (Studi kasus Universitas Bina Darma Palembang)

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

Tahapan Proses KDD (Peter Cabena)

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

TechnoXplore ISSN : X Jurnal Ilmu Komputer & Teknologi Informasi Vol 1 No : 2, Oktober 2016

ISSN : e-proceeding of Management : Vol.4, No.2 Agustus 2017 Page 1472

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

KAJIAN PENERAPAN ALGORITMA C4.5, NAIVE BAYES, DAN NEURAL NETWORK DALAM PEMILIHAN DOSEN TELADAN: STUDI KASUS UNIVERSITAS INDRAPRASTA

Klasifikasi Data Karyawan Untuk Menentukan Jadwal Kerja Menggunakan Metode Decision Tree

BAB II LANDASAN TEORI

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

BAB I PENDAHULUAN 1.1 Latar Belakang

DATA CLUSTERING MENGGUNAKAN METODE CRISP DM UNTUK MENGETAHUI KEBUTUHAN TENAGA PENDIDIK JENJANG SMA DI KABUPATEN BANJAR

IMPLEMENTASI TEKNIK DATA MINING UNTUK MEMPREDIKSI TINGKAT KELULUSAN MAHASISWA PADA UNIVERSITAS BINA DARMA PALEMBANG

SNIPTEK 2014 ISBN:

APPLICATION OF DATA MINING ALGORITHM TO RECIPIENT OF MOTORCYCLE INSTALLMENT

BAB III METODE PENELITIAN

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5

TRANSFORMASI Jurnal Informasi & Pengembangan Iptek

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB III ANALISIS DAN PERANCANGAN

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

SISTEM PENDUKUNG KEPUTUSAN PENEMPATAN JURUSAN MAHASISWA BARU MENGGUNAKAN METODE K-NEAREST NEIGHBOR

BAB II LANDASAN TEORI

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING MENGGUNAKAN CRISP-DM PADA SISTEM INFORMASI EKSEKUTIF DINAS KELAUTAN DAN PERIKANAN PROVINSI JAWA TENGAH

ALGORITMA NAÏVE BAYES UNTUK PENENTUAN JURUSAN PADA SISWA MADRASAH ALIYAH

PENERAPAN METODE ASOSIASI GSP DAN APRIORI UNTUK STOK DAN REKOMENDASI PRODUK

Transkripsi:

IMPLEMENTASI DATA MINING DALAM PREDIKSI PERFORMANCE SOFTWARE ENGINEER PT. EMERIO MENGGUNAKAN DECISION TREE Durrotul Mukhibah 1 Ana Kurniawati 2 1,2 Fakultas Ilmu Komputer dan Teknologi Informasi, Universitas Gunadarma, 1 Durrotul.Mukhibah@gmail.com 2 ana@staff.gunadarma.ac.id Abstrak Nilai hasil performance appraisal di PT. Emerio Indonesia belum dijadikan sebagai acuan dalam proses rekruitmen, sehingga masih ditemukan proses rekruitmen yang belum maksimal dalam mendapatkan Software Engineer yang berkualitas. Dengan mengimplementasikan teknik klasifikasi data mining yaitu decision tree, data personal dan performance appraisal yang dimiliki oleh Emerio diolah sebagai sumber data untuk memprediksi performance Software Engineerdi PT. Emerio Indonesia. Langkah-langkah implementasi dilakukan sesuai dengan tahapan penyelesaian data mining yaitu CRISP-DM. Sejumlah 103 data di Microsoft Excel diolah menjadi 101 data di CSV sebagai sumber data bagi pemodelan yang dilakukan melalui tools data mining, WEKA. Pemodelan klasifikasi dengan menggunakan WEKA menghasilkan satu model dan tujuh rule decision tree dari prediksi performance Software Engineer. Performance Software Engineer diprediksi ke dalam tiga kategori yaitu very competent, competent dan development needed. Masing-masing kategori ditentukan oleh kemampuan desain, pengujian, implementasi, analisis, dan softskill dari Software Engineer. Tingkat akurasi model decision tree yang dihasilkan adalah 97.0297% dengan tingkat kesalahan sebesar 2.9703%. Implementasi data mining dalam prediksi performance Software Engineer di PT. Emerio Indonesia dengan menggunakan decision tree ini, diharapkan dapat digunakan sebagai acuan bagi Emerio dalam membuat kebijakan proses rekruitmen Software Engineer yang lebih baik, sehingga akan diperoleh hasil rekruitmen Software Engineer yang berkualitas. Kata kunci: Data Mining, Decision Tree, Software Engineering, CRISP-DM, WEKA THE IMPLEMENTATION OF DATA MINING IN PREDICTING THE PERFORMANCE SOFTWARE ENGINEER AT PT EMERIO USING DECISION TREE Abstract The result of performance appraisal at PT. Emerio Indonesia has not been used as a reference in recruitment process. Some recruitment processes are missing to get qualified Software Engineer thereafter. By implementing data mining classification technique namely decision tree, the personal and performance appraisal data owned by Emerio will bw treated as a data source to predict Software Engineer performance at PT. Emerio Indonesia. The steps of the implementation are based on data mining completion methodology, CRISP-DM. A number of 103 data within Microsoft Excel are processed into 101 data within CSV as a data source of modeling process through data mining tools, WEKA. The classification modeling using WEKA will produce one model and seven rule decision trees of Software Engineer performance prediction. Software Engineer performance is predicted into three categories: very competent, competent and development needed. Each category is determined by the ability of design, testing, implementation, analysis, and soft skill of Software Engineer. Accuracy level of decision tree model result is 97.0297% with an error rate of 2.9703%. Jurnal Informatika dan Komputer Volume 22 No. 1,April 2017 31

Data mining implementation of Software Engineer performance prediction at PT. Emerio Indonesia using decision tree is expected to be used as a reference in policy-making of better Software Engineer recruitment to obtain qualified Software Engineer. Keywords :Data Mining, Decision Tree, Software Engineering, CRISP-DM, WEKA PENDAHULUAN Karakteristik software yang bersifat logika dibandingkan fisik, membuat proses pengembangan software sangat tergantung pada Software Engineer.Software Engineer adalah orang yang melakukan tahapan-tahapan dalam rekayasa software seperti perencanaan, analisa, desain, implementasi, testing dan deployment.selain tahapan-tahapan tersebut, Software Engineer juga harus mempunyai soft skill sebagai kemampuan pendukung dalam proses pengembangan software. Kualitas Software Engineer berpengaruh langsung terhadap kualitas software yang dihasilkan.hal ini membuat perusahaanperusahaan, terutama perusahaan software harus memberikan fokus yang besar dalam merekrut Software Engineer. Saat ini banyak perusahaan software yang mengalami kegagalan dalam proses rekruitmen Software Engineer. Sehingga salah satu permasalahan yang dihadapi oleh perusahaan software adalah bagaimana perusahaan mampu merekrut Software Engineer yang tepat dalam membangun software. PT. Emerio Indonesia (Emerio) adalah sebuah perusahaan software yang tergabung dalam grup NTT Jepang.Emerio mempunyai kurang lebih 300 pegawai dan hampir sebagian dari pegawai Emerio tercatat sebagai Software Engineer, yang masing-masing ditempatkan di seluruh client Emerio di wilayah Jabodetabek. Aktivitas yang dilakukan oleh Software Engineer Emerio adalah membangun softwareend to end untuk client baik melalui sebuah proyek atau melalui kemampuan personal Software Engineer. Untuk mengukur kinerja pegawainya, Emerio melakukan evaluasi atau penilaian kerja pada pegawai (performance appraisal) yang dilakukan oleh masing-masing manajer.performance appraisalmerupakan bagian yang sangat penting karena dengan kua-litas pegawai yang baik akandiperoleh hasil kerja yang baik. Selain itu, target perusahaan akan tercapai yang membuat kelangsungan perusahaan dan regenerasi dari pegawai terlaksana dengan baik [1]. Namun hingga saat ini, hasil performance appraisal tersebut belum dijadikan Emerio sebagai acuan dalam menemukan Software Engineer yang tepat. Salah satu cara untuk menggambarkan performancesoftware Engineer adalah melalui sebuah model yang dapat memprediksi pola hubungan antara data performance appraisal tahunan dengan performancesoftware Engineer. Model tersebut dapat dibentuk dengan menggunakan metode data mining.penggalian data (data mining) dapat didefinisikan sebagai proses menemukan pola dan tren yang tidak diketahui sebelumnya dalam basis data dan menggunakan informasi tersebut untuk membangun model prediktif [2]. Data mining berfungsiuntuk proses pengambilankeputusan dari volume data yang besar yang disimpan dalam basis data, data warehouse, atau informasiyang disimpan dalam repositori [3].Berdasarkan polanya data miningdikelompokkan menjadi deskripsi, estimasi, prediksi, klasifikasi, clustering, asosiasi [4].Data mining merupakan inti dari proses Knowledge Discovery in Database (KDD) [5]. KDD adalah prosesterorganisir untuk mengidentifikasi pola yang valid, baru, berguna, dan dapat 32 Mukhibah, Kurniawati, Implementasi data

dimengerti dari sebuah dataset yang besar dan kompleks [5]. Harry Dhika dalam jurnalyang berjudul Kajian Perancangan Rule Kenaikan Jabatan pada PT. ABC menghasilkan sebuah aturan yang membantumenentukan kenaikan jabatan karyawan PT. ABC dengan teknik dataminingmenggunakan algoritmac4.5 (decision tree) [1]. Penelitian yang dilakukan oleh Mujib Ridwan, Hadi Suyono, dan M. Sarosa menghasilkan klasifikasi kinerja akademik mahasiswa yang diprediksi kelulusannya dan memberikan rekomen-dasi untuk proses kelulusan tepat waktu ataululus dalam waktu yang paling tepat dengan nilai optimal. Klasifikasi ini diperoleh dengan menggunakan teknik data mining algoritma Naive BayesClassifier (NBC) untuk membentuk tabel probabilitas sebagai dasar proses klasifikasi kelulusan mahasiswa [6].Qasim Al-Radaideh dan Eman AlNagi dalampenelitian yang berjudul Using Data Mining Techniques to Build a Classification Model for Predicting Employees Performance menyebutkan bahwa teknik data mining dapat diman-faatkan dalam membangun model klasifikasi untuk memprediksi kinerja karyawan baru dengan mengadopsi meto-dologi data mining CRISP-DM [7]. Pada penelitian ini diterapkan salah satu teknik data mining yaitu klasifikasi jenis decision tree untuk membuat model klasifikasi prediksi performance Software Engineer Emerio berdasarkan kemampuan Software Engineer dalam software engineering dan soft skill.dengan adanya pemodelanklasifikasi performance Software Engineer ini, diharapkan dapat memberikan acuan kepada PT. Emerio Indonesia dalam mengambil keputusan rekruitmen Software Engineer yang tepat sehingga proses rekruitmen menjadi lebih baik. METODE PENELITIAN Metode penelitian menggunakan Cross Industry Standard Process for Data MiningMethodology (CRISP-DM) sebagaimana yang ditunjukkan oleh Gambar 1. Gambar 1. Bagan Tahapan Penelitian Jurnal Informatika dan Komputer Volume 22 No. 1,April 2017 33

Berdasarkan Gambar 1 tahapan penelitian ini sebagai berikut : 1. Business Understanding/ menentukan tujuan bisnis, yaitu membantu PT. Emerio Indonesia dalam menemukan kriteria rekruitmen Software Engineer yang berkualitas. 2. Data Understanding/ Pemahaman data, yaitu mengacu pada dokumen data personaldan dokumen penilaianperformancesoftware Engineer di PT. Emerio Indonesia. 3. Data Preparation/ Persiapan data, yaitu membuat format data dalam bentuk tabular dengan menggunakan excel dari dokumen applicationform dan performance appraisal untuk kemudian dikonversi ke format csv. 4. Modelling/ Pemodelan yaitu membuat model klasifikasi berdasarkan data csvsoftware Engineer dengan menggunakan tools WEKA dengan metode decision tree. 5. Evaluation/ Evaluasi, yaitu mengevaluasi hasil model klasifikasi apakah sudah sesuai dengan tujuan penelitian. 6. Deployment/ Penyebaran,pembuatan laporan tentang pengetahuan yang didapatkan dari hasil implementasi data mining terhadap prediksi performancesoftware Engineer. HASIL DAN PEMBAHASAN Performance Appraisal Performance appraisal merupakan penilaian terhadap kinerja pegawai tetap selama bekerja di PT. Emerio Indonesia.Proses performance appraisalsoftware Engineer di Emerio ditunjukkan oleh Gambar 2. Kriteria penilaian yang digunakan untuk menilaiperformancesoftware Engineerdibagi menjadi dua kategori yaitu kemampuan teknis dan kemampuan non-teknis sebagaimana terdapat pada Tabel 1.Sedangkan nilai yang digunakan sebagai standar penilaian performance dapat dilihat pada Tabel 2. Gambar 2. Proses Performance Appraisal 34 Mukhibah, Kurniawati, Implementasi data

Tabel 1. Kriteria Penilaian Kategori Keahlian Detail Kemampuan Kemampuan Teknis Kemampuan Non-Teknis Analisis Desain Implementasi Pengujian Soft Skill Kemampuan untuk memahami bisnis proses customer Kemampuan untuk menganalisa kebutuhan customer Mendesain hasil analisis kebutuhan sistem Penguasaan bahasa program Penalaran dan logika Pengetahuan Teknis/ fungsional Testing Kualitas Sistem Pengetahuan pekerjaan Kualitas Produktivitas Inisiatif Manajemen waktu Komunikasi Kerja tim Kreativitas/inovasi Berorientasi pada customer Peningkatan Belajar Pertimbangan Fleksibilitas Bertahan di bawah tekanan Perencanaan dan organisasi Membangun relasi untuk peluang bisnis baru Tabel 2. Penilaian Performance Appraisal Nilai Nilai Kompetensi Deskripsi Min Max 4 4 Superior Mahir di seluruh area kompetensi tanpa satu pun kekurangan. 3 3.99 Very Competent Mahir di seluruh kompetensi Jurnal Informatika dan Kompute Volume 22 No. 1, Desember 2016 35

dengan kemampuan beberapa kompetensi di atas rata-rata 2 2.99 Competent Kompetensi yang dimiliki standar, memiliki kekurangan yang tergolong minor dan mudah improvisasi 1 1.99 Development Needed Memiliki kompetensi dibawah standar. Pemahaman Bisnis Pada tahap awal ini, implementasi data miningdi PT. Emerio Indonesia ditujukan untuk mendapatkan modeldecision treeyang menggambarkan pola hubungan antara kemampuan teknis dan non-teknis dengan performance Software Engineer di divisisoftware service. Model decision tree ini dapat dijadikan sebagai acuan dalam melakukan proses rekruitmen Software Engineer yang tepat. Alasan mengapa prediksi performance Software Engineer di PT. Emerio Indonesia hanya dapat dimplementasikan pada divisi software servicesadalah karena kriteria reviewuntuk divisi software services berbeda dengan profesional services. Profesi-onal services yang bersifat kontrak hanya mendapatkan review atas kon-trak saja, sedangkan software services mengharuskan adanya review atas ke-mampuan teknis dan nonteknis sebagai tolak ukur performance nya. Pemahaman Data Data dikumpulkan dengan cara mencari informasi tentang data personal Software Engineer dan hasil performance appraisal melalui departemen Human Resource (HR) PT. Emerio Indonesia. Informasi yang diperoleh pada proses pengumpulan data dapat dilihat pada Tabel 3. Jenis Data Personal Software Engineer Tabel 3. Format Pengumpulan Data Nama Deskripsi Atribut Nama Nama pegawai Tanggal Tanggal Lahir Lahir Pegawai Job Title Nama Jabatan Jenis Jenis Kelamin Kelamin Status Status Perkawinan Perkawinan Tanggal Tanggal perekrutan Rekrut pegawai 36 Mukhibah, Kurniawati, Implementasi data

Hasil Performance Appraisal Profil PT.Emerio Department Nama Departemen Pendidikan Pendidikan Terakhir Pegawai Status Status Pegawai, pegawai Berpengalaman/ Fresh Graduate Lama Lama pengalaman Bekerja kerja pegawai Status Aktif Status pegawai saat ini, Aktif/ resign Tanggal Tanggal Pegawai Keluar resign Nama Nama Software Engineer Nilai Nilai Kemampuan Teknis Teknis Nilai Nilai Kemampuan SoftSkill Non-Teknis Format bebas Pengolahan Data Tahap pengolahan data dilakukan untuk membentuk dataset performance dengan menggunakan Microsoft Excel 2010.Format dataset yang digunakan sebagai sumber data pemodelan klasifikasi ditunjukkan oleh Tabel 4. Proses pengolahan data ini terdiri dari pembersihan data, integrasi data, reduksi data dan transformasi data sebagaimana yang ditunjukkan pada Gambar 3. Tabel 4. Format Dataset Pemodelan Nama Tipe Deskripsi Atribut Atribut Nama Nominal Nama Software Engineer Analisis Numerik Nilai Analisis Desain Numerik Nilai Desain Implementasi Numerik Nilai Implementasi Pengujian Numerik Nilai Pengujian SoftSkill Nominal Kemampuan Soft skill: - Strong (sama dengan atau di atas rata-rata) - Weak (Di bawah Rata-rata) Performance Ordinal Prediksi Performance: - Superior - Very Competent - Competent - Development Needed Jurnal Informatika dan Kompute Volume 22 No. 1, Desember 2016 37

Gambar 3. Proses Pengolahan Data Proses pembersihan data dilakukan dengan memeriksa data personal dan performance appraisal yang inkonsisten, memperbaiki kesalahan data tipografi dan dan nilai-nilai yang kosong. Integrasi data dilakukan dengan membuat sheet baru yang merupakan hasil penggabungan antara hasil appraisal teknis dan non teknis. Pada tahap seleksi data, data yang relevan sebagai sumber data pemodelan adalahdata dengan nilai kelas performance di atas 0. Dari 103 record, diperoleh 101 record yang relevan dengan enam atribut yang digunakan yaitu nama, analisis, desain, implementasi, pengujian, softskill dan satu kelas label klasifikasi performance. Transformasi datadilakukan perubahan tipe data pada atribut softskill dan kelas label performance sesuai dengan Tabel 4. Atribut softskill mempunyai ratarata 3.03 sehingga proses aturan transformasinya adalah jika ratarata atribut sofskill lebih besar sama dengan 3.03 maka dikategorikan STRONG, sedangkan jika rata-rata dibawah 3.03 dikategorikan WEAK. Setelah dilakukan transformasi data, langkah terakhir dari proses pengolahan data adalah mengubah dataset dari file excel menjadi format CSV agar dapat dikenali sebagai sumber data pada WEKA. Pengolahan data pada WEKA merupakan tahap untuk memilih sumber data pemodelan dari hasil persiapan data seperti pada Gambar 4. Gambar 1.Tahap Pengolahan Data 38 Mukhibah, Kurniawati, Implementasi data

Pemodelan Pemodelan pada WEKA merupakan tahap untuk memodelkan prediksi performancesoftware Engineer dengan menggunakan algoritma decision tree C4.5. Proses pemodelan data dengan klasifikasi decision treedapat dilihat pada Gambar 5. Berdasarkan hasil pemodelan dengan WEKA diperoleh jumlah leave dari model klasifikasi decision tree untuk performance Software Engineer adalah tujuh, ukuran dari tree adalah 13 dan sebagai root atas decision tree tersebut adalah atribut desain dengan nilai 2.85. Rule yang didapatkan dari hasil pemodelan ini ditunjukkan oleh Gambar 6. Dari rule tersebut, WEKA memvisualisasikan dalam bentuk gambar decision tree yang ditunjukkan oleh Gambar 7. Sedangkan hasil visualisasi decision tree untuk memperjelas visualisasi dari WEKA ditunjukkan oleh Gambar 8. Gambar 2. Pemodelan Decision Tree Gambar 3. Hasil Rule Decisin Tree Jurnal Informatika dan Kompute Volume 22 No. 1, Desember 2016 39

Gambar 4. Visualisasi Decision Tree WEKA Gambar 5. Visualisasi Decision Tree Evaluasi Model Tahap evaluasi adalah tahap yang dilakukan untuk menganalisis dan menguji hasil pemodelan decision tree yang telah diperoleh pada tahap pemodelan.berdasarkan hasil pemodelan WEKA, diperoleh jumlah instance klasifikasi yang benar adalah 98 instances dengan tingkat akurasi 97.0297% dan tingkat kesalahan sebesar 2.9703%. Hasil evaluasi model decision tree untuk prediksi performancesoftware Engineer ditunjukkan oleh Gambar 9. Gambar 6. Evaluasi Decision Tree 40 Mukhibah, Kurniawati, Implementasi data

Melalui kelas prediksi performance, dari 98 instance yang benar dapat dianalisis bahwa performancesoftware Engineer di PT. Emerio Indonesia dapat diprediksi melalui kemampuan Software Engineer dalam melakukan aktivitas software engineering yaitu analisis, desain, implementasi dan pengujian serta kemampuan non-teknis soft skill. Klasifikasi competent terdiri dari 44 instance dengan dua misclassification berasal dari development needed dan very competent. Klasifikasi development needed terdiri dari tujuh instance dengan tidak ada misclassification. Sedangkan klasifikasi very competent terdiri dari 50 instance dengan satu misclassification yang berasal dari very competent. Berdasarkan klasifikasi tersebut, berikut kriteria yang dapat dijadikan acuan bagi Emerio dalam merekrut Software Engineer: 1. Software Engineer yang diprediksi akan mempunyai performance development needed dapat dilihat melalui kemampuan Software Engineer yang rendah dalam aktivitas desain, pengujian dan implementasi (decision tree rule 1 dan 2). 2. Software Engineer yang diprediksi akan mempunyai performance competent dapat dilihat melalui kemampuan Software Engineer yang tinggi dalam aktivitas pengujian dan implementasi walaupun rendah dalam aktivitas desain (decision tree rule 3). Selain itu, Software Engineer dengan softskill lemah harus diimbangi dengan adanya kemampuan desain dan pengujian yang lebih baik dari kategori development needed (decision tree rule 4) dan Software Engineer dengan softskill kuat harus diimbangi dengan adanya kemampuan desain dan analisis yang tinggi (decision tree rule 6). 3. Software Engineer yang diprediksi akan mempunyai performance very competent dengan dilihat melalui kemampuan calon Software Engineer yang tinggi dalam aktivitas pengujian dan analisis serta mempunyai kemampuan softskill yang kuat atau lemah (decision tree rule 5 dan 7). Hasil pemodelan decision tree atas prediksi performance Software Engineer masih mengandung tingkat kesalahan sebesar 2.907% yang merupakan misclassification dari tiga instance. Ketiga misclassification tersebut yaitu : 1. Satu instance dengan prediksi performancedevelopment needed, namun performance yang ada adalah competent. Instance tersebut adalah record dengan nama SE, nilai analisis: 2.0, desain: 2.0, implementasi: 2.0, pengujian 3.0 dan softskill: Weak. 2. Satu instance dengan prediksi performancevery competent, namun performance yang ada adalah competent. Instance tersebut adalah record dengan nama DAP, nilai analisis: 3.0, desain: 3.0, implementasi: 1.67, pengujian: 3.0 dan softskill: strong. 3. Satu instance dengan prediksi performancecompetent, namun performance yang ada adalah very competent. Instance tersebut adalah record dengan nama BS, nilai analisis: 3.0, desain: 3.0, implementasi: 3.0, pengujian: 3.0 dan softskill: weak. Error misclassification ini disebabkan karena kesalahan pengum- Jurnal Informatika dan Kompute Volume 22 No. 1, Desember 2016 41

pulan (collection error) pada sumber data yang diperoleh untuk melakukan penghitungan performance.kesalahan ini dapat ditangani melalui pengulangan pada tahapan pengolahan data dengan memperbaiki kualitas data seperti mengurangi objek data, mengabaikan missing values atau mengganti dengan semua nilai yang mungkin seperti memasukkan kriteria ke dalam klasifikasi yang lebih rendah jika ditemukan data dengan nilai performance mendekati dua klasifikasi. Penyebaran Tahap penyebaran adalah tahap terakhir dari data mining dimana seharusnya pemodelan yang telah dihasilkan diimplementasikan ke dalam semua data performance appraisal yang dimiliki Emerio, namun hal ini tidak dapat dilakukan karena kebijakan internal Emerio.Pada tahap ini, hanya diberikan hasil pemodelan prediksi performancesoftware Engineer pada PT. Emerio Indonesia sebagai salah satu referensi dalam menentukan kebijakan perekrutan Software Engineer.Keputusan untuk mengimplementasikan hasil prediksi ini mutlak menjadi kebijakan internal PT. Emerio Indonesia. KESIMPULAN DAN SARAN Berdasarkan data yang diproses untuk pemodelan prediksi performance Software Engineer di PT. Emerio Indonesia, dihasilkan 98 instance dengan klasifikasi benar dan 3 instance dengan klasifikasi salah. Sehingga tingkat akurasi dari pemodelan tersebut adalah 97.0297% dan tingkat kesalahan sebesar 2.9703%.Dengan tingkat kesalahan yang relatif kecil ini, dapat disimpulkan bahwa model klasifikasi decision tree pada implementasi data mining dalam prediksi performancesoftware Engineer di PT. Emerio Indonesia dapat digunakan sebagai acuan dalam membuat kebijakan proses perekrutan Software Engineeryang lebih baik. Perekrutan Software Engineer ini melalui kriteriakriteria Software Engineer yang dihasilkan oleh pemodelan, yaitu very competent, competent dan development needed. Implementasi data mining erat kaitannya dengan sumber data.oleh karena itu, pada penelitian selanjutnya diharapkan dapat mengambil sumber data yang jauh lebih banyak. Penggunaan data yang lebih banyak akan meningkatkan keakuratan hasil penelitian. Selain itu, penelitian selanjutnya diharapkan dapat menggunakan metode dan algoritma lain, sehingga diperoleh metode dan algoritma mana yang paling baik dan efisien.untuk pengembangan di PT. Emerio Indonesia, diharapkan adanya aplikasi yang dapat menentukan prediksi performancesoftware Engineer dengan meng-gunakan teknik data mining. DAFTAR PUSTAKA [1] Dhika, H. 2015. "Kajian Perancangan Rule Kenaikan Jabatan pada PT. ABC".Jurnal SIMETRIS. Vol. 6, No. 2, pp. 217 222. [2] Iswari, N.M.S. 2011. "Penggunaan Teknik Data Mining untuk Manajemen Resiko Sistem Informasi Rumah Sakit". ULTIMATICS. Vol. 3, No. 2, pp. 16 22. [3] Han, J., dan Kamber, M. 2006. Data Mining Concept and Tehniques. San Fransisco: MorganKauffman. [4] Larose, D. T. 2005. Discovering Knowledge in Data. New Jersey: John Willey & Sons, Inc. 42 Mukhibah, Kurniawati, Implementasi data

[5] Maimon, O., dan Rokach, L. 2005. Data Mining and Knowledge Discovey Handbook. NewYork: Springer. [6] Ridwan, M., Suyono, H., dan Sarosa, M. 2013. "Penerapan Data Mining untuk Evaluasi Kinerja Akademik Mahasiswa Menggunakan Algo-ritma Naive Bayes Classifier".Jurnal EECCIS. Vol. 7, No. 1, pp. 59 64. [7] Al-Radaideh, Qasim, dan AlNagi, E. 2012. "Using Data Mining Techniques to Build a Classification Model for Predicting Employees Performance ".International Jour-nal of Advanced Computer Science and Applications (IJACSA).Vol. 3, No. 2. Jurnal Informatika dan Kompute Volume 22 No. 1, Desember 2016 43