BUSINESS INTELLIGENCE UNTUK PREDIKSI CUSTOMER CHURN TELEKOMUNIKASI

dokumen-dokumen yang mirip
IG-KNN UNTUK PREDIKSI CUSTOMER CHURN TELEKOMUNIKASI

Penggunaan Deep Learning untuk Prediksi Churn pada Jaringan Telekomunikasi Mobile Fikrieabdillah

BAB I PENDAHULUAN Latar Belakang

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN DENGAN ALGORITMA DECISION TREE

BAB I PENDAHULUAN 1.1 Latar Belakang

PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN ALGORITMA C4.5 BERBASIS FORWARD SELECTION

ASSOCIATION RULE MINING UNTUK PENENTUAN REKOMENDASI PROMOSI PRODUK

MODEL KLASIFIKASI KELAYAKAN KREDIT KOPERASI KARYAWAN BERBASIS DECISION TREE

1. Pendahuluan 1.1 Latar Belakang

IMPLEMENTASI K NEAREST NEIGHBOR (KNN) PADA KLASIFIKASI ARTIKEL WIKIPEDIA INDONESIA

BAB I PENDAHULUAN Latar Belakang

Versi Online tersedia di : JURNAL TECH-E (Online)

MODEL PREDIKSI POLA LOYALITAS PELANGGAN TELEKOMUNIKASI MENGGUNAKAN NAIVE BAYES DENGAN OPTIMASI PARTICLE SWARM OPTIMIZATION

BAB II LANDASAN TEORI

BAB III METODE PENELITIAN

PERANCANGAN APLIKASI SOCIAL COMMERCE BERDASARKAN METODE UJI KUALITAS WEBQUAL 4.0

BAB II TINJAUAN PUSTAKA

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

Penerapan Data Mining dalam Memprediksi Pembelian cat

ALGORITMA K-MEDOIDS UNTUK PENENTUAN STRATEGI PEMASARAN PRODUK

Optimasi Teknik Klasifikasi Modified k Nearest Neighbor Menggunakan Algoritma Genetika

6/26/2011. Kebutuhan perusahaan untuk mengimplementasikan BI cukup besar. BI dengan data analysis toolnya merupakan

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

BAB II TINJAUAN PUSTAKA. Meyer & Kolbe (2005) dalam papernya yang berjudul Integration of

Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB III METODE PENELITIAN

STUDI AWAL KLASIFIKASI ARTIKEL WIKIPEDIA BAHASA INDONESIA DENGAN MENGGUNAKAN METODA K NEAREST NEIGHBOR

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel

Algoritma Dasar. 4.1 Naive Bayes

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

KLASIFIKASI GAMBAR GERAK PEMAIN BOLA VOLI DENGAN MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

BAB I PENDAHULUAN Latar Belakang

ANALISIS INFORMATION GAIN ATTRIBUTE EVALUATION UNTUK KLASIFIKASI SERANGAN INTRUSI

BAB I PENDAHULUAN 1.1 Latar Belakang

PENERAPAN DATA MINING UNTUK RENCANA SUKSESI SUMBER DAYA MANUSIA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBOUR DI PT POS INDONESIA

BAB II LANDASAN TEORI

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

Peningkatan Akurasi pada Algoritma Support Vector Machine dengan Penerapan Information Gain untuk Mendiagnosa Chronic Kidney Disease

PENGKOMBINASIAN POHON KEPUTUSAN DATA PENCILAN KELAS DAN POHON KEPUTUSAN DATA NORMAL UNTUK PENINGKATAN AKURASI PREDIKSI CACAT PERANGKAT LUNAK

2. Tahapan Penelitian pemahaman merupakan awal proses penelitian

2. Adanya resiko pemumpukan barang pada gudang.

BAB III METODE PENELITIAN

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

Perancangan Sistem Penentuan Kunjungan Tempat Wisata Daerah Bali Menggunakan Metode K-Nearest Neighbour

Customer Relationship Management (CRM) Software dari SAP Fitur & Fungsi Sistem CRM: Marketing Software

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

IMPLEMENTASI DATA MINING DENGAN NAIVE BAYES CLASSIFIER UNTUK MENDUKUNG STRATEGI PEMASARAN DI BAGIAN HUMAS STMIK AMIKOM YOGYAKARTA

APLIKASI ALGORITMA CLASSIFY-BY-SEQUENCE UNTUK PENILAIAN KREDIT PADA BANK Y. Mohammad Iqbal 1. Abstrak

Implementasi Metode K-Nearest Neighbor Pada Aplikasi Data Penjualan PT. Multitek Mitra Sejati

Organizing Data and Information

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB 3 METODE PENELITIAN

Analisis Perbandingan Algoritma ID3 Dan C4.5 Untuk Klasifikasi Penerima Hibah Pemasangan Air Minum Pada PDAM Kabupaten Kendal

PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE

CUSTOMER RELATIONSHIP MANAGEMENT (CRM) SOFTWARE FROM SAP

TINJAUAN PUSTAKA. Definisi Data Mining

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

BAB II LANDASAN TEORI

PERANCANGAN SISTEM INFORMASI MANAJEMEN PERPUSTAKAAN MENGGUNAKAN POLA MODEL-VIEW- CONTROLLER (MVC)

IMPLEMENTASI METODE ANT COLONY OPTIMIZATION UNTUK PEMILIHAN FITUR PADA KATEGORISASI DOKUMEN TEKS

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

Enterprise Resource Planning

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. Perluasan coverage atau jangkauan dari suatu operator seluler dapat

METODOLOGI PENELITIAN

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

MENGGUNAKAN DATA MINING

OPTIMASI TEKNIK KLASIFIKASI MODIFIED K NEAREST NEIGHBOR MENGGUNAKAN ALGORITMA GENETIKA

Pengolahan Citra untuk Bidang Pertanian(Menentukan Kematangan Buah) Oleh Nama:Wahyu Abid A. NRP : Kelas :2D4 IT(B)

2. Tahapan Penelitian

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Oleh: Astrid Darmawan Pembimbing: Selvia Lorena Br. Ginting, M.T Wendi Zarman, M.Si

BAB II TINJAUAN PUSTAKA

Business Intelligence. Data Warehousing, Data Acquisition, Data Mining, Business Analytics, and Visualization

K NEAREST NEIGHBOR INFORMATION RETRIEVAL (SISTEM TEMU KEMBALI INFORMASI)

Penerapan Data Mining Classification Untuk Prediksi Perilaku Pola Pembelian Terhadap Waktu Transaksi Menggunakan Metode Naïve Bayes

Prosiding SNATIF Ke-1 Tahun 2014 ISBN:

BAB 2 TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI

BAB III LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB IV ANALISA DAN PERANCANGAN

ABSTRAK. Kata kunci: Sistem Pakar, Pembelajaran Mesin, Weka, Support Vector Machine, Regresi Logistik, Demam Berdarah, Malaria, Typhus

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

BAB III METODOLOGI PENELITIAN

BAB I. Pendahuluan. 1. Latar Belakang Masalah

ANALISIS PEMODELAN CUSTOMER RELATIONSHIP MANAGEMENT UNTUK PEMASARAN OBAT TRADISIONAL

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

Transkripsi:

BUSINESS INTELLIGENCE UNTUK PREDIKSI CUSTOMER CHURN TELEKOMUNIKASI Muhammad Arifin Program Studi Sistem Informasi, Fakultas Teknik, Universitas Muria Kudus Gondangmanis, PO Box 53, Bae, Kudus 59352 Email: arifin.m@umk.ac.id Abstrak Customer atau pelanggan merupakan hal yang sangat penting bagi kelangsungan hidup suatu perusahaan barang maupun jasa. Dengan ditinggalkan pelanggan sebuah perusahaan akan mengalami kerugian yang sangat besar bahkan untuk memperoleh pelanggan baru memerlukan biaya hingga 10 kali lipat lebih mahal dari biaya untuk mempertahankan pelanggan yang ada. Perusahaan telekomunikasi secara rutin menghasilkan dan menyimpan sejumlah besar data berkualitas tinggi, memiliki basis pelanggan yang sangat besar, dan beroperasi dalam lingkungan yang cepat berubah dan sangat kompetitif serta rentan terhadap customer churn (pelanggan yang meninggalkan perusahaan). Prediksi cusromer churn muncul sebagai Bussiness Intelligence (BI) yang sangat penting untuk telekomunikasi modern. Penelitian ini melakukan studi lieratur untuk mendapatkan informasi tentang permasalahan yang ada selanjutnya ekperimen untuk memprediksi cusromer churn dalam bidang Telekomunikasi dengan menerapkan algoritma prediksi, menganalisa hasil dan mendokumentasikannya. Dari hasil penelitian yang telah dilakukan dapat diketahui bahwa dengan menerapkan BI pada prediksi customer churn yang menggunakan algoritma KNN menghasilkan tigkat akurasi sebesar 88% pada nilai K 5 keatas. Dengan hasil tersebut diharapkan dapat membantu pihak pengambil keputusan dalam menemukan customer yang memiliki indikasi untuk churn. Kata kunci:businnes intelligence, prediksi, customer churn 1. PENDAHULUAN Customer atau pelanggan merupakan hal yang sangat penting bagi kelangsungan hidup suatu perusahaan baik perusahaan barang maupun jasa. Dengan ditinggalkan pelanggan sebuah perusahaan akan mengalami kerugian yang sangat besar selain itu pelanggan merupakan sebagian dari indikasi besar kecilnya sebuah perusahaan, apabila sebuah perusahaan memiliki sedikit pelanggan maka bisa dikatakan perusahaan tersebut kecil sedangkan sebaliknya apabila sebuah perusahaan dikatakan besar dapat dilihat dari jumlah pelanggannya yang jumlahnya besar pula. Menurut Yu dkk., (2011) Customer Churn didefinisikan sebagai kecenderungan pelanggan untuk berhenti melakukan bisnis dengan sebuah perusahaan. Hal ini telah menjadi isu penting yang merupakan salah satu tantangan utama oleh banyak perusahaan di era global ini dan harus dihadapinya. Disamping itu menurut Khakabi dkk.,(2010) untuk memperoleh pelanggan baru itu memerlukan biaya hingga 10 kali lipat lebih mahal dari biaya untuk mempertahankan pelanggan yang ada. Melihat begitu mahalnya untuk memperoleh pelanggan baru tentunya perusahaan akan lebih memilih mempertahankan pelanggan dibanding dengan mendapatkan pelanggan baru. Melihat hasil fakta tersebut maka banyak perusahaan sekarang lebih beralih untuk mempertahankan pelanggan yang ada dan menghindari churn pelanggan. Di era modern ini banyak bisnis yang berkembang dari product-centered ke Customer-Centered (Coussement dan Poel 2008). Sebelum perusahaan mengetahui ini perusahaan hanya berfokus pada penjualan jasa dan produk dengan sedikit pengetahuan mengenai pelanggan yang membeli produknya. Integrasi proses pekerjaan di suatu organisasi dengan teknologi informasi pada saat ini sudah menjadi kebutuhan mutlak. Hal ini dikarenakan dengan menggunakan teknologi informasi 279

proses untuk menganalisa masalah dan mengambil keputusan lebih cepat dan akurat. Kelangsungan hidup suatu organisasi dipengarui oleh ketersediaan data dan informasi yang lengkap, benar dan tepat (Depkeu RI., 2007). Weiss (2009) mengatakan perusahaan telekomunikasi secara rutin menghasilkan dan menyimpan sejumlah besar data berkualitas tinggi, memiliki basis pelanggan yang sangat besar, dan beroperasi dalam lingkungan yang cepat berubah dan sangat kompetitif. Perusahaan telekomunikasi memanfaatkan BI untuk meningkatkan upaya pemasaran mereka, mengidentifikasi penipuan, dan lebih baik mengelola jaringan telekomunikasi mereka. Namun, perusahaanperusahaan ini juga menghadapi sejumlah tantangan BI karena ukuran besar set data mereka, aspek sekuensial dan temporal data mereka, dan kebutuhan untuk memprediksi kejadian yang sangat langka seperti penipuan pelanggan dan jaringan kegagalan secara real-time. BI dapat dilihat sebagai sarana otomatis menghasilkan beberapa pengetahuan ini langsung dari data. Dalam perusahaan telekomunikasi, mempertahankan pelanggan lebih mudah dan murah dibandingkan perusahaan harus mencari pelanggan baru, Prediksi cusromer churn muncul sebagai Bussiness Intelligence (BI) yang sangat penting untuk telekomunikasi modern. Tujuan utama dari prediksi cusromer churn adalah untuk memperoleh informasi kemungkinan dari pelanggan yang akan berpindah ke perusahaan lain menggunakan prediksi model. Saat ini menunjukkan interaksi analisa pelanggan dengan cara menilai customer churn dari tingkat sosial yang dapat meningkatkan akurasi dari prediksi customer churn (Richter dan Slonim, 2010). Permasalahan diatas mampu dijawab oleh Business Intelligence (BI), dimana BI merupakan salah satu bentuk implementasi teknologi informasi yang digunakan untuk membantu kegiatan seperti mengumpulkan data, menyediakan akses, serta menganalisa data dan informasi mengenai kinerja perusahaan. Dengan kegiatan BI tersebut maka sebuah organisasi atau perusahaan akan dengan mudah dalam mengambil keputusan secara cepat dan tepat. Singkatnya BI dapat diartikan sebagai pengetahuan yang didapatkan dari hasil analisis data yang diperoleh dari kegiatan (usaha) suatu organisasi. BI biasanya dikaitkan dengan upaya untuk memaksimalkan kinerja suatu organisasi. BI dapat membantu suatu organisasi mendapatkan pengetahuan yang jelas mengenai faktorfaktor yang mempengaruhi kinerja organisasi sehingga dapat membantu organisasi dalam pengambilan keputusan serta sekaligus meningkatkan keunggulannya (competitive advantage). BI juga dapat membantu suatu organisasi dalam menganalisis perubahan tren yang terjadi sehingga akan membantu organisasi menentukan strategi yang diperlukan dalam mengantisipasi perubahan tren tersebut. Upaya memaksimalkan kinerja organisasi merupakan hal yang prioritas saat ini. Organisasi yang secara jelas mampu mengidentifikasikan, menjelaskan, dan mengimplementasikan strateginya akan mampu berkembang dan berkompetisi lebih baik (Depkeu RI., 2007). 2. METODOLOGI Metode penelitian dalam penelitian ini menggunakan 2 metode yaitu : 1. Metode melalui studi literature. 2. Metode eksperimen dengan menggunakan beberapa tahapan diantaranya: a. Pengumpulan data b. Pemilihan atribut c. Penerapan algoritma d. Evaluasi hasil e. Dokumentasi eksperimen Adapun skema alur tahapan penelitian ini ditunjukpan pada gambar 1 280

Mulai Pengumpulan Data Pemilihan Atribut Penerapan Algoritma Evaluasi Hasil Dokumentasi Eksperimen Selesai Gambar 1. Skema Alur Tahapan Penelitian 3. HASIL DAN PEMBAHASAN 3.1. Metode Melalui Studi Literature Metode melalui studi literature yang bertujuan mendapatkan pengetahuan atau domain dari penelitian yang akan dilakukan. Studi literatur tersebut didapatkan melalui berbagai sumber antara lain buku, jurnal, paper, dan sebagainya. Adapaun hal-hal yang dapat diambil dari metode ini diantaranya adalah: a. Studi Pendahuluan : tahap ini merupakan kegiatan untuk menemukan informasi tentang obyek permasalahan yang ada. Permasalahan-persalahan yang berkembang beberapa tahun terahir dalam sebuah organisasi atau perusahaan khususnya mengenai customer churn. b. Studi Pustaka : tahapan ini adalah tahap untuk menemukan penelitian-penelitian yang sejenis dengan penelitian ini yang nantinya dijadikan sebagai referensi dan pendukung teori dalam menyelesaikan permasalahan yang diangkat. c. Perumusan Masalah : adapun pada tahapan selanjutnya setelah mendapatkan permasalahan utama dari obyek penelitian yang dilengkapi dasar teori dari studi pustaka yang mendukung maka masalah yang ada dapat dirumuskan dengan baik. 3.2. Metode Eksperimen Metode eksperimen ini digunakan untuk menganalisa data yaitu memilah label dan variabel yang selanjutnya data digunakan dalam proses prediksi. Proses yang berjalan dalam metode ini mengginakan alat bantu Rapid Miner 5, adapun tahapan dalam metode ini adalah sebagai berikut: 3.1.1. Pengumpulan Data Kegiatan pengumpulan data dapat dilakukan dengan menagambil dari database perusahaan yang digunakan sebagai obyek penerapan BI. Data yang digunakan didalam penelitian ini adalah data telekomunikasi di Colombia dimana dataset customer churn diambil dari database-uci California University. Dalam dataset ini mendefinisikan transaksi panggilan yaitu churn per satu pelanggan seluler dari satu perusahaan telekomunikasi, dalam waktu tiga bulan terus menerus. Terdapat 21 fitur. Data customer churn ini terdiri dari 5000 tuple (record), terdiri dari 4293 berlabel false dan 707 berlabel true, terdiri dari 51 negara bagian distrik Colombia. 281

3.1.2. Pemilihan Atribut Kegiatan pemilihan atribut digunakan untuk memisahkan antara atribut label (atribut yang akan digunakan sebagai kunci prediksi) dengan atribut variabel prediksi dalam memprediksi sebuah data. Dalam dataset ini atribut yang bernilai false atau true dipilih sebagai label dan yang lainnya dijadikan sebagai variabel. Pada tabel 1 memperlihatkan atribut-atribut dalam dataset yang digunakan. Tabel 1. Keterangan Atribut Data Set Nama Atribut Keterangan State untuk 51 negara bagian District of Columbia Account Length berapa lama akun aktif Area Code kode area Phone Number nomer telepon yang digunakan sebagai ID pelanggan International Plan rencana internasional Voice Mail Plan rencana pesan suara Number Vmail Messages jumlah pesan voice mail Total Days total panggilan sehari pada siang hari, yang terdiri dari : total day minutes (jumlah layanan per menit), total day calls (jumlah panggilan) dan total day charge (jumlah biaya) Total Eve total panggilan sehari pada sore hari, yang terdiri dari total eve minutes (jumlah layanan per menit), total eve calls (jumlah panggilan) dan total eve charge (jumlah biaya) Total Night total panggilan sehari pada malam hari, yang terdiri dari total night minutes (jumlah layanan per menit), total night calls (jumlah panggilan) dan total night charge (jumlah biaya) Total International total panggilan yang digunakan untuk panggilan internasional, yang terdiri dari total intl minutes (jumlah layanan per menit), total intl calls (jumlah panggilan) dan total intl charge (jumlah biaya) Number Customer Service Calls jumlah panggilan ke layanan pelanggan Label indikasi tidak churn dan churn (False and True) 3.1.3. Penerapan Algoritma Prediksi sebuah data yang dalam hal ini adalah data pelanggan telekomunikasi dapat diprediksi dengan menggunakan beberapa algoritma prediksi diantaranya SVM, Logistik Regresi dan KNN. Dalam penelitian ini algoritma yang digunakan adalah KNN dimana algoritma ini sangatlah sederhana (Harrington, 2012), bekerja berdasarkan jarak terpendek dari query instance ke training sample untuk menentukan KNNnya. Training sample diproyeksikan keruang berdimensi banyak, dimana masing-masing dimensi merepresentasikan fitur dari data. Ruang ini dibagi menjadi bagian-bagian berdasarkan klasifikasi training sample. Sebuah titik pada ruang ini ditandai kelas c jika kelas c merupakan prediksi yang paling banyak ditemui pada k buah tetangga terdekat dari titik tersebut maka sampel tersebut masuk kedalam kelas c. Dekat atau jauhnya tetangga biasanya dihitung berdasarkan persamaan Euclidean Distance. Jarak Euclidean paling sering digunakan menghitung jarak (Deepa dan Ladha, 2011). Jarak euclidean berfungsi menguji ukuran yang bisa digunakan sebagai interpretasi kedekatan jarak antara dua obyek. yang direpresentasikan pada persamaan 1. Keterangan: D(a,b) : jarak skalar dari dua buah vektor a dan b dari matrik berukuran D dimensi k : data traning ke n d : jumlah data training : data training b : data testing...(1) 282

Persamaan 1 adalah persamaan untuk mencari jarak terpendek antara data testing dengan data taining. Untuk mengetahui proses lengkap dari prediksi customer churn telekomunikasi ditunjukkan pada gambar 2. Data Customer Churn (Data Training) Data Customer Churn (Data Testing) Hitung Jarak Antara Data Testing dengan Data Training (eucledian distance) Label Data Testing Ditemukan Urutkan Jarak Dari Yang Terkecil Tentukan Nilai K Ambil Mayoritas Label Dari Jarak Terpilih Gambar 2. Blok Diagram Algoritma Prediksi K-NN Gambar 2 blok diagram algoritma prediksi K-NN diatas memperlihatkan langkah-langkah dalam memprediksi data chustomer churn, dimana antara data training dan data testing dihitung menggunakan persamaan eucledian distance, setelah semua data dihitung jaraknya langkah selanjutnya adalah mengurutkan jarak dari jarak terkecil keterbesar selanjutnya menentukan nilai k, dimana nilai k adalah jumlah data terpilih. Dari data terpilih tersebut kemudian dipilih mayoritas labelnya yang sekaligus merupakan hasil dari label data. Tabel 2. Data Set State Length Account area code Number Phone international plan voice mail plan number vmail messages total day minutes total day calls total day charge KS 128 415 382-4657 No yes 25 265,1 110 45,07 OH 107 415 371-7191 No yes 26 161,6 123 27,47 NJ 137 415 358-1921 No No 0 243,4 114 41,38......... VT 86 415 373-8058 No yes 34 129,4 102 22 ID 85 408 350-8884 No yes 27 196,4 139 33,39 Tabel 3. Lanjutan Tabel 2 total eve minutes total eve calls total eve charge Total night minutes total night calls total night charge total intl minutes total intl calls total intl charge number customer service calls 197,4 99 16,78 244,7 91 11,01 10 3 2,7 1 False. 195,5 103 16,62 254,4 103 11,45 13,7 3 3,7 1 False. 121,2 110 10,3 162,6 104 7,32 12,2 5 3,29 0 False............ 267,1 104 22,7 154,8 100 6,97 9,3 16 2,51 0 False. 280,9 90 23,88 89,3 75 4,02 13,8 4 3,73 1? Pada tabel 2 dan tabel 3 data terahir belum diketahui apakah pelanggan tersebut masuk kedalam kategori true (churn) atau false (not churn), untuk mengetahui label dari data tersebut Churn 283

maka harus dihitung jaraknya menggunakan persamaan 1. Data yang sudah dihitung selanjutnya di urutkan dari jarak data yang paling kecil kedata yang paling besar nilai jaraknya, selanjutnya ditentukan nilai K-nya, dari proses itu maka akan diketahui label dari data tersebut dari mayoritas label yang didapat. 3.1.4. Evaluasai Hasil Dari berbagai eksperimen yang dilakukan dalam memprediksi customer churn Telekomunikasi dengan menggunakan Algoritma KNN diperoleh data sebagai berikut : Tabel 4. Hasil Prediksi Customer Churn Telekomunikasi Prediksi 1 3 5 7 9 11 13 15 Acc Auc Acc Auc Acc Auc Acc Auc Acc Auc Acc Auc Acc Auc Acc Auc KNN 82 0,5 86,7 0,68 88,3 0,69 88,4 0,69 88,6 0,69 88,3 0,7 88,3 0,7 88,2 0,71 3.1.5. Dokumentasi Eksperimen 1. Mengambil data dari file excel yang merupakan data customer churn dari uci dataset adapun prosesnya dapat dilihat pada gambar 3. K Gambar 3. Import Data Dari Dataset Pada gambar 3 menunjukkan data chustomer churn yang telah di import kedalam tool Rapidminer. 2. Menentukan id dan label Gambar 4 Pemilihan ID 284

Gambar 5. Penentuan label Pada gambar 4 dan 5 memperlihatkan proses pengambilan id sebagai kunci utama (primary key) pada data customer churn telekomunikasi dan pengambilan label sebagai kelas dalam memprediksi customer churn. 3. Penerapan Algoritma KNN dan Penentuan Nilai K Proses penerapan algoritma dilakukan setelah data diambil dari database disamping itu data harus sudah ditentukan id dan labelnya untuk diprediksi. Gambar 6 menunjukkan penerapan algoritma KNN dalam memprediksi customer churn. Gambar 6. Penerapan Algoritma baik. Selanjutnya memilih nilai K yang paling tepat untuk memperoleh nilai akurasi yang paling Gambar 7 Setting Nilai K 285

Pada gambar 6 merupakan proses prediksi menggunakan algoritma K-NN yang di validasi menggunakan 10 cros validasi, sedangkan pada gambar 7 memperlihatkan seting nilai k, nilai k ini nantinya akan mempengaruhi akurasi prediksi. 4. KESIMPULAN Dari hasil penelitian ini dapat disimpulkan bahwa penerapan BI untuk mengetahui prediksi customer churn dengan menggunakan algoritma prediksi KNN dapat diterapkan didunia telekomunikasi. Penerapan BI dapat membantu pengambilan keputusan bagi tingkat elit pengambil keputusan dengan cepat dan akurat dengan tingkat akurasi 88% dimana proses pengambilan keputusan didapat dari hasil analisa yang dilakukan. Sebagai contoh pengambil keputusan adalah apabila suatu pelanggan ataupun kelompok pelanggan tertentu yang diketahui sejak dini bahwa pelanggan tersebut cenderung akan meninggalkan perusahaannya maka dapat ditahan dengan berbagai cara diantaranya adalah dengan memberikan promosi-promosi yang menarik dan lain sebagainya. Penelitian ini mendapatkan hasil 88%, diharapkan penelitian mendatang dapat melanjutkan dengan menambah algoritma pemilihan fitur, imbalant data dan algoritma lain dengan tujuan untuk memperoleh hasil akurasi yang lebih baik. 5. DAFTAR PUSTAKA Dep. Keu. RI, Laporan Tim Studi Tentang Implementasi Business Intelligence pp. 1-2, Des. 2007. K. Coussement and D. Van den Poel, Integrating the voice of customers through call center emails into a decision support system for churn prediction, Information & Management, vol. 45, no. 3, pp. 164 174, Apr. 2008. M. Weiss, Data Mining in the Telecommunications Industry, IGI Global, Fordham University, USA, 2009 P. Harrington, Machine Learning in Action. USA: Manning Publications, 2012, p. 18. S. KhakAbi, M. R. Gholamian, and M. Namvar, Data Mining Applications in Customer Churn Management, 2010 International Conference on Intelligent Systems, Modelling and Simulation, pp. 220 225, Jan. 2010. T. Deepa and L. Ladha, Feature Selection Methods And Algorithms, International Journal on Computer Science and Engineering (IJCSE), vol. 3, no. 5, pp. 1787 1797, 2011. X. Yu, S. Guo, J. Guo, and X. Huang, An extended support vector machine forecasting framework for customer churn in e-commerce, Expert Systems with Applications, vol. 38, no. 3, pp. 1425 1430, Mar. 2011. Y. Richter and N. Slonim, Predicting customer churn in mobile networks through analysis of social groups, Proceedings of the SIAM International Conference on Data Mining, pp. 732 741, 2010. 286