BAB I PENDAHULUAN. 1.1 Latar Belakang

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB I PENDAHULUAN. 1.1 Latar Belakang"

Transkripsi

1 BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan penting dalam pembangunan hubungan dengan teman sekelas, guru dan pegawai di lingkungan sekolah [1]. Hubungan di lingkungan sekolah ini mempengaruhi motivasi siswa di dalam aktivitas belajar, baik motivasi intrinsik dan ekstrinsik [2]. Menurut penelitian [3], motivasi intrinsik maupun ekstrinsik inilah yang mempengaruhi performa akademik siswa. Berdasarkan keeratan hubungan dengan motivasi, faktor metakognisi juga mempengaruhi bagaimana siswa berperilaku di kelas dan mempengaruhi tingkat performa di dalam akademik [4]. Faktor metakognisi merupakan kemampuan untuk merefleksikan, memahami dan mengkontrol belajar dirinya sendiri. Metakognisi berperan dalam pemilihan meta level seseorang yang berkaitan dengan informasi kapan menggunakan proses kognisi tertentu dan bagaimana mengkombinasikannya dalam rangka mengerjakan tugas yang lebih besar. Metakognisi memiliki dua komponen utama yaitu pengetahuan kognisi serta peraturan kognisi [5]. Pengetahuan kognisi adalah mekanisme untuk menggunakan strategi maupun prosedur, sedangkan peraturan kognisi adalah sekumpulan aktivitas yang membantu seseorang dalam mengkontrol cara belajarnya. Hal hal yang membuat faktor metakognisi unggul dalam meneliti perilaku siswa karena faktor ini mencakup motivasi, peraturan (regulation) maupun kognisi seseorang. Sudah banyak penelitian yang memprediksi faktor performa siswa berdasarkan nilai kognisi yang dilihat dari pengetahuan mata pelajaran tertentu [6] [8]. Namun belum banyak proses prediksi faktor performa siswa berdasarkan nilai metakognisi dalam bidang keteknikan. Biasanya proses prediksi faktor diimplementasi dengan menggunakan Educational Data Mining (EDM). EDM adalah suatu mekanisme konversi data mentah dari sistem pendidikan menjadi 1

2 informasi yang bermanfaat, baik untuk siswa itu sendiri, guru, orang tua maupun peneliti sistem pendidikan [9]. Penggunaan EDM untuk mencari faktor performa dari motif siswa yang sebenarnya, sebaiknya diimplementasi pada level kelas yang sama, mata pelajaran yang sama atau level lingkungan pendidikan yang sama [6]. Namun imbas dari implementasi tersebut adalah sedikitnya data yang dikumpulkan oleh peneliti. Sedikitnya data tersebut biasanya dinamakan sebagai dataset kecil. Penggunaan dataset kecil pada implementasi data mining memiliki banyak kelebihan maupun kekurangan. Kelebihan penggunaan dataset kecil yaitu implementasi analisis yang lebih cepat serta meminimalisir kebutuhan yang dikeluarkan seperti waktu, tenaga, biaya dan sebagainya. Sedangkan kekurangan dari dataset kecil adalah kurangnya representasi informasi sehingga peneliti akan kesulitan dalam pengambilan keputusan. Bahkan parahnya, dataset kecil ini akan memunculkan fenomena yang dinamakan ketidakseimbangan kelas (class imbalanced) [10]. Fenomena ini terjadi ketika rasio kejadian antara satu kasus dengan kasus lainnya berjumlah tidak seimbang (rasio tidak seimbang/imbalanced ratio). Misalnya dalam kasus metakognisi, jumlah siswa yang memiliki kasus metakognisi buruk lebih banyak dibandingkan jumlah kasus siswa bermetakognisi baik. Kumpulan siswa yang masuk dalam kumpulan kasus berkejadian tinggi ini dinamakan sebagai kelas mayoritas, sedangkan kumpulan kasus berkejadian sedikit ini disebut sebagai kelas minoritas. Ketidakseimbangan kelas di dataset kecil sangat merugikan bagi peneliti yang berkecimpung di bidang data mining. Alasannya adalah kebanyakan machine learning pada data mining memiliki kesulitan dalam mengklasifikasi kelas minoritas dengan benar. Kebanyakan dari algoritme tersebut mengasumsi bahwa distribusi kelas yang diuji sudah seimbang sehingga salah dalam mengklasifikasi nilai pada tiap kelas. Terlebih lagi, algoritme machine learning dirancang untuk menggeneralisisasi data yang diuji sebagai sama kedudukannya dan menghasilkan hipotesis yang paling sederhana. Prinsip tersebut disematkan pada berbagai algoritme seperti decision tree, nearest neighbor serta Support Vector Machine (SVM). Oleh karenanya ketika algoritme ini menguji dataset yang tidak seimbang 2

3 maka akan cenderung fokus pada kelas mayoritas dan mengabaikan kelas minoritas sehingga menyebabkan error pada klasifikasi kelas minoritas. Kelas minoritas hanya dianggap sebagai noise saja [11]. Hasil pengujian metode klasifikasi di dataset yang tidak seimbang biasanya memiliki ciri khas berupa nilai instance yang terklasifikasi (misclassification cost) di kelas minoritas lebih tinggi dibandingkan dengan misclassification cost di kelas mayoritas. Oleh karenanya, tantangan dalam mengatasi hal ini adalah bagaimana caranya mengklasifikasi kelas minoritas secara lebih akurat. Menurut penelitian [12], cara untuk mengatasi ketidakseimbangan kelas adalah dengan melakukan sampel ulang (resample) dataset asli, baik pada kelas minoritas (oversampling) ataupun kelas mayoritas (undersampling). Cara kedua adalah dengan cara memberikan nilai / cost pada instance yang diuji. Cara pertama untuk mengatasi ketidakseimbangan kelas adalah proses sampel ulang. Oversampling merupakan mekanisme untuk menyeimbangkan distribusi kelas dengan cara replikasi instance kelas minoritas secara acak. Namun, kekurangan dari oversampling adalah peningkatan kemungkinan munculnya overfitting karena mekanisme ini membuat duplikasi instance secara persis. Kemudian Chawla dkk [13] mengajukan solusi yang dinamakan SMOTE (Synthethic Minority Oversampling Technique). SMOTE dapat membangkitkan sampel kelas minoritas secara sintetis dengan cara proses interpolasi antar instance kelas minoritas yang terletak berdekatan. SMOTE memanfaatkan faktor nearest neighbors serta tingkat oversampling yang diinginkan. Undersampling adalah suatu mekanisme untuk menyeimbangkan distribusi kelas dengan cara mengurangi instance kelas mayoritas secara acak. Namun kekurangan dari undersampling adalah hilangnya data yang dianggap penting bagi kelangsungan proses pengambilan keputusan oleh machine learning. Cara kedua untuk mengatasi ketidakseimbangan kelas adalah pemberian nilai / cost atribut pada instance yang diuji, akibat adanya jarak/gap informasi pada dataset jumlah terbatas. Li dkk [14] mengajukan suatu metode yang dinamakan MTD (Mega Trend Diffusion) yang bekerja dengan cara memperluas cakupan 3

4 informasi atribut dengan memberikan atribut sintetis. Atribut sintetis ini dibuat berdasarkan tingkat keanggotaan atribut di dalam dataset. Kebanyakan MTD diuji dengan algoritme SVM karena sering digunakan pada penanganan dataset kecil [15] [17]. Tetapi dari banyaknya penanganan ketidakseimbangan kelas di dataset kecil, tidak banyak yang mempertimbangkan seluruh aspek seperti oversampling, undersampling dan penanganan atribut. Dataset yang kecil cenderung memiliki informasi yang sedikit, pada atribut tambahan dapat berperan memberikan informasi lebih untuk machine learning. Selain itu, keadaan atribut yang semakin similiar dan berkorelasi tinggi akan sulit untuk dipisahkan dan membuat machine learning kesulitan dalam proses prediksi klasifikasi. Pengunaan algoritme machine learning sebagai penguji performa data seperti SVM, merupakan salah satu faktor penting keberhasilan penelitian di bidang data mining terutama pada dataset kecil [18]. N amun menurut Fern andez-delgado [19], tidak ada metode klasifikasi yang dianggap terbaik pada seluruh kasus. Oleh karenanya disarankan penggunaan kombinasi lebih dari 1 (satu) jenis algoritme yang dinamakan sebagai algoritme ensemble. Salah satu algoritme ensemble ini adalah Stacking. Algoritme Stacking bekerja dengan memanfaatkan probabilitas dari masing masing klasifikasi yang dipakai (base classifier) untuk diuji kembali oleh suatu klasifikasi meta-learning. Stacking dianggap lebih baik jika dibandingkan dengan Voting, bahkan Stacking dianggap lebih efektif dibandingkan dengan pemilihan salah satu metode klasifikasi terbaik berdasarkan pengujian cross validation [20]. Selain itu dibandingkan dengan teknik ensemble lainnya, seperti Bagging dan Boosting, teknik Stacking dapat mengurangi tingkat kesalahan (false positive rate) secara lebih signifikan [21]. SVM sering dipadupadankan dengan Naive Bayes pada penelitian teks mining serta sistem deteksi intrusi [22]. Naive Bayes merupakan salah satu teknik klasifikasi yang dapat diimplementasi dengan baik pada dataset terbatas, karena pengklasifikasi ini tetap dapat mengestimasi parameter walaupun data yang tersedia terbatas [23]. Namun belum banyak implementasi Stacking di 4

5 dataset bidang metakognisi. Menurut referensi [24], hasil dari kombinasi 2 (dua) atau lebih algoritme pada klasifikasi ensemble termasuk Stacking, dapat menghasilkan 3 (tiga) jenis kemungkinan : 1. Kemungkinan pertama, kerja ensemble menghasilkan nilai maksimal pada seluruh evaluasi performa. 2. Kemungkinan kedua, kerja ensemble menghasilkan nilai buruk pada seluruh evaluasi performa. 3. Kemungkinan ketiga, kerja ensemble menghasilkan nilai baik pada salah satu pengukuran, tapi tidak pada pengukuran lainnya. Untuk kemungkinan ketiga ini, evaluasi dipilih tergantung pada kepentingan relatif dari pengukuran performa dan tergantung dari tujuan si pembuat keputusan. Evaluasi performa klasifikasi dapat diukur dengan berbagai metode. Menurut Weiss [25], salah satu masalah pada dataset yang tidak seimbang ditandai dengan adanya kesalahan dalam evaluasi. Oleh karenanya diperlukan proses evaluasi yang tepat guna membantu dalam pengambilan keputusan. Proses pengambilan keputusan yang tepat dilakukan sesuai dengan tujuan awal penelitian. 1.2 Perumusan Masalah Berdasarkan latar belakang masalah yang telah dikemukakan sebelumnya, permasalahan yang dihadapi dalam penanganan ketidakseimbangan kelas di dataset metakognisi berjumlah terbatas adalah sebagai berikut : 1. Kebanyakan penelitian yang menangani ketidakseimbangan kelas di dataset kecil, tidak mempertimbangkan aspek penyeimbangan jumlah kelas serta aspek penambahan informasi atribut. 2. MTD biasanya diuji dengan SVM, padahal tidak ada klasifikasi terbaik yang berlaku pada berbagai jenis dataset. 3. Pengambilan keputusan di dataset yang tidak seimbang sering menjadi masalah akibat kesalahan evaluasi. 5

6 4. Pengujian faktor metakognisi seseorang yang mempengaruhi tingkat performa akademik pada dataset terbatas, belum banyak diimplementasi dan diteliti di bidang keteknikan (EDM). 1.3 Keaslian Penelitian Beberapa penelitian yang menjadi dasar penelitian ini dikemukakan pada Tabel 1.1. Dari tabel tersebut diketahui bahwa terdapat penelitian yang bergerak di bidang penangan ketidakseimbangan kelas. Penelitian penelitian tersebut melibatkan metode Mega Trend Diffusion yakni A Learning Method for the Class Imbalance Problem with Medical Data Sets [15] serta Extending Attribute Information for Small Data Set Classification [16]. Penelitian [15] memiliki kelebihan mekanisme MTD berupa penanganan dataset secara sistematis pada kelas mayoritas maupun minoritas. Namun kekurangan dari penelitian ini adalah tidak dipertimbangkannya kemungkinan overlap antar atribut yang dapat berimbas buruk bagi kelas minoritas. Di referensi [15] juga menyebutkan perlunya peningkatan jumlah kelas minoritas, namun mekanisme oversampling yang tepat tidak disebutkan. Padahal oversampling merupakan suatu upaya peningkatan jumlah instance dengan menduplikasinya secara persis dan dapat menyebabkan overfitting. Oleh karenanya, penelitian ini mengacu pada penggunaan metode yang diajukan pada penelitian Chawla, yakni SMOTE. Penelitian lain yang bergerak dalam bidang penanganan ketidakseimbangan kelas adalah referensi [16]. Referensi ini memiliki kelebihan berupa pembuatan atribut sintetis untuk menangani atribut yang berkorelasi tinggi, untuk kekurangannya adalah tidak membedakan perlakuan terhadap instance yang ada di kelas mayoritas maupun minoritas (generalisasi perlakuan) sehingga jumlah kelas mayoritas masih lebih besar dibandingkan kelas minoritas. Pengujian pada penelitian referensi [15] dan [16] sama sama menggunakan teknik klasifikasi SVM. Padahal menurut Dzeroski [20] implementasi Stacking lebih baik dibandingkan penggunaan satu klasifikasi yang dianggap baik. 6

7 Tabel Berbagai referensi yang terkait dengan penelitian ini No Peneliti Judul Penelitian Tujuan Hasil dan Kesimpulan Terkait 1 Li, Der-chiang Liu, Chiaowen Hu, Susan C (2010) 2 Li, Der-chiang Liu, Chiao-wen (2012) 3 Schraw, Gregory Dennison, Rayne Sperling (1994) 4 Dzeroski, Saso Zenko, Bernard (2004) 5 Sagale, Amit D Kale, Swati G (2014) 6 Chawla, Nitesh V dkk (2002) A Learning Method for the Class Imbalance Problem with Medical Data Sets Extending Attribute Information for Small Data Set Classification Assessing Metacognitive Awareness Is Combining Classifiers with Stacking Better than Selecting the Best One? Combining Naive Bayesian and Support Vector Machine for Intrusion Detection System SMOTE : Synthetic Minority Over-sampling Technique Strategi penanganan ketidakseimbangan kelas dengan meminimalisir bias terhadap kelas mayoritas pada dataset kedokteran. Mengekstrasi informasi secara efektif di dataset yang jumlahnya terbatas. Pembuatan instrumen metakognisi untuk resipien usia dewasa. Evaluasi berbagai kombinasi metode klasifikasi untuk implementasi Stacking. Kombinasi Naive Bayes dan SVM untuk memperoleh performa yang lebih baik di sistem deteksi intrusi. Mengatasi kekurangan dari undersampling oleh kelas mayoritas serta oversampling kelas minoritas. Performa dari pendekatan penelitian ini memperoleh hasil yang optimum karena memanfaatkan oversampling di kelas minoritas dan undersample di kelas minoritas. Proses ini melibatkan Gaussian Membership serta Mega Trend Diffusion. Dihasilkan pendekatan baru yang memanfaatkan konversi data asli menjadi dimensi data yang lebih tinggi berdasarkan fungsi fuzzy membership sehingga membentuk atribut sintetis. Instrumen 52 pertanyaan mencakup dua konsep metakognisi yaitu pengetahuan dan peraturan kognisi. Instrumen ini menjadi standar pertanyaan metakognisi dalam dunia psikologi. Implementasi Stacking menghasilkan performa yang lebih baik apabila dibandingkan dengan memilih klasifikasi yang dianggap paling baik melalui mekanisme cross validation. Kombinasi ini dapat menganalisis volume data yang lebih besar dan meningkatkan kecepatan deteksi serta akurasi pendeteksian kerusakan. Pendekatan SMOTE dapat meningkatkan akurasi metode klasifikasi untuk kelas minoritas. SMOTE merupakan pendekatan baru dari proses oversampling. 7

8 Dikarenakan SVM sering diimplementasi dalam uji penanganan ketidakseimbangan kelas, maka berdasarkan penelitian Sagale dan Kale [22] yang mengkombinasikan antara SVM dan Naive Bayes, akan digunakan 2 kombinasi ini dalam pengujian dataset hasil penanganan ketidakseimbangan kelas. Oleh karenanya, penelitian ini berupaya menggabungkan teknik Mega Trend Diffusion dari dua penelitian tersebut [15],[16], karena masing masing penelitian memiliki kelebihan maupun kekurangan dalam menangani ketidakseimbangan kelas. Teknik menaikkan jumlah instance di kelas minoritas menggunakan metode SMOTE [13]. Selanjutnya dataset hasil penanganan ketidakseimbangan kelas tersebut akan diuji dengan menggunakan kombinasi SVM dan Naive Bayes melalui klasifikasi Stacking. Dikarenakan belum banyak penanganan ketidakseimbangan kelas di bidang metakognisi, maka penelitian ini meneliti dataset metakognisi yang atributnya diambil dari penelitian Gregory dan Dennison [5]. 1.4 Tujuan Penelitian Tujuan utama dari penelitian ini adalah pembuatan algoritme transformasi dataset kecil guna penanganan ketidakseimbangan kelas. Untuk mencapai tujuan utama tersebut, diperlukan berbagai upaya pencapaian berbagai tujuan seperti : 1. Mengkombinasi dan memodifikasi algoritme penelitian sebelumnya yakni referensi [15] dan [16] yang mempertimbangkan aspek penyeimbangan jumlah kelas dan juga aspek penambahan informasi atribut. 2. Menguji signifikansi peranan pengujian dengan klasifikasi ensemble Stacking antara SVM dan Naive Bayes di dataset hasil algoritme penanganan ketidakseimbangan kelas. 3. Menguji hubungan antara faktor metakognisi dengan tingkat performa akademik, sehingga dapat diketahui faktor metakognisi apa saja yang paling cenderung mempengaruhi siswa berperforma buruk. 8

9 1.5 Manfaat Penelitian Hasil penelitian ini diharapkan dapat menghasilkan mekanisme penanganan ketidakseimbangan kelas yang bersifat optimal, melalui kombinasi Mega Trend Diffusion (MTD), proses oversampling oleh SMOTE serta pengujian klasifikasi ensemble. Selanjutnya, dari mekanisme tersebut akan diperoleh prediksi faktor metakognisi apa sajakah yang mempengaruhi tingkat performa seorang siswa. 9

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Metode Klasifikasi Data Mining dan Teknik Sampling Smote... METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Hairani

Lebih terperinci

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup

BAB I PENDAHULUAN. manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup 1 BAB I PENDAHULUAN 1.1. Latar Belakang Pendidikan merupakan salah satu faktor utama dalam hidup seorang manusia karena faktor ini mampu mengarahkan dan menunjukkan kualitas hidup setiap orang. Namun keberadaan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED Studi Kasus Perilaku Seksual Remaja di Indonesia Hasil SDKI 2012 Yogo Aryo Jatmiko 1, Septiadi Padmadisastra 2, Anna Chadidjah 3 Prodi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ZK. Abdurahman Baizal 1, Moch. Arif Bijaksana 2, Angelina Sagita Sastrawan 3 Telp (022)7564108 ext 2298 Fax

Lebih terperinci

Bab I Pendahuluan. 1.1 Latar Belakang

Bab I Pendahuluan. 1.1 Latar Belakang Bab I Pendahuluan 1.1 Latar Belakang Klasifikasi merupakan task dari data mining yang bertujuan untuk memberikan label kelas terhadap suatu data. Pemberian label kelas ini dilakukan oleh classifier. Suatu

Lebih terperinci

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine. ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya

BAB I PENDAHULUAN. 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini pendidikan di Indonesia semakin berkembang. Banyaknya pembangunan gedung sekolah maupun perguruan tinggi menjadi tanda berkembangnya pendidikan. Jumlah pendaftar

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Sistem jaringan komputer memiliki peran yang sangat penting dalam masyarakat modern karena memungkinkan informasi dapat diakses, disimpan dan dimanipulasi secara online.

Lebih terperinci

ANALISIS PENGARUH METODE COMBINE SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI

ANALISIS PENGARUH METODE COMBINE SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ANALISIS PENGARUH METODE COMBINE SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI Angelina Sagita Sastrawan 1, ZK. Abdurahman Baizal 2, Moch. Arif Bijaksana 3, Telp (022)7564108 ext 2298

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Perkembangan teknologi sekarang ini semakin pesat. Kebutuhan akan informasi dan komunikasi bertambah. Telah ditemukan berbagai perangkat teknologi yang memudahkan manusia

Lebih terperinci

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4725 Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel Handling Imbalanced Data

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan

Tabel 1.1 Pertumbuhan Panjang Jalan dan Jumlah Kendaraan BAB I PENDAHULUAN Sebagai negara berkembang, perekonomian Indonesia didorong untuk tumbuh dengan pesat. Salah satu indikator pertumbuhan perekonomian yang baik adalah tingginya daya beli masyarakat. Tingginya

Lebih terperinci

BAB IV EKSPERIMEN. 4.1 Tujuan

BAB IV EKSPERIMEN. 4.1 Tujuan BAB IV EKSPERIMEN Pada bab ini dibahas mengenai eksperimen penggunaan SVM dalam pendeteksian intrusi pada jaringan. Pembahasan ini meliputi tujuan yang ingin dicapai melalui eksperimen ini, parameter evaluasi

Lebih terperinci

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Muh. Safri Juliardi Program Studi Informatika Universitas Sebelas Maret Jl. Ir. Sutami No. 36 A Surakarta juliardi@student.uns.ac.id

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA C5.

MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN ALGORITMA C5. ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.2 Agustus 2017 Page 3138 MEMPREDIKSI STATUS BERLANGGANAN KLIEN BANK PADA KAMPANYE PEMASARAN LANGSUNG DENGAN MENGGUNAKAN METODE KLASIFIKASI DENGAN

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

BABI PENDAHULUAN. 1.1 Latar Belakang

BABI PENDAHULUAN. 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Kanker payudara adalah jenis kanker yang dimulai pada sel-sel payudara sebagai sekelompok sel kanker, yang kemudian dapat menyerang jaringan di sekitarnya atau menyebar

Lebih terperinci

1. Pendahuluan 1.1 Latar Belakang

1. Pendahuluan 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Teknologi semakin berkembang seiring dengan berjalannya waktu. Disadari atau tidak, sebagian besar kehidupan ini dibantu oleh teknologi dan banyak sekali manfaat yang

Lebih terperinci

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang 1.2 Perumusan Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Saat ini sering terjadi data explosion problem yaitu data data yang tersimpan dalam database berjumlah sangat besar namun dari data data tersebut belum banyak dimanfaatkan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar belakang 1.1 Latar belakang BAB I PENDAHULUAN Paru-paru adalah organ penting yang merupakan salah satu organ vital bagi kehidupan manusia. Organ ini memiliki peranan pada sistem pernapasan, karena dapat memenuhi

Lebih terperinci

BAB 1 PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1-1 BAB 1 PENDAHULUAN Bab ini menguraikan penjelasan umum mengenai tugas akhir yang dikerjakan. Penjelasan tersebut meliputi latar belakang masalah, tujuan tugas akhir, lingkup tugas akhir, metodologi yang

Lebih terperinci

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan

BAB I PENDAHULUAN. untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan 1 BAB I PENDAHULUAN 1.1 Latar Belakang Pesatnya perkembangan media sosial menawarkan pengguna kesempatan untuk bisa mengeluarkan pendapat dan ekspresi secara bebas. Itu artinya perusahaan tidak lagi memiliki

Lebih terperinci

IPTEK-KOM, Vol. 19 No.12, Juni 2017: ISSN

IPTEK-KOM, Vol. 19 No.12, Juni 2017: ISSN Implementasi Teknik Sampling untuk Mengatasi Imbalanced Data pada Penentuan Status Gizi Balita dengan Menggunakan Learning Vector Quantization Implementation of Sampling Techniques for Solving Imbalanced

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG

BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG BAB 1 PENDAHULUAN 1.1 LATAR BELAKANG Era komunikasi dengan menggunakan fasilitas internet memberikan banyak kemudahan dalam mendapatkan informasi yang dikehendaki. Dengan demikian semakin banyak orang,

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

3. Masalah Penelitian

3. Masalah Penelitian Course Outline 1. Pengantar Penelitian 2. Tahapan Penelitian 3. Masalah Penelitian 4. Literature Review 5. Struktur Penulisan Tesis 6. Kesalahan Penulisan Tesis 7. Metode Eksperimen 8. Pengujian Tesis

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penyakit Kanker merupakan suatu peyakit yang paling ditakuti oleh masyakat karena proses penyembuhannya yang sulit, efek yang ditimbulkan dan memerlukan biaya yang

Lebih terperinci

BAB I 1 PENDAHULUAN. atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi

BAB I 1 PENDAHULUAN. atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi BAB I 1 PENDAHULUAN 1.1 Latar Belakang Tulang punggung merupakan bagian dari tulang belakang yang tersusun atas sekelompok vertebra, invertebrate discs, saraf, otot, medulla, dan sendi (Berthonnaud et

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

PENERAPAN TEKNIK BAGGING PADA ALGORITMA KLASIFIKASI UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS DATASET MEDIS

PENERAPAN TEKNIK BAGGING PADA ALGORITMA KLASIFIKASI UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS DATASET MEDIS PENERAPAN TEKNIK BAGGING PADA ALGORITMA KLASIFIKASI UNTUK MENGATASI KETIDAKSEIMBANGAN KELAS DATASET MEDIS Rizki Tri Prasetio 1, dan Pratiwi 2 1 Universitas BSI Bandung, rizki.rte@bsi.ac.id 2 Universitas

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

ANALISIS PERFORMA ALGORITME WEIGHTED NAIVE BAYES CLASSIFIER. Abstrak

ANALISIS PERFORMA ALGORITME WEIGHTED NAIVE BAYES CLASSIFIER. Abstrak ANALISIS PERFORMA ALGORITME WEIGHTED NAIVE BAYES CLASSIFIER Burhan Alfironi Muktamar Program Studi Teknik Informatika STMIK Jenderal Achmad Yani burhanalfironimuktamar@gmail.com Abstrak Naïve Bayes Classifier

Lebih terperinci

BAB I PENDAHULUAN. Jumlah spam di dunia semakin meningkat secara eksponensial.

BAB I PENDAHULUAN. Jumlah  spam di dunia semakin meningkat secara eksponensial. BAB I PENDAHULUAN 1.1 Latar Belakang Jumlah email spam di dunia semakin meningkat secara eksponensial. Dilaporkan bahwa pada tahun 1978 sebuah email spam dikirimkan ke 600 alamat email. Sedangkan pada

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

LEARNING ARTIFICIAL INTELLIGENT

LEARNING ARTIFICIAL INTELLIGENT LEARNING ARTIFICIAL INTELLIGENT Outline Decision tree learning Jaringan Syaraf Tiruan K-Nearest Neighborhood Naïve Bayes Data Latih 1 Decision Tree??? Pelamar IPK Wawancara Diterima P1 Bagus Tinggi P2

Lebih terperinci

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah

BAB II TINJAUAN PUSTAKA. penelitian yang penting (Baharudin, Lee and Khan, 2010). Beberapa peneliti telah BAB II TINJAUAN PUSTAKA Beberapa peneliti yang melakukan penelitian menganggap text mining menjadi sangat penting karena kemudahan untuk mendapatkan data elektronik dari berbagai macam sumber, karena itu

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE

MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE MODEL OPTIMISASI HYBRID ENSEMBLES DALAM MENYELESAIKAN PERMASALAHAN CLASS IMBALANCE Hartono Program Studi Teknik Informatika, STMIK IBBI Jalan Sei Deli No. 18 Medan, Medan-Indonesia E-mail : hartonoibbi@gmail.com

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk Spam Filtering

Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk  Spam Filtering Implementasi dan Analisa Granular Support Vector Machine with Data Cleaning (GSVM-DC) untuk E-mail Spam Filtering Proposal Tugas Akhir KBK: Rekayasa Perangkat Lunak dan Data (RPLD) Moh. Mahsus 113060088

Lebih terperinci

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi,

BAB I PENDAHULUAN. masalah kecerdasan, desain, pemilihan, implementasi, dan monitoring (Tripathi, BAB I PENDAHULUAN 1.1 Latar Belakang Pengambilan suatu keputusan dapat membantu dalam mencari solusi dari sekian banyak solusi yang ada. Pengambilan keputusan adalah hasil dari suatu proses yang termasuk

Lebih terperinci

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan.

BAB I PENDAHULUAN. jurusan ditentukan berdasarkan standar kriteria tiap jurusan. BAB I PENDAHULUAN 1.1 Latar Belakang Pratiwi (2014) berpendapat Sekolah Menengah Atas (SMA) merupakan suatu instansi pendidikan yang di dalamnya terdapat proses pengambilan keputusan jurusan siswa kelas

Lebih terperinci

KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER

KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2005 KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER Agustina Ratna Puspitasari¹,

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

3. Masalah Penelitian pemahaman merupakan awal proses penelitian

3. Masalah Penelitian pemahaman merupakan awal proses penelitian Metodologi Penelitian Rudi Susanto rudist87@gmail.com 086547296211 3. Masalah Penelitian pemahaman merupakan awal proses penelitian Course Outline 1. Pengantar Penelitian 2. Tahapan Penelitian 3. Masalah

Lebih terperinci

METODOLOGI PENELITIAN

METODOLOGI PENELITIAN METODOLOGI PENELITIAN MASALAH PENELITIAN TKK6352 Metodologi Penelitian Name Chalifa Chazar Website script.id Email chalifa.chazar@gmail.com Last update : Juli 2016 chalifa.chazar@gmail.com Course Outline

Lebih terperinci

PENDAHULUAN. 1.1 Latar Belakang

PENDAHULUAN. 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi internet memunculkan berbagai metode komunikasi yang mudah, murah, dan cepat. Salah satu media yang paling populer dan sangat cepat berkembang

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM).

Lebih terperinci

ANALISIS PENANGANAN KETIDAKSEIMBANGAN KELAS DENGAN MENGGUNAKAN DENSITY BASED FEATURE SELECTION (DBFS) DAN ADAPTIVE BOOSTING (ADABOOST) TESIS

ANALISIS PENANGANAN KETIDAKSEIMBANGAN KELAS DENGAN MENGGUNAKAN DENSITY BASED FEATURE SELECTION (DBFS) DAN ADAPTIVE BOOSTING (ADABOOST) TESIS i ANALISIS PENANGANAN KETIDAKSEIMBANGAN KELAS DENGAN MENGGUNAKAN DENSITY BASED FEATURE SELECTION (DBFS) DAN ADAPTIVE BOOSTING (ADABOOST) TESIS SUDARTO 147038004 MAGISTER TEKNIK INFORMATIKA FAKULTAS ILMU

Lebih terperinci

Keoptimalan Naïve Bayes Dalam Klasifikasi

Keoptimalan Naïve Bayes Dalam Klasifikasi Keoptimalan Naïve Bayes Dalam Klasifikasi M. Ammar Shadiq Program Ilmu Komputer FPMIPA Universitas Pendidikan Indonesia ammar.shadiq@gmail.com Abstrak Naïve Bayes adalah salah satu algoritma pembelajaran

Lebih terperinci

( ) ( ) (3) II-1 ( ) ( )

( ) ( ) (3) II-1 ( ) ( ) BAB II LANDASAN TEORI 2.1 Naïve Bayes Classifier 2.1.1 Teorema Bayes Bayes merupakan teknik prediksi berbasis probabilistik sederhana yang berdasar pada penerapan teorema Bayes (atau aturan Bayes) dengan

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu metode penambangan data adalah klasifikasi. Metode klasifikasi memiliki beberapa algoritma dan setiap algoritma klasifikasi pada

Lebih terperinci

BAB I PENDAHULUAN I - 1

BAB I PENDAHULUAN I - 1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Dunia pendidikan merupakan dunia yang memerlukan perhatian khusus karena pendidikan merupakan faktor yang sangat mempengaruhi kualitas para calon penerus bangsa

Lebih terperinci

ii

ii KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun

Lebih terperinci

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE

PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK

Lebih terperinci

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak

PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan merupakan salah satu aspek penting di dalam kehidupan. Oleh karena itu, pendidikan mendapat perhatian besar dalam kehidupan masyarakat dan negara. Pendidikan

Lebih terperinci

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala Metode Klasifikasi (SVM Light dan K-NNK NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech Jurusan Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Alur dan Proses Cleaning Process Dokumen

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

KOMPARASI ALGORITMA KLASIFIKASI DENGAN PENDEKATAN LEVEL DATA UNTUK MENANGANI DATA KELAS TIDAK SEIMBANG

KOMPARASI ALGORITMA KLASIFIKASI DENGAN PENDEKATAN LEVEL DATA UNTUK MENANGANI DATA KELAS TIDAK SEIMBANG KOMPARASI ALGORITMA KLASIFIKASI DENGAN PENDEKATAN LEVEL DATA UNTUK MENANGANI DATA KELAS TIDAK SEIMBANG Ahmad Ilham¹ Program Studi Teknik Informatika Universitas Dian Nuswantoro, Semarang, Jawa Tengah dapurachmadilham@gmail.com

Lebih terperinci

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Tinjauan atau review seseorang yang ditujukan kepada suatu objek atau produk sangat berpengaruh terhadap penilaian publik atas produk tersebut (Sahoo, 2013). Review

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang 1 1.1 Latar Belakang BAB I PENDAHULUAN Dalam Peraturan Menteri Agama Republik Indonesia Nomor 30 Tahun 2014 tentang Biaya Kuliah Tunggal dan Uang Kuliah Tunggal pada Perguruan Tinggi Keagamaan Negeri di

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,

BAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, BAB II TINJAUAN PUSTAKA 2.1 Terdahulu Dalam penelitian ini, peneliti juga menyertakan beberapa uraian singkat mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, klasifikasi, metode

Lebih terperinci

BABI PENDAHULUAN 1.1 Latar Belakang

BABI PENDAHULUAN 1.1 Latar Belakang BABI PENDAHULUAN 1.1 Latar Belakang Tubuh manusia tersusun atas berbagai macam organ vital yang menunjang kehidupan. Salah satu contoh organ vital manusia adalah jantung. Jantung bertugas memompa darah

Lebih terperinci

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK

Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK PERBANDINGAN KLASIFIKASI KNN DAN NAIVE BAYESIAN SERTA PERBANDINGAN CLUSTERING SIMPLE K-MEANS YANG MENGGUNAKAN DISTANCE FUNCTION MANHATTAN DISTANCE DAN EUCLIDIAN DISTANCE PADA DATASET Dresses_Attribute_Sales

Lebih terperinci

KLASIFIKASI PADA TEXT MINING

KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa

Lebih terperinci

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali BAB I PENDAHULUAN 1.1. Latar Belakang Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali objek 3 dimensi. Sistem penglihatan manusia dapat membedakan berbagai macam objek 3 dimensi

Lebih terperinci

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009

Konsep Data Mining. Klasifikasi : Pohon Keputusan. Bertalya Universitas Gunadarma 2009 Konsep Data Mining Klasifikasi : Pohon Keputusan Bertalya Universitas Gunadarma 2009 Definisi Klasifikasi Proses untuk menyatakan suatu objek ke salah satu kategori yg sudah didefinisikan sebelumnya. Proses

Lebih terperinci

Algoritma K-Means Untuk Menangani Data Tidak Seimbang Pada Data Kebakaran Hutan

Algoritma K-Means Untuk Menangani Data Tidak Seimbang Pada Data Kebakaran Hutan 77 Algoritma K-Means Untuk Menangani Data Tidak Seimbang Pada Data Kebakaran Hutan Castaka Agus Sugianto *), Tri Herdiawan Apandi **) Teknik Informatika, Politeknik TEDC Bandung E-mail: * castaka@poltektedc.ac.id,

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Selain sebagai media komunikasi, Twitter memberikan akses bagi pihak ketiga yang ingin mengembangkan aplikasi yang memanfaatkan layanannya melalui Twitter API. Salah

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI

PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI PENERAPAN ALGORITMA NAÏVE BAYES UNTUK DETEKSI BAKTERI E-COLI Laily Hermawanti Program Studi Teknik informatika Fakultas Teknik Universitas Sultan Fatah (UNISFAT) Jl. Diponegoro 1B Jogoloyo Demak Telpon

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Tuntutan belajar bagi peserta didik tidak hanya menuntut kemampuan akedemik (hard skill), peserta didik juga dituntut untuk dapat meningkatkan kemampuan personalnya

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perkembangan teknologi yang pesat mempermudah akses terhadap informasi tekstual yang sangat besar jumlahnya, baik yang terdapat pada Internet maupun pada koleksi dokumen

Lebih terperinci

THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD

THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD THE APPLICATION OF DATA MINING FOR OLD STUDENT TO PREDICTION STUDIES USING NAIVE BAYES AND ADABOOST METHOD 1 JACOB SOARES, 2 ALBERTUS JOKO SANTOSO, 3 SUYOTO 1, 2, 3 Universitas Atma Jaya Yogyakarta E-mail:

Lebih terperinci

CONTOH KASUS DATA MINING

CONTOH KASUS DATA MINING CONTOH KASUS DATA MINING CONTOH KASUS DATA MINING Sebuah rumah sakit ingin ingin menekan biaya perawatan pasien tanpa mengurangi kualitas pelayanan. Salahsatu potensi yang dapat dimanfaatkan pada penerapan

Lebih terperinci

Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan

Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan Penerapan Teknik Support Vector Machine untuk Pendeteksian Intrusi pada Jaringan LAPORAN TUGAS AKHIR Disusun sebagai syarat kelulusan tingkat sarjana oleh : Krisantus Sembiring / 13503121 PROGRAM STUDI

Lebih terperinci

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah BAB III METODOLOGI Dalam penelitian ini metodologi memegang peranan penting guna mendapatkan data yang obyektik, valid dan selanjutnya digunakan untuk memecahkan permasalahan yang telah dirumuskan. Maka

Lebih terperinci

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah

UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah 1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja

Lebih terperinci

CHURN PREDICTION PELANGGAN MENGGUNAKAN CRISP-DM (Studi Kasus Pelanggan TelkomFlexi Bandung)

CHURN PREDICTION PELANGGAN MENGGUNAKAN CRISP-DM (Studi Kasus Pelanggan TelkomFlexi Bandung) CHURN PREDICTION PELANGGAN MENGGUNAKAN CRISP-DM (Studi Kasus Pelanggan TelkomFlexi Bandung) Customer Churn Prediction Using CRISP DM (Case Study : Customer of TelkomFlexi Bandung) Yance Sonatha Jurusan

Lebih terperinci