BAB II LANDASAN TEORI

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II LANDASAN TEORI"

Transkripsi

1 BAB II LANDASAN TEORI 2.1 Data Mining Data mining mengacu pada proses ekstraksi atau menggali pengetahuan dari sekumpulan data yang besar. Data mining mempunyai nama lain yang dikenal secara popular dengan sebutan Knowledge Discovery from Data (KDD). Proses Knowledge Discovery adalah sebagai berikut (Han,2006,pp 5-7) : 1. Data Cleaning Berguna untuk menghilangkan noise dan data yang tidak konsisten 2. Data Integration Dimana data yang berasal dari sumber data yang lebih dari satu dapat dikombinasikan. 3. Data Selection Dimana data relevan terhadap tugas analisa yang didapat dari database. 4. Data Transformation Dimana data diubah atau dikonsolidasi menjadi bentuk yang tepat untuk dilakukan mining dengan kesimpulan dan operasi aggregasi. 6

2 7 5. Data Mining Proses dimana metode intelligent di terapkan untuk melakukan ekstraksi terhadap pola data. 6. Pattern Evaluation Melakukan identifikasi terhadap pola data yang merepresentasikan knowledge base didalam suatu ukuran. 7. Knowledge Presentation Dimana visualisasi dan teknik representasi dari sebuah knowledge digunakan untuk knowledge dari user dimasa sekarang. 2.2 Proses Data Mining CRISP- DM Model Cross- Industry Standard Process for Data Mining (CRISP-DM) banyak digunakan di berbagai industry (Olson,2008,pp 9-18). Model ini terdiri dari 6 tahap proses : Gambar 2.1 Proses CRISP DM (Olson,2008,pp 10)

3 8 1. Business Understanding Pada tahap ini pemahaman bisnis meliputi penentuan tujuan bisnis, menilai situasi saat ini, menetapkan tujuan dari data mining, dan mengembangkan rencana proyek. 2. Data understanding Setelah tujuan bisnis dan rencana proyek dibuat, tahap ini akan mempertimbangkan tentangkebutuhan data. Langkah ini dapat mencakup pengumpulan awal data, deskripsi data, eksplorasi data, dan verifikasi dari kualitas data.data eksplorasi seperti melihat ringkasan statistik dapat terjadi pada akhir fase ini. Model analisis cluster dapat diterapkan selama tahap ini, dengan maksud mengidentifikasi pola-pola dalam data. 3. Data preparation Setelah sumber data yang tersedia diidentifikasi, data harus dipilih, dibersihkan, dibangun ke dalam bentuk yang diinginkan, dan di beri format.pembersihan data (Data Cleaning) dan transformasi data dalam persiapan data pemodelan terjadi pada fase ini.data eksplorasi pada kedalaman yang lebih besar dapat diterapkan selama fase ini, dan model tambahan digunakan, untuk menyediakan kesempatan untuk melihat pola yang didasarkan pada pemahaman bisnis. 4. Modeling Tools untuk data miningseperti visualisasi (plotting data dan membangun hubungan) dan analisis cluster (untuk melakukan identifikasi variabel-

4 9 variabelyang berjalan dengan baik bersama-sama) yang berguna untuk analisisawal. Tools seperti induksi aturan umum dapat mengembangkan aturan asosiasi awal.setelah pengertian tentang data didapatkan (seringkali melalui pattern recognition yang dapat dilihat berdasarkan output dari model), model lebih rinci sesuai dengan tipe data dapat diterapkan. Pembagian data menjadi training set dan test set juga dibutuhkan untuk pemodelan. 5. Evaluation Hasil dari model harus dievaluasi dalam konteks sasaran bisnisyang telah didirikan pada tahap pertama (Business Understanding). Hal ini akan mengarah pada identifikasi kebutuhan lainnya (terkadang melalui pattern recognition), atau kepada fase sebelumnya CRISP-DM. Mendapatkan pemahaman akan bisnis merupakan prosedur iterasi dalam data mining, di mana hasil dari berbagai visualisasi, statistik, dan alat kecerdasan buatan menunjukkan hubungan pengguna baru yang memberikan pemahaman yang lebih dalam operasi suatu organisasi. 6. Deployment Data mining dapat digunakan untuk melakukan verifikasi yang dihasilkan dari hipotesis, atau untuk knowledge discovery (identifikasi tak terduga dan hubungan yang bermanfaat). Melalui knowledge discovery difase awal dari proses CRISP-DM, model dapat diperoleh yang kemudian dapat diterapkan pada operasi bisnis untuk berbagai tujuan, termasuk prediksi atau identifikasi situasi kunci. Model ini perlu dipantau untuk perubahan kondisi dari sebuah

5 10 operasi, karena apa mungkin benar hari ini mungkin tidak benar ditahun berikutnya. Bila perubahan signifikan memang terjadi, model harus diulang. 2.3 Strategi Data Mining Supervised Learning Supervised Learning membangun sebuah model dengan menggunakan sebuah variabel, Langkah pertama sebuah algoritma akan menyediakan sebuah training set data dimana mencakup nilai-nilai sebelum diklasifikasikan dari variabel target selain prediktor. Langkah kedua yaitu untuk menguji bagaimana model data mining sementara pada tes data set. Dalam melakukan tes set, ketidaksepakatan data set, nilai-nilai sementara variabel target yang tersembunyi dari model sementara, kemudian melakukan klasifikasi menurut pola dan struktur itu kemudian dipelajari dari pelatihan yang ditetapkan.manfaat dari klasifikasi kemudian dievaluasi dengan membandingkan terhadap nilai-nilai sebenarnya dari variabel target sementara model data mining kemudian disesuaikan untuk meminimalkan tingkat kesalahan pada tes ditetapkan.(larose, 2005, pp 91-92). Beberapa metode supervised yaitu decision trees, neural network, danknearestneighbors.

6 Unsupervised Learning Dalam metode unsupervised learning, tidak ada variabel target yang di identifikasi dengan demikian. Sebaliknya, algoritma pencarian data mining untuk pola dan struktur di antara semua variabel. Metode unsupervisedadalah clustering. 2.4 Klasifikasi dan Prediksi Klasifikasi adalah sebuah proses untuk mencari model atau fungsi yang menjelaskan dan membedakan kelas atau konsep dari data, dengan tujuan untuk menggunakan model dan melakukan prediksi dari kelas suatu objek dimana tidak diketahui label dari kelas tersebut. Model yang ada berasal dari analisis dari kumpulan training data (objek data dimana kelas dari label diketahui) (Han,2006,pp 24-26) Derived model dapat direpresentasikan di berbagai macam bentuk, seperti aturan klasifikasi (IF-THEN),decision trees, mathematical formula, atau neural network. Decision tree adalah seperti flow chart tree structure, dimana setiap node test dari nilai atribut, setiap cabang merepresentasikan output dari test dan daun pohon merepresentasikan kelas atau distribusi dari kelas.neural network, ketika digunakan untuk klasifikasi adalah sebuah koleksi dari neuron like processing unit dengan weighted connections diantara unit. Banyak metode untuk melakukan konstruksi terhadap model klasifikasi, seperti naïve Bayesian classification, support vector machine, dan k-nearest neighbor classification.

7 Feature Selection Pengertian feature selection menurut (Martin Seweel,2007) adalah sebuah proses yang bisaa digunakan pada machine learning dimana sekumpulan dari features yang dimiliki data digunakan untuk pembelajaran algoritma. Subset yang baik memiliki sedikitnya dimensi angka yang paling banyak berkontribusi untuk akurasi dan nantinya akan dibuangnya sisa dari dimensi yang tidak berkepentingan. Ini merupakan langkah penting dalam tahap preprocessing dan salah satu cara untuk menghindari curse of dimentionality. Forward selection dimulai tanpa variabel dan menambahkan mereka satu persatu, pada setiap langkah ditambahkan variabel yang menurunkan error paling banyak, sampai semua error dihilangkan. Backward selection dimulai dengan semua variabel dan membuangnya satu persatu, pada setiap langkah membuang variabel yang membuang error paling banyak sampai semua error dihilangkan. Untuk menghilangkan overfitting, kesalahan yang disebutkan diatas adalah kesalahan pada validasi yang berbeda dari training set Variance of Variable Subset Selection Menurut (Isabelle Guyon dan Andree elisseff,2003) banyak metode dari variable subset selection sensitif terhadap gangguan kecil saat dilakukan percobaan. Jika terdapat variable yang bersifat redundan, himpunan bagian yang berbeda dari variable dengan prediksi yang identic dapat diperoleh sesuai dengan kondisi awal dari algoritma atau tambahan dari beberapa variable atau contoh

8 13 training. Untuk sebagian aplikasi, seseorang bertujuan menghasilkan subset yang dpat disajikan pada tahap proses berikutnya tetapi terkadang masih terdapat varian yang tidak diinginkan karena varian memiliki model yang buruk yang tidak tergeneralisasi dengan baik, hasil tidak dapat diproduksi kembali, dan subset tersebut gagal untuk mengambarkan keseluruhan gambaran. Salah satu metode untuk melakukan stabilisasi dengan menggunakan beberapa bootstraps. Proses variable selection dilakukan berulang dengan sub sample dari training data. Gabungan subset yang terdiri dari beberapa variable di bootstrap yang berbagai macan diambil sebagai subset yang stabil Supervised Feature Selection Ulasan tentang 3 pendekatan untuk memilih features dimana features harus dibedakan dari variabel karena keduanya muncul bersamaan disistem yang sama (Isabelle Guyon dan Andree elisseff,2003) : 1. Nested subset methods. Sejumlah extract features dari learning machines sebagai bagian dari proses pembelajaran. Hal ini termasuk neural network dimana internal nodes nya merupakan feature extractors. 2. Filters Torkkola (2003) mengajukan metode filter untuk menbangun features menggunakan mutual information criterion. Penulis memaksimalkan untuk feature vectors pada dimensi m dan target

9 14 vektor y. Melakukan modeling pada fungsi kepadatan fitur dengan Parzen windows memperbolehkan komputasi derivatif yang dimana bersifat transform independent.. Kemudian digabungkan dengan transform-dependent derivatives, dibuat algoritma gradient keturunan untuk melakukan optimasi parameter w dari transform 3. Direct objective optimization Metode kernel memiliki fitur ruang implisit yang diungkapkan oleh : adalah feature vector yang terbatas dimensi. Memilih fitur yang implisit dapat meningkatkan generalisasi, tetapi tidak mengubah waktu yang berjalan.didalam kasus ini. Weston et al (2003) mengusulkan metode untuk memilih kernel feature secara implisit dengan polynomial kernal, menggunakan kerangka dari minimisasi L0-norm Support Vector Machine Menurut (Habib,2008) Support Vector Machines adalah sebuah metode baru yang menjanjikan untuk klasifikasi baik data linier dan nonlinier. Dalam Singkatnya, Support Vector Machine (atau SVM) adalah algoritma yang bekerja sebagai berikut. Menggunakan pemetaan nonlinier untuk mengubah training data ke dimensi yang lebih tinggi. Dalam dimensi baru ini akan dicari sebuah optimal

10 15 linear yang memisahkan hyperplane (yaitu, sebuah "batas keputusan" memisahkan tuple dari satu kelas dari yang lain). Dengan pemetaan nonlinier yang sesuai ke dimensi cukup tinggi, data dari dua kelas selalu dapat dipisahkan dengan sebuah hyperplane.support Vector Machine menemukan bahwa hyperplane tersebut menggunakan dukungan vektor ("penting" pelatihan tupel) dan margin (didefinisikan oleh vektor dukungan) Support Vector MachineFor Pattern Recognition Menurut (Madzarov,et.al,2009,pp ) Support Vector Machine merupakan metode klasifikasi biner yang dikembangkan oleh Vapnik dan rekan- rekan di laboratorium Bell (Vladimir,1998) (Burges,1998). Untuk masalah biner, kami memiliki pelatihan titik data: {xi, yi}, i= 1,..., l,yi={-1, 1}, xi,rd. Misalkan kita memiliki beberapa hyperplane yang memisahkan positif dari contoh contoh negatif (a "memisahkan hyperplane"). Titik-titik x yang terdapat di hyperplane menunjukann wx+b=0, dimana w adalah keadaan normal untuk hyperplane itu, b / w adalah jarak tegak lurus dari hyperplane ke asal, dan w adalah bentuk Euclidean dari w. Diandaikan d+( (d-) menjadi jarak terpendek dari hyperplane yang memisahkan ke contoh positif (negatif) terdekat. misalnya. Didefinisikan terpisah, algoritma dukungan vektor hanya "margin" dari hyperplane yang terpisah menjadi d++d-. Untuk kasus linear terlihat memisahkan hyperplane dengan margin terbesar. Hal ini dapat dirumuskan sebagai berikut: dianggap bahwa semua data pelatihan memenuhi batasan sebagai berikut:

11 16 Hal ini dapatdigabungkan menjadi satusetdari pertidaksamaan: Perhatikan titik-titik kesetaraan dalam Persamaan. (1) holds (membutuhkan adanya poin a) adalah setara dengan memilih skala untuk w dan b. Titik-titik yang terdapat di hyperplane H1: xi w + b = 1 dengan w normal dan jarak tegak lurus dari titik asal 1-b / w. Demikian pula, poin yang setara dalam Persamaan. (2)holds terdapatt di H2 hyperplane: b w xi + = -1, denganw normal dan jarak tegak lurus dari asal -1-b / w. Oleh karena itu d + = d-= 1 / w dan margin adalah hanya 2 / w. Gambar 2.2 Linear separating hyperplane untuk kasus yang terpisah.(madzarov,,et.al,2009,pp 234) Support Vector dilingkari. Perhatikan bahwa H1 dan H2 sejajar (mereka memiliki keadaan yang sama normal) dan bahwa tidak ada titik pelatihan jatuh di antara mereka. Dengan demikian kita dapat menemukan sepasang hyperplanes yang memberikan margin maksimal dengan meminimalkan w 2.

12 Teknik Multiclass Support Vector Machine One-against-all (OvA) Menurut (Habib,2008) Untuk masalah N-kelas (N>2), N two-class SVM Classifiers dibangun (Vladimir,1999). SVM dilatih ketika proses labeling sampel didalam contoh kelas positif dan sisanya contoh kelas negatif.dalam fase pengakuan, contoh uji disajikan kepada semua NSVMs dan diberi label menurut output maksimum antara pengklasifikasin. Kerugian dari metode ini adalah kompleksitas pelatihan, jumlah pelatihan sample tergolong besar. Setiap pengklasifikasi N dilatih menggunakan semua sampel yang tersedia One-against-one (OvO) Algoritma ini membangun N (N-1) / 2 two-class classifiers, menggunakan semua pasangan- kombinasi binary pair-wise dari kelas N. Setiap classifier dilatih dengan menggunakan sampelkelas pertama sebagai contoh positif dan sampelkelas dua sebagai contoh negatif. Untuk menggabungkan penggolong, algoritma Max Wins digunakan. Ditemukan kelas yang dihasilkan dengan memilih kelas dipilih oleh mayoritas pengklasifikasi (Friedman,1997). Jumlah sample digunakan untuk pelatihan masing-masing dari pengklasifikasi 0v0 adalah lebih kecil, karena sampel hanya dari dua dari semua kelas N diambil dengan pertimbangan. Jumlah sampel yang lebih rendah menyebabkan non linieritas yang kecil, sehingga waktu pelatihan lebih singkat.kerugian dari metode ini adalah bahwa setiap tes sampel harus disampaikan kepada sejumlah besar penggolong N

13 18 (N-1) / 2.Hal ini mengakibatkan pengujian lebih lambat, terutama ketika jumlah kelas dalam masalah besar (Xu,2003,pp ). 2.5Confusion Matrix Menurut (Neila et al, 2012) metode klasifikasi akan dilakukan evaluasi terutama pada bagian akurasi dari hasil klasifikasi. Akurasi sebuah klasifikasi berpengaruh terhadap performa dari suatu klasifikasi.untuk melakukan analisa dapat digunakan confusion matrix yaitu sebuah matrik dari prediksi yang akan dibandingkan dengan kelas yang asli dari data inputan. Sebagai contoh, sebuah test (i,j) dari sebuah confusion matrix adalah persentase dari waktu dari sebuah classifier yang melakukan identifikasi input I sebagai pattern dari kelas j. Setiap kolom dari matriks berkorespondensi kepada classifier output dan setiap baris pada input. Akurasi sebuah klasifikasi dimana i=j menerangkan akurasi dari klasifikasi pada setiap kelas. 2.6Telemarketing Menurut (Mehrotra, A., & Agarwal, R.,2009) telemarketing merupakan proses interaktif antara perusahaan dan pelanggannya menggunakan media sistem yang komprehensif untuk mendapatkan respon dari pelanggan. Hal tersebut merupakan seni dan ilmu dari mendapatkan penawaran yang tepat, pelanggan yang tepat diwaktu yang tepat untuk memenuhi kebutuhan pelanggan akan produk dan servis.telemerketing banyak digunakan di banyak industri termasuk perusahaan telekomunikasi, perbankan, asuransi, dan lainnya. Telemarketing merupakan metode yang lebih dominan dari direct marketing yang digunakan oleh banyak perusahaan untuk mendapatkan pelanggan dengan cara melakukan

14 19 hubungan antar pelanggan dan sales person yang terbentuk melalui percakapan telepon. Terdapat 2 macam tipe dari telemarketing yaitu inbound dan outbound. Inbound marketing adalah ketika pelanggan dihubungi oleh perusahaan melalui telepon dengan tujuan mengadukan komplain, mendapatkan informasi dan lainnya. Sedangkan outbound telemarketing adalah ketika perusahaan menghubungi pelanggan untuk menjual produk, melihat riset pasar dan lain lain.telepon merupakan medium paling ideal untuk bangunan dan menjaga hubungan yang dekat dengan pelanggan.telemarketing yang efektif membutuhkan kualitas data pelanggan yang bagus, kemampuan pengelompokan, dan hasil yang bisa dijelaskan untuk strategi dan melakukan percobaan. Teknologi seperti data mining banyak digunakan oleh perusahaan untuk lebih mengerti pelanggannya lebih baik dan melayani lebih baik.

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI Dalam bab ini dibahas teori yang digunakan sebagai landasan pengerjaan Support Vector Backpropagation. Pembahasan bertujuan untuk menguraikan teori dan algoritma yang digunakan dalam

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali

BAB I PENDAHULUAN. Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali BAB I PENDAHULUAN 1.1. Latar Belakang Sistem penglihatan manusia memiliki akurasi yang besar dalam mengenali objek 3 dimensi. Sistem penglihatan manusia dapat membedakan berbagai macam objek 3 dimensi

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Seiring berkembangnya teknologi informasi, kebutuhan akan informasi yang digunakan untuk mendukung business intelligent suatu perusahaan juga meningkat. Informasi penting

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM)

KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) KLASIFIKASI WILAYAH DESA-PERDESAAN DAN DESA-PERKOTAAN WILAYAH KABUPATEN SEMARANG DENGAN SUPPORT VECTOR MACHINE (SVM) SKRIPSI Disusun Oleh : MEKAR SEKAR SARI NIM. 24010210120008 JURUSAN STATISTIKA FAKULTAS

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

Tahapan Proses KDD (Peter Cabena)

Tahapan Proses KDD (Peter Cabena) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (Business

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas 1. Memahami cakupan materi dan sistem perkuliahan Data Mining.

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE

PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE Eka Listiana 1*, Much Aziz Muslim 1 1 Program Studi Teknik Informatika, Fakultas

Lebih terperinci

SVM untuk Regresi. Machine Learning

SVM untuk Regresi. Machine Learning MMA10991 Topik Khusus - Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

BAB III ANALISIS DAN PENYELESAIAN MASALAH

BAB III ANALISIS DAN PENYELESAIAN MASALAH BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan

Lebih terperinci

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Memahami definisi, proses serta teknik data mining. Pengenalan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Tinjauan Studi In-Ju Kim, seorang Asisten professor program studi terapan ilmu medis Universitas Dammam, Saudi Arabia pada penelitiannya tahun 2015 yang berjudul Knowledge Gaps

Lebih terperinci

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (

Lebih terperinci

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO Wahyu Nurjaya WK 1, Yusrina Adani 2 Program Studi Sistem Informasi, STMIK LPKIA Bandung Program

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING BAB IV GAMBARAN UMUM METODOLOGI DATA MINING A. Metodologi Data Mining Metodologi Data Mining Komponen data mining pada proses KDD seringkali merupakan aplikasi iteratif yang berulang dari metodologi data

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A11.2011.06038 Kel : A11.4812 CRISP-DM CRISP - DM adalah metodologi data mining komprehensif dan Model proses untuk

Lebih terperinci

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala

Metode Klasifikasi (SVM Light dan K-NNK. NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech. Jurusan Informatika FMIPA Universitas Syiah Kuala Metode Klasifikasi (SVM Light dan K-NNK NN) Dr. Taufik Fuadi Abidin, S.Si., M.Tech Jurusan Informatika FMIPA Universitas Syiah Kuala www.informatika.unsyiah.ac.id/tfa Alur dan Proses Cleaning Process Dokumen

Lebih terperinci

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat

BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini

Lebih terperinci

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

SILABUS MATAKULIAH. Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran SILABUS MATAKULIAH Revisi : - Tanggal Berlaku : Maret 2015 A. Identitas 1. Nama Matakuliah : A11.54606 / Data 2. Program Studi : Teknik Informatika-S1 3. Fakultas : Ilmu Komputer 4. Bobot sks : 3 SKS 5.

Lebih terperinci

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG

PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA DATA AKREDITASI SEKOLAH DASAR (SD) DI KABUPATEN MAGELANG ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 3, Nomor 4, Tahun 2014, Halaman 811-820 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PENERAPAN METODE KLASIFIKASI SUPPORT VECTOR MACHINE (SVM) PADA

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

BAB I PENDAHULUAN 1-1

BAB I PENDAHULUAN 1-1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi dan komputer akhir-akhir ini mengalami perkembangan yang sangat pesat tidak terkecuali pada aplikasi-aplikasi database. Di

Lebih terperinci

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 2 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Mengapa Data Mining? Penumpukan data Minimnya pemanfaatan data

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI BAB III LANDASAN TEORI 3.1. Citra Digital Citra digital adalah suatu citra elektronik yang diambil dari dokumen, seperti foto, buku, maupun sebuah video. Proses perubahan citra analog menjadi citra digital

Lebih terperinci

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma.

BAB II DASAR TEORI. Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. BAB II DASAR TEORI Pada bab ini akan dibahas teori-teori pendukung yang digunakan sebagai acuan dalam merancang algoritma. 2.1. Microsoft Visual Studio Microsoft Visual Studio adalah sebuah software yang

Lebih terperinci

MODUL 12 Model Prediktif

MODUL 12 Model Prediktif MODUL 12 Model Prediktif Prediktif Analytics adalah teknologi yang menangkap proses data mining dalam rutinitas sederhana. Kadang-kadang disebut "one-click data mining," Model ini menyederhanakan dan mengotomatisasi

Lebih terperinci

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA

PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA PERBANDINGAN ANALISIS KLASIFIKASI ANTARA DECISION TREE DAN SUPPORT VECTOR MACHINE MULTICLASS UNTUK PENENTUAN JURUSAN PADA SISWA SMA (Studi Kasus Nilai Mata Pelajaran Pokok di SMA Negeri 1 Jepara) SKRIPSI

Lebih terperinci

SUPPORT VECTOR MACHINE (SVM)

SUPPORT VECTOR MACHINE (SVM) MAKALAH DATA MINING SUPPORT VECTOR MACHINE (SVM) Di Susun Oleh : Nama : RA. Toyyibatul Faihah NRP : 07.04.111.00132 JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS TRUNOJOYO 2010 1 PENDAHULUAN 1.1

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : E124909 / Data Mining Revisi ke : 4 Satuan Kredit Semester : 2 SKS Teori Tgl revisi : 16 Juli 2015 Jml Jam kuliah dalam seminggu

Lebih terperinci

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009 Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah salah satu teknik dan proses untuk menemukan suatu pola dan pengetahuan dari data yang berjumlah besar (Han dkk., 2011). Proses yang dilakukan

Lebih terperinci

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami pemrosesan awal data yang akan diproses

Lebih terperinci

BAB 3 LANDASAN TEORI

BAB 3 LANDASAN TEORI BAB 3 LANDASAN TEORI 3.1. Data Mining Data mining adalah proses menganalisa data dari perspektif yang berbeda dan menyimpulkannya menjadi informasi-informasi penting yang dapat dipakai untuk meningkatkan

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI 2.1 Studi Literatur BAB II LANDASAN TEORI Penelitian yang berkaitan dengan klasifikasi kalimat tanya berdasarkan Taksonomi Bloom telah dilakukan oleh Selvia Ferdiana Kusuma dengan menggunakan algoritma

Lebih terperinci

Moch. Ali Machmudi 1) 1) Stmik Bina Patria

Moch. Ali Machmudi 1) 1) Stmik Bina Patria UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama

Lebih terperinci

BAB II KAJIANPUSTAKA

BAB II KAJIANPUSTAKA BAB II KAJIANPUSTAKA 2.1 Klasifikasi Klasifikasi adalah proses pengelompokan data menjadi suatu kelas berdasarkan kesamaan karakteristik pada data data yang ada. Ada 2 jenis metode yang dapat digunakan

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

1. Pendahuluan. 1.1 Latar Belakang

1. Pendahuluan. 1.1 Latar Belakang 1. Pendahuluan 1.1 Latar Belakang Persaingan dalam dunia bisnis, terlebih lagi bagi perusahaan besar, tidak lepas dari adanya proses jual beli saham. Saham secara umum merupakan surat berharga yang dapat

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal

Lebih terperinci

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR

KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR Dewi Pramudi Ismi 1), Ardiansyah 2) 1 Program Studi Teknik Informatika, Fakultas Teknologi Industri,

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan penelitian tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat

Lebih terperinci

SILABUS MATAKULIAH. Revisi : 4 Tanggal Berlaku : 04 September Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran

SILABUS MATAKULIAH. Revisi : 4 Tanggal Berlaku : 04 September Indikator Pokok Bahasan/Materi Aktifitas Pembelajaran SILABUS MATAKULIAH Revisi : 4 Tanggal Berlaku : 04 September 2015 A. Identitas 1. Nama Matakuliah : Data 2. Program Studi : Teknik Industri 3. Fakultas : Teknik 4. Bobot sks : 2 SKS 5. Elemen : MKB 6.

Lebih terperinci

Support Vector Machine

Support Vector Machine MMA10991 Topik Khusus Machine Learning Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439, Fax. +62-21-7863439,

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA. menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan machinelearning

BAB 2 TINJAUAN PUSTAKA. menggunakan teknik statistik, matematika, kecerdasan buatan, tiruan dan machinelearning BAB 2 TINJAUAN PUSTAKA 2.1. Data Mining Data mining adalah kombinasi secara logis antara pengetahuan data, dan analisa statistik yang dikembangkan dalam pengetahuan bisnis atau suatu proses yang menggunakan

Lebih terperinci

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine

BAB III METODOLOGI. Support Vector Machines (SVM) merupakan salah satu metode machine BAB III METODOLOGI 3.1 Hipotesis Support Vector Machines (SVM) merupakan salah satu metode machine learning yang dapat melakukan klasifikasi data dengan sangat baik. Metode ini bertujuan untuk mendapatkan

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

Model Linear untuk Klasifikasi

Model Linear untuk Klasifikasi MMA10991 Topik Khusus - Machine Learning Model Linear untuk Klasifikasi Dr. rer. nat. Hendri Murfi Intelligent Data Analysis (IDA) Group Departemen Matematika, Universitas Indonesia Depok 16424 Telp. +62-21-7862719/7863439,

Lebih terperinci

STUDI KOMPARASI METODE KLASIFIKASI DUA KELAS

STUDI KOMPARASI METODE KLASIFIKASI DUA KELAS Program Studi MMT-ITS, Surabaya Pebruari 007 STUDI KOMPARASI METODE KLASIFIKASI DUA KELAS Budi Santosa dan Devi Rosita Hanum Teknik Industri Institut Teknologi Sepuluh Nopember Email: budi_s@ie.its.ac.id,

Lebih terperinci

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN MUTU PERGURUAN TINGGI Timor

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

Pengantar Support Vector Machine

Pengantar Support Vector Machine Pengantar Support Vector Machine Anto Satriyo Nugroho February 8, 2007 1 Pengantar Pattern Recognition (PR) didefinisikan sebagai proses pemetaan suatu data ke dalam konsep tertentu yang telah didefinisikan

Lebih terperinci

2. Data & Proses Datamining

2. Data & Proses Datamining 2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Pasar modal merupakan salah satu bagian dari pasar keuangan, di samping pasar uang, yang sangat penting peranannya bagi pembangunan nasional pada umumnya dan bagi

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS)

RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) RENCANA PROGRAM KEGIATAN PERKULIAHAN SEMESTER (RPKPS) Kode / Nama Mata Kuliah : A11.54606 / Data Mining Revisi ke : - Satuan Kredit Semester : 3 SKS Teori Tgl revisi : - Jml Jam kuliah dalam seminggu :

Lebih terperinci

PE DAHULUA. Latar Belakang

PE DAHULUA. Latar Belakang Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

Peningkatan Akurasi pada Algoritma Support Vector Machine dengan Penerapan Information Gain untuk Mendiagnosa Chronic Kidney Disease

Peningkatan Akurasi pada Algoritma Support Vector Machine dengan Penerapan Information Gain untuk Mendiagnosa Chronic Kidney Disease Peningkatan Akurasi pada Algoritma Support Vector Machine dengan Penerapan Information Gain untuk Mendiagnosa Chronic Kidney Disease Kiki Prima Wijaya 1, Much Aziz Muslim 2 12 Jurusan Ilmu Komputer, FMIPA,

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Kredit merupakan salah satu bentuk usaha sekunder yang dapat dilakukan untuk pemenuhan kebutuhan sehari-hari. Pada umumya, proses kredit dapat dilayani melalui lembaga

Lebih terperinci

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN)

SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) SISTEM KLASIFIKASI PENYAKIT DIABETES MELLITUS MENGGUNAKAN METODE K-NEAREST NEIGHBOR (K-NN) Fitri Yunita Fakultas Teknik dan Ilmu Komputer, Universitas Islam Indragiri Email:Fitriyun@gmail.com Abstrak Diabetes

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE

KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE Warih Maharani Fakultas

Lebih terperinci

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ

ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ ANALISA DATA MINING MENGGUNAKAN METODE CRISP - DM TERHADAP TRANSAKSI PEMBELIAN ASURANSI PADA BANK XYZ Laporan Tugas Akhir Diajukan Untuk Melengkapi Salah Satu Syarat Memperoleh Gelar Sarjana Komputer O

Lebih terperinci

BAB 1 PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1-1 BAB 1 PENDAHULUAN Bab ini menguraikan penjelasan umum mengenai tugas akhir yang dikerjakan. Penjelasan tersebut meliputi latar belakang masalah, tujuan tugas akhir, lingkup tugas akhir, metodologi yang

Lebih terperinci

Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan

Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan Terdapat banyak jenis pola: Pola visual Pola temporal Pola logikal Tidak ada tepat satu teori untuk menyelesaikan problem pengenalan pola Terdapat model standar yang dapat dijadikan teori acuan Statistik

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Meningkatnya perkembangan teknologi juga diikuti dengan berkembangnya penggunaan berbagai situs jejaring sosial. Salah satu jejaring sosial yang sangat marak digunakan

Lebih terperinci