BAB II LANDASAN TEORI

Ukuran: px
Mulai penontonan dengan halaman:

Download "BAB II LANDASAN TEORI"

Transkripsi

1 6 BAB II LANDASAN TEORI 2.1 Data Mining Pengertian Data Mining Secara singkat, data mining berarti menggali atau menemukan informasi dari sejumlah besar data (Han & Kamber, 2006). Dan secara luasnya, data mining adalah proses menemukan interesting knowledge dari sejumlah besar data yang tersimpan dalam database, data warehouse, atau media penyimpanan lainnya (Han & Kamber, 2006). Sedangkan berdasarkan Gartner Group (Larose, 2005), data mining adalah sebuah proses untuk menemukan hubungan, pola, dan tren dengan memilah-milah sejumlah besar data yang tersimpan dalam media penyimpanan, menggunakan teknologi pengenalan pola serta statistika dan matematika. Dengan berdasarkan pengertian diatas, maka dapat dikatakan jika data mining adalah sebuah proses mencari informasi dari data yang berjumlah besar dan tersimpan dalam media penyimpanan. Data mining bisa tercipta dikarenakan adanya keinginan untuk mencari pengetahuan atau informasi dari data yang tersimpan dalam jumlah yang banyak. Selain hal tersebut, dalam penerapannya terdapat beberapa faktor yang mendukung pengembangan data mining, yaitu: - Pertumbuhan yang besar pada data

2 7 Data mining, dalam penerapannya akan mengakses file yang besar. Hal ini dikarenakan hasil dari data mining akan menjadi dasar dalam pengambilan keputusan untuk melakukan tindakan tertentu, sehingga tingkat kebeneran informasi yang dihasilkan sangat diperlukan.untuk mencapai tingkat kebenaran informasi yang tinggi, maka diperlukan data yang sangat besar untuk diolah. Seiring dengan perkembangan media penyimpanan, maka perkembangan jumlah data yang disimpan bergerak naik sangat cepat. Akan tetapi, jika terjadinya minim pengetahuan untuk mengolah data tersebut maka akan tercipta kondisi data rich but information poor (Han & Kamber, 2006), dimana tidak diketahuinya informasi dari data yang tersimpan tersebut. - Pertumbuhan yang luar biasa dalam daya komputasi dan kapasitas penyimpanan oleh perangkat keras Penerapan data mining pada dasarnya akan membutuhkan kebutuhan sumber daya dan kemampuan komputasi yang sangat besar. Dengan perkembangan teknologi yang terjadi, mengakibatkan perkembangan yang sangat pesat bagi kemampuan komputasi dan kapasitas penyimpanan oleh perangkat keras. Sehingga dengan ketersediaan perangkat yang memiliki kemampuan tersebut, dapat menjadikan proses data mining menjadi cukup layak untuk dilakukan secara komersial. - Peningkatan persaingan untuk meningkatkan pasar dalam ekonomi global

3 8 Seiring dengan persaingan bisnis yang semakin ketat, maka akan mendorong setiap perusahaan untuk selalu dapat berinovasi dan memberikan pelayanan-pelayanan atau promosi agar dapat bersaing dengan perusahaan lain. Data mining dalam peranannya dapat memberikan pengolahan informasi yang dapat menjadi pertimbangan bagi perusahaan dalam melakukan sebuah tindakan, seperti dalam memilih promosi, produk, dan pelayanan yang akan dipasarkan. - Peningkatan terhadap akses ke data dengan melalui navigasi Web atau intranet Perkembangan teknologi jaringan sampai sekarang, mengakibatkan kemudahan akses oleh data baik itu melalui jaringan internet atau intranet. Dengan kemudahan akses tersebut, maka mengakibatkan data transaksi mengenai akses data yang sangat besar. Sehingga dengan data mining, diharapkan dapat membantu dalam mengolah data transaksi tersebut agar dapat menjadi informasi yang berguna bagi perusahaan. - Pengembangan terhadap perangkat lunak untuk data mining Seiring dengan perkembangan dan kebutuhan akan data mining, mengakibatkan pertumbuhan perangkat lunak yang dapat mendukung data mining tersebut. Perangkat lunak yang dapat membantu dalam data mining, antara lain Orange, RapidMiner, Weka, JhepWork, KNIME, dan lain sebagainya. Dimana pada masing-masing perangkat lunak memiliki perbedaan masing-masing seperti bahasa pemrograman yang digunakan, bentuk tampilan, dan lain sebagainya.

4 9 Dalam penerapannya, data mining dapat diterapkan dalam berbagai penyimpanan data (Han & Kamber, 2006). Media penyimpanan yang disebut antara lain realational database, data warehouses, transactional database, advanced database system, flat files, data streams, dan World Wide Web. Dan dalam penerapannya pun, teknik dan algoritma yang digunakan untuk data mining pun berbeda satu sama lain antar setiap media penyimpana dan fungsi dari data mining tersebut. Algoritma data mining yang ada sekarang bermacam-macam, namun berdasarkan jurnal (Wu, et al., 2008) disebutkan 10 algoritma terbaik untuk data mining, antar lain C4.5, algoritma k-means, support vector machine, algoritma apriori, algoritma EM, PageRank, AdaBoost, knn(k-nearest neighbor), Naive Bayes, CART(Classification and Regression Tree). Sedangkan untuk setiap algoritma menyesuaikan dengan fungsi dari data mining, yaitu fungsi karakterisasi, fungsi diskriminasi, fungsi asosiasi, fungsi prediksi, fungsi klasifikasi, dan fungsi cluster (Han & Kamber, 2006) Data Stream Data mining dapat diterapkan dalam berbagai data salah satunya adalah data stream. Data stream adalah data dengan karakteristik dimana aliran data masuk dan keluar terjadi secara dinamis dari sebuah platform observasi (Han & Kamber, 2006). Data stream memiliki beberapa karakteristik unik lainnya antara lain volume data yang besar dan tidak terbatas, berubah secara dinamis, mengalir masuk dan keluar, dan memungkinkan hanya satu atau sebagian pemeriksaan, dan bersifat cepat dalam waktu respon.

5 10 Data stream pada penerapannya akan menjadi 2 kategori (Liu, Lin, & Han, 2009), yaitu: - Transactional Data Stream Data stream yang mencatat kegiatan interaksi antara dua entitas. Contoh dari transactional data stream adalah transaksi retail, tellecommunications record, web access logs, dan operasi ATM. - Measurement Data Stream Data stream yang mencatat hasil pengukuran pada sebuah entitas. Contoh dari measurement data stream adalah data sensor jaringan, sinyal peralatan mobile, IP packets, dan pembacaan instrumen sains Metodologi Data Mining Pada pengembangannya hingga sekarang ini, terjadi beberapa perkembangan terhadap metodologi dalam penerapan data mining. Metodologi atau model proses merupakan suatu rangkaian tugas yang harus dilakukan untuk mengembangkan elemen tertentu, serta unsur-unsur yang diproduksi dalam setiap tugas(output) dan dan unsur-unsur yang diperlukan untuk melakukan tugas(input). Dengan tujuan untuk membuat proses agar dapat berulang, dikendalikan, dan terukur (Marbán, Mariscal, & Segovia, 2009). Perkembangan metodologi pada data mining terjadi mulai pada metodologi KDD(Knowledge Discovery from Data) pada awal tahun 1990-

6 11 an. Setelah itu terjadi perkembangan metodologi yang menyusul setelahnya. Berikut merupakan gambaran perkembangan metodologi data mining. Gambar 2.1 Perkembangan Metodologi Data Mining (Marbán, Mariscal, & Segovia, 2009) Pada gambaran diatas, diketahui perkembangan metodologi dimulai pada metodologi KDD. Selanjutnya dengan berdasar KDD dikembangkan beberapa metodologi dengan melakukan beberapa perubahan namun secara garis besar memiliki fitur serupa, yaitu Human-centered, SEMMA, Two Crows, Anand & Buchner dan Cabena. Di lain sisi, metodologi 5 A s merupakan metodologi yang menjadi pelopor dari CRISP-DM, dimana siklus yang dikerjakan memiliki kemiripan dengan siklus pada CRISP-DM. Selanjutnya CRISP-DM menjadi dasar pengembangan CIOS yang lebih fokus pada kebutuhan riset akademik, RAMSYS (RApid collaborative data Mining SYStem) dan DMIE (Data

7 12 Mining for Industrial Engineering). Metodologi tersebut tetap didasarkan pada CRISP-DM dan mempertahankan fase yang sama secara generik. Pada tabel berikut ini akan dijelaskan mengenai tahapan pada beberapa metodologi. Tabel 2.1 Perbandingan Metodologi (Marbán, Mariscal, & Segovia, 2009) Walau jumlah tahapan dan tahapan yang dilakukan berbeda-beda, namun secara garis besar tahapan pada setiap metodologi data mining adalah sebagai berikut: - Pre-processing Pada tahapan ini dilakukan persiapan mengenai data mining yang akan dilakukan. Seperti pengenalan bisnis, pengenalan data, dan persiapan data.

8 13 - Data Mining Pada tahap ini dilakukan kegiatan data mining dengan berdasarkan metode dan algoritma yang ditentukan. - Post-processing Tahapan ini adalah tahapan setelah melakukan proses data mining. Berikut merupakan penjelasan mengenai beberapa metodologi: KDD KDD merupakan singkatan dari Knowledge Discovery from Data. KDD mulai dikembangkan pada era awal 1990-an. Fayyad pada 1996 menggagas proses model KDD dan menetapkan langkah untuk proyek DM. Pada metodologi KDD terdapat 9 tahap (Han & Kamber, 2006) sesuai dengan gambar di bawah.

9 14 Gambar 2.2 Tahapan Metodologi KDD (Han & Kamber, 2006) - Data Cleaning Pada tahapan ini melakukan pemilihan data yang relevan dari database dengan melakukan pemisahan terhadap data yang tidak konsisten dan data yang tidak relevan. - Data Integration

10 15 Pada tahapan ini dilakukan integrasi terhadap data yang ada dengan cara menggabungkan berbagai sumber data menjadi satu sumber. - Data Selection Pada tahapan ini melakukan pemilihan terhadap data yang relevan dengan analisa yang akan dilakukan pada database. - Data Transformation Pada tahapan ini dilakukan pengubahan terhadap format data yang ada menjadi format data yang sesuai untuk diproses dalam data mining. - Data Mining Pada tahapan ini dilakukan proses data mining, dengan menerapkan metode tertentu untuk mendapatkan informasi yang tersembunyi dari data yang ada. - Pattern Evaluation Pada tahapan ini dilakukan identifikasi terhadap pola-pola yang menarik yang didapat dari hasil data mining, untuk kemudian direpresentasikan. - Knowledge Presentation Pada tahapan ini dilakukan visualisasi dan penyajian terhadap pengetahuan mengenai teknik yang digunakan untuk memperoleh pengetahuan yang diperoleh user.

11 SEMMA SEMMA merupakan singakatan dari Sample Explore Modify Model Assess, singkatan tersebut mengacu pada proses dalam melakukan sebuah proyek data mining. Pada penerapannya, SAS Institute membagi siklus SEMMA menjagi 5 tahapan untuk proses data mining (Azevedo & Santos, 2008), berikut tahapannya: - Sample Tahap ini melakukan sampling data dengan cara mengekstraksi sebagian besar data dan menetapkan besar data yang cukup untuk menampung informasi yang signifikan. - Explore Tahap ini melakukan eksplorasi terhadap data dengan cara mencari tren yang tak terduga dan anomali dalam rangka untuk mendapatkan pemahaman dan ide-ide. - Modify Tahap ini melakukan modifikasi terhadap data dengan menciptakan, memilih, dan mengubah variabel untuk fokus pada proses pemilihan model. - Model Pada tahap ini terdiri pada pemodelan data dengan suatu perangkat lunak untuk mencari kombinasi data yang dapat memprediksi hasil yang diinginkan. - Assess

12 17 Pada tahap ini terdiri dari penilaian data dengan mengevaluasi kegunaan dan keandalan dari temuan pada proses data mining. Gambar 2.3 Tahapan Metodologi SEMMA (Mariscal, Marban, & Fernandez, 2010) CRISP-DM CRISP-DM merupakan singkatan dari Cross Industry Standard Process for Data Mining. CRISP-DM merupakan standarisasi data mining yang disusun oleh tiga penggagas data mining market. Yaitu Daimler Chrysler (Daimler-Benz), SPSS (ISL), NCR (Larose, 2005). Pada metodologi ini dilakukan pembagian siklus untuk proses data mining menjadi 6 tahap, dimana ketergantungan antara setiap tahap digambarkan dengan panah. Berikut merupakan gambaran dari metodologi CRISP-DM.

13 18 Gambar 2.4 Tahapan Metodologi CRISP-DM (Larose, 2005) Berdasarkan pada gambar di atas, lingkaran siklus paling luar menggambarkan bahwa data mining dengan metodologi CRISP-DM dapat mengambil pengalaman dari proyek masa lalu untuk menjadi masukan dalam proyek-proyek baru. Pada beberapa literatur digambarkan bahwa dari tahapan evaluasi dapat mengirim analisis kembali ke salah satu tahapan sebelumnya, namun untuk kesederhanaan maka pada literatur ini digambarkan proses yang paling umum dimana dari tahapan evaluasi dapat kembali ke tahap modeling. Berikut adalah penjelasan dari setiap tahap: - Business Understanding

14 19 Pada tahap ini berfokus pada pemahaman mengenai tujuan dari proyek dan kebutuhan secara persepktif bisnis, kemudian mengubah hal tersebut menjadi sebuah permasalahan data mining dan rencana awal untuk mencapai tujuan tersebut. Kegiatan yang dilakukan antara lain: menentukan tujuan dan persyaratan dengan jelas secara keseluruhan, menerjemahkan tujuan tersebut serta menentukan pembatasan dalam perumusan masalah data mining, dan selanjutnya mempersiapkan strategi awal untuk mencapai tujuan tersebut. - Data Understanding Pada tahap ini dilakukan pengumpulan terhadap data, lalu kemudian mempelajari data tersebut dengan tujuan untuk mengenal data, melakukan identifikasi dan mengetahui kualitas dari data, serta mendeteksi subset yang menarik dari data yang dapat dijadikan hipotesa bagi informasi yang tersembunyi. - Data Preparation Pada tahap ini dilakukan persiapan mengenai data yang akan digunakan pada tahap berikutnya. Kegiatan yang dilakukan antara lain: memilih kasus dan parameter yang akan dianalisis(select Data), melakukan transformasi terhadap parameter tertentu(transformation), dan melakukan pembersihan data agar data siap untuk tahap modeling(cleaning). - Modeling

15 20 Pada tahap ini dilakukan penentuan terhadap teknik data mining, alat bantu data mining, dan algoritma data mining yang akan diterapkan. Lalu selanjutnya adalah melakukan penerapan teknik dan algoritma data mining tersebut kepada data dengan bantuan alat bantu. Jika diperlukan penyesuaian data terhadap teknik data mining tertentu, dapat kembali ke tahap persiapan data. - Evaluation Melakukan interpretasi terhadap hasil dari data mining yang dihasilkan dalam proses pemodelan pada tahap sebelumnya. Evaluasi dilakukan terhadap model yang diterapkan pada tahap sebelumnya dengan tujuan agar model yang ditentukan dapat sesuai dengan tujuan yang ingin dicapai dalam tahap pertama. - Deployment Melakukan penyusunan laporan terhadap hasil yang didapat dari evaluasi pada tahap sebelumnya atau dari proses data mining yang dilakukan secara keseluruhan Perbandingan KDD, SEMMA, dan CRISP-DM Dengan berdasarkan pada penjelasan ketiga metodologi diatas, dapat dinyatakan jika pendekatan KDD and SEMMA adalah ekuivalen atau memiliki kesamaan. Sample dapat diidentifikasikan dengan Selection. Explore dapat diidentifikasikan sebagai Pre processing. Modify sebagai Transformation. Model sebagai Data

16 21 Mining. Assess dapat berarti Interpretation/Evaluation. Sehingga dapat dikatakan proses SEMMA terlihat mirip dengan lima tahapan pada KDD. Pada tabel berikut akan dijelaskan mengenai tahapan pada masing-masing metodologi: Tabel 2.2 Perbandingan Tahapan KDD, SEMMA, dan CRISP- DM (Azevedo & Santos, 2008) Pada tabel di atas diketahui jika penggunaan CRISP-DM, menambahkan sebuah tahapan yaitu business undertanding, dimana pada penerapannya tahapan ini dilakukan untuk mengetahui pemahaman mengenai tujuan dari proyek data mining yang akan dilakukan. Sedangkan tahap lainnya dapat diidentifikasikan dengan tahapan pada KDD, atau merupakan kombinasi dari tahapan pada KDD sesuai dengan gambaran pada tabel di atas. Setiap metodologi memiliki kelebihan masing-masing, akan tetapi untuk mengetahui metodologi yang sering digunakan maka dilakukan survey mengenai penggunaan metodologi tersebut. Berikut merupakan gambar mengenai survey yang dilakukan terhadap penggunaan metodologi dalam data mining.

17 22 Gambar 2.5 Survey Penggunaan Metodologi Data Mining (Mariscal, Marban, & Fernandez, 2010) Dari hasil survey diatas diketahui bahwa metodologi CRISP- DM menjadi metodologi yang paling sering digunakan. Dimana pada tahun 2002 jumlah pemilih CRISP-DM mencapai 51%, sedangkan pada tahun 2004 dan 2007 menurun menjadi 41%. Walau menurun, CRISP-DM tetap menjadi metodologi yang sering digunakan sesuai dengan survey tersebut Fungsional Data Mining Selanjutnya, terdapat beberapa fungsi atau tugas dari data mining yang biasanya dikerjakan dalam proyek data mining. Fungsi tersebut antara lain (Larose, 2005): - Description

18 23 Data mining dapat berfungsi untuk melakukan deskripsi pola dan trend pada kumpulan data, dengan melakukan deskripsi akan didapat penjelasan yang mungkin untuk tren atau pola tersebut. Data mining harus bersifat se-transparan mungkin, karena hasil dari data mining harus menjelaskan pola yang jelas. - Estimation Fungsi estimation memiliki kemiripan dengan fungsi classification, yaitu bertujuan untuk menentukan nilai dari atribut output yang belum diketahui. Namun berbeda dengan classification, atribut output pada estimation lebih bersifat numerik daripada kategori. Contoh kasus yang menerapkan estimation antara lain: o Memperkirakan rata-rata nilai(ipk) dari seorang mahasiswa pasca sarjana dengan didasarkan pada IPK ketika sarjana. o Memperkirakan jumlah uang yang dikeluarkan untuk berbelanja keperluan sekolah ketika tahun ajaran baru dimulai oleh sebuah keluarga. - Prediction Tujuan dari fungsi ini adalah untuk menemukan kemungkinan hasil di masa depan dengan berdasarkan tindakan sekarang. Dimana atribut output yang dihasilkan bisa berupa kategori atau numerik. Berikut merupakan contoh kasus yang menerapkan fungsi prediction:

19 24 o Memprediksi pemenang dari kejuaraan dengna berdasarkan perbandingan statistik tim. o Memprediksi persentase kenaikan tingkat kecelakaan lalu lintas pada tahun depan jika batasan kecepatan meningkat. o Memprediksi harga saham 3 bulan ke depan. Gambar 2.6 Prediksi Harga Saham 3 Bulan Kedepan (Han & Kamber, 2006) - Classification Klasifikasi merupakan sebuah proses untuk mencari model atau fungsi yang menjelaskan dan membedakan kelas atau konsep dari data, dengan tujuan untuk menggunakan model dan melakukan prediksi dari kelas suatu objek dimana tidak diketahui label dari kelas tersebut (Han & Kamber, 2006). Berikut merupakan contoh dari penerapan fungsi klasifikasi: o Menentukan apakah transaksi dengan kartu kredit tersebut adalah penipuan.

20 25 o Menilai apakah pengajuan kredit yang diajukan memiliki resiko kredit yang baik atau buruk. o Mendiagnosis apakah terdapat penyakit tertentu. Dalam melakukan representasi terhadap klasifikasi, terdapat beberapa model yang dapat digunakan. Representasi tersebut bisa dengan menggunakan classification (IF-THEN) rules, decision trees, mathematical formulae, atau neural networks. Decision tree merupakan sebuah diagram alur yang berbentuk seperti pohon, dimana setiap cabang merepresentasikan output dari pengujian dan daun pohon merepresentasikan kelas atau distribusi dari kelas. Gambar 2.7 Contoh Decision Tree (Han & Kamber, 2006) Neural network berbentuk seperti sebuah koleksi unit proses yang berbentuk neuron dengan weighted connections diantara setiap unit.

21 26 Gambar 2.8 Contoh Neural Network (Han & Kamber, 2006) Dalam pemanfaatannya terdapat banyak metode yang dapat digunakan untuk melakukan model klasifikasi, seperti support vector machine, naive Bayesian classification, dan k- nearest neighbor classification. - Clustering Clustering berkaitan dengan pengelompokan dari records, penelitian, atau kasus ke dalam kelas yang memiliki kesamaan objek. Clustering berbeda dengan classification, dikarenakan pada clustering tidak ada target parameter yang digunakan untuk clustering. Algoritma pada clustering akan melakukan segmentasi data pada seluruh data menjadi sub-kelompok yang relatif memiliki kesamaan. Berikut merupakan contoh dari penerapan fungsi clustering: o Menentukan target pemasaran produk untuk bisnis kecil yang tidak memiliki anggaran pemasaran yang besar.

22 27 o Sebagai alat pengurangan dimensi data ketika set data memiliki ratusan atribut o Mengelompokkan pelanggan dengan berdasarkan karakterisasi pola pembeliannya, sehingga dapat membantu pemasaran untuk strategi pemasaran. Gambar 2.9 Contoh Penerapan Clustering terhadap lokasi pelanggan dalam sebuah kota (Han & Kamber, 2006) Dalam penerapannya, banyak algoritma yang dapat digunakan untuk melakukan clustering, seperti k-means algorithm, dan self-organizing maps(som). - Association Asosiasi dalam penerapan data mining memiliki tugas untuk menemukan atribut yang memiliki keterkaitan atau mencari hubungan atau suatu item. Sebagai contohnya dalam himpunan transaksi, dimana dari himpunan transaksi tersebut mungkin akan ditemukan suatu hubungan seperti berikut, pada sebuah supermarket ditemukan bahwa terdapat 1000 pelanggan

23 28 yang melakukan transaksi pembelian dimana 200 pelanggan membeli popok, dan dari 200 pelanggan tersebut diketahui 50 pelanggannya membeli bir. Dalam bahasa asosiasi hal tersebut dibaca menjadi Jika membeli popok, maka membeli bir dengan support 200/1000 = 20% dan confidence 50/200 = 25%. Support dalam hal ini berarti persentase jumlah transaksi dalam analisis yang menggambarkan bahwa kedua produk telah dipesan dalam satu transaksi yang sama. Sedangkan confidence berarti persentase jumlah pelanggan yang akan membeli produk ke-2 jika membeli produk pertama, dalam hal ini berarti jika pembeli membeli popok, maka ada peluang 25% pembeli tersebut juga akan membeli bir. Dengan demikian, untuk dapat menemukan hubungan antar item tersebut mungkin diperlukan pembacaan terhadap data transaksi secara berulang terhadap data transaksi tersebut. Dikarenakan data transaksi tersebut berjumlah sangat besar maka diperlukan algoritma yang efisien untuk dapat mengerjakannya. Selain itu terdapat beberapa contoh penerapan fungsi asosiasi, antara lain: o Menginvestigasi proporsi pelanggan yang akan merespon positif terhadap tawaran dari perusahaan ponsel. o Memprediksi degradasi dari jaringan telekomunikasi.

24 29 o Mendapatkan keterkaitan antar parameter yang berpengaruh pada peluang berhasilnya lulus ujian dari seorang pelajar ketika menghadapi ujian akhir. Untuk menerapkan asosiasi terdapat beberapa algoritma yang dapat digunakan, yaitu apriori algorithm, dan GRI(generalized rule induction) algorithm Clustering Clustering merupakan proses pengelompokan sekumpulan objek fisik atau abstrak kedalam kelas dengan objek yang serupa (Han & Kamber, 2006). Sedangkan cluster merupakan koleksi objek data yang memiliki kesamaan satu sama lain dalam kelompok yang sama dan berbeda dengan objek di kelompok lain. Cluster analisis dapat diterapkan secara luas pada berbagai penggunaan, termasuk dalam market research, pattern recognition, data analysis, dan image processing. Salah satunya dalam bisnis, clustering dapat membantu pemasaran dalam mengetahui pengelompokan bagi pelanggannya dan mengkarakterisasi kelompok pelanggannya berdasarkan pola belanjanya. Clustering dapat juga dikatakan sebagai data segmentation pada beberapa penerapan, karena clustering akan membagi sekumpulan data yang besar ke dalam kelompok-kelompok dengan berdasarkan pada kesamaannya. Han & Kamber (2006) juga menyebutkan bahwa clustering merupakan sebuah contoh dari unsupervised learning. Karena tidak seperti klasifikasi, clustering tidak berdasarkan pada parameter atau kelas yang

25 30 ditentukan sebelumnya. Sehingga clustering merupakan bentuk learning by observation, bukan learning by examples. Clustering pada penerapannya di data mining memiliki beberapa kebutuhan, yaitu (Han & Kamber, 2006): - Scalability Skalabilitas dari clustering, baik dalam sampel kecil atau database yang besar untuk menghindari hasil yang bias. - Ability to deal with different types of attributes Clustering dapat memiliki kemampuan untuk mengolah berbagai macam jenis atribut, yang dapat berupa data biner, nominal, ordinal, atau kombinasi dari tipe data tersebut. - Discovery of clusters with arbitrary shape Algoritma clustering dengan berdasarkan ukuran jarak cenderung akan menemukan cluster dengan bentuk lingkaran, akan tetapi clustering sebaiknya dapat mendeteksi cluster dengan bentuk apapun, karena tidak semua cluster akan berbentuk bulat. - Minimal requirements for domain knowledge to determine input parameters Algoritma pada clustering terkadang mengharuskan pengguna untuk memasukkan parameter tertentu dalam analisis cluster (seperti jumlah cluster yang diinginkan), dimana hasil dari clustering sangat sensitif terhadap parameter yang dimasukkan. Akan tetapi parameter seringkali sulit untuk ditentukan sehingga menjadi kesulitan bagi

26 31 pengguna. Untuk itu diperlukan kebutuhan yang minimal untuk menentukan parameter masukan. - Ability to deal with noisy data Database yang ada cenderung akan memiliki data yang salah, sedangkan pada beberapa algoritma clustering yang sensitif terhadap data tersebut dapat mengakibatkan kualitas hasil yang buruk. - Incremental clustering and insensitivity to the order of input records Beberapa algoritma clustering sensitif terhadap urutan data masukan. Artinya, ketika diberi satu set objek data, algoritma dapat memberikan hasil clustering yang berbeda tergantung pada urutan penyajian data masukan. Hal ini berkaitan dengan pengembangan terhadap algoritma clustering dan algoritma tambahan yang sensitif terhadap urutan data masukan. - High dimensionality Database atau data warehouse cenderung memiliki beberapa dimensi atau atribut, dan banyak algoritma clustering yang dapat menangani dimensi data yang kecil seperti dengan dua atau tiga dimensi. Sehingga dapat mengurangi penanganan berdimensi tinggi, karena manusia normal dapat belajar setidaknya sampai 3 dimensi. - Constraint-based clustering Pada penerapannya mungkin diperlukan pengelompokkan dengan berdasarkan pada berbagai macam batasan, sehingga hal ini

27 32 akan menjadi tantangan untuk menemukan hasil clustering data yang baik dengan memenuhi terhadap batasan tersebut. - Interpretability and usability Dalam penerapan clustering, pengguna mengharapkan hasil dari penerapannya dapat dipahami, serta dapat digunakan. Sehingga dengan kata lain, diperlukan pertimbangan terhadap tujuan dari aplikasi tersebut ketika melakukan pemilihan fitur dan metode clustering. Untuk kebutuhan penggunaan clustering, biasanya penerapan dilakukan pada (Jain, 2009): - Underlying structure, untuk mendapatkan informasi tentang data, menghasilkan hipotesis, mendeteksi anomali, dan mengidentifikasi fitur yang penting. - Natural classification, untuk mengidentifikasi tingkat kesamaan antara bentuk-bentuk (phylogenetic relationship). - Compression, sebagai metode untuk mengatur dan meringkas data dengan melalui prototipe cluster K-Means Kegiatan clustering merupakan proses pengelompokan sekumpulan objek fisik atau abstrak kedalam kelas dengan objek yang serupa. Dalam melakukan clustering tersebut, pada jurnal Data Clustering: 50 Years Beyond K-Means (Jain, 2009) diungkapkan perihal mengenai penggunaan K-means sebagai sebuah algoritma

28 33 yang cukup handal digunakan untuk proses clustering. K-means yang disebutkan merupakan salah satu algoritma yang digunakan ketika akan melakukan proses clustering. Pada jurnal Top 10 algorithms in data mining (Wu, et al., 2008), disebutkan bahwa algoritma K-means merupakan algoritma yang paling banyak digunakan dalam data mining dan menempati peringkat ke-2(dua), selanjutnya K-means menjadi posisi pertama untuk algoritma clustering. Berikut urutan algoritma yang menjadi terbaik (Wu, et al., 2008): - C4.5 - K-means - SVM (Support Vector machines) - Algoritma Apriori - EM (Expectation Maximazation) - Algoritma PageRank - Algoritma AdaBoost - K-Nearst Neighbor - Naive Bayes - Classification and Regression Trees. Algoritma K-means adalah metode iteratif sederhana untuk melakukan partisi terhadap data yang diberikan ke dalam sejumlah penggunaan cluster tertentu (Wu, et al., 2008). Algoritma K-means ditemukan oleh beberapa peneliti di seluruh disiplin ilmu yang

29 34 berbeda, terutama Lloyd (1957, 1982), Forgey (1965), Friedman dan Rubin (1967), dan McQueen (1967). Anggap X = {x i }, dimana i = 1,...,n, merupakan himpunan pada n d-dimensi yang akan dikelompokkan pada K cluster, yang digambarkan C = { c k, k=1,...,k}. Selanjutnya k-means akan menemukan partisi secara sedemikian rupa sehingga kesalahan kuadrat antara rata-rata empiris cluster dan poin di cluster dapat diminimalkan. Anggap k menjadi rata-rata dari cluster c k, maka hubungan antara keduanya dirumuskan menjadi: Selanjutnya tujuan dari k-means akan meminimalkan nilai J(c k ) terhadap keseluruhan K cluster, sehingga dirumuskan menjadi: Secara umum, langkah-langkah utama dari algoritma K- means adalah sebagai berikut: - Pilih partisi awal pada cluster K, ulangi langkah 2 dan 3 sampai keanggotaan cluster telah stabil. - Menghasilkan sebuah partisi baru dengan menetapkan kepada masing-masing pola terhadap pusat cluster terdekatnya. - Menghitung pusat cluster yang baru.

30 35 Berikut merupakan gambaran dari algoritma k-means pada sebuah data dua dimensi dengan tiga cluster: Gambar 2.10 Ilustrasi K-means (Jain, 2009) Berdasarkan pada gambar di atas, maka pada tahap pertama masukan data diberikan dengan tiga cluster(a), selanjutnya tiga titik utama dipilih sebagai pusat cluster dan nilai awal untuk melakukan cluster(b), lalu pada (c) dan (d) dilakukan iterasi langkah-langkahnya untuk memperbaharui cluster dan pusat pada masing-masing cluster, dan pada akhir clustering diperoleh pengelompokkan terakhir(e). 2.2 CDR(Call Details Records) Perusahaan telekomunikasi mendapatkan keuntungan dari penjualan jasa komunikasi untuk pelanggannya. Dari jasa komunikasi yang disediakan, panggilan melalui telepon selular merupakan salah satu pelayanan dari perusahaan telekomunikasi, dimana dengan menggunakan layanan tersebut maka

31 36 memungkinkan komunikasi langsung antara pelaku dan penerima panggilan. Dalam penggunaan layanan panggilan tersebut, maka transaksi mengenai panggilan akan disimpan dalam sebuah penyimpanan yang kemudian hasil penyimpanan akan disebut sebagai Call Details Records(CDR). Call Details Records(CDR) menyimpan informasi yang memadai dan menggambarkan kegiatan panggilan dari setiap kegiatan panggilan yang terjadi (Folasade, 2011). Call Details Records(CDR) pada umumnya akan terdiri dari hal berikut (Ofrane & Lawrence, 2003): - Nomor telepon asal dan tujuan panggilan (who) Berisikan informasi mengenai nomor telepon dari pengguna yang melakukan panggilan, dan nomor telepon tujuan dari panggilan yang dilakukan. - Tanggal dan waktu panggilan, serta durasi panggilan (when) Berisikan informasi mengenai tanggal dan waktu pada saat melakukan panggilan serta lama waktu yang terjadi pada saat melakukan panggilan. - Jenis panggilan dan perinciannya (what) Berisikan informasi mengenai tanggal dan waktu pada saat melakukan panggilan. - Lokasi panggilan (where) Berisikan informasi mengenai lokasi terjadinya panggilan. - Alasan kejadian perekaman (why) Berisikan alasan terhadap perekaman panggilan. Call Details Records(CDR) dihasilkan dari mediation devices. Mediation devices adalah perangkat yang akan menerima, mengolah, dan mengubah format

32 37 informasi dari jaringan telekomunikasi menjadi format yang sesuai dengan satu atau lebih billing dan customer care system (Ofrane & Lawrence, 2003). Berikut merupakan gambaran dari proses kerja mediation devices. Gambar 2.11 Proses Kerja Mediation Devices (Ofrane & Lawrence, 2003) Sesuai dengan gambar di atas, maka mediation device mampu untuk menerima, dan melakukan decoding format data yang diterima dari switch yang berbeda. Dan mengubahnya menjadi standar Call Details Records(CDR) yang dapat digunakan oleh billing system. Selanjutnya pada gambar di bawah ini, terdapat gambaran mengenai struktur dasar dari Call Details Records(CDR). Diagram ini melakukan referensi terhadap, Usage Detail Record(UDR). Hal ini dikarenakan tidak semua kejadian merupakan suara atau panggilan data, sehingga terdapat catatan yang dihasilkan pada jaringan yang disebut Usage Detail Record(UDR). Pada diagram ditunjukkan bahwa UDR berisikan mengenai

33 38 nomor identifikasi yang unik, pelaku panggilan, nomor tujuan panggilan, serta waktu awal dan waktu akhir dari panggilan. Gambar 2.12 Usage Detail Record(UDR) (Ofrane & Lawrence, 2003) Selanjutnya dari Call Details Records(CDR) setiap pelanggan, dapat dilakukan pengolahan sehingga menghasilkan informasi berupa catatan yang menggambarkan perilaku pelanggan menelepon. Pada umumnya, selain dengan Call Details Records(CDR), perusahaan telekomonukasi dapat melakukan pengelompokkan pelanggan mereka dengan menggunakan billing system. Akan tetapi dari data yang tersimpan pada billing system, hanya menggambarkan mengenai perilaku pelanggan dalam berlangganan, berbelanja, dan melakukan pembayaran. Sedangkan pada Call Details Records(CDR), dapat menggambarkan perilaku dari pelanggan dalam memanfaatkan layanan panggilan. Dari hal tersebut, dapat diketahui jika Call Details Records(CDR) memiliki data yang lebih tepat untuk menggambarkan mengenai perilaku pelanggan daripada data di billing system (Lin, 2007). Dengan berdasarkan pada Call Details Records(CDR) yang mengandung data mengenai perilaku pelanggan, maka hal ini dapat membantu untuk mendapatkan informasi pelanggan yang dapat diperoleh untuk tujuan pemasaran.

34 39 Salah satu informasi tersebut adalah mengenai perilaku komunikasi dari pelanggan, dimana perilaku komunikasi pelanggan tersebut akan mewakili perilaku panggilan dari para pelanggan selama periode yang cukup lama. Dengan mendapatkan informasi pelanggan tersebut maka perusahaan dapat memahami kebutuhan pelanggan, sehingga penawaran khusus mengenai penggunaan panggilan dapat dibuat dan tarif dapat disesuaikan dengan perilaku pelanggan tersebut (Maedche, Hotho, & Wiese). Jika berdasarkan data yang tersedia pada Call Details Records(CDR), maka perilaku komunikasi dari pelanggan dapat digambarkan dengan ketertarikan pelanggan (profile interest) dalam panggilan melalui pengelompokan berdasarkan lama panggilan yang dilakukan, ketertarikan panggilan dari dan ke mana panggilan terjadi, serta dari penyebaran data panggilan berdasarkan jam. Yang kemudian dari hal tersebut bisa diketahui mengenai pola kemana panggilan yang dilakukan, darimana panggilan berasal, serta kapan dan berapa lama panggilan terjadi.

PENERAPAN DATA MINING PADA CDR (CALL DETAILS RECORDS) UNTUK MENGETAHUI PROFILE INTEREST DARI PELANGGAN PT. XYZ

PENERAPAN DATA MINING PADA CDR (CALL DETAILS RECORDS) UNTUK MENGETAHUI PROFILE INTEREST DARI PELANGGAN PT. XYZ PENERAPAN DATA MINING PADA CDR (CALL DETAILS RECORDS) UNTUK MENGETAHUI PROFILE INTEREST DARI PELANGGAN PT. XYZ Joppy Justian Lukas Siswanto Tanutama, Ir., MM Laporan Teknis Jakarta, 19/02/2014 Disetujui:

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Memahami definisi, proses serta teknik data mining. Pengenalan

Lebih terperinci

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek)

ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) ANALISIS SEGMENTASI NASABAH MENGGUNAKAN ALGORITMA K-MEANS CLUSTERING (Studi Kasus di PT. Buana Sejahtera Multidana Cabang Cikampek) Meriska Defriani 1, Noviyanti 2 1 STT Wastukancana 2 Teknik Informatika,

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Pasar modal merupakan salah satu bagian dari pasar keuangan, di samping pasar uang, yang sangat penting peranannya bagi pembangunan nasional pada umumnya dan bagi

Lebih terperinci

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan

Lebih terperinci

http://www.brigidaarie.com proses menganalisa data untuk mencari polapola tersembunyi dengan menggunakan metodologi otomatis Istilah lain : Machine Learning Knowledge Discovery in Database (KDD) Predictive

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 2 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Mengapa Data Mining? Penumpukan data Minimnya pemanfaatan data

Lebih terperinci

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas 1. Memahami cakupan materi dan sistem perkuliahan Data Mining.

Lebih terperinci

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A

Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A Kel : A Cross Industry Standard Process for Data Mining (CRISP-DM) Nama : Siti Maskuroh NIM : A11.2011.06038 Kel : A11.4812 CRISP-DM CRISP - DM adalah metodologi data mining komprehensif dan Model proses untuk

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Perpustakaan merupakan tempat dimana seseorang mendapatkan pengetahuan, informasi atau hiburan dengan jumlah kategori yang bervarian seperti ilmiah, non fiksi, komedi,

Lebih terperinci

Tahapan Proses KDD (Peter Cabena)

Tahapan Proses KDD (Peter Cabena) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (Business

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Dalam mencapai tujuan pembangunan ekonomi diperlukan peran serta lembaga keuangan untuk membiayai pembangunan tersebut. Lembaga keuangan memegang peranan penting dalam

Lebih terperinci

BAB II TINJAUAN STUDI DAN LANDASAN TEORI

BAB II TINJAUAN STUDI DAN LANDASAN TEORI BAB II TINJAUAN STUDI DAN LANDASAN TEORI 2.1 Tinjauan Studi Penelitian mengenai penerapan metode market basket analysis bukan merupakan hal asing, sebab telah banyak dilakukan oleh peneliti sebelumnya.

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI

PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI PENERAPAN METODE ASOSIASI DATA MINING MENGGUNAKAN ALGORITMA APRIORI UNTUK MENGETAHUI KOMBINASI ANTAR ITEMSET PADA PONDOK KOPI Fitri Nurchalifatun Fakultas Ilmu Komputer, Universitas Dian Nuswantoro, Jl.

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA Domma Lingga Mahasiswa Program Studi Teknik Informatika STMIK Budidarma Medan Jl. Sisingamangaraja

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Pada bab ini dilakukan pendefinisian permasalahan dari penelitian yang akan dilakukan. Dalam Cross Industry Standard Process for Data Mining[3], tahapan ini

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi

Lebih terperinci

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009 Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu

Lebih terperinci

BAB 1 PENDAHULUAN 1-1

BAB 1 PENDAHULUAN 1-1 BAB 1 PENDAHULUAN Bab ini menguraikan penjelasan umum mengenai tugas akhir yang dikerjakan. Penjelasan tersebut meliputi latar belakang masalah, tujuan tugas akhir, lingkup tugas akhir, metodologi yang

Lebih terperinci

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5 PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5 Annisak Izzaty Jamhur Universitas Putera Indonesia YPTK Padang e-mail: annisakizzaty@yahoo.com Abstract

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan

Lebih terperinci

Pen e g n a g n a t n a t r a r D at a a t a M ini n ng n oleh: Entin Martiana

Pen e g n a g n a t n a t r a r D at a a t a M ini n ng n oleh: Entin Martiana Pengantar Data Mining oleh: Entin Martiana Pengantar Mengapa data mining? Apa data mining? Data Mining: data apa saja? Fungsi data mining Model dalam data mining Fungsi dalam data mining Permasalahan dalam

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Dalam periode enam tahun terakhir (tahun 2007 2012), jumlah gerai ritel modern di Indonesia mengalami pertumbuhan rata-rata 17,57% per tahun. Pada tahun 2007, jumlah

Lebih terperinci

ANALISIS DATA MINING UNTUK MENENTUKAN VARIABEL VARIABEL YANG MEMPENGARUHI KELAYAKAN KREDIT KEPEMILIKAN RUMAH MENGGUNAKAN TEKNIK KLASIFIKASI

ANALISIS DATA MINING UNTUK MENENTUKAN VARIABEL VARIABEL YANG MEMPENGARUHI KELAYAKAN KREDIT KEPEMILIKAN RUMAH MENGGUNAKAN TEKNIK KLASIFIKASI ANALISIS DATA MINING UNTUK MENENTUKAN VARIABEL VARIABEL YANG MEMPENGARUHI KELAYAKAN KREDIT KEPEMILIKAN RUMAH MENGGUNAKAN TEKNIK KLASIFIKASI Aulia Fitrul Hadi Universitas Putra Indonesia YPTK Padang E-mail:

Lebih terperinci

BAB 2 TELAAH PUSTAKA

BAB 2 TELAAH PUSTAKA BAB 2 TELAAH PUSTAKA Pada bab ini akan dipaparkan mengenai deskripsi data mining secara umum dan landasan teori dari algoritma data mining yang digunakan pada FIKUI Mining. Selain itu, juga akan dijelaskan

Lebih terperinci

DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA. Oleh : Rita Prima Bendriyanti ABSTRAK

DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA. Oleh : Rita Prima Bendriyanti ABSTRAK DESAIN APLIKASI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA Oleh : Rita Prima Bendriyanti ABSTRAK Penelitian ini menggunakan metode observasi, dengan melihat atau mengamati secara langsung

Lebih terperinci

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita Anggraeni, Ragil Saputra, Beta Noranita APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita

Lebih terperinci

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING

KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING KLASIFIKASI PROSES BUSINESS DATA MAHASISWA UNIVERSITAS KANJURUHAN MALANG MENGGUNAKAN TEKNIK DATA MINING Moh Ahsan Universitas Kanjuruhan Malang ahsan@unikama.ac.id ABSTRAK. Universitas Kanjuruhan Malang

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data mining mengacu pada proses ekstraksi atau menggali pengetahuan dari sekumpulan data yang besar. Data mining mempunyai nama lain yang dikenal secara popular dengan

Lebih terperinci

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.

ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa. ABSTRAK Kemajuan teknologi membuat begitu mudahnya dalam pengolahan suatu informasi. Waktu tidak lagi menjadi hambatan dalam pengolahan data yang sangat banyak. Hal ini didukung pula dengan adanya perkembangan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut :

BAB II LANDASAN TEORI. Teori teori yang digunakan sebagai landasan dalam desain dan. implementasi dari sistem ini adalah sebagai berikut : BAB II LANDASAN TEORI Teori teori yang digunakan sebagai landasan dalam desain dan implementasi dari sistem ini adalah sebagai berikut : 2.1. Sistem Informasi Manajemen Sistem Informasi Manajemen adalah

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Perkembangan teknologi informasi telah mampu mengubah persepsi manusia terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

SKRIPSI TI S1 FIK UDINUS 1

SKRIPSI TI S1 FIK UDINUS 1 SKRIPSI TI S FIK UDINUS PENERAPAN ASSOCIATION RULE DENGAN ALGORITMA APRIORI UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA TEKNIK INFORMATIKA S FAKULTAS ILMU KOMPUTER UNIVERSITAS DIAN NUSWANTORO

Lebih terperinci

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI

PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI PENGEMBANGAN APLIKASI PENENTUAN TINGKAT KEUNTUNGAN PADA E- COMMERCE DENGAN MENGGUNAKAN ALGORITMA K-MEANS DAN APRIORI Gunawan 1, Fandi Halim 2, Tony Saputra Debataraja 3, Julianus Efrata Peranginangin 4

Lebih terperinci

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA Ade Putra Fakultas Vokasi, Program Studi Komputerisasi Akuntansi Universitas Bina Darma

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang Pelaku bisnis saat ini dituntut selalu inovatif untuk dapat bersaing dengan kompetitor. Bisnis retail seperti Apotek merupakan bisnis dengan persaingan yang sangat

Lebih terperinci

II. TINJAUAN PUSTAKA

II. TINJAUAN PUSTAKA II. TINJAUAN PUSTAKA 2.1 Sistem Informasi Manajemen Mcleod R dan Schell G, (2004) membagi sumber daya menjadi dua bagian yaitu sumberdaya fisikal dan sumberdaya konseptual. Sumber daya fisikal terdiri

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

2.2 Data Mining. Universitas Sumatera Utara

2.2 Data Mining. Universitas Sumatera Utara Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam

BAB I PENDAHULUAN. Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam BAB I PENDAHULUAN 1.1 LATAR BELAKANG Saat ini, konsep data mining semakin dikenal sebagai tools penting dalam manajemen informasi karena jumlah informasi yang semakin besar jumlahnya. Data mining sendiri

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menemukan pengetahuan yang tersembunyi di dalam database. Data mining merupakan proses semi otomatik

Lebih terperinci

TUGAS KONSEP DASAR DATA MINING

TUGAS KONSEP DASAR DATA MINING TUGAS KONSEP DASAR DATA MINING Di susun Oleh: Nurkholifah Npm : 2014210052 FAKULTAS ILMU KOMPUTER JURUSAN SISTEM INFORMASI UNIVERSITAS INDO GLOBAL MANDIRI TAHUN 2016 BAB I PENDAHULUAN 1.1 Latar Belakang

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

BAB I PENDAHULUAN 1-1

BAB I PENDAHULUAN 1-1 BAB I PENDAHULUAN 1.1 Latar Belakang Masalah Perkembangan teknologi informasi dan komputer akhir-akhir ini mengalami perkembangan yang sangat pesat tidak terkecuali pada aplikasi-aplikasi database. Di

Lebih terperinci

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING

BAB IV GAMBARAN UMUM METODOLOGI DATA MINING BAB IV GAMBARAN UMUM METODOLOGI DATA MINING A. Metodologi Data Mining Metodologi Data Mining Komponen data mining pada proses KDD seringkali merupakan aplikasi iteratif yang berulang dari metodologi data

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa dengan Metode NAÏVE BAYES M. Ridwan Effendi Fakultas Komputer Jurusan Sistem Informasi Universitas Mohammad Husni Thamrin Jakarta Email :

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal

Lebih terperinci

BAB 1 PENDAHULUAN. retail di Indonesia pada semester I 2010 telah mencapai Rp 40 triliun. Omzet perusahaan

BAB 1 PENDAHULUAN. retail di Indonesia pada semester I 2010 telah mencapai Rp 40 triliun. Omzet perusahaan BAB 1 PENDAHULUAN 1.1 Latar Belakang Bisnis retail berkembang pesat di Indonesia dalam beberapa tahun ini. Kita dapat menjumpainya di kota-kota besar maupun kota-kota kecil. Menurut ketua umum Asosiasi

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM).

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi

Lebih terperinci

PROPOSAL PENELITIAN. PENERAPAN DATA MINING UNTUK MENINGKATKAN PENJUALAN PADA PT. XL AXIATA, Tbk PALEMBANG

PROPOSAL PENELITIAN. PENERAPAN DATA MINING UNTUK MENINGKATKAN PENJUALAN PADA PT. XL AXIATA, Tbk PALEMBANG PROPOSAL PENELITIAN PENERAPAN DATA MINING UNTUK MENINGKATKAN PENJUALAN PADA PT. XL AXIATA, Tbk PALEMBANG I. PENDAHULUAN 1.1. Latar Belakang Kemajuan perkembangan teknologi informasi pada era globalisasi

Lebih terperinci

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA

APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA APLIKASI DATA MINING UNTUK MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA Yuli Asriningtias, Rodhyah Mardhiyah Program Studi Teknik Informatika Fakultas Bisnis & Teknologi Informasi, Universitas Teknologi

Lebih terperinci

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering. BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang

Lebih terperinci

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN Fauziah Nur1, Prof. M. Zarlis2, Dr. Benny Benyamin Nasution3 Program Studi Magister Teknik Informatika, Universitas

Lebih terperinci

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

POHON KEPUTUSAN DENGAN ALGORITMA C4.5 POHON KEPUTUSAN DENGAN ALGORITMA C4.5 1. Pengantar Algoritma C4.5 Klasifikasi merupakan salah satu proses pada data mining yang bertujuan untuk menemukan pola yang berharga dari data yang berukuran relatif

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI Di dalam landasan teori ini, akan dibahas tentang teori teori dan konsep dasar yang mendukung pembahasan dari sistem yang akan dibuat. 2.1 Basis Data (Database) Basis data diperlukan

Lebih terperinci

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO

PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO PENERAPAN ALGORITMA NAIVE BAYES UNTUK MEMPREDIKSI KEPUTUSAN NASABAH TELEMARKETING DALAM MENAWARKAN DEPOSITO Wahyu Nurjaya WK 1, Yusrina Adani 2 Program Studi Sistem Informasi, STMIK LPKIA Bandung Program

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE

DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE Didik Setiyadi, Ali Nurdin DATA MINING POTENSI AKADEMIK SISWA BERBASIS ONLINE 1 DIDIK SETIYADI, 2 ALI NURDIN 1,2 Sekolah Tinggi Manajemen Informatika dan Komputer Eresha Program Studi : Teknik Informatika

Lebih terperinci

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak DATA MINING MELIHAT POLA HUBUNGAN NILAI TES MASUK MAHASISWA TERHADAP DATA KELULUSAN MAHASISWA UNTUK MEMBANTU PERGURUAN TINGGI DALAM MENGAMBIL KEBIJAKAN DALAM RANGKA PENINGKATAN MUTU PERGURUAN TINGGI Timor

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Kartika Kosmetik merupakan toko penjualan produk kosmetik yang paling besar didaerah Rancaekek. Produk utama yang dijual di Kartika Kosmetik adalah produk-produk

Lebih terperinci