SKRIPSI PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN PADA TOKO DESHOP CIKARANG

Ukuran: px
Mulai penontonan dengan halaman:

Download "SKRIPSI PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN PADA TOKO DESHOP CIKARANG"

Transkripsi

1 SKRIPSI PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN PADA TOKO DESHOP CIKARANG Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Komputer Disusun oleh: Nama : Widiya Iswati NIM : PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS PELITA BANGSA KABUPATEN BEKASI 2020

2 SKRIPSI PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN PADA TOKO DESHOP CIKARANG Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Komputer Disusun oleh: Nama : Widiya Iswati NIM : PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS PELITA BANGSA KABUPATEN BEKASI 2020

3

4

5

6

7

8

9 ABSTRAK Toko Deshop Cikarang adalah salah satu Toko skin care yang berada di Cikarang. Jika prediksi minat pelanggan diperhatikn dengan baik maka bisa sangat merugikan bisnis penjualan. Prediksi minat pelanggan saat ini menjadi faktor yang sangat berpengaruh pada perkembangan suatu usaha, jika suatu pelaku bisnis bisa memprediksi pada pasar maka akan mudah baginya untuk memenuhi kebutuhan pelanggan. Berdasarkan latar belakang tersebut maka dengan menerapkan teknik data mining diharapkan dapat membantu Toko Deshop untuk memprediksi minat pelanggan. Adapun teknik data mining yang digunakan prosesnya menggunakan lima langkah dalam KDD (Knowledge Discovery in Database), yang mencakup beberapa aktivitas yaitu seleksi, praproses, data mining, interprestasi dan evaluasi. Selain melakukan perhitungan secara manual, kasus penelitian ini juga diujikan menggunakan aplikasi RapidMiner. Dari hasil penelitian menggunakan Algoritma C4.5 dihasilkan nilai akurasi sebesar 94.44% sehingga penggunaan Algoritma C4.5 sangat efektif dalam memprediksi produk ter Toko Deshop Ckarang, sehingga pemilik toko hanya perlu membeli produk skin care yang untuk stok pemasaran. Kata Kunci : Data Mining, Prediksi, Penjualan, Algoritma C4.5, Klasifikasi, RapidMiner viii

10 ABSTRACT Cikarang Deshop Shop is one of the skin care shops located in Cikarang. If predictions of customer interest are not well considered, it can be very detrimental to the sales business. Prediction of customer interest is currently a very influential factor in the development of a business, if a businessperson can predict the market it will be easy for him to meet customer needs. Based on this background, implementing data mining techniques is expected to help Deshop Stores predict customer interests. The data mining technique used by the process uses five steps in KDD (Knowledge Discovery in Database), which includes several activities namely selection, preprocessing, data mining, interpretation and evaluation. In addition to performing calculations manually, this research case was also tested using the RapidMiner application. From the results of the study using the C4.5 Algorithm produced an accuracy value of 94.44% so that the use of the C4.5 Algorithm is very effective in predicting the best-selling products of Carang Deshop Store, so that shop owners only need to buy in-demand skin care products for marketing stock. Keywords: Data Mining, Prediction, Sales, C4.5 Algorithm, Classification, RapidMiner ix

11 DAFTAR ISI HALAMAN PERSETUJUAN... ii HALAMAN PENGESAHAN... iii PERNYATAAN KEASLIAN SKRIPSI... iii PERNYATAAN PERSETUJUAN PUBLIKASI... v UCAPAN TERIMAKASIH... vi ABSTRAK... viii ABSTRACT... viii DAFTAR ISI... ix DAFTAR TABEL... xii DAFTAR GAMBAR... xiii DAFTAR LAMPIRAN (Jika ada)... xiv BAB I PENDAHULUAN... i 1.1 Latar Belakang Identifikasi Masalah Batasan Masalah Rumusan Masalah Tujuan Penelitian Manfaat Penelitian... 3 BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI Penelitian Terdahulu Kajian Jurnal Pertama Kajian Jurnal Kedua Kajian Jurnal Ketiga Definisi Judul Pengertian Penerapan Algoritma C x

12 2.2.3 Prediksi Pengertian Data Pengertian Penjualan Data Mining Pengertian Data Mining Tugas-tugas Data Mining Manfaat Data Mining Jenis atau Teknik Data Mining Klasifikasi Decision Tree Knowledge Discovery In Database (KDD) Rapid Miner Kerangka Pemikiran BAB III METODE PENELITIAN Objek Penelitian Jenis Data Sumber Data Primer Sumber Data Sekunder Metodologi Penilitian Tahapan Metodologi Penelitian Analisis Data Knowledge Discovery in Database (KDD Tahapan Penelitian Kebutuhan Software dan Hardware BAB IV HASIL DAN PEMBAHASAN Hasil Penelitian Root Node Rapid Miner Pembahasan Hasil Pengujian BAB V PENUTUP Kesimpulan... 45

13 5.2 Saran DAFTAR PUSTAKA

14 DAFTAR TABEL Tabel 3. 1 Atribut Yang Digunakan Tabel 3. 2 Klasifikasi Berdasarkan Jenis Produk Tabel 3. 3 Klasifikasi Berdasarkan Jumlah Terjual Tabel 3. 4 Klasifikasi Berdasarkan Jenis Pakaian... Tabel 3. 5 Klasifikasi Berasarkan Jenis Aksesoris Tabel 3. 6 Klasifikasi Berdasararkan Jenis Toner Tabel 3. 7 Klasifikasi Berdasarkan Merek Tabel 3. 8 Klasifikasi Berdasarkan Harga xiii

15 DAFTAR GAMBAR Gambar 2. 1 Pseudocode Algoritma C Gambar 2. 2 Tahapan Proses Data Mining Gambar 2. 3 Tampilan Utama Rapid Miner Gambar 2. 4 Kerangka Pemikiran Gambar 3. 1 Tahapan Metodolodi penelitian Gambar 3. 5 Tahapan Penelitian Gambar 4. 1 Data Set Gambar 4. 2 Data Tsting Gambar 4. 3 Perhitungan Algoritma C4.5 Node Gambar 4. 4 Perhitungan Algoritma C4.5 Node Gambar 4. 5 Perhitungan Algoritma C4.5 Node Gambar 4.6 Perhitungan Algoritma C4.5 Node Gambar 4.7 Perhitungan Algoritma C4.5 Node Gambar 4. 8 Pohon Keputusan Gambar Halaman Utama RapidMiner Gambar Halaman Select the cells to import data Gambar kotak dialog import data Gambar Process Read excel Gambar Process Validation Gambar Tabel Hasil Akurasi Data Testing Gambar Tabel Hasil Recall Data Testing Gambar Tabel Hasil Precision Data Testing Gambar Tree View RapidMiner... 49

16 DAFTAR LAMPIRAN Lampiran 1 Dataset Lampiran 2 Data Testing... 48

17 BAB I PENDAHULUAN 1.1. Latar Belakang Skin Care merupakan kebutuhan pokok bagi manusia. Seiring dengan perkembangan Ilmu Pengetahuan dan Teknologi, sehingga bermunculan beragam bisnis yang menawarkan berbagai jenis skin care. Hal ini dapat kita lihat dari banyaknya produk penjual skin care, kegiatan dan aktifitas seseorang semakin banyak, sehingga dibutuhkan berbagai jenis skin care yang dapat digunakan sesuai dengan kebutuhan tersebut. Maka dari itu, ketika seseorang ingin memenuhi kebutuhan skin care, ia hanya bertindak pada fungsi dan tujuan utama dari skin care itu sendiri. Menjual suatu produk di era modernisasi ini sudah sangatlah mudah, kita bisa berjualan secara online, kita hanya memerlukan smartphone atau laptop dan koneksi internet serta barang yang akan dijual. Lebih dari itu, pemenuhan kebutuhan akan Skin Care melibatkan pertimbangan-pertimbangan lain yang dianggap penting dan perlu penyesuaian, seperti trend yang sedang berkembang pada masanya. Hal ini memberikan peluang dan kesempatan bagi para penjual serta produsen skin care untuk lebih kreatif dalam berkarya. Dalam lingkungan bisnis yang global sekarang ini, setiap perusahaan dituntut untuk mampu bersaing dalam meningkatkan kinerja dan mampu menghasilkan laporan yang sesuai, sehingga perusahaan dapat mengambil keputusan dari hasil kinerja dan laporan tersebut. Di sisi lain perkembangan teknologi informasi mempengaruhi pemrosesan data untuk menghasilkan informai yang lebih akurat, aktual, dan relevan untuk meningkatkan ketepatan atau akurasi dalam pengambilan keputusan. Dari penumpukan data yang terjadi dapat digali untuk menemukan pola-pola penjualan prouk yang dapat digunakan untuk menganalisa pasar dan meramalkan penjualan pada watu yang akan datang. Prediksi jumlah penjualan merupakan faktor penting yang menentukan kelancaran usaha suatu perusahaan. Prediksi ini sangat berguna untuk menentukan 21

18 22 berapa banyak produk yang akan dipesan pada bulan selanjutnya. Permasalahan yang umum dihadapi oleh suatu perusahaan adalah bagaimana tingkat akurasi dalam memprediksi atau meramalakan penjualan produk dimasa mendatang berdasarkan data penjualan sebelumnya. Prediksi tersebut sangat berpengaruh untuk menentukan produk mana yang dan tiak. Untuk menghasikan prediksi yang tepat tentu saja dibutuhkan kecermatan dan ketelitian. Tujuan penelitian ini adalah penulis mencoba menerapkan data mining metode decision tree Algoritma C4.5 pada Toko Deshop Cikarang dan diharapkan dapat memberikan informasi berupa prediksi penjualan menu skin care yang paling digemari pelanggan dan digemari ( dan ). Sehingga kedepannya pemilik bisnis ini dapat melakukan analisa menu mengikuti trend dan kegemaran pelanggannya. Dari latar belakang diatas, maka penulis berkeinginan untuk menyusun tugas akhir dengan judul Penerapan Data Mining Dengan Algoritma C4.5 Dalam Prediksi Penjualan pada Toko Deshop Cikarang. 1.2 Identifikasi Masalah Dari latar belakang diatas terdapat beberapa masalah yang timbul dan dapat di identifikasikan sebagai berikut : 1. Belum diketahui produk skin care mana yang paling diminati pelanggan Toko Deshop Cikarang. 2. Belum adanya suatu akurasi yang tepat dalam melihat penentuan suatu prediksi penjualan Toko Deshop Cikarang. 3. Berapakah tingkat akurasi perhitungan algoritma C4.5 untuk memprediksi data penjualan Toko Deshop Cikarang. 1.3 Batasan Masalah Adapun batasan-batasan masalah dalam penelitian ini adalah : 1. Penelitian ini banyak membantu bagi pihak penjual Toko Deshop Cikarang dalam menentukan produk mana yang banyak diminati oleh pelanggan.

19 23 2. Menguji suatu metode (dalam hal ini algoritma C4.5) prediksi penjualan Toko Deshop Cikarang 3. Hasil dari penelitian ini adalah Prediksi produk skin care mana yang banyak diminati pelanggan dan produk skin care mana yang cocok untuk distok agar laku di pasaran. 1.4 Rumusan Masalah Berdasarkan pada latar belakang masalah, maka dapat dirumuskan masalah sebagai berikut : 1. Bagaimana tingkat akurasi yang dapat membantu penjual dalam mengambil keputusan untuk memprediksi produk merek skin care mana yang banyak diminati pelanggan ( dan )? 1.5 Tujuan Penelitian Berdasarkan rumusan masalah diatas maka tujuan pada penelitian ini adalah sebagai berikut : 1. Untuk menerapkan tingkat minat produk skin care mana yang banyak diminati pelanggan Toko Deshop Cikarang. 2. Untuk mengetahui tingkat akurasi algoritma C4.5 dalam memprediksi tingkat minat pelanggan Toko Deshop Cikarang.Menerapkan algoritma C4.5 pada tingkat minat pelanggan pada Toko Deshop Cikarang. 1.6 Manfaat Penelitian Dengan tercapainya tujuan peelitian di atas, maka di harapkan akan bermanfaat bagi semua pihak, bagi Toko Deshop Cikarang maupun bagi penulis. Manfaat dari penulis ini adalah : 1. Bagi Penulis Menambah wawasan dan pengetahuan enulis tentang algoritma C4.5 untuk prediksi tingkat penjualan produk dan menerapkan ilmu yang telah didapat selama kuliah. 2. Bagi Akademik

20 24 Penelitian ini dapat memberikan infrmasi bagi peneliti atau calon peneliti lain untuk menerapkannya kedalam sistem yang lebih luas dan lebih kompleks atau sebagai bahan acuan yang dapat dikembangkan bagi kemungkinan pengembangan konsep dan materi lebih lanjut serta dapat melengkapi referensi pustaka akademik. 3. Bagi Perusahaan Untuk mendapatkan pendukung keputusan bagi Toko Deshop Cikarang untuk memperbaiki pelayanannya dalam mempertahankan pelanggan.

21 BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Penelitian Terdahulu Kajian Jurnal Pertama Nandang Iriadi, Nia Nuraeni (2016) dengan judul kajian penerapan metode klasifikasi data mining algoritma c4.5 untuk prediksi kelayakan kredit pada bank mayapada jakarta. Industri perbankan mengalami perkembangan yang cukup pesat, baik dari sisi volume usaha, mobilisasi dana masyarakat maupun pemberian kredit. Data mining mengenai pinjaman memiliki potensial besar untuk menjelajahi bagian pola yang tersembunyi dalam suatu dataset dari domain pinjaman termasuk pinjaman kredit. Algoritma C4.5 merupakan pengklasifikasian yang paling sederhana, mudah diimplemntasikan. Namun, Algoritma C4.5 masih memiliki kelemahan dalam menangani data dalam dimensi tinggi. Penelitian ini bertujuan untuk menerapkan algoritma C4.5 dengan seleksi atribut sehingga dapat mengurangi dimensi dari data, serta mengidentifikasi fitur dalam kumpulan data dengan metode algoritma C4.5. Dari penelitian ini yang dilakukan model yang terbentuk dengan algoritma C4.5 sendiri sudah memiliki akurasi yang baik yaitu sebesar 83.67% dengan proses seleksi atribut oleh algoritma C4.5.[1] Kajian Jurnal Kedua Liliana Swastina (2013) dengan judul Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa. Banyak kasus dijumpai bahwa pemilihan jurusan yang sesuai dengan kemampuan, kepribadian, minat dan bakat dapat mempengaruhi mahasiswa dalam mengikuti perkuliahan. Penggunaan pendekatan algoritma klasifikasi data mining akan diterapkan untuk menentukan jurusan dalam bidang studi yang akan diambil oleh mahasiswa, sehingga mahasiswa salah dalam memilih jurusan yang akan di tempuh selama belajar pada perguruan tinggi. Algoritma C4.5 digunakan untuk menentukan jurusan yang akan diambil oleh mahasiswa sesuai dengan latar

22 26 belakang, minat dan kemampuannya sendiri. Parameter pemilihan jurusan adalah Indeks Prestasi Kumulatif Semester 1 dan 2. Hasil eksperimen dan evaluasi menunjukan bahwa Algoritma Decision Tree C4.5 akurat diterapkan untuk penentuan kesesuaian jurusan mahasiswa dengan tingkat akurasi 93,31 % dan akurasi rekomendasi jurusan sebesar 82,64%[2] Kajian Jurnal Ketiga Siti Mujilahwati (2017) dengan judul Pemanfaatan Algoritma ID3 untuk Klasifikasi Penjualan Obat. Toko AJ merupakan toko yang menjual berbagai macam jenis obat-obatan, ada obat pertanian, obat peternakan, dan obat tambak. Toko ini proses penjualannya sudah memakai sistem terkomputerisasi selama empat tahun terakhir. Akan tetapi pemilik toko pernah tahu bahwa data penjualan selama ini dapat digunakan untuk melakukan klasifikasi tingkat penjualan obat, yang dapat dipakai untuk menentukan ketersediaan obat. Berdasarkan data penjualan tersebut, maka penelitian ini membahas bagaimana algoritma Iterative Dichotomizer Three (ID3) dapat dimanfaatkan untuk proses klasifikasi penjualan obat apa saja yang laku dan laku. Kategori yang digunakan pada penelitian ini adalah harga, kwalitas dan animo, kelas yang dipakai adalah dan. Dataset yang digunakan selama tiga tahun sebanyak data training, dan data testing yang digunakan sebanyak 24. Akurasi yang didapat pada penelitian ini sebesar 91,6%. Kata Kunci: klasifikasi, ID3, obat, fungisida, penjualan[3]. 2.2 Definisi Judul Pengertian Penerapan Implementasi/Penerapan adalah perluasan aktivitas yang saling menyesuaikan. Pengertian implementasi sebagai ativitas yang saling menyesuaikan. Setelah sistem informasi yang baru dirancang, sistem tersebut harus diimplemantasikan sebagai sistem kerja, dan dipelihara agar dapat berjalan dengan baik[4].

23 Algoritma C4.5 Algoritma C4.5 merupakan algoritma yang digunakan untuk melakukan proses klasifikasi data dengan teknik pohon keputusan. Algoritma C4.5 merupakan ekstensi dari algoritma ID3 dan menggunakan prinsip decision tree yang mirip. Algoritma ini sudah sangat terkenal dan disukai karena memiliki banyak kelebihan. Kelebihan ini misalnya dapat mengolah data numerik dan diskret, dapat menangani nilai atribut yang hilang, menghasilkan aturan-aturan yang mudah diinterpretasikan. Dan performanya merupakan salah satu yang tercepat dibandingkan dengan algoritma lain[5]. Ide dasar dari algoritma ini adalah pembuatan pohon keputusan berdasarkan pemilihan atribut yang memiliki prioritas tertinggi atau dapat disebut memiliki nilai gain tertinggi berdsarkan nilai entropy atribut tersebut sebagai poros atribut klasifikasi. Kemudian secara rekursif cabang-cabang pohon diperluas sehingga seluruh pohon terbentuk. Menurut kamus IGI Global (Internasional Publisher of Progressive Academic), entropy adalah jumlah data yang relevan terhadap informasi dari suatu kumpulan data. Gain adalah informasi yang didapatkan dari perubahan entropy pada suatu kumpulan data, baik melalui observasi atau bisa juga disimpulkan dengan cara melakukan partisipasi terhadap suatu set data. Berdasarkan apa yang ditulis oleh jefri, terhadap empat langkah dalam proses pembuatan pohon keputusan pada algoritma C4.5, yaitu : 1. Memilih atribut sebagai akar 2. Membuat cabang untuk masing-masing nilai 3. Membagi setiap kasus dalam cabang 4. Mengulangi proses dalam setiapcabang sehingga semua kasus dalam cabang memiliki kelas yang sama. Menurut jiandi data yang dimilki harus disusun menjadi sebuah tabel berdasarkan kasus dan jumlah responden sebelum dilakukan perhitungan untuk mencari nilai entropy dan gain. Entropy(S) = (1)

24 28 Rumus 1 merupakan rumus yang digunakan dalam perhitungan entropy yang digunakan untuk menentukan sberapa informatif atribut tersebut. Berikut keterangannya : S : Himpunan kasus n : Jumlah partisi s pi : jumlah kasus pada partisi ke i Gain(S,A) = Entropy(S) - *Entropy (Si) (2) Rumus 2 merupakan rumus yang digunakan dalam perhitungan gain setelah melakukan perhitungan entropy. Berikut keterangannya : s : himpunan kasus n : jumlah partisi atribut A si : jumlah kasus pada partisi ke i s : jumlah kasus dalam S dengan mengetahui rumus-rumus diatas, data yang telah diperoleh dapat dimasukkan dan di proses dengan algoritma C4.5 untuk proses pembuatan decision tree. Gambar 2.1 Pseudocode Algoritma C4.5 Sumber : Fandy Ferdian, Seng Hansun (2017:3).

25 29 Gambar 2.1 merupakan psudecode dari algoritma C4.5 yang berfungsi untuk pembentukan pohon keputusan. Perhitungan dimulai dari menghitung banyaknya jumlah atribut dan menentukan atribut mana yang akan digunakan sebagai aka dari pohon keputusan. Selanjutnya akan dilakukan perhitungan entropy dan gain untuk menentukan leaf dari pohon keputusan tersebut. Setelah semua perhitungan selesai dilakukan, pohon keputusan dapat dibentuk berdasarkan nilai gain yang telah dihitung sebelumnya. Atribut dengan nilai gain tertinggi akan terletak pada prioritas yang lebih tinggi dan memiliki kedudukan yang lebih tinggi juga pada pohon keputusan[6] Prediksi Prediksi adalah sama dengan ramalan atau perkiraan. Menurut Kamus Besar Bahasa Indonesia, prediksi adalah hasil dari kegiatan memprediksi atau meramal atau memperkirakan. Prediksi bisa berdasarkan metode ilmiah ataupun subjektif belaka. Kesimpulannya pengertian prediksi secara istilah akan sangat tergantung pada konteks atau permasalahannya. Berbeda dengan pengertian prediksi secara bahasa yang berarti lamaran atau perkiraan yang sudah menjadi pengertian yang baku[7]. Menurut (Eva, Y. 2015) manfaat dalam melakukan prediksi adalah : 1. Mengetahui kondisi masa mendatang. 2. Perencanaan produksi, pemasaran, keuangan, dan lain-lain. 3. Keperluan investasi pada sebuah perusahaan Pengertian Data Data adalah hasil observasi langsung terhadap suatu kejadian, yang merupakan perlambangan yang mewakili objek atau konsep dalam dunia nyata. Hal ini dilengkapi dengan nilai tertentu. Menurut Ralson dan Reilly (Chamidi, 2004: 314), data didefinisikan sebagai fakta atau apa yang dikatakan sebagai hasil observasi terhadap fenomena di alam. Sebagai hasil observasi langsung terhadap kejadian atau fakta dari fenomena di alam nyata, data bisa berupa tulisan atau gambar yang dilengkapi dengan nilai tertentu. Contohnya, daftar hadir siswa

26 30 semester 1 Ilmu Perpustakaan dan kearsipan adalah data. Daftar tersebut masih merupakan bentuk mentah karena belum memberikan informasi apa-apa. Sebagian orang awam sering memiliki pengertian yang agak rancu terhadap data dan informasi. Sering terjadi pengertian data digunakan untuk menyebut informasi. Demikian pula sebaliknya[8] Pengertian Penjualan Penjualan adalah suatu usaha yang terpadu untuk mengembangkan rencana-rencana strategis yang diarahkan pada usaha pemasaran kebutuhan dan keinginan pembeli, guna mendapatkan penjualan yang menghasilkan laba. Penjualan merupakan sumber hidup suatu perusahaan, karena dari penjualan dapat diperoleh laba serta suatu usaha memikat konsumen yang diusahakan untuk mengetahui daya tarik mereka sehingga dapat mengetahui hasil produk yang dihasilkan. Penjualan adalah suatu transfer hak atas benda-benda. Dari penjelasan tersebut dalam memindahkan atau menstransfer barang dan jasa diperlukan orangorang yang bekerja dibidang penjualan seperti pelaksanaan dagang, agen, wakil pelayanan dan wakil pemasaran. Bagaimana menciptakan hubungan jangka panjang dengan pelanggan melalui produk atau jasa perusahaan. Dalam hal ini, selling berrti sebuah taktik yang dapat mengintegrasikan perusahaan, pelanggan, dan relasi antara keduanya Selling adalah suatu kegiatan yang ditujukan untuk mencari pembeli, mempengaruhi dan memberi petunjuk agar pembeli dapat menyesuaikan kebutuhannya dengan produk yang ditawarkan serta mengadakan perjanjian mengenai harga menguntungkan bagi kedua belah pihak. Faktor-faktor Yang Mempengaruhi Kegiatan Penjualan Dalam praktek kegiatan penjualan itu dipengaruhi oleh beberapa faktor sebagai berikut[9]: a. Kondisi dan Kemampuan Penjual Transaksi jual-beli atau pemindahan hak milik secara komersial atas barang dan jasa itu pada prinsipnya melibatkan dua pihak, yaitu penjual sebagai pihak pertama dan pembeli sebagai pihak kedua. Disini penjual harus dapat menyakitkan kepada pemeblinya agar dapat berhasil mencapai sasaran

27 31 penjualan yang diharapkan. Untuk maksud tersebut penjual harus memahami beberapa masalah penting yang sangat bekaitan, yakni : 1) Jenis dan karakteristik barang yang ditawarkan. 2) Harga produk. 3) Syarat penjualan seperti: pembayaran, pelayanan sesudah penjualan, garansi dan sebagainya. b. Kondisi Pasar Pasar, sebagai kelompok pembeli atau pihak yang menjadi sasaran dalam penjualan, dapat pula mempengaruhi kegiatan penjualannya. Adapun faktorfator kondisi pasar yang perlu di perhatikan adalah: 1) Jenis pasarnya. 2) kelompok pembeli atau segmen pasarnya. 3) Daya belinya. 4) Frekuensi pembelian. 5) Keinginan dan kebutuhan. c. Modal Akan sulit bagi penjualan barangnya apabila barang yang dijual tersebut belum dikenal penjual harus memperkenalkan dulu membawa barangnya ketempat pembeli. Untuk melaksanakan maksud tersebut diperlukan adanya sarana serta usaha, seperti alat transport, tempat peragaan baik didalam perusahaan maupun di luar perusahaan, usaha promosi, dan sebagainya. Semua ini hanya dapat dilakukan apabila penjualan memiliki sejumlah modal yang diperlukan untuk itu. Seperti usaha promosi membutuhkan data penjualan dimana data penjualan bertugas untuk menjalin hubungan dengan pelanggan serta menimbulkan perasaan senang dalam diri pelanggan, karena dengan itu peluang untuk mencapai keberhasilan dalam menjual akan semakin meningkat. d. Kondisi Organisasi Perusahaan Pada perusahaan besar, biasanya masalah penjualan ini ditangani oleh bagian tersendiri (bagian penjualan) yang dipegang orang-orang tertentu/ahli di bidang penjualan.

28 32 e. Faktor Lain. Faktor-faktor lain, seperti: periklanan, peragaan, kampanye, pemberian hadiah, sering mempengaruhi penjualan. Namun untuk melaksanakannya, diperlukan sejumlah dana yang sedikit. Bagi perusahaan yang bermodal kuat, kegiatan ini secara rutin dapat dilakukan. Sedangkan bagi perusahaan kecil yang mempunyai modal relatif kecil, kegiatan ini lebih jarang dilakukan. Ada pengusaha yang berpegangan pada suatu prinsip bahwa paling penting membuat barang yang baik. Bilamana prinsip tersebut dilaksanaka, maka diharapkan pembeli akan kembali membeli lagi barang yang sama. Namun, sebelum pembelian dilakukan, sering pembeli harus dirangsang daya tariknya, misalnya dengan memberikan bungkus yang menarik atau dengan cara promosi lainnya. 2.3 Data Mining Pengertian Data Mining Data Mining sebagai proses untuk menemukan kolerasi atau pola dari ratusan atau ribuan field dari sebuah relasional basis data yang besar. Data Mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini diketahui secara manual dari suatu basis data. Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat pada basis data. Data Mining terutama digunakan untuk mencari pengetahuan yang terdapat dalam basis data yang besar sehingga sering disebut Knowledge Discovery Databases (KDD). Hal penting yang terkait di dalam Data Mining adalah[5] : 1. Data Mining merupakan suatu proses otomatis terhadap data yang sudah ada. 2. Data yang akan diproses berupa data yang sangat besar 3. Tujuan Data Mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat. Kemampuan Data Mining dalam mencari informasi bisnis yang berharga dari basis data yang sangat besar,

29 33 dapat di analogikan dengan penambangan logam mulia dari lahan sumbernya, teknologi ini dipakai untuk : a) Prediksi dan sifat-sifat bisnis. Data Mining secara otomatis melakukan proses pencarian informasi untuk memprediksi basis data dalam jumlah besar. b) Penemuan pola-pola yang diketahui sebelumnya. Data Mining menyapu basis data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu sapuan. Tahapan proses Data Mining[5]: 1. Data Cleaning, tahap pembersihan data yang konsisten. 2. Data Integration, langkah menggabungkan data dari beberapa sumber. 3. Data Selection, data yang dikembalikan lagi ke database setelah proses data cleaning. 4. Data Transformation, data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi regrasi. 5. Data Mining, merupakan proses yang digunakan untuk mengolah suatu data dengan menggunakan metode. 6. Evaluation and presentation, pengidentifikasian pola berdasarkan tindakan yang digunakan. 7. Knowledge, hasil yang dicapai berupa pengetahuan atau sebuah informasi. Sumber : Azwanti (2018) Gambar 2.2 Tahapan Proses Data Mining

30 Tugas-tugas Data Mining Tugas-tugas yang biasa dilakukan oleh data mining antara lainganti ke jurnal ini [10] : 1. Klastering Mengelompokkan obyek ke dalam beberapa kelompok berdasarkan kemiripan antar obyek, dimana dalam satu klaster harus bersisi obyek yang saling mirip dan antar klaster obyek salin mirip. Klastering ini memerlukan data pelatihan yang sudah diberi label. 2. Klasifikasi Klasifikasi data merupakan suatu proses yang menemukan properti-properti yang sama pada sebuah himpunan obyek di dalam sebuah basis data dan mengklasifikasikannnya ke dalam kelas-kelas yang berbeda menurut model klasifikasi yang ditetapkan. Tujuan dari klasifikasi adalah untuk menemukan model dari training set yang membedakan atribut ke dalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan atribut yang kelasnya belum diketahui sebelumnya. Beberapa metode klasifikasi umum digunakan dalam data mining adalah : pengklasifikasi pohon keputusan, pengklasifikasi bayesian, pengklasifikasi k- nearest neighbour, penalaran berbasis kasus, algoritma genetika dan teknik logika fuzzy.(azwanti, 2018:34). 3. Regresi Regresi pada dasarnya mirip dengan klasifikasi, yakni memerlukan data pelatihan yang sudah diberi label. Bedanya, output klasifikasi adalah nilai diskrit, sedangkan output dari regresi adalah nilai kontinyu. Regresi ini mencari model hubungan antara atribut dependent, dimana atribut depedent nya juga berupa nilai kontinyu. 4. Asosiasi Melakukan asosiasi antar obyek dalam suatu data set, biasanya data franksaksional. Asiosi dilakukan dengan menghitung berapa kali dalam suatu set data suatu transaksi yang mengandung dua item atau lebih yang berhubungan. Sering ada yang menyebut Market Basket.

31 Manfaat Data Mining Data mining juga bisa dimanfaatkan untuk menyelesaikan masalah dalam kebutuhan dibidang bisnis, misalnya : 1. Mengetahui hilangnya pelanggan dikarenakan adanya pesaing. 2. Mengetahui item suatu produk yang memiliki keamanan karakteristik. 3. Mengidentifikasi produk-produk yang sudah terjual dengan produk lainnya. 4. Untuk memprediksi dari tingkat penjualan. 5. Menilai tingkat resiko dalam menentukan jumlah produksi pada suatu item. 6. Memprediksi perilaku bisnis dimasa depan Jenis Atau Teknik Data Mining Teknik yang digunakan dalam data mining erat kaitanya dengan penemuan (discovery) dan pembelajaran (Learning) yang berbagi dalam tiga metode utama pembelajaran yaitu [11]: 1. Supervised Learning Adalah teknik yang paling banyak digunakan. Teknik ini sama dengan programing by example. Teknik ini melibatkan fase pelatihan dimana data pelatihan historis yang karakter-karakternya dipetakan ke hasil-hasil yang telah diketahui diolah dalam algoritma data mining. Proses ini melatih algoritma untuk mengenali variabel-variabel dan nilai-nilai kunci yang nantinya akan digunakan sebagai dasar dalam perkiraan-perkiraan ketika diberikan data baru. 2. Unsupervised Learning Teknik pembelajaran ini melibatkan fase pelatihan seperti yang terdapat pada supervised learning. Teknik ini bergantung pada penggunaan algoritma yang mendeteksi semua pola, seperti association dan sequences, yang muncul dari kriteria penting yang spesifik dalam data masukan. Pendekatan ini mengarah pada pembuatan banyak aturan (rules) yang mengkarakterisasikan penemuan association, cluster, dan segments. Aturan-aturan ini kemudian dianalisis untuk menemukan hal-hal penting.

32 36 3. Reinforcement Learning Teknik pembelajaran ini jarang digunakan dibandingkan dengan dua teknik lainya, namun memiliki peranan-peranan yang terus dioptimalkan dari waktu ke waktu memiliki control adaptif. Teknik ini sangat menyerupai kehidupan nyata yaitu seperti on job training, dimana seorang pekerja diberikan sekumpulan tugas yang membutuhkan keputusan keputusan yang telah dibuatnya sehubungan dengan hasil performace pekerja tersebut. Reinformace learning sangat tepat digunakan untuk menyelesaikan masalahmasalah yang sulit bergantung pada waktu. 2.4 Klasifikasi Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan hasilnya untuk diklasifikasi. Dalam klasifikasi, keluaran dari setiap data adalah bilangan bulat atau diskrit. Dalam contoh pengambilan keputusan untuk main bola atau maka keluaran tersebut bisa diubah ke bilangan bulat 1 atau -1 dengan melihat keluaran yang berupa bilangan bulat kita bisa menerapkan method klasifikasi. 2.5 Decision Tree Decision Tree merupakan metode klasifikasi yang paling sering diguanakan. Dalam pengerjaannya memerlukan waktu yang lama dan hasilnyapun mudah untuk dipahami dan banyak penelitian dalam kasus ini sering menggunakan Decision Tree untuk mendapatkan hasil yang maksimal. Secara umum Algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut[12]: 1. Pilih atribut sebagai akar 2. Buat cabang untuk masing-masing nilai 3. Bagi kasus dalam cabang

33 37 4. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama. Tiga jenis Node pada Decision Tree : a. Root Node, merupakan Node paling atas, pada Node ini ada masukan dan bisa mempunyai luaran lebih dari satu. b. Internal Node, merupakan Node percabangan, pada Node ini hanya terdapat satu masukan dan mempunyai luaran minimal 2. c. Leaf Node atau terminal Node, merupakan Node terakhir, pada Node ini hanya terdapat satu masukan dan mempunyai luaran. Dalam induksi Decision Tree adalah bagaimana menyatakan syarat pengujian pada Node. Ada 3 kelompok penting syarat pengujian Node: 1. Fitur biner Memiliki 2 nilai berbeda disebut dengan fitur biner. Syarat pengujian ketika fitur ini menjadi Node (akar maupun internal) hanya punya dua pilihan cabang. 2. Fitur bertipe kategorikal Fitur yang nilainya bertipe ketegorikal (nominal atau ordinal) bisa mempunyai beberapa nilai berbeda. 3. Fitur bertipe numeric Fitur bertipe numerik, syarat pengujian dalam Node (akar maupun internal) dinyatakan dengan perbandingan pengujian (A<v) atau (A v) dengan hasil biner, atau untuk multi dengan hasil berupa jangkauan nilai bentuk vi A <v i+1, untuk i=1,2,.,k. 2.6 Knowledge Discovery In Database (KDD) Knowledge Discovery In Databases (KDD) adalah proses non trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data. Knowledge Discovery In Database (KDD) merupakan kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran besar serta hubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan visualisasi dai pola-pola sejumlah kumpulan data[13].

34 38 Secara umum tahapan-tahapan proses Knowledge Discovery in Databases terdiri dari : 1. Data Cleaning Proses menghilangkan noise dari data yang konsisten. 2. Data Integration Penggabungan Data dari berbagai database ke dalam satu database baru. 3. Data Selection Proses pemilihan data yang relevan yang didapat dari database. 4. Data Transformation Data diubah ke dalam format yang sesuai untuk diproses dalam Data Mining. 5. Data Mining Suatu metode yang diterapkan untuk menemukan pengetahuan berharga yang tersembunyi dari data. 6. Pattern Evaluation Mengidentifikasi pola-pola menarik untuk dipresentasikan ke dalam knowledge based. 7. Knowledge Presentation Visualisasi dan penyajian pengetahuan mengenai teknik yang digunakan untuk memperoleh pengetahuan yang diperoleh oleh user. 2.7 Rapid Miner Rapid Miner merupakan perangkat lunak yang dibuat oleh Dr. Markus Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari rapid-i.com dengan tampilan GUI (Graphical User Interface) sehingga memudahkan pengguna dalam mengguanakan perangkat lunak ini. Perangkat lunak ini bersifat open source dan dibuat dengan menggunakan program java dibawah lisensi GNU Public Licence dan Rapid Miner dapat dijalankan di sistem operasi manapun. Dengan menggunakan Rapid Miner, dibutuhkan kemampuan koding khusus, karena semua fasilitas sudah disediakan. Rapid Miner dikhususkan untuk penggunaan data mining. Model yang disediakan juga cukup banyak dan lengkap, seperti Model Bayesian, Modelling,

35 39 Tree Induction, Neural Network dan lain-lain. Banyak metode yang disediakan oleh Rapid Miner mulai dari klasifikasi, klustering, asosiasi dan lain-lain. Jika ada model atau model algoritma yang ada dalam Weka, pengguna boleh menambahkan moduln lain, karena weka bersifat open source, jadi sapapun dapat ikut mengembangkan perangkat lunak ini. Gambar 2.3 Tampilan Utama Rapid Miner 2.8 Kerangka Pemikiran Kerangka pemikiran merupakan alur pikir penulis yang dijadikan sebagai skema pemikiran atau dasar-dasar pemikiran untuk memperkuat indikator yang melatar belakangi penelitian ini. Dalam kerangka pemikiran ini penulis mencoba menjelaskan masalah pokok penelitian.

36 Gambar 2.4 Kerangka Pemikiran 40

37 41 BAB III METODE PENELITIAN 3.1 Objek Penelitian Dalam penyusunan laporan penelitian ini penulis melakukan penelitian dengan mengambil objek penelitian pada Toko Deshop Cikarang yang betempat di Desa Kukun Kecamatan Cikarang Kabupaten Bekasi. 3.2 Jenis Data Dalam pembuatan penelitian ini metode pengumpulan data yang digunakan penulis adalah metode pengumpulan dengan cara menggabungkan data dari sumber data primer dan sumber data sekunder yang menunjang pada tujuan penelitian. 1. Sumber Data Primer Dalam penulisan penelitian ini, penulis mengumpulkan data sebagai bahan dari pembuatan laporan dengan menggunakan metode deskriptif, yaitu teknik pengumpulan data yang digunakan adalah : a. Wawancara (Interview) Adalah teknik pengumpulan data yang sangat penting dalam penelitian kualitatif yang melibatkan manusia sebagai subjek. b. Studi Pustaka Adalah teknik pengumpulan data yang dilakukan dengan menghimpun, mempelajari, dan menganalisis dokumen-dokumen baik dokumen tertulis, gambar maupun elektronik seperti buku-buku referensi, jurnal-jurnal, dan media lainnya yang berkaitan dengan onyek penelitian. c. Observasi Adalah pengamatan langsung suatu kegiatan yang sedang dilakukan.

38 42 2. Sumber Data Sekunder Dalam pengumpulan data sekunder penulis menggunakan cara dokumentasi yaitu mengumpulkan bahan-bahan yang tertulis berupa data/laporan yang diperoleh dari Papermooth selama melakukan kegiatan penelitian. Selain itu penulis juga melihat referensi dari penulisan penelitian sebelumnya yang berkaitan dengan judul. 3.3 Metodologi Penelitian Metode yang digunakan dalam penelitian ini adalah metode penelitian KDD (Knowledge Discovery in Database), yang mencakup beberapa aktivitas yaitu seleksi, praproses, transformasi, data mining, interprestasi dan evaluasi. 1. Pengumpulan Data Pengumpulan data adalah mengumpulkan data-data yang akan digunakan dalam proses algoritma klasifikasi C Seleksi Data Seleksi data adalah data yang akan digunakan dalam proses algoritma klasifikasi C4.5. Tujuan dari seleksi data adalah menciptakan himpunan data target, pemilihan himpunan data, atau memfokuskan pada subset variabel atau sampel data, dimana penemuan (discovery) akan dilakukan. 3. Transformasi Data Transformasi data adalah proses mentransformasi atau mengubah data ke dalam bentuk yang sesuai, agar dapat di proses dengan perhitungan algoritma C Perhitungan Entropy dan Information Gain Perhitungan semua atribut/variabel, entropy menggunakan rumus 1 dan information gain menggunakan rumus 2 untuk mengetahui information gain tertinggi yang akan di jadikan simpul akar pada pembuatan pohon keputusan. 5. Pohon Keputusan (Decision Tree) Pohon keputusan adalah hasil dari proses perhitungan entropy dan information gain, setelah perhitungan berulang-ulang sampai semua

39 43 atribut pohon memiliki kelas dan bisa lagi dilakukan proses perhitungan. 6. Aturan-aturan/Rule Model Aturan-aturan/Rule model adalah uraian penjelasan yang merepresentasikan sebuah pohon keputusan. 7. Validasi dan Pengujian Validasi dan pengujian adalah pengujian yang dilakukan untuk mengetahui semua fungsi bekerja dengan baik atau. Validasi dilakukan dengan Ten-fold Cros Validation. Ten-fold Cross Validation adalah validasi yang dilakukan dengan cara membagi suatu set data menjadi sepuluh segmen yang berukuran sama besar dengan cara melakukan pengacakan data, validasi dan pengujian dilakukan untuk mengetahui tingkat akurasi, presisi, dan recall dari hasil prediksi klasifikasi. Akurasi adalah presentasi dari catatan yang diklasifikasi dengan benar dalam pengujian dataset, persisi adalah presentasi data yang diklasifikasikan sebagai model baik yang sebenarnya juga baik. Recall adalah pengukuran tingkat berpengenalan positif sebenarnya. 8. Analisis Hasil Pengujian Analisa yang dilakukan untuk memastikan bahwa hasil pengujian benarbenar sesuai dengan pembahasan. Analisa dilakukan dengan melakukan perhitungan kembali hasil validasi dan pengujian (akurasi, presisi, dan recall) secara manual, apakah perhitungan yang dilakukan akan menghasilkan nilai yang sama atau, dibantu dengan Confusion Matrix. Confusion Matrix adalah model yang akan membentuk matrix yang terdiri true positif atau tupel positif dan true negatif atau tupel negatif. Confusion matrix berisi informasi aktual (actual) dan prediksi (predicted) pada sistem klasifikasi. Confusion Matrix dapat memvisualisasi kinerja algoritma klasifikasi.

40 Analisis Data Knowledge Discovery in Database (KDD) Dalam pengumpulan data terdapat sebanyak 290 data memiliki 5 attribut. Setelah data di dapatkan maka ada beberapa tahapan preparation data. Preparation data merupakan tahapan untuk mendapatkan data yang berkualitas dan mempermudah proses perhitungan data mining, maka dapat dilakukan beberapa teknik sebagai berikut : A. Data Cleaning Pada tahap ini dilakukan proses pembersihan data untuk memastikan data yang telah dipilih layak atau dalam proses pemodelan data mining. Dalam penelitian ini dilakukan pembersihan data dengan cara menghilangkan data yang lengkap (missing value). B. Data Selection Berikut adalah tabel 3.1 yang merupakan tabel attribut yang akan digunakan dalam proses perhitungan decision tree C4.5. Tabel 3.1 Atribut Yang Digunakan No Atribut Tipe 1 Merek Text 2 Nama Produk Text 3 Jenis Produk Text 4 Harga Currency 5 Terjual Numeric Tabel 3.2 Data Penjualan

41 No Nama produk merek jenis produk Harga Jumlah Terjual Terjual 1 Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah gelatin kopi deshop masker wajah cuka apel bragg toner air mawar deshop toner spatula deshop aksesoris mangkok masker deshop aksesoris bandana deshop aksesoris pinset komedo deshop aksesoris kuas masker deshop aksesoris cup masker deshop aksesoris Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah cup masker deshop aksesoris Tabel 3.3 Klasifikasi Berdasarkan Jenis Produk Jenis Produk Laris Status Penjualan Kurang Laris Masker Toner 12 8 Aksesoris Tabel 3.4 Klasifikasi Berdasarkan Jumlah Terjual Status Penjualan

42 Jumlah Terjual Laris Kurang Laris Tabel 3.5 Klasifikasi Berdasarkan Nama Produk Nama Produk Laris Status Penjualan Tidak Laris Peel off mask oatmeal 7 3 Peel off mask vit c 7 3 +collagen peach 8 2 Tea tree oil 4 6 blueberry 3 7 lavender 6 4 strawberry shuffle 6 4 vanila milk 7 3 chocolate milted 6 4 golden beauty 6 4 greentea clay 4 6 es corbet whitening 4 6 egg white honey 4 6 cremy cofee 6 4 avocado recipes 5 5 gelatin original 4 6 gelatin charcoal 6 4 gelatin coklat 6 4 gelatin strawberry 7 3

43 gelatin greentea 8 2 gelatin kopi 4 6 Tabel 3.6 Klasifikasi Berdasarkan Jenis Aksesoris Jenis Aksesoris Laris Status Penjualan Tidak Laris Spatula 5 5 Mangkok masker 5 3 Bandana 10 0 Pinset komedo 0 7 Kuas masker 5 5 Cup masker 5 5 Tabel 3.7 Klasifikasi Berdasarkan Jenis Toner Jenis Toner Laris Status Penjualan Tidak Laris Cuka apel 7 3 Air mawar 5 5 Tabel 3.8 Klasifikasi Berdasarkan Merek Merek Laris Status Penjualan Tidak Laris Philochaly Lea gloria Deshop Cikarang 66 64

44 Tabel 3.9 Klasifikasi Berdasarkan Harga Harga Laris Status Penjualan Tidak Laris HR (harga rendah) HT (harga tinggi) HS ( harga Sedang) C. Mining Process Pada tahap ini peneliti menentukan teknik data mining yang digunakan untuk mengolah data yang sudah disiapkan sebelumnya. Dan yang sudah disiapkan untuk klasifikasi dibagi menjadi dua data, untuk data training (80%) dan untuk data testing (20%). Pembagian data training dan data testing menggunakan teknik sampling random sistematik. Cara penggunaan teknik ini yaitu dengan cara perandoman atau pengundian hanya dilakukan satu kali, yakni ketika menentukan unsur pertama dari sampling yang akan diambil. Penentuan unsur sampling selanjutnya ditempuh dengan cara memanfaatkan interval sampel. Interval sampel adalah angka yang menunjukan jarak antara nomor-nomor urut yang terdapat dalam kerangka sampling yang akan dijadikan patokan dalam menentukan atau memilih unsur-unsur sampling kedua dan seterusnya hingga unsur ke n. Interval sampel biasanya dilambangkan dengan huruf k. Interval sampel atau juga disebut sampling rasio diperoleh dengan cara membagi ukuran populasi dengan ukuran sampel yang dikehendaki (N/m). Contoh perhitungan untuk mengambil data testing adalah sebagai berikut : Jumlah data keseluruhan (N) = 290

45 Jumlah data testing = 20% 290 = 58 Jumlah sampel (n) = 58 Internal Sampling (k) = N/n =290/58 = 5 Dari hasil diatas diperoleh data testing sebanyak 58 maka sisanya dijadikan data training sebanyak = 232 setelah semua data siap dan sudah sesuai dengan tahapan pengolahan sebelumnya, data yang sudah melalui proses pengolahan kemudian akan dilakukan perhitungan dengan menggunakan tools rapidminer. Dua langkah yang dilakukan pada tahap ini ialah : 1. Perhitungan decision tree secara manual Data yang akan digunakan dalam perhitungan secara manual yaitu 5 sampel data testing yang diambil 20% dari dataset penjualan Gerai Busana Muslim secara acak oleh peneliti. 2. Pengujian decision tree menggunakan Rapidminer Pengujian dengan menggunakan rapidminer bertujuan untuk memudahlan dan membandingkan dalam pemrosesan data secara manual. D. Pattern Evaluation Melakukan pengujian terhadap model-model yang bertujuan untuk mendapatkan model yang paling akurat. Pada tahap evaluasi, akan diketahui apakah hasil dari tahap pemodelan dapat menjawab tujuan yang telah ditetapkan pada tahap pertama. Untuk itu akan dilakukan pola pada decision tree yang telah terbentuk, sehingga diharapkan mendapatkan informasi atau pola yang berguna sebagai prediksi produk ter untuk mengelola modal usaha pada Gerai Busana Muslim. E. Knowledge presentation Visualisasi dan penyajian pengetahuan berdasarkan hasil yang telah didapat pada tahap sebelumnya utnuk memperoleh pengetahuan yang telah di peroleh.

46 3.5 Tahapan Penelitian Gambar 3.3 Tahapan Penelitian 3.6 Kebutuhan Software dan Hardware 1. Kebutuhan software yang diperlukan adalah sebagai berikut : a. Sistem operasi windows 10 versi 64 bit b. Rapidminer 9.0 c. Microsoft Office Kebutuhan hardware yang diperlukan dalam penelitian ini adalah sebagai berikut : a. Laptop intel dual core b. RAM 2 GB

47 BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian Metode penelitian yang penulis lakukan menghasilkan informasi dan data yang digunakan sebagai acuan penulis sebagai dasar penelitian. Penelitian ini mengguanakan semua data dari data penjualan Deshop Cikarang yaitu sebanyak 290 data sebagai data Training untuk proses klasifikasi, dan 20% dari data training untuk dijadikan data testing. Gambar 4.1 Dataset No Nama produk merek jenis produk Harga Jumlah Terjual Terjual 1 Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah gelatin kopi deshop masker wajah cuka apel bragg toner air mawar deshop toner spatula deshop aksesoris mangkok masker deshop aksesoris bandana deshop aksesoris pinset komedo deshop aksesoris kuas masker deshop aksesoris cup masker deshop aksesoris Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah cup masker deshop aksesoris

48 Gambar 4.2 Data Testing Nama produk merek jenis produk Harga Terjual cuka apel bragg toner HT cuka apel bragg toner HT cuka apel bragg toner HT air mawar deshop toner HR air mawar deshop toner HR air mawar deshop toner HR bandana deshop aksesoris HR bandana deshop aksesoris HR cup masker deshop aksesoris HR cup masker deshop aksesoris HR gelatin charcoal deshop masker wajah HT gelatin charcoal deshop masker wajah HT gelatin coklat deshop masker wajah HT gelatin greentea deshop masker wajah HT gelatin greentea deshop masker wajah HT gelatin kopi deshop masker wajah HT gelatin original deshop masker wajah HT gelatin strawberry deshop masker wajah HT kuas masker deshop aksesoris HR mangkok masker deshop aksesoris HR mangkok masker deshop aksesoris HR pinset komedo deshop aksesoris HR spatula deshop aksesoris HR spatula deshop aksesoris HR spatula deshop aksesoris HR avocado recipes lea gloria masker wajah HR avocado recipes lea gloria masker wajah HR avocado recipes lea gloria masker wajah HR chocolate milted lea gloria masker wajah HR chocolate milted lea gloria masker wajah HR crèmy coffe lea gloria masker wajah HR crèmy coffe lea gloria masker wajah HR egg white honey lea gloria masker wajah HR es corbet whitening lea gloria masker wajah HR es corbet whitening lea gloria masker wajah HR golden beauty lea gloria masker wajah HR greentea clay lea gloria masker wajah HR greentea clay lea gloria masker wajah HR strawberry shuffle lea gloria masker wajah HR strawberry shuffle lea gloria masker wajah HR strawberry shuffle lea gloria masker wajah HR vanila milk lea gloria masker wajah HR vanila milk lea gloria masker wajah HR blueb philochaly masker wajah HR blueb philochaly masker wajah HR laven philochaly masker wajah HR laven philochaly masker wajah HR Peel off mask oatme philochaly masker wajah HR Peel off mask oatme philochaly masker wajah HR Peel off mask oatme philochaly masker wajah HR peach philochaly masker wajah HR Tea tr philochaly masker wajah HR Tea tr philochaly masker wajah HR Tea tr philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR

49 Data diatas adalah data testing, data testing adalah data 20% dari keseluruhan, total populasi data testing berjumlah 58 data. Data testing dipilih secara acak Root Node Berikut adalah tampilan hasil perhitungan entropy dan gain yang lengkap dalam bentuk tabel. Gambar 4.3 Tabel Perhitungan Algoritma C4.5 Node 1 No ATRIBUTE VALUE 1 JUMLA H KASUS ( S ) Tidak Laris (S1) Laris (S2) E(S1) = E(S2) = (-S1/S)*LOG2 (S1/S) (-S2/S)*LOG2 (S2/S) ENTROPY (E) TOTAL , , , Masker wajah , , , jenis produk Toner , , , Aksesoris , , , TOTAL GAIN E (TOTAL) - (jumlah G) 0, merek Pilochaly Bragg Dheshop , , , Lea Gloria , , , , Peel off mask oatmeal Peel off mask vit c +collagen peach Tea tree oil blueberry lavender strawberry shuffle , , , vanila milk chocolate milted golden beauty greentea clay es corbet whitening egg white honey crèmy coffe Nama Produk avocado recipes gelatin original gelatin charcoal gelatin coklat gelatin strawberry gelatin greentea gelatin kopi cuka apel air mawar , , , spatula mangkok masker bandana pinset komedo kuas masker cup masker HR ,5 0, , Harga HT , , , HS Berikut hasil perhitungan Node 1 sebagai berikut : Total jumlah (S) 58 Jumlah Laris (S1) 39 Jumlah Tidak Laris (S2) 19 Entropy Total = ( 0, , = ( = 0,

50 1. Entropy Jenis Produk Entropy Masker Wajah = ( = ( = 0, Entropy Toner = ( = ( = 0, Entropy Aksesoris = ( = ( = 0, Gain Total (jenis produk) = Entropy (S) - *Entropy = 0, = 0, Entropy Merek Entropy Pilochaly = ( = ( = 0 Entropy Bragg = ( = ( = 0 Entropy Deshop = ( = ( = 0, Entropy Lea Gloria = ( = ( = 0,

51 3. Perhitungan Harga HR Entropy (HR) = = -0, HT Entropy (HT) = HS = 0, Entropy (HT) = = 0 Gain Total (Harga) = Entropy (S) - *Entropy = 0, = 0, Nilai Gain yang dijdikan node akar pertama yaitu Harga, untuk node akar selanjutnya dilakukan perhitungan lagi dan seterusnya dengan menghitung nilai value HR dan HT. Adapun hasil dari perhitungan node 1.1 sebagai berikut : NO ATRIBUTE VALUE JUMLAH KASUS ( S ) Tidak Laris (S1) Laris (S2) E(S1) = E(S2) = (-S1/S)*LOG2 (- S2/S)*LOG2 (S1/S) (S2/S) ENTROPY (E) 1 Harga HR ,5 0, , jenis produk Masker wajah , , , Toner , , , Aksesoris , , , Nama Produk air mawar , , bandana cup masker kuas masker mangkok masker pinset komedo spatula avocado recipes chocolate milted creamy coffe egg white honey es corbet whitenin golden beauty greentea clay strawberry shuffle , , , vanila milk merek deshop , , , lea gloria , , , TOTAL GAIN E (TOTAL) - (jumlah G) -0, , ,

52 Gambar 4.4 Tabel Perhitungan Algoritma C4.5 Node 1.1 Selanjutnya adalah menyelesaikan untuk menghitung node 1.1 sebagai akar, sama dengan cara yang diatas dengan menghitung nilai entropy dari attribut yang tersisa yaitu air mawar dan strawberry shuffle pada attribut nama produk. NO ATRIBUTE VALUE JUMLAH KASUS ( S ) Laris (S1) Laris (S2) E(S1) = E(S2) = (-S1/S)*LOG2 (S1/S) (- S2/S)*LOG2 (S2/S) ENTROPY (E) TOTAL GAIN E (TOTAL) - (jumlah G) 1 Nama Produk air mawar , , , Jenis Produk toner , , , merek deshop , , , Gambar 4.5 Tabel Perhitungan Algoritma C4.5 Node 1.2 Selanjutnya adalah menyelesaikan untuk menghitung node 1.2 sebagai akar, dari node 1.2 terdapat Gain yang sama yaitu attribut Jenis Produk dengan value toner dan Merek dengan value deshop. Maka akar cabang nya yaitu jenis produk. Adapun hasil perhitungan node 1.3 adalah sebagai berikut : NO ATRIBUTE VALUE JUMLAH KASUS ( S ) Laris (S1) Laris (S2) E(S1) = E(S2) = (- (-S1/S)*LOG2 S2/S)*LOG2 (S1/S) (S2/S) ENTROPY (E) TOTAL GAIN E (TOTAL) - (jumlah G) 1 Nama Produk strawberry shuffle , , , Jenis Produk masker wajah , , , merek lea gloria , , , Gambar 4.6 Tabel Perhitungan Algoritma C4.5 Node 1.3 Selanjutnya adalah menyelesaikan untuk menghitung node 1.3 sebagai akar, dari node 1.3 terdapat Gain yang sama yaitu attribut Jenis Produk dengan value masker wajah dan Merek dengan value lea gloria. Maka akar cabang nya yaitu Jenis produk. Adapun hasil perhitungan node 1.4 adalah sebagai berikut :

53 Gambar 4.7 Tabel Perhitungan Algoritma C4.5 Node 1.4 Selanjutnya adalah menyelesaikan untuk menghitung node 1.4 sebagai hasil akhir, sama dengan cara yang diatas dengan menghitung nilai entropy, dari node 1.4 terdapat gain yang sama yaitu Jenis Produk dan Merek, maka untuk akar cabang dari Harga dengan value HT adalah Jenis Produk diikuti dengan Merek Rapid Miner Setelah dilakukan dengan perhitungan menggunakan excel, selanjutnya dilakukan perhitungan menggunakan aplikasi rapid miner. Adapun langkah-langkah dalam mengolah data menggunakan Rapid Miner adalah sebagai berikut : 1. Seluruh data training yang akan di proses oleh Rapid Miner disimpan terlebih dahulu di microsoft Excel dengan format.xlsx. adapun data training yang dimaksud penulis memberi nama data data testing.xlsx data tersebut nantinya akan dihitung menggunakan software aplikasi RapidMiner Buka aplikasi RapidMiner 9.0 dan akan muncul tampilan sebagai berikut :

54 Gambar Halaman Utama RapidMiner Selanjutnya pilih Blank lalu pilih menu add data lalu cari dimana data testing.xlsx berada pilih dan klik selanjutnya akan muncul kotak dialog select the cell to import pilih dan klik next. Gambar Halaman Select the cells to import data

55 2. Selanjutnya pada format your columns pada atribut terjual klik tanda panah kebawah lalu pilih change role lalu pilih label klik ok, klik next lalu klik finish Gambat kotak dialog import data 3. Drag data testing.xlsx pada menu repository yang sudah kita masukkan kedalam rapidminer, operator yang digunakan adalah split validation, operator tersebut berguna sebagai pengukur ke akuratan sebuah model yang sedang dijalanka.

56 Gambar Process Read excel 4. Kemudian didalam operator split validation terdapat process, pada process tersebut membutuhkan operator yang dapat menghasilkan tujuan pengujian. Karena pada penelitian ini menggunakan perhitungan algoritma C4.5 maka operator yang digunakan adalah operator decision tree yang digunakan untuk menentukan pohon keputusan, tambahkan juga apply model dan performance untuk mengetahui tingkat akurasinya. Pilih dan klik run.

57 Gambar Process Validation Evaluasi model dengan Confusion matrix Model Confusion matrix akan membentuk matrix yang terdiri dari true positif atau tupel positif dan true negatif atau tupel negatif. Keterangan : TP : True Positive TN : True Negative FP : False Positive FN : False Negative Berikut dibawah ini merupakan hasil dari Confusion matrix pada algoritma C4.5: a. Accuracy Accuracy didefinisikan sebagai tingkat kedekatan antara nilai prediksi dengan nilai aktual. Dari data yang tersedia, analisis menggunakan aplikasi Rapid Miner dengn penukuran Decision Tree didapatkan hasil dengan tingkat akurasi 94.44%. Perhitungan akurasi dilakukan dengan cara membagi jumlah data yang diklasifiasi secara benar dengan total data sample yang di uji.

58 Gambar Tabel Hasil Akurasi Data Testing Class Precission didapat dengan hasil prediksi sebesar % dan prediksi sebesar 90%. Presisi dapat diartikan sebagai kecocokan antara permintaan tersebut, jadi kecocokan anatara permintaan dan prediksi % dan kecocokan dengan prediksi adalah 90.00%. Recal didefinisikan sebagai rasio dari item relevan yang dipilih terhadap total jumlah item relevan yang tersedia. Jadi dari data yang tersediadapat disimpulkan bahwa tingkt relevan True sebesar 88.89% dan True sebesar %. b. Recall Reacall dihitung dengan cara membagi data benar yang bernilai positif ( true positif) dengan hasil penjumlahan dari data benar yang bernilai positif (true positif) dan data salah yang bernilai negative (false negative). Dari data yang ada didapat hasil dengan tingkat pracission sebesar % seperti terlihat pada gambar dibawah ini Gambar Tabel Hasil Recall Data Testing Class Precission didapat dengan hasil prediksi sebesar % dan prediksi sebesar 90.00%. Presisi dapat diartian sebagai kecocokan

59 antara permintaan informasi dengan jawaban terhadap permintaan tersebut, jadi kecocokan antara permintaan dan prediksi adalah100.00% dan kecocokan dengan prediksi adalah 90.00%. Recal didefinisikan sebagai rasio dari item relevan yang dipilih terhadap total jumlah item relevan yang tersedia. Jadi dari data yang tersediadapat disimpulkan bahwa tingkt relevan True sebesar 88.89% dan True sebesar %. c. Precision Nilai Precision dihitung dengan cara membagi data benar yang bernilai positif (true positif) dibagi dengan jumlah data yang bernilai positif (true positif ) dan data salah yang bernilai (false positif). Dari data yang ada didapat hasil dengan tingkat precission sebesar 90.00%. Seperti terlihat gambar dibawah ini Gambar Tabel Hasil Precision Data Testing Class Precission didapat dengan hasil prediksi sebesar % dan prediksi sebesar 90%. Presisi dapat diartikan sebagai kecocokan antara permintaan tersebut, jadi kecocokan anatara permintaan dan prediksi % dan kecocokan dengan prediksi adalah 90.00%. Recal didefinisikan sebagai rasio dari item relevan yang dipilih terhadap total jumlah item relevan yang tersedia. Jadi dari data yang tersediadapat disimpulkan bahwa tingkt relevan True sebesar 88.89% dan True sebesar %.

60 Gambar 4.19 Tree View RapidMiner 4.2 Pembahasan Hasil Pengujian Berdasarkan Hasil Pengujian yang telah dibuat maka dapat di ambil sebuah kesimpulan bahwa hasil pengujian sangat baik karena rule yang di hasilkan sama berdasarkan dua perhitungan manual dan rapid miner. a. Algoritma C.45 sangat efektif digunakan dalam memprediksi produk ter pada Deshop Cikarang. b. Pengujian prediksi produk ter dengan rapidminer menggunakan metode decision tree C.45, diperoleh akurasi sebesar 94.44% menggunakan confusion matrix.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Sebelum melakukan penelitian adapun penulis mencari penelitian penelitian yang memungkinkan terkait dengan penelitian antara lain : 1. Analisis Kinerja Data

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret

Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret 2013 12 PENERAPAN ALGORITMA C 4.5 DALAM MEMPEROLEH DECISION TREE UNTUK MEMPREDIKSI PENENTUAN RESIKO KREDIT PADA BANK BPR BUKITTANDANG MANDIRI PADANG MENGGUNAKAN

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media

Lebih terperinci

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA Ade Putra Fakultas Vokasi, Program Studi Komputerisasi Akuntansi Universitas Bina Darma

Lebih terperinci

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA IMPLEMENTATION OF DATA MINING WITH C4.5 ALGORITHM TO PREDICT STUDENT ACHIEVEMENT Oleh: SITI MUHIMATUL KHOIROH NPM

Lebih terperinci

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung

Lebih terperinci

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5

PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5 PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5 Annisak Izzaty Jamhur Universitas Putera Indonesia YPTK Padang e-mail: annisakizzaty@yahoo.com Abstract

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan

Lebih terperinci

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout  Data mining BAB 1 PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, identifikasi masalah, ruang lingkup tugas akhir, maksud dan tujuan tugas akhir, metode penelitian tugas akhir, dan sistematika penulisan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Pada bab ini akan dijelaskan tahap-tahap yang dilakukan dalam melakukan penelitian. Tahapan penelitian berguna agar pelaksanaan penelitian dapat berjalan dengan baik dan sistematis

Lebih terperinci

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining

Lebih terperinci

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :

BAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : BAB 3 METODE PENELITIAN 3.1 Instrumen Penelitian Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : 3.1.1 Bahan Bahan yang digunakan dalam penelitian ini yaitu data siswa kelas SMA

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN

Lebih terperinci

3.1 Metode Pengumpulan Data

3.1 Metode Pengumpulan Data BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data Sebuah penelitian memerlukan pengumpulan data dan metode pengumpulan data karena sangat berpengaruh terhadap akurasi dan kualitas data yang digunakan

Lebih terperinci

BAB III METODE PENELITIAN. ini dilaksanakan dari bulan Agustus Oktober 2016.

BAB III METODE PENELITIAN. ini dilaksanakan dari bulan Agustus Oktober 2016. BAB III METODE PENELITIAN 3.1. Tempat dan Waktu Penelitian Penelitian ini dilaksanakan di Universitas Muhammadiyah Yogyakarta di ruang Biro Sistem Informasi, gedung AR. Fachruddin B. Adapun waktu penelitian

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

Penerapan Data Mining dalam Memprediksi Pembelian cat

Penerapan Data Mining dalam Memprediksi Pembelian cat Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Penerapan Data Mining dalam Memprediksi Pembelian cat Fitriana Harahap STMIK POTENSI UTAMA Jl. KL. Yos Sudarso KM 6,5

Lebih terperinci

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI

ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah BAB III METODOLOGI Dalam penelitian ini metodologi memegang peranan penting guna mendapatkan data yang obyektik, valid dan selanjutnya digunakan untuk memecahkan permasalahan yang telah dirumuskan. Maka

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan

Lebih terperinci

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik. BAB IV HASIL DAN PEMBAHASAN 4.1. Identifikasi Masalah Dalam menentukan status calon dosen dan dosen tetap terdapat masalahmasalah dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya sebagai

Lebih terperinci

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana

BAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN

PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN Fina Nasari 1 1 Sistem Informasi, STMIK Potensi Utama 3 Jalan K.L. Yos Sudarso KM.

Lebih terperinci

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM :

Manajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : Manajemen Data Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : 1011601026 MAGISTER ILMU KOMPUTER UNIVERSITAS BUDI LUHUR 2011 DIT TI / DJHKI SKPL-DJHKI-01.04.2011.xx Halaman 0

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,

Lebih terperinci

2. Data & Proses Datamining

2. Data & Proses Datamining 2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien 1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang. Pertumbuhan pasar swalayan dewasa ini telah meningkat dengan pesat di

BAB 1 PENDAHULUAN Latar Belakang. Pertumbuhan pasar swalayan dewasa ini telah meningkat dengan pesat di BAB 1 PENDAHULUAN 1.1. Latar Belakang Pertumbuhan pasar swalayan dewasa ini telah meningkat dengan pesat di Indonesia, ditandai dengan semakin banyak dan menjamurnya pasar swalayan di berbagai tempat.

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. 1.1 Latar Belakang BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal

Lebih terperinci

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan. BAB I PENDAHULUAN A. Latar Belakang Dengan kemajuan teknologi informasi dewasa ini kebutuhan akan informasi yang akurat sangat dibutuhkan, dikarenakan informasi akan menjadi suatu elemen penting dalam

Lebih terperinci

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

POHON KEPUTUSAN DENGAN ALGORITMA C4.5 POHON KEPUTUSAN DENGAN ALGORITMA C4.5 1. Pengantar Algoritma C4.5 Klasifikasi merupakan salah satu proses pada data mining yang bertujuan untuk menemukan pola yang berharga dari data yang berukuran relatif

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD) Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan Sistem Pendukung Keputusan (SPK) / Decision Support Sistem (DSS) adalah sistem komputer yang saling berhubungan dan menjadi alat bantu bagi seorang

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

a. Prosesor yang digunakan adalah Intel Core i3 1.9 Ghz b. RAM dengan ukuran 2GB c. Harddisk dengan ukuran 500GB d. Layar monitor 14.

a. Prosesor yang digunakan adalah Intel Core i3 1.9 Ghz b. RAM dengan ukuran 2GB c. Harddisk dengan ukuran 500GB d. Layar monitor 14. BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Beberapa perangkat yang digunakan untuk mengerjakan tugas akhir ini adalah sebagai berikut : 1. Perangkat Lunak Dalam melakukan penelitian, peneliti menggunakan

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan

Lebih terperinci

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

2.2 Data Mining. Universitas Sumatera Utara

2.2 Data Mining. Universitas Sumatera Utara Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki

Lebih terperinci

PENERAPAN DATA MINING UNTUK MEMPREDIKSI KRITERIA NASABAH KREDIT

PENERAPAN DATA MINING UNTUK MEMPREDIKSI KRITERIA NASABAH KREDIT Jurnal Komputer dan Informatika (KOMPUTA) 53 PENERAPAN DATA MINING UNTUK MEMPREDIKSI KRITERIA NASABAH KREDIT Angga Ginanjar Mabrur [1], Riani Lubis [2] 1,2 Program Studi Teknik Informatika Fakultas Teknik

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

BAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus

BAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus BAB I PENDAHULUAN I.1. Latar Belakang Bank adalah lembaga keuangan yang usaha pokoknya adalah menghimpun dana dan menyalurkan kembali dana tersebut ke masyarakat dalam bentuk kredit serta memberikan jasa-jasa

Lebih terperinci

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung

Lebih terperinci

JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM

JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM Oleh: BENI KURNIAWAN 12.1.03.02.0201 Dibimbing oleh : 1. Resty

Lebih terperinci

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA 6 BAB 2 TINJAUAN PUSTAKA 2.1. Sistem Pendukung Keputusan Konsep Sistem Pendukung Keputusan (SPK) atau Decision Support Systems (DSS) pertama kali diungkapkan pada awal tahun 1970-an oleh Michael S. Scott

Lebih terperinci

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING Marlindawati 1) Andri 2) 1) Manajemen Informatika Universitas Bina Darma Jl. Ahmad Yani No. 3, Palembang

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Perkembangan teknologi informasi telah mampu mengubah persepsi manusia terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

Lebih terperinci

PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA. Abstrak

PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA. Abstrak JURASIK (Jurn Riset Sistem Informasi & Teknik Informatika) ISSN 2527-5771 PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA Yuni Sara Luvia 1, Dedy Hartama

Lebih terperinci

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING Marlindawati1), Andri2) 1), 2) Sistem Informasi UNIVERSITAS BINA DARMA Palembang Jl, Jend. A.Yani

Lebih terperinci

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1 Penelitian Terkait Beberapa jurnal penelitian terkait yang diperoleh tentang pemanfaatan teknik Data Mining dengan metode Association Rule menggunakan Algoritma Apriori untuk

Lebih terperinci

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK) IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK) [1] Beti Novianti, [2] Tedy Rismawan [3] Syamsul Bahri [1][2][3] Jurusan Sistem Komputer, Fakultas

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika Classification Decision Tree Classification Decision Tree Pengertian Pohon Keputusan Pohon keputusan adalah

Lebih terperinci

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

BAB IV HASIL PENELITIAN DAN PEMBAHASAN BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini

Lebih terperinci

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK Abet Alpha P Yetli Oslan Abstrak Ketepatan pemilihan rekomendasi produk bagi konsumen

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan penelitian tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat

Lebih terperinci

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009 Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu

Lebih terperinci

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:

Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN: KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas

Lebih terperinci

BAB III METODOLOGI PENELITIAN. digunakan pada proses rekomendasi penjurusan pada jenjang menengah. Merumuskan Masalah

BAB III METODOLOGI PENELITIAN. digunakan pada proses rekomendasi penjurusan pada jenjang menengah. Merumuskan Masalah A. Desain Penelitian BAB III METODOLOGI PENELITIAN Gambar 3.1 berikut ini merupakan desain penelitian yang akan digunakan pada proses rekomendasi penjurusan pada jenjang menengah atas. Merumuskan Masalah

Lebih terperinci

Kerusakan Barang Jadi

Kerusakan Barang Jadi Penerapan Algoritma C4.5 pada Analisis Kerusakan Barang Jadi (Studi Kasus: PT Kayu Lapis Asli Murni) Ivan Oktana, Seng Hansun Program Studi Teknik Informatika, Universitas Multimedia Nusantara, Tangerang,

Lebih terperinci

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering. BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci