SKRIPSI PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN PADA TOKO DESHOP CIKARANG
|
|
- Susanto Hadiman
- 3 tahun lalu
- Tontonan:
Transkripsi
1 SKRIPSI PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN PADA TOKO DESHOP CIKARANG Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Komputer Disusun oleh: Nama : Widiya Iswati NIM : PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS PELITA BANGSA KABUPATEN BEKASI 2020
2 SKRIPSI PENERAPAN DATA MINING DENGAN ALGORITMA C4.5 DALAM PREDIKSI PENJUALAN PADA TOKO DESHOP CIKARANG Diajukan untuk memenuhi salah satu syarat memperoleh gelar Sarjana Komputer Disusun oleh: Nama : Widiya Iswati NIM : PROGRAM STUDI TEKNIK INFORMATIKA FAKULTAS TEKNIK UNIVERSITAS PELITA BANGSA KABUPATEN BEKASI 2020
3
4
5
6
7
8
9 ABSTRAK Toko Deshop Cikarang adalah salah satu Toko skin care yang berada di Cikarang. Jika prediksi minat pelanggan diperhatikn dengan baik maka bisa sangat merugikan bisnis penjualan. Prediksi minat pelanggan saat ini menjadi faktor yang sangat berpengaruh pada perkembangan suatu usaha, jika suatu pelaku bisnis bisa memprediksi pada pasar maka akan mudah baginya untuk memenuhi kebutuhan pelanggan. Berdasarkan latar belakang tersebut maka dengan menerapkan teknik data mining diharapkan dapat membantu Toko Deshop untuk memprediksi minat pelanggan. Adapun teknik data mining yang digunakan prosesnya menggunakan lima langkah dalam KDD (Knowledge Discovery in Database), yang mencakup beberapa aktivitas yaitu seleksi, praproses, data mining, interprestasi dan evaluasi. Selain melakukan perhitungan secara manual, kasus penelitian ini juga diujikan menggunakan aplikasi RapidMiner. Dari hasil penelitian menggunakan Algoritma C4.5 dihasilkan nilai akurasi sebesar 94.44% sehingga penggunaan Algoritma C4.5 sangat efektif dalam memprediksi produk ter Toko Deshop Ckarang, sehingga pemilik toko hanya perlu membeli produk skin care yang untuk stok pemasaran. Kata Kunci : Data Mining, Prediksi, Penjualan, Algoritma C4.5, Klasifikasi, RapidMiner viii
10 ABSTRACT Cikarang Deshop Shop is one of the skin care shops located in Cikarang. If predictions of customer interest are not well considered, it can be very detrimental to the sales business. Prediction of customer interest is currently a very influential factor in the development of a business, if a businessperson can predict the market it will be easy for him to meet customer needs. Based on this background, implementing data mining techniques is expected to help Deshop Stores predict customer interests. The data mining technique used by the process uses five steps in KDD (Knowledge Discovery in Database), which includes several activities namely selection, preprocessing, data mining, interpretation and evaluation. In addition to performing calculations manually, this research case was also tested using the RapidMiner application. From the results of the study using the C4.5 Algorithm produced an accuracy value of 94.44% so that the use of the C4.5 Algorithm is very effective in predicting the best-selling products of Carang Deshop Store, so that shop owners only need to buy in-demand skin care products for marketing stock. Keywords: Data Mining, Prediction, Sales, C4.5 Algorithm, Classification, RapidMiner ix
11 DAFTAR ISI HALAMAN PERSETUJUAN... ii HALAMAN PENGESAHAN... iii PERNYATAAN KEASLIAN SKRIPSI... iii PERNYATAAN PERSETUJUAN PUBLIKASI... v UCAPAN TERIMAKASIH... vi ABSTRAK... viii ABSTRACT... viii DAFTAR ISI... ix DAFTAR TABEL... xii DAFTAR GAMBAR... xiii DAFTAR LAMPIRAN (Jika ada)... xiv BAB I PENDAHULUAN... i 1.1 Latar Belakang Identifikasi Masalah Batasan Masalah Rumusan Masalah Tujuan Penelitian Manfaat Penelitian... 3 BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI Penelitian Terdahulu Kajian Jurnal Pertama Kajian Jurnal Kedua Kajian Jurnal Ketiga Definisi Judul Pengertian Penerapan Algoritma C x
12 2.2.3 Prediksi Pengertian Data Pengertian Penjualan Data Mining Pengertian Data Mining Tugas-tugas Data Mining Manfaat Data Mining Jenis atau Teknik Data Mining Klasifikasi Decision Tree Knowledge Discovery In Database (KDD) Rapid Miner Kerangka Pemikiran BAB III METODE PENELITIAN Objek Penelitian Jenis Data Sumber Data Primer Sumber Data Sekunder Metodologi Penilitian Tahapan Metodologi Penelitian Analisis Data Knowledge Discovery in Database (KDD Tahapan Penelitian Kebutuhan Software dan Hardware BAB IV HASIL DAN PEMBAHASAN Hasil Penelitian Root Node Rapid Miner Pembahasan Hasil Pengujian BAB V PENUTUP Kesimpulan... 45
13 5.2 Saran DAFTAR PUSTAKA
14 DAFTAR TABEL Tabel 3. 1 Atribut Yang Digunakan Tabel 3. 2 Klasifikasi Berdasarkan Jenis Produk Tabel 3. 3 Klasifikasi Berdasarkan Jumlah Terjual Tabel 3. 4 Klasifikasi Berdasarkan Jenis Pakaian... Tabel 3. 5 Klasifikasi Berasarkan Jenis Aksesoris Tabel 3. 6 Klasifikasi Berdasararkan Jenis Toner Tabel 3. 7 Klasifikasi Berdasarkan Merek Tabel 3. 8 Klasifikasi Berdasarkan Harga xiii
15 DAFTAR GAMBAR Gambar 2. 1 Pseudocode Algoritma C Gambar 2. 2 Tahapan Proses Data Mining Gambar 2. 3 Tampilan Utama Rapid Miner Gambar 2. 4 Kerangka Pemikiran Gambar 3. 1 Tahapan Metodolodi penelitian Gambar 3. 5 Tahapan Penelitian Gambar 4. 1 Data Set Gambar 4. 2 Data Tsting Gambar 4. 3 Perhitungan Algoritma C4.5 Node Gambar 4. 4 Perhitungan Algoritma C4.5 Node Gambar 4. 5 Perhitungan Algoritma C4.5 Node Gambar 4.6 Perhitungan Algoritma C4.5 Node Gambar 4.7 Perhitungan Algoritma C4.5 Node Gambar 4. 8 Pohon Keputusan Gambar Halaman Utama RapidMiner Gambar Halaman Select the cells to import data Gambar kotak dialog import data Gambar Process Read excel Gambar Process Validation Gambar Tabel Hasil Akurasi Data Testing Gambar Tabel Hasil Recall Data Testing Gambar Tabel Hasil Precision Data Testing Gambar Tree View RapidMiner... 49
16 DAFTAR LAMPIRAN Lampiran 1 Dataset Lampiran 2 Data Testing... 48
17 BAB I PENDAHULUAN 1.1. Latar Belakang Skin Care merupakan kebutuhan pokok bagi manusia. Seiring dengan perkembangan Ilmu Pengetahuan dan Teknologi, sehingga bermunculan beragam bisnis yang menawarkan berbagai jenis skin care. Hal ini dapat kita lihat dari banyaknya produk penjual skin care, kegiatan dan aktifitas seseorang semakin banyak, sehingga dibutuhkan berbagai jenis skin care yang dapat digunakan sesuai dengan kebutuhan tersebut. Maka dari itu, ketika seseorang ingin memenuhi kebutuhan skin care, ia hanya bertindak pada fungsi dan tujuan utama dari skin care itu sendiri. Menjual suatu produk di era modernisasi ini sudah sangatlah mudah, kita bisa berjualan secara online, kita hanya memerlukan smartphone atau laptop dan koneksi internet serta barang yang akan dijual. Lebih dari itu, pemenuhan kebutuhan akan Skin Care melibatkan pertimbangan-pertimbangan lain yang dianggap penting dan perlu penyesuaian, seperti trend yang sedang berkembang pada masanya. Hal ini memberikan peluang dan kesempatan bagi para penjual serta produsen skin care untuk lebih kreatif dalam berkarya. Dalam lingkungan bisnis yang global sekarang ini, setiap perusahaan dituntut untuk mampu bersaing dalam meningkatkan kinerja dan mampu menghasilkan laporan yang sesuai, sehingga perusahaan dapat mengambil keputusan dari hasil kinerja dan laporan tersebut. Di sisi lain perkembangan teknologi informasi mempengaruhi pemrosesan data untuk menghasilkan informai yang lebih akurat, aktual, dan relevan untuk meningkatkan ketepatan atau akurasi dalam pengambilan keputusan. Dari penumpukan data yang terjadi dapat digali untuk menemukan pola-pola penjualan prouk yang dapat digunakan untuk menganalisa pasar dan meramalkan penjualan pada watu yang akan datang. Prediksi jumlah penjualan merupakan faktor penting yang menentukan kelancaran usaha suatu perusahaan. Prediksi ini sangat berguna untuk menentukan 21
18 22 berapa banyak produk yang akan dipesan pada bulan selanjutnya. Permasalahan yang umum dihadapi oleh suatu perusahaan adalah bagaimana tingkat akurasi dalam memprediksi atau meramalakan penjualan produk dimasa mendatang berdasarkan data penjualan sebelumnya. Prediksi tersebut sangat berpengaruh untuk menentukan produk mana yang dan tiak. Untuk menghasikan prediksi yang tepat tentu saja dibutuhkan kecermatan dan ketelitian. Tujuan penelitian ini adalah penulis mencoba menerapkan data mining metode decision tree Algoritma C4.5 pada Toko Deshop Cikarang dan diharapkan dapat memberikan informasi berupa prediksi penjualan menu skin care yang paling digemari pelanggan dan digemari ( dan ). Sehingga kedepannya pemilik bisnis ini dapat melakukan analisa menu mengikuti trend dan kegemaran pelanggannya. Dari latar belakang diatas, maka penulis berkeinginan untuk menyusun tugas akhir dengan judul Penerapan Data Mining Dengan Algoritma C4.5 Dalam Prediksi Penjualan pada Toko Deshop Cikarang. 1.2 Identifikasi Masalah Dari latar belakang diatas terdapat beberapa masalah yang timbul dan dapat di identifikasikan sebagai berikut : 1. Belum diketahui produk skin care mana yang paling diminati pelanggan Toko Deshop Cikarang. 2. Belum adanya suatu akurasi yang tepat dalam melihat penentuan suatu prediksi penjualan Toko Deshop Cikarang. 3. Berapakah tingkat akurasi perhitungan algoritma C4.5 untuk memprediksi data penjualan Toko Deshop Cikarang. 1.3 Batasan Masalah Adapun batasan-batasan masalah dalam penelitian ini adalah : 1. Penelitian ini banyak membantu bagi pihak penjual Toko Deshop Cikarang dalam menentukan produk mana yang banyak diminati oleh pelanggan.
19 23 2. Menguji suatu metode (dalam hal ini algoritma C4.5) prediksi penjualan Toko Deshop Cikarang 3. Hasil dari penelitian ini adalah Prediksi produk skin care mana yang banyak diminati pelanggan dan produk skin care mana yang cocok untuk distok agar laku di pasaran. 1.4 Rumusan Masalah Berdasarkan pada latar belakang masalah, maka dapat dirumuskan masalah sebagai berikut : 1. Bagaimana tingkat akurasi yang dapat membantu penjual dalam mengambil keputusan untuk memprediksi produk merek skin care mana yang banyak diminati pelanggan ( dan )? 1.5 Tujuan Penelitian Berdasarkan rumusan masalah diatas maka tujuan pada penelitian ini adalah sebagai berikut : 1. Untuk menerapkan tingkat minat produk skin care mana yang banyak diminati pelanggan Toko Deshop Cikarang. 2. Untuk mengetahui tingkat akurasi algoritma C4.5 dalam memprediksi tingkat minat pelanggan Toko Deshop Cikarang.Menerapkan algoritma C4.5 pada tingkat minat pelanggan pada Toko Deshop Cikarang. 1.6 Manfaat Penelitian Dengan tercapainya tujuan peelitian di atas, maka di harapkan akan bermanfaat bagi semua pihak, bagi Toko Deshop Cikarang maupun bagi penulis. Manfaat dari penulis ini adalah : 1. Bagi Penulis Menambah wawasan dan pengetahuan enulis tentang algoritma C4.5 untuk prediksi tingkat penjualan produk dan menerapkan ilmu yang telah didapat selama kuliah. 2. Bagi Akademik
20 24 Penelitian ini dapat memberikan infrmasi bagi peneliti atau calon peneliti lain untuk menerapkannya kedalam sistem yang lebih luas dan lebih kompleks atau sebagai bahan acuan yang dapat dikembangkan bagi kemungkinan pengembangan konsep dan materi lebih lanjut serta dapat melengkapi referensi pustaka akademik. 3. Bagi Perusahaan Untuk mendapatkan pendukung keputusan bagi Toko Deshop Cikarang untuk memperbaiki pelayanannya dalam mempertahankan pelanggan.
21 BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Penelitian Terdahulu Kajian Jurnal Pertama Nandang Iriadi, Nia Nuraeni (2016) dengan judul kajian penerapan metode klasifikasi data mining algoritma c4.5 untuk prediksi kelayakan kredit pada bank mayapada jakarta. Industri perbankan mengalami perkembangan yang cukup pesat, baik dari sisi volume usaha, mobilisasi dana masyarakat maupun pemberian kredit. Data mining mengenai pinjaman memiliki potensial besar untuk menjelajahi bagian pola yang tersembunyi dalam suatu dataset dari domain pinjaman termasuk pinjaman kredit. Algoritma C4.5 merupakan pengklasifikasian yang paling sederhana, mudah diimplemntasikan. Namun, Algoritma C4.5 masih memiliki kelemahan dalam menangani data dalam dimensi tinggi. Penelitian ini bertujuan untuk menerapkan algoritma C4.5 dengan seleksi atribut sehingga dapat mengurangi dimensi dari data, serta mengidentifikasi fitur dalam kumpulan data dengan metode algoritma C4.5. Dari penelitian ini yang dilakukan model yang terbentuk dengan algoritma C4.5 sendiri sudah memiliki akurasi yang baik yaitu sebesar 83.67% dengan proses seleksi atribut oleh algoritma C4.5.[1] Kajian Jurnal Kedua Liliana Swastina (2013) dengan judul Penerapan Algoritma C4.5 Untuk Penentuan Jurusan Mahasiswa. Banyak kasus dijumpai bahwa pemilihan jurusan yang sesuai dengan kemampuan, kepribadian, minat dan bakat dapat mempengaruhi mahasiswa dalam mengikuti perkuliahan. Penggunaan pendekatan algoritma klasifikasi data mining akan diterapkan untuk menentukan jurusan dalam bidang studi yang akan diambil oleh mahasiswa, sehingga mahasiswa salah dalam memilih jurusan yang akan di tempuh selama belajar pada perguruan tinggi. Algoritma C4.5 digunakan untuk menentukan jurusan yang akan diambil oleh mahasiswa sesuai dengan latar
22 26 belakang, minat dan kemampuannya sendiri. Parameter pemilihan jurusan adalah Indeks Prestasi Kumulatif Semester 1 dan 2. Hasil eksperimen dan evaluasi menunjukan bahwa Algoritma Decision Tree C4.5 akurat diterapkan untuk penentuan kesesuaian jurusan mahasiswa dengan tingkat akurasi 93,31 % dan akurasi rekomendasi jurusan sebesar 82,64%[2] Kajian Jurnal Ketiga Siti Mujilahwati (2017) dengan judul Pemanfaatan Algoritma ID3 untuk Klasifikasi Penjualan Obat. Toko AJ merupakan toko yang menjual berbagai macam jenis obat-obatan, ada obat pertanian, obat peternakan, dan obat tambak. Toko ini proses penjualannya sudah memakai sistem terkomputerisasi selama empat tahun terakhir. Akan tetapi pemilik toko pernah tahu bahwa data penjualan selama ini dapat digunakan untuk melakukan klasifikasi tingkat penjualan obat, yang dapat dipakai untuk menentukan ketersediaan obat. Berdasarkan data penjualan tersebut, maka penelitian ini membahas bagaimana algoritma Iterative Dichotomizer Three (ID3) dapat dimanfaatkan untuk proses klasifikasi penjualan obat apa saja yang laku dan laku. Kategori yang digunakan pada penelitian ini adalah harga, kwalitas dan animo, kelas yang dipakai adalah dan. Dataset yang digunakan selama tiga tahun sebanyak data training, dan data testing yang digunakan sebanyak 24. Akurasi yang didapat pada penelitian ini sebesar 91,6%. Kata Kunci: klasifikasi, ID3, obat, fungisida, penjualan[3]. 2.2 Definisi Judul Pengertian Penerapan Implementasi/Penerapan adalah perluasan aktivitas yang saling menyesuaikan. Pengertian implementasi sebagai ativitas yang saling menyesuaikan. Setelah sistem informasi yang baru dirancang, sistem tersebut harus diimplemantasikan sebagai sistem kerja, dan dipelihara agar dapat berjalan dengan baik[4].
23 Algoritma C4.5 Algoritma C4.5 merupakan algoritma yang digunakan untuk melakukan proses klasifikasi data dengan teknik pohon keputusan. Algoritma C4.5 merupakan ekstensi dari algoritma ID3 dan menggunakan prinsip decision tree yang mirip. Algoritma ini sudah sangat terkenal dan disukai karena memiliki banyak kelebihan. Kelebihan ini misalnya dapat mengolah data numerik dan diskret, dapat menangani nilai atribut yang hilang, menghasilkan aturan-aturan yang mudah diinterpretasikan. Dan performanya merupakan salah satu yang tercepat dibandingkan dengan algoritma lain[5]. Ide dasar dari algoritma ini adalah pembuatan pohon keputusan berdasarkan pemilihan atribut yang memiliki prioritas tertinggi atau dapat disebut memiliki nilai gain tertinggi berdsarkan nilai entropy atribut tersebut sebagai poros atribut klasifikasi. Kemudian secara rekursif cabang-cabang pohon diperluas sehingga seluruh pohon terbentuk. Menurut kamus IGI Global (Internasional Publisher of Progressive Academic), entropy adalah jumlah data yang relevan terhadap informasi dari suatu kumpulan data. Gain adalah informasi yang didapatkan dari perubahan entropy pada suatu kumpulan data, baik melalui observasi atau bisa juga disimpulkan dengan cara melakukan partisipasi terhadap suatu set data. Berdasarkan apa yang ditulis oleh jefri, terhadap empat langkah dalam proses pembuatan pohon keputusan pada algoritma C4.5, yaitu : 1. Memilih atribut sebagai akar 2. Membuat cabang untuk masing-masing nilai 3. Membagi setiap kasus dalam cabang 4. Mengulangi proses dalam setiapcabang sehingga semua kasus dalam cabang memiliki kelas yang sama. Menurut jiandi data yang dimilki harus disusun menjadi sebuah tabel berdasarkan kasus dan jumlah responden sebelum dilakukan perhitungan untuk mencari nilai entropy dan gain. Entropy(S) = (1)
24 28 Rumus 1 merupakan rumus yang digunakan dalam perhitungan entropy yang digunakan untuk menentukan sberapa informatif atribut tersebut. Berikut keterangannya : S : Himpunan kasus n : Jumlah partisi s pi : jumlah kasus pada partisi ke i Gain(S,A) = Entropy(S) - *Entropy (Si) (2) Rumus 2 merupakan rumus yang digunakan dalam perhitungan gain setelah melakukan perhitungan entropy. Berikut keterangannya : s : himpunan kasus n : jumlah partisi atribut A si : jumlah kasus pada partisi ke i s : jumlah kasus dalam S dengan mengetahui rumus-rumus diatas, data yang telah diperoleh dapat dimasukkan dan di proses dengan algoritma C4.5 untuk proses pembuatan decision tree. Gambar 2.1 Pseudocode Algoritma C4.5 Sumber : Fandy Ferdian, Seng Hansun (2017:3).
25 29 Gambar 2.1 merupakan psudecode dari algoritma C4.5 yang berfungsi untuk pembentukan pohon keputusan. Perhitungan dimulai dari menghitung banyaknya jumlah atribut dan menentukan atribut mana yang akan digunakan sebagai aka dari pohon keputusan. Selanjutnya akan dilakukan perhitungan entropy dan gain untuk menentukan leaf dari pohon keputusan tersebut. Setelah semua perhitungan selesai dilakukan, pohon keputusan dapat dibentuk berdasarkan nilai gain yang telah dihitung sebelumnya. Atribut dengan nilai gain tertinggi akan terletak pada prioritas yang lebih tinggi dan memiliki kedudukan yang lebih tinggi juga pada pohon keputusan[6] Prediksi Prediksi adalah sama dengan ramalan atau perkiraan. Menurut Kamus Besar Bahasa Indonesia, prediksi adalah hasil dari kegiatan memprediksi atau meramal atau memperkirakan. Prediksi bisa berdasarkan metode ilmiah ataupun subjektif belaka. Kesimpulannya pengertian prediksi secara istilah akan sangat tergantung pada konteks atau permasalahannya. Berbeda dengan pengertian prediksi secara bahasa yang berarti lamaran atau perkiraan yang sudah menjadi pengertian yang baku[7]. Menurut (Eva, Y. 2015) manfaat dalam melakukan prediksi adalah : 1. Mengetahui kondisi masa mendatang. 2. Perencanaan produksi, pemasaran, keuangan, dan lain-lain. 3. Keperluan investasi pada sebuah perusahaan Pengertian Data Data adalah hasil observasi langsung terhadap suatu kejadian, yang merupakan perlambangan yang mewakili objek atau konsep dalam dunia nyata. Hal ini dilengkapi dengan nilai tertentu. Menurut Ralson dan Reilly (Chamidi, 2004: 314), data didefinisikan sebagai fakta atau apa yang dikatakan sebagai hasil observasi terhadap fenomena di alam. Sebagai hasil observasi langsung terhadap kejadian atau fakta dari fenomena di alam nyata, data bisa berupa tulisan atau gambar yang dilengkapi dengan nilai tertentu. Contohnya, daftar hadir siswa
26 30 semester 1 Ilmu Perpustakaan dan kearsipan adalah data. Daftar tersebut masih merupakan bentuk mentah karena belum memberikan informasi apa-apa. Sebagian orang awam sering memiliki pengertian yang agak rancu terhadap data dan informasi. Sering terjadi pengertian data digunakan untuk menyebut informasi. Demikian pula sebaliknya[8] Pengertian Penjualan Penjualan adalah suatu usaha yang terpadu untuk mengembangkan rencana-rencana strategis yang diarahkan pada usaha pemasaran kebutuhan dan keinginan pembeli, guna mendapatkan penjualan yang menghasilkan laba. Penjualan merupakan sumber hidup suatu perusahaan, karena dari penjualan dapat diperoleh laba serta suatu usaha memikat konsumen yang diusahakan untuk mengetahui daya tarik mereka sehingga dapat mengetahui hasil produk yang dihasilkan. Penjualan adalah suatu transfer hak atas benda-benda. Dari penjelasan tersebut dalam memindahkan atau menstransfer barang dan jasa diperlukan orangorang yang bekerja dibidang penjualan seperti pelaksanaan dagang, agen, wakil pelayanan dan wakil pemasaran. Bagaimana menciptakan hubungan jangka panjang dengan pelanggan melalui produk atau jasa perusahaan. Dalam hal ini, selling berrti sebuah taktik yang dapat mengintegrasikan perusahaan, pelanggan, dan relasi antara keduanya Selling adalah suatu kegiatan yang ditujukan untuk mencari pembeli, mempengaruhi dan memberi petunjuk agar pembeli dapat menyesuaikan kebutuhannya dengan produk yang ditawarkan serta mengadakan perjanjian mengenai harga menguntungkan bagi kedua belah pihak. Faktor-faktor Yang Mempengaruhi Kegiatan Penjualan Dalam praktek kegiatan penjualan itu dipengaruhi oleh beberapa faktor sebagai berikut[9]: a. Kondisi dan Kemampuan Penjual Transaksi jual-beli atau pemindahan hak milik secara komersial atas barang dan jasa itu pada prinsipnya melibatkan dua pihak, yaitu penjual sebagai pihak pertama dan pembeli sebagai pihak kedua. Disini penjual harus dapat menyakitkan kepada pemeblinya agar dapat berhasil mencapai sasaran
27 31 penjualan yang diharapkan. Untuk maksud tersebut penjual harus memahami beberapa masalah penting yang sangat bekaitan, yakni : 1) Jenis dan karakteristik barang yang ditawarkan. 2) Harga produk. 3) Syarat penjualan seperti: pembayaran, pelayanan sesudah penjualan, garansi dan sebagainya. b. Kondisi Pasar Pasar, sebagai kelompok pembeli atau pihak yang menjadi sasaran dalam penjualan, dapat pula mempengaruhi kegiatan penjualannya. Adapun faktorfator kondisi pasar yang perlu di perhatikan adalah: 1) Jenis pasarnya. 2) kelompok pembeli atau segmen pasarnya. 3) Daya belinya. 4) Frekuensi pembelian. 5) Keinginan dan kebutuhan. c. Modal Akan sulit bagi penjualan barangnya apabila barang yang dijual tersebut belum dikenal penjual harus memperkenalkan dulu membawa barangnya ketempat pembeli. Untuk melaksanakan maksud tersebut diperlukan adanya sarana serta usaha, seperti alat transport, tempat peragaan baik didalam perusahaan maupun di luar perusahaan, usaha promosi, dan sebagainya. Semua ini hanya dapat dilakukan apabila penjualan memiliki sejumlah modal yang diperlukan untuk itu. Seperti usaha promosi membutuhkan data penjualan dimana data penjualan bertugas untuk menjalin hubungan dengan pelanggan serta menimbulkan perasaan senang dalam diri pelanggan, karena dengan itu peluang untuk mencapai keberhasilan dalam menjual akan semakin meningkat. d. Kondisi Organisasi Perusahaan Pada perusahaan besar, biasanya masalah penjualan ini ditangani oleh bagian tersendiri (bagian penjualan) yang dipegang orang-orang tertentu/ahli di bidang penjualan.
28 32 e. Faktor Lain. Faktor-faktor lain, seperti: periklanan, peragaan, kampanye, pemberian hadiah, sering mempengaruhi penjualan. Namun untuk melaksanakannya, diperlukan sejumlah dana yang sedikit. Bagi perusahaan yang bermodal kuat, kegiatan ini secara rutin dapat dilakukan. Sedangkan bagi perusahaan kecil yang mempunyai modal relatif kecil, kegiatan ini lebih jarang dilakukan. Ada pengusaha yang berpegangan pada suatu prinsip bahwa paling penting membuat barang yang baik. Bilamana prinsip tersebut dilaksanaka, maka diharapkan pembeli akan kembali membeli lagi barang yang sama. Namun, sebelum pembelian dilakukan, sering pembeli harus dirangsang daya tariknya, misalnya dengan memberikan bungkus yang menarik atau dengan cara promosi lainnya. 2.3 Data Mining Pengertian Data Mining Data Mining sebagai proses untuk menemukan kolerasi atau pola dari ratusan atau ribuan field dari sebuah relasional basis data yang besar. Data Mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini diketahui secara manual dari suatu basis data. Informasi yang dihasilkan diperoleh dengan cara mengekstraksi dan mengenali pola yang penting atau menarik dari data yang terdapat pada basis data. Data Mining terutama digunakan untuk mencari pengetahuan yang terdapat dalam basis data yang besar sehingga sering disebut Knowledge Discovery Databases (KDD). Hal penting yang terkait di dalam Data Mining adalah[5] : 1. Data Mining merupakan suatu proses otomatis terhadap data yang sudah ada. 2. Data yang akan diproses berupa data yang sangat besar 3. Tujuan Data Mining adalah mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat. Kemampuan Data Mining dalam mencari informasi bisnis yang berharga dari basis data yang sangat besar,
29 33 dapat di analogikan dengan penambangan logam mulia dari lahan sumbernya, teknologi ini dipakai untuk : a) Prediksi dan sifat-sifat bisnis. Data Mining secara otomatis melakukan proses pencarian informasi untuk memprediksi basis data dalam jumlah besar. b) Penemuan pola-pola yang diketahui sebelumnya. Data Mining menyapu basis data, kemudian mengidentifikasi pola-pola yang sebelumnya tersembunyi dalam satu sapuan. Tahapan proses Data Mining[5]: 1. Data Cleaning, tahap pembersihan data yang konsisten. 2. Data Integration, langkah menggabungkan data dari beberapa sumber. 3. Data Selection, data yang dikembalikan lagi ke database setelah proses data cleaning. 4. Data Transformation, data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi regrasi. 5. Data Mining, merupakan proses yang digunakan untuk mengolah suatu data dengan menggunakan metode. 6. Evaluation and presentation, pengidentifikasian pola berdasarkan tindakan yang digunakan. 7. Knowledge, hasil yang dicapai berupa pengetahuan atau sebuah informasi. Sumber : Azwanti (2018) Gambar 2.2 Tahapan Proses Data Mining
30 Tugas-tugas Data Mining Tugas-tugas yang biasa dilakukan oleh data mining antara lainganti ke jurnal ini [10] : 1. Klastering Mengelompokkan obyek ke dalam beberapa kelompok berdasarkan kemiripan antar obyek, dimana dalam satu klaster harus bersisi obyek yang saling mirip dan antar klaster obyek salin mirip. Klastering ini memerlukan data pelatihan yang sudah diberi label. 2. Klasifikasi Klasifikasi data merupakan suatu proses yang menemukan properti-properti yang sama pada sebuah himpunan obyek di dalam sebuah basis data dan mengklasifikasikannnya ke dalam kelas-kelas yang berbeda menurut model klasifikasi yang ditetapkan. Tujuan dari klasifikasi adalah untuk menemukan model dari training set yang membedakan atribut ke dalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan atribut yang kelasnya belum diketahui sebelumnya. Beberapa metode klasifikasi umum digunakan dalam data mining adalah : pengklasifikasi pohon keputusan, pengklasifikasi bayesian, pengklasifikasi k- nearest neighbour, penalaran berbasis kasus, algoritma genetika dan teknik logika fuzzy.(azwanti, 2018:34). 3. Regresi Regresi pada dasarnya mirip dengan klasifikasi, yakni memerlukan data pelatihan yang sudah diberi label. Bedanya, output klasifikasi adalah nilai diskrit, sedangkan output dari regresi adalah nilai kontinyu. Regresi ini mencari model hubungan antara atribut dependent, dimana atribut depedent nya juga berupa nilai kontinyu. 4. Asosiasi Melakukan asosiasi antar obyek dalam suatu data set, biasanya data franksaksional. Asiosi dilakukan dengan menghitung berapa kali dalam suatu set data suatu transaksi yang mengandung dua item atau lebih yang berhubungan. Sering ada yang menyebut Market Basket.
31 Manfaat Data Mining Data mining juga bisa dimanfaatkan untuk menyelesaikan masalah dalam kebutuhan dibidang bisnis, misalnya : 1. Mengetahui hilangnya pelanggan dikarenakan adanya pesaing. 2. Mengetahui item suatu produk yang memiliki keamanan karakteristik. 3. Mengidentifikasi produk-produk yang sudah terjual dengan produk lainnya. 4. Untuk memprediksi dari tingkat penjualan. 5. Menilai tingkat resiko dalam menentukan jumlah produksi pada suatu item. 6. Memprediksi perilaku bisnis dimasa depan Jenis Atau Teknik Data Mining Teknik yang digunakan dalam data mining erat kaitanya dengan penemuan (discovery) dan pembelajaran (Learning) yang berbagi dalam tiga metode utama pembelajaran yaitu [11]: 1. Supervised Learning Adalah teknik yang paling banyak digunakan. Teknik ini sama dengan programing by example. Teknik ini melibatkan fase pelatihan dimana data pelatihan historis yang karakter-karakternya dipetakan ke hasil-hasil yang telah diketahui diolah dalam algoritma data mining. Proses ini melatih algoritma untuk mengenali variabel-variabel dan nilai-nilai kunci yang nantinya akan digunakan sebagai dasar dalam perkiraan-perkiraan ketika diberikan data baru. 2. Unsupervised Learning Teknik pembelajaran ini melibatkan fase pelatihan seperti yang terdapat pada supervised learning. Teknik ini bergantung pada penggunaan algoritma yang mendeteksi semua pola, seperti association dan sequences, yang muncul dari kriteria penting yang spesifik dalam data masukan. Pendekatan ini mengarah pada pembuatan banyak aturan (rules) yang mengkarakterisasikan penemuan association, cluster, dan segments. Aturan-aturan ini kemudian dianalisis untuk menemukan hal-hal penting.
32 36 3. Reinforcement Learning Teknik pembelajaran ini jarang digunakan dibandingkan dengan dua teknik lainya, namun memiliki peranan-peranan yang terus dioptimalkan dari waktu ke waktu memiliki control adaptif. Teknik ini sangat menyerupai kehidupan nyata yaitu seperti on job training, dimana seorang pekerja diberikan sekumpulan tugas yang membutuhkan keputusan keputusan yang telah dibuatnya sehubungan dengan hasil performace pekerja tersebut. Reinformace learning sangat tepat digunakan untuk menyelesaikan masalahmasalah yang sulit bergantung pada waktu. 2.4 Klasifikasi Suatu teknik dengan melihat pada kelakuan dan atribut dari kelompok yang telah didefinisikan teknik ini dapat memberikan klasifikasi pada data baru dengan memanipulasi data yang ada yang telah diklasifikasi dan dengan menggunakan hasilnya untuk diklasifikasi. Dalam klasifikasi, keluaran dari setiap data adalah bilangan bulat atau diskrit. Dalam contoh pengambilan keputusan untuk main bola atau maka keluaran tersebut bisa diubah ke bilangan bulat 1 atau -1 dengan melihat keluaran yang berupa bilangan bulat kita bisa menerapkan method klasifikasi. 2.5 Decision Tree Decision Tree merupakan metode klasifikasi yang paling sering diguanakan. Dalam pengerjaannya memerlukan waktu yang lama dan hasilnyapun mudah untuk dipahami dan banyak penelitian dalam kasus ini sering menggunakan Decision Tree untuk mendapatkan hasil yang maksimal. Secara umum Algoritma C4.5 untuk membangun pohon keputusan adalah sebagai berikut[12]: 1. Pilih atribut sebagai akar 2. Buat cabang untuk masing-masing nilai 3. Bagi kasus dalam cabang
33 37 4. Ulangi proses untuk masing-masing cabang sampai semua kasus pada cabang memiliki kelas yang sama. Tiga jenis Node pada Decision Tree : a. Root Node, merupakan Node paling atas, pada Node ini ada masukan dan bisa mempunyai luaran lebih dari satu. b. Internal Node, merupakan Node percabangan, pada Node ini hanya terdapat satu masukan dan mempunyai luaran minimal 2. c. Leaf Node atau terminal Node, merupakan Node terakhir, pada Node ini hanya terdapat satu masukan dan mempunyai luaran. Dalam induksi Decision Tree adalah bagaimana menyatakan syarat pengujian pada Node. Ada 3 kelompok penting syarat pengujian Node: 1. Fitur biner Memiliki 2 nilai berbeda disebut dengan fitur biner. Syarat pengujian ketika fitur ini menjadi Node (akar maupun internal) hanya punya dua pilihan cabang. 2. Fitur bertipe kategorikal Fitur yang nilainya bertipe ketegorikal (nominal atau ordinal) bisa mempunyai beberapa nilai berbeda. 3. Fitur bertipe numeric Fitur bertipe numerik, syarat pengujian dalam Node (akar maupun internal) dinyatakan dengan perbandingan pengujian (A<v) atau (A v) dengan hasil biner, atau untuk multi dengan hasil berupa jangkauan nilai bentuk vi A <v i+1, untuk i=1,2,.,k. 2.6 Knowledge Discovery In Database (KDD) Knowledge Discovery In Databases (KDD) adalah proses non trivial untuk mencari dan mengidentifikasi pola (pattern) dalam data. Knowledge Discovery In Database (KDD) merupakan kegiatan yang meliputi pengumpulan, pemakaian data historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran besar serta hubungan dengan teknik integrasi dan penemuan ilmiah, interprestasi dan visualisasi dai pola-pola sejumlah kumpulan data[13].
34 38 Secara umum tahapan-tahapan proses Knowledge Discovery in Databases terdiri dari : 1. Data Cleaning Proses menghilangkan noise dari data yang konsisten. 2. Data Integration Penggabungan Data dari berbagai database ke dalam satu database baru. 3. Data Selection Proses pemilihan data yang relevan yang didapat dari database. 4. Data Transformation Data diubah ke dalam format yang sesuai untuk diproses dalam Data Mining. 5. Data Mining Suatu metode yang diterapkan untuk menemukan pengetahuan berharga yang tersembunyi dari data. 6. Pattern Evaluation Mengidentifikasi pola-pola menarik untuk dipresentasikan ke dalam knowledge based. 7. Knowledge Presentation Visualisasi dan penyajian pengetahuan mengenai teknik yang digunakan untuk memperoleh pengetahuan yang diperoleh oleh user. 2.7 Rapid Miner Rapid Miner merupakan perangkat lunak yang dibuat oleh Dr. Markus Hofmann dari Institute of Technologi Blanchardstown dan Ralf Klinkenberg dari rapid-i.com dengan tampilan GUI (Graphical User Interface) sehingga memudahkan pengguna dalam mengguanakan perangkat lunak ini. Perangkat lunak ini bersifat open source dan dibuat dengan menggunakan program java dibawah lisensi GNU Public Licence dan Rapid Miner dapat dijalankan di sistem operasi manapun. Dengan menggunakan Rapid Miner, dibutuhkan kemampuan koding khusus, karena semua fasilitas sudah disediakan. Rapid Miner dikhususkan untuk penggunaan data mining. Model yang disediakan juga cukup banyak dan lengkap, seperti Model Bayesian, Modelling,
35 39 Tree Induction, Neural Network dan lain-lain. Banyak metode yang disediakan oleh Rapid Miner mulai dari klasifikasi, klustering, asosiasi dan lain-lain. Jika ada model atau model algoritma yang ada dalam Weka, pengguna boleh menambahkan moduln lain, karena weka bersifat open source, jadi sapapun dapat ikut mengembangkan perangkat lunak ini. Gambar 2.3 Tampilan Utama Rapid Miner 2.8 Kerangka Pemikiran Kerangka pemikiran merupakan alur pikir penulis yang dijadikan sebagai skema pemikiran atau dasar-dasar pemikiran untuk memperkuat indikator yang melatar belakangi penelitian ini. Dalam kerangka pemikiran ini penulis mencoba menjelaskan masalah pokok penelitian.
36 Gambar 2.4 Kerangka Pemikiran 40
37 41 BAB III METODE PENELITIAN 3.1 Objek Penelitian Dalam penyusunan laporan penelitian ini penulis melakukan penelitian dengan mengambil objek penelitian pada Toko Deshop Cikarang yang betempat di Desa Kukun Kecamatan Cikarang Kabupaten Bekasi. 3.2 Jenis Data Dalam pembuatan penelitian ini metode pengumpulan data yang digunakan penulis adalah metode pengumpulan dengan cara menggabungkan data dari sumber data primer dan sumber data sekunder yang menunjang pada tujuan penelitian. 1. Sumber Data Primer Dalam penulisan penelitian ini, penulis mengumpulkan data sebagai bahan dari pembuatan laporan dengan menggunakan metode deskriptif, yaitu teknik pengumpulan data yang digunakan adalah : a. Wawancara (Interview) Adalah teknik pengumpulan data yang sangat penting dalam penelitian kualitatif yang melibatkan manusia sebagai subjek. b. Studi Pustaka Adalah teknik pengumpulan data yang dilakukan dengan menghimpun, mempelajari, dan menganalisis dokumen-dokumen baik dokumen tertulis, gambar maupun elektronik seperti buku-buku referensi, jurnal-jurnal, dan media lainnya yang berkaitan dengan onyek penelitian. c. Observasi Adalah pengamatan langsung suatu kegiatan yang sedang dilakukan.
38 42 2. Sumber Data Sekunder Dalam pengumpulan data sekunder penulis menggunakan cara dokumentasi yaitu mengumpulkan bahan-bahan yang tertulis berupa data/laporan yang diperoleh dari Papermooth selama melakukan kegiatan penelitian. Selain itu penulis juga melihat referensi dari penulisan penelitian sebelumnya yang berkaitan dengan judul. 3.3 Metodologi Penelitian Metode yang digunakan dalam penelitian ini adalah metode penelitian KDD (Knowledge Discovery in Database), yang mencakup beberapa aktivitas yaitu seleksi, praproses, transformasi, data mining, interprestasi dan evaluasi. 1. Pengumpulan Data Pengumpulan data adalah mengumpulkan data-data yang akan digunakan dalam proses algoritma klasifikasi C Seleksi Data Seleksi data adalah data yang akan digunakan dalam proses algoritma klasifikasi C4.5. Tujuan dari seleksi data adalah menciptakan himpunan data target, pemilihan himpunan data, atau memfokuskan pada subset variabel atau sampel data, dimana penemuan (discovery) akan dilakukan. 3. Transformasi Data Transformasi data adalah proses mentransformasi atau mengubah data ke dalam bentuk yang sesuai, agar dapat di proses dengan perhitungan algoritma C Perhitungan Entropy dan Information Gain Perhitungan semua atribut/variabel, entropy menggunakan rumus 1 dan information gain menggunakan rumus 2 untuk mengetahui information gain tertinggi yang akan di jadikan simpul akar pada pembuatan pohon keputusan. 5. Pohon Keputusan (Decision Tree) Pohon keputusan adalah hasil dari proses perhitungan entropy dan information gain, setelah perhitungan berulang-ulang sampai semua
39 43 atribut pohon memiliki kelas dan bisa lagi dilakukan proses perhitungan. 6. Aturan-aturan/Rule Model Aturan-aturan/Rule model adalah uraian penjelasan yang merepresentasikan sebuah pohon keputusan. 7. Validasi dan Pengujian Validasi dan pengujian adalah pengujian yang dilakukan untuk mengetahui semua fungsi bekerja dengan baik atau. Validasi dilakukan dengan Ten-fold Cros Validation. Ten-fold Cross Validation adalah validasi yang dilakukan dengan cara membagi suatu set data menjadi sepuluh segmen yang berukuran sama besar dengan cara melakukan pengacakan data, validasi dan pengujian dilakukan untuk mengetahui tingkat akurasi, presisi, dan recall dari hasil prediksi klasifikasi. Akurasi adalah presentasi dari catatan yang diklasifikasi dengan benar dalam pengujian dataset, persisi adalah presentasi data yang diklasifikasikan sebagai model baik yang sebenarnya juga baik. Recall adalah pengukuran tingkat berpengenalan positif sebenarnya. 8. Analisis Hasil Pengujian Analisa yang dilakukan untuk memastikan bahwa hasil pengujian benarbenar sesuai dengan pembahasan. Analisa dilakukan dengan melakukan perhitungan kembali hasil validasi dan pengujian (akurasi, presisi, dan recall) secara manual, apakah perhitungan yang dilakukan akan menghasilkan nilai yang sama atau, dibantu dengan Confusion Matrix. Confusion Matrix adalah model yang akan membentuk matrix yang terdiri true positif atau tupel positif dan true negatif atau tupel negatif. Confusion matrix berisi informasi aktual (actual) dan prediksi (predicted) pada sistem klasifikasi. Confusion Matrix dapat memvisualisasi kinerja algoritma klasifikasi.
40 Analisis Data Knowledge Discovery in Database (KDD) Dalam pengumpulan data terdapat sebanyak 290 data memiliki 5 attribut. Setelah data di dapatkan maka ada beberapa tahapan preparation data. Preparation data merupakan tahapan untuk mendapatkan data yang berkualitas dan mempermudah proses perhitungan data mining, maka dapat dilakukan beberapa teknik sebagai berikut : A. Data Cleaning Pada tahap ini dilakukan proses pembersihan data untuk memastikan data yang telah dipilih layak atau dalam proses pemodelan data mining. Dalam penelitian ini dilakukan pembersihan data dengan cara menghilangkan data yang lengkap (missing value). B. Data Selection Berikut adalah tabel 3.1 yang merupakan tabel attribut yang akan digunakan dalam proses perhitungan decision tree C4.5. Tabel 3.1 Atribut Yang Digunakan No Atribut Tipe 1 Merek Text 2 Nama Produk Text 3 Jenis Produk Text 4 Harga Currency 5 Terjual Numeric Tabel 3.2 Data Penjualan
41 No Nama produk merek jenis produk Harga Jumlah Terjual Terjual 1 Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah gelatin kopi deshop masker wajah cuka apel bragg toner air mawar deshop toner spatula deshop aksesoris mangkok masker deshop aksesoris bandana deshop aksesoris pinset komedo deshop aksesoris kuas masker deshop aksesoris cup masker deshop aksesoris Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah cup masker deshop aksesoris Tabel 3.3 Klasifikasi Berdasarkan Jenis Produk Jenis Produk Laris Status Penjualan Kurang Laris Masker Toner 12 8 Aksesoris Tabel 3.4 Klasifikasi Berdasarkan Jumlah Terjual Status Penjualan
42 Jumlah Terjual Laris Kurang Laris Tabel 3.5 Klasifikasi Berdasarkan Nama Produk Nama Produk Laris Status Penjualan Tidak Laris Peel off mask oatmeal 7 3 Peel off mask vit c 7 3 +collagen peach 8 2 Tea tree oil 4 6 blueberry 3 7 lavender 6 4 strawberry shuffle 6 4 vanila milk 7 3 chocolate milted 6 4 golden beauty 6 4 greentea clay 4 6 es corbet whitening 4 6 egg white honey 4 6 cremy cofee 6 4 avocado recipes 5 5 gelatin original 4 6 gelatin charcoal 6 4 gelatin coklat 6 4 gelatin strawberry 7 3
43 gelatin greentea 8 2 gelatin kopi 4 6 Tabel 3.6 Klasifikasi Berdasarkan Jenis Aksesoris Jenis Aksesoris Laris Status Penjualan Tidak Laris Spatula 5 5 Mangkok masker 5 3 Bandana 10 0 Pinset komedo 0 7 Kuas masker 5 5 Cup masker 5 5 Tabel 3.7 Klasifikasi Berdasarkan Jenis Toner Jenis Toner Laris Status Penjualan Tidak Laris Cuka apel 7 3 Air mawar 5 5 Tabel 3.8 Klasifikasi Berdasarkan Merek Merek Laris Status Penjualan Tidak Laris Philochaly Lea gloria Deshop Cikarang 66 64
44 Tabel 3.9 Klasifikasi Berdasarkan Harga Harga Laris Status Penjualan Tidak Laris HR (harga rendah) HT (harga tinggi) HS ( harga Sedang) C. Mining Process Pada tahap ini peneliti menentukan teknik data mining yang digunakan untuk mengolah data yang sudah disiapkan sebelumnya. Dan yang sudah disiapkan untuk klasifikasi dibagi menjadi dua data, untuk data training (80%) dan untuk data testing (20%). Pembagian data training dan data testing menggunakan teknik sampling random sistematik. Cara penggunaan teknik ini yaitu dengan cara perandoman atau pengundian hanya dilakukan satu kali, yakni ketika menentukan unsur pertama dari sampling yang akan diambil. Penentuan unsur sampling selanjutnya ditempuh dengan cara memanfaatkan interval sampel. Interval sampel adalah angka yang menunjukan jarak antara nomor-nomor urut yang terdapat dalam kerangka sampling yang akan dijadikan patokan dalam menentukan atau memilih unsur-unsur sampling kedua dan seterusnya hingga unsur ke n. Interval sampel biasanya dilambangkan dengan huruf k. Interval sampel atau juga disebut sampling rasio diperoleh dengan cara membagi ukuran populasi dengan ukuran sampel yang dikehendaki (N/m). Contoh perhitungan untuk mengambil data testing adalah sebagai berikut : Jumlah data keseluruhan (N) = 290
45 Jumlah data testing = 20% 290 = 58 Jumlah sampel (n) = 58 Internal Sampling (k) = N/n =290/58 = 5 Dari hasil diatas diperoleh data testing sebanyak 58 maka sisanya dijadikan data training sebanyak = 232 setelah semua data siap dan sudah sesuai dengan tahapan pengolahan sebelumnya, data yang sudah melalui proses pengolahan kemudian akan dilakukan perhitungan dengan menggunakan tools rapidminer. Dua langkah yang dilakukan pada tahap ini ialah : 1. Perhitungan decision tree secara manual Data yang akan digunakan dalam perhitungan secara manual yaitu 5 sampel data testing yang diambil 20% dari dataset penjualan Gerai Busana Muslim secara acak oleh peneliti. 2. Pengujian decision tree menggunakan Rapidminer Pengujian dengan menggunakan rapidminer bertujuan untuk memudahlan dan membandingkan dalam pemrosesan data secara manual. D. Pattern Evaluation Melakukan pengujian terhadap model-model yang bertujuan untuk mendapatkan model yang paling akurat. Pada tahap evaluasi, akan diketahui apakah hasil dari tahap pemodelan dapat menjawab tujuan yang telah ditetapkan pada tahap pertama. Untuk itu akan dilakukan pola pada decision tree yang telah terbentuk, sehingga diharapkan mendapatkan informasi atau pola yang berguna sebagai prediksi produk ter untuk mengelola modal usaha pada Gerai Busana Muslim. E. Knowledge presentation Visualisasi dan penyajian pengetahuan berdasarkan hasil yang telah didapat pada tahap sebelumnya utnuk memperoleh pengetahuan yang telah di peroleh.
46 3.5 Tahapan Penelitian Gambar 3.3 Tahapan Penelitian 3.6 Kebutuhan Software dan Hardware 1. Kebutuhan software yang diperlukan adalah sebagai berikut : a. Sistem operasi windows 10 versi 64 bit b. Rapidminer 9.0 c. Microsoft Office Kebutuhan hardware yang diperlukan dalam penelitian ini adalah sebagai berikut : a. Laptop intel dual core b. RAM 2 GB
47 BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian Metode penelitian yang penulis lakukan menghasilkan informasi dan data yang digunakan sebagai acuan penulis sebagai dasar penelitian. Penelitian ini mengguanakan semua data dari data penjualan Deshop Cikarang yaitu sebanyak 290 data sebagai data Training untuk proses klasifikasi, dan 20% dari data training untuk dijadikan data testing. Gambar 4.1 Dataset No Nama produk merek jenis produk Harga Jumlah Terjual Terjual 1 Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah gelatin kopi deshop masker wajah cuka apel bragg toner air mawar deshop toner spatula deshop aksesoris mangkok masker deshop aksesoris bandana deshop aksesoris pinset komedo deshop aksesoris kuas masker deshop aksesoris cup masker deshop aksesoris Peel off mask oatmeal philochaly masker wajah Peel off mask vit c +collagen philochaly masker wajah peach philochaly masker wajah Tea tree oil philochaly masker wajah blueberry philochaly masker wajah lavender philochaly masker wajah strawberry shuffle lea gloria masker wajah vanila milk lea gloria masker wajah chocolate milted lea gloria masker wajah golden beauty lea gloria masker wajah greentea clay lea gloria masker wajah es corbet whitening lea gloria masker wajah egg white honey lea gloria masker wajah crèmy coffe lea gloria masker wajah avocado recipes lea gloria masker wajah gelatin original deshop masker wajah gelatin charcoal deshop masker wajah gelatin coklat deshop masker wajah gelatin strawberry deshop masker wajah gelatin greentea deshop masker wajah cup masker deshop aksesoris
48 Gambar 4.2 Data Testing Nama produk merek jenis produk Harga Terjual cuka apel bragg toner HT cuka apel bragg toner HT cuka apel bragg toner HT air mawar deshop toner HR air mawar deshop toner HR air mawar deshop toner HR bandana deshop aksesoris HR bandana deshop aksesoris HR cup masker deshop aksesoris HR cup masker deshop aksesoris HR gelatin charcoal deshop masker wajah HT gelatin charcoal deshop masker wajah HT gelatin coklat deshop masker wajah HT gelatin greentea deshop masker wajah HT gelatin greentea deshop masker wajah HT gelatin kopi deshop masker wajah HT gelatin original deshop masker wajah HT gelatin strawberry deshop masker wajah HT kuas masker deshop aksesoris HR mangkok masker deshop aksesoris HR mangkok masker deshop aksesoris HR pinset komedo deshop aksesoris HR spatula deshop aksesoris HR spatula deshop aksesoris HR spatula deshop aksesoris HR avocado recipes lea gloria masker wajah HR avocado recipes lea gloria masker wajah HR avocado recipes lea gloria masker wajah HR chocolate milted lea gloria masker wajah HR chocolate milted lea gloria masker wajah HR crèmy coffe lea gloria masker wajah HR crèmy coffe lea gloria masker wajah HR egg white honey lea gloria masker wajah HR es corbet whitening lea gloria masker wajah HR es corbet whitening lea gloria masker wajah HR golden beauty lea gloria masker wajah HR greentea clay lea gloria masker wajah HR greentea clay lea gloria masker wajah HR strawberry shuffle lea gloria masker wajah HR strawberry shuffle lea gloria masker wajah HR strawberry shuffle lea gloria masker wajah HR vanila milk lea gloria masker wajah HR vanila milk lea gloria masker wajah HR blueb philochaly masker wajah HR blueb philochaly masker wajah HR laven philochaly masker wajah HR laven philochaly masker wajah HR Peel off mask oatme philochaly masker wajah HR Peel off mask oatme philochaly masker wajah HR Peel off mask oatme philochaly masker wajah HR peach philochaly masker wajah HR Tea tr philochaly masker wajah HR Tea tr philochaly masker wajah HR Tea tr philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR Peel off mask vit c + philochaly masker wajah HR
49 Data diatas adalah data testing, data testing adalah data 20% dari keseluruhan, total populasi data testing berjumlah 58 data. Data testing dipilih secara acak Root Node Berikut adalah tampilan hasil perhitungan entropy dan gain yang lengkap dalam bentuk tabel. Gambar 4.3 Tabel Perhitungan Algoritma C4.5 Node 1 No ATRIBUTE VALUE 1 JUMLA H KASUS ( S ) Tidak Laris (S1) Laris (S2) E(S1) = E(S2) = (-S1/S)*LOG2 (S1/S) (-S2/S)*LOG2 (S2/S) ENTROPY (E) TOTAL , , , Masker wajah , , , jenis produk Toner , , , Aksesoris , , , TOTAL GAIN E (TOTAL) - (jumlah G) 0, merek Pilochaly Bragg Dheshop , , , Lea Gloria , , , , Peel off mask oatmeal Peel off mask vit c +collagen peach Tea tree oil blueberry lavender strawberry shuffle , , , vanila milk chocolate milted golden beauty greentea clay es corbet whitening egg white honey crèmy coffe Nama Produk avocado recipes gelatin original gelatin charcoal gelatin coklat gelatin strawberry gelatin greentea gelatin kopi cuka apel air mawar , , , spatula mangkok masker bandana pinset komedo kuas masker cup masker HR ,5 0, , Harga HT , , , HS Berikut hasil perhitungan Node 1 sebagai berikut : Total jumlah (S) 58 Jumlah Laris (S1) 39 Jumlah Tidak Laris (S2) 19 Entropy Total = ( 0, , = ( = 0,
50 1. Entropy Jenis Produk Entropy Masker Wajah = ( = ( = 0, Entropy Toner = ( = ( = 0, Entropy Aksesoris = ( = ( = 0, Gain Total (jenis produk) = Entropy (S) - *Entropy = 0, = 0, Entropy Merek Entropy Pilochaly = ( = ( = 0 Entropy Bragg = ( = ( = 0 Entropy Deshop = ( = ( = 0, Entropy Lea Gloria = ( = ( = 0,
51 3. Perhitungan Harga HR Entropy (HR) = = -0, HT Entropy (HT) = HS = 0, Entropy (HT) = = 0 Gain Total (Harga) = Entropy (S) - *Entropy = 0, = 0, Nilai Gain yang dijdikan node akar pertama yaitu Harga, untuk node akar selanjutnya dilakukan perhitungan lagi dan seterusnya dengan menghitung nilai value HR dan HT. Adapun hasil dari perhitungan node 1.1 sebagai berikut : NO ATRIBUTE VALUE JUMLAH KASUS ( S ) Tidak Laris (S1) Laris (S2) E(S1) = E(S2) = (-S1/S)*LOG2 (- S2/S)*LOG2 (S1/S) (S2/S) ENTROPY (E) 1 Harga HR ,5 0, , jenis produk Masker wajah , , , Toner , , , Aksesoris , , , Nama Produk air mawar , , bandana cup masker kuas masker mangkok masker pinset komedo spatula avocado recipes chocolate milted creamy coffe egg white honey es corbet whitenin golden beauty greentea clay strawberry shuffle , , , vanila milk merek deshop , , , lea gloria , , , TOTAL GAIN E (TOTAL) - (jumlah G) -0, , ,
52 Gambar 4.4 Tabel Perhitungan Algoritma C4.5 Node 1.1 Selanjutnya adalah menyelesaikan untuk menghitung node 1.1 sebagai akar, sama dengan cara yang diatas dengan menghitung nilai entropy dari attribut yang tersisa yaitu air mawar dan strawberry shuffle pada attribut nama produk. NO ATRIBUTE VALUE JUMLAH KASUS ( S ) Laris (S1) Laris (S2) E(S1) = E(S2) = (-S1/S)*LOG2 (S1/S) (- S2/S)*LOG2 (S2/S) ENTROPY (E) TOTAL GAIN E (TOTAL) - (jumlah G) 1 Nama Produk air mawar , , , Jenis Produk toner , , , merek deshop , , , Gambar 4.5 Tabel Perhitungan Algoritma C4.5 Node 1.2 Selanjutnya adalah menyelesaikan untuk menghitung node 1.2 sebagai akar, dari node 1.2 terdapat Gain yang sama yaitu attribut Jenis Produk dengan value toner dan Merek dengan value deshop. Maka akar cabang nya yaitu jenis produk. Adapun hasil perhitungan node 1.3 adalah sebagai berikut : NO ATRIBUTE VALUE JUMLAH KASUS ( S ) Laris (S1) Laris (S2) E(S1) = E(S2) = (- (-S1/S)*LOG2 S2/S)*LOG2 (S1/S) (S2/S) ENTROPY (E) TOTAL GAIN E (TOTAL) - (jumlah G) 1 Nama Produk strawberry shuffle , , , Jenis Produk masker wajah , , , merek lea gloria , , , Gambar 4.6 Tabel Perhitungan Algoritma C4.5 Node 1.3 Selanjutnya adalah menyelesaikan untuk menghitung node 1.3 sebagai akar, dari node 1.3 terdapat Gain yang sama yaitu attribut Jenis Produk dengan value masker wajah dan Merek dengan value lea gloria. Maka akar cabang nya yaitu Jenis produk. Adapun hasil perhitungan node 1.4 adalah sebagai berikut :
53 Gambar 4.7 Tabel Perhitungan Algoritma C4.5 Node 1.4 Selanjutnya adalah menyelesaikan untuk menghitung node 1.4 sebagai hasil akhir, sama dengan cara yang diatas dengan menghitung nilai entropy, dari node 1.4 terdapat gain yang sama yaitu Jenis Produk dan Merek, maka untuk akar cabang dari Harga dengan value HT adalah Jenis Produk diikuti dengan Merek Rapid Miner Setelah dilakukan dengan perhitungan menggunakan excel, selanjutnya dilakukan perhitungan menggunakan aplikasi rapid miner. Adapun langkah-langkah dalam mengolah data menggunakan Rapid Miner adalah sebagai berikut : 1. Seluruh data training yang akan di proses oleh Rapid Miner disimpan terlebih dahulu di microsoft Excel dengan format.xlsx. adapun data training yang dimaksud penulis memberi nama data data testing.xlsx data tersebut nantinya akan dihitung menggunakan software aplikasi RapidMiner Buka aplikasi RapidMiner 9.0 dan akan muncul tampilan sebagai berikut :
54 Gambar Halaman Utama RapidMiner Selanjutnya pilih Blank lalu pilih menu add data lalu cari dimana data testing.xlsx berada pilih dan klik selanjutnya akan muncul kotak dialog select the cell to import pilih dan klik next. Gambar Halaman Select the cells to import data
55 2. Selanjutnya pada format your columns pada atribut terjual klik tanda panah kebawah lalu pilih change role lalu pilih label klik ok, klik next lalu klik finish Gambat kotak dialog import data 3. Drag data testing.xlsx pada menu repository yang sudah kita masukkan kedalam rapidminer, operator yang digunakan adalah split validation, operator tersebut berguna sebagai pengukur ke akuratan sebuah model yang sedang dijalanka.
56 Gambar Process Read excel 4. Kemudian didalam operator split validation terdapat process, pada process tersebut membutuhkan operator yang dapat menghasilkan tujuan pengujian. Karena pada penelitian ini menggunakan perhitungan algoritma C4.5 maka operator yang digunakan adalah operator decision tree yang digunakan untuk menentukan pohon keputusan, tambahkan juga apply model dan performance untuk mengetahui tingkat akurasinya. Pilih dan klik run.
57 Gambar Process Validation Evaluasi model dengan Confusion matrix Model Confusion matrix akan membentuk matrix yang terdiri dari true positif atau tupel positif dan true negatif atau tupel negatif. Keterangan : TP : True Positive TN : True Negative FP : False Positive FN : False Negative Berikut dibawah ini merupakan hasil dari Confusion matrix pada algoritma C4.5: a. Accuracy Accuracy didefinisikan sebagai tingkat kedekatan antara nilai prediksi dengan nilai aktual. Dari data yang tersedia, analisis menggunakan aplikasi Rapid Miner dengn penukuran Decision Tree didapatkan hasil dengan tingkat akurasi 94.44%. Perhitungan akurasi dilakukan dengan cara membagi jumlah data yang diklasifiasi secara benar dengan total data sample yang di uji.
58 Gambar Tabel Hasil Akurasi Data Testing Class Precission didapat dengan hasil prediksi sebesar % dan prediksi sebesar 90%. Presisi dapat diartikan sebagai kecocokan antara permintaan tersebut, jadi kecocokan anatara permintaan dan prediksi % dan kecocokan dengan prediksi adalah 90.00%. Recal didefinisikan sebagai rasio dari item relevan yang dipilih terhadap total jumlah item relevan yang tersedia. Jadi dari data yang tersediadapat disimpulkan bahwa tingkt relevan True sebesar 88.89% dan True sebesar %. b. Recall Reacall dihitung dengan cara membagi data benar yang bernilai positif ( true positif) dengan hasil penjumlahan dari data benar yang bernilai positif (true positif) dan data salah yang bernilai negative (false negative). Dari data yang ada didapat hasil dengan tingkat pracission sebesar % seperti terlihat pada gambar dibawah ini Gambar Tabel Hasil Recall Data Testing Class Precission didapat dengan hasil prediksi sebesar % dan prediksi sebesar 90.00%. Presisi dapat diartian sebagai kecocokan
59 antara permintaan informasi dengan jawaban terhadap permintaan tersebut, jadi kecocokan antara permintaan dan prediksi adalah100.00% dan kecocokan dengan prediksi adalah 90.00%. Recal didefinisikan sebagai rasio dari item relevan yang dipilih terhadap total jumlah item relevan yang tersedia. Jadi dari data yang tersediadapat disimpulkan bahwa tingkt relevan True sebesar 88.89% dan True sebesar %. c. Precision Nilai Precision dihitung dengan cara membagi data benar yang bernilai positif (true positif) dibagi dengan jumlah data yang bernilai positif (true positif ) dan data salah yang bernilai (false positif). Dari data yang ada didapat hasil dengan tingkat precission sebesar 90.00%. Seperti terlihat gambar dibawah ini Gambar Tabel Hasil Precision Data Testing Class Precission didapat dengan hasil prediksi sebesar % dan prediksi sebesar 90%. Presisi dapat diartikan sebagai kecocokan antara permintaan tersebut, jadi kecocokan anatara permintaan dan prediksi % dan kecocokan dengan prediksi adalah 90.00%. Recal didefinisikan sebagai rasio dari item relevan yang dipilih terhadap total jumlah item relevan yang tersedia. Jadi dari data yang tersediadapat disimpulkan bahwa tingkt relevan True sebesar 88.89% dan True sebesar %.
60 Gambar 4.19 Tree View RapidMiner 4.2 Pembahasan Hasil Pengujian Berdasarkan Hasil Pengujian yang telah dibuat maka dapat di ambil sebuah kesimpulan bahwa hasil pengujian sangat baik karena rule yang di hasilkan sama berdasarkan dua perhitungan manual dan rapid miner. a. Algoritma C.45 sangat efektif digunakan dalam memprediksi produk ter pada Deshop Cikarang. b. Pengujian prediksi produk ter dengan rapidminer menggunakan metode decision tree C.45, diperoleh akurasi sebesar 94.44% menggunakan confusion matrix.
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur
Lebih terperinciBAB 2 LANDASAN TEORI
BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau
Lebih terperinciPENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER
PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan
Lebih terperinciBAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain
BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Sebelum melakukan penelitian adapun penulis mencari penelitian penelitian yang memungkinkan terkait dengan penelitian antara lain : 1. Analisis Kinerja Data
Lebih terperinciBAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah
BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan
Lebih terperinciMajalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret
Majalah Ilmiah UPI YPTK, Volume 20, No. 1, Maret 2013 12 PENERAPAN ALGORITMA C 4.5 DALAM MEMPEROLEH DECISION TREE UNTUK MEMPREDIKSI PENENTUAN RESIKO KREDIT PADA BANK BPR BUKITTANDANG MANDIRI PADANG MENGGUNAKAN
Lebih terperinciBAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket
Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa
Lebih terperinciPENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO
PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika
Lebih terperinciPERTEMUAN 14 DATA WAREHOUSE
PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media
Lebih terperinciSOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA
SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA Ade Putra Fakultas Vokasi, Program Studi Komputerisasi Akuntansi Universitas Bina Darma
Lebih terperinciJURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA
JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA IMPLEMENTATION OF DATA MINING WITH C4.5 ALGORITHM TO PREDICT STUDENT ACHIEVEMENT Oleh: SITI MUHIMATUL KHOIROH NPM
Lebih terperinciBAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.
BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung
Lebih terperinciPENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5
PENERAPAN DATA MINING UNTUK MENGANALISA JUMLAH PELANGGAN AKTIF DENGAN MENGGUNAKAN ALGORITMA C4.5 Annisak Izzaty Jamhur Universitas Putera Indonesia YPTK Padang e-mail: annisakizzaty@yahoo.com Abstract
Lebih terperinciBAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet
Lebih terperinciTINJAUAN PUSTAKA. Definisi Data Mining
TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data
Lebih terperinciAbidah Elcholiqi, Beta Noranita, Indra Waspada
Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Studi Sebelum melakukan penelitian penulis terlebih dahulu melakukan tinjauan pustaka dari penelitian lain dan penelitian tentang prediksi penjurusan
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Dropout Data mining
BAB 1 PENDAHULUAN Bab ini membahas mengenai latar belakang masalah, identifikasi masalah, ruang lingkup tugas akhir, maksud dan tujuan tugas akhir, metode penelitian tugas akhir, dan sistematika penulisan
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Pada bab ini akan dijelaskan tahap-tahap yang dilakukan dalam melakukan penelitian. Tahapan penelitian berguna agar pelaksanaan penelitian dapat berjalan dengan baik dan sistematis
Lebih terperinciPERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan
BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Secara sederhana data mining adalah penambangan atau penemuan informasi baru dengan mencari pola atau aturan tertentu dari sejumlah data yang sangat besar. Data mining
Lebih terperinciBAB 3 METODE PENELITIAN. Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain :
BAB 3 METODE PENELITIAN 3.1 Instrumen Penelitian Bahan dan peralatan yang dibutuhkan dalam penelitian ini antara lain : 3.1.1 Bahan Bahan yang digunakan dalam penelitian ini yaitu data siswa kelas SMA
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi
Lebih terperinciIMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA
IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
Lebih terperinciJurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN
Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN
Lebih terperinci3.1 Metode Pengumpulan Data
BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data Sebuah penelitian memerlukan pengumpulan data dan metode pengumpulan data karena sangat berpengaruh terhadap akurasi dan kualitas data yang digunakan
Lebih terperinciBAB III METODE PENELITIAN. ini dilaksanakan dari bulan Agustus Oktober 2016.
BAB III METODE PENELITIAN 3.1. Tempat dan Waktu Penelitian Penelitian ini dilaksanakan di Universitas Muhammadiyah Yogyakarta di ruang Biro Sistem Informasi, gedung AR. Fachruddin B. Adapun waktu penelitian
Lebih terperinci- PERTEMUAN 1 - KNOWLEGDE DISCOVERY
DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data
Lebih terperinciBAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan
Lebih terperinciPenerapan Data Mining dalam Memprediksi Pembelian cat
Konferensi Nasional Sistem & Informatika 2015 STMIK STIKOM Bali, 9 10 Oktober 2015 Penerapan Data Mining dalam Memprediksi Pembelian cat Fitriana Harahap STMIK POTENSI UTAMA Jl. KL. Yos Sudarso KM 6,5
Lebih terperinciANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI
ANALISIS KLASIFIKASI PADA NASABAH KREDIT KOPERASI X MENGGUNAKAN DECISION TREE C4.5 DAN NAÏVE BAYES SKRIPSI Diajukan Kepada Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Negeri Yogyakarta Sebagai
Lebih terperinciBAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan
6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan
Lebih terperinciBAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk
BAB II LANDASAN TEORI 2.1 Sistem Menurut Gondodiyoto (2007), sistem adalah merupakan suatu kesatuan yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk mencapai suatu tujuan tertentu.
Lebih terperinciBAB III METODELOGI PENELITIAN
BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian
Lebih terperinciBAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah
BAB III METODOLOGI Dalam penelitian ini metodologi memegang peranan penting guna mendapatkan data yang obyektik, valid dan selanjutnya digunakan untuk memecahkan permasalahan yang telah dirumuskan. Maka
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Penelitian terkait Penelitian ini sebelumnya dilakukan studi kepustakaan dari penelitian terdahulu sebagai dasar atau acuan untuk menyelesaikan tugas akhir. Dari studi kepustakaan
Lebih terperinciBAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.
BAB IV HASIL DAN PEMBAHASAN 4.1. Identifikasi Masalah Dalam menentukan status calon dosen dan dosen tetap terdapat masalahmasalah dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya sebagai
Lebih terperinciBAB IV METODOLOGI PENELITIAN. Penelitian ini dilakukan dengan melalui empat tahap utama, dimana
BAB IV METODOLOGI PENELITIAN Penelitian ini dilakukan dengan melalui empat tahap utama, dimana tahap pertama adalah proses pengumpulan dokumen teks yang akan digunakan data training dan data testing. Kemudian
Lebih terperinciBAB 3 METODE PENELITIAN
BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi
Lebih terperinciPENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN
PENERAPAN ALGORITMA C4.5 DALAM PEMILIHAN BIDANG PEMINATAN PROGRAM STUDI SISTEM INFORMASI DI STMIK POTENSI UTAMA MEDAN Fina Nasari 1 1 Sistem Informasi, STMIK Potensi Utama 3 Jalan K.L. Yos Sudarso KM.
Lebih terperinciManajemen Data. Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM :
Manajemen Data Dosen : Dr. Yan Rianto Rini Wijayanti, M.Kom Nama : Yoga Prihastomo NIM : 1011601026 MAGISTER ILMU KOMPUTER UNIVERSITAS BUDI LUHUR 2011 DIT TI / DJHKI SKPL-DJHKI-01.04.2011.xx Halaman 0
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Decision Tree Definisi Decision tree adalah sebuah diagram alir yang berbentuk seperti struktur pohon yang mana setiap internal node menyatakan pengujian terhadap suatu atribut,
Lebih terperinci2. Data & Proses Datamining
2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education
Lebih terperinciModel Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree
Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan
Lebih terperinciPEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5
PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,
Lebih terperinciPenerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien
1 Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien Ketut Wisnu Antara 1, Gede Thadeo Angga Kusuma 2 Jurusan Pendidikan Teknik Informatika Universitas Pendidikan Ganesha
Lebih terperinciBAB 1 PENDAHULUAN Latar Belakang. Pertumbuhan pasar swalayan dewasa ini telah meningkat dengan pesat di
BAB 1 PENDAHULUAN 1.1. Latar Belakang Pertumbuhan pasar swalayan dewasa ini telah meningkat dengan pesat di Indonesia, ditandai dengan semakin banyak dan menjamurnya pasar swalayan di berbagai tempat.
Lebih terperinciKLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK
KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Peminatan siswa SMA Negeri 8 Bandung dilakukan di kelas X SMA setelah tahap daftar ulang. Hal tersebut berdasarkan aturan kurikulum 2013 [11]. Peminatan merupakan hal
Lebih terperinciBAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.
BAB I PENDAHULUAN A. Latar Belakang Dengan kemajuan teknologi informasi dewasa ini kebutuhan akan informasi yang akurat sangat dibutuhkan, dikarenakan informasi akan menjadi suatu elemen penting dalam
Lebih terperinciPOHON KEPUTUSAN DENGAN ALGORITMA C4.5
POHON KEPUTUSAN DENGAN ALGORITMA C4.5 1. Pengantar Algoritma C4.5 Klasifikasi merupakan salah satu proses pada data mining yang bertujuan untuk menemukan pola yang berharga dari data yang berukuran relatif
Lebih terperinciUniversitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)
Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas
Lebih terperinciBAB 2 LANDASAN TEORI
6 BAB 2 LANDASAN TEORI 2.1 Sistem Pendukung Keputusan Sistem Pendukung Keputusan (SPK) / Decision Support Sistem (DSS) adalah sistem komputer yang saling berhubungan dan menjadi alat bantu bagi seorang
Lebih terperinciPERBANDINGAN DECISION TREE
84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)
Lebih terperincia. Prosesor yang digunakan adalah Intel Core i3 1.9 Ghz b. RAM dengan ukuran 2GB c. Harddisk dengan ukuran 500GB d. Layar monitor 14.
BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Beberapa perangkat yang digunakan untuk mengerjakan tugas akhir ini adalah sebagai berikut : 1. Perangkat Lunak Dalam melakukan penelitian, peneliti menggunakan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan
Lebih terperinciPENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU
PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro
Lebih terperinciPenerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi
IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan
Lebih terperinci2.2 Data Mining. Universitas Sumatera Utara
Basis data adalah kumpulan terintegrasi dari occurences file/table yang merupakan representasi data dari suatu model enterprise. Sistem basisdata sebenarnya tidak lain adalah sistem penyimpanan-record
Lebih terperinciANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK
ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika
Lebih terperinciVersi Online tersedia di : JURNAL TECH-E (Online)
JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada
Lebih terperinciDATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI
DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI Heroe Santoso 1), I Putu Hariyadi 2), Prayitno 3) 1), 2),3) Teknik Informatika STMIK Bumigora Mataram Jl Ismail Marzuki
Lebih terperinciPENERAPAN DATA MINING UNTUK MEMPREDIKSI KRITERIA NASABAH KREDIT
Jurnal Komputer dan Informatika (KOMPUTA) 53 PENERAPAN DATA MINING UNTUK MEMPREDIKSI KRITERIA NASABAH KREDIT Angga Ginanjar Mabrur [1], Riani Lubis [2] 1,2 Program Studi Teknik Informatika Fakultas Teknik
Lebih terperinciDecision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa
Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi
Lebih terperinciBAB I PENDAHULUAN. Oleh karena itu dalam melakukan Kegiatan usahanya sehari-hari bank harus
BAB I PENDAHULUAN I.1. Latar Belakang Bank adalah lembaga keuangan yang usaha pokoknya adalah menghimpun dana dan menyalurkan kembali dana tersebut ke masyarakat dalam bentuk kredit serta memberikan jasa-jasa
Lebih terperinciPENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE
PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE Castaka Agus Sugianto Program Studi Teknik lnformatika Politeknik TEDC Bandung
Lebih terperinciJURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM
JURNAL PREDIKSI PRESTASI SISWA SEKOLAH DASAR MENGGUNAKAN ALGORITMA CART PREDICTION ELEMENTARY SCHOOL STUDENT ACHIEVEMENT USING CART ALGORITHM Oleh: BENI KURNIAWAN 12.1.03.02.0201 Dibimbing oleh : 1. Resty
Lebih terperinciDecision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa
Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa Winda Widya Ariestya 1, Yulia Eka Praptiningsih 2, Wahyu Supriatin 3 Program Studi Sistem Informasi Fakultas Ilmu Komputer dan Teknologi
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
6 BAB 2 TINJAUAN PUSTAKA 2.1. Sistem Pendukung Keputusan Konsep Sistem Pendukung Keputusan (SPK) atau Decision Support Systems (DSS) pertama kali diungkapkan pada awal tahun 1970-an oleh Michael S. Scott
Lebih terperinciPENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING
PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING Marlindawati 1) Andri 2) 1) Manajemen Informatika Universitas Bina Darma Jl. Ahmad Yani No. 3, Palembang
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA 2.1 Dasar Teori 2.1.1 Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah Proses yang menggunakan
Lebih terperinciStudent Clustering Based on Academic Using K-Means Algoritms
Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com
Lebih terperinciBAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.
BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Perkembangan teknologi informasi telah mampu mengubah persepsi manusia terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.
Lebih terperinciPENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA. Abstrak
JURASIK (Jurn Riset Sistem Informasi & Teknik Informatika) ISSN 2527-5771 PENERAPAN ALGORITMA C4.5 UNTUK KLASIFIKASI PREDIKAT KEBERHASILAN MAHASISWA DI AMIK TUNAS BANGSA Yuni Sara Luvia 1, Dedy Hartama
Lebih terperinciMODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING
MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING Marlindawati1), Andri2) 1), 2) Sistem Informasi UNIVERSITAS BINA DARMA Palembang Jl, Jend. A.Yani
Lebih terperinciPerbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik
Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting
Lebih terperinciBAB 2 TINJAUAN PUSTAKA
BAB 2 TINJAUAN PUSTAKA 2.1 Penelitian Terkait Beberapa jurnal penelitian terkait yang diperoleh tentang pemanfaatan teknik Data Mining dengan metode Association Rule menggunakan Algoritma Apriori untuk
Lebih terperinciIMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)
IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK) [1] Beti Novianti, [2] Tedy Rismawan [3] Syamsul Bahri [1][2][3] Jurusan Sistem Komputer, Fakultas
Lebih terperinciData Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining
Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering
Lebih terperinciUniversitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree
Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika Classification Decision Tree Classification Decision Tree Pengertian Pohon Keputusan Pohon keputusan adalah
Lebih terperinciBAB IV HASIL PENELITIAN DAN PEMBAHASAN
BAB IV HASIL PENELITIAN DAN PEMBAHASAN 1.1 Data Training Data training adalah data yang digunakan untuk pembelajaran pada proses data mining atau proses pembentukan pohon keputusan.pada penelitian ini
Lebih terperinciPROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK
PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK Abet Alpha P Yetli Oslan Abstrak Ketepatan pemilihan rekomendasi produk bagi konsumen
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan penelitian tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat
Lebih terperinciKonsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009
Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu
Lebih terperinciJurnal String Vol. 1 No. 1 Tahun 2016 ISSN:
KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas
Lebih terperinciBAB III METODOLOGI PENELITIAN. digunakan pada proses rekomendasi penjurusan pada jenjang menengah. Merumuskan Masalah
A. Desain Penelitian BAB III METODOLOGI PENELITIAN Gambar 3.1 berikut ini merupakan desain penelitian yang akan digunakan pada proses rekomendasi penjurusan pada jenjang menengah atas. Merumuskan Masalah
Lebih terperinciKerusakan Barang Jadi
Penerapan Algoritma C4.5 pada Analisis Kerusakan Barang Jadi (Studi Kasus: PT Kayu Lapis Asli Murni) Ivan Oktana, Seng Hansun Program Studi Teknik Informatika, Universitas Multimedia Nusantara, Tangerang,
Lebih terperinciBAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.
BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang
Lebih terperinciKLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION
KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi
Lebih terperinci