PE DAHULUA. Latar Belakang

Ukuran: px
Mulai penontonan dengan halaman:

Download "PE DAHULUA. Latar Belakang"

Transkripsi

1 Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di Indonesia oleh penduduk daerah setempat yang memenuhi syarat. Pilkada dilaksanakan setiap lima tahun sekali. Pilkada Kota Bogor dilaksanakan pada tanggal 25 Oktober Hasil Pilkada Kota Bogor merupakan akumulasi dari hasil perhitungan suara di setiap Tempat Pemungutan Suara (TPS). Data hasil pemilihan tersebut dikumpulkan oleh Komisi Pemilihan Umum Daerah Kota Bogor. Salah satu bentuk analisis yang dapat diterapkan pada data hasil Pilkada adalah deteksi pencilan (outlier detection). Pada umumnya, TPS yang jaraknya berdekatan memiliki hasil pemenang pemungutan suara yang relatif sama. Data hasil Pilkada Kota Bogor hanya memiliki atribut non-spasial, sehingga hanya akan terdeteksi global outlier. Jika data tersebut digabung dengan data spasial Kota Bogor, spatial outlier dapat terdeteksi. Spatial outlier adalah objek yang tereferensi secara spasial di mana nilai atribut non-spasial secara signifikan berbeda dari objek yang tereferensi secara spasial di sekitarnya. Proses analisis data yang besar dapat menggunakan teknik data mining. Secara khusus, jika data yang dianalisis merupakan data spasial maka teknik tersebut disebut spatial data mining. Salah satu teknik dalam spatial data mining adalah spatial outlier detection. Dalam teknik spatial outlier detection, terdapat beberapa algoritme. Namun beberapa di antaranya memiliki kelemahan yaitu masih mengandung kesalahan dalam mendeteksi spatial outlier yang sebenarnya. Penggunaan algoritme Iterative Ratio dan Iterative Z-value dianggap dapat mengurangi kesalahan deteksi. Penelitian ini akan mengimplementasikan kedua algoritme tersebut untuk mendeteksi spatial outlier pada data hasil Pilkada Kota Bogor. Tujuan Penelitian ini bertujuan untuk mendeteksi data TPS di Kecamatan Bogor Tengah Kota Bogor yang menjadi spatial outlier dengan menggunakan algoritme Iterative Ratio dan Iterative Z-value. Ruang Lingkup Penelitian ini menggunakan data sekunder hasil Pilkada Kota Bogor tahun 2008 yang berasal dari Komisi Pemilihan Umum Daerah (KPUD) Bogor daerah Kecamatan Bogor Tengah. Manfaat Penelitian ini diharapkan dapat mengungkap data pada TPS mana yang menjadi spatial outlier. Dengan demikian, hasil tersebut dapat dijadikan bahan untuk analisis lanjutan agar dapat memahami proses politik yang terjadi. Praproses Data TI JAUA PUSTAKA Data yang tersimpan dalam suatu basis data seringkali tidak sempurna, mengandung noise (data error), atau tidak konsisten. Oleh karena itu, perlu dilakukan praproses data agar dapat meningkatkan kualitas data yang pada akhirnya akan meningkatkan akurasi dan efisiensi data tersebut. Kualitas data akan menentukan kualitas keputusan (Han & Kamber 2006). Tahap dari praproses dapat dilihat pada Gambar 1 yang terdiri atas : Data cleaning Data integration Data transformation Data reduction Gambar 1 Bentuk praproses data (Han & Kamber 2006). 1 Pembersihan data Permasalahan data kotor dan cara membersihkannya : Nilai yang kosong Untuk mengatasi nilai yang kosong (missing values) dalam data dapat dilakukan dengan penghapusan tuple, mengisi dengan konstanta global 1

2 seperti tidak tahu atau, menggunakan nilai rata-rata dari nilai atribut yang kosong, mengisi dengan nilai rata-rata dari kelas yang sama, atau mengisi dengann nilai yang mungkin dengan menggunakan metode regresi, induksi pohon keputusan (decision tree), dan lain sebagainya. Nilai mengandung noise Data dengan nilai yang mengandung noise dapat diganti dengan nilai hasil perhitungan dengan metode binning, metode regresi, atau dengan cara clustering. Data tidak konsisten 2 Integrasi data Data tidak konsisten diperbaiki dengan menggunakan referensi eksternal. Integrasi data adalah prosess penggabungan data dari berbagai sumber penyimpanan data. 3 Transformasi data Transformasi data akan mengubah data ke dalam bentuk yang sesuai untuk proses data mining. Transformasi data mencakup smoothing, agregasi, generalisasi, normalisasi, atau konstruksi atribut. 4 Reduksi data Teknik reduksi data seperti agregasi kubus data, reduksi dimensi, kompresi data, atau discretization dapat digunakan untuk mereduksi representasi data dengan meminimalkan informasi yang hilang. Data Mining Data mining adalah sebuah proses pencarian secara otomatis informasi yang berguna dalam tempat penyimpanan data berukuran besar (Tan et al. 2005). Istilah lain yang sering digunakan diantaranya knowledge discovery (mining) in databases (KDD), knowledge extraction, data/pattern analysis, data archeology, data dredging, information harvesting, dan business intelligence. Teknik data mining digunakan untuk memeriksa basis data berukuran besar sebagai cara untuk menemukan pola yang baru dan berguna. Data mining adalah bagian integral dari KDD. Keseluruhan proses KDD untuk konversi raw data ke dalam informasi yang berguna ditunjukkan dalam Gambar 2. Gambar 2 Proses knowledge discovery in databases. Spatial Data Mining Spatial data mining mengacu pada ekstraksi pengetahuan, hubungan spasial, atau pola menarik lainnya yang tidak secara eksplisit tersimpan pada basis data spasial (Shekhar et al. 2003). Tantangan terbesar pada spatial data mining adalah proses eksplorasi. Mengekstraksi pola yang menarik dan berguna dari kumpulan data spasial lebih sulit dibandingkan dengan mengekstraksi pola yang berhubungan dengan data kategorik. Hal ini disebabkan oleh kompleksitas dari tipe data spasial, hubungan spasial, dan otokorelasi spasial. Spatial Outlier Detection Outlier secara informal didefinisikan sebagai suatu pengamatan pada kumpulan data di mana muncul ketidakkonsistenan suatu data dengan data yang lainnya pada kumpulan data yang sama, atau yang terdeviasi terlalu banyak dari pengamatan yang lain dengann mekanisme yang berbeda (Tan et al. 2005). Secara informal, spatial outlier merupakan objek yang tereferensi secara spasial di mana atribut non- dengan spasialnya relatif sangat berbeda lingkungannya (Shekhar et al. 2003). Global outlier merupakan objek yang nilainya berbeda secara signifikan dengan seluruh nilai yang ada. Ilustrasi dari global outlier dan spatial outlier terlihat pada Gambar 3. Pendeteksian spatial outlier sangat berguna dalam aplikasi sistem informasi geografis dan basis data spasial. Gambar 3 Global outlier (G) dan spatial outlier (S) (Lu et al. 2003). 2

3 Sekumpulan data spasial dapat dimodelkan sebagai kumpulan objek yang tereferensi secara spasial. Objek spasial memiliki dua kategori dimensi yang berbeda sesuai dengan atribut mana yang akan diukur. Kategori tersebut terdiri atas : 1 Atribut spasial dari objek yang tereferensi secara spasial seperti lokasi, bentuk, dan geometrik atau topologi lainnya. 2 Atribut non-spasial dari objek yang tereferensi secara spasial seperti trafficsensor-identifiers, umur, dan pemilik. K- earest eighbor earest eighbor merupakan teknik klasifikasi yang berdasarkan kedekatan objek. Kedekatan disini didefinisikan dengan ukuran jarak misalnya Euclidean. Jarak Euclidean antar dua titik, misal Titik 1 =(x 1, y 1 ) dan Titik 2 =(x 2, y 2 ) adalah (Han & Kamber 2006) : Dist Titik 1,Titik 2 = (x 1 -x 2 ) 2 +(y 1 -y 2 ) 2 K- earest eighbor (k-nn) akan mengklasifikasikan data terhadap k labeled data terdekat. Algoritme untuk k- earest eighbor adalah : 1 Menentukan nilai k. 2 Menghitung jarak antar setiap titik. 3 Mengelompokkan dengan k titik terdekat untuk setiap titik. Algoritme Iterative Ratio Tantangan yang perlu diperhatikan dalam pendeteksian spatial outlier adalah meminimalkan kesalahan deteksi. Kesalahan terjadi jika spatial outlier yang sebenarnya akan diabaikan, sedangkan spatial outlier yang bukan sebenarnya akan teridentifikasi atau sebaliknya. Salah satu contoh algoritme yang berpotensi melakukan kesalahan deteksi adalah Moran Scatterplot. Moran Scatterplot merupakan plot antara nilai atribut yang telah dinormalisasi (sumbu x) dengan nilai rataan tetangga atribut yang telah dinormalisasi (sumbu y) (Luc 1995). Moran Scatterplot memiliki empat kuadran. Jika objek berada pada kuadran low outlier dan high outlier, maka objek tersebut merupakan spatial outlier. Low outlier adalah objek yang nilainya rendah diantara objek yang nilainya tinggi. High outlier adalah objek yang nilainya tinggi diantara objek yang nilainya rendah. Jika objek berada pada kuadran cluster, maka objek tersebut bukan spatial outlier karena nilai dari objek tersebut tidak berbeda dengan objek tetangganya. Hal ini ditunjukkan oleh Gambar 4. Gambar 4 Struktur Moran Scatterplot. Kesalahan deteksi spatial outlier yang dilakukan Moran Scatterplot diperlihatkan pada Gambar 5 dan 6. Pada Gambar 5(a) dan Gambar 6(a), titik dibagi menjadi tiga kelas yaitu kelas sedikit, sedang, dan banyak. Ketiga kelas ini direpresentasikan dengan warna berbeda. Warna hijau merepresentasikan kelas sedikit, warna kuning merepresentasikan kelas sedang, dan warna merah merepresentasikan kelas banyak. Titik dengan ID_OBJ=81 merupakan spatial outlier. Pada Gambar 5(a) terlihat bahwa kelas titik tersebut berbeda dengan kelas titik di sekitarnya di mana kelas titik di sekitarnya adalah kelas sedikit dan sedang. Dengan menggunakan Morran Scatterplot, titik tersebut tidak terdeteksi sebagai spatial outlier karena titik berada pada kuadran cluster. Spatial Outlier dengan ID_OBJ=81 (a) Spatial outlier (b) Moran Scatterplot Gambar 5 Kesalahan deteksi spatial outlier pada Moran Scatterplot. 3

4 Moran Scatterplot juga melakukan kesalahan dengan mendeteksi suatu titik sebagai spatial outlier, tetapi titik tersebut bukan merupakan spatial outlier. Pada Gambar 6(a), titik dengan ID_OBJ=136 bukan spatial outlier karena tetangga dari titik tersebut kelasnya sama yaitu kelas sedikit (warna hijau). Dengan Moran Scatterplot, titik tersebut dianggap sebagai spatial outlier karena berada pada kuadran high outlier. 1 Untuk setiap titik spasial x i, dihitung k nearest neighbors set k (x i ) dan fungsi neighborhood g(x i ) g(x i ) 1 k xϵ k (x i ) f(x) Dihitung juga fungsi h i = h(x i ) = f(x i )/g(x i ). Gambar 7 memperlihatkan ilustrasi dari perhitungan set k (x i ), g(x i ), dan h(x i ). ID_OBJ=136 W Z-Score Attribute of values Low outlier cluster (a) Spatial outlier Z-Score Attribute of values (b) Morran Scatterplot Gambar 6 Kesalahan deteksi spatial outlier pada Moran Scatterplot. Beberapa variabel yang digunakan dalam algoritme Iterative Ratio dan Iterative Z-value adalah: x i adalah titik spasial. cluster ID_OBJ=136 High outlier k(x i ) adalah k nearest neighbors terhadap titik x. f(x) adalah fungsi yang merepresentasikan nilai atribut dari x i. g(x) adalah fungsi yang memetakan X (data set spasial) ke R (bilangan real). Fungsi ini diimplementasikan dengan fungsi rataan. h(x) adalah fungsi yang digunakan untuk membandingkan g dan f. Algoritme Iterative Ratio adalah sebagai berikut (Lu et al. 2003): Gambar 7 Ilustrasi perhitungan set k(x i ), g(x i ), dan h(x i ). 2 Misal h q menunjukkan nilai maksimum dari h 1, h 2,, h n Dengan batas θ yang telah diketahui, jika h q θ, maka x q ditentukan sebagai spatial outlier (S-outlier). 3 Nilai f(x q ) diperbaharui sebagai g(x q ). Untuk setiap titik spasial x i di mana k (x i ) mengandung x q, nilai g(x i ) dan h i diperbaharui. 4 Langkah 2, 3, dan 4 diulangi sampai nilai h i tidak melebihi batas θ atau sampai total jumlah S-outlier sebesar m. Algoritme Iterative Z-value Algoritme Iterative Z-value adalah sebagai berikut (Lu et al. 2003): 1 Untuk setiap titik spasial x i, dihitung k nearest neighbors set k (x i ), fungsi neighborhood g(x i ). g(x i ) 1 k xϵ k (x i ) f(x) Dihitung juga fungsi h i =h(x i ) = f(x i ) g(x i ). 2 Misal µ dan σ menunjukkan rataan sampel dan standar deviasi sampel dari suatu data set {h1, h2,.,h n }. Selanjutnya, dihitung nilai absolut y i untuk i = 1, 2,.,n. y i = h i- µ σ Misal y q adalah nilai maksimum dari y 1,y 2,,y n. Dengan batas θ yang telah, 4

5 diketahui, jika y q θ, maka x q ditentukan S-outlier. 3 Nilai f(x q ) diperbaharui sebagai g(x q ). Untuk setiap titik spasial x i di mana k (x i ) mengandung x q, nilai g(x i ) dan h i diperbaharui. 4 Nilai µ dan σ dihitung kembali pada data set {h 1, h 2,, h n }. Untuk i = 1,2,,n, nilai diperbaharui. Penggabungan Data Proses spatial data mining memerlukan data spasial dan non-spasial. Oleh karena itu, untuk proses selanjutnya data spasial dan non-spasial digabungkan. 5 Langkah 2, 3, dan 4 diulangi sampai nilai y i tidak melebihi batas θ atau sampai total jumlah S-outlier sebesar m. Pada algoritme Iterative Ratio dan Iterative Z-value, jika S-outlier terdeteksi, maka koreksi akan dilakukan dengan segera. Koreksi yang dilakukan adalah dengan mengganti nilai atribut S-outlier dengan nilai rataan atribut di sekitarnya. Dengan adanya koreksi ini dapat mencegah titik normal yang berada dekat dengan spatial outlier terdeteksi sebagai spatial outlier. METODE PE ELITIA Penelitian ini dilakukan dalam beberapa tahap seperti yang digambarkan pada Gambar 8 yaitu pengadaan data, praproses data, penggabungan data, membentuk k-nn list, analisis spatial outlier dengan algoritme Iterative Ratio dan Iterative Z-value, dan visualisasi. Pengadaan Data Data hasil Pilkada Kota Bogor pada tahun 2008 diperoleh dari KPUD Kota Bogor. Karena penelitian ini difokuskan pada kecamatan Bogor Tengah, maka pengadaan data dilanjutkan dengan meminta data pada Panitia Pemungutan Suara (PPS) Bogor Tengah. Data tersebut merupakan data yang memiliki atribut nonspasial. Data yang juga diperlukan adalah data spasial Kota Bogor. Praproses Data Praproses dilakukan untuk data hasil Pilkada dan peta. Beberapa tahapan yang dilakukan dalam tahap praproses, di antaranya: Pembersihan data Transformasi data Praproses data dilakukan untuk meningkatkan kualitas data yang dianalisis. Dengan peningkatan kualitas data maka kualitas hasil keputusan juga akan lebih baik. Gambar 8 Tahap penelitian. Pendugaan Spatial Outlier Pada langkah ini, akan diduga data pada TPS mana yang menjadi spatial outlier. Pendugaan dilakukan dengan melihat pola sebaran dari kelas persentase. Ada dua metode yang digunakan yaitu Equal Interval dan atural Breaks. Equal interval merupakan proses pembagian nilai menjadi beberapa kelas dengan interval yang sama untuk setiap kelas. atural Breaks merupakan proses pembagian nilai ke dalam beberapa kelas dengan menggunakan algoritme Jenk s Optimization. Algoritme Jenk s Optimization adalah sebagai berikut (Slocum 2004) : 5

OUTLIER PADA DATA HASIL PILKADA KOTA BOGOR BERDASARKA TEMPAT PEMU GUTA SUARA ADE TRISETYO

OUTLIER PADA DATA HASIL PILKADA KOTA BOGOR BERDASARKA TEMPAT PEMU GUTA SUARA ADE TRISETYO DETEKSI SPATIAL OUTLIER PADA DATA HASIL PILKADA KOTA BOGOR BERDASARKA TEMPAT PEMU GUTA SUARA ADE TRISETYO DEPARTEME ILMU KOMPUTER FAKULTAS MATEMATIKA DA ILMU PE GETAHUA ALAM I STITUT PERTA IA BOGOR BOGOR

Lebih terperinci

HASIL DA PEMBAHASA. Pengadaan Data

HASIL DA PEMBAHASA. Pengadaan Data 1 Memilih atribut yang akan diklasifikasikan ke dalam k kelas, misal atribut yang dipilih adalah atribut x. 2 Sekumpulan k-1 nilai dibangkitkan secara acak dalam selang [min{x}, max{x}]. Selang ini digunakan

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN 1 PENDAHULUAN Latar Belakang Kemiskinan merupakan suatu hal yang memiliki batasan yang luas, tetapi bagaimanapun juga batasan mengenai kemiskinan harus tetap diukur untuk kebijakan pemerintah. Menurut

Lebih terperinci

DATA PREPROCESSING. Budi Susanto (versi 1.2)

DATA PREPROCESSING. Budi Susanto (versi 1.2) DATA PREPROCESSING Budi Susanto (versi 1.2) Kenali Data Anda Atribut Data Memahami tipe atribut Membantu membetulkan data saat integrasi data Deskripsi Statistik Data Memudahkan untuk mengisi nilai yang

Lebih terperinci

Task III : Data Transformation (Transformasi Data) Beberapa Pendekatan Transformasi Data. Smoothing. Normalization (#2) Normalization (#1)

Task III : Data Transformation (Transformasi Data) Beberapa Pendekatan Transformasi Data. Smoothing. Normalization (#2) Normalization (#1) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #4: Data Preprocessing (Bagian 2) Task III : Data Transformation (Transformasi Data) Mengubah / mentransformasikan data ke dalam

Lebih terperinci

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY

- PERTEMUAN 1 - KNOWLEGDE DISCOVERY DATA WAREHOUSE - PERTEMUAN 1 - KNOWLEGDE DISCOVERY in DATABASE (KDD) Penemuan Pengetahuan di Database Tujuan : Mahasiswa Dapat memahami konsep KDD yang merupakan tujuan akhir dari Data Warehouse dan Data

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan,

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006.

jumlah keluarga, dan jumlah rumah. Data diambil dari hasil sensus potensi desa yang dilakukan BPS tahun 1996, 1999, 2003, dan 2006. 1 Latar Belakang PENDAHULUAN Kemajuan teknologi komputer semakin memudahkan proses penyimpanan dan pengolahan data berukuran besar. Namun demikian, seringkali data yang sudah tersimpan belum dimanfaatkan

Lebih terperinci

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Situs jejaring sosial merupakan gaya hidup sosial baru yang muncul seiring berkembangnya internet. Gaya hidup baru tersebut memiliki ruang lingkup yang lebih luas

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009

Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES. Bertalya Universitas Gunadarma 2009 Konsep Data Mining DATA MINING & KNOWLEDGE DISCOVERY IN DATABASES Bertalya Universitas Gunadarma 2009 Data Mining (DM) DM merupakan suatu proses penjelajahan otomatis untuk mendapatkan informasi berguna

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

Data Preprocessing. oleh: Entin Martiana

Data Preprocessing. oleh: Entin Martiana Data Preprocessing oleh: Entin Martiana Data Data yang ada pada umumnya: Banyak noise Ukuran yang besar Dapat merupakan campuran dari berbagai sumber Memahami data sangat penting untuk preprocessing September

Lebih terperinci

BAB III LANDASAN TEORI

BAB III LANDASAN TEORI BAB III LANDASAN TEORI 3.1 Data, Informasi, Pengetahuan Data adalah bilangan, terkait dengan angka angka atau atribut atribut yang bersifat kuantitas, yang berasal dari hasil observasi, eksperimen, atau

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1 Penambangan Data (Data Mining) Pengertian data mining, berdasarkan beberapa orang: 1. Data mining (penambangan data) adalah suatu proses untuk menemukan suatu pengetahuan atau

Lebih terperinci

METODE PENELITIAN. Gambar 2 Tahapan penelitian. Praproses Data

METODE PENELITIAN. Gambar 2 Tahapan penelitian. Praproses Data daerah dalam lingkup R dan f(r) adalah fungsi yang dijalankan pada lingkup R. Mekanisme algoritme Naive adalah sebagai berikut : 1 Menentukan dataset D yang merupakan himpunan seluruh poligon / daerah

Lebih terperinci

BAB 1 PENGERTIAN DATA MINING DAN FUNGSI-FUNGSI DATA MINING

BAB 1 PENGERTIAN DATA MINING DAN FUNGSI-FUNGSI DATA MINING BAB 1 PENGERTIAN DATA MINING DAN FUNGSI-FUNGSI DATA MINING Pendahuluan Perkembangan yang cepat dalam teknologi pengumpulan dan penyimpanan data telah memudahkan organisasi untuk mengumpulkan sejumlah data

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1. Tinjauan Pustaka Sistem data mining akan lebih efektif dan efisiensi dengan komputerisasi yang tepat. Sistem data mining mampu memberikan informasi yang

Lebih terperinci

BAB 1 PENDAHULUAN Latar Belakang

BAB 1 PENDAHULUAN Latar Belakang BAB 1 PENDAHULUAN 1.1. Latar Belakang Pasar modal merupakan salah satu bagian dari pasar keuangan, di samping pasar uang, yang sangat penting peranannya bagi pembangunan nasional pada umumnya dan bagi

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Salah satu persoalan lingkungan yang muncul hampir setiap tahun di Indonesia terutama pasca tahun 2000 adalah kebakaran hutan, termasuk di wilayah provinsi Riau. Kebakaran hutan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Data Mining 2.1.1 Pengertian Data Mining Dengan semakin besarnya jumlah data dan kebutuhan akan analisis data yang akurat maka dibutuhkan metode analisis yang tepat. Data mining

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA 1 Latar Belakang PENDAHULUAN Teknologi basis data saat ini berkembang sangat pesat. Data disimpan dalam basis data, diolah kemudian disajikan sebagai informasi yang bernilai bagi pengguna. Penyimpanan

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDHULUN Listrik merupakan sumber daya yang sangat dibutuhkan saat ini. Penggunaan listrik setiap tahun, bahkan setiap bulan terus meningkat. Hal ini dibuktikan dengan selalu bertambahnya

Lebih terperinci

Tahapan Proses KDD (Peter Cabena)

Tahapan Proses KDD (Peter Cabena) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (Business

Lebih terperinci

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas 1. Memahami cakupan materi dan sistem perkuliahan Data Mining.

Lebih terperinci

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge

Lebih terperinci

PERTEMUAN 14 DATA WAREHOUSE

PERTEMUAN 14 DATA WAREHOUSE PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Data Mining Dengan perkembangan pesat teknologi informasi termasuk diantaranya teknologi pengelolaan data, penyimpanan data, pengambilan data disertai kebutuhan pengambilan

Lebih terperinci

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket

BAB 1 KONSEP DATA MINING 2 Gambar 1.1 Perkembangan Database Permasalahannya kemudian adalah apa yang harus dilakukan dengan data-data itu. Sudah diket Bab1 Konsep Data Mining POKOK BAHASAN: Konsep dasar dan pengertian Data Mining Tahapan dalam Data Mining Model Data Mining Fungsi Data Mining TUJUAN BELAJAR: Setelah mempelajari materi dalam bab ini, mahasiswa

Lebih terperinci

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4)

Tahapan Proses KDD (Peter Cabena) Business Objective Determination (#1) Business Objective Determination (#2) Business Objective Determination (#4) Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #2 Gunawan Jurusan Teknik Informatika Sekolah Tinggi Teknik Surabaya Tahapan Proses KDD (Peter Cabena) Penentuan Sasaran Bisnis (

Lebih terperinci

BAB 3 METODE PENELITIAN

BAB 3 METODE PENELITIAN BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi

Lebih terperinci

Estimasi Parameter pada Regresi Spatial Error Model (SEM) yang Memuat Outlier menggunakan Iterative Z Algorithm

Estimasi Parameter pada Regresi Spatial Error Model (SEM) yang Memuat Outlier menggunakan Iterative Z Algorithm PRISMA 1 (2018) https://journal.unnes.ac.id/sju/index.php/prisma/ Estimasi Parameter pada Regresi Spatial Error Model (SEM) yang Memuat Outlier menggunakan Iterative Z Algorithm Yulia Sari, Nur Karomah

Lebih terperinci

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian Implementasi Sistem Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkahlangkah melakukan clustering dengan FCM,

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK Dody Herdiana, S.T., M. Kom. Dosen PNS DPK pada Program Studi Teknik Informatika

Lebih terperinci

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 4 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2015 Pre-Processing Agregasi (aggregation) Penarikan contoh (sampling)

Lebih terperinci

Data Mining Outline BAB I Pendahuluan. Proses Data Mining. Recap

Data Mining Outline BAB I Pendahuluan. Proses Data Mining. Recap Data Mining Outline BAB I Pendahuluan BAB II Data BAB III Algoritma Klasifikasi BAB IV Algoritma Klastering BAB V Algoritma Asosiasi BAB VI Algoritma Estimasi BAB VII Deteksi Anomali Ricky Maulana Fajri

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1. Penambangan Data (Data Mining) Penambangan data (Data Mining) adalah serangkaian proses untuk menggali nilai tambah dari sekumpulan data berupa pengetahuan yang selama ini

Lebih terperinci

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang 1 BAB I PENDAHULUAN 1.1 Latar Belakang Data mining adalah salah satu teknik dan proses untuk menemukan suatu pola dan pengetahuan dari data yang berjumlah besar (Han dkk., 2011). Proses yang dilakukan

Lebih terperinci

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD)

Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika. Knowledge Discovery in Databases (KDD) Universitas Putra Indonesia YPTK Padang Fakulas Ilmu Komputer Program Studi Teknik Informatika Knowledge Discovery in Databases (KDD) Knowledge Discovery in Databases (KDD) Definisi Knowledge Discovery

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 3 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2015 Definisi Set Data Set Data / Data Set / Himpunan Data Kumpulan

Lebih terperinci

Jurnal Format Volume 6 Nomor 2 Tahun 2017 :: ISSN :

Jurnal Format Volume 6 Nomor 2 Tahun 2017 :: ISSN : Penggunaan Mining dalam Kegiatan Sistem Pembelajaran Berbantuan Komputer Diky Firdaus Program Studi Informatika Fakultas Ilmu Komputer Universitas Mercu Buana, Jalan Meruya Selatan no. 1 Jakarta e-mail

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 6 BAB 2 LANDASAN TEORI Pada tinjauan pustaka ini akan dibahas tentang konsep dasar dan teori-teori yang mendukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Basis Data (Database) Database

Lebih terperinci

Z = HASIL DAN PEMBAHASAN

Z = HASIL DAN PEMBAHASAN 1 D adalah himpunan daerah Bogor yang terdiri dari 68 desa/kelurahan di Kota Bogor. 2 Mengonversi himpunan daerah tersebut ke dalam matriks di MATLAB. 3 Menentukan daerah R menggunakan MBR (Minimum Bounding

Lebih terperinci

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA

SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA SOLUSI PREDIKSI MAHASISWA DROP OUT PADA PROGRAM STUDI SISTEM INFORMASI FAKULTAS ILMU KOMPUTER UNIVERSITAS BINA DARMA Ade Putra Fakultas Vokasi, Program Studi Komputerisasi Akuntansi Universitas Bina Darma

Lebih terperinci

MODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH. NOVIANDI, M.Kom NIDN

MODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH. NOVIANDI, M.Kom NIDN MODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH NOVIANDI, M.Kom NIDN. 0318018202 PROGRAM STUDI MANAJEMEN INFORMASI KESEHATAN FAKULTAS ILMU-ILMU KESEHATAN UNIVERSITAS ESA UNGGUL 2018 0 BAB

Lebih terperinci

Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer

Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer Proses Data Mining dalam Sistem Pembelajaran Berbantuan Komputer Mewati Ayub Jurusan Teknik Informatika, Fakultas Teknologi Informasi Universitas Kristen Maranatha, Bandung Email : mewati.ayub@eng.maranatha.edu

Lebih terperinci

3.1 Metode Pengumpulan Data

3.1 Metode Pengumpulan Data BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data Sebuah penelitian memerlukan pengumpulan data dan metode pengumpulan data karena sangat berpengaruh terhadap akurasi dan kualitas data yang digunakan

Lebih terperinci

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami pemrosesan awal data yang akan diproses

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Konsep Pemasaran Dalam merancang dan mengembangkan produk, baik yang berupa jasa maupun barang, tidak terlepas dari konsep pemasaran yang bertujuan memenuhi

Lebih terperinci

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya. BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI 2.1 Tinjauan Pustaka Salah satu cara untuk mengetahui faktor nilai cumlaude mahasiswa Fakultas Teknik Universitas Muhammadiyah Yogyakarta adalah dengan menerapkan

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP Hak cipta dan penggunaan kembali: Lisensi ini mengizinkan setiap orang untuk menggubah, memperbaiki, dan membuat ciptaan turunan bukan untuk kepentingan komersial, selama anda mencantumkan nama penulis

Lebih terperinci

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. BAB 2 LANDASAN TEORI Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun. 2.1. Data Mining Data mining adalah suatu istilah yang digunakan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Instrumen Penelitian Pada penelitian ini bahan dan peralatan yang diperlukan sebagai berikut: 3.1.1 Bahan Dalam penelitian ini bahan yang dibutuhkan adalah data siswa kelas

Lebih terperinci

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian

2 TINJAUAN PUSTAKA. Ruang Lingkup Penelitian 3 Ruang Lingkup Penelitian 1. Teknik yang digunakan dalam membentuk clustering titik panas adalah DBSCAN. 2. Data yang digunakan pada penelitian ini adalah data titik panas kebakaran hutan di Indonesia

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Perkembangan teknologi informasi yang sangat pesat yang terjadi dewasa ini menuntut manusia untuk mampu beradaptasi dengan perkembangan tersebut. Upaya adaptasi yang dilakukan

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN METODE PENELITIAN Proses Dasar Sistem Proses dasar pengembangan sistem secara umum terdiri dari tahapan sebagai berikut: 1 Praproses. Pada tahap ini dilakukan persiapan yang meliputi seleksi data, transformasi

Lebih terperinci

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,

Lebih terperinci

I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan

I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan BAB. I. PENDAHULUAN I.1 Latar Belakang Masalah Seiring berjalannya waktu dan perkembangan teknologi media penyimpanan elektronik, setiap organisasi dapat menyimpan datanya secara elektronik dan bersifat

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 PENERAPAN DATA MINING UNTUK MEMBENTUK KELOMPOK BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMPN 19 BANDUNG Andre Catur Prasetyo Teknik Informatika Universitas

Lebih terperinci

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE

JURNAL TEKNIK, (2014) APLIKASI DATA MINING UNTUK MEMPREDIKSI PERFORMANSI MAHASISWA DENGAN METODE KLASIFIKASI DECISION TREE JURNA TEKNIK, (2014) 1-6 1 AIKASI DATA MINING UNTUK MEMREDIKSI ERFORMANSI MAHASISWA DENGAN METODE KASIFIKASI DECISION TREE Irfan Fahmi, Budi Santosa Jurusan Teknik Industri, Fakultas Teknologi Industri,

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal

Lebih terperinci

HASIL DAN PEMBAHASAN. Microsoft SQL Server Microsoft Sharepoint Microsoft.Net Framework 4.0.

HASIL DAN PEMBAHASAN. Microsoft SQL Server Microsoft Sharepoint Microsoft.Net Framework 4.0. 3 warehouse dan data mart memiliki batasan yang sangat tipis, namun perbedaan ini tidak perlu dikhawatirkan karena secara subtansi tujuan dari pembuatannya memiliki kesamaan (Noviandi 2010). Konsep data

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA Pada tinjauan pustaka ini membahas tentang landasan teori yang medukung pembahasan yang berhubungan dengan sistem yang akan dibuat. 2.1 Data Mining Data mining adalah kegiatan menemukan

Lebih terperinci

Penggunaan Pohon Keputusan untuk Data Mining

Penggunaan Pohon Keputusan untuk Data Mining Penggunaan Pohon Keputusan untuk Data Mining Indah Kuntum Khairina NIM 13505088 Program Studi Teknik Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan Ganesha

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Ketika suatu organisasi tumbuh semakin besar dan pola tingkatan operasionalnya semakin tidak sederhana dan kompleks, maka secara alamiah tuntutan pihak manajemen akan

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

HASIL DAN PEMBAHASAN Praproses Data Clustering

HASIL DAN PEMBAHASAN Praproses Data Clustering Perangkat lunak: Sistem operasi: Windows XP Home Edition, WEKA versi 3.5.7, ArcView GIS 3.3, Map Server For Windows (ms4w) 2.3.1 Chameleon 2.4.1 Perangkat keras: Prosessor intel Pentium 4 ~2GHz Memory

Lebih terperinci

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami definisi set data, tipe data, kualitas

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi IJCCS, Vol.x, No.x, July xxxx, pp. 1~5 ISSN: 1978-1520 39 Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi Irwan

Lebih terperinci

PENDAHULUAN. Latar Belakang

PENDAHULUAN. Latar Belakang Latar Belakang PENDAHULUAN Penelitian mengenai pengenalan wajah termotivasi oleh banyaknya aplikasi praktis yang diperlukan dalam identifikasi wajah. Pengenalan wajah sebagai salah satu dari teknologi

Lebih terperinci

MODUL 2 DATA DAN EKSPLORASI DATA

MODUL 2 DATA DAN EKSPLORASI DATA MODUL 2 DATA DAN EKSPLORASI DATA 2.1. Tujuan Mahasiswa dapat memahami dan menjelaskan tentang jenis data dan cara mengeksplorasi data 2.2. Teori Singkat Data dan Eksplorasi Data 2.2.1 Data Objek dan Tipe

Lebih terperinci

BAB II KAJIAN PUSTAKA

BAB II KAJIAN PUSTAKA BAB II KAJIAN PUSTAKA Sumber-sumber yang digunakan dalam pembuatan tugas akhir, baik yang diambil dari buku, internet, maupun jurnal diuraikan secara terperinci pada Bab Tinjuan Pustaka. Konsep dan definisi

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009 Konsep Data Mining Pendahuluan Bertalya Universitas Gunadarma 2009 Latar Belakang Data yg dikumpulkan semakin bertambah banyak Data web, e-commerce Data pembelian di toko2 / supermarket Transaksi Bank/Kartu

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya

Lebih terperinci

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data

Lingkungan Pengembangan Data Mining HASIL DAN PEMBAHASAN Preprocessing Data Setelah dilakukan analisis clustering maka algoritme tersebut akan dibandingkan berdasarkan cluster yang terbentuk dari hasil analisis cluster-nya. Hasil perbandingan diharapkan dapat membuktikan bahwa

Lebih terperinci

Student Clustering Based on Academic Using K-Means Algoritms

Student Clustering Based on Academic Using K-Means Algoritms Student Clustering Based on Academic Using K-Means Algoritms Hironimus Leong, Shinta Estri Wahyuningrum Faculty of Computer Science, Faculty of Computer Science Unika Soegijapranata marlon.leong@gmail.com

Lebih terperinci

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA

DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA DATA MINING CLUSTERING DENGAN ALGORITMA FUZZY C-MEANS UNTUK PENGELOMPOKAN JADWAL KEBERANGKATAN DI TRAVEL PT. XYZ TASIKMALAYA Aseptian Nugraha, Acep Irham Gufroni, Rohmat Gunawan Teknik Informatika Fakultas

Lebih terperinci

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING Marlindawati 1) Andri 2) 1) Manajemen Informatika Universitas Bina Darma Jl. Ahmad Yani No. 3, Palembang

Lebih terperinci

BAB II. TINJAUAN PUSTAKA

BAB II. TINJAUAN PUSTAKA DAFTAR ISI Halaman HALAMAN JUDUL... i HALAMAN PENGESAHAN... ii HALAMAN PERNYATAAN... iii KATA PENGANTAR... iv DAFTAR ISI... vi DAFTAR TABEL... ix DAFTAR GAMBAR... x DAFTAR LAMPIRAN... xii ABSTRACT... xiii

Lebih terperinci

Bab III ANALISIS&PERANCANGAN

Bab III ANALISIS&PERANCANGAN 3.1 Analisis Masalah Bab III ANALISIS&PERANCANGAN Pada penelitian sebelumnya yaitu ANALISIS CBIR TERHADAP TEKSTUR CITRA BATIK BERDASARKAN KEMIRIPAN CIRI BENTUK DAN TEKSTUR (A.Harris Rangkuti, Harjoko Agus;

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA BAB 2 TINJAUAN PUSTAKA 2.1. Penelitian Terkait Pada penelitian ini, peneliti melakukan penelitian yang didasarkan pada penelitian terdahulu yang terkait dengan penelitian yang akan dilakukan peneliti.

Lebih terperinci

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING Marlindawati1), Andri2) 1), 2) Sistem Informasi UNIVERSITAS BINA DARMA Palembang Jl, Jend. A.Yani

Lebih terperinci

IV. METODE PENELITIAN

IV. METODE PENELITIAN 33 IV. METODE PENELITIAN 3.1 Kerangka Pemikiran Berdasarkan perumusan masalah, tujuan dan manfaat, penelitian ini dibangun atas dasar kerangka pemikiran bahwa kemiskinan merupakan masalah multidimensi

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA BAB II TINJAUAN PUSTAKA A. Knowledge Discovery in Database (KDD) dan Data Mining Banyak orang menggunakan istilah data mining dan knowledge discovery in databases (KDD) secara bergantian untuk menjelaskan

Lebih terperinci