Data Preprocessing dengan RapidMiner Budi Susanto. RapidMiner - Budi Susanto
|
|
- Ridwan Tedjo
- 7 tahun lalu
- Tontonan:
Transkripsi
1 Data Preprcessing dengan RapidMiner Budi Susant RapidMiner - Budi Susant
2 Atribut Data Kenali Data Anda Memahami tipe atribut Membantu membetulkan data saat integrasi data Deskripsi Statistik Data Memudahkan untuk mengisi nilai yang ksng, memperhalus nise data, mengetahui utlier selama pemrsesan data Mengukur Kesamaan dan ketidaksamaan Dapat berguna juga untuk mendeteksi utlier Untuk melakukan klasifikasi Pada umumnya untuk mengukur kedekatan. RapidMiner - Budi Susant
3 Data Data yang ada pada umumnya: Banyak nise Ukuran yang besar Dapat merupakan campuran dari berbagai macam sumber Memahami data sangat penting untuk tahap preprsesing. RapidMiner - Budi Susant
4 Atribut Data Mencerminkan karakteristik bjek data. Tipe atribut menentukan himpunan nilai yang diperblehkan. Nminal Binary (Binmial) Ordinal Numerik Interval-scale Rati-scale Diskret atau Cntinue RapidMiner - Budi Susant
5 Deskripsi Statistik Mengukur lkasi pusat/tengah dari distribusi data Mean Median Mde Midrange Data Mining: Cncepts and Techniques, 3th ed., p. 47 RapidMiner - Budi Susant
6 Deskripsi Statistik Mengukur penyebaran data Rentang dan Kuartil Variasi dan Standard Deviasi Data Mining: Cncepts and Techniques, 3th ed., p. 48 RapidMiner - Budi Susant
7 Interquartil Range (IQR) Q3 Q1 Outlier data 1.5 x IQR BxPlt RapidMiner - Budi Susant
8 Mengukur Kesamaan Dalam aplikasi data mining, seperti clustering, analisis utlier, klasifikasi nearest-neighbr, membutuhkan cara untuk menilai dua bjek data serupa atau tidak. Minkwski distance Euclidean dan Manhattan Csine RapidMiner - Budi Susant
9 Mengukur Kesamaan RapidMiner - Budi Susant
10 Data Preprcessing Teknik-teknik: Data Cleaning Data integratin Data Reductin Data Transfrmatin Mengapa penting? Untuk memenuhi data quality Accuracy Cmpleteness Cnsistency Disamping terdapat faktr data quality lain: Timeliness Believability interpretability RapidMiner - Budi Susant
11 Data Cleaning Prses untuk membersihkan data dengan beberapa teknik Memperkecil nise membetulkan data yang tidak knsisten. Mengisi missing value Mengidentifikasi atau membuang utlier RapidMiner - Budi Susant
12 Data Cleaning: Missing Values Mengabaikan recrd Biasanya untuk label klasifikasi yang ksng Mengisikan secara manual Menggunakan mean/median dari atribut yang mengandung missing value Mean dapat dipakai jika distribusi data nrmal Median digunakan jika distribusi data tidak nrmal (cndng) Menggunakan nilai glbal Menggunakan nilai termungkin Menerapkan regresi RapidMiner - Budi Susant
13 Data Cleaning: Nisy Data Nise data adalah suatu kesalahan acak atau variasi dalam variabel terukur. Teknik-teknik Binning Smthing by bin means Smthing by bin medians Smthing by bin bundaries Regressin Outlier Analysis RapidMiner - Budi Susant
14 Percbaan Data Cleaning Dataset Labr-Negtiatins RapidMiner - Budi Susant
15 RapidMiner - Budi Susant Wrkflw #1
16 Data Integratin Data dapat bersumber dari beberapa sumber Teknik Analisis krelasi Atribut redundan duplikasi RapidMiner - Budi Susant
17 Cvariance Crrelatin RapidMiner - Budi Susant
18 Data Transfrmatin Tujuannya: diharapkan lebih efisien dalam prses data mining dan mungkin juga agar pla yang dihasilkan lebih mudah dipahami. Strategi: Smthing Attribute (feature) cnstructin Aggregatin Nrmalizatin Discretizatin RapidMiner - Budi Susant
19 Data Transfrmatin: Aggregatin dan Smthing RapidMiner - Budi Susant
20 Data Transfrmatin: Nrmalizatin Unit ukuran dapat mempengaruhi analisis data. Unit yang lebih kecil akan menghasilkan rentang nilai yang besar Atribut akan memiliki bbt yang lebih besar dari atribut lain Sehingga Data perlu dinrmalisasi atau dibakukan. Hasil suatu nrmalisasi adalah [-1, 1] atau [0.0, 1.0] Diperlukan dalam klasifikasi (termasuk neural netwrk dan nearest netwrk) dan clustering. RapidMiner - Budi Susant
21 Data Transfrmatin: Metde Nrmalizatin Min-max Z-scre Decimal scaling RapidMiner - Budi Susant
22 RapidMiner - Budi Susant nrmalizatin
23 Data Transfrmatin: Discretizatin Melakukan pergantian atribut numerik menjadi interval label (misalnya: 0-10,11-20, dst.) atau knseptual label (misalnya: bawah, tengah, atas) RapidMiner - Budi Susant
24 RapidMiner - Budi Susant discretizatin
25 Teknik Data Transfrmatin: Data Reductin Dimensinality reductin Wavelet transfrm Principal Cmpnent Analysis Attribute Subset Selectin Numersity reductin sampling Data cmpressin RapidMiner - Budi Susant
DATA PREPROCESSING. Budi Susanto (versi 1.2)
DATA PREPROCESSING Budi Susanto (versi 1.2) Kenali Data Anda Atribut Data Memahami tipe atribut Membantu membetulkan data saat integrasi data Deskripsi Statistik Data Memudahkan untuk mengisi nilai yang
Lebih terperinciData Preprocessing. oleh: Entin Martiana
Data Preprocessing oleh: Entin Martiana Data Data yang ada pada umumnya: Banyak noise Ukuran yang besar Dapat merupakan campuran dari berbagai sumber Memahami data sangat penting untuk preprocessing September
Lebih terperinciSeminar Nasional Matematika dan Aplikasinya, 21 Oktober 2017 Surabaya, Universitas Airlangga. Evy Dwi Cahyati 1), Dyah Herawatie 2), Eto Wuryanto 3)
Seminar Nasinal Matematika dan Aplikasinya, 21 Oktber 2017 IMPLEMENTASI K-MEANS CLUSTERING UNTUK PEMETAAN DESA DAN KELURAHAN DI KABUPATEN BANGKALAN BERDASARKAN CONTRACEPTIVE PREVALENCE RATE DAN TINGKAT
Lebih terperinciDATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi
DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 3 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2015 Definisi Set Data Set Data / Data Set / Himpunan Data Kumpulan
Lebih terperinciTask III : Data Transformation (Transformasi Data) Beberapa Pendekatan Transformasi Data. Smoothing. Normalization (#2) Normalization (#1)
Knowledge Discovery in Databases (IS704) dan Data Mining (CS704) Kuliah #4: Data Preprocessing (Bagian 2) Task III : Data Transformation (Transformasi Data) Mengubah / mentransformasikan data ke dalam
Lebih terperinci2. Data & Proses Datamining
2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)
Lebih terperinciMODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH. NOVIANDI, M.Kom NIDN
MODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH NOVIANDI, M.Kom NIDN. 0318018202 PROGRAM STUDI MANAJEMEN INFORMASI KESEHATAN FAKULTAS ILMU-ILMU KESEHATAN UNIVERSITAS ESA UNGGUL 2018 0 BAB
Lebih terperinciDATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi
DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 4 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2015 Pre-Processing Agregasi (aggregation) Penarikan contoh (sampling)
Lebih terperinciMateri 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya
Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami definisi set data, tipe data, kualitas
Lebih terperinciMateri 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya
Materi 4 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami pemrosesan awal data yang akan diproses
Lebih terperinciTAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas
TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma
Lebih terperinciMODUL 2 DATA DAN EKSPLORASI DATA
MODUL 2 DATA DAN EKSPLORASI DATA 2.1. Tujuan Mahasiswa dapat memahami dan menjelaskan tentang jenis data dan cara mengeksplorasi data 2.2. Teori Singkat Data dan Eksplorasi Data 2.2.1 Data Objek dan Tipe
Lebih terperinciPE DAHULUA. Latar Belakang
Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di
Lebih terperinciPenghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori
Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan
Lebih terperinciBAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.
BAB 3 METODE PENELITIAN 3.1 Metode Pengumpulan Data 3.1.1 Sumber Data Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder. 1. Data primer Didapatkan peneliti secara langsung
Lebih terperinciREVIEW BIOSTATISTIK DESKRIPTIF
REVIEW BIOSTATISTIK DESKRIPTIF POKOK BAHASAN 1. Konsep statistik deskriptif 2. Data dan variabel 3. Nilai Tengah (Ukuran Pusat), posisi dan variasi) pada data tunggal dan kelompok 4. Penyajian data 5.
Lebih terperinciAri Kurniawan
KLASTERISASI KOMPETENSI GURU MENGGUNAKAN HASIL PENILAIAN PORTOFOLIO DENGAN METODE K-MEANS CLUSTERING Ari Kurniawan 2208206015 Dosen Pembimbing : Mochamad Hariadi, S.T., M.Sc., Ph.D. S2 TEKNIK ELEKTRO (TELEMATIKA)
Lebih terperincipenyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN
1 PENDAHULUAN Latar Belakang Kemiskinan merupakan suatu hal yang memiliki batasan yang luas, tetapi bagaimanapun juga batasan mengenai kemiskinan harus tetap diukur untuk kebijakan pemerintah. Menurut
Lebih terperinciTIPS dan TRIK VISUAL BINNING
TIPS dan TRIK VISUAL BINNING Fasilitas visual Binning adalah pengembangan dari fasilitas categrize variables yang telah ada pada SPSS mulai versi 11.5. Pada dasarnya fasilitas ini akan mengubah bilangan
Lebih terperinciSTK 211 Metode statistika. Agus Mohamad Soleh
STK 211 Metode statistika Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami Apa yang disajikan dan diringkas? --> PEUBAH Univariate vs Bivariate vs Multivariate
Lebih terperinciBAB III METODOLOGI PENELITIAN. Dataset
BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar
Lebih terperinciData Mining Outline BAB I Pendahuluan. Proses Data Mining. Recap
Data Mining Outline BAB I Pendahuluan BAB II Data BAB III Algoritma Klasifikasi BAB IV Algoritma Klastering BAB V Algoritma Asosiasi BAB VI Algoritma Estimasi BAB VII Deteksi Anomali Ricky Maulana Fajri
Lebih terperinciSTATISTIKA DESKRIPTIF. Wenny Maulina, S.Si., M.Si
STATISTIKA DESKRIPTIF Wenny Maulina, S.Si., M.Si Ukuran Pemusatan Ukuran pemusatan ukuran ringkas yang menggambarkan karakteristik umum data tersebut. Modus (Mode): Nilai pengamatan yang paling sering
Lebih terperinciStatistika Deskriptif
Statistika Deskriptif Materi 2 - STK511 AnalisisStatistika September 26, 2017 Sep, 2017 1 Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami Apa yang disajikan
Lebih terperincipermintaan. Sedangkan untuk faktor - faktor lain dianggap tetap (tidak diteliti). Penelitian
BAB III METODOLOGI PENELITIAN 3.1 Materi Penelitian Pada penelitian ini akan membahas bagaimana menentukan atau memperkirakan vlume prduksi berdasarkan variabel bahan baku, jam kerja, biaya prduksi dan
Lebih terperinciBAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur
Lebih terperinciBAB II TINJAUAN PUSTAKA. mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa,
BAB II TINJAUAN PUSTAKA 2.1 Terdahulu Dalam penelitian ini, peneliti juga menyertakan beberapa uraian singkat mengenai penelitian terdahulu, tentang prediksi lama masa studi mahasiswa, klasifikasi, metode
Lebih terperinciPengenalan Pola. K-Means Clustering
Pengenalan Pola K-Means Clustering PTIIK - 2014 Course Contents 1 Definisi k-means 2 Algoritma k-means 3 Studi Kasus 4 Latihan dan Diskusi K-Means Clustering K-Means merupakan salah satu metode pengelompokan
Lebih terperinciSTATISTIKA INDUSTRI I. Agustina Eunike, ST., MT., MBA.
STATISTIKA INDUSTRI I Agustina Eunike, ST., MT., MBA. PERTEMUAN-1 DATA Data Hasil pengamatan pada suatu populasi Untuk mendapatkan informasi yang akurat Pengumpulan data Pengolahan data Penyajian data
Lebih terperinciANALISIS CLUSTER PADA DOKUMEN TEKS
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami
Lebih terperinciK-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia
K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id
Lebih terperinci2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database
2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma
Lebih terperinciKonsep dan Teknik Data Mining
Konsep dan Teknik Data Mining Data Preprocessing Mengapa data di di proses awal? Pembersihan data Integrasi dan transformasi data Reduksi data Diskritisasi dan pembuatan konsep hierarki Mengapa Data Diproses
Lebih terperinciClustering. Virginia Postrel
8 Clustering Most of us cluster somewhere in the middle of most statistical distributions. But there are lots of bell curves, and pretty much everyone is on a tail of at least one of them. We may collect
Lebih terperinciStatistika Farmasi
Bab 1:,, Statistika FMIPA Universitas Islam Indonesia Data Populasi dan Sampel Menurut Websters New World Dictionary, data berarti sesuatu yang diketahui atau dianggap. Dengan demikian, data dapat memberikan
Lebih terperinciDATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi
DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 4 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Similaritas dan Dissimilaritas Kemiripan (similarity) adalah
Lebih terperinci3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik
DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...
Lebih terperinciTipe Clustering. Partitional Clustering. Hirerarchical Clustering
Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan
Lebih terperinciKlasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor
Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,
Lebih terperinciMengolah dan Menganalisis Data
Mengolah dan Menganalisis Data Dr. Eko Pujiyanto, S.Si., M.T. Materi Data Mengolah dan analisis data Memilih alat analisis yang tepat Data Data 1 Jamak dari DATUM artinya informasi yang diperoleh dari
Lebih terperinciBAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran
BAB 2 TINJAUAN PUSTAKA 2.1 Tinjauan Pustaka Beberapa penelitian terdahulu telah banyak yang menerapkan data mining, yang bertujuan dalam menyelesaikan beberapa permasalahan seputar dunia pendidikan. Khususnya
Lebih terperinciK-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN
1 K-PROTOTYPE UNTUK PENGELOMPOKAN DATA CAMPURAN Rani Nooraeni*, Dr. Jadi Supriadi, DEA, Zulhanif, S.Si,M.Sc Jurusan statistika terapan, Fakultas MIPA UNPAD rnooraeni@gmail.com* Abstrak.Membagi suatu data
Lebih terperinciJurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 1, Januari 2018, hlm. 184-189 http://j-ptiik.ub.ac.id Klasifikasi Standar Produk Baja PT. Krakatau Steel (Persero)
Lebih terperinciHASIL DAN PEMBAHASAN. Data
Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode
Lebih terperinciBAB I PENDAHULUAN 1.1. Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini adalah era dimana perkembangan teknologi semakin pesat dan cepat. Seiring dengan perkembangan teknologi yang ada, maka ukuran data yang diolah juga akan semakin
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI
BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI penelitian. Pada bab ini akan dibahas literatur dan landasan teori yang relevan dengan 2.1 Tinjauan Pustaka Kombinasi metode telah dilakukan oleh beberapa peneliti
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena
Lebih terperinciSTK511 Analisis Statistika. Bagus Sartono
STK511 Analisis Statistika Bagus Sartono Pokok Bahasan Pengenalan analisis dan deskripsi data Sebaran peluang peubah acak. Sebaran penarikan contoh Pendugaan parameter Pengujian hipotesis (t-test, one-way
Lebih terperinciMateri 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya
Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami set data yang digunakan pada proses
Lebih terperinciData Mining II Estimasi
Data Mining II Estimasi Matakuliah Data warehouse Universitas Darma Persada Oleh: Adam AB Data Mining-2012-a@b 1 Tahapan proses datamining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/
Lebih terperinciPENGUKURAN DESKRIPTIF
PENGUKURAN DESKRIPTIF STATISTIK INDUSTRI I Jurusan Teknik Industri Universitas Brawijaya Malang 1 PENGUKURAN DESKRIPTIF Suatu pengukuran yang bertujuan untuk memberikan gambaran tentang data yang diperoleh
Lebih terperinciMODEL DATA MINING CAPAIAN PEMBELAJARAN. N. Tri Suswanto Saptadi. Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 12/4/2015
1 MODEL DATA MINING N. Tri Suswanto Saptadi CAPAIAN PEMBELAJARAN Definisi Kategori Model Naïve Bayesian k-nearest Neighbor Clustering 1 3 Definisi Mining : proses atau usaha untuk mendapatkan sedikit barang
Lebih terperinciBAB 3 METODE PENELITIAN
BAB 3 METODE PENELITIAN Pada proses penelitian ini dilakukan beberapa tahapan mulai dari tahap awal yaitu tahap inisiasi, pengembangan model, dan tahap terakhir pengembangan prototipe. Dalam tahapan inisiasi
Lebih terperinciKLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE
KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE Warih Maharani Fakultas
Lebih terperinciIMPUTASI MISSING DATA MENGGUNAKAN METODE K-NEAREST NEIGHBOUR DENGAN OPTIMASI ALGORITMA GENETIKA. Abidatul Izzah 1) Nur Hayatin 2) 1)
1 IMPUTASI MISSING DATA MENGGUNAKAN METODE K-NEAREST NEIGHBOUR DENGAN OPTIMASI ALGORITMA GENETIKA Abidatul Izzah 1) Nur Hayatin 2) 1) Teknik Informatika ITS Surabaya Jl. Teknik Kimia Kampus Teknik Informatika
Lebih terperinciMA2082 BIOSTATISTIKA Orang Biologi Tidak Anti Statistika
Catatan Kuliah MA2082 BIOSTATISTIKA Orang Biologi Tidak Anti Statistika disusun oleh Khreshna I.A. Syuhada, MSc. PhD. Kelompok Keilmuan STATISTIKA - FMIPA Institut Teknologi Bandung 2011 Tentang MA2082
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : Tabel 2.1 Penelitian sebelumnya Parameter Penulis Objek Metode Hasil
Lebih terperinciSTK 211 Metode statistika. Materi 2 Statistika Deskriptif
STK 211 Metode statistika Materi 2 Statistika Deskriptif 1 Statistika Deskriptif Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami Penyajian data dapat dilakukan
Lebih terperinciSkala pengukuran dan Ukuran Pemusatan. Ukuran Pemusatan
Skala Pengukuran Nominal (dapat dikelompokkan, tidak punya urutan) Ordinal (dapat dikelompokkan, dapat diurutkan, jarak antar nilai tidak tetap sehingga tidak dapat dijumlahkan) Interval (dapat dikelompokkan,
Lebih terperinciPENGUKURAN DATA. 1. Terminology Populasi & Sampel. Peubah/Variabel. Peubah/Variabel
PENGUKURAN DATA 1. Terminology Populasi & Sampel Populasi: himpunan komplit dari individual, obyek atau nilai dari suatu pengamatan Seringkali terlalu besar untuk dikaji secara keseluruhan Mungkin nyata
Lebih terperinciTIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R
Modul Praktikum Data Mining 2016 PERTEMUAN 3 TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R TUJUAN PRAKTIKUM Mahasiswa akan dapat memahami Tipe data, Eksplorasi Data, Statistika ringkasan, Visualisasi
Lebih terperinciIMPLEMENTASI ALGORITMA K-MEANS DALAM PENGKLASTERAN MAHASISWA PELAMAR BEASISWA
IMPLEMENTASI ALGORITMA K-MEANS DALAM PENGKLASTERAN MAHASISWA PELAMAR BEASISWA Nurul Rohmawati W 1), Sofi Defiyanti 2), Mohamad Jajuli 3) 1),2),3) Teknik Informatika Fakultas Ilmu Komputer Universitas Singaperbangsa
Lebih terperinciSATUAN ACARA PERKULIAHAN
Topik Bahasan : Membahas Silabus Perkuliahan Tujuan Umum : Mahasiswa Mengetahui Komponen Yang Perlu Dipersiapkan Dalam Matakuliah Ini satu kali Tujuan 1 Menjelaskan tentang Mengakomodasi berbagai masukan
Lebih terperinciBAB III METODOLOGI PENELITIAN
BAB III METODOLOGI PENELITIAN 3.1 Instrumen Penelitian Instrumen penelitian ini diperlukan agar penelitian dapat berjalan dengan lancar dan baik. Instrumen tersebut terdiri dari perangkat keras dan perangkat
Lebih terperinciMoch. Ali Machmudi 1) 1) Stmik Bina Patria
UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 aliadhinata@gmail.com 1) Abstrak Tujuan utama
Lebih terperinciDistribusi Normal, Skewness dan Qurtosis
Distribusi Normal, Skewness dan Qurtosis Departemen Biostatistika FKM UI 1 2 SAP Statistika 1, minggu ke-4 4 Membekali mahasiswa agar lebih paham dan menguasai teori terkait: menghitung ukuran penyimpangan
Lebih terperinciMemulai SPSS dan Mengelola File
MODUL 1 Memulai SPSS dan Mengelola File A. MEMULAI SPSS Untuk memulai SPSS for Windows langkah yang harus dilakukan adalah: Klik menu Start Programs SPSS for Windows SPSS for Windows. Kemudian akan ditampilkan
Lebih terperinciIMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING
IMPLEMENTASI DETEKSI OUTLIER PADA ALGORITMA HIERARCHICAL CLUSTERING Yoga Bhagawad Gita 1, Ahmad Saikhu 2 1,2 Jurusan Teknik Informatika, Fakultas Teknologi Informasi Institut Teknologi Sepuluh Nopember
Lebih terperinciMA2081 Statistika Dasar
Catatan Kuliah MA2081 Statistika Dasar Orang Cerdas Belajar Statistika Dosen: Khreshna I.A. Syuhada, MSc. PhD. Kelompok Keilmuan Statistika - FMIPA Institut Teknologi Bandung 2015 1 Tentang MAK6281 Topik
Lebih terperinciContoh: Pada data Tabel satu diperoleh range pada masing masing mata kuliah. adalah: Matakuliah Max min range A B C
POKOK BAHASAN : Ukuran Penyebaran SUB POKOK BAHASAN : a. Range, b. RAK, c. SD, d. Varians, TIK : Mahasiswa dapat : a. Menjelaskan analisa deskriptif dengan ukuran penyebaran b. mampu melakukan analisa
Lebih terperinciPRESENTASI TUGAS AKHIR KI091391
PRESENTASI TUGAS AKHIR KI091391 IMPLEMENTASI KD-TREE K-MEANS CLUSTERING PADA KLASTERISASI DOKUMEN (Kata kunci: KD-Tree K-Means Clustering, Klasterisasi Dokumen, K- Dimensional Tree, K-Means Clustering)
Lebih terperinciBAB III LANDASAN TEORI
BAB III LANDASAN TEORI 3.1 Data, Informasi, Pengetahuan Data adalah bilangan, terkait dengan angka angka atau atribut atribut yang bersifat kuantitas, yang berasal dari hasil observasi, eksperimen, atau
Lebih terperinci1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian
Penerapan Data Mining dengan Menggunakan Metode Clustering K-Mean Untuk Mengukur Tingkat Ketepatan Kelulusan Mahasiswa Program Teknik Informatika S1 Fakultas Ilmu Komputer Universitas Dian Nuswantoro Semarang
Lebih terperinciKLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER
Powered by TCPDF (www.tcpdf.org) Tugas Akhir - 2005 KLASIFIKASI PADA DATA MINING MENGGUNAKAN NAIVE BAYESIAN CLASSIFIER CLASSIFICATION FOR DATA MINING USING NAIVE BAYESIAN CLASSIFIER Agustina Ratna Puspitasari¹,
Lebih terperinciMA5182 Topik dalam Statistika I: Statistika Spasial. Utriweni Mukhaiyar
Review 1: Statistika Deskriptif MA5182 Topik dalam Statistika I: Statistika Spasial 28 Agustus 2012 28 Agustus 2012 Utriweni Mukhaiyar Ilustrasi Berikut adalah data rata-rata curah hujan bulanan yang diamati
Lebih terperinciPertemuan III Statistika Dasar (Basic Statistics)
Pertemuan III Statistika Dasar (Basic Statistics) Jika punya data mengenai daya hidup dari baterai HP merk XXX Dimana lokasi atau pusat dari data? ukuran pemusatan Seberapa besar variasi dari data ukuran
Lebih terperinciKLASIFIKASI PADA TEXT MINING
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa
Lebih terperinciStatistik dan Statistika Populasi dan Sampel Jenis-jenis Observasi Statistika Deskriptif
1. 2 2. 3. 4. Statistik dan Statistika Populasi dan Sampel Jenis-jenis Observasi Statistika Deskriptif Sari Numerik Penyajian Data 2008 by USP & UM ; last edited Jan 11 MA 2081 Statistika Dasar 24 Januari
Lebih terperinciARTIKEL PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL
ARTIKEL PENERAPAN METODE K-MEANS DALAM PROSES CLUSTERING PENILAIAN PRESTASI KERJA PEGAWAI NEGERI SIPIL Oleh: IRFAN DWI NURCAHYO BUDIARTO 13.1.03.02.0117 Dibimbing oleh : 1. Hermin Istiasih, ST.,M.M.,M.T.
Lebih terperinciDAN ANALISIS DATA. Sari Numerik. MA 2181 Analisis Data 8 Agustus 2011 Utriweni Mukhaiyar. 1. Statistik dan Statistika. 2. Populasi dan Sampel
PENGANTAR STATISIK DAN ANALISIS DATA 1. Statistik dan Statistika 2. Populasi dan Sampel 3. Jenis-jenis Observasi 4. STATISTIKA DESKRIPTIF Sari Numerik Penyajian Data MA 2181 Analisis Data 8 Agustus 2011
Lebih terperinciStatistik Deskriptif. Statistik Farmasi 2015
Statistik Deskriptif Tujuan perkuliahan Setelah mengikuti perkuliahan, diharapkan mahasiswa mampu: 1. Meringkas data, dengan menggunakan pengukuran tendensi sentral seperti rata-rata, median, modus dan
Lebih terperinciTentang MA5283 Statistika BAB 1 STATISTIKA DESKRIPTIF MA5283 STATISTIKA. Dosen: Khreshna I.A. Syuhada, MSc. PhD. Orang Cerdas Belajar Statistika
Orang Cerdas Belajar Statistika Bentuk perkuliahan Jadwal Kuliah Buku teks Penilaian Matriks kegiatan perkuliahan Jadwal Kuliah 1 Tatap muka di kelas 2 Praktikum di Lab. Statistika dan Komputasi Bentuk
Lebih terperinciSTATISTIKA DESKRIPTIF
STATISTIKA DESKRIPTIF 1 Statistika deskriptif berkaitan dengan penerapan metode statistika untuk mengumpulkan, mengolah, menyajikan dan menganalisis data kuantitatif secara deskriptif. Statistika inferensia
Lebih terperinciData Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining
Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering
Lebih terperinciBAB II TINJAUAN PUSTAKA
BAB II TINJAUAN PUSTAKA A. Tinjauan Pustaka Pada penelitian yang dilakukan oleh (Chen, Sain, & Guo, 2012) berfokus untuk mengetahui pola penjualan, pelanggan mana yang paling berharga, pelanggan mana yang
Lebih terperinciSPSS FOR WINDOWS BASIC. By : Syafrizal
SPSS FOR WINDOWS BASIC By : Syafrizal SPSS merupakan software statistik yang paling populer, fasilitasnya sangat lengkap dibandingkan dengan software lainnya, penggunaannya pun cukup mudah Langkah pertama
Lebih terperinciBAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Perguruan tinggi merupakan strata terakhir sebelum mahasiswa dapat bersaing didalam dunia kerja. Agar mampu bersaing didalam dunia kerja, mahasiswa dituntut
Lebih terperinciSAMPLING METHODS Metode Penarikan Contoh STK221 3(2-2)
SAMPLING METHODS Metode Penarikan Contoh STK221 3(2-2) Pustaka Scheaffer RL, Mendenhall W, Ott RL. 2006. Elementary Survey Sampling, 6th ed. Belmont: Duxbury Press. Levy PS, Lemeshow S. 1999. Sampling
Lebih terperinciBAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di
BAB II TINJAUAN PUSTAKA DAN DASAR TEORI 2.1. Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di lakukan oleh Muhammad Toha dkk (2013), Sylvia Pretty Tulus (2014), Johan
Lebih terperinciBAB 1 PENDAHULUAN 1.1. Latar Belakang
BAB 1 PENDAHULUAN 1.1. Latar Belakang Analisis cluster merupakan salah satu alat yang penting dalam pengolahan data statistik untuk melakukan analisis data. Analisis cluster merupakan seperangkat metodologi
Lebih terperinciPerbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik
Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: imam.ity@bsi.ac.id Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting
Lebih terperinciDISPERSI DATA. - Jangkauan (Range) - Simpangan/deviasi Rata-rata (Mean Deviation) - Variansi (Variance) - Standar Deviasi (Standart Deviation)
DISPERSI DISPERSI DATA Ukuran penyebaran suatu kelompok data terhadap pusat data. - Jangkauan (Range) - Simpangan/deviasi Rata-rata (Mean Deviation) - Variansi (Variance) - Standar Deviasi (Standart Deviation)
Lebih terperinciIMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA
IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id
Lebih terperinciAbidah Elcholiqi, Beta Noranita, Indra Waspada
Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah
Lebih terperinciPERTEMUAN 14 DATA WAREHOUSE
PERTEMUAN 14 DATA WAREHOUSE Data Warehouse Definisi : Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1. Pendahuluan Didalam bab ini menceritakan semua teori-teori yang digunakan didalam proses algoritma decision tree, algoritma Random tree dan Random Florest serta teoriteori dan
Lebih terperinciBAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah
BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah Deposito merupakan salah satu tabungan berjangkaayangamodel pengambilannya berdasarkan pada kesepakatan dari pihak bank dengan nasabah deposito [1].Suku bunga
Lebih terperinciAplikasi Data Mining untuk Mengukur Tingkat Kelulusan Mahasiswa dengan Metode Apriori
Aplikasi Data Mining untuk Mengukur Tingkat Kelulusan Mahasiswa dengan Metode Apriori dan k-mean Clustering (Studi Kasus: Jurusan Teknik Informatika Universitas Trunojoyo Madura) Mohammad Syarief Prodi
Lebih terperinciAlgoritma Dasar. 4.1 Naive Bayes
4 Algoritma Dasar It is a capital mistake to theorize before one has data. Arthur Conan Doyle Sebelum masuk ke algoritma machine learning yang cukup modern/ matematis, kami akan memberi contoh algoritma
Lebih terperinci