MODUL 2 DATA DAN EKSPLORASI DATA

Ukuran: px
Mulai penontonan dengan halaman:

Download "MODUL 2 DATA DAN EKSPLORASI DATA"

Transkripsi

1 MODUL 2 DATA DAN EKSPLORASI DATA 2.1. Tujuan Mahasiswa dapat memahami dan menjelaskan tentang jenis data dan cara mengeksplorasi data 2.2. Teori Singkat Data dan Eksplorasi Data Data Objek dan Tipe Atribut Dataset adalah kumpulan dari data objek dan atributnya. Data objek akan merepresentasikan entitas dari suatu basisdata. Misalnya dalam basisdata penjualan, objeknya adalah pelanggan, item jual, dan penjualan. Sedangkan atribut adalah data field atau properti atau karakteristik dari suatu objek. Contohnya adalah warna mata seseorang, temperatur dan sebagainya. Atribut dikenal juga sebagai variabel, field, karakteristik, atau fitur. Objek juga dikenal dengan record, point, case, sampel, entitas, atau instance. Gambar 1. Atribut dan Objek Nilai atribut adalah bilangan atau simbol pada atribut tersebut. Nilai setiap atribut yang satu dengan yang lain berbeda-beda. Bisa saja satu atribut yang memiliki sama nilai yang Team Pengampuh MK Data Mining 10

2 berbeda. Misalnya tinggi bisa diukur dengan feet (kaki) atau meter. Bisa juga dalam atribut yang berbeda diukur dengan nilai yang sama. Misalnya nilai atribut untuk ID dan umur adalah integer, tapi properti dari nilai atribut bisa berbeda. ID tidak mempunyai limit tapi umur mempunyai nilai maksimum dan nilai minimum (batasan umur). Berikut adalah tabel tipe tipe atribut yang berbeda Data tidak hanya terkelompokan pada data kualitatif dan kuantitatif (NOIR Nominal, Ordinal, Interval, Ratio) secara mutually exclusive (berganti). Pada pembahasan tentang machine learning, atribut dibagi atas dua bagian, yaitu diskrit dan kontinu. Setiap tipe data diproses secara berbeda. Berikut adalah perbedaan atribut diskrit dan atribut kontinu. Atribut Diskrit Nilainya bersifat finite (terbatas) atau infinite (tidak terbatas). Maksudnya adalah boleh ya dan boleh tidak direpresentasikan dalam bilangan integer. Contohnya : kode pos, jumlah, kumpulan kata dalam dokumen, warna rambut, dan sebagainya Biasanya direpresentasikan dalam variabel integer bernilai bulat Atribut binary (Boolean) adalah kasus khusus pada atribut diskrit Team Pengampuh MK Data Mining 11

3 Atribut Kontinu Nilai atribut berupa bilangan real (bilangan dalam bentuk desimal meliputi bilangan rasional dan irasional) Contohnya adalah temperatur, tinggi, dan berat Pada prakteknya, bilangan real bisa juga diukur dan direpresentasikan dengan nilai finite Atribut kontinu sering menggunakan variabel floating point (bilangan titik mengambang) Data berdasarkan tipenya, terbagi atas : a. Record Terdiri dari bermacam record yang terdiri dari beberapa atribut. Misalnya berbentuk data matriks atau data dokumen Gambar 2. Contoh data record Data transaksi Merupakan contoh khusus dari data record, dimana : - Setiap record (transaksi) terdiri dari beberapa item Team Pengampuh MK Data Mining 12

4 - Misalnya : pembelanjaan pada supermarket oleh konsumen, dimana seorang konsumen membeli beberapa produk dalam satu kali transaksi Gambar 3. Contoh data transaksi b. Graph - World wide web (WWW) - Struktur molekular c. Ordered - Data spasial - Data temporal Data temporal adalah data yang terukur dari waktu ke waktu (time series). Contoh nya adalah data finansisal yang memberikan informasi harga saham dari waktu ke waktu atau data curah hujan yang diambil secara periodik. Gambar 4. Contoh data temporal Team Pengampuh MK Data Mining 13

5 - Data sekuensial Misalnya data sekuens transaksi; data terdiri dari set transaksi dan item, dengan atribut waktu dan ID konsumen saling berkaitan dalam suatu transaksi. - Data sekuens genetik Gambar 5. Data sekuens transaksi Kualitas Data Dalam suatu basis data, seringkali data tidak lengkap dan tidak konsisten. Data tersebut akan susah untuk dianalisis, karena itu diperlukan suatu praproses data (dibahas pada Modul 3). Contoh masalah dalam penentuan data yang berkualitas adalah noise dan outliers, missing value, dan duplikasi data. - Noise Noise merujuk pada modifikasi dari nilai atau bobot original dari data. Jadi noise merupakan random error atau varian dari hasil pengukuran variabel (yang merupakan hasil pengukuran dari statistik deskripsi lihat sub bagian selanjutnya). Contohnya adalah distorsi pada saat telepon atau muncul snow pada layar televisi. Team Pengampuh MK Data Mining 14

6 Gambar 6. Contoh noise pada gelombang sinus pada siaran televisi - Outliers Outliers adalah data objek yang memiliki karakteristik yang berbeda dari data objek yang terdapat pada dataset. Gambar 7 Contoh outliers - Missing value Beberapa alasan kenapa terjadinya missing value adalah sebagai berikut : Informasi tidak terkumpul (misalnya ketika diadakan pengumpulan data, ada yang tidak ingin memberikan informasi berapa umur dan berat badan) Atribut yang digunakan tidak bisa digunakan untuk semua kasus (misalnya besarnya penghasilan tidak bisa digunakan pada anak-anak) Cara menangani missing value ada beberapa cara; misalnya : Eliminasi atau menghapus data objek Team Pengampuh MK Data Mining 15

7 Mengestimasi missing value bisa digunakan interpolasi (estimasi) pada sisa nilai yang ada Tidak memperdulikan missing value ketika menganalis data - Duplikasi data Dataset sering terdiri dari beberapa data objek yang terduplikasi. Misalnya ketika menggabungkan beberapa sumber yang bersifat heterogen satu orang bisa memiliki lebih dari satu nomer handphone atau alamat . Hal tersebut bisa dihindari dengan cara menerapkan data cleaning atau pembersihan data (dipelajari pada Modul 3) Statistik dalam Pendeskripsian Data Statistik digunakan dalam meringkas propertis atau parameter dari data. Yang termasuk dalam properties adalah frekuensi data, lokasi data dan penyebaran data. Contohnya adalah lokasi digunakan mean, dan penyebaran digunakan standar deviasi. - Frekuensi dan mode Frekuensi dalam suatu atribut adalah persentase dari berapa banyaknya suatu nilai yang muncul pada dataset. Misalnya untuk atribut jenis kelamin pada suatu populasi, jenis kelamin perempuan muncul sebanyak 50% pada satu kali pengukuran data. Sedangkan mode adalah frekuensi yang paling sering muncul pada suatu nilai atribut. Karena itu mode dapat menentukan kualitatif dan kuantitatif dari suatu atribut. Dataset yang terdiri dari satu, dua atau tiga mode disebut sebagai unimodal, bimodal, dan trimodal. Jika disingkat, lebih dari dua mode disebut sebagai multimodal. Frekuensi dan mode sering digunakan pada data kategorial. - Mengukur lokasi : mean dan median Team Pengampuh MK Data Mining 16

8 Mean adalah pengukuran yang sering digunakan untuk mengukur lokasi dari titik tengah dari suatu data set. = 1 = (1) Dengan x1, x2,... xm adalah banyaknya nilai dari data set m. Contoh 2.1. Dalam suatu dataset penghasilan (dalam ribuan rupiah) terdapat peningkatan angka : 30, 36, 47, 50, 52, 52, 56, 60, 63, 70, 70, 110. Jika digunakan persamaan (1) maka : = = =58 Maka mean dari penghasilan adalah Meskipun demikian, mean sangat sensitif untuk terjadinya outliers. Karena itu median digunakan untuk mengatasinya. = Contoh 2.2 Jika menggunakan contoh 2.1 maka nilai mediannya dari 12 set data objek dengan nilai tengahnya adalah 52 dan 56, maka data hanya 11, maka nilai tengah atau median adalah Mengukur penyebaran : range dan varian = =54. Jika Range adalah perbedaan antara nilai maksimum dan minimum. Sedangkan varian atau standar deviasi adalah pengukuran yang sering digunakan untuk menghitung penyebaran data dalam dataset. If m is odd, i.e., m = 2r +1 If m is even, i.e., m = 2r (2) Team Pengampuh MK Data Mining 17

9 = = 1 1 = Walaupun begitu, sangat sensitif terhadap outlier. Karena itu digunakan pengukuran yang sering digunakan untuk mencegah outlier Visualisasi Visualisasi adalah konversi data ke bentuk visual atau bentuk tabular, sehingga karakteristik dari data dan relasi antara item data atau atribut bisa dianalisis. Visualisasi merupakan teknik yang paling powerful untuk diaplikasikan untuk eksplorasi data (misalnya untuk mendeteksi pola general dan tren, outlier dan pattern atau pola yang tidak biasa). Contoh visualisasi adalah temperatur permukaan laut pada Juli 1982, dimana sepuluh ribu titik data digambarkan dalam satu gambar. Gambar 8 Suhu permukaan air laut Team Pengampuh MK Data Mining 18

10 Cara merepresentasi hasil visualisasi digunakan format visual. Data objek, atribut, dan relasi antara data objek diterjemahkan dalam bentuk grafik seperti titik, garis, bentuk dan warna. Contohnya : - Objek selalu direpresentasikan dengan titik - Tiap atribut direpresentasikan sebagai karakteristik dari titik data, contohnya adalah warna, ukuran, dan bentuk - Jika posisi titik sudah ditempati oleh titik yang lain, maka titik yang berada pada kelompok yang sama tersebut akan mudah dikenali sebagai outlier. Susunan atau arrangement adalah penempatan visual dengan model tampilan data. Hal tersebut bisa membuat perbedaan yang sangat jauh untuk memahami data yang akan diolah. Gambar 9. Contoh susunan data dalam matriks Teknik teknik dalam visualisasi data - Histogram Merupakan pengukuran yang sering digunakan. Histos berarti tiang dan gram berarti chart atau grafik, jadi histogram adalah grafik yang berbentuk batang. Histogram akan membagi nilai dalam beberapa bagian dan membentuk plot batang (bar plot) pada setiap objek di setiap bagian. Tinggi dari tiap batang menunjukkan banyaknya objek, sedangkan bentuk dari histogram mengikuti berapa banyaknya data tersebut terbagi (number of bins). Contohnya pada data lebar petal, terdapat 10 dan 20 bagian (bins) yang berbeda. Team Pengampuh MK Data Mining 19

11 Gambar 10. Lebar petal untuk 10 bins dan 20 bins Histogram juga digambarkan dalam bentuk dua dimensi untuk dua atribut yang berbeda. Misalnya adalah lebar petal dan panjang petal. Gambar 11. Histogram dua dimensi - Box plots Boxplot diperkenalkan oleh J. Tukey, merupakan cara yang populer untuk visualisasi distribusi atau penyebaran data. Cara visualisasi dari boxplot mengikuti bentuk five-number summary yang terdiri dari median (Quartile 2 Q2), quartile Q1 dan Q, minimum, dan maksimum (urutannya menjadi Minimum, Q1, Median, Q3, Maximum). Box plot sering digunakan untuk membandingkan data yang kompatibel. Penggambaran umum boxplot digambarkan pada gambar 12 Team Pengampuh MK Data Mining 20

12 Gambar 12. Urutan bagian dari boxplot Gambar 13. Contoh penggambaran boxplot untuk data iris Team Pengampuh MK Data Mining 21

13 Gambar 14. Distribusi data pada suatu dataset - Scatter plots Merupakan penggambaran nilai atribut untuk posisi dari titik titik data. Biasanya digambarkan dalam bentuk dua dimensi, tapi bisa juga digambarkan dalam bentuk tiga dimensi. Penggambaran scatter plot untuk dua dimensi menggunakan koordinat Cartesian. Gambar 15. Visualisasi 2 D pada scatter plot Team Pengampuh MK Data Mining 22

14 Gambar 16. Visualisasi matriks scatter plot data iris Similarity dan Disimilarity Similarity atau kesamaan merupakan kesamaan antara data objek dalam kelompok data dan disimilarity merupakan ketidakmiripan (berdasarkan jarak) antara kelompok data. Biasanya digunakan dalam penggalian data, seperti pengelompokan (clustering), analisis outlier, klasifikasi tetangga terdekat (distance based). Contoh pengukurannya adalah sebagai berikut : Assymetric binary attributes : Jaccard coefficient Distance binary attributes : Euclidean, Manhattan, Minkowski, and supremum Menggunakan frekuensi kemunculan pada suatu data (term frequency vector) : Cosine similarity, atau Tanimoto coefficient Tugas Kumpulkan pada pertemuan 3 (Minggu depan) Tidak Menerima Keterlambatan dalam pengumpulan tugas Team Pengampuh MK Data Mining 23

15 1. Briefly in explain with example this following : Graph data Spatial or spatiotemporal data Genetic Sequence data Quantiles, Quartiles and Percentile Interquartile range (IQR) The five number summary 2. Suppose that the data for analysis includes the attribute age. The age valuesfor the data tuples are (in increasing order) 13,15, 16, 16, 19,20,21, 22, 22, 25, 25, 25, 25,, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70 Wahat is the mean of the data? What is the median? What is the range of the data? Can you find (roughly) the first quartile (Q1) and the third quartile (Q3) of the data? Show a boxplot or the data 3. Briefly outline how to compute the dissimilarity between object describes by the following Nominal attributes Asymmetric binary attributes Numeric attributes Term-frequency vectors Reference : 1. Han J., Kamber M., Pei J, Data Mining : Concepts dan Techniques, Amerika : Morgan Kaufmann Press, 2012 Team Pengampuh MK Data Mining 24

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 3. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 3 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2015 Definisi Set Data Set Data / Data Set / Himpunan Data Kumpulan

Lebih terperinci

Gambar berikut ini menunjukkan suhu permukaan laut pada bulan Juli tahun Sepuluh dari ribuan titik data diringkas dalam satu gambar

Gambar berikut ini menunjukkan suhu permukaan laut pada bulan Juli tahun Sepuluh dari ribuan titik data diringkas dalam satu gambar VISUALISASI Visualisasi adalah konversi data ke dalam format visual atau tabel sehingga karakteristik dari data dan relasi diantara item data atau atribut dapat di analisis atau dilaporkan Visualisasi

Lebih terperinci

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami definisi set data, tipe data, kualitas

Lebih terperinci

DATA PREPROCESSING. Budi Susanto (versi 1.2)

DATA PREPROCESSING. Budi Susanto (versi 1.2) DATA PREPROCESSING Budi Susanto (versi 1.2) Kenali Data Anda Atribut Data Memahami tipe atribut Membantu membetulkan data saat integrasi data Deskripsi Statistik Data Memudahkan untuk mengisi nilai yang

Lebih terperinci

TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R

TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R Modul Praktikum Data Mining 2016 PERTEMUAN 3 TIPE DATA DAN EKSPLORASI DATA MENGGUNAKAN WEKA DAN R TUJUAN PRAKTIKUM Mahasiswa akan dapat memahami Tipe data, Eksplorasi Data, Statistika ringkasan, Visualisasi

Lebih terperinci

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya

Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya Materi 3 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2016 Nizar Rabbi Radliya nizar.radliya@yahoo.com Nama Mahasiswa NIM Kelas Kompetensi Dasar Memahami set data yang digunakan pada proses

Lebih terperinci

Statistika Deskriptif

Statistika Deskriptif Statistika Deskriptif Materi 2 - STK511 AnalisisStatistika September 26, 2017 Sep, 2017 1 Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami Apa yang disajikan

Lebih terperinci

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining

Data Mining. Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. Avinanta Tarigan. 22 Nov Avinanta Tarigan Data Mining Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi Avinanta Tarigan 22 Nov 2008 1 Avinanta Tarigan Data Mining Outline 1 Pengertian Dasar 2 Classification Mining 3 Association Mining 4 Clustering

Lebih terperinci

STK 211 Metode statistika. Agus Mohamad Soleh

STK 211 Metode statistika. Agus Mohamad Soleh STK 211 Metode statistika Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami Apa yang disajikan dan diringkas? --> PEUBAH Univariate vs Bivariate vs Multivariate

Lebih terperinci

STK 211 Metode statistika. Materi 2 Statistika Deskriptif

STK 211 Metode statistika. Materi 2 Statistika Deskriptif STK 211 Metode statistika Materi 2 Statistika Deskriptif 1 Statistika Deskriptif Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami Penyajian data dapat dilakukan

Lebih terperinci

PE DAHULUA. Latar Belakang

PE DAHULUA. Latar Belakang Latar Belakang PE DAHULUA Pemilihan Kepala Daerah dan Wakil Kepala Daerah, atau seringkali disebut Pilkada, adalah pemilihan umum untuk memilih Kepala Daerah dan Wakil Kepala Daerah secara langsung di

Lebih terperinci

FORMAT LAPORAN MODUL V DISTRIBUSI SAMPLING

FORMAT LAPORAN MODUL V DISTRIBUSI SAMPLING FORMAT LAPORAN MODUL V DISTRIBUSI SAMPLING ABSTRAK ABSTRACT KATA PENGANTAR DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN BAB I PENDAHULUAN (kata pengantar) 1.1 Latar Belakang 1.2 Tujuan Penulisan

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI BAB 2 LANDASAN TEORI 2.1. Data Mining Data mining adalah bagian dari knowledge discovery di database yang menganalisa database berukuran besar untuk menemukan pola yang berguna pada data (Silberschatz,

Lebih terperinci

PENGUKURAN DATA. 1. Terminology Populasi & Sampel. Peubah/Variabel. Peubah/Variabel

PENGUKURAN DATA. 1. Terminology Populasi & Sampel. Peubah/Variabel. Peubah/Variabel PENGUKURAN DATA 1. Terminology Populasi & Sampel Populasi: himpunan komplit dari individual, obyek atau nilai dari suatu pengamatan Seringkali terlalu besar untuk dikaji secara keseluruhan Mungkin nyata

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep analisis clustering Memahami tipe-tipe data dalam clustering Memahami beberapa algoritma

Lebih terperinci

Data Preprocessing. oleh: Entin Martiana

Data Preprocessing. oleh: Entin Martiana Data Preprocessing oleh: Entin Martiana Data Data yang ada pada umumnya: Banyak noise Ukuran yang besar Dapat merupakan campuran dari berbagai sumber Memahami data sangat penting untuk preprocessing September

Lebih terperinci

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means,

Kata kunci: Cluster, Knowledge Discovery in Database, Algoritma K-Means, K- Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K-Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

Statistika Farmasi

Statistika Farmasi Bab 2: Penyajian Data dan Statistika FMIPA Universitas Islam Indonesia 1 2 Biasa Distribusi Frekuensi 3 Stem-and-Leaf Plot Histogram Scatter Plot Boxplot Penyajian Data Data diuraikan dalam bentuk kalimat.

Lebih terperinci

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING. Pertemuan 4. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi DATA MINING 3 SKS Semester 6 S1 Sistem Informasi Pertemuan 4 Nizar Rabbi Radliya nizar.radliya@yahoo.com Universitas Komputer Indonesia 2016 Similaritas dan Dissimilaritas Kemiripan (similarity) adalah

Lebih terperinci

STK511 Analisis Statistika. Pertemuan 2 Review Statistika Dasar

STK511 Analisis Statistika. Pertemuan 2 Review Statistika Dasar STK511 Analisis Statistika Pertemuan 2 Review Statistika Dasar Statistika Populasi Sampling Pendugaan Contoh Deskriptif Tingkat Keyakinan Statistika Deskriptif vs Statistika Inferensia Ilmu Peluang Parameter

Lebih terperinci

Metode Statistika (STK211) Statistika Deskriptif (1) Dr. Ir. Kusman Sadik Dept. Statistika IPB, 2015

Metode Statistika (STK211) Statistika Deskriptif (1) Dr. Ir. Kusman Sadik Dept. Statistika IPB, 2015 Metode Statistika (STK211) Statistika Deskriptif (1) Dr. Ir. Kusman Sadik Dept. Statistika IPB, 2015 1 2 3 4 5 Statistika Deskripsi dan Eksplorasi Merupakan teknik penyajian dan peringkasan data sehingga

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

2. Data & Proses Datamining

2. Data & Proses Datamining 2. Data & Proses Datamining Data 1. Input (Dataset) 2. Pengolahan Data Awal 3. Metode Learning Tahapan Utama Proses Data Mining Input (Data) Metode (Algoritma Data Mining) Output (Pola/Model/ Knowledge)

Lebih terperinci

dengan Algoritma K Means

dengan Algoritma K Means K Pembentukan cluster dalam Knowledge Discovery in Database dengan Algoritma K Means Oleh: Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY,email: andayani@uny.ac.id Abstrak Pembentukan cluster merupakan

Lebih terperinci

STATISTIK DESKRIPTIF

STATISTIK DESKRIPTIF BAB 5 STATISTIK DESKRIPTIF Salah satu statistik yang secara sadar maupun tidak, sering digunakan dalam berbagai bidang adalah statistik deskriptif. Pada bagian ini akan dipelajari beberapa contoh kasus

Lebih terperinci

KONSEP MANAJEMEN BASIS DATA Sistem Informasi Geografis

KONSEP MANAJEMEN BASIS DATA Sistem Informasi Geografis KONSEP MANAJEMEN BASIS DATA Sistem Informasi Geografis Company LOGO Sistem Informasi Geografis ibi Basis data spasial yaitu: sekumpulan entity baik yang memiliki lokasi atau posisi tetap maupun tidak tetap

Lebih terperinci

Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada.

Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. Azimmatul Ihwah Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. Ada cara yg lebih baik untuk menginterpretasi data yg

Lebih terperinci

Kursus Statistika Dasar. Bagian 1. Pengelompokan Statistika. Istilah-istilah Dasar. Jenis Data. Pengelompokan Statistika lainnya. Bambang Suryoatmono

Kursus Statistika Dasar. Bagian 1. Pengelompokan Statistika. Istilah-istilah Dasar. Jenis Data. Pengelompokan Statistika lainnya. Bambang Suryoatmono Kursus Statistika Dasar Bambang Suryoatmono Bagian 1 Statistika Deskriptif Pengelompokan Statistika Statistika Deskriptif: statistika yang menggunakan data pada suatu kelompok untuk menjelaskan atau menarik

Lebih terperinci

STATISTIKA DESKRIPTIF. Wenny Maulina, S.Si., M.Si

STATISTIKA DESKRIPTIF. Wenny Maulina, S.Si., M.Si STATISTIKA DESKRIPTIF Wenny Maulina, S.Si., M.Si Statistika Deskripsi Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. Teknik Penyajian Data Tabel Gambar

Lebih terperinci

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering

Tipe Clustering. Partitional Clustering. Hirerarchical Clustering Analisis Cluster Analisis Cluster Analisis cluster adalah pengorganisasian kumpulan pola ke dalam cluster (kelompok-kelompok) berdasar atas kesamaannya. Pola-pola dalam suatu cluster akan memiliki kesamaan

Lebih terperinci

STATISTIKA INDUSTRI I. Agustina Eunike, ST., MT., MBA.

STATISTIKA INDUSTRI I. Agustina Eunike, ST., MT., MBA. STATISTIKA INDUSTRI I Agustina Eunike, ST., MT., MBA. PERTEMUAN-1 DATA Data Hasil pengamatan pada suatu populasi Untuk mendapatkan informasi yang akurat Pengumpulan data Pengolahan data Penyajian data

Lebih terperinci

Distribusi Frekuensi dan Statistik Deskriptif Lainnya

Distribusi Frekuensi dan Statistik Deskriptif Lainnya BAB 2 Distribusi Frekuensi dan Statistik Deskriptif Lainnya Misalnya seorang penjaga gudang mencatat berapa sak gandum keluar dari gudang selama 15 hari kerja, maka diperoleh distribusi data seperti berikut.

Lebih terperinci

PERTEMUAN II STATISTIK DESKRIPTIF

PERTEMUAN II STATISTIK DESKRIPTIF PERTEMUAN II STATISTIK DESKRIPTIF DATA & VARIABEL Data adalah sekumpulan datum yang berisi fakta-fakta serta gambaran suatu fenomena yang dikumpulkan, dirangkum, dianalisis dan selanjutnya diinterpretasikan.

Lebih terperinci

STATISTIKA DASAR DAN APLIKASI

STATISTIKA DASAR DAN APLIKASI STATISTIKA DASAR DAN APLIKASI Jenis Statistika KULIAH PENERAPAN KOMPUTER MATERI MUATAN LOKAL MAYOR PSP 2010 Statistika Deskriptif: -Menggunakan metode numerik dan grafik untuk mencari pola suatu kumpulan

Lebih terperinci

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI 2.1 Tinjauan Pustaka Penelitian ini menggunakan beberapa sumber pustaka yang berhubungan dengan kasus yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup

Lebih terperinci

STATISTIKA DESKRIPTIF

STATISTIKA DESKRIPTIF STATISTIKA DESKRIPTIF 1 Statistika deskriptif berkaitan dengan penerapan metode statistika untuk mengumpulkan, mengolah, menyajikan dan menganalisis data kuantitatif secara deskriptif. Statistika inferensia

Lebih terperinci

ANALISIS DATA EKSPLORATIF MODUL 4 PENGANTAR MINITAB

ANALISIS DATA EKSPLORATIF MODUL 4 PENGANTAR MINITAB ANALISIS DATA EKSPLORATIF KELAS C2 MODUL 4 PENGANTAR MINITAB Nama Nomor Praktikan Mahasiswa Sri Siska Wirdaniyati 12611125 Tanggal Kumpul 5 Desember 2013 Praktikan Tanda tangan Laboran Nama Penilai Tanggal

Lebih terperinci

Metode Statistika STK211/ 3(2-3)

Metode Statistika STK211/ 3(2-3) Metode Statistika STK211/ 3(2-3) Pertemuan II Statistika Deskripsi dan Eksplorasi Septian Rahardiantoro - STK IPB 1 Misalkan diketahui data sebagai berikut Data 1 No Jenis Kelamin Tinggi Berat Agama 1

Lebih terperinci

Statistik Farmasi 2015

Statistik Farmasi 2015 Statistik Farmasi 2015 Tujuan Perkuliahan Setelah mengikuti perkuliahan, diharapkan mahasiswa mampu: 1. Mengorganisir data menggunakan distribusi frekuensi 2. Mempresentasikan data dalam distribusi frekuensi

Lebih terperinci

E-book Statistika Gratis... Statistical Data Analyst. Penyajian Data Statistik

E-book Statistika Gratis... Statistical Data Analyst. Penyajian Data Statistik Penyajian Data Statistik Pada penulisan kedua tentang Statistika Elementer ini, penulis akan memberikan bahasan mengenai Penyajian Data Statistik kepada para pembaca untuk mengetahui bentuk penyajian data

Lebih terperinci

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database 2. Tinjauan Pustaka 2.1 Data Mining Data mining merupakan ilmu yang mempelajari tentang proses ekstraksi informasi yang tersembunyi dari sekumpulan data yang berukuran sangat besar dengan menggunakan algoritma

Lebih terperinci

MODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH. NOVIANDI, M.Kom NIDN

MODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH. NOVIANDI, M.Kom NIDN MODUL MATA KULIAH DATA MINING (MIK 620 SESI 10) DISUSUN OLEH NOVIANDI, M.Kom NIDN. 0318018202 PROGRAM STUDI MANAJEMEN INFORMASI KESEHATAN FAKULTAS ILMU-ILMU KESEHATAN UNIVERSITAS ESA UNGGUL 2018 0 BAB

Lebih terperinci

Partitional clustering KLASTERING DENGAN METODE K-MEANS

Partitional clustering KLASTERING DENGAN METODE K-MEANS Partitional clustering KLASTERING DENGAN METODE K-MEANS PENDAHULUAN K-mean merupakan teknik klastering yang paling umum dan sederhana. Tujuan klastering ini adalah mengelompokkan obyek ke dalam k klaster/kelompok.

Lebih terperinci

STATISTIK DESKRIPTIF

STATISTIK DESKRIPTIF PERTEMUAN KE-3 STATISTIK DESKRIPTIF Ringkasan Materi: Pengukuran Deskriptif Pengukuran deskriptif pada dasarnya memaparkan secara numerik ukuran tendensi sentral, dispersi dan distribusi suatu data. Tendensi

Lebih terperinci

CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE

CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE CLUSTERING DATA KATEGORIK MENGGUNAKAN K-MODES DENGAN WEIGHTED DISSIMILARITY MEASURE Lutfi Hidayat Ramdhani¹, Hetti Hidayati², Mahmud Dwi Suliiyo³ ¹Teknik Informatika,, Universitas Telkom Abstrak K-Modes

Lebih terperinci

Prof. Dr. Ir. Zulkifli Alamsyah, M.Sc. PROGRAM STUDI AGRIBISNIS FAKULTAS PERTANIAN UNIVERSITAS JAMBI

Prof. Dr. Ir. Zulkifli Alamsyah, M.Sc. PROGRAM STUDI AGRIBISNIS FAKULTAS PERTANIAN UNIVERSITAS JAMBI Prof. Dr. Ir. Zulkifli Alamsyah, M.Sc. PROGRAM STUDI AGRIBISNIS FAKULTAS PERTANIAN UNIVERSITAS JAMBI DATA dan VARIABEL DATA = Fakta atau angka-angka. Bila tidak diolah, tidak punya makna Data untuk kepentingan

Lebih terperinci

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal

Lebih terperinci

PENDAHULUAN TINJAUAN PUSTAKA

PENDAHULUAN TINJAUAN PUSTAKA Latar Belakang PENDAHULUAN Sponge atau poriferans berasal dari bahasa Latin yaitu porus yang artinya pori dan ferre yang artinya memiliki. Sponge adalah hewan berpori, pada umumnya terdapat di lautan,

Lebih terperinci

Metode Statistika STK211/ 3(2-3)

Metode Statistika STK211/ 3(2-3) Metode Statistika STK211/ 3(2-3) Pertemuan II Statistika Deskripsi dan Eksplorasi Septian Rahardiantoro - STK IPB 1 Misalkan diketahui data sebagai berikut Data 1 No Jenis Kelamin Tinggi Berat Agama 1

Lebih terperinci

Statistik Bisnis 1. Week 5 Variation, Shape and Exploring Numerical Data

Statistik Bisnis 1. Week 5 Variation, Shape and Exploring Numerical Data Statistik Bisnis 1 Week 5 Variation, Shape and Exploring Numerical Data Agenda 15 Minutes 75 Minutes Attendance check Discussion and Exercise Objectives To describe the properties of variation, and shape

Lebih terperinci

BAB II TINJAUAN PUSTAKA

BAB II TINJAUAN PUSTAKA 2.1 Tinjauan Empiris BAB II TINJAUAN PUSTAKA Pada penelitian ini, peneliti menggunakan beberapa penelitian yang pernah dilakukan sebelumnya sebagai tinjauan studi. Berikut ialah tinjauan empiris yang digunakan:

Lebih terperinci

HASIL DA PEMBAHASA. Pengadaan Data

HASIL DA PEMBAHASA. Pengadaan Data 1 Memilih atribut yang akan diklasifikasikan ke dalam k kelas, misal atribut yang dipilih adalah atribut x. 2 Sekumpulan k-1 nilai dibangkitkan secara acak dalam selang [min{x}, max{x}]. Selang ini digunakan

Lebih terperinci

Visualisasi Data Kawasan Pariwisata yang Sering Dikunjungi di Bali dengan Pendekatan Pencocokan String pada Postingan Akun Instagram

Visualisasi Data Kawasan Pariwisata yang Sering Dikunjungi di Bali dengan Pendekatan Pencocokan String pada Postingan Akun Instagram Visualisasi Data Kawasan Pariwisata yang Sering Dikunjungi di Bali dengan Pendekatan Pencocokan String pada Postingan Akun Instagram Ida Ayu Putu Ari Crisdayanti / 13515067 Program Studi Teknik Informatika

Lebih terperinci

REVIEW BIOSTATISTIK DESKRIPTIF

REVIEW BIOSTATISTIK DESKRIPTIF REVIEW BIOSTATISTIK DESKRIPTIF POKOK BAHASAN 1. Konsep statistik deskriptif 2. Data dan variabel 3. Nilai Tengah (Ukuran Pusat), posisi dan variasi) pada data tunggal dan kelompok 4. Penyajian data 5.

Lebih terperinci

FORMAT LAPORAN MODUL V DISTRIBUSI SAMPLING

FORMAT LAPORAN MODUL V DISTRIBUSI SAMPLING FORMAT LAPORAN MODUL V DISTRIBUSI SAMPLING ABSTRAK ABSTRACT KATA PENGANTAR DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN BAB I PENDAHULUAN (kata pengantar) 1.1 Latar Belakang 1.2 Tujuan Penulisan

Lebih terperinci

ANALISIS CLUSTER PADA DOKUMEN TEKS

ANALISIS CLUSTER PADA DOKUMEN TEKS Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 ANALISIS CLUSTER PADA DOKUMEN TEKS Budi Susanto (versi 1.3) Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep analisis clustering Memahami

Lebih terperinci

Statistik Bisnis. Week 2 Numerical Descriptive Measures

Statistik Bisnis. Week 2 Numerical Descriptive Measures Statistik Bisnis Week 2 Numerical Descriptive Measures Agenda Time Activity First Session 90 minutes Central Tendency Second Session 60 minutes Variation and Shape 30 minutes Exploring Numerical Data Objectives

Lebih terperinci

Manajemen Data dengan Stata

Manajemen Data dengan Stata Manajemen Data dengan Stata #5 Beberapa Penggunaan Grafik pada Stata Permadina Kanah Arieska, M.Si permadina.kanah@unusa.ac.id http:// kanahberbagi.com Note: Seluruh modul tentang Manajemen Data dengan

Lebih terperinci

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN

penyebarannya. Diharapkan dari penelitian ini dapat terbentuk sebuah basis pengetahuan spasial yang bermanfaat. PENDAHULUAN 1 PENDAHULUAN Latar Belakang Kemiskinan merupakan suatu hal yang memiliki batasan yang luas, tetapi bagaimanapun juga batasan mengenai kemiskinan harus tetap diukur untuk kebijakan pemerintah. Menurut

Lebih terperinci

STATISTIK DESKRIPTIF

STATISTIK DESKRIPTIF STATISTIK DESKRIPTIF DATA & VARIABEL Data adalah sekumpulan datum yang berisi fakta-fakta serta gambaran suatu fenomena yang dikumpulkan, dirangkum, dianalisis dan selanjutnya diinterpretasikan. Variabel

Lebih terperinci

Statistika I. Pertemuan 2 & 3 Statistika Dasar (Basic( Ari Wibowo, MPd Prodi PAI Jurusan Tarbiyah STAIN Surakarta. Konsep Peubah

Statistika I. Pertemuan 2 & 3 Statistika Dasar (Basic( Ari Wibowo, MPd Prodi PAI Jurusan Tarbiyah STAIN Surakarta. Konsep Peubah Statistika I Pertemuan & 3 Statistika Dasar (Basic( Statistic) Ari Wibowo, MPd Prodi PAI Jurusan Tarbiyah STAIN Surakarta Konsep Peubah Definisi Peubah merupakan karakteristik dari objek yang sedang diamati,

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

PENYAJIAN DAN INTERPRETASI DATA PADA EPIDEMIOLOGI DESKRIPTIF (EPIDEMIOLOGY LECTURE NOTE) Ade Heryana, SST, MKM

PENYAJIAN DAN INTERPRETASI DATA PADA EPIDEMIOLOGI DESKRIPTIF (EPIDEMIOLOGY LECTURE NOTE) Ade Heryana, SST, MKM 1 Ade Heryana, Epidemiology Lecture Notes PENYAJIAN DAN INTERPRETASI DATA PADA EPIDEMIOLOGI DESKRIPTIF (EPIDEMIOLOGY LECTURE NOTE) Ade Heryana, SST, MKM TABEL Tabel adalah sekumpulan data yang disusun

Lebih terperinci

Memulai SPSS dan Mengelola File

Memulai SPSS dan Mengelola File MODUL 1 Memulai SPSS dan Mengelola File A. MEMULAI SPSS Untuk memulai SPSS for Windows langkah yang harus dilakukan adalah: Klik menu Start Programs SPSS for Windows SPSS for Windows. Kemudian akan ditampilkan

Lebih terperinci

Statistik Bisnis. Week 2 Numerical Descriptive Measures

Statistik Bisnis. Week 2 Numerical Descriptive Measures Statistik Bisnis Week 2 Numerical Descriptive Measures Agenda Time Activity First Session 90 minutes Central Tendency Second Session 60 minutes Variation and Shape 30 minutes Exploring Numerical Data Objectives

Lebih terperinci

Pengenalan Pola. Klasterisasi Data

Pengenalan Pola. Klasterisasi Data Pengenalan Pola Klasterisasi Data PTIIK - 2014 Course Contents 1 Konsep Dasar 2 Tahapan Proses Klasterisasi 3 Ukuran Kemiripan Data 4 Algoritma Klasterisasi Konsep Dasar Klusterisasi Data, atau Data Clustering

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Faktor penentu bagi usaha atau bisnis apapun pada masa sekarang ini adalah kemampuan untuk menggunakan informasi seefektif mungkin. Penggunaan data secara tepat karena

Lebih terperinci

STK511 Analisis Statistika. Bagus Sartono

STK511 Analisis Statistika. Bagus Sartono STK511 Analisis Statistika Bagus Sartono Pokok Bahasan Pengenalan analisis dan deskripsi data Sebaran peluang peubah acak. Sebaran penarikan contoh Pendugaan parameter Pengujian hipotesis (t-test, one-way

Lebih terperinci

Tipe Data. MENDESKRIPSIKAN DATA Secara Grafik. Bab II. Level Pengukuran. Presentasi Data secara Grafik

Tipe Data. MENDESKRIPSIKAN DATA Secara Grafik. Bab II. Level Pengukuran. Presentasi Data secara Grafik Tipe Data Data MENDESKRIPSIKAN DATA Secara Grafik Kategori Bab II Contoh: Level Pengukuran Data Rasio Data Kuantitatif Kategori Berurut (ranking, urutan atau skala) Data Interval Data Ordinal Data Kualitatif

Lebih terperinci

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian

Implementasi Sistem HASIL DAN PEMBAHASAN Data Penelitian Implementasi Sistem Clustering FCM diimplementasikan pada program yang dikembangkan dengan perangkat lunak Matlab v.7.7. Tahap implementasi sistem mengikuti langkahlangkah melakukan clustering dengan FCM,

Lebih terperinci

BAB 2 LANDASAN TEORI

BAB 2 LANDASAN TEORI 7 BAB 2 LANDASAN TEORI Bab ini membahas tentang teori penunjang dan penelitian sebelumnya yang berhubungan dengan penerapan algoritma hierarchical clustering dan k-means untuk pengelompokan desa tertinggal.

Lebih terperinci

Statistik Deskriptif untuk Data Nominal dan Ordinal

Statistik Deskriptif untuk Data Nominal dan Ordinal Statistik Deskriptif untuk Data Nominal dan Ordinal Salah satu ciri utama sehingga sebuah data harus diproses dengan metode nonparametrik adalah jika tipe data tersebut semuanya adalah data nominal atau

Lebih terperinci

STATISTIKA INDUSTRI I

STATISTIKA INDUSTRI I STATISTIKA INDUSTRI I TOLOOOONGGG... PUSYIIIIIIINGGGGG!!!! Hiksss!!!!! Lebih mudah dimengerti kann?????!!!!! What do you think??? Definisi Statistika Suatu metode ilmiah dalam mengumpulkan, mengklasifikasikan,

Lebih terperinci

2. Pengertian data outlier Data outlier yaitu data dengan kombinasi unik dari karakteristik yang dapat diidentifikasi sebagai sesuatu yang berbeda

2. Pengertian data outlier Data outlier yaitu data dengan kombinasi unik dari karakteristik yang dapat diidentifikasi sebagai sesuatu yang berbeda 2. Pengertian data outlier Data outlier yaitu data dengan kombinasi unik dari karakteristik yang dapat diidentifikasi sebagai sesuatu yang berbeda dari observasi yang lainnya. Yang dimaksud dengan karakteristik

Lebih terperinci

DATA DAN PENYAJIAN DATA STATISTIKA PERTEMUAN KE-2. Oleh ; Muhammad Yusuf Awaluddin

DATA DAN PENYAJIAN DATA STATISTIKA PERTEMUAN KE-2. Oleh ; Muhammad Yusuf Awaluddin DATA DAN PENYAJIAN DATA STATISTIKA PERTEMUAN KE-2 Oleh ; Muhammad Yusuf Awaluddin OVERVIEW Statistic : Nilai yg dihitung dari sebuah sampel (mean, median, std.deviasi, dll) Statistics : Metode ilmiah untuk

Lebih terperinci

K-NN merupakan instance-based learning, Maksudnya: data training disimpan sehingga klasifikasi untuk record baru yg belum diklasifikasi dpt ditemukan

K-NN merupakan instance-based learning, Maksudnya: data training disimpan sehingga klasifikasi untuk record baru yg belum diklasifikasi dpt ditemukan K-NN merupakan instance-based learning, Maksudnya: data training disimpan sehingga klasifikasi untuk record baru yg belum diklasifikasi dpt ditemukan dengan membandingkan kemiripan yang paling banyak dalam

Lebih terperinci

Catatan Kuliah. Analisis Data. Orang Cerdas Belajar Statistika. disusun oleh. Khreshna I.A. Syuhada, MSc. PhD.

Catatan Kuliah. Analisis Data. Orang Cerdas Belajar Statistika. disusun oleh. Khreshna I.A. Syuhada, MSc. PhD. Catatan Kuliah Analisis Data Orang Cerdas Belajar Statistika disusun oleh Khreshna I.A. Syuhada, MSc. PhD. Kelompok Keilmuan STATISTIKA - FMIPA Institut Teknologi Bandung 2013 Tentang Analisis Data A.

Lebih terperinci

DATA DAN PENYAJIAN DATA STATISTIKA PERTEMUAN KE-2. OLEH ; MUHAMMAD YUSUF AWALUDDIN

DATA DAN PENYAJIAN DATA STATISTIKA PERTEMUAN KE-2. OLEH ; MUHAMMAD YUSUF AWALUDDIN DATA DAN PENYAJIAN DATA STATISTIKA PERTEMUAN KE-2. OLEH ; MUHAMMAD YUSUF AWALUDDIN DATA DAN PENYAJIAN DATA STATISTIKA PERTEMUAN KE-2 Oleh ; Muhammad Yusuf Awaluddin OVERVIEW Statistic : Nilai yg dihitung

Lebih terperinci

Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada.

Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. Azimmatul Ihwah Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada. Ada cara yg lebih baik untuk menginterpretasi data yg

Lebih terperinci

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN :

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN : Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 PENERAPAN DATA MINING UNTUK MEMBENTUK KELOMPOK BELAJAR MENGGUNAKAN METODE CLUSTERING DI SMPN 19 BANDUNG Andre Catur Prasetyo Teknik Informatika Universitas

Lebih terperinci

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree Scientific Journal of Informatics Vol. 3, No. 1, Mei 2016 p-issn 2407-7658 http://journal.unnes.ac.id/nju/index.php/sji e-issn 2460-0040 Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan

Lebih terperinci

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang)

APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita Anggraeni, Ragil Saputra, Beta Noranita APLIKASI DATA MINING ANALISIS DATA TRANSAKSI PENJUALAN OBAT MENGGUNAKAN ALGORITMA APRIORI (Studi Kasus di Apotek Setya Sehat Semarang) Hapsari Dita

Lebih terperinci

Satatistik dan Probabilitas. Ir. I Nyoman Setiawan, MT. NIP HP

Satatistik dan Probabilitas. Ir. I Nyoman Setiawan, MT. NIP HP Satatistik dan Probabilitas Ir. I Nyoman Setiawan, MT. NIP. 19631229 199103 01 001 HP. 081338721408 setiawan@ee.unud.ac.id man_awan@yahoo.com Statistik Dan Probabilitas Pendahuluan Statistika adalah pengetahuan

Lebih terperinci

Referensi : 1. Komputasi Statistik Dengan Software R, I Gede Nyoman Mindra, didi.staff.gunadarma.ac.id/downloads/files/13709/babv.

Referensi : 1. Komputasi Statistik Dengan Software R, I Gede Nyoman Mindra, didi.staff.gunadarma.ac.id/downloads/files/13709/babv. STATISTIKA DESKRIPTIF 2 Referensi : 1. Komputasi Statistik Dengan Software R, I Gede Nyoman Mindra, 2009 2. didi.staff.gunadarma.ac.id/downloads/files/13709/babv.pdf Ukuran Statistik 2.1 RATA RATA (MEAN)

Lebih terperinci

MA5182 Topik dalam Statistika I: Statistika Spasial. Utriweni Mukhaiyar

MA5182 Topik dalam Statistika I: Statistika Spasial. Utriweni Mukhaiyar Review 1: Statistika Deskriptif MA5182 Topik dalam Statistika I: Statistika Spasial 28 Agustus 2012 28 Agustus 2012 Utriweni Mukhaiyar Ilustrasi Berikut adalah data rata-rata curah hujan bulanan yang diamati

Lebih terperinci

Ukuran-Ukuran Gejala Pusat

Ukuran-Ukuran Gejala Pusat Ukuran-Ukuran Gejala Pusat Ukuran Gejala Pusat merupakan ukuran yang dapat mewakili data secara keseluruhan. Artinya, jika keseluruhan nilai yang ada dalam data tersebut besarnya diurutkan, lalu dimasukkan

Lebih terperinci

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA Heri Awalul Ilhamsah Jurusan Teknik Industri Universitas Trunojoyo Madura Kampus Universitas Trunojoyo

Lebih terperinci

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan

BAB II TINJAUAN PUSTAKA. sekumpulan besar data yang tersimspan dalam penyimpanan dengan BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Data Mining A. Pengertian Data Mining Menurut Gartner Group data mining adalah suatu proses menemukan hubungan yang berarti, pola, dan kecenderungan dengan

Lebih terperinci

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan 6 BAB II TINJAUAN PUSTAKA 2.1 Pengertian Data Mining Data mining adalah suatu istilah yang digunakan untuk menguraikan penemuan pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Lebih terperinci

18/09/2017. Fakultas Teknologi dan Desain Program Studi Teknik Informatika

18/09/2017. Fakultas Teknologi dan Desain Program Studi Teknik Informatika Fakultas Teknologi dan Desain Program Studi Teknik Informatika 1 Capaian Pembelajaran Mahasiswa memiliki pemahaman mengenai sistem bilangan dan mampu menjelaskan macam-macam sistem bilangan yang digunakan

Lebih terperinci

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.

Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining. Modul Praktikum WEKA Yudi Wibisono (e: yudi@upi.edu ); t: @yudiwbs Ilmu Komputer Universitas Pendidikan Indonesia (cs.upi.edu) Versi BETA : Oktober 2013 http://creativecommons.org/licenses/by-nc-sa/3.0/

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Performansi Hasil Cluster

HASIL DAN PEMBAHASAN. Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Performansi Hasil Cluster Performansi Hasil Cluster Gambar 8 Langkah-langkah deteksi cluster dengan algoritme DDBC. Pada tahap ini dilakukan analisis terhadap hasil cluster. Analisis yang digunakan adalah analisis cluster ce. Besarnya

Lebih terperinci

STATISTIKA DESKRIPTIF

STATISTIKA DESKRIPTIF STATISTIKA DESKRIPTIF Ukuran Pusat (measure of center) Ukuran Penyebaran (measure of variability) Menurut Anda, bagaimana penampilan saya? Gambaran saya? Visualizing Telling Dapatkan Anda tentukan manakah

Lebih terperinci

ANALISIS STATISTIKA. Pertemuan 2 Statistika Dasar (Basic Statistics)

ANALISIS STATISTIKA. Pertemuan 2 Statistika Dasar (Basic Statistics) ANALISIS STATISTIKA Pertemuan Statistika Dasar (Basic Statistics) Statistika Deskripsi dan Eksplorasi Merupakan teknik penyajian dan peringkasan data sehingga menjadi informasi yang mudah dipahami. Tehnik

Lebih terperinci

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id

Lebih terperinci

DASAR PEMILIHAN UJI STATISTIK

DASAR PEMILIHAN UJI STATISTIK 01/27/10 1 DASAR PEMILIHAN UJI STATISTIK Saptawati Bardosono PENDAHULUAN Pada setiap penelitian biasanya data dikumpulkan untuk sejumlah besar variabel, sehingga dapat menyulitkan pemilihan uji statistik

Lebih terperinci

PENGKONSTRUKSIAN GRAFIK PENGENDALI BERDASAR BOXPLOT BIVARIAT

PENGKONSTRUKSIAN GRAFIK PENGENDALI BERDASAR BOXPLOT BIVARIAT S-3 PENGKONSTRUKSIAN GRAFIK PENGENDALI BERDASAR BOXPLOT BIVARIAT Frangky Masipupu 1), Adi Setiawan ), Bambang Susanto 3) 1) Mahasiswa Program Studi Matematika ) 3) Dosen Program Studi Matematika Program

Lebih terperinci

PRESENTASI TUGAS AKHIR KI091391

PRESENTASI TUGAS AKHIR KI091391 PRESENTASI TUGAS AKHIR KI091391 IMPLEMENTASI KD-TREE K-MEANS CLUSTERING PADA KLASTERISASI DOKUMEN (Kata kunci: KD-Tree K-Means Clustering, Klasterisasi Dokumen, K- Dimensional Tree, K-Means Clustering)

Lebih terperinci

Tujuan. Dunia Nyata dan SIG. Arna fariza. Mengubah dunia nyata menjadi informasi geografis di komputer 3/17/2016

Tujuan. Dunia Nyata dan SIG. Arna fariza. Mengubah dunia nyata menjadi informasi geografis di komputer 3/17/2016 Dunia Nyata dan SIG Arna fariza Politeknik elektronika negeri surabaya Tujuan Mengubah dunia nyata menjadi informasi geografis di komputer 1 Materi Representasi dunia nyata Representasi geometri Representasi

Lebih terperinci

Pendahuluan & Statistika Deskriptif

Pendahuluan & Statistika Deskriptif 1 Pendahuluan & Statistika Deskriptif Pendahuluan Statistical Thinking Percentil dan Kuartil Ukuran Pemusatan Ukuran Variabilitas Pengelompokkan Data Skewness dan Kurtosis Metoda Penyajian Data Analisis

Lebih terperinci