Data Mining I. Mata kuliah Data Warehouse Universitas Darma Persada Oleh: Adam AB

dokumen-dokumen yang mirip
PENGUKURAN DESKRIPTIF

Pengukuran Deskriptif. Debrina Puspita Andriani /

Tentang MA5283 Statistika BAB 1 STATISTIKA DESKRIPTIF MA5283 STATISTIKA. Dosen: Khreshna I.A. Syuhada, MSc. PhD. Orang Cerdas Belajar Statistika

DATA MINING. Pertemuan 2. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

Pengukuran Deskriptif

Tabel 7-1 Rata-rata hitung hasil test mata kuliah statistik deskriptif kelompok A dan B. A B

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

dapat digunakan formulasi sebagai berikut : Letak Letak Letak

UKURAN LOKASI DAN VARIANSI MEAN:

LEMBAR AKTIVITAS SISWA STATISTIKA 2 B. PENYAJIAN DATA

Contoh Analisis Kurikulum

STATISTIK DESKRIPTIF. Penyajian Data, ukuran Pemusatan Data, Ukuran Penyebaran Data

MA2082 BIOSTATISTIKA Orang Biologi Tidak Anti Statistika

Pengumpulan & Penyajian Data

MENGHITUNG NILAI RATA-RATA SUATU DISTRIBUSI DATA

sbl3statistik - - STATISTIK - - Statistik 9306 Matematika 1 (Q3 Q 1 )

UKURAN DISPERSI (SEBARAN)DATA

BAB III UKURAN TENGAH DAN DISPERSI

Konsep Data Mining. Pendahuluan. Bertalya. Universitas Gunadarma 2009

STATISTIKA. Standar kompetensi : Menggunakan aturan statistika, kaidah, pencacahan, dan sifatsifat peluang dalam pemecahan masalah

information karena data yang terkumpul itu tidak dapat digunakan untuk aplikasi

MA2082 BIOSTATISTIKA Orang Biologi Tidak Anti Statistika

UKURAN NILAI SENTRAL&UKURAN PENYEBARAN. Tita Talitha, MT

OUTLINE BAGIAN I Statistik Deskriptif

A. PENYAJIAN DATA. Nama Dwi Willi Nita Wulan Dani. Tabel 3.1

STATISTIK. Rahma Faelasofi

Catatan Kuliah. Analisis Data. Orang Cerdas Belajar Statistika. disusun oleh. Khreshna I.A. Syuhada, MSc. PhD.

BAB 1 PENDAHULUAN Latar Belakang

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. pengumpulan data. Soal yang digunakan adalah soal yang telah teruji validitasnya

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. menyatakan distribusi frekuensi skor responden untuk masing-masing variabel dan

MODUL MATEMATIKA SMA IPA Kelas 11

Contoh: Pada data Tabel satu diperoleh range pada masing masing mata kuliah. adalah: Matakuliah Max min range A B C

BAB II TINJAUAN PUSTAKA

STATISTIKA INDUSTRI I. Agustina Eunike, ST., MT., MBA.

SATUAN ACARA PERKULIAHAN

MA2081 Statistika Dasar

SOAL TUGAS STATISTIKA PENDIDIKAN. 2010, Prof. Ir. Sigit Nugroho, M.Sc., Ph.D.

STATISTIKA 4 UKURAN LETAK

Setelah mempelajari bahan ajar ini diharapkan Anda dapat:

TUGAS II STATISTIKA. Oleh. Butsiarah / 15B Kelas B PROGRAM STUDI PENDIDIKAN TEKNOLOGI DAN KEJURUAN PROGRAM PASCASARJANA

RENCANA PEMBELAJARAN SEMESTER GANJIL 2017/2018 PRODI MANAJEMEN INFORMASI KESEHATAN FAKULTAS ILMU-ILMU KESEHATAN UNIVERSITAS ESA UNGGUL

UKURAN PEMUSATAN DATA STATISTIK

UKURAN TENGAH DAN UKURAN DISPERSI

BAB II LANDASAN TEORI

STATISTIKA DESKRIPTIF. Wenny Maulina, S.Si., M.Si

Penggalian Informasi Potensial dari Basis Data di Perguruan Tinggi. Sri Andayani Jurusan Pendidikan Matematika FMIPA UNY

Metode Penelitian Kuantitatif Aswad Analisis Deskriptif

King s Learning Be Smart Without Limits NAMA : KELAS :

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

Probabilitas dan Statistika Analisis Data dan Ukuran Pemusatan. Adam Hendra Brata

Pengukuran Statistik Deskriptif UKURAN PUSAT, UKURAN VARIASI DAN UKURAN POSISI

Timor Setiyaningsih, Nur Syamsiah Teknik Informatika Universitas Darma Persada. Abstrak

BAB II LANDASAN TEORI

/, _ PENGANTAR DATA MINING. Menggali Pengetahuan dari Bon&kahan Data. crh. 3...:t...:.. o:o/t.'ih9. t 7.=... L. .II /r_.!j """""'_: I. P.? r. ...

DATA MINING. Pertemuan 1. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

SATUAN ACARA TUTORIAL (SAT) Tutorial ke : 1 Kode/ Nama Mata Kuliah : PAMA 3225 / Statistika Dasar

Data Mining II Estimasi

BAB IV DISPERSI DATA

Statistika Farmasi

DISPERSI DATA. - Jangkauan (Range) - Simpangan/deviasi Rata-rata (Mean Deviation) - Variansi (Variance) - Standar Deviasi (Standart Deviation)

BAB I DISTRIBUSI FREKUENSI

PUSAT PENGEMBANGAN DAN PEMBERDAYAAN PENDIDIK DAN TENAGA KEPENDIDIKAN (PPPPTK) MATEMATIKA

C. Ukuran Letak dan Ukuran Penyebaran Data

Satatistik dan Probabilitas. Ir. I Nyoman Setiawan, MT. NIP HP

BAB I PENDAHULUAN 1.1 Latar Belakang

SKRIPSI TI S1 FIK UDINUS 1

RANCANGAN AKTIVITAS TUTORIAL (RAT)

BAB II TINJAUAN PUSTAKA

Soal, Kartu Soal, Kisi-kisi Soal

Distribusi Frekuensi dan Statistik Deskriptif Lainnya

BAB 2 LANDASAN TEORI

HARISON,S.Pd,M.Kom JURUSAN TEKNIK INFORMATIKA FAKULTAS TEKNOLOGI INDUSTRI INSTITUT TEKNOLOGI PADANG

Statistika & Probabilitas

: Purnomo Satria NIM : PENDISKRIPSIAN DATA

SISTEM BASIS DATA. Pertemuan 1 & 2. 3 SKS Semester 2 S1 Sistem Informasi Nizar Rabbi Radliya

..::Data Mining::.. Prediksi

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

Jurnal Matematika UNAND Vol. 5 No. 4 Hal ISSN : c Jurusan Matematika FMIPA UNAND

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

STATISTIKA TERAPAN Disertai Contoh Aplikasi dengan SPSS

SATUAN ACARA TUTORIAL (SAT) Mata Kuliah : Statistika Dasar/PAMA 3226 SKS : 3 SKS Tutorial : ke-1 Nama Tutor : Adi Nur Cahyono, S.Pd., M.Pd.

Data Mining Outline BAB I Pendahuluan. Rules. Pendahuluan 9/9/2016. Who Am I? Manusia Memproduksi Data. Ricky Maulana Fajri

BAB III METODE PENELITIAN. learning cycle 7-E, learning cycle 5-E dan pembelajaran langsung. Pendekatan yang digunakan adalah pendekatan kuantitatif.

Apa bedanya Membaca Data dan Menafsirkan Data dalam Aspek Pengolahan Data. oleh Dra.Th.Widyantini,M.Si PPPPTK MATEMATIKA

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

Silabus NAMA SEKOLAH : MATA PELAJARAN : Matematika

DESKRIPSI DATA. sekumpulan data yang sudah dikumpulkan. Ukuran pemusatan dibagi menjadi dua yaitu:

BAB 2 TINJAUAN PUSTAKA

STATISTIK DESKRIPTIF. Abdul Rohman, S.E

BAB I PENGANTAR STATISTIK DAN ANALISIS DATA

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

Short Quiz. TIME LIMIT: 10 minutes

Ukuran tendensi sentral seperti mean, median, dan modus seringkali tidak mempunyai cukup informasi untuk menyimpulkan data yg ada.

UKURAN PENYEBARAN DATA

PENYAJIAN DATA. Cara Penyajian Data meliputi :

PENERAPAN ALGORITMA APRIORI DALAM MEMPREDIKSI PERSEDIAAN BUKU PADA PERPUSTAKAAN SMA DWI TUNGGAL TANJUNG MORAWA

BAB I PENDAHULUAN Latar Belakang Sekolah Menengah Atas (SMA) Negeri 01 Belangkejeren, yang terletak di

STATISTIKA DASAR DAN APLIKASI

PENGANTAR STATISTIK Pusat Data dan Satistik Pendidikan-Kebudayaan Setjen, Kemdikbud 2014

BAB III METODE PENELITIAN

Transkripsi:

1

2

Data Mining I Mata kuliah Data Warehouse Universitas Darma Persada Oleh: Adam AB

Bussiness Intelligent proses perubahan data menjadi informasi dan dari kumpulan informasi yang ada akan diambil polanya menjadi pengetahuan 4

Data Mining - definisi Istilah yang digunakan untuk menguraikan penemuan pengetahuan dalam database Data mining menggunakan teknik statistik, matematika, kecerdasan buatan dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar 5

Data Mining-definisi (lanj) Analisis otomatis dari data yang berjumlah besar atau kompleks dengan tujuan menemukan pola atau kecenderungan yang penting yang biasanya tidka disadari keberadaannya. (pramudiono, 2006) Analisis dari peninjauan kumpulan data untuk menemukan hubungan yang tidak diduga dan meringkas data dengan cara yang berbeda dengan sebelumnya yang dapat dipahamidan bermanfaat bagi pemilik data (Larose, 2005) 6

Data Mining-definisi (lanj) Data Mining ~ Knowledge Discovery ~ pattern recognition 7

Data mining-definisi (lanj) Disiplin ilmu yang mempelajari metode untuk mengekstrakpengetahuan atau menemukan pola dari suatu data 1. Data: fakta yang terekam dan tidak membawa arti 2. Pengetahuan: pola, aturan atau model yang muncul dari data Sehingga Data mining sering disebut Knowledge Discovery in Database(KDD) Konsep Transformasi Data Informasi Pengetahuan 8

Data Tidakmembawaarti, merupakan kumpulandarifakta-faktatentangsuatu kejadian Suatucatatanterstrukturdarisuatu transaksi Merupakanmateripentingdalam membentukinformasi 9

Pengetahuan Gabungandarisuatupengalaman, nilai, informasi kontekstual dan juga pandangan pakaryang memberikansuatuframework untuk mengevaluasi dan menciptakan pengalaman baru dan informasi (Thomas H. Davenport, Laurence Prusak) Bisaberupasolusipemecahansuatumasalah, petunjuk suatu pekerjaan dan ini bisa ditingkatkan nilainya, dipelajari dan juga bisa diajarkan kepada yang lain 10

Data Informasi - Pengetahuan Data Kehadiran Pegawai NIP TGL DATANG PULANG 1103 02/12/2004 07:20 15:40 1142 02/12/2004 07:45 15:33 1156 02/12/2004 07:51 16:00 1173 02/12/2004 08:00 15:15 1180 02/12/2004 07:01 16:31 1183 02/12/2004 07:49 17:00 11

Data Informasi - Pengetahuan Informasi Akumulasi Bulanan Kehadiran Pegawai NIP Masuk Alpa Cuti Sakit Telat 1103 22 1142 18 2 2 1156 10 1 11 1173 12 5 5 1180 10 12 12

Informasi Kondisi Kehadiran Mingguan Pegawai Senin Selasa Rabu Kamis Jumat Terlambat 7 0 1 0 5 Pulang Cepat 0 1 1 1 8 Izin 3 0 0 1 4 Alpa 1 0 2 0 2 13

Pengetahuan apa yang diperoleh? Pengetahuantentangkebiasaan pegawaidalamjam datang/pulang kerja Pengetahuantentangbagaimana teknik meningkatkankehadiranpegawai kebijakan 14

Kebijakan penataan jam kerja karyawan khusus untuk hari senin dan jumat Peraturan jam kerja: HariSenindimulaijam 10:00 Hari Jumat diakhiri jam 14:00 Sisa jam kerja dikompensasi ke hari lain: 1. Senin pulang setelah maghrib, toh jalanan jakarta macet total di sore hari (bayar hutang 2 jam) 2. Rabu dan kamis bayar hutang setengah jam di pagi hari dan setengah jam di sore hari (bayar hutang 2 jam) 15

Irisan bidang ilmu data mining 1. Statistik: Lebih bersifat teori Fokus ke pengujian hipotesis 2. Machine Learning: Lebih bersifat heuristik Fokus pada perbaikan performansi dari suatu teknik learning 3. Data Mining: Gabungan teori dan heuristik Fokus pada seluruh proses penemuan knowledge dan pola Termasuk data cleaning, learning dan visualisasi hasilnya 16

Mengapa Data minng Manusia dalam suatu organisasi, sadar atau tidak sadar telah memproduksi berbagai data yang jumlahnya sangat besar Contoh data: bisnis, kedokteran, ekonomi, geografi, olahraga, Pada dasarnya, data adalah entitas yang tidak memiliki arti, meskipun kemungkinan memiliki nilai di dalamnya 17

Faktor perlunya Data Mining Pertumbuhan data yang cepat Penyimpanan data dalam data warehouse, sehingga seluruh perusahaan memiliki akses ke dalam DB yang handal Peningkatan akses data melalui web dan intranet Tekanan kompetisi bisnis Ketersediaan teknologi Perkembangan komputasi yang sangat maju dan pesat dan kapasitas media simpan 18

Hal penting terkait data mining Proses otomatisasi terhadap data yang sudah ada Data yang akan diproses berupa data yang sangat besar Tujuan data mining mendapatkan hubungan atau pola yang mungkin memberikan indikasi yang bermanfaat 19

Fungsi data mining Fungsi deskripsi (description) Fungsi estimasi (estimation) Fungsi prediksi (prediction) Fungsi klasifikasi (classification) Fungsi pengelompokan (clustering) Fungsi asosiasi (association) Fungsi minor Fungsi major 20

Estimation Association Prediction Clustering Classification 21

Data mining-deskripsi Sebagai kasus akan diberi suatu data nilai UAS matakuliah Datawarehouse kelas pagi dan malam 22

Data Mining-deskripsi (lanj) Ketika diberi kumpulan data kita sukar menangkap arti kumpulan data tersebut sehingga data harus dirangkum sedemikian rupa agar berbicara sehingga kita memiliki gambaran mengenai kumpulan data tersebut Bayangkan bila datanya adalah ribuan bahkan jutaan data. jutaan angka 23

Data Mining-deskripsi (lanj) Diperlukan suatu cara untuk menggambarkan sekumpulan data secara ringkas deskripsi Metode Statistika 24

Data Mining-deskripsi (lanj) Terdapat beberapa cara untuk memberikan gambaran secara ringkas. 1. Deskripsi grafis mendeskripsikan data dalam bentuk gambar a. diagram titik b. histogram 2. Deskripsi lokasi memberikan informasi mengenai data pada posisi tempat tertentu 25

Data mining-deskripsi (lanj) 3. Deskripsi keberagaman meski deskripsi lokasi sudah memberikan gambaran tentang lokasi pusat data (mean, median, modus) kita masih belum memiliki gambaran atas keberagaman data. 26

Data mining-deskripsi(lanj) Sebagai gambaran akan kita lihat studi kasus nilai UAS MK datawarehouse Nilai UAS terdiri dari 2 kelas yaitu kelas pagi dan malam Kelas pagi ditampilkan pada tabel berikut 27

Data mining-deskripsi(lanj) 28

Data mining-deskripsi(lanj) Mengapa kita perlu memproses data di atas? Apakah data di tabel tersebut memberikan arti bagi kita? Bagaimana kita mengetahui makna sekumpulan data di atas? Bagaimana bila data di atas berjumlah ribuan bahkan jutaan data? 29

Data mining-deskripsi grafis Mendeskripsikan data dalam bentuk visual a picture paints a thousand words Berupa diagram titik dan histogram 30

Data mining-deskripsi grafis(lanj) Diagram titik setiap data digambarkan sebagai sebuah titik (dot) Misal nilai kelas pagi digambarkan tiitik penuh sementara kelas malam digambarkan titik dengan lubang tengah 31

Data mining-deskripsi grafis(lanj) Diagram histogram Misalnya kita mempunyai data nilai UAS kelas pagi 32

Data mining-deskripsi grafis(lanj) Langkah pertama dalam membuat histogram adalah membuat beberapa interval dalam hal ini misalnya membuat interval sesuai dengan klasifikasi nilai 80 100 = A 68-79.99 = B 67.99 56 = C 55.9 46 = D 45 0 = E 33

Data mining-deskripsi grafis(lanj) Langkah kedua adalah menghitung seberapa banyak data yang menjadi anggota tiap interval Langkah ketiga, membuat histogram berdasarkan data di atas 34

Data mining-deskripsi grafis(lanj) 35

Data mining-deskripsi grafis(lanj) histogram berdasarkan interval nilai 4.5 4 3.5 3 2.5 2 1.5 1 0.5 0 S e rie s 1 1 2 3 4 jum la h fre k ue ns i 36

Data mining-deskripsi grafis(lanj) Pengetahuan apa yang diperoleh? Dengan melihat batang-batang tersebut kita dapat melihat lokasi kecenderungan mengumpulnya data dari batang tertinggi. Histogram yang menunjukkan data yang merata menunjukkan keberagaman data beragam dan menyebar 37

Data mining-deskripsi lokasi Meskipun deskripsi grafis sudah menggambarkan karakteristik data, sifatnya masih terlalu kasar dan kurang praktis untuk dilakukan. Kita memerlukan angka yang cukup mewakili data dan diperoleh secara praktis daripada grafis. 38

Data mining-deskripsi lokasi(lanj) 1. Rata-rata (Mean) membuat menjadi rata. Rumus mean adalah jumlah semua data dibagi dengan banyaknya data 39

Data mining-deskripsi lokasi(lanj) Melihat kasus nilai UAS kelas PAGI dan MALAM maka bisa dilihat masingmasing mean nilai UAS tersebut 40

Data mining-deskripsi lokasi(lanj) Rata-rata / mean Pengetahuan apa yang bisa diperoleh? Dengan mudah bisa kita katakan bahwa PADA UMUMNYA nilai kelas malam memiliki nilai 70.3 dan kelas pagi 66.33. Nilai rata-rata kelas malam lebih tinggi daripada kelas pagi. Mengapa? 41

Data mining-deskripsi lokasi(lanj) Median / nilai tengah Dengan median, kita mencari nilai di tengah. Langkah pertama adalah mengurutkannya. Data asli: 85 65 55 75 65 55 55 70 70 60 65 80 95 75 85 Data urut: 55 55 55 60 65 65 65 70 70 75 75 80 85 85 95 Karena data kita ganjil (15) maka nilai tengahnya adalah 70 Bila banyaknya data genap maka pertengahan data dijumlahkan kemudian dibagi 2 42

Data mining-deskripsi lokasi(lanj) Pengetahuan apa yang dapat diperoleh? Bila kita mengurutkan data nilai dari yang terendah sampai ke tertinggi maka ditengahnya adalah 70. Keuntungan menggunakan median adalah tidak terpengaruh nilai ekstrim. Bila ratarata/mean akan terpengaruh nilai ekstrim. Contohnya? 43

Data mining-deskripsi lokasi(lanj) Modus nilai yang paling banyak muncul. Data nilai : 55 55 55 60 65 65 65 70 70 75 75 80 85 85 95 Nilai yang menjadi modus adalah 55 3x dan 65 3x Pengetahuan apa yang muncul? Nilai mahasiswa UAS pagi banyak yang memperoleh 55 dan 65 Modus mencerminkan lokasi kecenderungan berkumpulnya sebagian besar data dibanding yang lain. 44

Data mining-deskripsi lokasi(lanj) Contoh: sebuah perusahaan menyatakan bahwa gaji rata-rata perusahaan XYZ adalah Rp. 10 juta. Kenyataann 90 karyawan digaji Rp. 1 Juta, dan hanya 10 karyawan yang digaji Rp. 100 juta. Dibandingkan rata-rata, informasi yang lebih tidak menyesatkan dan berguna adalah bahwa sebagian besar / modus karyawan digaji sekitar Rp. 1 juta 45

Data mining-deskripsi lokasi(lanj) Kuartil : membagi seluruh data menjadi empat bagian dan mencari nilai di tiap seperempat bagian/kuartil tersebut. 55 55 55 60 65 65 65 70 70 75 75 80 85 85 95 Pengetahuan apa yang bisa diperoleh? Bila kita mengurutkan data nilai UAS pagi kemudian urutan kita bagi empat maka akan diperoleh angka 55, 62.5, 70, 77.5, 95 46

Data mining-deskripsi lokasi(lanj) Persentil : pembagian data dengan 100 bagian 55 55 55 60 65 65 65 70 70 75 75 80 85 85 95 47

Data mining-deskripsi lokasi(lanj) Pengetahuan yang diperoleh: Bila kita mengurutkan data nilai UAS kelas pagi dari yang terendah sampai tertinggi akan diperoleh angka tersebut 48

Data mining-deskripsi keberagaman Deskripsi lokasi sudah memberikan gambaran tentang lokasi pusat data (rata-rata, modus, median) tetapi kita belum memiliki keberagaman data. Data I 6, 6, 7, 7, 7, 8, 8 mean = 7, median = 7, modus = 7 Data II 0, 1, 3, 7, 7, 12,19 mean = 7, median = 7, modus = 7 49

Data mining-deskripsi keberagaman Mean, median dan modus nya sama apakah data di atas sama? Data di atas tidak sama karena persebarannya beda. Pada data I cenderung berkumpul di 7, sementara data II beragam dan menyebar. Tiga ukuran untuk melihat keberagaman yaitu range, varians dan standar deviasi 50

Data mining-deskripsi keberagaman 1. Rentang menyatakan besarnya rentang jarak antara data terkecil dengan data terbesar. Rentang yang besar menandakan bahwa data relatif beragam dan sebaliknya Contoh: Data I 6, 6, 7, 7, 7, 8, 8 Data II 0, 1, 3, 7, 7, 12,19 range data I 8 6 = 2 range data II 19 0 = 19 51

Data mining-deskripsi keberagaman Pengetahuan apa yang kita peroleh? Kelompok data II memiliki data lebih beragam dengan range yang lebar. Tetapi karena ukuran yang diambil nilai min dan max maka kurang terlihat juga keberagaman data nya 52

Data mining-deskripsi keberagaman Contoh 2: memodifikasi contoh 1 Data I 6, 15, 15, 16, 16, 16, 25 Data II 0, 1, 3, 7, 7, 12,19 Meski range nya sama, data I masih relatif lebih seragam/kurang beragam dibanding data II 53

Data mining-deskripsi keberagaman 2. Varians dan standar deviasi Range tidak dapat dijadikan pijakan yang kokoh untuk menilai keberagaman data. Oleh karena itu ukuran varians yang menggunakan prinsip pencarian jarak antara setiap data dengan pusatnya (mean) sering digunakan. 54

Data mining-deskripsi keberagaman Setiap data observasi dikurangi dengan rata-rata seluruh data. Setiap hasl pengurangan dikuadratkan kemudian semuanya dijumlahkan. Hasil penjumlahan dibagi dengan (n-1), dengan n menyatakan banyaknya data. 55

Data mining-deskripsi keberagaman Bila data I dan II di olah dengan varians dan standar deviasi maka (Data ke n mean) 2 Jumlah (Data ke n mean) 2 /banyaknya data 56

Data mining-deskripsi keberagaman Berdasarkan varians nya Pengetahuan apa yang diperoleh? Data pada kelompok II berjarak relatif lebih jauh dengan pusatnya (dalam hal ini rata-ratanya) sehingga variansinya lebih besar. Dengan kata lain data pada kelompok II lebih beragam dibanding data I 57

Data mining-deskripsi keberagaman Standar deviasinya adalah 5.5 dan 6.7 Pengetahuan apakah yang bisa digali? Data pada kelompok II lebih beragam dibanding kelompok I. 58

penutup Kegunaan fungsi deskripsi Berbagai cara menjalankan fungsi deskripsi Ukuran yang digunakan dalam caracara deskripsi Ilmu yang digunakan dalam data mining 59

Pertanyaan? 60

Latihan Berikut adalah catatan temperatur tertinggi tiap jam dalam sebuah lemari pendingin: 4.2; 4.7; 4.7; 5.0; 3.8; 3.6; 3.0; 5.1; 3.1; 3.8; 4.8; 4.0; 5.2; 4.3; 2.8; 2.0; 2.8; 3.3; 4.8 dan 5.0 Gambar dan interpretasikan dengan histogram Hitung mean, median, modus Hitung range, varians dan standar deviasi nya 61

62

catatan Dalam ilmu statistik standar deviasi digunakan untuk membandingkan penyebaran atau penyimpangan data dua kelompok atau lebih. Apabila standar deviasi suatu data tersebut kecil maka hal tersebut menunjukkan data-data tersebut berkumpul disekitar rata-rata hitungnya, dan jika standar deviasinya besar hal tersebut menunjukkan penyebaran yang besar dari nilai rata-rata hitungnya. Salah satu penerapan standar deviasi ini misalnya dalam bidang ekonomi. Standar deviasi dapat digunakan untuk menghitung perbandingan pertumbuhan ekonomi suatu negara, misalnya mengukur pertumbungan ekonomi negara-negara ASEAN. Dalam kurun waktu lima tahun terakhir misalnya, standar deviasi pertumbuhan ekonomi Negara Singapura adalah 0.55, Malaysia sebesar 0.87, Indonesia sebesar 1.03, dan Thailand sebesar 1.01. Dari hasil penghitungan tersebut dapat diketahui dan dianalisis mengenai pertumbuhan ekonomi Indonesia yang memiliki standar deviasi lebih besar dibanding 3 Negara ASEAN lainnya, hal ini mengindikasikan pertumbuhan ekonomi Indonesia yang lebih fluktuatif dan ketidakmenentuan dibandingkan 3 negara laiinya. 63

64

65

66