..::Data Mining::.. Prediksi Mata Kuliah Data warehouse Univ. Darma Persada Oleh: Adam Arif Budiman 2012 Data Mining-Prediksi-Adam AB
Prediksi Dalam estimasi kita memperkirakan suatu hal misalnya rata-rata populasi dari sampel. Estimasi dilakukan berdasarkan sampel yang ada di tangan kita Prediksi? Data Mining-Prediksi-Adam AB 2
Prediksi (lanj) Dalam prediksi kita menggunakan data yang ada di tangan kita untuk memprediksi hasil dari satu hal baru yang akan muncul selanjutnya. Jadi estimasi dilakukan untuk memperkirakan hal yang tidak kita ketahui (rata-rata populasi, varians populasi) Prediksi memperkirakan hasil dari hal yang belum terjadi. Kita dapat menunggu hingga hal tersebut terjadi untuk membuktikan seberapa tepat prediksi kita. Data Mining-Prediksi-Adam AB 3
Prediksi (lanj) Dalam statistika dikenal dua cara untuk memprediksi yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4
Regresi linear Bila diketahui data sbb: Berapa lama waktu yang diperlukan untuk mengantarkan pesanan yang ke 26 dengan jarak sekian kilometer? Data Mining-Prediksi-Adam AB 5
Regresi Linear (lanj) Terdapat dua jenis regresi yaitu: 1. Regresi linear sederhana hanya melibatkan satu variabel pemberi pengaruh 2. Regresi linear berganda melibatkan lebih dari satu variabel pemberi pengaruh Data Mining-Prediksi-Adam AB 6
Regresi (lanj) Variabel: besaran yang berubah nilainya Variabel variabel pemberi pengaruh (sebab) variabel terpengaruh (akibat) Contoh: jarak toko dan waktu tempuh jarak sebagai sebab, waktu yang diperlukan sebagai akibat. Data Mining-Prediksi-Adam AB 7
Regresi Linear Sederhana (lanj) Grafik pada data pada slide 5 bila digambarkan akan seperti di bawah ini. Bagaimana kecenderungan titik di grafik tersebut? jarak vs waktu waktu 80 70 60 50 40 30 20 10 0 0 2 4 6 8 jarak Data Mining-Prediksi-Adam AB 8
Regresi linear sederhana (lanj) jarak vs waktu 80 70 60 waktu 50 40 30 20 10 0 0 2 4 6 8 jarak Data Mining-Prediksi-Adam AB 9
Regresi linear sederhana (lanj) Regresi linear sederhana merupakan yang menggunakan garis lurus untuk menggambarkan hubungan diantara dua variabel atau lebih. Dari kasus ini variabel tersebut adalah jarak dan waktu, dengan jarak sebagai sumbu x (dalam km), waktu sebagai sumbu y (dalam menit) Data Mining-Prediksi-Adam AB 10
Regresi linear sederhana (lanj) Kita mencari garis yang mendekati titik-titik sehingga garis tersebut dapat dijadikan acuan untuk prediksi titik berikutnya Secara umum garis tersebut dapat dituliskan dalam bentuk persamaan garis Y = β 0 + β 1 X Data Mining-Prediksi-Adam AB 11
Regresi linear Sederhana (lanj) Y = variabel terpengaruh β 0 = konstanta β 1 = gradient garis X = variabel pemberi pengaruh Data Mining-Prediksi-Adam AB 12
Regresi linear sederhana (lanj) Bagaimana cara mencari garis regresi yang paling baik? Menghitung konstanta (β 0 ) dan gradient (β 1 ) dengan rumus: jarak vs waktu waktu 80 70 60 50 40 30 20 10 0 0 2 4 6 8 jarak Data Mining-Prediksi-Adam AB 13
Regresi linear sederhana (lanj) Dengan rumus di atas, maka hasil perhitungan pada tabel jarak dan waktu menjadi: Data Mining-Prediksi-Adam AB 14
Regresi linear sederhana (lanj) β 1 = 2745.81- (752.42) (82.94) 25 353.18 - (82.94) 2 25 = 4.35 β 0 = 29.02 4.35 (3.32) = 14.58 Sehingga persamaan regresinya adalah : Y = 14.58 + 4.35x Data Mining-Prediksi-Adam AB 15
Regresi linear sederhana (lanj) Pengetahuan apa yang bisa diperoleh dari pengolahan data di atas? Kita bisa memprediksikan waktu tempuh pengiriman pesanan sama dengan 14.58 menit ditambah 4.35 kali jarak rumah pelanggan Misal, pelanggan ke 26 berjarak 1.5 km maka waktu tempuh adalah Y = 14.58 + (4.35) (1.5) = 21.1 (menit) Data Mining-Prediksi-Adam AB 16
Regresi linear berganda Bagaimana bila variabel masukan/pemberi pengaruh lebih dari satu? k buah variabel Y = β 0+ β 1X 1+ β 2X 2+ + β kx k Bila kita memiliki (k+1) buah persamaan sementara variabel yang tidak kita ketahui juga sebanyak (k+1) maka persamaan di atas bisa menjadi. Data Mining-Prediksi-Adam AB 17
Regresi linear berganda (lanj) Data Mining-Prediksi-Adam AB 18
Regresi linear berganda (lanj) Y = β 0 + β 1 X 1 + β 2 X 2 + + β k X k Bilakitaisikandata padatabeldiatasmaka akan diperoleh persamaan 25β 0 + β 1 (206) + β 2 (82.94) = 725.42 β 0 (206) + β 1 (2396) + β 2 (771.77)= 8001.67 β 0 (82.94) + β 1 (771.77) + β 2 (353.18)= 2745.81 Ketiga persamaan di atas diselesaikan sehingga diperoleh nilaiβ 0 = 2.31, β 1 = 2.74, β 2 = 1.24 Data Mining-Prediksi-Adam AB 19
Regresi linear berganda (lanj) Sehingga persamaan umum model di atas adalah : Y = 2.31 + 2.74X 1 + 1.24X 2 Pengetahuan apa yang bisa diperoleh? Kita bisa memprediksi bahwa bila kita mengantarkan pesanan maka akan diperoleh waktu sama dengan 2.31 menit ditambah 2.74 kali banyaknya lampu merah yang ditemui dan ditambah 1.24 kali jarak rumah pelanggan Data Mining-Prediksi-Adam AB 20
Regresi linear berganda (lanj) Bila jarak rumah pelanggan ke 26 adalah 1.5 dari restoran dan akan melewati lampu merah 1 buah maka waktu hantar adalah 6.91 menit Data Mining-Prediksi-Adam AB 21
Lampiran 1 menyelesai kan persamaan regresi Data Mining-Prediksi-Adam AB 22
Data Mining-Prediksi-Adam AB 23
Data Mining-Prediksi-Adam AB 24
latihan Buatlah persamaan regresi dan simpulkan pengetahuan yang diperoleh Data Mining-Prediksi-Adam AB 25
referensi Data Mining-Prediksi-Adam AB 26