Universitas Gadjah Mada Fakultas Teknik Departemen Teknik Sipil dan Lingkungan ANALISIS FREKUENSI Statistika dan Probabilitas
2 Regresi Linear Tabel data x i y i = f(x i ) 1 0.5 2 2.5 3 2 4 4 5 3.5 6 6 7 5.5 Hubungan antara variabel pertama, x, dengan variabel kedua, y, yang merupakan fungsi variabel pertama, y = f(x). y = f(x) Grafik/kurva data 8 6 4 2 0 0 1 2 3 4 5 6 7 X
3 Regresi Linear Y 7 6 5 4 3 2 1 0 Kurva regresi merepresentasikan pola hubungan (tren, perilaku) variabel y terhadap x. 0 1 2 3 4 5 6 7 8 X data regresi
4 Sebaran Data Situasi Bagaimana kalau kita ingin mengetahui perilaku salah satu variabel itu sendiri? Misalnya: ingin mempelajari pola sebaran data X (X tentu saja adalah variabel random) Berilah contoh data X di bidang teknik sipil dan lingkungan.
5 Temperatur Udara Harian Maksimum Tahun Temperatur [ C] Tahun Temperatur [ C] Tahun Temperatur [ C] Tahun Temperatur [ C] 1971 31.8 1981 30.7 1991 30.1 2001 32.1 1972 32.9 1982 32.3 1992 31.1 2002 29.1 1973 32.7 1983 31.8 1993 31.9 2003 31.5 1974 30.7 1984 32.8 1994 33.9 2004 32.4 1975 30.4 1985 31.9 1995 31.9 2005 30.7 1976 29.0 1986 31.4 1996 30.3 2006 29.9 1977 31.5 1987 31.1 1997 29.7 2007 33.8 1978 32.6 1988 30.7 1998 33.8 2008 30.0 1979 32.0 1989 32.7 1999 34.1 2009 33.9 1980 30.2 1990 31.4 2000 30.4 2010 29.6
Temperatur Udara Harian Maksimum 6 35 34 Temperatur [oc] 33 32 31 30 29 28 1971 1974 1977 1980 1983 1986 1989 1992 1995 1998 2001 2004 2007 2010 Tahun
7 Temperatur Udara Harian Maksimum Pertanyaan Apa nama instrumen untuk mengukur temperatur udara? Dapatkah kalian menceritakan cara data tersebut diperoleh? Dapatkah kalian mendeskripsikan data tersebut secara statistis? Bandingkan presentasi data dalam bentuk tabel dan grafik; yang manakah yang lebih baik?
Distribusi Normal 8 N(μ,σ 2 ) p X (x) pdf (probability density function) p X ( x) = ( 2πσ 2 ) 1 2 e 1 2( x µ ) σ 2 + luas = p X ( x)dx =1 μ 3σ μ 2σ μ σ μ+σ μ+2σ μ+3σ μ + X
9 Distribusi Normal Jika X berdistribusi normal, N(µ,σ 2 ), maka prob(x x) dapat dicari dengan: x 1 2 2 1 ( t µ ) ( X x) = PX ( x) = px ( t) dt = ( 2πσ ) e prob 2 x σ 2 dt luas di bawah kurva pdf (dari s.d. x) à cdf cdf (cumulative distribution function) x +
pdf - cdf 10 p X (x) cdf P X (x) 1 pdf µ 0 +
Distribusi Normal Standar 11 p X (x) cdf P X (x) 1 Z X = X µ σ pdf 0 μ 3σ μ 2σ μ σ μ μ+σ μ+2σ μ+3σ + X 3 2 1 0 1 2 3 + Z
12 Tabel Frekuensi Rentang temperatur [ C] Temperatur [ C] frek frek rel 28 29 28.5 1 0.025 29 30 29.5 5 0.125 30 31 30.5 9 0.225 31 32 31.5 12 0.300 32 33 32.5 8 0.200 33 34 33.5 4 0.100 34 35 34.5 1 0.025 Jumlah 40 1 Temperatur udara harian maksimum tahunan minimum 29.0 C maksimum 34.1 C rerata 31.5 C simp. baku 1.4 C nilai median rentang temperatur jika memakai MSExcel, gunakan fungsi =FREQUENCY(, ) control+shift+enter
Histogram Frekuensi 13 0.35 0.3 Frekuensi relatif 0.25 0.2 0.15 0.1 0.05 0 28-29 29-30 30-31 31-32 32-33 33-34 34-35 Temperatur [ C]
Histogram Frekuensi 14 0.35 0.3 Frekuensi relatif 0.25 0.2 0.15 0.1 0.05 0 28-29 29-30 30-31 31-32 32-33 33-34 34-35 Temperatur [ C]
15 Pengamatan vs Teoretik Ekspektasi frek. relatif (frek. relatif teoretis menurut distribusi normal) klas ke-2: temperatur 29 30 C frek. relatif (dist. normal) 2 ( ) = 2πs T f T t = 29.5 30 29 ( ) 1 2 e 1 2 t T 30 ( ) ( ) 2 s T 2 dt = 2 π 1.4 2 30 31.5 = F T ( 30) F T ( 29) = F Z ' % & 1.4 ( ) F Z ( 1.7857) = F Z 1.0714 = 0.1420 0.0371 = 0.1049 29 1 2 e ( % 29 31.5( * F Z ' * ) & 1.4 ) 1 2( t 32.1) 2 1.4 2 dt baca di tabel distribusi normal standar
16 Frekuensi Teoretik (Distribusi Normal) Temperatur [ C] z F Z (z) frek rel 28 29 28.5-2.5000-1.7857 0.0062 0.0371 0.0309 29 30 29.5-1.7857-1.0714 0.0371 0.1420 0.1049 30 31 30.5-1.0714-0.3571 0.1420 0.3605 0.2185 31 32 31.5-0.3571 0.3571 0.3605 0.6395 0.2790 32 33 32.5 0.3571 1.0714 0.6395 0.8580 0.2185 33 34 33.5 1.0714 1.7857 0.8580 0.9629 0.1049 34 35 34.5 1.7857 2.5000 0.9629 0.9938 0.0309
17 Pengamatan vs Teoretik Cara lain untuk memperkirakan frekuensi relatif dalam suatu interval klas f T p T ( t i ) = Δt i p T ( t i ) ( t i ) = p Z ( z i ) dz dt = p Z z i ( ) s T
18 Pengamatan vs Teoretik Cara lain (lanjutan ) i = 2 : Δt i =1 C t i = 29.5 z i = 29.5 31.5 = 1.4286 1.4 p Z ( z i ) = p Z 1.4286 p T f T ( ) = 0.1480 ( t i ) = p z Z ( i ) $ ' & ( t i ) = s T p T t i = 0.1480 ) = 0.1027 s T % 1.4 ( ( ) =1 0.1027 = 0.1027 baca di tabel distribusi normal standar frek. relatif teoretis (distribusi normal)
19 Frekuensi Teoretik (Distribusi Normal) Temperatur [ C] z p z (z) p T (t) frek rel 28 29 28.5-2.1429 0.0402 0.0287 0.0287 29 30 29.5-1.4286 0.1438 0.1027 0.1027 30 31 30.5-0.7143 0.3091 0.2208 0.2208 31 32 31.5 0.0000 0.3989 0.2850 0.2850 32 33 32.5 0.7143 0.3091 0.2208 0.2208 33 34 33.5 1.4286 0.1438 0.1027 0.1027 34 35 34.5 2.1429 0.0402 0.0287 0.0287
Kurva Pengamatan vs Kurva PDF Teoretis 20 0.35 0.3 PDF Distribusi Normal Frekuensi relatif 0.25 0.2 0.15 0.1 0.05 0 Kurva data 28-29 29-30 30-31 31-32 32-33 33-34 34-35 Temperatur [ C]
21 Frekuensi Kumulatif Pengamatan vs Teoretis Temperatur [ C] Pengamatan Distribusi Normal frek rel frek rel kum frek rel frek rel kum 28 29 28.5 0.025 0.025 0.0287 0.0287 29 30 29.5 0.125 0.15 0.1027 0.1314 30 31 30.5 0.225 0.375 0.2208 0.3522 31 32 31.5 0.3 0.675 0.2850 0.6372 32 33 32.5 0.2 0.875 0.2208 0.8580 33 34 33.5 0.1 0.975 0.1027 0.9607 34 35 34.5 0.025 1 0.0287 0.9894
Kurva Pengamatan vs Kurva CDF Teoretis 22 1.2 Frekuensi relatif 1 0.8 0.6 0.4 0.2 0 CDF Distribusi Normal 28-29 29-30 30-31 31-32 32-33 33-34 34-35 Temperatur [ C]
23 Kurva CDF pada Kertas Khusus Kurva CDF Berupa garis lengkung. Ada satu cara tertentu yang memungkinkan kurva CDF berupa garis lurus, yaitu dengan melakukan transformasi koordinat. n Ordinat: magnitud data. n Skala biasa. n Absis: probabilitas, P X (x) atau kadang dituliskan pula dengan notasi prob(x < x). n Skala dibuat sedemikian hingga kurva CDF distribusi normal berupa garis lurus. Pada tempo doeloe, kertas grafik seperti di atas dibuat dulu à priori sebelum pemplotan data. n Kertas grafik seperti itu dikenal dengan nama kertas probabilitas. n Pemplotan (penggambaran) data dilakukan pada kertas probabilitas tersebut. Pada saat ini, langkah automatisasi dengan program aplikasi komputer dapat dilakukan sehingga kertas probabilitas dibuat bersama-sama dengan pemplotan data.
Kertas probabilitas distribusi normal Untuk memplotkan data pengamatan dan kurva CDF teoretis Dapat diunduh dari / prob(x > x) atau 1 P X (x) ordinat adalah magnitud data (skalar) absis adalah probabilitas, prob(x < x) atau P X (x) à frekuensi relatif kumulatif skala dibuat sedemikian hingga CDF berupa garis lurus 24
Plot Data pada Kertas Probabilitas 25 Data temperatur udara harian maksimum diplotkan pada kertas probabilitas. Urutkan data dari kecil ke besar, m = 1, 2,, n m adalah nomor urut data, n adalah jumlah data. Posisi titik data pada kertas probabilitas adalah: n absis: m/(n+1), n ordinat: magnitud data. Cara penempatan titik data tersebut adalah cara Weibul. Ada beberapa cara yang lain, yang akan dikenalkan pada kuliah Hidrologi.
26 Temperatur Udara Harian Maksimum (Data Urut) m m/(n+1) [%] Temperatur [ C] m m/(n+1) [%] Temperatur [ C] m m/(n+1) [%] Temperatur [ C] m m/(n+1) [%] Temperatur [ C] 1 2.44 29.0 11 26.83 30.4 21 51.22 31.5 31 75.61 32.6 2 4.88 29.1 12 29.27 30.7 22 53.66 31.8 32 78.05 32.7 3 7.32 29.6 13 31.71 30.7 23 56.10 31.8 33 80.49 32.7 4 9.76 29.7 14 34.15 30.7 24 58.54 31.9 34 82.93 32.8 5 12.20 29.9 15 36.59 30.7 25 60.98 31.9 35 85.37 32.9 6 14.63 30.0 16 39.02 31.1 26 63.41 31.9 36 87.80 33.8 7 17.07 30.1 17 41.46 31.1 27 65.85 32.0 37 90.24 33.8 8 19.51 30.2 18 43.90 31.4 28 68.29 32.1 38 92.68 33.9 9 21.95 30.3 19 46.34 31.4 29 70.73 32.3 39 95.12 33.9 10 24.39 30.4 20 48.78 31.5 30 73.17 32.4 40 97.56 34.1
27 Plot Data pada Kertas Probabilitas Data temperatur udara harian maksimum adalah time series data, data runtut waktu. Memperhatikan prosedur pemplotan data temperatur udara harian maksimum, yaitu data diurutkan, maka: diartikan bahwa data adalah seri data independent sehingga urut data terhadap waktu boleh tidak diperhatikan, data diurutkan dari kecil ke besar dan percentile rank setiap titik data dianggap merupakan nilai pendekatan probabilitas, prob(t < t). Arti notasi prob(t < t) = a probabilitas temperatur udara kurang daripada t C adalah a contoh: prob(t < 32 C) = 0.64
28
29 Plot Data pada Kertas Probabilitas Kurva CDF distribusi normal (kurva cdf teoretis) Dapat dengan mudah digambarkan pada kertas probabilitas Langkah n Tetapkan dua titik data, misal pada temperatur 29 C dan 34 C n n Hitung prob(t < 29 C) dan prob(t < 34 C) dengan menggunakan tabel distribusi normal standar 29 31.5 ( ) = P Z $ P T 29 P T 34 " # " $ # 1.4 ( ) = P Z 34 31.5 1.4 % ' = P Z 1.7857 & % ' = P Z 1.7857 & ( ) = 0.0371= 3.71% ( ) = 0.9629 = 96.29% Tarik garis lurus yang melewati titik (3.71%,29 C) dan (96.29%,34 C)
30
31 Uji Kesesuaian Sebaran Data terhadap Distribusi Normal Dengan mencermati plot data temperatur dan garis CDF distribusi normal, tampak bahwa sebaran data temperatur tersebut mendekati CDF distribusi normal. Artinya, data temperatur udara harian maksimum tahunan tersebut berdistribusi normal. Kesesuaian antara sebaran data dengan CDF distribusi normal perlu diuji Dikenal dengan istilah best fit test. Jenis uji, yang lazim dilakukan di bidang hidrologi, adalah uji Smirnov-Kolmogorov dan uji chi-kuadrat. Kedua jenis cara menguji kesesuaian tersebut akan dibahas pada kuliah Hidrologi. Pada kuliah Hidrologi, akan dikenalkan pula beberapa jenis distribusi teoretis selain distribusi normal.
32 Tugas/PR Rapikan hitungan dan plot data temperatur udara harian maksimum tahunan tersebut. Unduh data debit aliran dari weblog saya dan lakukan analisis frekuensi dengan langkah kerja seperti yang telah dibahas pada kuliah ini. /index.php/kuliah/kuliah-sarjana-s1/statistika-danprobabilitas/ Nama fail: Data debit puncak Sungai XYZ.xlsx Tugas/PR dikumpulkan di ruang saya atau di Sekretariat MTPBA. Saran Selain menghitung dan menyajikan data, berilah deskripsi tentang data dan interpretasi Saudara tentang data tersebut.
33 Debit Puncak Tahunan Sungai XYZ Tahun ke- Debit (m 3 /s) Tahun ke- Debit (m 3 /s) Tahun ke- Debit (m 3 /s) Tahun ke- Debit (m 3 /s) Tahun ke- Debit (m 3 /s) Tahun ke- Debit (m 3 /s) 1 473 12 470 23 1110 34 687 45 843 56 871 2 544 13 663 24 717 35 801 46 450 57 705 3 872 14 809 25 961 36 323 47 284 58 777 4 657 15 800 26 925 37 431 48 460 59 442 5 915 16 523 27 341 38 770 49 804 60 206 6 535 17 580 28 690 39 536 50 550 61 850 7 678 18 672 29 734 40 708 51 729 62 829 8 700 19 115 30 991 41 894 52 712 63 887 9 669 20 461 31 792 42 626 53 468 64 602 10 347 21 524 32 626 43 1120 54 841 65 403 11 580 22 943 33 937 44 440 55 613 66 505 Data debit di atas berasal dari data debit rerata harian selama 66 tahun, yang kemudian dicuplik nilai maksimum pada setiap tahun.
34 Debit Puncak Tahunan Sungai XYZ 1200 1000 Debit [m 3 /s] 800 600 400 200 0 0 10 20 30 40 50 60 70 Tahun ke-
35