4.1. Pengumpulan data Data trafik jaringan yang diunduh dari http://www.cacti.mipa.uns.ac.id:90 dapat diklasifikasikan berdasar download rata-rata, download maksimum, download minimum, upload rata-rata, upload maksimum, dan upload minimum. Pengelompokan data trafik harian yang didapatkankan dengan empat periode waktu, yaitu a. malam (00.01-06.00), b. pagi (06.01-12.00), c. siang (12.01-18.00), d. sore (18-01-24.00) Dengan lima kondisi masa beban trafik pada : libur lebaran, libur, awal kuliah, kuliah, dan krs. Data selengkapnya dapat dilihat pada lampiran 1. Missing data pada trafik harian diganti dengan metode mean imputation atau rata-rata dari masing-masing pengelompokan data yaitu Yt-12, Yt-8, Yt-4 dan Yt sebelum masuk pada langkah selanjutnya. Contohnya proses mean imputation dengan menggunakan minitab16 ditunjukan pada gambar 4.1 berikut, dan hasil mean imputation selengkapnya ditunjukan pada lampiran 2. Gambar 4.1. Contoh Penggunaan Minitab untuk Mean imputation 21
22 4.2. Pengelompokan Data Variabel input yang dipertimbangkan dalam model meliputi Yt-12, Yt-8, Yt- 4, jam, hari, dan masa. Untuk menentukan variabel dependen pada jaringan saraf tiruan menggunakan metode best subset regression. Contoh penggunaan Minitab untuk best subset regression ditunjukkan pada gambar 4.2 dan hasil perhitungan ditunjukkan dalam gambar 4.2 sedangkan hasil selengkapnya disajikan dalam tabel 4.1. Gambar 4.2. Contoh penggunaan Minitab untuk best subset regression pada download average Hasil perhitungan best subset regression yang disajikan pada gambar 4.3 yang menunjukkan hasil terbaik adalah baris yang diberi highlight hitam dengan nilai Cp Mallows dan S minimum, dan nilai R-Sq dan R-Sq(adj) maksimum dengan Yt-4, jam, hari, dan masa. Maka, Yt-4, jam, hari, dan masa dapat diambil untuk pemodelan input dari jaringan saraf tiruan untuk download average. Perhitungan best subset regression selengkapnya disajikan pada lampiran 3.
23 Gambar 4. 3. Contoh Hasil Best subset Regression dari Download Average Tabel 4.1 adalah model dari layer input yang dihasilkan untuk arsitektur jaringan backpropagation. Tabel 4.1. Variabel input hasil dari best subset No Data Variabel Input 1 Download average Yt-4, jam, hari, masa 2 Download maximum Yt-4, jam, hari, masa 3 Download minimum Yt-12, Yt-4, jam, hari, masa 4 Upload average Yt-4, jam, hari, masa 5 Upload maximum Yt-4, jam, hari, masa 6 Upload minimum Yt-12, jam, hari, masa Struktur data input jaringan berdasarkan model best subset regression memiliki jumlah neuron lapisan input yang berbeda pada setiap data trafik, karena neuron input mengacu pada banyaknya variabel yang mempengaruhi data trafik saat itu.
24 4.3. Peramalan Pelatihan yang dilakukan pada pada penelitian ini disesuaikan pada arsitektur yang telah ditentukan pada langkah sebelumnya, dengan pemodelan input yang sudah dihasilkan dengan metode best subset. Seperti contohnya arsitektur model jaringan saraf tiruan yang digunakan pada download average ditunjukkan dalam gambar 4.4. Gambar 4.4. Arsitektur Jaringan Penggunaan Bandwidth pada Download Average Sebelum jaringan dibangun terlebih dahulu dilakukan preprosesing untuk melakukan normalisasi menggunakan mean dan deviasi standar. Normalisasi data atau preprocessing bertujuan untuk menskalakan harga input dan target supaya masuk dalam suatu range tertentu, yakni membawa data ke bentuk normal dengan mean = 0 dan deviasi standar = 1 melalui fungsi prestd. Tujuan utamanya adalah mensikronisasikan data dan memudahkan dalam komputasi. Sedangkan hasil dari proses normalisasi adalah sekumpulan bilangan yang berkisar antara 0 dan 1. Sehingga perlu untuk membawa output jaringan tersebut sesuai dengan kondisi aslinya. Untuk itu, perlu juga digunakan fungsi poststd setelah dilakukan simulasi pada jaringan saraf.
25 Tampilan awal aplikasi ditunjukkan gambar 4.5 yang dibuat menggunakan Matlab dengan script lengkap pada lampiran 4. Gambar 4.5. Tampilan aplikasi pelatihan jaringan saraf tiruan backpropagation Data input dan target output yang digunakan dalam pelatihan jaringan saraf tiruan didapat dari hasil pencarian berupa string berekstensi.txt yang ditunjukkan pada gambar 4.6. Parameter yang digunakan dalam peramalan ini adalah maksimum epoch = 1000, goal atau target error = 0.001,momentum = 0.8, learning rate 0.5. Parameter learning rate merupakan laju pemahaman yang menentukan kecepatan iterasi. Semakin besar learning rate, semakin sedikit iterasi yang dipakai. Akan tetapi jika learning rate terlalu besar, maka akan merusak pola yang sudah benar sehingga pemahaman menjadi lambat, maka diambil nilai tengah antara 0 dan 1, yaitu 0.5. Data learning digunakan untuk menunjukkan banyaknya data untuk pelatihan yaitu 220, sedangkan data training digunakan untuk menunjukkan keseluruhan data atau
26 akhir data, yaitu 332. Tombol radio button dimaksudkan untuk mempermudah pemilihan arsitektur yang disediakan. Gambar 4.6. Tampilan fungsi pencarian pada aplikasi Setelah inisialisasi parameter pelatihan diset, maka dilakukan pelatihan pembelajaran pola oleh jaringan saraf tiruan backpropagation. Dari perintah pembelajaran yang dilakukan jaringan saraf tiruan backpropagation tersebut, didapat hasil pelatihan yang ditunjukkan pada gambar 4.7. Hasil simulasi proses pelatihan menghasilkan informasi mengenai target input, output jaringan dan selisih antara error target dan output jaringan. Seperti contoh berikut hasil simulasi proses pelatihan pada download average yang selengkapnya disajikan pada lampiran 5. 1 0.02 1.34-1.32 2 0.58 1.37-0.79
27 3 0.51 1.45-0.94 4 0.43 1.34-0.91 Dengan nilai error terkecil 0.02 pada data ke-168 dan nilai error terbesar 5.33 pada data ke-75. Gambar 4.7. Grafik hasil evaluasi data pelatihan pada download average Berdasarkan proses pelatihan pada gambar 4.7 didapat informasi hasil pelatihan: gradient garis terbaik(m1) = 0.8249, titik potong dengan sumbu Y (a1) = 0.7734, dan koefisien korelasi 0.9952. Hasil koefisien korelasi pada proses pelatihan selengkapnya ditunjukkan pada tabel 4.2. Grafik perbandingan antara target dengan output jaringan pada proses pelatihan disajikan pada gambar 4.8. Setelah bobot optimum dicapai, dilakukan simulasi untuk peramalan data uji yang telah ditransformasikan, maka didapat grafik hasil evaluasi data peramalan pada download average yang ditunjukkan pada gambar 4.9. Hasil simulasi proses peramalan menghasilkan informasi mengenai target input, output jaringan dan selisih antara error target dan output jaringan. Seperti
28 contoh berikut hasil simulasi proses peramalan pada download average yang selengkapnya disajikan pada lampiran 6. 1 0.02 1.34-1.32 2 0.58 1.37-0.79 3 0.51 1.45-0.94 4 0.43 1.34-0.91 5 0.27 1.34-1.07 6 0.20 1.34-1.14 7 0.81 1.35-0.54 8 0.78 1.34-0.56 Dengan nilai error terkecil 0.02 pada data ke-88 dan nilai error terbesar 9.02 pada data ke-38. Gambar 4.8. Grafik perbandingan target dan output jaringan pada data pelatihan download average
29 Pada gambar 4.8 diatas menunjukkan hasil perbandingan antara target dengan output jaringan pada data pelatihan, output jaringan disimbolkan dengan tanda (o) dan target (*) sebagian sudah berdekatan. Hasil terbaik terjadi apabila posisi (o) dan (*) betul-betul berada pada posisi yang sama. Gambar 4.9. Grafik hasil evaluasi data uji pada download average Berdasarkan proses pelatihan pada gambar 4.9 didapat informasi hasil pelatihan: gradient garis terbaik(m1) = 0.6763, titik potong dengan sumbu Y (a1) = 1.2081, dan koefisien korelasi 0.70589. Hasil koefisien korelasi pada proses pelatihan selengkapnya ditunjukkan pada tabel 4.3. Grafik perbandingan antara target dengan output jaringan pada proses pelatihan disajikan pada gambar 4.10. Output jaringan disimbolkan dengan tanda (o) dan target (*) sebagian sudah berdekatan. Hasil terbaik terjadi apabila posisi (o) dan (*) betul-betul berada pada posisi yang sama.
30 Gambar 4.10. Grafik perbandingan target dan output jaringan pada data uji download average 4.4. Evaluasi Hasil Berikut tabel 4.2 yang menunjukkan nilai koefisien korelasi pada proses pelatihan yang dilakukan terhadap 220 data latih: Tabel 4.2. Nilai koefisien korelasi hasil pelatihan jaringan backpropagation No Data Persamaan Nilai r 1 Download average Y=(0.82)T+0.77 0.91 ** 2 Download maximum Y=(0.82)T+1.4 0.91 ** 3 Download minimum Y=(0.55)T+0.48 0.74 ** 4 Upload average Y=(0.48)T+0.73 0.70 ** 5 Upload maximum Y=(0.39)T+1.4 0.63 ** 6 Upload minimum Y=(0.26)T+0.63 0.52 **
31 Hasil pelatihan jaringan saraf backpropagation terhadap 220 data output jaringan dengan target memiliki nilai korelasi yang sangat kuat pada download average dengan persamaan Y=(0.82)T+0.77 dan nilai r = 0.91, download maximum dengan persamaan Y=(0.82)T+1.4 dan nilai r = 0.91, sedangkan nilai korelasi kuat pada download minimum dengan persamaan Y=(0.55)T+0.48 dan nilai r = 0.74, Upload average dengan persamaan Y=(0.48)T+0.73 dan nilai r = 0.70, upload maximum dengan persamaan Y=(0.39)T+1.4 dan nilai r = 0.63, dan pada upload minimum dengan persamaan Y=(0.26)T+0.63 dengan nilai r=0.52. Nilai r tertinggi pada download average dan download maximum dengan nilai koefisien korelasi 0.91, hal ini akan mempengaruhi hasil peramalan dengan nilai r yang tinggi. Sedangkan nilai r terendah adalah upload minimum dengan nilai koefisien korelasi 0.63 yang menyebabkan nilai koefisien korelasi semakin kecil pada peramalan. Tabel 4.3. Nilai koefisien korelasi dari data uji jaringan backpropagation No Data Nilai r 1 Download average 0.71 ** 2 Download maximum 0.61 ** 3 Download minimum 0.59 ** 4 Upload average 0.32 ** 5 Upload maximum 0.35 ** 6 Upload minimum 0.31 ** Hasil pengujian terhadap 120 data menunjukkan semua signifikan pada output jaringan dengan target memiliki nilai korelasi yang kuat pada download average dengan nilai r 0.71, download maximum dengan nilai r 0.61, download minimum dengan nilai r 0.59,, sedangkan nilai korelasi cukup pada upload average dengan nilai r 0.32, Upload maximum dengan nilai r 0.35, upload minimum dengan nilai r 0.31
32 Nilai r tertinggi pada pengujian adalah pada download average dengan nilai r 0.71, hal ini dikarenakan nilai r pada pelatihan sudah tinggi, dengan nilai 0.91. Sedangkan nilai r terkecil adalah upload minimum dengan nilai r 0.31, yang disebabkan oleh kecocokan persamaan target dengan output hanya 0.52 pada pembelajaran.