digilib.uns.ac.id BAB III METODOLOGI PENELITIAN 3.1 Studi Literatur Studi ini dilakukan dengan cara mencari dan membaca berbagai literatur serta karya-karya penelitian mengenai topik penelitian yang sudah dibuat sebelumnya dan data-data yang berhubungan dengan penelitian ini. Literatur pendukung ini berupa jurnal, paper, makalah, artikel, buku, atau sumber lainnya yang membahas mengenai algoritma LM dan dalam proses pelatihan jaringan syaraf tiruan, serta jaringan syaraf tiruan secara umum. 3.2 Dataset Pada tahap ini dilakukan pengumpulan data tahunan untuk prediksi jumlah pengangguran di provinsi Jawa Tengah, dimana variabel yang digunakan sebagai data masukan yakni data dari tahun 1996 sampai 2011, dan data target berupa data jumlah pengangguran dari tahun 2009 sampai 2012. Data masukan terdiri dari data tahun 1996-2011, penduduk menurut kelompok umur dan jenis kelamin, data historis Tingkat Partisipasi Angkatan Kerja (TPAK) menurut kelompok umur, angkatan kerja, tingkat pengangguran terbuka, penduduk yang bekerja menurut lapangan usaha, Produk Dasar Regional Bruto (PDRB) atas dasar harga konstan 2000 menurut lapangan usaha, dan data historis penduduk usia 15 tahun keatas, status, pendidikan dan pekerjaan, jumlah tamatan SMA sederajat di tahun yang bersangkutan dan inflasi. Data diperoleh dari Badan Pusat Statistik Provinsi Jawa Tengah. Kemudian data dibagi menjadi 2 bagian, data yang digunakan untuk proses pelatihan yakni data dari tahun 1996-2007, dengan data target jumlah pengangguran dari tahun 1997 sampai tahun 2008. Data yang digunakan untuk proses pengujian yakni data dari tahun 2008-2011, dengan data target jumlah pengangguran dari tahun 2009 sampai tahun 2012. Sebelum digunakan, data dinormalisasi dengan normalisasi min-max. 21
digilib.uns.ac.id 22 3.3 Analisa dan Perancangan 3.3.1 Proses Normalisasi Proses normalisasi data dilakukan sebelum data dibagi menjadi data training dan data testing. Normalisasi menggunakan normalisasi min-max agar didapat data dengan nilai antara 0 sampai 1. Proses normalisasi dilakukan untuk tiap variabel. 3.3.2 Arsitektur Jaringan Syaraf Tiruan Dalam penelitian ini, arsitektur JST terdiri dari tiga layer, yakni 1 input layer, 1 hidden layer, dan 1 output layer. Jumlah neuron pada input layer tergantung pada jumlah variabel yang akan diinputkan pada jaringan. Sehingga dalam penelitian ini, jumlah neuron pada input layer sebanyak 10 neuron sesuai dengan jumlah variabel yang akan digunakan dalam penelitian ini. Untuk hidden layer terdiri dari 6 neuron (Paulin. et al., 2010) dan output layer terdiri dari 1 neuron. Input layer Hidden layer Output layer V W k W0 j i V0 Gambar 3. 1 Model JST
digilib.uns.ac.id 23 3.3.3 Proses Pelatihan Pada proses pelatihan, data training dilatih dengan berbagai variasi parameter JST yang berbeda-beda untuk menentukan variasi parameter JST yang paling optimal sehingga menghasilkan Mean Squared error (MSE) konvergen dengan jumlah iterasi yang diperlukan paling sedikit diantara variasi parameter yang lain. Variasi parameter berupa nilai learning rate untuk algoritma. Semakin besar nilai learning rate akan berimplikasi pada semakin besarnya langkah pembelajaran, jika learning rate diset terlalu besar, maka algoritma akan menjadi tidak stabil. Sebaliknya, jika learning rate diset terlalu kecil, maka algoritma akan konvergen dalam jangka waktu yang sangat lama (Kusumadewi, 2004). Untuk algoritma LM, variasi berupa nilai faktor beta, dengan nilai parameter LM untuk setiap variasi diberi nilai 0.1. Apabila nilai parameter LM bernilai 0, maka pendekatan ini sama seperti metode Newton. Namun apabila nilai parameter LM terlalu besar, maka pendekatan ini akan sama halnya dengan gradient descent dengan nilai learning rate yang sangat kecil (Kusumadewi, 2004). Untuk itu setelah beberapa iterasi, algoritma akan menurunkan atau menaikkan nilai parameter LM untuk mendapatkan hasil yang lebih baik dengan menggunakan nilai faktor beta. Variasi parameter JST dapat dilihat pada tabel 3.1. Selanjutnya data akan dilatih dengan menggunakan algoritma LM dan algoritma. Untuk setiap variasi dilakukan percobaan sebanyak sepuluh kali, untuk melihat nilai Mean Squared Error (MSE) dan jumlah iterasi yang diperlukan untuk mencapai konvergen pada setiap algoritma. MSE adalah metode alternative untuk mengevaluasi teknik peramalan masing-masing kesalahan (selisih data target terhadap data peramalan) dikuadratkan, kemudian dijumlahkan dan dibagi dengan jumlah data. MSE dihitung dengan rumus (Pramita. et al., 2010) : (3.1)
digilib.uns.ac.id 24 Tabel 3. 1 Variasi Parameter No Jenis Variasi Keterangan 1 Variasi Algoritma 1. LM 2. 2 Variasi learning rate untuk 3 Variasi nilai faktor beta untuk LM 0.1 0.01 0.001 2.5 5 7.5 10 4 Nilai parameter LM 0.1 3.3.4 Analisa Hasil Pelatihan Hasil yang diperoleh pada proses pelatihan berupa rata-rata jumlah iterasi yang dibutuhkan setiap variasi dari masing-masing algoritma untuk mencapai nilai MSE. Rata-rata jumlah iterasi ini yang nantinya akan dijadikan tolok ukur perbandingan kecepatan konvergensi setiap variasi dari masing-masing algoritma. Semakin banyak jumlah iterasi yang dibutuhkan, semakin lama kecepatan konvergensinya. Berikut ini adalah flowchart proses pelatihan dan evaluasi pelatihan dalam prediksi pengangguran di Jawa Tengah : Mulai Data Pengangguran dan variabel yang mempengaruhinya Normalisasi Min-Max Pelatihan JST menggunakan LM Pelatihan JST mennggunakan pelatihan manggunakan LM pelatihan manggunakan Selesai Gambar 3. 2 commit Flowchart to user Proses Pelatihan
digilib.uns.ac.id 25 3.3.5 Proses Pengujian Dalam proses pengujian, data testing diuji dengan parameter yang sama saat proses pelatihan. Dari hasil pengujian didapatkan output yang kemudian dilakukan denormalisasi untuk setiap output yang dihasilkan. Hasil denormalisasi berupa nilai prediksi jumlah pengangguran di Jawa Tengah dari tahun 2009 sampai tahun 2012. Hasil prediksi yang dihasilkan digunakan untuk menganalisa kemampuan algoritma LM dan dalam melakukan prediksi jumlah pengangguran. Analisa perbandingan dapat dilihat dengan tolok ukur nilai MAPE dan NMSE yang dihasilkan oleh masing-masing algoritma. Semakin kecil nilai MAPE dan NMSE, maka nilai akurasi algoritma dalam melakukan prediksi semakin baik. Untuk itu pada proses pengujian dilakukan sepuluh kali percobaan dan didapatkan nilai rata-rata dari nilai MAPE dan NMSE. 3.3.6 Analisa Hasil Pengujian Pada tahap ini, dilakukan analisa terhadap perbandingan akurasi algoritma LM dan dalam melakukan prediksi jumlah pengangguran. Tingkat akurasi didapat dari nilai MAPE dan NMSE masing-masing algoritma dalam melakukan prediksi pengangguran pada proses pengujian. Untuk nilai MAPE, semakin kecil nilai MAPE maka peramalan semakin akurat. Apabila nilai MAPE kurang dari 10% maka hasil prediksi dikatakan sangat baik, apabila nilai MAPE antara 10% sampai dengan 20% maka hasil prediksi dikatakan baik (Yasmin. et al., 2010). Untuk NMSE, semakin kecil nilai NMSE maka semakin kecil perbedaan antara nilai asli dengan nilai prediksi. Sebaliknya, semakin besar nilai NMSE maka semakin besar perbedaan antara nilai asli dengan nilai prediksi (Sularno, 2009). Berikut ini adalah flowchart proses pengujian dan evaluasi pengujian dalam prediksi pengangguran di Jawa Tengah :
digilib.uns.ac.id 26 Mulai Data Pengangguran dan variabel yang mempengaruhinya Normalisasi Min-Max Pengujian JST menggunakan LM Pengujian JST mennggunakan Denormalisasi pengujian manggunakan LM pengujian manggunakan Selesai Gambar 3. 3 Flowchart Proses Pengujian