BAB I PENDAHULUAN 1. 1.1. Latar Belakang Machine learning (ML), bagian dari kecerdasan buatan (artificial intelligence), merupakan metode untuk mengoptimalkan performa dari sistem dengan mempelajari data sampel atau data histori (Alpaydin, 2009). Dalam kehidupan sehari-hari, obyek dapat diidentifikasi dengan mudah oleh manusia, namun belum tentu dapat dijelaskan secara spesifik. Di sinilah peran ML dalam mengenali, mengidentifikasi, ataupun memprediksi data tertentu dengan mempelajari data histori (experience data). Dengan ML, model dibuat baik secara langsung ataupun tidak, dengan mengekstrak pengetahuan dari pakar ataupun dari data yang bahkan belum diketahui hubungannya dengan cara mempelajarinya dengan algoritme tertentu. Algoritme merupakan rentetan proses yang terstruktur untuk menyelesaikan permasalahan tertentu. (Cormen, et al., 2009) menjelaskan bahwa algoritme adalah prosedur komputasi yang didefinisikan dengan baik yang mengambil beberapa nilai, atau himpunan nilai-nilai, sebagai masukan dan menghasilkan beberapa nilai, atau himpunan nilai-nilai, sebagai keluaran. Dengan demikian, sebuah algoritme merupakan urutan langkah komputasi yang mengubah masukan menjadi keluaran. Beberapa algoritme memiliki kecepatan waktu learning tersendiri pada permasalahan tertentu sesuai dengan kompleksitas algoritme dan permasalahan itu 1
2 sendiri. Namun, untuk beberapa permasalahan dibutuhkan waktu learning yang sangat cepat seperti halnya vision pada robotika, sistem kontrol dan aplikasi realtime learning lainnya. Dengan demikian, algoritma yang memiliki kecepatan learning yang tinggi dengan performa menggeneralisasi yang baik akan membantu untuk mengatasi permasalahan yang membutuhkan waktu yang sangat cepat (real time). Berbagai algoritme di bidang sistem cerdas (intelligent system) telah dikembangkan dengan pendekatan dan model tertentu. Sebagai contoh, algoritme back propagation (BP) yang diterapkan untuk menghitung bobot-bobot pada feedforward neural network (FFN), salah satu bentuk dari jaringan syaraf tiruan (JST). Contoh yang lain adalah algoritme C4.5 (Quinlan, 1993) dan variannya yang digunakan untuk membangun pohon keputusan (decision tree) berdasarkan teori informasi, dan masih banyak lagi algoritme lainnya. JST merupakan model pemrosesan yang dikembangkan dari hasil kolaborasi antara bidang ilmu biologi dan ilmu komputer yang memiliki kemampuan yang sangat baik untuk menyelesaikan berbagai permasalahan dalam bidang ML. Dengan memodelkan jaringan syaraf seperti yang ada pada makhluk hidup dengan struktur dan aturan perhitungan tertentu, berbagai macam masalah dapat dipecahkan mulai dari yang sederhana sampai yang sangat kompleks. Kemampuannya dalam menggeneralisasi dan struktur model yang unik membuat model ini dikenal dan menarik perhatian para peneliti untuk mengembangkan beberapa learning algorithm dengan performa yang baik.
3 BP (Rumelhart, et al., 1988), salah satu learning algorithm yang menggunakan gradient descent pada FFN, merupakan algoritme yang banyak digunakan dan cukup terkenal dengan akurasinya yang cukup tinggi dalam melatih FFN-JST. BP memperbaiki bobot-bobot JST berdasarkan propagasi error balik (dari output ke input) secara iteratif sampai pada titik konvergen atau pada kriteria pemberhentian (stopping criteria). Meskipun demikian, ada beberapa permasalahan pada algoritme ini yaitu seperti terperangkap pada solusi lokal minimum dan learning time yang cukup lama (Shaobin & Yong, 2007; Huang, et al., 2006). Hal ini tentunya merupakan permasalahan pada performa algoritme yang tidak mampu untuk merespons pada aplikasi-aplikasi tertentu yang membutuhkan waktu yang sangat singkat (real-time learning). Oleh karena itu, dibutuhkan algoritme yang dapat melakukan respons yang sangat cepat pada FFN sehingga tidak hanya memiliki akurasi yang cukup tinggi dalam menggeneralisasi namun juga memiliki kecepatan yang sangat cepat untuk melatih FFN. Huang, dkk., pada tahun 2006 telah merancang learning algorithm pada single hidden layer feedforward neural network (SLFN) yang disebut dengan Extreme Learning Machine (ELM) dengan menggunakan metode analitis (Huang, et al., 2006). ELM menghitung bobot pada SLFN dengan memberikan bobot acak antara input layer dan hidden layer kemudian menghitung secara matematis bobot antara hidden layer dan output layer. ELM sangat cepat dibandingkan dengan BP. Namun, penentuan bobot secara acak perlu dikoreksi lebih lanjut untuk mendapatkan akurasi yang lebih tinggi. Hal ini karena bobot yang dihitung secara matematis tergantung pada bobot acak.
4 Algoritme-algoritme yang ditawarkan tersebut memiliki kelebihan dan kekurangan masing-masing. Tentunya sangat sulit untuk merancang algoritme yang memiliki performa yang baik di berbagai aspek. BP memiliki akurasi yang tinggi namun terkadang terjebak di lokal minimum dan juga membutuhkan waktu training yang cukup lama. Sedangkan ELM, memiliki akurasi yang dapat diterima dan sangat cepat. Akan tetapi, ELM masih menggunakan bobot acak sehingga performanya kurang optimal. Dengan demikian, masih memungkinkan untuk meningkatkan kemampuan dari algoritme yang sudah ada pada JST. 1.2. Rumusan Masalah Algoritme BP membutuhkan waktu training yang cukup lama dan terkadang terjebak di minimum lokal sedangkan ELM dengan learning time yang sangat cepat menggunakan penentuan salah satu bobot pada SLFN secara acak, sehingga menyebabkan bias dan kurang optimal. 1.3. Tujuan Penelitian Mengembangkan algoritme yang memiliki akurasi dan kecepatan yang tinggi dengan pendekatan metode analitis berdasarkan persamaan matematis pada FFN dan mengetahui performanya dibandingkan dengan algoritme BP dan ELM dengan menghitung kecepatan dan akurasi dari masing-masing algoritme. 1.4. Batasan Masalah Fokus penelitian ini adalah perancangan dan pengembangan algoritme pada JST. Pada penelitian ini, algoritme yang diusulkan, Analytical Forward Learning
5 (AFL), hanya akan dibandingkan secara empiris dengan standar BP dan ELM dengan dua kasus yaitu klasifikasi dan regresi dengan perlakuan data uji dibuat sama untuk ketiga algoritma sehingga didapatkan perbandingan performanya. 1.5. Manfaat Penelitian Algoritme AFL dapat diterapkan pada berbagai aplikasi di berbagai bidang, baik medis, sosial, teknologi dan lainnya yang membutuhkan machine learning dan membutuhkan waktu yang singkat (realtime) dengan akurasi yang tinggi seperti halnya vision pada robotika. 1.6. Sistematika Penulisan Untuk memudahkan terhadap dokumentasi penelitian ini, penulisan dokumen penelitian ini dibagi dalam 5 bab sebagai berikut: BAB I Pendahuluan Pada bab pertama terdiri dari beberapa sub bab yaitu latar belakang, rumusan masalah tujuan penelitian, batasan masalah, manfaat penelitian dan sistematika penelitian. BAB II Tinjuan Pustaka Pada bagian ini membahas tentang penelitian-penelitian yang berkaitan dengan JST. Pengetahuan tentng JST dan berbagai algoritme beserta kekurangan dan kelebihannya serta metode analitis dengan menggunakan Moore-Penrose generalized inverse dikenalkan.
6 BAB III Metode Penelitian Bagian ini membahas tentang cara pengujian algoritme serta rancangan algoritme yang diusulkan baik persamaannya dan langkah-langkah pengaplikasiannya. BAB IV Hasil dan Pembahasan Bagian ini membahas hasil dari evaluasi algoritme, algoritme yang diajukan dibandingkan dengan algoritme BP dan ELM. Hal yang dibandingkan yaitu, akurasi, error, kecepatan training baik untuk masalah akurasi dan regresi. BAB V Kesimpulan dan Saran Bab terakhir ini berisi tentang kesimpulan dari hasil penelitian perancangan algoritme untuk JST serta saran untuk pengembangan algoritme lebih lanjut.