Anaisis 9 Saham Sektor Industri di Indonesia Menggunakan Metode SVR Nur Adhi Nugroho1,a, Acep Purqon1,b 1 Laboratorium Fisika Bumi, Keompok Keahian Fisika Bumi dan Sistem Kompeks, Fakutas Matematika dan Imu Pengetahuan Aam, Institut eknoogi Bandung, J. Ganesha no. 10 Bandung, Indonesia, 4013 a nur.adhi1@gmai.com b acep@fi.itb.ac.id Abstrak Saham merupakan saah satu instrumen daam pasar keuangan. Karakteristik dari data indeks harga saham yaitu sifatnya yang berubah dari waktu ke waktu. Oeh karena itu, untuk meminimumkan resiko yang dihadapi para investor maka peru adanya sistem yang mampu memprediksi trend harga saham. Daam makaah ini, akan dibahas Support Vector Regression SVR untuk menentukan prediksi cosing harga saham. SVR merupakan pengembangan dari SVM untuk kasus regresi. ujuan SVR adaah membuat suatu fungsi regresi untuk menentukan hyperpane terbaik. ahap yang juga penting sebeum impementasi ke daam SVR yaitu data mining dan data processing. Pengambian data saham meaui yahoo finance kemudian pemrosesan data diakukan menggunakan Exce. Kedua tahap ini diperukan untuk menghindari data saham perusahaan yang kosong dan menghapus data waktu yang tidak diperukan. Saham yang digunakan yaitu dari 9 sektor industri di Indonesia. Data indeks saham periode 005-014 akan digunakan sebagai data set training. Kemudian performansi tingkat keakuratan SVR akan dibandingkan dengan data periode 015. Kata-kata kunci: Data Mining, Data Processing, Regresi, Saham, Support Vector Regression SVR PENDAHULUAN Pasar moda, menurut Bursa Efek Indonesia, merupakan pasar unuk berbagai instrument keuangan jangka panjang yang bisa diperjuabeikan, baik surat utang obigasi, ekuiti saham, reksa dana, instrumen derivatif maupun instrumen ainnya. Adanya pasar moda memberikan kesempatan masyarakat untuk bisa berinvestasi, saah satunya yaitu saham. Indeks harga saham memberikan gambaran kondisi ekonomi saat itu serta menjadi indikator bagi para investor daam mengambi keputusan untuk berinvestasi sehingga tidak mengaami kerugian yang besar. Fenomena indeks harga saham merupakan saah satu peristiwa dinamika stokastik. Dinamika stokastik merupakan pergerakan dari sebuah data di mana data tersebut menunjukkan adanya efek acak. Datanya yang bersifat time series dan niainya yang fuktuatif menyebabkan prediksi harga saham merupakan saah satu prediksi yang suit untuk diakukan. Ha ini disebabkan kondisi pasar keuangan dipengaruhi oeh banyak faktor, seperti kebijakan perusahaan, infasi, niai suku bunga, kebijakan ekonomi, dan gejoak poitik di negara tersebut. Support Vector Machine merupakan saah satu agoritma yang menggunakan pendekatan non inear. Konsep dasar SVM adaah mencari hyperpane garis pemisah baik untuk memisahkan antar cass. 95
Gambar 1. Hyperpane[1] Pada Gambar 1. menunjukkan adanya persebaran data dari dua cass. Cass -1 disimbokan dengan kotak warna merah, sedangkan +1 disimbokan dengan ingkaran warna kuning. Gambar sebeah kiri memperihatkan banyaknya aternatif hyperpane untuk memisahkan dua cass. Sedangkan pada gambar sebeah kanan, garis merah teba menunjukkan hyperpane terbaik yang memisahkan kedua cass tepat ditengah. Hyperpane terbaik dapat ditemukan dengan mengukur margin dari hyperpane tersebut dengan mencari titik maksimanya. Margin merupakan jarak antara hyperpane dengan titik terdekat dari masingmasing cass. itik yang terdekat ini disebut support vector. Daam makaah ini akan menggunakan Support Vector Regression SVR untuk memprediksi trend harga saham. SVR sendiri adaah pengembangan dari SVM untuk kasus regresi. Perbedaan dengan SVM adaah SVM digunakan untuk kasus kasifikasi sehingga output berupa diskrit. Sedangkan SVR, karena untuk kasus regresi, output bersifat kontinu biangan rii. MEODE SUPPOR VECOR REGRESSION Support Vector Regression Misakan kita mempunyai data training {x1,y1 xi,yi} R. ujuan SVR adaah menemukan suatu fungsi fx yang mempunyai deviasi ε paing besar maksima dari target yang diobservasi yi untuk semua data training. Sehingga ketika ε = 0 maka akan dihasikan fungsi regresi yang sempurna. Bentuk umum fungsi inear: f x = w ϕ x + b 1 w merupakan vektor pembobot, ϕ x merupakan fungsi pemetaan di daam feature space, dan b adaah w konstanta. Untuk mendapatkan fungsi setipis sedatar mungkin maka harus meminimumkan norm dari panjang vektor dari w. min 1 w dan memenuhi: yi w ϕ x + b ε 3 w ϕ x yi + b ε 4 Pada kenyataannya tidak semua kasus datanya masuk pada range f x ± ε. Sehingga peru ada tambahan variabe baru yang disebut variabe sack ξ, ξ* untuk mengatasi data yang berada diuar batas margin. Data yang berada diuar margin akan terkena pinati. Probem optimasi di atas dapat diperoeh dengan meminimakan: 96
min 1 w + C ξ + ξ * 5 di mana yi w ϕ x + b ε + ξ 6 w ϕ x yi + b ε + ξ * 7 ξ,ξ * 0 8 Konstanta C merupakan niai pinati dari data karena error ebih dari ε. Sedangkan data yang masih daam jangkauan ε maka dianggap error berniai no. Korespondensi ini yang dinamakan dengan ε-insensitive oss function ξ, dapat dituiskan sebagai berikut: ε 0, jika ξ ε ξ ε, seainnya ξ ε := 9 Gambar. ε-insensitive oss function[] Pada SVR, support vector merupakan data training yang teretak pada margin ε dan diuar margin. Sehingga jumah support vector akan menurun karena naiknya niai ε. Sousi optimasi persamaan 5 dan batasan persamaan 6, 7, 8 diseesaikan dengan fungsi Lagrange: Q w, b, α i, α i*,ηi,ηi* = L L= 1 w + C ξ i + ξ i* α i ε + ξ i + f x i yi α i* ε + ξ i* f x i + yi ηiξ i + ηi*ξ i* 10 Di mana αi, αi*, ηi, ηi* adaah Lagrange Mutipier dan niainya ebih dari samadengan no. Sedangkan f xi merupakan persamaan 1. Untuk mendapatkan sousi optima di atas diakukan turunan w, b, ξ, ξ* : α i, α i*,η i,η i* 0 = w α i α i* ϕ x i = 0 w = α i α i* = 0 b = C α i ηi = 0 ξ i parsia Lagrange Mutipier terhadap 11 1 13 97
= C α i* η i* * ξ i 14 Dari persamaan 11 maka didapatkan: w = α i α i* ϕ x i 15 Kemudian substitusi persamaan 11, 1, 13, 14ke daam persamaan 10 dengan memaksimakan sousi dua Qαi,αi*: f x = α i α i* w x i ϕ x + b 16 f x = α i α i* k x i, x + b 17 K x i, x merupakan fungsi kerne. Penjeasan fungsi kerne akan dijeaskan pada subbagian berikutnya. Kemudian mencari sousi optima b yaitu dengan menggunakan kondisi KK Karush-Kuhn-ucker didapatkan sebagai berikut: b = yi w ϕ x i ε = yi α i α i* k x i, x ε 18 Fungsi Kerne Peran dari fungsi kerne adaah memetakan data x di input space ke daam feature space yang berdimensi ebih tinggi. Fungsi kerne yang biasanya digunakan berdasarkan studi iterature adaah: 1. Kerne inear ϕ x = K x, x i = x x. 19 Kerne poynomia ϕ x = K x, x i = x x + 1 d 3. 0 Kerne RBF x xi ϕ x = K x, xi = exp σ 1 Kinerja Prediksi Saah satu kriteria untuk mengukur keakuratan suatu mode adaah dengan meihat niai error yang dihasikan. Daam makaah ini niai error yang digunakan yaitu Mean Absoute Percentage Error MAPE. Dirumuskan sebagai berikut: MAPE = Di mana 1 yi y i 100 n yi yi merupakan niai aktua dan y i merupakan niai prediksi. 98
HASIL DAN PERBANDINGAN DENGAN DAA REFERENSI Data yang digunakan adaah data harga penutupan dari 9 perusahaan pada sektor tiap industri di Indonesia. abe 1. Daftar dari iap Sektor Industri No. 1 3 4 5 6 7 8 9 Sektor Industri Pertanian Pertambangan Industri Dasar dan Kimia Aneka Industri Industri Barang Konsumsi Properti dan Rea Estate ransportasi dan Infrastruktur Keuangan Perdagangan Astra Argo Lestari AALI Aneka ambang ANM Semen Indonesia SMGR Astra Internationa ASII iga Piar Sejahtera Food AISA Lippo Cikarang LPCK Indosat ISA Bank Negara Indonesia BBNI AKR Corpindo AKRA Data yang digunakan yaitu data training dari 1 Januari 005 sampai 31 Desember 014. Sedangkan data testing sebagai komparasi dengan hasi prediksi. Pengoahan data akan menggunakan ibrary SMOreg dengan jumah step sebanyak 6. iap step merepresentasikan periodisitas daam buanan. Sedangkan jumah step menyatakan jumah prediksi. Sehingga prediksi yang diakukan adaah untuk 6 periode kedepan. abe. ingkat Akurasi Mode SVR RBF C=1.0, gamma=1.0 Mean Absoute Percentage Error MAPE AALI ANM SMGR ASII AISA LPCK ISA BBNI AKRA 1-step ahead -step ahead 3-step ahead 4-step ahead 5-step ahead 6-step ahead 0.603 1.069 1.9468.059 3.5441 4.4496 1.5715 1.677 1.8 0.941.9755.961 3.1807 4.461 5.665.691.3973.9115 0.309 3.6434 3.798 4.0777 4.9451 6.5814.785.9374 3.818 0.345 4.501 4.53 4.8587 5.3344 7.714 3.1495 3.4095 4.69 0.3669 4.8017 5.311 5.5354 5.6889 8.0177 3.4743 3.7887 5.0 0.3874 5.3093 5.8999 6.1633 6.0136 8.6398 3.789 4.1596 5.7473 abe 3. Hasi Prediksi 6 Periode Kedepan SVR RBF C=1.0, gamma=1.0 Hasi Prediksi AALI ANM SMGR ASII AISA LPCK ISA BBNI AKRA 1-step ahead -step ahead 3-step ahead 4-step ahead 5-step ahead 6-step ahead 3664.94 1057.4 1619.99 7389.9 099.38 1075.5 4034.1 606.9 418.30 3687.9 1044.17 16146.03 7360.77 096.76 104.1 4018.71 6058.3 436.96 379.87 104.7 16139.13 7344.61 099.96 10176.85 4010.7 6065.40 430.07 3736.43 1039.64 1619.3 7339.67 098.4 10167.7 4003.7 6077.89 4351.16 3761.63 1039.99 1610. 7333.10 100.43 10148. 3995.49 6100.17 4394.60 3793.87 1043.69 16113.78 738 098.89 10138.76 3990.48 6110.65 4433.19 abe 4. Data Aktua 6 Periode Kedepan AALI ANM SMGR Data Aktua Periode 1 Periode Periode 3 Periode 4 Periode 5 Periode 6 350 894.575 14575 4650 844.177 14875 4300 76.58 13650 0350 667.78 1500 4800 638.38 13450 950 571.184 1000 99
ASII AISA LPCK ISA BBNI AKRA 7850 150 11500 4095 650 4695 7850 00 1195 415 6875 4870 8575 095 11675 465 75 515 6850 1760 11975 4000 645 500 7300 185 10850 3740 6875 5475 7075 1870 9100 4000 5300 595 Performansi tingkat keakurasian semakin baik apabia niai MAPE semakin keci. Dari tabe. menunjukkan niai MAPE yang cukup besar. Hanya pada saham Astra Argo Lestari yang memiiki persentase MAPE keci. Sehingga ini beum bisa dijadikan pedoman daam tingkat kepercayaan investor terhadap niai prediksi saham dari perusahaan tersebut. Seain baik tidaknya data, keakurasian juga dipengaruhi pada fungsi kerne yang digunakan serta penentuan niai parameter yang digunakan. KESIMPULAN SVR merupakan metode yang dapat mengatasi overfitting. [,3] Pemiihan fungsi kerne sangat penting. Fungsi kerne ini akan menentukan ruang fitur yang digunakan daam mencari hyperpane terbaik. Ini dibuktikan dengan hasi persentase MAPE yang masih berkisar 5% menunjukkan mode prediksi beum akurat. Ha yang peru diakukan kedepannya adaah meakukan cross-check terhadap penggunaan fungsi kerne serta uji coba dengan niai parameter yang bervariasi. REFERENSI 1.. A.S. Nugroho, Support Vector Machine eori Apikasinya daam Bioinformatika. 003. Smoa A.J., Schokopf B., A utoria on Support Vector Regression. Statistics and Computing Voume 14, pp 199-004. 3. Basak D., Pa S., Patranabis D.C., Support Vector Regression. Neura Informatics Processing-Letter and Reviews Vo. 11 007. 4. Weing Max, Support Vector Regression. Department of Computer Science, University of oronto. 5. Schokopf B., Smoa A.J., Learning with Kernes. MI Press, Cambrige 001. 6. Ho Chia-Hua, Lin Chih-Jen, Large-scae Linear Support Vector Regression. Journa of Machine Learning Reasearch 13 01. 7. Kuhn Max, Johnson Kje, Appied Predictive Modeing. Springer Science+Business Media New York 013. 8. Breiman Leo, Statistica Modeing: the wo Cutures. Statistica Science Vo. 16 No.3, 199-15 001. 9. JinXing Che, Support Vector Regression Based on Optima raining Subset and Adaptive Partice Swarm Optimization Agorithm. Appied Soft Computing 13 013. 10. Nghi Dang Huu, Mai Luong Chi, raining Data Seection for Support Vector Machines Mode. 011 INERNAIONAL CONFERENCE ON INFORMAION AND ELERONICS ENGINEERING, Singapore 011. 11. Wu Chun-Hsin, raver-ime Prediction with Support Vector Regression. IEEE ransactions on Inteigent ranportation Systems Vo.5 No.4 004. 300