STUDI SIMULASI EVALUASI KETEPATAN KLASIFIKASI INDEKS MASSA TUBUH BERDASARKAN TABEL KLASIFIKASI INDEKS MASSA TUBUH WHO DENGAN PENDEKATAN REGRESI LOGISTIK ORDINAL DAN ANALISIS DISKRIMINAN (Stud Kasus Klasfkas Status Gz Dewasa) Dewnta Dwnanda Pusptasar, S.S Jurusan Statstka Terapan Fakultas Matematka dan Ilmu Pengetahuan Alam, Unverstas Padjajaran dewntadwnanda@yahoo.com Septad Padmadsastra, Ph.D Jurusan Statstka Terapan Fakultas Matematka dan Ilmu Pengetahuan Alam, Unverstas Padjajaran s_padmadsastra@yahoo.com Dr. Nussar Hajarsma, M.S Jurusan Statstka Terapan Fakultas Matematka dan Ilmu Pengetahuan Alam, Unverstas Padjajaran Abstrak Status gz dewasa dklasfkaskan menjad empat kelompok, yatu underweght, normal, overweght, dan obestas. Tujuan utama dar peneltan n adalah evaluas ketepatan klasfkas ndeks massa tubuh berdasarkan tabel klasfkas ndeks massa tubuh WHO dengan pendekatan regres logstk ordnal dan analss dskrmnan. Selanjutnya, membandngkan ketepatan klasfkas antara regres logstk ordnal dan analss dskrmnan dalam pengklasfkas status gz dewasa. Stud kasus pengelompokkan status gz dewasa berdasarkan varabel bebas yang terlbat yatu, berat badan (kg) dan tngg badan (cm) dengan stud smulas. Berat badan dan tngg badan bersfat kontnu dan berdstrbus normal multvarat. Data smulas menggunakan lma tngkatan ukuran sampel, yatu n 1 =00, n =400, n 3 =600, n 4 =800, dan n 5 =1000 dengan pengulangan sebanyak 100 kal. Ukuran ketepatan klasfkas yang dgunakan adalah Apparent Error Rate (APER). Haslnya adalah rata-rata kesalahan klasfkas (APER) yang dhaslkan regres logstk ordnal sebesar 8,56%, analss dskrmnan 8,49%, dan berdasarkan tabel klasfkas ndeks massa tubuh WHO sebesar 31,08%. Analss Dskrmnan menghaslkan nla APER lebh kecl dbandngkan dengan Regres
Logstk Ordnal. Klasfkas ndeks massa tubuh (IMT) dengan tabel klasfkas IMT WHO menghaslkan APER palng besar dbandngkan dengan analss dskrmnan dan regres logstk ordnal. Analss dskrmnan lebh bak dterapkan dalam pengklasfkasan status gz dewasa dbandngkan dengan regres logstk ordnal. Kata Kunc: Tabel Klasfkas Indeks Massa Tubuh, Regres Logstk Ordnal, Analss Dskrmnan, Klasfkas. Abstract Adult nutrent status was classfed nto four groups, underweght, normal, overweght, and obesty. The man purpose of ths study was to evaluate the accuracy of classfcaton body mass ndex (BMI) usng smplfed tables for BMI. Then compare the level of classfcaton accuracy between classfcaton usng smplfed tables for body mass ndex wth Ordnal Logstc Regresson and Dscrmnant Analyss usng smulated data. The case study of ths paper s about classfcaton adult nutrent status whereas nutrent status standart WHO. Independent varables was used n ths paper are weght (kg) and heght (cm) whch follow multvarat normal dstrbuton. Smulaton data are used fve levels of sample sze n 1 =00,n =400,n 3 =600,n 4 =800, and n 5 =1000, every levels of sample sze wll be replcated as much as 100 tmes to see the consstency of each method n the classfcaton. Apparent Error Rate s used to compare the leveel of classfcaton accuracy. The result showed that the apparent error rate of ordnal logstc regresson s 8,56%, dsrmnant analyss s 8,49%, and usng body mass ndex smplfed tables classfcaton s 31,08%. Classfcaton usng smplfed tables for body mass ndex has greatest APER than ordnal logstc regresson and dscrmnan analyss.dscrmnant analyss s better to classfy adult nutrent status than ordnal logstc regresson. Keywords: Smplfed Tables for Body Mass Index, Ordnal Logstc Regresson, Dscrmnant Analyss, Classfcaton
1. PENDAHULUAN Status gz orang dewasa dklasfkaskan menjad empat kelompok, yatu underweght, normoweght, overweght, dan obesty. Pada umumnya ahl gz melakukan pengklasfkasan status gz dewasa dengan menggunakan metode ndeks massa tubuh berdasarkan tabel klasfkas ndeks massa tubuh yang telah ada, yatu tabel baku rujukan yang dkeluarkan oleh WHO. Pengklasfkasan merupakan salah satu metode statstka dalam pengelompokkan suatu data yang dsusun secara sstemats. Pada peneletan n membandngkan antara teknk klasfkas regres logstk, yatu regres logstk ordnal dengan analss dskrmnan yang bersfat multpel (analss dskrmnan multpel). Teknk klasfkas yang dgunakan regres logstk ordnal karena status gz dbedakan menjad empat kelompok yang sfatnya menunjukkan tngkatan. Analss dskrmnan multpel dgunakan karena status gz dewasa dbedakan menjad empat kelompok. Kelebhan dar regres logstk adalah memlk odds raso yang menunjukkan seberapa besar pengaruh varabel predktor suatu kategor referens pada suatu varabel respon dan dalam pemenuhan asums tdak memerlukan asums normaltas multvarat serta kesamaan matrks varans-kovarans sehngga metode n cukup tahan (robust) untuk dapat dterapkan dalam berbaga keadaan data (Tatham et. Al, 1998). Kelemahan yang dhaslkan model regres logstk berupa nla probabltas yang kurang prakts. Pada analss dskrmnan, memlk kelebhan yatu memberkan perhtungan yang lebh efsen (Sharma, 1996), sedangkan kelemahan dar analss dskrmnan adalah asums harus terpenuh, dmana data harus memenuh dstrbus normal multvarat dan menghaslkan matrks varans-kovarans yang sama setap kelompok (Johnson dan Wcherm, 00). Metode klasfkas yang bak adalah metode yang menghaslkan ketepatan klasfkas yang tngg atau kesalahan klasfkas yang mnmal. Berdasarkan uraan d atas, pada peneltan n akan dlakukan perbandngan ketepatan klasfkas status gz orang dewasa antara ndeks massa tubuh berdasarkan tabel klasfkas ndeks massa tubuh, regres logstk ordnal, dan analss dskrmnan.
. TINJAUAN PUSTAKA.1 Indeks Massa Tubuh (IMT) Indeks massa tubuh (IMT) merupakan alat atau cara yang sederhana untuk memantau status gz orang dewasa. Pengukuran ndeks massa tubuh hanya membutuhkan dua hal yatu berat badan (kg) dan tngg badan (cm). Untuk mengetahu nla IMT, dhtung dengan rumus berkut : BB( kg) IMT (.1) TB( m) Pengklasfkasan status gz dewasa berdasarkan tabel klasfkas ndeks massa tubuh sebaga berkut :. Regres Logstk Ordnal Tabel.1 Tabel Klasfkas Status Gz Dewasa Klasfkas IMT(kg/m ) Underweght IMT 18,5 Normal 18,5 < IMT < 5 Overweght 5 IMT < 30 Obestas IMT 30 (Sumber : WHO, 000) Regres logstk ordnal adalah suatu analss regres yang dgunakan untuk menggambarkan hubungan antara varabel respon dengan sekumpulan varabel predktor, dmana varabel respon bersfat ordnal, yatu mempunya lebh dar dua kategor ( k > ) dan setap kategor dapat dperngkat. Varabel bebas dapat berupa data kategor atau kontnu yang terdr atas dua varabel atau lebh. Metode yang serng dgunakan untuk varabel respon berskala ordnal adalah dengan membentuk fungs logt dar peluang kumulatf. Sehngga model logstk untuk respon ordnal serng dsebut sebaga model logt kumulatf (Agrest, 007). Peluang kumulatf, P( Y j x ) ddefnskan sebaga berkut :
exp P( Y j x ) ( x ) 1 exp Jka terdapat k 0 j k k k 1 j p p x x 0 j k k k 1 (.) kategor respon maka model regres logstk ordnal yang terbentuk sebanyak k 1. Model logstk kumulatf ddefnskan sebaga berkut: LogtP( Y j x ) x j = 1,,...,k-1 (.3) 0 j k k k 1 Jka terdapat empat kategor respon dmana j 1,,3, 4 maka nla masngmasng peluang kategor respon ke j dperoleh dengan persamaan : ( x ) P( Y 1 x ) 1 ( x ) P( Y x ) P( Y 1 x ) ( x ) P( Y 3 x ) P( Y x ) 3 ( x ) 1 P( Y 3 x ) 4 Untuk klasfkas nla ( x ) j p (.4) pada persamaan (.4) akan djadkan pedoman pengklasfkasan. Suatu pengamatan akan masuk dalam respon kategor j berdasarkan nla ( x ) yang terbesar (Wbowo, 00)..3 Analss Dskrmnan j Analss dskrmnan adalah teknk statstka yang dpergunakan untuk mengklasfkaskan suatu observas ke dalam suatu kelompok berdasarkan sekumpulan varabel-varabel (Johnson & Wchern, 00). Pemodelan antara varabel predktor dan varabel respon dnyatakan oleh suatu fungs yatu fungs dskrmnan.. Fungs n dbentuk dengan memaksmumkan jarak antar kelompok, sehngga memlk kemampuan untuk membedakan antar kelompok. Fungs dskrmnan bersfat memaksmumkan raso keragaman antar kelompok dengan keragaman dalam kelompok. Asums yang harus dpenuh dalam analss dskrmnan adalah data berdstrbus normal multvarat dan adanya kesamaan struktur matrks varans-kovarans antar kelompok. Model umum analss dskrmnan merupakan suatu kombnas lner bentuknya sebaga berkut: Z a W X W X W X (.5) j 1 1... p p
Fungs dskrmnan lner (Johnson dan Wchern, 00) adalah : t 1 1 t 1 d ( x) x ln p = 1,,..,k (.6) Dengan μ adalah rata-rata populas ke-, 1 adalah nvers matrks kovarans dan p adalah peluang pror pada populas ke-. Estmas dar d ( x) adalah d ˆ ( x) ˆ 1 1 ( ) t t 1 d x x Sgabx x Sgabx ln p (.7) dengan x adalah rata-rata sampel kelompok ke-, dˆ ( x ) dsebut juga sebaga fungs dskrmnan lner dengan parameter-parameter x S t 1 gab dan konstanta 1 t 1 c x Sgabx ln p untuk = 1,,...,k. Alokas x ke dalam kelompok k apabla dˆ ( x) maks ( dˆ ( x), dˆ ( x),..., dˆ ( x)). k ( t ) 1 k Pengklasfkasan obyek ke dalam populas yang terdekat setara dengan pengklasfkasan obyek ke dalam populas dengan peluang posteror yang palng besar. Besarnya peluang posteror tersebut yatu (Johnson dan Wchern, 00) : P( t x) k e 1 1 d ( x) e 1 d ( x) t 1,,..., k (.8) 3. PERBANDINGAN KETEPATAN KLASIFIKASI Data yang dgunakan adalah data smulas dengan lma ukuran sampel n 1 = 00, n = 400, n 3 = 600, n 4 = 800, dan n 5 = 1000. Semua ukuran sampel akan dlakukan replkas sebanyak 100 kal untuk melhat kekonsstenan masng-masng metode dalam pengklasfkasan. Algortma data smulas dalam membandngkan knerja setap teknk klasfkas dengan 100 replkas data smulas sebaga berkut : 1. Bangktkan sampel acak berdstrbus normal multvarat yang berasal dar masng-masng kelompok dengan metode Monte Carlo, dmana ukuran sampel masng-masng kelompok sama, dengan skenaro :
53.93 84.79 5.43 ; 153.39 5.43 49.13 51.88 84.79 5.43 1 ; 1 179.10 5.43 49.13 64.15 84.79 5.43 ; 170.69 5.43 49.13. 74.6 84.79 5.43 3 ; 3 164.66 5.43 49.13 81.38 84.79 5.43 4 ; 4 154.38 5.43 49.13. Lakukan klasfkas untuk masng-masng objek dengan menggunakan Regres Logstk Ordnal, Analss Dskrmnan, dan Tabel Klasfkas Indeks Massa Tubuh dengan bantuan Software R 3.1.0. 3. Htung ketepatan klasfkas untuk masng-masng metode klasfkas, dengan metode Apparent Error Rate (APER ). 4. Ulang langkah 1 sampa dengan 3 sebanyak 100 kal. Evaluas prosedur klasfkas dengan nla APER menyatakan nla propors sampel yang salah dklasfkaskan (Johnson dan Wchern, 00). Aktual Predks ˆ 1 ˆ ˆ 3 ˆ 4 Total π 1 n 11 n 1 n 13 n 14 A π n 1 n n 3 n 4 B π 3 n 31 n 3 n 33 n 34 C π 4 n 41 n 4 n 43 n 44 D Total E F G H I
Rumus ketepatan klasfkas tersebut adalah sebaga berkut : Melhat ketepatan klasfkas secara keseluruhan nla APER adalah n n n n n n... n APER I 1 13 14 1 3 4 43 100% 4. HASIL DAN PEMBAHASAN Hasl kesalahan klasfkas (APER) dengan regres logstk ordnal, analss dksrmnan, dan berdasarkan pengklasfan tabel klasfkas ndeks massa tubuh untuk seluruh tngkatan ukuran sampel dengan replkas sebanyak 100 kal dtunjukkan pada tabel 4.1. Tabel 4.1. Hasl Persentase Kesalahan Klasfkas (APER) Regrse Logstk Ordnal, Analss Dskrmnan, dan Tabel Klasfkas Indeks Massa Tubuh APER APER APER n Regres Logstk Ordnal Analss Dskrmnan Indeks Massa Tubuh 00 8,08 8,17 30,8 400 8,63 8,54 31,1 600 8,8368 8,6801 31,3433 800 8,6465 8,55 31,0665 1000 8,64 8,564 31,118 Rata-rata kesalahan klasfkas 8,56701 8,4953 31,08951 Rata-rata kesalahan klasfkas (APER) yang dhaslkan regres logstk ordnal sebesar 8,56%, analss dskrmnan 8,49%, dan berdasarkan tabel klasfkas ndeks massa tubuh sebesar 31,08%. Dar Tabel 4.1 dapat terlhat bahwa APER yang dhaslkan oleh analss dskrmnan untuk semua tngkat ukuran sampel dengan replkas sebanyak 100 kal menghaslkan kesalahan klasfkas palng kecl dbandngkan dengan regres logstk ordnal dan tabel klasfkas ndeks
massa tubuh. Pengklasfkasan status gz dewasa yang selama n dlakukan berdasarkan tabel klasfkas ndeks massa tubuh menghaslkan tngkat kesalahan klasfkas palng besar dbandngkan dengan regres logstk ordnal dan analss dskrmnan. 5. KESIMPULAN DAN DARAN 5.1 Kesmpulan 1. Untuk semua tngkatan ukuran sampel dengan replkas sebanyak 100 kal dan memenuh asums normal multvarat serta matrks varans-kovarans untk setap kelompok sama dalam pengklasfkasan status gz dewasa menghaslkan analss dskrmnan memberkan nla APER yang lebh kecl dbandngkan dengan regres logstk ordnal. Analss dskrmnan lebh bak dterapkan untuk klasfkas status gz dewasa dbandngkan dengan regres logstk ordnal.. Pengklasfkasan status gz dewasa dengan ndeks massa tubuh berdasarkan tabel klasfkas ndeks massa tubuh menghaslkan nla APER yang palng besar dbandngkan dengan teknk klasfkas statstka, yatu analss dskrmnan dan regres logstk ordnal. 3. Varabel yang dgunakan dalam peneltan n, yatu berat badan dan tngg badan yang bersfat kontnu dan bvarat normal sehngga analss dskrmnan menghaslkan ketepatan klasfkas yang lebh bak dbandngkan dengan regres logstk ordnal. 5. Saran 1. Dalam peneltan n hanya melbatkan data smulas normal bvarat, maka dsarankan untuk peneltan selanjutnya dgunakan data normal multvarat.. Perlu adanya evaluas atau peneltan mengena tabel klasfkas ndeks massa tubuh agar menghaslkan ketepatan klasfkas yang lebh bak lag
3. Metode Analss Regres Logstk Ordnal dan Analss Dskrmnan perlu dbandngkan dengan metode lan agar dperoleh suatu metode klasfkas yang lebh bak lag. DAFTAR PUSTAKA Agrest A. 007. An Introducton to Categorcal Data Analyss. New York. John Wley and Sons Badan Peneltan dan Pengembangan Kesehatan. 010. Rset Kesehatan Dasar (Rskesdas 010). Kementran Kesehatan Republk Indonesa, Jakarta. Centre for Obesty Research and Educaton. 007. Body Mass Index: BMI Calculator. Ddapat dar http://www.core.monash.org/bm.html [Agustus 014]. Depkes, RI. 000. Pedoman Prakts Untuk Mempertahankan Berat Badan Normal Berdasarkan Indeks Massa Tubuh ( IMT) dengan Gz Sembang. Jakarta: Depkes RI. Dllon, W.R. dan Goldsten M. 1984. Multvarate Analyss: Methods and Applcatons. New York: John Wley & Sons, Inc.. Grafk Indeks Massa Tubuh Anak. http://en.wkpeda.org/wk/body_mass_ndex Hajarsman, N. 008. Statstka Multvarat, UNISBA Bandung Hosmer, Davd W., Lemeshow S. 000. Appled Logstc Regresson. New York. John Wley and Sons. Johnson, R.A dan Wchern,D.W. 00,.Appled Multvarate Statstcal Analyss, ffth edton,.prantce Hall, New Jersey. Klenbaum, Davd G, Mtchel Klen. (010). Logstc Regresson. Sprnger Scence-Bussness Meda. New York. Krzanowsk, W.J. (1975), Dscrmnaton and Classfcaton usng Both Bnary and Contnuous Varable, Journal of the Amercan Statstcal Assocaton, 70;78-35. Manel,S, Mare,DJ, dan Ormerod, SJ. (1999). Comparson dsrcmnant analyss, neural networks, and logstc regresson for predstng speces dstrbutons: a case study wth Hmalayan rver brd, Ecologcal Modellng, 10;337-347.
Pohar,M,Blas M, dan Turk, S. (004). Comparson of Logstc Regresson and Lnear Dscrmnant Analyss : A Smulaton Study, Metodoloãk zvezk, Vol.1, No.1, hal.143-161. Press, S.J. dan Wlson, S. (1978), Choosng Between Logstc Regresson and Dscrmnaton Analyss, Journal of the Amercan Statstcal Assocaton, 73;699-364. Sharma, S. (1996), Appled Multvarate Technques, John Wley, New York. Sugondo, S., 006. Obestas. Dalam: Sudoyono, W.A., Setyohad, B., Alw, I., Smadbrata, M., & Setat, S. Buku Ajar Ilmu Penyakt Dalam. Jld III. Eds 4. Jakarta: Pusat Penerbtan Departemen Ilmu Penyakt Dalam FKUI, 1919-194. Supranto, J. 004. Ekonometr Jld. Jakarta: Penerbt Ghala Indonesa. Tatham, R.L., Har, J.F, Anderson, R.E., dan Black, W.C., (1998), Multvarate Data Analyss, Prentce Hall, New Jersey. Yula I.P.D. (1997), Analss Statstka Terhadap Kerusakan Wall Tle d PD Sarana Bangunan Unt Pabrk Keramk dan Pengolahan Bahan Tulungagung, Tugas Akhr, Statstka ITS. Wbowo,W. (00), Perbandngan Hasl Klasfkas Analss Dskrmnan dan Regres Logstk pada Pengklasfkasan Data Respon Bner, KAPPA, Vol. 3, No. 1, hal. 36-45. WHO. 000. Body Mass Index (BMI) = Indeks Massa Tubuh. http://www.obestas.web.d/ndonesa/bm().htm [Jul 014].