AALISIS DISKRIMIA DISKRIT UTUK MEGELOMPOKKA KOMPOE Bernk Maskun Jurusan Statstka FMIPA UPAD jay_komang@yahoo.com Abstrak Untuk mengelompokkan hasl pengukuran yang dukur dengan p buah varabel dmana penlaan setap varabel dlakukan dengan pengkategoran yang bersfat bner maka banyak susunan yang mungkn terjad adalah 2 p. Dar sampel yang dperoleh, terlebh dahulu sampel dbag dalam dua bagan yatu Analyss Sample sebaga sampel untuk membuat aturan pengklasfkasan dan Holdout Sample sebaga sampel untuk menguj ketepatan kalsfkas dar aturan klasfkas. Har dkk (1988) mengusulkan ukuran sampel untuk sampel analyss adalah 75% dar sampel yang ada. Dar Sampel Analyss selanjutnya dkategorkan atas dua kelompok sampel yatu kelompok yang bak dan kelompok tdak bak (perlu perbakan) yang selanjutnya dlakukan pengujan hpotess kesamaan propors dengan statstk uj berbentuk yang berdstrbus Ch kuadrat dengan dk =2 p -1 Jka hasl pengujan bersfat sgnfkan, selanjutnya lakukan Klasfkas dengan aturan D D1, 2D Dmana : 1 jka g1( x) 2 g ( x ) ; 2 jka 1 2 ; ( x) g Peluang kesalahan pengklasfkasan dar Sampel analyss dapat d htung () Actual Error Rate (AER) : p( D) g ( x )... g ( x) g ( x) g ( x )... g ( x)... 1 1 2 2 2 D2 D 1 D 3 D 1 D D n () Apparent Error Rate (APER) : APER dhtung dengan terlebh dahulu nla durutkan dar nla terbesar (k) hngga terkecl (1) kemudan gunakan rumus : 1 p( D) 1(1) ( x1(2) ) ( 1( x ) 1)... k ( 1) n k ( x ) x x Kata kunc : Ch-Kuadrat, AER, APER 880
1. PEDAHULUA Dalam perndusran terutama yang menghaslkan produk yang memerlukan keteltan/presss yang tngg sepert komponen AIR BRAKE SYSTEM (sstem pengereman kereta ap) yang merupakan hasl produk dar PT. PIDAD (Persero) Bandung untuk memenuh pesanan khusus dar PT. KAI, maka produk yang dhaslkan harus memenuh standar yang telah dtentukan. Untuk tu perlu dlakukan pengujan terhadap komponen-komponen Ar Brake yang dhaslkan antara lan dengan mengandalkan uj fungs (tdak duj secara keseluruhan) yatu pengujan yang dkerjakan oleh para pekerja dengan cara mencelupkan komponen yang dproduk kedalam ar untuk mengetahu bocor atau tdak. Selama kurun waktu Me 2007 sampa dengan Januar 2009 terdapat fakta terjadnya kebocoran dar produk yang dhaslkan untuk memenuh pemesanan PT. KAI sebaga berkut : Tabel 1.1 Jumlah Kebocoran Ar Brake System Produk PT. PIDAD Waktu Sampel Pemerksaan Bak % Bocor % Me 2007 100 73 73,00 27 27,00 Agustus 2007 60 40 67,00 20 33,00 ovember 2007 500 370 74,00 130 26,00 Jul 2008 510 360 70,59 150 29,41 Januar 2009 336 248 73,80 88 26,20 Terlhat dalam tabel d atas, produk yang mengalam kerusakan (kebocoran) dar waktu ke waktu cenderung menngkat. Tentunya jka hal n terus menerus berlangsung tdak menutup terjadnya penangguhan pemesanan yang mengakbatkan dapat merugkan kedua belah phak. Untuk menentukan apakah produk yang dhaslkan memenuh standar atau tdak, tentukan dapat dlakukan dengan cara mengklasfkaskan berdasarkan uj yang telah dlakukan untuk setap komponen produk. Dalam mengklasfkaskan 881
hasl produknya, PT. PIDAD menggunakan 5 komponen domnan dar Ar Brake System yang harus dperksa, dmana untuk tap komponen dkategorkan dalam data kualtatf berskala nomnal (bocor atau tdak bocor). Berdasarkan data kualtatf untuk ke lma komponen tersebut, dapat dtentukan komponen mana yang palng domnan untuk membedakan klasfkas satu kelompok dengan kelompok lannya serta besar peluang kesalahan pengklasfkasannya. 2. TIJAUA PUSTAKA 2.1 Pengelompokkan berdasarkan satu varabel predktor Pada saat kta dhadapkan pada persoalan pengelompokan dengan memperhatkan satu varabel predktor, maka unvarate classfcaton dapat dgunakan dengan tujuan : () untuk menaksr besarnya pengaruh varabel pengelompokkan ketka terdapat dua kelompok yang sudah terseda sebelumnya, dan () untuk menetapkan nla pemsah varabel respon yang bak untuk menentukan standar agar unt sampel dapat dbag ke dalam dua kelompok untuk mengdentfkaskan objek dengan tepat. a. Pengelompokkan berdasarkan dua atau lebh varabel predktor Dalam mulvarate pengelompokan dapat dlakukan dengan beberapa merode, dantaranya Analss Dskrmnan. Analss n merupakan suatu teknk analss statstka untuk mengelompokkan setap objek ke dalam dua kelompok atau lebh berdasarkan krtera sejumlah varabel bebas (nterval atau raso dan bersfat kuanttatf) sedangkan varabel tdak bebasnya merupakan kategor (nonmetrk, nomnal atau ordnal yang bersfat kualtatf) (Har, 1998). Untuk melakukan analss dskrmnan, langkah pertama yang harus dlakukan adalah melakukan pengujan hpotess apak terdapat perbedaan antara kedua kelompok populas yang telah dketahu. Apabla terdapat perbedaan antara kedua kelompok maka analss dskrmnan dapat dlakukan, jka tdak terdapat perbedaan maka analss dskrmnan tdak perlu dlakukan. Hpotess statstknya berbentuk : 882
H o : 1 2 Melawan H 1 : 1 2 Stattk uj nya adalah : yang berdstrbus Ch kuadrat dengan dk =2 p -1 Menentukan Aturan Klasfkas Untuk menentukan aturan klasfkas ; jka banyaknya ndvdu yang berasal dar populas pada X = x merupakan varabel acak bnom (x), = 1,2, sehngga banyaknya ndvdu yang terambl menjad sampel dar dua populas 1 1 dan 2 2 ( ) x merupakan varabel acak Bnom dengan 1 2. Peluang pror dtaksr oleh dan taksran untuk peluang susunan adalah g ( x) Sehngga taksran untuk dskrmnan adalah : 2.2.2 Menghtung peluang kesalahan Klasfkas Setelah proses klasfkas, selajutnya dapat dketahu seberapa tepat aturan klasfkas yang telah dtentukan tersebut dengan menghtung nla error rate yatu propors kesalahan kalasfkas dar Holdout Sample. Jka la eror rate kecl maka ketepatan klasfkas semakn tngg. Jka klasfkas yang dhaslkan dar sampel telah dhtung, dapat pula dhtung dua buah kesalahan klasfkas yatu () Actual Error Rate (AER) 883
p( D) g ( x )... g ( x) g ( x) g ( x )... g ( x )... 1 1 2 2 2 D2 D 1 D 3 D 1 D D dan () Apparent Error Rate (APER) 1 p( D) 1(1) ( x1(2) ) ( 1( x ) 1)... k ( 1) n k ( x ) x x 2.2.3 Menentukan Varabel Dskrmnator dan Subset varabel Terbak Untuk menentukan varabel dskrmnator dan subset varabel terbak dalam analss dskrmnan dskrt dua kelompok dapat dgunakan Statstk Kullback Dvergence. Varabel Dskrmnan terbak dlakukan dengan langkah langkah sebaga berkut : (1) Htung nla dengan rumus : j j n w w w w w w w w J log log w w w w 1 j 1j 2j 1j 2j 1j 2j 2j 1 2 1 1 1 j 2 j 2 2 1 j 2 j (2) tentukan nla j yang maxmum : j = max j dengan 1 =j = p (3) Uj sgnfkan Z 1 Melawan Statstk ujnya adalah j dengan krtera tolak Ho jka j > dengan dk = 1 3. APLIKASI Dalam mengkategorkan apakah setap produk ISOLATIG COCK L I dalam hal n Ar Brake yang dhaslkan oleh PT PIDAD Persero termasuk 884
kategor yang bak atau harus ada perbakan telah dlakukan pemerksaan atas 5 komponen : Housng (X 1 ), Flens (X 2 ), Ventlas (X 3 ), Penutup(X 4 ), dan Segmen (X 5 ). Masng-masng komponen dnla atas krtera bocor (skor 1) atau bak ( skor 0). Dar 336 sampel acak, telah dkelompokkan atas 32 kelompok berdasarkan 5 komponen pemerksaan sebaga berkut : Tabel 3.2 Data Hasl Pemerksaan Lma Komponen ISOLATIG COCK L I/Ar Brake Komponen Jumlah Hasl X 1 X 2 X 3 X 4 X 5 Bak Jelek Pengujan 1 0 0 0 0 0 47 0 47 2 1 0 0 0 0 7 2 9 3 0 1 0 0 0 6 0 6 4 0 0 1 0 2 2 14 16 5 0 0 0 1 0 1 45 46 6 0 0 0 0 1 1 5 6 7 1 1 0 0 0 2 1 3 8 1 0 1 0 0 4 12 16 9 1 0 0 1 0 1 13 14 10 1 0 0 0 1 2 2 4 11 0 1 1 0 0 2 5 7 12 0 1 0 1 0 6 4 10 13 0 1 0 0 1 0 1 1 14 0 0 1 1 0 6 21 27 15 0 0 1 0 1 1 4 5 16 0 0 0 1 1 2 8 10 17 1 1 1 0 0 5 1 6 18 1 1 0 1 0 1 3 4 19 1 1 0 0 1 4 2 6 20 1 0 1 1 0 7 6 13 21 1 0 1 0 1 2 2 4 22 1 0 0 1 1 4 2 6 23 0 1 1 1 0 1 20 21 24 0 1 1 0 1 3 5 8 25 0 1 0 1 1 1 3 4 26 0 0 1 1 1 1 12 13 27 0 1 1 1 1 0 5 5 28 1 0 1 1 1 1 9 10 29 1 1 0 1 1 2 1 3 30 1 1 1 0 1 4 0 4 31 1 1 1 1 0 0 2 2 32 1 1 1 1 1 0 0 0 Jumlah 126 210 336 885
Dar 336 buah Ar brake dbag atas dua kelompok sampel yatu sebaga Analyss Sample sebanyak 252 buah dan ssanya 84 buah sebaga Holdout Sample (Lampran 1 dan Lampran 2) Berdasarkan data dalam Lampran 1, selanjutnya dlakukan pengujan hpotess H : : Tdak terdapat perbedaan propors o 1 2 Melawan H 1 : 1 2 : Terdapat perbedaan propors Statstk uj nya adalah : (Lampran 3) yang bersfat sgnfkans dengan Ch-kuadrat tabel = 43,8 untuk dk = 31, n memberkan hasl yang menyatakan terdapat perbedaan antara kedua kelompok. Selanjutnya dapat dtentukan varabel dskrmnator dan Subset varabel terbak dalam membedakan kelompok perlu perbakan dan kelompok tdak perlu perbakan yatu dengan menghtung nla pengamatan X : Tabel 3.3 Varabel Dskrmnator Varabel X 1 0,684 X 2 0,010 X 3 6,717 X 4 3,279 X 5 0,001 untuk masng-masng varabel Sedangkan subset varabel terbaknya adalah : Tabel 3.4 Subset varabel Dskrmnator Varabel Df la krts X 3 6,72 1 3,84 X 4 X 3 12,76 3 7,81 X 4 X 5 X 3 17,83 7 14,07 X 2 X 4 X 5 X 3 42,69 15 25,00 X 1 X 2 X 4 X 5 X 3 22,04 31 44,97 886
Dar tabel d atas terlhat bahwa varabel X 2 X 4 X 5 X 3 mempunya nla yang terbesar, n dapat dartkan bahwa keempat varabel tersebut merupakan subset varabel yang terbak untuk membedakan antara kelompok yang perlu perbakan dan kelompok tanpa perbakan. Dar Analyss Sample dapat dtentukakan aturan klasfkas (Lampran 4) sebaga berkut : Tabel 3.5 Tabel Aturan Klasfkas Susunan X1 X2 X3 X4 X5 Perlu Tdak Perlu Memperoleh Memperoleh 1 0 0 0 0 0 V 2 0 0 0 1 0 V 3 0 0 1 0 0 V 4 0 0 1 1 0 V 5 0 1 0 0 0 V 6 0 1 0 1 0 V 7 0 1 1 0 0 V 8 0 1 1 1 0 V 9 1 0 0 0 0 V 10 1 0 0 1 0 V 11 1 0 1 0 0 V 12 1 0 1 1 0 V 13 1 1 0 0 0 V 14 1 1 0 1 0 v 15 1 1 1 0 0 V 16 1 1 1 1 0 V 17 0 0 0 0 1 V 18 0 0 0 1 1 V 19 0 0 1 0 1 V 20 0 0 1 1 1 V 21 0 1 0 0 1 V 22 0 1 0 1 1 V 23 0 1 1 0 1 V 24 0 1 1 1 1 V 25 1 0 0 0 1 v 26 1 0 0 1 1 V 27 1 0 1 0 1 V 28 1 0 1 1 1 V 29 1 1 0 0 1 v 30 1 1 0 1 1 v 31 1 1 1 0 1 V 32 1 1 1 1 1 V 887
Dar tabel d atas dapat dketahu bahwa untuk susunan : 1 yatu susunan (0 0 0 0 0 ), 6(0 1 0 1 0), 8(0 1 1 1 0), 9(1 0 0 0 0), 12(1 0 1 1 0), 14(1 1 0 1 0 ), 25(1 0 0 0 1 ), 29(1 1 0 0 1 ), dan 30(1 1 0 1 1) berasal dar kelompok komponen yang tdak perlu memperoleh perbakan, maka jka terdapat komponen yang mempunya hasl pemerksaan sama dengan kelompok pemerksaan tersebut, maka komponen tersebut dapat dkelompokan tdak perlu perbakan. Sedangkan untuk susunan : 2 yatu susunan (0 0 0 1 0), 3(0 0 1 0 0 ), 4(0 0 1 1 0), 5(0 1 0 0 0 ), 7(0 1 1 0 0 ), 10(1 0 0 1 0 ), 11( 1 0 1 0 0), 13(1 1 0 0 0 ), 15(1 1 1 0 0 ), 16(1 1 1 1 0 ), 17(0 0 0 0 1), 18(0 0 0 1 1 ), 19(0 0 1 0 1), 20(0 0 1 1 1), 21(0 1 0 0 1 ), 22(0 1 0 1 1), 23( 0 1 1 0 1 ), 24(0 1 1 1 1 ), 26(1 0 0 1 1),27(1 0 1 0 1 ), 28(1 0 1 1 1), dan 31(1 1 1 0 1), 32 (1,1,1,1,1,1) sehngga jka terapat komponen mempunya hasl pemerksaan yang sama dengan kelompok pemerksaan tersebut, maka komponen tersebut dkelompokan perlu perbakan. Perhtungan kesalahan klasfkas dhtung dar Holdout Sample yang telah dkelompokkan sepert pada Lampran 2, dan dperoleh matrks klasfkas sebaga berkut : Tabel 3.6 Matrk Klasfkas Alokas Tdk Perlu Perlu Jumlah Tdak perlu 13 11 24 Alokas Perlu 22 38 60 Jumlah 35 49 84 Dar Tabel 5 dapat dhtung APER = 0,393, atau dapat dketahu kesalahan pengklasfkasan sebesar 39,3 persen. 888
4. KESIMPULA 1. Dalam mengelompokkan ar Brake kedalam kelompok perlu perbakan dan tdak perlu perbakan dengan menggunakan 5 varabel pengamatan yang dnla dalam skala bnom d PT Pndad (Persero) menunjukkan peluang kesalahan klasfkas sebesar 39,3 % 2. Dar ke lma buah varabel pengamatan, varabel X 3 (pemerksaan ventlas) merupakan varabel dskrmnator yang mempunya kontrbus palng besar dbandngkan dengan empat varabel lannya. 3. Pengklasfkasan produk Ar Brake, tdak perlu dengan kelma varabel, tetap cukup dengan 4 buah varabel pengamatan yatu dengan menghlangkan varabel X 1 (Housng) sehngga lebh efsen. DAFTAR PUSTAKA York, Jonh Wley & Sons Dscreate Dscrmnant Analyss.. ew Har, Joseph F., Rolph E Anderson., Roland L. tatham., and Wllam C. Black., Multvarate Data Analyss nternatonal, Inc., Upper Saddle Rver, ew Jersey. Rencher., Alvn C., (1995 Sons, Inc, USA. Methods of Multvarate Analyss Jakarta. Analss Multvarat, Art dan Interpretas 889
Lampran 1 Tabel Frekuens Observas Sample Analyss Tdak Perlu Memperoleh Perlu Memperoleh Susunan X1 X2 X3 X4 X5 1 0 0 0 0 0 20 0 20 2 0 0 0 1 0 2 21 23 3 0 0 1 0 0 5 18 23 4 0 0 1 1 0 5 13 18 5 0 1 0 0 0 4 7 11 6 0 1 0 1 0 6 4 10 7 0 1 1 0 0 1 2 3 8 0 1 1 1 0 1 9 10 9 1 0 0 0 0 5 1 6 10 1 0 0 1 0 1 10 11 11 1 0 1 0 0 4 5 9 12 1 0 1 1 0 2 1 3 13 1 1 0 0 0 0 1 1 14 1 1 0 1 0 3 1 4 15 1 1 1 0 0 0 1 1 16 1 1 1 1 0 5 15 20 17 0 0 0 0 1 1 6 7 18 0 0 0 1 1 1 2 3 19 0 0 1 0 1 0 5 5 20 0 0 1 1 1 0 1 1 21 0 1 0 0 1 1 2 3 22 0 1 0 1 1 2 2 4 23 0 1 1 0 1 2 2 4 24 0 1 1 1 1 0 6 6 25 1 0 0 0 1 4 0 4 26 1 0 0 1 1 3 3 6 27 1 0 1 0 1 2 11 13 28 1 0 1 1 1 2 2 4 29 1 1 0 0 1 4 3 7 30 1 1 0 1 1 4 1 5 31 1 1 1 0 1 3 4 7 32 1 1 1 1 1 0 0 0 Jumlah 890
Lampran 2 Tabel Dstrbus Frekuens Observas (Holdout Sample) Sus una n X1 X2 X3 X4 X5 Perlu Memperoleh Ju mla h Tdak Perlu Memperoleh 1 0 0 0 0 0 2 0 2 2 0 0 0 1 0 1 2 3 3 0 0 1 0 0 2 3 5 4 0 0 1 1 0 3 2 5 5 0 1 0 0 0 1 1 2 6 0 1 0 1 0 0 2 2 7 0 1 1 0 0 1 2 3 8 0 1 1 1 0 2 0 2 9 1 0 0 0 0 1 1 2 10 1 0 0 1 0 1 1 2 11 1 0 1 0 0 0 2 2 12 1 0 1 1 0 2 1 3 13 1 1 0 0 0 0 1 1 14 1 1 0 1 0 2 1 3 15 1 1 1 0 0 1 2 3 16 1 1 1 1 0 1 2 3 17 0 0 0 0 1 1 2 3 18 0 0 0 1 1 0 3 3 19 0 0 1 0 1 1 1 2 20 0 0 1 1 1 2 1 3 21 0 1 0 0 1 1 5 6 22 0 1 0 1 1 0 2 2 23 0 1 1 0 1 2 1 3 24 0 1 1 1 1 1 2 3 25 1 0 0 0 1 1 2 3 26 1 0 0 1 1 1 1 2 27 1 0 1 0 1 0 1 1 28 1 0 1 1 1 1 1 2 29 1 1 0 0 1 2 2 4 30 1 1 0 1 1 1 1 2 31 1 1 1 0 1 1 1 2 32 1 1 1 1 1 0 0 0 Tot al Jumlah 35 49 84 884
Lampran 3 Perhtungan Statstk Uj Susunan X1 X2 X3 X4 X5 Tdak Perlu Memperoleh Perlu Memperoleh 1 0 0 0 0 0 20 0 0.058742 0 2 0 0 0 1 0 2 21 0.043796 0.006549 3 0 0 1 0 0 5 18 0.00862 0.002052 4 0 0 1 1 0 5 13 0.002179 0.000606 5 0 1 0 0 0 4 7 0.000004 0.000001 6 0 1 0 1 0 6 4 0.005241 0.002875 7 0 1 1 0 0 1 2 0.000051 0.000016 8 0 1 1 1 0 1 9 0.016405 0.00261 9 1 0 0 0 0 5 1 0.010595 0.010129 10 1 0 0 1 0 1 10 0.020017 0.003052 11 1 0 1 0 0 4 5 0.000589 0.000235 12 1 0 1 1 0 2 1 0.002465 0.001556 13 1 1 0 0 0 0 1 0 0.000464 14 1 1 0 1 0 3 1 0.005046 0.003853 15 1 1 1 0 0 0 1 0 0.000464 16 1 1 1 1 0 5 15 0.00433 0.001124 17 0 0 0 0 1 1 6 0.007017 0.001324 18 0 0 0 1 1 1 2 0.000051 0.001556 19 0 0 1 0 1 0 5 0 0.002321 20 0 0 1 1 1 0 1 0 0.000464 21 0 1 0 0 1 1 2 0.000051 0.001556 22 0 1 0 1 1 2 2 0.000742 0.000332 23 0 1 1 0 1 2 2 0.000742 0.000332 24 0 1 1 1 1 0 6 0 0.002785 25 1 0 0 0 1 4 0 0.011748 0.001856 26 1 0 0 1 1 3 3 0.001114 0.000499 27 1 0 1 0 1 2 11 0.011431 0.002242 28 1 0 1 1 1 2 2 0.000742 0.000332 29 1 1 0 0 1 4 3 0.002892 0.001496 30 1 1 0 1 1 4 1 0.007785 0.006761 31 1 1 1 0 1 3 4 0.000291 0.000112 32 1 1 1 1 1 0 0 0 0 Total 93 159 = 44,776 885
Lampran 4 Proses Perhtungan Dalam Menentukan Aturan Klasfkas Dengan : f x x j j ; j = 1, 2 ; Susuna n X 1 X 2 X 3 X 4 X 5 Tdak Perlu Memperole h 1 Perlu Memperole h 1 0 0 0 0 0 20 0 0,21 5 2 0 0 0 1 0 2 21 0,02 1 3.. 2 f 1 (x) f 2 (x) g 1 g 2 0 0,07 9 0,13 0,00 2 7 0 0,08 3 31 1 1 1 0 1 3 4 0,03 2 0,02 5 0,01 2 0,01 6 32 1 1 1 1 1 0 0 0 0 0 0 Total 93 159 886