FUZZY C-MEANS UNTUK CLUSTERING DATA (STUDI KASUS : DATA PERFORMANCE MENGAJAR DOSEN) Emha Taufiq Luthfi STMIK AMIKOM Yogyakarta e-mail : emha_tl@yahoo.com Abstraksi Clustering merupakan proses pengelompokan data dalam kelas-kelas atau cluster-cluster sehingga data dalam suatu cluster memili tingkat persamaan yang tinggi satu dengan lainnya tetapi sangat berbeda dengan data dalam cluster lain. Dalam tulisan ini dilakukan percobaan penggunaan metode Fuzzy C-Means untuk mengetahui kemungkinan adanya cluster-cluster dari data performance mengajar dosen. Kata kunci : Clustering, Fuzzy C-Means, Data Performance Mengajar Dosen. PENDAHULUAN Untuk evaluasi proses pengajaran oleh dosen selama satu semester, salah satu cara dengan meminta mahasisa untuk memberan penilaian terhadap performance dosen dalam mengampu suatu mata kuliah selalu satu semester dalam beberapa kriteria penilaian. Kriteria yang digunakan antara lain : N : Penguasaan dan kemampuan dalam menjelaskan materi N : Kemampuan dalam menjaab pertanyaan N3 : Kemampuan dalam memberi motivas mahasisa N4 : kemampuan membuat suasana kelas menyenangkan N5 : Kedisiplinan hadir dalam perkuliahan Dari nilai kelima kriteria tersebut, didapat nilai indeks prestasi kumulatif dosen dalam mengampu suatu mata kuliah selama satu semester. Seorang dosen dalam satu semester mungkin harus mengampu lebih dari satu mata kuliah. Atau satu mata kuliah mungkin harus diampu oleh lebih dari seorang dosen. Proses clustering yang dilakukan, akan mencoba mengetahui kemungkinan adanya kelompokkelompok yang mungkin belum detahui dari data performance mengajar dosen terhadap suatu mata kuliah.. FUZZY C-MEANS Fuzzy C-means Clustering (FCM), atau denal juga sebagai Fuzzy ISODATA, merupakan salah satu metode clustering yang merupakan bagian dari metode Hard K-Means. FCM menggunakan model pengelompokan fuzzy sehingga data dapat menjadi anggota dari semua kelas atau cluster terbentuk dengan derajat atau tingkat keanggotaan yang berbeda antara 0 hingga. D
Tingkat keberadaan data dalam suatu kelas atau cluster ditentukan oleh derajat keanggotaannya. Tekn ini pertama kali diperkenalkan oleh Jim Bezdek pada tahun 98. Konsep dasar FCM, pertama kali adalah menentukan pusat cluster yang akan menandai lokasi ratarata untuk tiap-tiap cluster. Pada kondisi aal, pusat cluster ini masih belum akurat. Tiap-tiap data memili derajat keanggotaan untuk tiap-tiap cluster. Dengan cara memperbai pusat cluster dan nilai keanggotaan tiap-tiap data secara berulang, maka dapat dilihat baha pusat cluster akan menujui lokasi yang tepat. Perulangan ini didasarkan pada minimasi fungsi obyektif (Gelley, 000). Fungsi obyektif yang digunakan FCM adalah (Ross, 005) : J ( U, V; X ) = ( μ ) dengan є [, ], n C k= i= ( d ) m d = d( x v ) = ( x v ) k i kj ij j= X adalah data yang dicluster : x K x m X = M M x L x n nm dan V adalah matrs pusat cluster : v K v m V = M M v L v c cm / Nilai J terkecil adalah yang terba, sehingga : J * ( U *, V * ; X ) = min J ( U, V, X ) M fc Algoritma FCM secara lengkap diberan sebagai berut (Zimmerman, 99); (Yan, 994); (Ross, 005) :. Tentukan : a. Matrs X berukuran n x m, dengan n = jumlah data yang akan di cluster; dan m = jumlah variabel (kriteria). b. Jumlah cluster yang akan dibentuk (C ) c. Pangkat (pembobot > ) d. Maksimum iterasi e. Kriteria penghentian ( ε = nilai positif yang sangat kecil). Bentuk matrs partisi aal U (derajat keanggotaan dalam cluster); matrs partisi aal biasanya dibuat secara acak D
μ ( x ) = U M μ ( x ) c μ ( x μ ( x c ) ) L L L n n n n M cn n 3. Hitung pusat cluster V untuk setiap cluster V n k= = ij n ( μ ) k= ( μ ) x kj 4. Perbai derajat keanggotaan setiap data pada setiap cluster (perbai matrs partisi) C d μ = d dengan : d /( ) = j jk m = d( xk vi) = ( xkj vij ) j= / 5. Tentukan kriteria penghentian iterasi, yaitu perubahan matrs partisi pada iterasi sekarang dan iterasi sebelumnya Δ = U t U t Apabila Δ< ε maka iterasi dihentan. 3. PERCOBAAN Clustering dengan metode FCM terhadap data performance mengajar dosen di suatu semester dilakukan untuk mengetahui cluster-cluster yang mungkin ada dan memili pola tertentu dengan parameter sebagai berut :. Matrs input satu dimensi berupa nilai indeks prestasi mengajar seorang dosen pada mata kuliah tertentu pada program studi tertentu.. Jumlah cluster yang dicoba dibentuk = C = 4 3. Pangkat (pembobot) = = 4. Maksimum Iterasi = 000 5. Kriteria penghentian = ε = 0-6 Implementasi dilakukan dengan menggunakan softare matlab. 4. HASIL Penghitungan pusat cluster dan perbaan nilai keanggotaan akan dihentan pada iterasi ke 4. Pada iterasi tersebut, nilai Δ = 7.86e-007. Nilai Pusat cluster adalah V = [.4485 3.564.8508.8508] D 3
Nilai pusat cluster 3 dan 4 memili nilai sama, sehingga terbentuk hanya 3 cluster. Pada Percobaan lain mungkin didapat hasil yang sedit berbeda, darenakan inisialisasi aal matrs partisi yang dilakukan secara acak. Mata Kuliah Dosen Jenjang IP_MK Kecenderungan Cluster c c c3 c4 Akuntansi I I D3.87 0.00 0.00 0.4989 0.4989 Akuntansi I SDMM S REG.4 0.989 0.00 0.0075 0.0075 Aljabar Linier E D3.68 0.068 0.0333 0.3799 0.3799 Aljabar Linier RJ D3 3.0 0.0053 0.9454 0.047 0.047 Aljabar Linier SM S REG.76 0.040 0.058 0.47 0.47 Analisis Kinerja Sistem MDI S TR.56 0.45 0.35 0.33 0.33 Analisis Kinerja Sistem MDI S REG. 0.67 0.056 0.359 0.359 Analisis Laporan Keuangan SH S REG.80 0.003 0.006 0.498 0.498 Analisis Laporan Keuangan SH D3.87 0.00 0.00 0.4989 0.4989 Analisis Sistem Informasi HAF D3 3.0 0.03 0.67 0.4003 0.4003 Analisis Sistem Informasi MHT S REG 3. 0.09 0.598 0.89 0.89 Analisis Sistem Informasi SMT S REG.59 0.6 0.076 0.80 0.80 Analisis Sistem Informasi WW D3.94 0.056 0.0376 0.4734 0.4734 Bahasa Inggris II TS D3 3.55 0.0499 0.704 0.38 0.38 Bahasa Inggris II TS S REG 3.60 0.059 0.664 0.393 0.393 Broadcasting TV MSMM S TR.86 0.0003 0.0003 0.4997 0.4997 Broadcasting TV MSMM S REG.9 0.008 0.043 0.4888 0.4888 Broadcasting TV MSMM S REG.98 0.06 0.096 0.439 0.439 E-Business MSMM S TR.97 0.035 0.0779 0.4493 0.4493 E-Commerce J S REG.49 0.975 0.008 0.08 0.08 E-Commerce J D3.7 0.03 0.059 0.4364 0.4364 Interaksi Manusia dan Komputer PSM S TR 3. 0.065 0.643 0.65 0.65 Interaksi Manusia dan Komputer PSM S REG 3.9 0.006 0.9869 0.0058 0.0058 Jaringan Komputer AP D3.5 0.933 0.0063 0.0303 0.0303 Jaringan Komputer MS S REG 3.46 0.03 0.79 0.0884 0.0884 Keamanan Komputer MD S TR 3.00 0.0304 0.404 0.446 0.446 Kepemimpinan ASSH D3.66 0.79 0.035 0.349 0.349 Kepemimpinan MI D3.8 0.0034 0.005 0.497 0.497 Kepemimpinan SPDMM S REG.3 0.7733 0.035 0.0958 0.0958 Keirausahaan AMT S REG.36 0.9304 0.009 0.0303 0.0303 Keirausahaan AMT S REG.73 0.083 0.035 0.447 0.447 Keirausahaan AMT S REG.76 0.040 0.058 0.47 0.47 D 4
Mata Kuliah Dosen Jenjang IP_MK Kecenderungan Cluster c c c3 c4 Keirausahaan KP D3.66 0.79 0.035 0.349 0.349 Keirausahaan KP D3.70 0.478 0.030 0.4 0.4 Komputer Grafis AFS S REG.70 0.478 0.030 0.4 0.4 Komputer Grafis AY D3.87 0.00 0.00 0.4989 0.4989 Komunasi Data K D3.88 0.003 0.003 0.4974 0.4974 Komunasi Data K S REG.95 0.083 0.0489 0.4664 0.4664 Komunasi Data RMAKR D3.76 0.040 0.058 0.47 0.47 Komunasi Data RMAKR S REG 3.0 0.03 0.67 0.4003 0.4003 Manajemen Stratej FA S TR 3.9 0.0074 0.9 0.0353 0.0353 Matemata Diskret SM S TR.60 0.5609 0.099 0.046 0.046 Metodelogi Penelitian HS D3 3.07 0.0355 0.3943 0.85 0.85 Metodelogi Penelitian ES S REG.43 0.9956 0.0005 0.009 0.009 Pemp. Basis Data AA D3.98 0.06 0.096 0.439 0.439 Pemp. Basis Data AS D3.76 0.040 0.058 0.47 0.47 Pemp. Basis Data ETL S REG.87 0.00 0.00 0.4989 0.4989 Pemp. Basis Data MRA S REG.57 0.75 0.03 0.33 0.33 Pemp. Berorientasi Objek II AB D3.44 0.999 0.000 0.0004 0.0004 Pemp. Berorientasi Objek II ASMT D3.53 0.876 0.0 0.0565 0.0565 Pemp. Berorientasi Objek II WW D3 3.00 0.0304 0.404 0.446 0.446 Pemp. Berorientasi Obyek II KMT S REG.53 0.876 0.0 0.0565 0.0565 Pemp. Terstruktur AA S REG.9 0.004 0.005 0.4845 0.4845 Pemp. Terstruktur EHS D3 3.53 0.046 0.70 0.69 0.69 Pemp. Terstruktur HP S REG.54 0.8407 0.037 0.078 0.078 Pengelolaan Instalasi Komputer RW D3 3.9 0.0074 0.9 0.0353 0.0353 Pengelolaan Instalasi Komputer MHP S REG.9 0.008 0.043 0.4888 0.4888 Pengelolaan Proyek SI MHT S TR 3.8 0.0098 0.894 0.048 0.048 Pengelolaan Proyek SI MHT S REG 3.07 0.0355 0.3943 0.85 0.85 Perancangan Multimedia MSMM D3.96 0.009 0.063 0.4584 0.4584 Perancangan Multimedia MSMM S REG 3.3 0.00 0.9893 0.0048 0.0048 Perancangan Multimedia TI D3.84 0.0004 0.0003 0.4996 0.4996 Perancangan Multimedia TI S REG.95 0.083 0.0489 0.4664 0.4664 Perilaku Organisasi AR S REG 3.8 0.0098 0.894 0.048 0.048 Perilaku Organisasi BS D3 3.34 0.008 0.937 0.074 0.074 Rekayasa Perangkat Lunak SP S TR.48 0.984 0.006 0.007 0.007 D 5
Mata Kuliah Dosen Jenjang IP_MK Kecenderungan Cluster c c c3 c4 Sistem Informasi Akuntansi SH S REG.70 0.478 0.030 0.4 0.4 Sistem Informasi Akuntansi SH D3.88 0.003 0.003 0.4974 0.4974 Sistem Pakar HAF S REG 3.7 0.04 0.864 0.063 0.063 Sistem Pakar HAF S TR 3.33 0.0066 0.9486 0.04 0.04 Sistem Penunjang Keputusan MD S REG 3.8 0.0098 0.894 0.048 0.048 Sistem Penunjang Keputusan SP S TR.3 0.8675 0.086 0.0569 0.0569 Sistem Penunjang Keputusan SP S REG.54 0.8407 0.037 0.078 0.078 Statist MCM D3 3.3 0.038 0.694 0.49 0.49 Statist S S REG.96 0.009 0.063 0.4584 0.4584 Statist SS D3.7 0.03 0.059 0.4364 0.4364 Statist ZM S REG.57 0.75 0.03 0.33 0.33 Testing dan Implementasi Sistem SR S REG.66 0.79 0.035 0.349 0.349 Testing dan Implementasi Sistem SR S TR.8 0.0034 0.005 0.497 0.497 V V 3, V 4 V Gambar Hasil FCM pada Iterasi akhir Cluster c didapat untuk nilai matrs input (IPK) antara.56 sampai dengan.60. Cluster c didapat untuk nilai matrs input (IPK) antara 3.07 sampai dengan 3.60. Sedangkan cluster c3 dan c4 untuk nilai matrs input (IPK).66 sampai dengan 3.0. Contoh hal yang dapat dilihat misal, untuk mata kuliah Pemrograman Basis Data yang diampu oleh 4 orang dosen memili kecenderungan berada pada cluster c3,c4 dengan derajat keanggotaan yang rendah serta dosen berada pada cluster c dengan derajat keanggotaan cukup tinggi. Begitu pula mata kuliah Pemrograman Berorientasi Obyek, untuk 4 orang dosen pengampu memili kecenderungan berada pada cluster c3,c4 serta cluster c. Atau mungkin dapat diamati mata kuliah atau dosen yang memili kecenderungan berada di cluster c. Untuk percobaan lebih lanjut, perlu dicoba clustering dengan lebih dari variabel input. Semisal, untuk kasus data performance dosen dapat dilakukan clustering dengan kombinasi input kriteria penilaian N, N, N3, N4 dan N5. D 6
5. KESIMPULAN Clustering merupakan proses pengelompokan obyek atau data tidak berlabel kedalam suatu kelas atau cluster dengan obyek yang memili kesamaan. Clustering dengan menggunakan metode Fuzzy C-Means terhadap data performance mengajar dosen, dapat memunculkan beberapa cluster data yang dapat dianalisa lebih lanjut persamaan dan perbedaannya. 6. DAFTAR PUSTAKA Lin, Ching-Teng; Lee, George. 996. Neural Fuzzy Systems : A Neuro-Fuzzy Synergism to Intelligent Systems. United States of America. Prentice Hall International Inc. Kusumadei, Sri; Hartati, Sri. 006. Neuro-Fuzzy : Integrasi Sistem Fuzzy dan Jaringan Syaraf. Yogyakarta. Graha Ilmu. http://.cs.bris.ac.uk/home/tr690/documentation/fuzzy_clustering_initial_report/node.html D 7