KLASTERISASI SINYAL SUARA MENGGUNAKAN METODE PARTICLE SWARM OPTIMIZATION PADA PENGEMBANGAN SISTEM PENGENALAN INDIVIDU BERBASIS SUARA UCAPAN Abstra Nama: Moh. Bagus Had S (Nrp 1205 100 037) Dosen Pembmbng: Drs. Nurul Hdayat M.Kom Jurusan Matemata Faultas Matemata dan Ilmu Pengetahuan Alam Insttut Tenolog Sepuluh Nopember Surabaya 2010 Emal: just_bagus@yahoo.com Bometra merupaan cabang dar matemata terapan yang membahas tentang dentfas ndvdu berdasaran cr-cr bologs yang bersfat un. Cr-cr tersebut tda mudah denal oleh omputas sehngga perlu dcar suatu metode yang tepat untu menggal nformas dar cr-cr tersebut. Salah satu bdang dar bometra adalah pengenalan suara. Peneltan n menggunaan metode lastersas Partcle Swarm Optmzaton (PSO) pada tahap pengelompoan cr sstem pengenalan suara. Data yang aan dlauan proses lastersas adalah data magntude hasl proses estmas Trspetrum. Proses lastersas bertujuan untu mencar data magntude pewal dar masng-masng laster untu djadan masuan pada laps nput dar Jarngan Syaraf Truan Learnng Vector Quantzaton (JST-LVQ) pada tahap lasfas. Dar uj coba yang dlauan, adanya perbedaan jumlah laster tda mempengaruh hasl pengenalan secara sgnfan. Perubahan tngat pengenalan yang cuup sgnfan terjad pada saat adanya penambahan jumlah referens d dalam proses pembelajaran. Seman banya jumlah referens suara yang dlauan proses pembelajaran, seman menngat pula hasl pengenalan sstem. Uj coba dlauan terhadap 10 ata dar pembcara yang sama, 1 ata dar 20 pembcara yang berbeda, dan 20 ata dar pembcara yang berbeda. Dengan mengambl lma referens untu masng-masng ata, metode Partcle Swarm Optmzaton mampu mengenal ata yang d ucapan hngga 81% Kata Kunc: Trspetrum, Partcle Swarm Optmzaton, Learnng Vector Quantzaton 1. Pendahuluan Sstem pengenalan suara adalah bagan dar bometra yang merupaan cabang matemata terapan yang muncul dan berembang pada era globalsas. Bdang garap bometra adalah mengdentfas ndvdu berdasaran cr-cr fsologs dan tngah lau yang dml oleh ndvdu tersebut. Salah satu cr yang dapat dgunaan untu mengdentfas ndvdu adalah melalu suara ucapan. Saat n, aplas dar system pengenalan suara sudah banya dpasaran secara omersal. Aplas n membantu manusa dalam melauan peerjaan hususnya yang berhubungan dengan pengendalan dan pengontrolan erja sumber daya. Dalam melauan pengendalan erja, cara n lebh memeberan emudahan ja dbandngan dengan cara yang lan, msalnya dengan mengetan perntah dar eyboard. Hal n darenaan suara merupaan alat omunas yang sangat sederhana dan bersfat alam sehngga memudahan manusa dalam memberan perntah. Suara dapat djadan sebaga penanda ndvdu, arena setap ndvdu mempunya araterst suara yang spesf. Hal tu dsebaban oleh adanya perbedaan spetrum suara, perbedaan freuens dan ampltudo dantara ndvdu. Dalam membangun sstem
pengenalan suara, secara umum terdapat empat tahapan yang harus dlauan (Amn, 2006), yatu auss data suara, estmas snyal suara, pengelompoan cr, serta lasfas snyal suara. Data snyal suara dperoleh dengan bantuan alat peream sepert mrofon (snyal analog) dan emudan dubah menjad snyal dgtal dengan bantuan sound card pada Personal Computer (PC) (Adpranata,1999). Pada tahap pra pengolahan, dlauan proses estmas snyal suara yang emudan menghaslan data magntude dan fase. Dengan adanya magntude dan fase snyal suara, maa pola atau araterst dar ata yang ducapan dapat detahu. Proses estmas snyal suara dengan menggunaan estmas Bspetrum dan Trspetrum serta analssnya sudah dtelt dan dmplementasan (Rduwan,2007). Dar hasl yang dperoleh pada peneltan tersebut, menunjuan bahwa estmas trspetrum mempunya presentase pengenalan yang lebh bagus ja dbandngan dengan estmas bspetrum pada pengenalan ndvdu. Dalam proses lasfas suara, data yang dgunaan merupaan data magntude hasl prapengolahan dengan estmas trspetrum. Mengngat bahwa data yang ddapatan dar hasl prapengolahan mash berada dalam jumlah yang banya, maa hal n sangat berpengaruh terhadap lamanya proses lasfas. Untu tu, dperluan suatu metode lastersas untu mendapatan data magntude pewal dar masng-masng elompo (laster) sehngga dperoleh data yang lebh sedt untu dlauan proses lasfas. Pada tugas ahr n, dembangan perangat luna pengdentfas ndvdu berbass suara ucapan dengan menggunaan metode lastersas Partcle Swarm Optmzaton (PSO) pada tahap lastersasnya. Hasl lastersas yang dperoleh dar metode tersebut aan dgunaan sebaga nputan pada tahap lasfas menggunaan Jarngan Saraf Truan Lernng Vetor Quantzaton (JST- LVQ). Manfaat yang ddapat dar tugas ahr n antara lan, dapat dgunaan : 1. Untu membangun sstem eamanan menggunaan pengenalan ndvdu berbass suara ucapan. 2. Untu membuat peralatan eletron otomats yang cara erjanya berdasaran suara ucapan. 3. Untu mengembangan robot yang bsa dontrol menggunaan suara ucapan. 4. Sebaga referens dan sarana nformas dalam melauan lastersas data menggunaan metode PSO. Sedangan batasan masalah yang dgunaan sebaga acuan, antara lan : 1. Pengucapan ata satu persatu dan dlauan dengan suara normal. 2. Keadaan ruangan untu pengamblan ucapan dalam eadaan normal dan danggap tda ada nose. 3. Data yang dproses adalah data estmas yang dperoleh dar hasl proses estmas trspetrum terhadap data auss snyal suara. 4. Proses pereaman dan estmas snyal suara aan memanfaatan hasl yang sudah derjaan oleh Amn, (2006) dan Rduwan, (2007). 2. Estmas Trspetrum Estmas Trspetrum merupaan proses estmas snyal suara yang ddasaran pada orelas tga parameter freuens yatu f 1, f 2, dan f 3. Daerah estmas Trspetrum merupaan ruang tga dmens yang dbentu oleh vetor freuens f 1, f 2 dan f 3. Pada setap oordnat ( f 1, f 2, f 3 ) tersebut terdapat nla trspetrumnya, sehngga hasl estmas trspetrum dapat dataan berada dalam ruang empat dmens. Hasl estmas Trspetrum tersebut berupa magntude dan fase yang merupaan hasl transformas dar hasl estmas trspetrum tu sendr yang berbentu omples dalam oordnat artesus, edalam oordnat utub yang berbentu besaran magntude dan fase. Nla magntude hasl estmas trspetrum selanjutnya dlauan proses lastersas, dengan format eluaran dar hasl estmas adalah ( f 1, f 2, f 3, Magntude). 3. Partcle Swarm Optmzaton (PSO) Dalam lastersas PSO, satu partcle dalam swarm menunjuan suatu solus yang mungn dalam lastersas. Oleh arena tu, swarm merupaan umpulan solus yang mungn dalam lastersas untu seumpulan data. Jara rata-rata suatu data e pusat laster dgunaan sebaga ftness value untu mengevaluas solus yang dberan oleh tap partel.
Jara rata-rata suatu data e pusat laster pada metode lastersas PSO memenuh persamaan sebaga berut (Cu, 2004): f Nc 1 p j1 d( C,) m N P c j Sedangan untu jara suatu data e pusat laster, memenuh persamaan berut: d m 2 p j p j m 1 d( m,)() m / m m d dengan: N = Jumlah laster c P = Jumlah data yang dml tap laster. d( C,) m j = Jara antara pusat laster dengan data obje d m = Dmens ruang vetor M = Hmpunan data obje, M m, m, m,..., m } { 1 2 3 p X = Hmpunan pusat laster (Partel), X { C1, C2, C3,..., C } Algortma Klatersas PSO adalah sebaga berut : A. Insalsas 1. Tahap nsalsas Partel dan Velocty awal: a) Car nla masmum dan mnmum dar data data magntude. max max(m), mn mn(m) b) Insalsas nla awal laster sebanya Nc. C random*(max mn) X C c) Insalsas nla awal velocty sebanya Nc. V random*(max mn) Y V Set nla nerta factor (W), self confdence (C1), swarm confdence (C2). 2. Htung jara tap data magntude terhadap seluruh pusat laster, emudan masuan data magntude tersebut edalam pusat laster terdeatnya. IF d( C 1,) mj d( C,) mj THEN m 1, j m j Else m, j mj (2.1) END IF 3. Htung nla ftness untu tap partel f () X 4. Dapatan Local Best dan Global Best -Local Best (2.2) f ()() p f X p X Global Best g f ( p 0 ) X terba g p0 X B. Optmas terba 1. Update velocty tap v pusat laster g w* v c1* rnd* p x c2* rnd p x 1 * 2. Update poss tap pusat laster x 1 x v 1 3. Htung embal jara tap data magntude terhadap seluruh pusat laster, emudan masuan data magntude tersebut edalam pusat laster terdeatnya. IF d( C 1,) mj d( C,) mj THEN Else m 1, j m, j m j mj END IF 4. Htung nla ftness untu tap partel f () X 5. Update Local Best Dan Global Best -Local Best IF f ()() C f p THEN f ()() p f C
p C END IF -Global Best IF f ()() C f p g THEN f ()() p g f C g p C END IF 6. Langah Optmas D ulang hngga rtera eonvergenan terpenuh atau jumlah teras masmal terlampau. 4. Arstetur JST-LVQ Pada tahapan lasfas, data laster dlasfas edalam elas-elas yang sudah dtentuan dengan menggunaan metode Learnng Vector Quantzaton (LVQ). Data suara yang aan dlasfas, data lasternya harus mempunya uuran yang sama sehngga proses lasfas dapat dlauan. Algortma pembelajaran LVQ tersebut adalah sebaga berut (Fausett, 1994) : Arstetur jarngan syaraf truan yang dgunaan dalam peneltan n dpat dlhat pada Gambar 4.1 Gambar 4.1 Arstetur JST-LVQ 5.Metode Peneltan Peneltan yang dlauan n memfousan pada pengembangan sstem pengenalan suara pada tahap pengelompoan cr atau lastersas. Secara umum sstem pengenalan suara yang aan dbuat dalam peneltan n dapat dlha pada dagram alr Gambar 5.1 Gambar 5.1 Bagan Alr Metode Peneltan 6. Uj Coba dan Pembahasan Dalam melauan uj coba perangat luna, dgunaan sebuah noteboo dengan spesfas Processor AMD Turon 64 X2 TL- 60 2.0 Ghz, Memory DDR2 1968 MB, VGA NVIDIA GeForce 7000M, Montor 14,1 WXGA Crystal Brte LCD, Mcrophone SONICGEAR dan Loudspeaer Realte HD Audo Output. Sedangan untu perangat luna yang dgunaan adalah sstem opras Wndows XP Profesonal, Vsual Basc 6.0 sebaga tool untu membuat perangat luna.
Proses-proses yang ada dalam perangat luna pengenalan suara dantaranya adalah proses pereaman, estmas trspetrum, lastersas PSO, lasfas, testng dan plotng.uj coba yang dlauan pada sstem n menggunaan sampel chun sebesar 128 pada proses estmasnya. Pada proses lastersas dgunaan jumlah laster yatu 8, 16, dan 32. Dan untu proses lasfasnya menggunaan metode JST-LVQ dengan jumlah epoch 100 dengan menggunaan referens sebanya 1, 3, dan 5 referens suara dan nla learnng rate sebesar 0.01. 6.1 Proses Kastersas Data Estmas Pada proses lastersas, data hasl estmas trpsetrum yang dsmpan dalam bentu fle dlauan proses lastersas. Proses lastersas dapat dlauan terhadap beberapa data sealgus. Gambar 6.1 merupaan contoh program untu melauan proses lastersas terhadap data hasl estmas trspetrum. Gambar 6.3 Plottng data estmas dan laster PSO untu ata BUKA dengan sample chun 128 laster 16 Gambar 6.4 Plottng data estmas dan laster PSO untu ata BUKA dengan sample chun 128 laster 8. Gambar 6.1 Proses Klastersas Data Berut n dberan gambar-gambar hasl proses lastersas. 6.2 Proses Pembelajaran Data hasl lastersas emudan dlauan proses pembelajaran (tranng) untu mencar bobot yang aan dgunaan sebaga referens pada proses testng. Gambar 6.5 dan Gambar 6.6 merupaan tamplan program yang dgunaan untu proses pembelajaran. Gambar 6.2 Plottng data estmas dan laster PSO untu ata BUKA dengan sample chun 128 laster 32 Gambar 6.5 Proses Penetapan Data Target
Gambar 6.8 Dagram Prosentase Pengenalan Sstem Untu Masng-masng Kata; Chun 128, Epoch 100 dan Klaster 16 Gambar 6.6 Proses Klasfas Data Dalam melauan lasfas, data hasl lastersas dgunaan untu mengnsalsas nla bobot dar JST-LVQ. Parameter yang dgunaan dalam pembelajaran n adalah nla masmum epoch dan nla learnng rate. 6.3 Uj pengenalan Suara Dalam uj pengenalan suara, pengujan dlauan terhadap sepuluh jens ata yang berbeda, yatu ATAS, BAWAH, BUKA, KANAN, KIRI, MAJU, MUNDUR, NAIK, TURUN, TUTUP. Sepuluh jens ata tersebut dperoleh dar satu ndvdu. Setap jens ata dambl sebanya sepuluh al. Dalam pengujan n, pember sampel adalah penuls. Hasl dar proses uj pengenalan suara dberan dalam dagarm berut. Gambar 6.7 Dagram Prosentase Pengenalan Sstem Untu Masng-masng Kata; Chun 128, Epoch 100 dan Klaster 8 Gambar 6.9 Dagram Prosentase Pengenalan Sstem Untu Masng-masng Kata; Chun 128, Epoch 100 dan Klaster 32 6.4 Uj Pengenalan Indvdu Dalam pengujan n, sampel yang destmas dan dlauan pengenalan dperoleh dar sebuah ata yatu ata BUKA yang ducapan oleh duapuluh ndvdu yang berbeda. Setap ndvdu mengucapan ata BUKA sebanya lmapuluh al. Pada pengujan n, pember sampel berasal dar jens elamn la-la dan perempuan dengan usa yang berbeda beda. Berut n adalah tabel nformas ndvdu yang memberan sampel untu dgunaann pada uj pengenalan ndvdu. Tabel 4.1 Informas Indvdu Pember Sampel Suara No. Nama Kelamn Usa 1 Al L 24 2 Ansa P 18 3 Asworo L 22 4 Bagus L 23 5 Cgyp P 21 6 Darl L 21 7 Ganang L 20 8 Ipn L 19 9 Irvan L 21 10 Mawa P 22 11 Nla P 20 12 Norma P 21 13 Nove P 21 14 Paul L 20 15 Ratna P 20 16 Sant P 21 17 Septyan L 20
18 Suc P 19 19 Ugx L 22 20 Uln P 19 Pada percobaan n dgunaan sampel chun 128 dan epoch 100 serta jumlah laster masng-masng 32 laster dan 16 laster. Berut adalah hasl dar uj pengenalan ndvdu. Gambar 6.10 Dagram Prosentase Pengenalan Sstem Untu Uj Pengenalan Indvdu; du; Chun 128, Epoch 100 dan Klaster 16 Gambar 6.11 Dagram Prosentase Pengenalan Sstem Untu Uj Pengenalan Indvdu; du; Chun 128, Epoch 100 dan Klaster 32 Dar dagarm datas dapat dlhat hat bahwa untu uj pengenalan ndvdu, metode Partcle Swarm Optmzaton meml rata-rata pengenalan dengan nla prosentase pengenalan hanya 55% untu uj coba dengan 5 referens 46% untu uj coba dengan 3 referens dan 41% untu uj coba dengan 1 referens untu laster 32. Sedangan untu laster 16 rata-rata pengenalannya masng-masng 54%, 41% dan 34% untu uj coba dengan 5, 3 dan 1 referens. 6.5 Uj Pengenalan Nama Pengujan n menggunaan an sampel nama yang dperoleh dar suara duapuluh ndvdu yang berbeda. Setap ndvdu mengucapan namanya sebanya lmapuluh al. Dalam pengujan n, pember sampel berasal dar jens elamn la-la dan perempuan dengan usa yang berbeda beda. Berut n adalah tabel nformas ndvdu yang memberan sampel untu dgunaan pada uj pengenalan nama ndvdu Tabel 4.2 Informas Indvdu Pember Sampel Suara No. Nama Kelamn Usa 1 Ajeng P 20 2 Apang L 21 3 Asworo L 22 4 Bagus L 23 5 Cgyp P 21 6 Darl L 21 7 Ganang L 20 8 Ipn L 19 9 Iwan L 22 10 Nla P 20 11 Norma P 21 12 Nove P 21 13 Paul L 20 14 Ry L 19 15 Sant P 21 16 Septyan L 20 17 Satra L 19 18 Ugx L 22 19 Uln P 19 20 Vna P 20 Pada percobaan n dgunaan sampel chun 128 dan epoch 100 serta jumlah laster masng-masng 32 laster dan 16 laster. Berut adalah hasl dar uj pengenalan nama. Gambar 6.12 Dagram Prosentase Pengenalan Sstem Untu Uj Pengenalan Nama; Chun 128, Epoch 100 dan Klaster 32
1. Untu menghaslan laster yang lebh optmal, perlu dembangan dengan melauan penggabungan metode lastersas. 2. Untu menghaslan tngat pengenalan yang lebh bagus, perlu dembangan untu memaa metode Jarnganan Syaraf Truan yang lan. Gambar 6.13 Dagram Prosentase Pengenalan Sstem Untu Uj Pengenalan Nama; Chun 128, Epoch 100 dan Klaster 32 Dar uj coba datas, ddapat nformas bahwa untu uj pengenalan nama, metode Partcle Swarm Optmzaton meml rata-rata pengenalan dengan nla prosentase pengenalan hanya 66% untu ujcoba dengan 5 referens dan 46% untu uj coba dengan 3 referens dan 38% untu uj coba dengan 1 referens untu laster 32. Sedangan untu laster 16 rata-rata pengenalannya masng-masng 59%, 43% dan 41% untu uj coba dengan 5, 3 dan 1 referens. 7. Penutup 7.1. Kesmpulan Dar hasl uj coba yang dlauan, dapat dambl esmpulan sebaga berut. 1. Algortma Partcle Swarm Optmzaton telah drancang dan dmplementasan e dalam bentu perangat luna yang mampu melauan proses lastersas data suara hasl estmas. 2. Rancangan algortma lasfas telah berhasl dmplementasan e dalam bentu perangat luna yang mampu melauan proses lasfas data suara hasl lastersas. 3. Sebuah sstem perangat luna pengdentfas suara telah berhasl dbuat dar hasl ntegras program mula dar proses pereaman hngga lasfas dengan menggunaan Vsual Basc 6.0 4. Penggunaan metode Partcle Swarm Optmzaton untu lastersas dan JST- hasl LVQ untu lasfas memberan pengenalan yang relatv bagus. Dengan hasl rata-rata pengenalan mencapa 81%. 7.2 Saran Berdasaran hasl yang sudah dcapa pada peneltan n, terdapat beberapa hal yang perlu dpertmbangan untu pengembangan peneltan n, antara lan sebaga berut DAFTAR PUSTAKA Adpranata, R. 1999. Pengenalann suara manusa dengan metode jarngan saraf truan bac propagaton berbass PC. Unverstass Krsten Petra. Amn, M.S. 2006. Pengelompoan Cr dan Klasfas Snyal Suara Menggunaan Metode Kuantsas Vetor MSA-RLS dan Jarngan Syaraf Truan LVQ. Surabaya: Jurusan Matemata, Insttut Tenolog Sepuluh Nopember. Cu, X., Poto, T.E. Document Custerng usng Partcle Swarm Optmzaton. Oa Rdge : Appled Software Engnerng Research Group Computatonal Scences and Engnerng Dvson, Oa Rdge Natonal Laboratory. TN 37831-6085 Faradsa, R. 2007. Perbandngan Hasl Optmas Partcle Swarm Optmzaton (PSO) dan Genetc Algorthm (GA) Pa da Fungs Rosenbroc (BANANA FUNCTION). Surabaya : Jurusan Matemata, Insttut Tenolog Sepuluh Nopember. Fausett, L. 1994. Fundamentals of Neural Networs: Archtectures, Algorthms, and Applcatons. Prentce Hall Internatonal, Inc. Jumad, A. 2008. Perbandngan Antara Metode Klastersas RLS dan Fuzzy Clusterng pada Sstem Pengenalan Indvdu Berbass Suara Ucapan. Surabaya : Jurusan Matemata, Insttut Tenolog Sepuluh Nopember. Rduwan, M.A. 2007. Pembuatan Perangat Luna Pengestmas Snyal Suara Berbass Vsual. Surabaya: Jurusan Matemata, Insttut Tenolog Sepuluh Nopember.