ANALISA ENANG PENGARUH PANJANG SINYAL SUARA DAA PRIMER ERHADAP KINERJA SISEM IDENIFIKASI PEMBICARA Nurul Hdayat ) Ars jahyanto ) ) Jurusan Matematka FMIPA Insttut eknolog Sepuluh Nopember ) Jurusan Sstem Informas FIF Insttut eknolog Sepuluh Nopember Kampus IS Sukollo Surabaya 60 ABSRAK Peneltan n mencoba menganalsa pengaruh panjang snyal data prmer yang dolah menggunakan metode estmas trspektrum terhadap knerja sstem pembcara melalu snyal suara yang ducapkan. Proses pengolahan data prmer n dlakukan untuk mendapatkan estmas data magntudo dan fase snyal suara. Pada proses n snyal suara yang berupa sebuah kata yang ducapkan dbag menjad beberapa chunk. Setap chunk destmas kemudan dcar rata-ratanya. Hasl estmas n berupa data magntudo dan fase snyal dsmpan menjad beberapa kategor yakn dsmpan seluruh data separuh data seperempat dan seterusnya. Masngmasng danalsa berdasarkan waktu eksekus estmas jumlah data yang dhaslkan estmas tu dan pengaruhnya terhadap knerja sstem pembcara. Dar beberapa ujcoba menunjukkan bahwa ukuran panjang snyal yang destmas memberkan pengaruh yang cukup sgnfkan terhadap knerja sstem pada seperempat bagan atau yang lebh kecl lag. Lama eksekus proses estmas untuk seperempat seperdelapan dan seperenambelas bagan snyal tdak sampa satu detk. Sedangkan untuk satu bagan snyal membutuhkan semblan detk dan untuk setengah bagan snyal membutuhkan waktu eksekus selama satu detk. Kata kunc : Sstem dentfkas estmas trspektrum.. PENDAHULUAN. Latar Belakang Perkembangan teknolog nformas dewasa n mengalam kemajuan yang sangat pesat khususnya yang berkatan dengan alat-alat elektrons yang serba otomats prakts pemakaannya nyaman memlk portabltas tngg dan harganya terjangkau untuk kalangan menengah atas. Berbaga produk teknolog nformas yang dpasarkan saat n semakn memanjakan konsumen msalnya pesawat telepon yang memlk memory pntu elektrons mesn-mesn sensor robot dan lan-lan. Salah satu bagan pentng untuk dapat memberkan kontrbus terhadap perkembangan teknolog nformas adalah dengan mencptakan atau mengembangkan suatu sstem denttas (mes n) yang ddasarkan pada suara ucapan. Sampa dengan saat n pengembangan sstem suara n sudah banyak dlakukan bak oleh kalangan akadems maupun perusahaan-perusahaan yang memproduks peralatan elektronk namun belum bsa mencapa tngkat knerja yang dharapkan apalag sstem dentfkas yang bersfat real tme khususnya d Indonesa. Oleh karena tu saat n berbaga kalangan salng berlomba melakukan peneltan untuk mengembangkan sstem suara (pembcara) yang memlk knerja tngg dukur dar kemampuan mengdentfkas suara pada suasana tanpa nose maupun dengan nose dan bersfat real tme. Hal yang terpentng untuk membangun sstem dentfkas suara yang bersfat real tme adalah dengan menekan waktu komputas ( run tme) serendah mungkn. Dengan kata lan melakukan analsa tentang pengaruh panjang snyal suara yang dkomputas terhadap knerja sstem. Analsa n dperlukan untuk mendapatkan nformas tentang panjang snyal yang optmal yang harus dkomputas yang relatf tdak menurunkan tngkat dentfkas sstem secara sgnfkan.. Permasalahan Permasalahan yang muncul d dalam melakukan optmalsas panjang snyal ucapan sebuah kata dapat drumuskan sebaga berkut: a) Merumuskan algortma estmas trspektrum terhadap snyal suara X(t) untuk setap bagan pertama subsnyal dar setap panjang snyal (lebar ucapan) -n * (n = 0 ) bagan pertama dar setap sampel snyal X(t). adalah panjang satu bagan penuh dar snyal suara yang ducapkan. 40 Volume Nomor Januar 00 : 40 45
b) Mengestmas data prmer dengan panjang snyal -n * (n = 0 ) bagan pertama dar setap sampel snyal X(t). c) Mengmplementaskan dan mengujcoba hasl estmas trspektrum pada sstem dentfkas suara. d) Menganalsa pengaruh panjang snyal suara ucapan terhadap knerja sstem dengan parameter pembandng adalah panjang satu snyal penuh.. ujuan ujuan dar peneltan n adalah untuk mendapatkan nformas tentang panjang optmal snyal suara yang perlu destmas sehngga baya komputas dapat dturunkan sekecl mungkn tetap knerja sstem dentfkas mash tetap tngg. Sebaga pembandngnya untuk mencapa tujuan n adalah hasl estmas panjang snyal satu bagan..4 Ruang Lngkup Peneltan n merupakan tndak lanjut dar beberapa peneltan yang telah penelt lakukan yang menggunakan estmas trspektrum sebaga prapengolahan datanya. Ruang lngkup peneltan melput transformas fourer untuk mendapatkan doman frekwens snyal data prmer estmas dan analss trspektrum mplementas estmas dan ujcoba hasl estmas pada sstem dentfkas suara menggunakan kuantsas skalar sebaga ekstraks crnya dan jarngan syaraf truan propagas balk sebaga pengklasfkas. Semua mplementas n menggunakan Personal Computer (PC) dengan sstem operas Wndows N dan Lnu. adalah dengan memperkecl duras waktu dar snyal (panjang snyal) yang destmas. Sstem yang telah dkembangkan pada [4 8] memlk tngkat ketahanan yang sangat rendah terhadap nose Gaussan adtp. Sedangkan sstem pada [5] walaupun memlk tngkat ketahanan yang lebh tngg (bersfat robust) namun baya komputasnya sangat tngg sebaga akbat penngkatan dmens estmas dan kurangnya memanfaatkan sfat-sfat smetrs yang dmlk trspektrum. Ddasarkan pada sfat robust yang dmlk oleh sstem yang ddasarkan pada analsa trspektrum peneltan n dlanjutkan dengan mencoba menganalsa pengaruh panjang snyal suara pembcara terhadap knerja sstem. Caranya adalah demkan: Panjang satu snyal dar suatu ucapan ddefnskan sebaga duras waktu yang dperlukan untuk mengucapkan satu kata. Msalkan pada duras waktu t panjang snyal suara yang drekam adalah. Pada proses prapengolahan data prmer n mula-mula data yang destmas sepanjang duras waktu t kemudan dlanjutkan beturut-turut sebesar ½ t ¼ t -n t. Jelas bahwa baya komputas akan turun untuk n yang membesar. Hasl dar masng-masng estmas pada proses pengolahan data prmer selanjutnya dkelompokkan menggunakan metode kuantsas skalar untuk mendapatkan skalar pewakl yang nantnya menjad masukan ( nput) pada jarngan syaraf truan propagas balk. Dar beberapa ekspermen yang akan dlakukan pada masng-masng estmas n dharapkan akan dketahu nla optmal dar panjang snyal data prmer yang akan dkomputas tanpa mempengaruh knerja sstem.. INJAUAN PUSAKA. MEODOLOGI Umumnya pengembangan sstem suara dpengaruh oleh tga status pengolahan datanya yakn status pengolahan data prmer (prapengolahan data) pengolahan data untuk mengekstraks cr (kuantsas data) dan pengklasfkas data. Sstem suara yang prapengolahan datanya menggunakan estmas telah dlakukan msalnya yang ddasarkan pada analsa power spectrum [8] bspektrum [4] maupun trspektrum [5] dengan hasl mash jauh dar sempurna; yakn kemampuan dentfkasnya mash dbawah 90%. Dsampng tu ketga sstem n mengabakan baya komputas karena yang menjad target peneltan dar ketga sstem tu adalah kemampuan mengdentfkas. Pada hal semestnya faktor baya komputas n juga perlu dperhtungkan. Sebaga hpotesa untuk menekan baya komputas pada pengembangan sstem suara Metode yang dgunakan dalam peneltan n terdr dar beberapa tahap (Lhat Gambar ): ahap : Akuss data snyal suara (data prmer). Akuss data prmer berupa snyal suara kata maju dlakukan menggunakan Personal Computer (PC) berprosesor pentum perangkat lunak Sound Forge dan Gold Wave. Snyal suara kata maju drekam dar 0 orang berlanan enam berjens kelamn lak-lak dan empat perempuan berusa 5 tahun sampa 50 tahun. Perekaman suara dlakukan pada suasana suny dengan duras waktu untuk setap suara kata maju sektar.8 sampa dengan.0 detk. Hasl perekaman berupa fle-fle *.raw. ahap : Rancangan algortma estmas trspektrum. Algortma estmas trspektrum pada peneltan n menggunakan asums bahwa snyal suara ucapan manusa merupakan snyal ergodk dan bersfat Analsa entang Pengaruh Panjang Snyal Suara Data Prmer erhadap Knerja Sstem 4 Identfkas Pembcara - Nurul Hdayat & Ars jahyanto
stasoner. Snyal ergodk adalah suatu snyal dmana nla rata-rata dar beberapa snyal sama dengan nla dar satu snyal. Sedangkan snyal stasoner adalah bahwa nla snyal d suatu ttk waktu tertentu bersfat tetap. ahap : Implementas (codng) dar algortma estmas trspektrum Algortma estmas n dmplementaskan menggunakan bahasa pemrograman C dengan kompler GNU C pada PC yang berbass Lnu. Hasl estmas terhadap snyal suara berupa data magntudo dan fase snyal untuk masngmasng suara ucapan. Untuk data magntudo dsmpan ke dalam fle-fle *.tmg sedangkan data fase dsmpan ke dalam fle *.tph ahap 4: Ujcoba pada Sstem Pada tahap n dlakukan runnng program dan ujcoba hasl estmas pada sstem sebaga proses valdas untuk dgunakan mengalsa dan menentukan panjang snyal data prmer yang optmal. Proses estmas yang dgunakan pada peneltan n menggunakan analss order empat yang dkenal sebaga estmas trspektrum dengan rumus: M ( f f f ) ). * [ X f ). X ( f ). X ( f X ( f f ) ] ( f ( f dmana X ) adalah spektrum Fourer * berduras pada frekwens f dan X ( ) adalah f konyugas kompleks dar X f ) []. ( Akuss data prmer Perancangan algortma estmas Implementas wndow wndow wndow FF FF FF SP SP SP M M M 4 4 4 Dlakukan ujcoba pada Sstem M ) 4 ( Gambar. Dagram alr estmas trspektrum snyal suara. Gambar. Dagram metodolog peneltan 4. ESIMASI RISPEKRUM Fokus bahasan peneltan n sesungguhnya terletak pada proses prapengolahan data prmer yakn mengestmas snyal suara untuk mendapatkan data magntudo dan fase snyal suara. Panjang snyal yang destmas dapat bervaras mula dar satu bagan setengah bagan seperempat bagan dan seterusnya. Yang perlu danalsa adalah pengaruh panjang snyal yang destmas n terhadap knerja sstem dentfkas. Hasl yang optmal adalah bla panjang snyal yang destmas pendek yang secara sgnfkan dapat menurunkan waktu eksekus pada proses estmas tetap tdak mempengaruh knerja sstem. Proses estmas trspektrum terhadap snyal suara dapat dlhat pada Gambar. Sedangkan ruang estmasnya berupa setengah kubus dengan jumlah N * N data sebanyak *( N ). Untuk satu bagan snyal N bernla 64. Lhat Gambar. Ada dua pendekatan yang bsa dlakukan untuk menganalsa lebar ucapan n yatu: 4 Volume Nomor Januar 00 : 40 45 Pendekatan I: Lebar ucapan saat proses estmas d man memory berupa satu snyal penuh tetap yang dsmpan d memor sekunder bervaras mula dar satu bagan ½ bagan ¼ bagan /8 bagan dan /6 bagan. Lhat Gambar 4. Pendekatan kedua n dgunakan mengngat pada estmas terdapat suatu transformas yang bersfat otokorelas pada doman frekwens sehngga supaya tdak kehlangan nformas pada bagan yang destmas. f
f Gambar. Ruang estmas trspektrum berupa setengah kubus berukuran. Lebar ucapan: satu snyal () Proses estmas pada peneltan n hanya menggunakan pendekatan I saja. Rancangan algortmanya adalah sebaga berkut: () Snyal suara X(t) dsamplng pada frekuens khz pada duras waktu.8 detk sampa dengan.0 detk mempunya N = 000 *.8 ttk sampel (smpangan). Snyal n dbag menjad K chunk (potongan) yang masng - masng mempunya M ttk sampel. Msalkan masng-masng chunk n dnama dengan = 0 09. () Setap nla snyal pada masng-masng chunk dmasukkan ke dalam wndow Hammng : 0.54 0.46 cos( u) u d( u) 0 untuk u lannya dengan tujuan untuk mereduks terjadnya frekuens tngg d ttk-ttk perpotongan chunk. () Pada setap chunk dlakukan transformas Fourer menggunakan algortma FF. (4) Untuk masng-masng chunk dlakukan estmas trspektrum menggunakan rumus: M 4 * ( ) X( ). X( ). X( ) X ( ) bagan Gambar 4. Pendekatan I dar estmas trspektrum. Pendekatan II: Pada pendekatan n bagan snyal (lebar ucapan) yang destmas benar - benar dambl bervaras mula dar satu bagan ½ bagan ¼ bagan /8 bagan dan /6 bagan saja. Karena estmas trspektrum n terdapat otokorelas pada doman frekwens maka selang frekwens yang dolah hanya sepertga dar selang yang seharusnya untuk setap bagan snyal yang destmas. Msalkan lebar snyal yang destmas adalah l maka f / bagan f f l f dan f f. Mengngat berasal dar doman yang sama maka f Proses estmas rspektrum (d man memor) Smpan d memor sekunder /4 bagan /8 bagan /6 bagan f f l. Jad dengan pendekatan n ada nformas yang hlang pada bagan yang destmas. Hasl estmas dar masng-masng bagan n kemudan dsmpan d memor sekunder. dmana X () adalah hasl transformas Fourer dar X(t) ( f = frekwens snyal f ). (5) erakhr masng-masng hasl estmas n dcar rata-ratanya yang dsmpan dalam sebuah fle magntude dan sebuah fle fase. Pada proses penympanan nla-nla hasl estmas n dbuat berubah-ubah mengkut rumus -k * bagan pertama dengan k=0 4 dan adalah panjang snyal setap chunk. Panjang n sesungguhnya merepresentaskan satu bagan snyal karena hasl dar proses estmas satu bagan snyal dar sebuah kata maju.estmas trspektrum terhadap snyal dtentukan dengan mengambl rata-ratanya. 5. HASIL PENELIIAN Pada peneltan n proses estmas dlakukan terhadap 5 bagan snyal yakn satu bagan setengah bagan seperempat bagan seperdelapan dan seperenam belas bagan snyal. Hasl estmas n kemudan dlakukan ekstraks cr terhadap masngmasng bagan; dan dlanjutkan proses. Setelah dlakukan beberapa kal ujcoba pada sstem suara maka ddapatkan hasl peneltan sebaga berkut: Analsa entang Pengaruh Panjang Snyal Suara Data Prmer erhadap Knerja Sstem 4 Identfkas Pembcara - Nurul Hdayat & Ars jahyanto
abel. Hasl ujcoba pengenalan sstem untuk beberapa bagan snyal hasl estmas. No Bagan snyal yg destmas Waktu Estmas (detk) Jumlah data ngkat pengenalan (%) 9 0 8.65 ½ 6898 8.5 ¼ 0 76 4 4 /8 0 88 7 5 /6 0 40.5 snyal menjad setengah bagan snyal hampr tdak ada pengaruhnya terhadap knerja sstem. E D C B A 6. PEMBAHASAN Pembahasan atau analss terhadap hasl peneltan n dlakukan dengan menggunakan tga parameter yakn tngkat pengenalan sstem terhadap suara pembcara (prosentase pengenalan) lama eksekus (waktu) saat estmas dan jumlah data magntude dan fase hasl estmas. Krtera yang dgunakan untuk menentukan bagan snyal yang palng bak pada proses estmas adalah tngkat pengenalan yang tngg waktu eksekus rendah dan jumlah data yang kecl. Dar ketga parameter tu tngkat pengenalan sstem merupakan parameter yang palng pentng. Artnya jka tngkat pengenalannya rendah maka parameter lannya menjad tdak berguna. Pada abel tampak bahwa untuk seper-empat bagan snyal atau yang lebh kecl walaupun waktu eksekus proses estmas yang dperlukan mendekat nol detk dan jumlah data yang dhaslkan juga kecl tetap prosentase pengenalan sstem relatf rendah dbandng pada satu bagan snyal. Sedangkan untuk setengah bagan snyal prosentase pengenalannya hampr sama dengan satu bagan snyal atau hanya mengalam penurunan sebesar 05% saja. Waktu eksekus estmas untuk setengah bagan n jauh lebh cepat atau terjad penurunan sebesar 8889% dan jumlah data yang dhaslkan mengalam penurunan yang cukup sgnfkan yakn sebesar 87%. Berkut n nformas tentang pengaruh panjang snyal (bagan snyal yang destmas) berturut-turut terhadap knerja sstem. Perhtungan graden pada setap segmen gars dmaksudkan untuk melhat pengaruh yang sgnfkan akbat panjang snyal yang destmas dperkecl mula dar satu bagan penuh sampa dengan /6 bagan saja. Pada Gambar 5 tampak bahwa graden terkecl terjad pada segmen gars BA yatu sebesar 0.5. In berart bahwa pengaruh panjang yang destmas dar satu bagan Gambar 5. Pengaruh lebar ucapan data prmer (suara) terhadap knerja sstem Walaupun untuk panjang snyal yang destmas dar setengah bagan menjad seperempat bagan terjad penurunan jumlah data maupun waktu estmas tetap untuk bagan n terjad penurunan knerja sstem yang cukup sgnfkan sehngga lebar ucapan seperempat bagan maupun yang lebh kecl lag menjad tdak berart. 7. KESIMPULAN Setelah melakuan peneltan n maka dapat dtark kesmpulan bahwa panjang snyal yang optmal yang perlu destmas adalah setengah bagan saja. Dbandng panjang snyal satu bagan estmas terhadap panjang snyal setengah bagan n dapat menurunkan waktu estmas dan jumlah data hasl estmas dengan prosentase penurunan berturut-turut mencapa 88.99% dan 87.%. Sedangkan knerja sstem hanya turun sebesar 0.58%. DAFAR PUSAKA [] Brgham E. O. [988] he Fast Fourer ransform and Its Applcatons Prentce-Hall Internatonal Inc.. [] Chester M. [99] Neural Networks : a tutoral Prentce-Hall Internatonal edton. [] Fanany Mohammad I. Kusumoputro Benyamn [998] Metode Kuantsas pada Data Bspektrum untuk Pembcara Menggunakan Jarngan Syaraf ruan Makalah Program Stud Ilmu Komputer Pascasarjana UI. [4] Fanany Mohamad I. [998] Bspectrum Pattern Analyss and Quantzaton to Speaker 44 Volume Nomor Januar 00 : 40 45
Identfcaton hess Program Stud Ilmu Komputer UI. [5] Hdayat Nurul [999] Pengembangan Sstem Pengenal Suara Menggunakan Metode Estmas rspektrum dan Kuantsas Skalar hess Program Stud Ilmu Komputer UI. [6] Nkas Chrysostomos L. Petropuou Athna P. [99] Hgher-Order Spectra Analyss : a nonlner sgnal processng framework Prentce-Hall Internatonal edton. [7] Nkas Chrysostomos L. [July 987] Bspectrum Estmaton : A Dgtal Sgnal Processng Framework Proceedng of he IEEE Vol. 75 No. 7. [8] Supryono Ipon [998] Penggunaan Sstem Penentu Lebar Ucapan Penyarng Snyal dan Proses Flter Bank pada Prapengolahan Sstem Pengenal Kata Jarngan Neural Buatan dengan Metode Propagas Balk Skrps Faslkom UI. [9] [Sept 997] Speaker Recognton : A utoral Proceedng of the IEEE Vol. 85 No.9. [0] rono Ad [000] Ekstraks Cr Pada Data Suara Menggunakan Spektra Orde ngg Dan Kuantsas Vektor Untuk Pembcara Menggunakan Jarngan Neural Buatan hess Program Stud Ilmu Komputer UI. Analsa entang Pengaruh Panjang Snyal Suara Data Prmer erhadap Knerja Sstem 45 Identfkas Pembcara - Nurul Hdayat & Ars jahyanto