BAB 2 LANDASAN TEORI 2.1 Gelombang Bunyi Menurut Anwar, et al (2014), gelombang bunyi atau lebih khusus dikenal sebagai gelombang akustik adalah gelombang longitudinal yang berada dalam sebuah medium, biasanya udara. Gelombang suara berasal dari benda yang bergetar. Bentuk gelombang suara periodik akan menimbulkan sensasi yang menyenangkan (jika intensitas nya tepat) seperti bunyi musik. Sebaliknya, bunyi yang tidak periodik akan menimbulkan suara derau (noise). 2.2 Nada Sebuah nada adalah suatu bunyi yang memiliki nilai tertentu, yaitu pitch, yang diukur untuk menggambarkan jenis nada tersebut. Serangkaian nada yang tersusun teratur berdasarkan ketukan dan pola disebut musik (Afriani, 2012). Dalam teori musik, setiap nada memiliki nilai tertentu menurut frekuensinya ataupun jarak relatif nada tersebut terhadap nada patokan. Nada dapat diatur dalam tangga nada yang berdedabeda. Nada dasar menentukan frekuensi tiap-tiap nada pada suatu karya musik (Wilson, 2008). Nada merupakan jenis suprasegmental yang ditandai oleh tinggi-rendahnya arus ujaran yang terjadi karena frekuensi getaran yang berbeda antar segmen. Misalnya pada saat seseorang berada dalam kesedihan maka ia akan berbicara dengan nada yang rendah. Sebaliknya bila ia berada dalam keadaan marah atau gembira, ia berbicara dengan nada yang tinggi.
6 2.3 Tangga Nada Tangga nada merupakan kumpulan nada-nada yang harmonis. Kumpulan dari semua nada pada musik disebut tangga nada kromatik. Tangga nada kromatik dapat diartikan sebagai nada setiap warna. Istilah tangga nada kromatik dipakai untuk kedua belas nada dari tiap oktaf (Sijabat, 2009). 2.4 Alat Musik Gitar Menurut Anwar (2014), masuknya alat musik gitar ke Indonesia salah satunya adalah dibawa oleh tawanan asal portugis sekitar abad ke-7. Secara umum gitar dibagi menjadi 2 jenis, gitar akustik dan gitar listrik (electric guitar). Gitar akustik merupakan gitar yang terbuat dari kayu, dan terdapat lubang suara atau tabung resonansi (sound hole). Bagian-bagian pada gitar akustik ditunjukkan pada gambar 2.1 berikut. Gambar 2.1 Bagian-bagian gitar akustik (Anwar, 2014)
7 Senar gitar yang dipetik akan menghasilkan bunyi yang memiliki frekuensi dan setelan nada yang berbeda tergantung kepada penggunaan dan keinginan dari pengguna gitar tersebut. Frekuensi suara senar gitar yang umum digunakan dapat dilihat pada tabel 2.1. Tabel 2.1 Frekuensi Nada Gitar (Lourde R. & Saji, 2009) Nada senar gitar Nomor Kunci Frekuensi E (senar 6) E2 82.4 A (senar 5) A2 110.0 G (senar 4) D3 146.8 D (senar 3) G3 196.0 B (senar 2) B3 246.9 E (senar 1) E4 329.6 2.5 Sejarah Pengenalan Suara Sudah hampir lima dekade dilakukan penelitian di bidang pengenalan suara (speech recognition). Menurut Maulana (2013), riset untuk mengembangkan system speech recognition oleh mesin ini dibuat mulai tahun 1950-an yaitu pada saat peneliti mencoba mengeksploitasi ide dari acoustic-phonetics. Tahun 1952, Biddulph dan Balashek membuat sebuah sistem yang dapat mengenali suatu digit terisolasi dari seorang pembicara yang sangat bergantung pada resonansi spektral vokal dari setiap digit. Kemudian Olson dan Belar berusaha membuat sebuah sistem untuk mengenali 10 suku kata berbeda dari seorang pembicara yang juga sangat bergantung pada spektral dan area vokal pada tahun 1956. Selanjutnya Fry dan Denes, pada tahun 1959 membuat sebuah sistem pengenalan fonem untuk mengenali 4 vokal dan 10 konsonan dengan menggunakan analisis spektruk dan pencocok pola. Pada tahun yang sama, Forgie juga melakukan penelitian pengenalan vokal dimana 10 vokal disisipkan dalam format a/b/-vokal-/t. Pada tahun 1962 Sakae dan Doshita membuat hardware pengenalan fonem. Usaha selanjutnya dilakukan oleh Nagata dan rekan kerjanya di laboratorium NEC
8 yang menjadi awal bagi sebuah program penelitian produktif. Usaha itu dilakukan oleh nagata pada tahun 1963. Pada era 1960-an, usaha yang dilakukan Martin dan rekannya pada laboraturium RCA adalah untuk membangun sistem dengan kemampuan dasarnya untuk mendeteksi awal dan akhir suatu speech. Pada tahun yang bersamaan, Vintsyuk mengajukan metode dynamic programming untuk menyamakan waktu dari pegutaran speech. Sejumlah batu pijakan yang signifikan diraih pada tahun 1970-an mengenai penelitian speech recognition. Penelitian Jepang menunjuk kearah bagaimana penerapan metode dynamic programming dapat diterapkan dan penelitian yang dilakukan Itakura tentang Linear Predictive Coding (LPC) dengan sukses pada pencobaan speech ber-bit rendah. 2.6 Pengenalan Suara Pengenalan suara merupakan serangkaian proses untuk mengenali sinyal suara dengan membandingkan pola karakteristik sinyal suara acuan dengan pola karakteristik sinyal suara uji secara otomatis (Saaddatuddaroin, 2009). Suara dikenali melalui ciri-cirinya. Ciri-ciri tersebut digunakan untuk membedakan antara suara yang satu dengan suara yang lainnya. Pengenalan suara dapat diklasifikasikan dalam identifikasi dan verifikasi. Identifikasi suara adalah proses pengenalan suara berdasarkan sampel suara, sedangkan verifikasi suara adalah proses penerimaan atau penolakan terhadap suara yang diberikan (Setiawan & Handayani 2012). 2.7 Pengolahan Sinyal Digital Pengolahan sinyal digital adalah pemrosesan sinyal yang berkaitan dengan perubahan bentuk, menipulasi isi dan penyajian dari sinyal suara dan informasi dalam bentuk digital (Huda, 2011). Tujuan dari pengolahan sinyal digital adalah untuk mendapatkan ekstraksi ciri dari sinyal suara. Sebuah proses untuk mengubah sinyal suara menjadi parameter-parameter yang selanjutnya dapat dilakukan proses selanjutnya, misalnya identifikasi pola suara. Proses yang terjadi pada pengolahan sinyal digital pada
9 penelitian ini adalah proses sampling dan Fast Fourier Transform (FFT). Contoh input suara dapat dilihat pada gambar 2.2 berikut. Gambar 2.2 Input Suara 2.7.1 Sampling Proses sampling adalah proses untuk mengubah sinyal pada waktu-kontinu menjadi bentuk diskrit yang diperoleh dengan mengambil cuplikan sinyal pada waktu-kontinu (Huda, 2011). 2.7.2 Fast Fourier Transform (FFT) Fast Fourier Transform merupakan DFT dengan algoritma yang lebih optimal, sehingga menghasilkan perhitungan yang lebih cepat. Dengan DFT, memerlukan waktu O(n2) untuk mengolah sampel data sebanyak n buah. Hal ini tentunya akan memakan waktu lama bila sampel data makin banyak (Stefanus, Hamz, M. & Angzas, Y., 2005). Proses pada metode fast Fourier Transform (FFT) adalah mengkonversi setiap frame N sampel dari domain waktu menjadi domain frekuensi. Menurut Hanggarsari,et al(2012), transformasi fourier merupakan metode yang efisien untuk transformasi fourier diskrit yang banyak digunakan pada pemrosesan sinyal digital.
10 Contoh sinyal dalam domain waktu pada gambar 2.3 dan contoh sinyal dalam domain frekuensi pada gambar 2.4 berikut (Huda, 2011). Gambar 2.3 Sinyal dalam domain waktu Gambar 2.4 Sinyal dalam domain frekuensi Metode FFT dapat dilakukan dalam domain waktu dan frekuensi, yang disebut sebagai desimasi dalam waktu (decimation-in-time) dan desimasi-dalam-frekuensi (decimation-in-frequency) (Gunawan, D., Juwono, F.H., 2012). Pada prinsipnya algoritma ini adalah memecah N-titik menjadi dua (N/2) titik, kemudian dipecah lagi pada tiap (N/2) titik menjadi dua (N/4) titik, begitu seterusnya sampai hanya terdapat 1 titik. Prinsip tersebut dapat kita lihat lebih jelas pada gambar 2.2 berikut.
11 Gambar 2.5 Desimasi untuk 16 titik Konsep metode Fast Fourier Transfrom (FFT) secara keseluruhan dapat dilihat pada gambar 2.6. Gambar 2.6 Konsep FFT Algoritma DFT melakukan perkalian kompleks sebanyak N. Dengan menggunakan FFT maka terdapat log2(n) perkalian kompleks. Sehingga jumlah perkalian kompleks berkurang dari N 2 menjadi log2(n). Dikarenakan DFT merupakan bagian dari FFT, maka lebih baik menghitung FFT dengan mempertimbangkan nilai N DFT terlebih dahulu (Yang, 2012).
12 X(k) = k = 0, 1, 2 N-1 (1) Pisahkan x(n) menjadi dua bagian : x(ganjil) dan x(genap) = x(2m), dimana m=0, 1,2,,N/2-1. Lalu nilai N DFT juga dibagi dua bagian untuk tiap nilai N/2 : X(k) = = + = + (2) Dimana m = 0, 1, 2,., N/2-1 Karena : = cos( ) + j sin( ) (3) = cos[ ] + j. sin[ = -cos( ) j.sin( ) = -[cos( ) + j.sin( )] = - (4) Maka : = - (5) Jadi ketika faktor diubah dengan setengah periode, nilai dari faktor tersebut tidak akan berubah, tetapi tanda nilai faktor tersebut akan menjadi sebaliknya. Hal ini merupakan sifat simetri dari faktor. Karena faktor bisa juga ditulis sebagai =, maka : ( ) = - (6) Dan ( 2 = - = (7)
13 Maka nilai N DFT akhirnya menjadi : X(k) = (8) k = 0,1.N/2 X(k + N/2) = - (9) k = 0, 1, 2..N/2 Jadi nilai N DFT dipisah menjadi dua nilai N/2 DFT. Dari persamaan (8), (k) memiliki (N/2) * (N/2) = (N/2) 2. memiliki N/2 + (N/2) 2. Maka jumlah total dari perhitungan untuk X(k) adalah 2(N/2) 2 + N/2=N 2 /2+N/2. Untuk nilai awal N DFT, dimulai dari N 2. Maka pada langkah pertama, pisahkan x(n) menjadi dua bagian yang membuat perhitungan dari N 2 menjadi N 2 /2+N/2. Jumlah angka perkalian dikurangi setengah secara berkala. Selanjutnya adalah proses pengurangan perkalian dari nilai N menjadi N/2. Lanjutkan pemisahan (m) dan (m) menjadi bagian ganjil dan genap dengan cara yang sama, perhitungan untuk N/2 akan dikurangi menjadi N/4. Kemudian perhitungan DFT akan berkurang secara terus menerus. Jadi jika sinyal untuk nilai N DFT terpisah terus menerus sampai sinyal akhir menjadi satu titik. Misalkan ada N=2 v DFT yang perlu dihitung. Maka jumlah pemisahan yang dapat dilakukan adalah v = (N). Jumlah total perkalian akan dikurangi hingga (N/2) (N). Untuk tambahan perhitungan, angka yang akan dikurangi mencapai N (N). Karena perkalian dan penambahan dikurangi, maka kecepatan perhitungan komputasi DFT dapat ditingkatkan. Tujuan utama untuk Radix -2 FFT adalah memisahkan deretan data menjadi ganjil dan genap secara terus menerus sampai mendekati setengah perhitungan.
14 2.8 Penelitian terdahulu Pada bagan ini akan dipaparkan tentang penelitian-penelitian sebelumnya yang berhubungan dengan pengenalan nada pada senar gitar. Pemaparan tentang penelitian sebelumnya dapat dilihat pada tabel 2.2 berikut. Tabel 2.2 Penelitian terdahulu Penulis Teknik yang digunakan Keterangan Afriani, S.S., 2012. Jaringan Saraf Tiruan Metode Learning Vector Learning Vector Quantization dapat digunakan Quantization. untuk mengenali nada pada senar biola, dengan pengenalan nada G mencapai 100%, nada E mencapai 93,33%, nada D mencapai 40% dan nada A mencapai 60%. Anwar, K. Et al, 2014 Fast Fourier Akord merupakan prinsip utama Transform (FFT). dalam memainkan alat musik gitar. penulis melakukan analisis Basuki, A., et al, 2006 Fast Fourier Tranform (FFT), Jaringan Saraf Tiruan (JST) Propagasi balik (back Propagation). fenomena dari akord D mayor menggunakan metode Fast Fourier Transform (FFT). Sinyal suara analog dicuplik dengan kecepatan 12000 Hz. Fast Fourier Transform(FFT) digunakan untuk mendapatkan fitur sinyal yang ditransformasikan kedalam domain frekuensi. Kemudian fitur suara tersebut diproses dengan menggunakan jaringan saraf tiruan(jst).
15 Tabel 2.2 Penelitian terdahulu (Lanjutan) Penulis Teknik yang Keterangan digunakan Ardiansyah, M., 2014 Mel Frequency Metode MFCC digunakan untuk Cepstral Coefficient mengambil nilai vektor pada (MFCC) dan sebuah lagu. Metode LVQ Learning Vector digunakan untuk mencocokkan Quantization (LVQ). data uji dengan data acuan yang telah disimpan di dalam database. Dianputra, R., 2014 Fast Fourier Algoritma FFT digunakan untuk Transform (FFT) menghitung nilai Discreate Fourier Transform (DCT) untuk transformasi dari domain waktu ke domain frekuensi. Data masukan adalah suara senar gitar yang dipetik secara open string.