BAB II LANDASAN TEORI

dokumen-dokumen yang mirip
PENDAHULUAN. Latar Belakang

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENDAHULUAN. Latar Belakang

udara maupun benda padat. Manusia dapat berkomunikasi dengan manusia dari gagasan yang ingin disampaikan pada pendengar.

IDENTIFIKASI CAMPURAN NADA PADA SUARA PIANO MENGGUNAKAN CODEBOOK

i. Perangkat Keras Prosesor Intel Pentium(R) Dual-Core CPU 2.20 GHz

BAB II LANDASAN TEORI

PENDAHULUAN Tujuan Latar Belakang Ruang Lingkup Manfaat Penelitian TINJAUAN PUSTAKA Nada dan Chord Gitar

BAB II LANDASAN TEORI

Pengenalan Pembicara dengan Ekstraksi Ciri MFCC Menggunakan Kuantisasi Vektor (VQ) Yoyo Somantri & Erik Haritman dosen tek elektro fptk UPI.

BAB III METODE PENELITIAN

PENGUJIAN METODE NAIVE BAYES CLASSIFIER UNTUK KLASIFIKASI GENRE MUSIK BERDASARKAN FREKUENSI

ALGORITMA BAYESIAN CLASSIFICATION UNTUK MEMPREDIKSI HEREGRISTRASI MAHASISWA BARU DI STMIK WIDYA PRATAMA

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Akurasi Data Mining Untuk Menghasilkan Pola Kelulusan Mahasiswa

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Dalam tinjauan pustaka dibawah ini terdapat 6 referensi sebagai berikut : - Algoritma Naïve Bayes Classifier

1. Pendahuluan Latar Belakang

BAB II LANDASAN TEORI

Seminar Nasional Ilmu Komputer (SNIK 2016) - Semarang, 10 Oktober 2016 ISBN:

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB IV IMPLEMENTASI DAN EVALUASI. 4.1 Spesifikasi Hardware dan Software yang digunakan dalam penelitian

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II LANDASAN TEORI

NASKAH PUBLIKASI KOMPRESI IMAGE MENGGUNAKAN VECTOR QUANTIZATION

BAB 2 LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang

TINJAUAN PUSTAKA. Pengenalan Suara

ANALISIS DAN PERANCANGAN PROGRAM APLIKASI. mahasiswa Binus University secara umum. Dan mampu membantu

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

BAB 2 LANDASAN TEORI

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Alfa Saleh. Teknik Informatika Universitas Potensi Utama Jl K.L. Yos Sudarso KM 6.5 No.3-A, Tanjung Mulia, Medan

BAB 2 LANDASAN TEORI

yaitu dalam ketepatan pengenalan pola berdasarkan kelas untuk menampilkan genre.

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

PENERAPAN DATA MINING DALAM MENENTUKAN JURUSAN SISWA

PENGEMBANGAN MODEL PROBABILISTIC NEURAL NETWORK UNTUK IDENTIFIKASI CHORD GITAR ARVIANI RIZKI

MODUL I DASAR-DASAR OPERASI MATLAB

PENGENALAN SUARA MANUSIA DENGAN MENGGUNAKAN JARINGAN SARAF TIRUAN MODEL PROPAGASI BALIK

Penerapan Perintah Suara Berbahasa Indonesia untuk Mengoperasikan Perintah Dasar di Windows

BAB I PENDAHULUAN. Proses pengenalan kata merupakan salah satu fungsi dari

PENGENALAN SUARA BURUNG MENGGUNAKAN MEL FREQUENCY CEPSTRUM COEFFICIENT DAN JARINGAN SYARAF TIRUAN PADA SISTEM PENGUSIR HAMA BURUNG

BAB II LANDASAN TEORI

2.4. Vector Quantization Kebisingan BAB III METODOLOGI PENELITIAN Desain Penelitian Requirements Definition...

BAB IV HASIL DAN PEMBAHASAN. dicolokan ke komputer, hal ini untuk menghindari noise yang biasanya muncul

PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan

Perbandingan Sistem Perhitungan Suara Tepuk Tangan dengan Metode Berbasis Frekuensi dan Metode Berbasis Amplitudo

PENGEMBANGAN MODEL CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR TONI HARYONO

CONTOH KASUS DATA MINING

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

Jurnal Komputer Terapan Vol. 1, No. 2, November 2015, Jurnal Politeknik Caltex Riau

PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES

BAB 2 LANDASAN TEORI. mencakup teori speaker recognition dan program Matlab. dari masalah pattern recognition, yang pada umumnya berguna untuk

SISTEM PENILAIAN BERDASARKAN TEPUK TANGAN MENGGUNAKAN MFCC DAN CODEBOOK PUSPITA KARTIKA SARI

BAB 2 TINJAUAN PUSTAKA

Data Mining Terapan dengan Matlab

BIOMETRIK SUARA DENGAN TRANSFORMASI WAVELET BERBASIS ORTHOGONAL DAUBENCHIES

BAB 3 ANALISIS DAN PERANCANGAN SISTEM

BAB III METODE PENELITIAN

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA)

Suara bisa dibuat database engine untuk pengenalan kata. Dengan aplikasi ini, dapat secara otomatis melakukan transkripsi suara, sehingga dapat mengur

BAB I PENDAHULUAN. pernah tepat, dan sedikitnya semacam noise terdapat pada data pengukuran.

Jaringan Syaraf Tiruan pada Robot

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

Frekuensi Dominan Dalam Vokal Bahasa Indonesia

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

BAB III METODOLOGI. dari suara tersebut dapat dilihat, sehingga dapat dibandingkan, ataupun dicocokan dengan

Team project 2017 Dony Pratidana S. Hum Bima Agus Setyawan S. IIP

BAB 1 PENDAHULUAN. manusia untuk mendengar sangat luar biasa. Sistem pendengaran manusia dapat

MODUL 5 EKSTRAKSI CIRI SINYAL WICARA

SISTEM PENGOLAHAN SUARA MENGGUNAKAN ALGORITMA FFT (FAST FOURIER TRANSFORM)

ANALISIS PENERAPAN TEKNIK DATAMINING DALAM PENGIMPLEMENTASIAN DAN PENGEMBANGAN MODEL ACTIVE LEARNING DENGAN METODE KELOMPOK

BAB II DASAR TEORI Suara. Suara adalah sinyal atau gelombang yang merambat dengan frekuensi dan

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

BAB I PENDAHULUAN. dapat menghasilkan suara yang enak untuk didengar.

BAB II LANDASAN TEORI

Perbandingan Spektral Musik Klasik dengan Musik Etnik Jawa menggunakan Analisis MFCC dan Beat Strength

PENENTUAN AKOR GITAR DENGAN MENGGUNAKAN ALGORITMA SHORT TIME FOURIER TRANSFORM

BAB III METODOLOGI PENELITIAN

PENGENALAN NADA SULING REKORDER MENGGUNAKAN FUNGSI JARAK CHEBYSHEV

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

BAB I PENDAHULUAN. manusia satu dengan manusia lainnya berbeda-beda intonasi dan nadanya, maka

PENGENALAN CHORD PADA GITAR DENGAN MFCC SEBAGAI METODE EKSTRAKSI CIRI DAN JARINGAN SARAF TIRUAN SEBAGAI METODE PENGENALAN POLA FAUZI SISWOYO

SIMULASI DAN ANALISIS KLASIFIKASI GENRE MUSIK BERBASIS FFT DAN CONTINOUS DENSITY HIDDEN MARKOV MODEL

IMPLEMENTASI MEL FREQUENCY CEPSTRAL COEFFICIENT DAN DYNAMIC TIME WARPING UNTUK PENGENALAN NADA PADA ALAT MUSIK BELLYRA

BAB 3 PERANCANGAN SISTEM

PEMBANGUNAN METODE CODEBOOK UNTUK IDENTIFIKASI CHORD GITAR DENGAN TEKNIK EKSTRAKSI CIRI MFCC ARMEN MARTA

TINJAUAN PUSTAKA. Definisi Data Mining

Aktifasi Peralatan Elektronik Berbasis Suara Menggunakan Android

UNIVERSITAS BINA NUSANTARA

PERTEMUAN 14 DATA WAREHOUSE

BAB 3 METODE PENELITIAN

BAB III METODE PENELITIAN. Pemotong an Suara. Convert. .mp3 to.wav Audacity. Audacity. Gambar 3.1 Blok Diagram Penelitian

Transkripsi:

BAB II LANDASAN TEORI 2.1 Tinjuan Studi Pada penelitian sebelumnya terdapat penelitian yang membahas tentang penerapan metode Naive Bayes untuk memprediksi heregritasi mahasiswa baru. Dalam jurnal ilmiah ICTech, Vol. 10, Mei 2012 yang dilakukan oleh Devi Sugianti menerangkan bahwa setiap tahun, akademik STIMIK Widya Pratama melakukan kegiatan pendaftaran [6]. Pada tahun 2011 jumlah pendaftar sebanyak 913 dengan jumlah heregristrasi sebanyak 658 maka 255 mahasiswa tidak melakukan heregristrasi. Bayesian Classification merupakan salah satu metode data mining yang digunakan untuk mengklasifikasian data. Metode Bayesian Classification ini digunakan untuk mengetahui kemungkinan pengunduran diri seorang calon mahasiswa. Dalam memprediksi heregristrasi mahasiswa baru dengan atribut asal kota, gelombang, progdi, dan status tes. Keakuratan yang telah dilakukan dengan menggunakan metode Bayesian Classification 78%. Pengetesan data dengan kota asal pemalang, gelombang 3, Progdi TI, status tes adalah bebas tes. Terdapat 9 mahasiswa yang melakukan pendaftaran, dengan yang melakukan heregristrasi 7 mahasiswa [6]. Dalam penelitiannya dilakukan oleh Mujib Ridwan menerangkan bahwa penelitian tersebut difokuskan untuk mengevaluasi kinerja akademik mahasiswa pada tahun ke-2 dan diklasifikasikan dalam kategori mahasiswa lulus dalam waktu yang paling tepat dengan nilai optimal berdasarkan histori nilai yang telah ditempuh mahasiswa. Sempel mahasiswa angkatan 2005-2009 yang sudah dinyatakan lulus akan digunakan sebagai data training dan testing. Sedangkan data mahasiswa angkatan 2010-2011 dan belum lulus akan digunakan sebagai data target. Data input akan diproses menggunakan teknik data mining algoritma Naive Bayes Classifier (NBC) untuk membentuk tabel probabilitas sebagai dasar proses klasifikasi kelulusan 6

7 mahasiswa. Output dari sistem ini berupa klasifikasi kinerja akademik mahasiswa yang diprediksi kelulusannya dan memberikan rekomendasi untuk proses kelulusan tepat waktu atau lulus dalam waktu yang paling tepat dengan nilai optimal. Hasil pengujian menunjukan bahwa faktor yang paling berpengaruh dalam penentuan klasifikasi kinerja akademik mahasiswa yaitu Indeks Prestasi Komulatif (IPK), Indeks Prestasi (IP) semester 1, IP semester 4, dan jenis kelamin. Sehingga faktor-faktor tersebut dapa digunakan sebagai bahan evaluasi bagi pihak pengelola perguruan tinggi. Pengujian pada data mahasiswa angkatan 2005-2009, algortima NBC menghasilkan nilai precision,recall, dan accuracy masing-masing 83%, 50%, dan 70% [4]. Dalam skripsi yang dibuat oleh Muhamad Ridwan Fansuri, yang berjudul Klasifikasi genre musik menggunakan Learning Vector Quantization (LVQ) pada tahun 2011 yang menjelaskan bahwa stasiun radio dan televisi musik memiliki jutaan kaset musik. Banyaknya genre musik menimbulkan masalah ketika orang ingin menentukan genre yang tepat dari jenis musik yang baru, untuk mengklasifikasikan genre musik bukanlah hal yang mudah, karena genre musik benar-benar sulit untuk mempunyai standardisasi. Klasifikasi genre musik secara otomatis dapat membantu peran manusia dalam proses itu dan membantu orang untuk mencari lagu sesuai dengan genre yang diinginkan. Penelitian ini menggunakan Mel Frequency Koefisien Cepstrum (MFCC) untuk mendapatkan ektrasi fitur. Learning Vector Quantization (LVQ), salah satu jenis jaringan syaraf tiruan yang digunakan untuk metode klasifikasi. Jumlah genre yang digunakan adalah empat jenis genre musik, yaitu rock, klasik, keroncong, dan jazz dengan empat durasi yang berbeda yaitu 5 detik, 10 detik, 20 detik, dan 25 detik [3]. Penelitian ini menggunakan k-fold cross validationuntuk mendistribusikan dataset untuk pelatihan dan pengujian ditetapkan dengan jumlah lipatan sebanyak 2 sampai 10 kali lipat. Penelitian ini berhasil menerapkan ekstrasi fitur MFCC dan klasifikasi menggunakan LVQ. Berdasarkan hasil penelitian, akurasi klasifikasi menggunakan Learning Vector Quantizationmencapai 93,75% untuk empat jenis genre musik. Nilai

8 akurasi tertinggi diperoleh dari eksperimen dengan durasi 10 detik dan jumlah 4 kali. Waktu pelatihan untuk masing-masing durasi 30 menit selama 5 detik, 45 menit selama 10 detik, musik durasi 120 menit selama 20 detik dan 150 menit untuk 25 detik [3]. 2.2 Genre Musik Musik adalah seni, hiburan dan aktivitas manusia yang melibatkan suara suara yang teratur. Dalam artian khusus, musik diartikan sebagai ilmu dan seni suara, yaitu berupa bentuk sinkronisasi suara- suara yang membentuk harmoni nada nada sehingga terdengar estetik, tujuannya adalah untuk menghibur diri sendiri atau orang lain yang mendengarnya [4]. Genre merupakan istilah pengkategorian dari bentuk seni, kata tersebut sering kali digunakan untuk menyebutkan setiap subset dari seni contohnya subset film, acara televisi, show, dan musik yang dari kesetiap seni tersebut mempunyai kreteria tersendiri [4]. Genre musik adalah label yang dibuat dan digunakan manusia untuk mengkategorikan dan menggambarkan musik di dunia[5]. Mengelompokan genre musik ke dalam 11 genre utama, yaitu pop/rock, jazz, r&b, rap, country, blues, elektronik, latin, reggae, internasional dan klasik. Musik juga mempunyai beberapa elemen penyusunnya, elemen terkecil dari musik adalah nada. Nada itu sendiri adalah suara yang memiliki nilai frekuensi tertentu. Dalam musik, nada berada pada ruang dua dimensi, yaitu dimensi vertikal dan horisontal [4]. 2.3 Musik Jazz Musik jazz merupakan salah satu aliran musik yang berasal dari negara Amerika serikat, musik jazz banyak menggunakan gitar, trombon, piano, trompet dan saksofon. Elemen yang terpenting dalam aliran musik ini adalah blue note, improvisasi, polyrhythms, sinkopasi dan shuffle note. Dalam jazz, pemain ahli akan menafsirkan sebuah lagu degnan cara yang sangat individu, tidak pernah memainkan komposisi yang sama persis dengan cara yang sama dua kali. Tergantung daya kreatifitas pemain dan pengalaman pribadi,

9 interaksi dengan sesama musisi atau bahkan anggota audiens, seseorang musisi atau pemain musik jazz dapat mengubah melodi, harmoni. 2.4 Musik Rock Musik rock adalah genre musik populer yang mulai diketahui secara umum pada pertengahan tahun 50-an. Akar dari musik ini berasal dari rhythm and blues. Musik rock juga mengambil gaya dari berbagai musik lainnya termasuk musik rakyat. Bunyi khas dari musik ini yaitu rock sering berkisar pada gitar listrik atau gitar akuistik dan penggunaan back beat yang sangat jelas pada rhythm section dengan gitar bazz dan drum. Sebuah kelompok pemusik yang mengkhususkan diri memainkan musik rock dijuluki sebagai rock band atau group rock. Rock band banyak terdiri dari pemain gitar, penyanyi utama, pemain gitar bazz, dan drummer yang membentuk sebuah kuartet. 2.5 Musik Qasidah Kasidah (Qasidah) salah satu kesenian yang hidup dikalangan umat islam. Kasidah adalah syair bahasa Arab yang berisikan pujian kepada Tuhan dan Rasul, yang dibacakan dengan berbagai jenis lagu. Acara membacakan kasidah disebut kasidahan. Kasidah dapat juga dilagukan dengan iringan alat musik, terutama gambus. Bagi masyarakat indonesia orkes gambus atau kelompok kasidah bukan hal baru, bahkan sekarang sudah mulai mengalami perkembangan mengikuti perekembangan musik [8]. Karakter utama qasidah adalah musik dakwah islami, qasidah yaitu semacam musik religi yang dilakukan dengan rasa hormat dan tenang sehingga penonton akan dapat menemukan diri mereka dalam keadaan tenang di ruang kesadarannya. 2.6 Digitalisasi Gelombang Audio Gelombang audio merupakan gelombang longitudinal yang merambat melalui medium seperti medium padat, cair, atau gas. Gelombang suara merupakan gelombang analog yang apabila diolah menggunakan peralatan elektronik, gelombang tersebut harus melalui tahap digitalisasi sehingga gelombang tersebut berupa data digital. Dalam proses digitalisasi audio,

10 gelombang audio melalui dua tahap proses yaitu sampling dan kuantisasi. Sampling merupakan proses pengambilan nilai dalam jangka waktu tertentu. Nilai yang dimaksud adalah amplitudo, yaitu besarnya volume suara pada suatu waktu. Proses sampling menghasilkan sebuah vektor yang menyatakan nilai-nilai hasil sampling. Vektor tersebut mempunyai panjang yang bergantung pada lamanya sinyal dan sampling rate sendiri adalah banyaknya nilai yang diambil setiap detiknya. Untuk mengukur panjang vektor sinyal, digunakan rumus berikut [3] : S = F 2 Τ...(2.1) Dengan S = Panjang vektor F 2 = Sampling rate (Hertz) T = Panjang sinyal (detik) Tahap selanjutnya adalah proses kuantisasi. Kuantisasi bertujuan menyimpan nilai amplitudo ke dalam representasi nilai 8 bit atau 16 bit. 2.7 Ekstrasi Fitur Ekstrasi ciri berfungsi mengkarakterisasi sinyal audio. Beberapa fitur sinyal audio yang biasa digunakan antara lain Linier Predictive Coding, Perceptual Linier Prediction, dan Mel- Frequency. Proses ini dilakukan karena sinyal audio merupakan sinyal yang bervariasi yang diwaktukan dengan lambat. Jadi pada jangka waktu yang sangat pendek (5-100 ms), karakteristik sinyal tersebut hampir sama, tetapi dalam jangka waktu yang lebih panjang (0,2 detik atau lebih), karakteristik sinyal audio tersebut berubah dan memperlihatkan perbedaan sinyal audio yang diolah [3]. 2.7.1 Fast Fourier Transform Fast Fourier Transform (FFT) ditemukan oleh J. Fourier pada tahun 1822, Fast Fourier Transform ini merupakan pengembangan dari

11 Fourier Transform (FT). FT membagi sebuah sinyal menjadi frekuensi yang berbeda beda dalam fungsi eksponensial yang kompleks [9]. Fast Fourier Transform merupakan metode yang sangat efesien untuk menghitung koefisien dari fourier diskrit ke suatu finite sekuen dari data yang kompleks. Karena waktu yang tersimpan lebih dari pada metode konvensional, Fast Fourier Transform merupakan aplikasi temuan yang penting dalam sejumlah bidang yang berbeda seperti analisis spektrum, speech and optical signal processing, desaign filter digital. Algoritma FFT berdasarkan atas prinsip pokok dekomposisi perhitungan discrete fourier transform dari suatu sekuen sepanjang N kedalam transformasi diskrit fourier secara berturut turut lebih kecil [9]. Fast Fourier Transform, adalah suatu algoritma untuk menghitung transformasi fourier diskrit dengan cepat dan efesien. Karena banyak sinyal sinyal dalam sistem komunikasi yang bersifat kontinyu, sehingga untuk kasus sinyal kontinyu kita gunakan transformasi fourier. Transformasi fourier didefinisikan oleh rumus berikut [9]:...(2.3) Dimana S(f) : sinyal dalam domain frekuensi (frequency domain) s(t) : sinyal dalam domain waktu (time domain) e -j2πft f t : konstanta sebuah sinyal : frekuensi : waktu Fast Fourier Transform (FFT) merupakan salah satu metode untuk transformasi sinyal suara dalam domain waktu menjadi sinyal dalam domain frekuensi, artinya proses perekaman suara disimpan dalam bentuk digital berupa gelombang spectrum suara berbasis

12 frekuensi sehingga lebih mudah dalam menganalisa spectrum frekuensi suara yang direkam. 2.8 Mel-Frequency Cepstrum Coefficient (MFCC) Tujuan dari MFCC adalah mengadaptasi kemampuan telinga manusia dalam mendengar dan mengolah suara [3]. Proses MFCC dapat dilihat pada gambar 2.1 Sinyal Kontinyu Frame Blocking Windowing Fast Fourier Transform spectrum spectrum Mel Frquency Wrapping Cepstrum Gambar 2.1 Diagram blok proses MFCC

13 Tahap-tahap dari proses MFCC dapat dijelaskan sebagai berikut [3] : 1. Frame Blocking, proses ini membagi sinyal audio ke dalam frame.tiap frame terdiri atas N sample. Gambar 2 menggambarkan ilustrasi dari proses frame blocking. 2. Windowing, pada tahap ini sinyal yang telah dibagi ke dalam frame dilakukan proses windowing untuk meminimalkan diskontinuitas sinyal, dengan cara meminimalkan distorsi spectral dengan menggunakan window untuk memperkecil sinyal hingga mendekati nol pada awal dan akhir tiap frame. Window yang dipakai pada proses ini adalah Hamming window dengan persamaan : w (n) = 0,54 0,46 cos(2π/ (N 1)...(2.4) Dengan n = 1, 2, 3... N-1 (N adalah jumlah frame yang digunakan) Ilustrasi dari Hamming Window dapat dilihat pada Gambar 2.2. Gambar 2.2 Hamming Window

14 3. Fast Fourier Transform (FFT), merupakan fast algorithm dari Discrete Fourier Transform (DFT) yang berguna untuk konversi setiap frame dari domain waktu menjadi domain frekuensi. Berikut persamaan yang digunakan : N 1 X n = k=0 Xke 2πjkn/N...(2.5) Dengan n=0, 1, 2... N-1, j adalah bilangan imajiner, yaitu j= -1. Gambar 2.3 memperlihatkan sinyal yang sudah berubah ke dalam domain frekuensi. Gambar 2.3 Sinyal audio dalam domain frekuensi 4. Mel-Frequency Wrapping. Berdasarkan studi psikofisik, persepsi manusia terhadap frekuensi sinyal audio tidak berupa skala linier. Jadi untuk setiap nada dengan frekuensi aktual f (dalam Hertz) dapat diukur tinggi subjektifnya menggunakan skala mel. Skala mel-frequency adalah selang frekuensi dibawah 1000 Hz, dan selang logiritmik untuk frekuensi di atas 1000 Hz. Gambar 5 mengilustrasikan filter pada proses mel-frequency wrapping.

15 Gambar 2.4 Mel-Frequency Wrapping. 5. Cepstrum, tahap ini mengkonversikan log mel spectrum ke dalam domain waktu. Hasil proses ini disebut mel frequency cepstrum coefficients. Berikut ini adalah persamaan yang digunakan dalam DCT : M Cj = Xi cos (j(i 1)/2 π j=1...(2.6) M Dengan j=1,2,3...k(k adalah jumlah koefisien yang diinginkan) dan M adalah jumlah filter. 2.9 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstraksi dan mengidentifikasi informasi yang bermanfaat dan pengetahuan yang terkait dari berbagai database besar. Istilah data mining memiliki hakikat sebagai disiplin ilmu yang tujuan utamanya adalah untuk menemukan, menggali, atau menambang pengetahuan dari data atau informasi yang kita miliki. Data mining, sering juga disebut sebagai Knowledge Discovery in Database (KDD). KDD adalah kegiatan yang meliputi pengumpulan,

16 pemakaian data, historis untuk menemukan keteraturan, pola atau hubungan dalam set data berukuran besar [5]. 1. Metode Pelatihan Secara garis besar metode pelatihan yang digunakan dalam teknik-teknik data mining dibedakan ke dalam dua pendekatan, yaitu : a. Unsupervised learning Metode ini diterapkan tanpa adanya latihan (training) dan tanpa ada guru (teacher). Guru di sini adalah label dari data. b. Supervised learning Yaitu metode belajar dengan adanya latihan dan pelatih. Dalam pendekatan ini, untuk menemukan fungsi keputusan, fungsi pemisah atau fungsi regresi, digunakan beberapa contoh data yang mempunyai output atau label selama proses training. 2. Pengelompokan Data Mining Ada beberapa teknik yang dimiliki data mining berdasarkan tugas yang bisa dilakukan, yaitu a. Deskripsi Para peneliti biasanya mencoba menemukan cara untuk mendeskripsiskan pola dan trend yang tersembunyi dalam data. b. Estimasi Estimasi mirip dengan klasifikasi, kecuali variabel tujuan yang lebih ke arah numerik dari kategori. c. Prediksi Prediksi memiliki kemiripan dengan estimasi dan klasifikasi. Hanya saja, prediksi hasilnya menunjukan sesuatu yang belum terjadi (mungkin terjadi di masa depan). d. Klasifikasi Dalam klasifikasi variabel, tujuan bersifat kategorik. Misalnya, kita akan mengklasifikasikan pendapatan dalam tiga kelas, yaitu pendapatan tinggi, pendapatan sedang, dan pendapatan rendah.

17 e. Clustering Clustering lebih ke arah pengelompokan record, pengamatan, atau kasus dalam kelas yang memiliki kemiripan. f. Asosiasi Mengidentifikasi hubungan antara berbagai peristiwa yang terjadi pada satu waktu. 3. Tahap-tahap Data Mining Sebagai suatu rangkaian proses, data mining dapat dibagi menjadi beberapa tahap proses yang diilustrasikan pada gambar1. Tahap-tahap tersebut bersifat interaktif, pemakai terlibat langsung atau dengan perantaraan knowledge base [9].

18 Gambar 2.5 Tahap-tahap Data Mining a. Pembersihan data (data cleaning) Pembersihan data merupakan proses menghilangkan noise dan data yang tidak konsisten atau data tidak relevan. b. Integrasi data (data intregation)

19 Integrasi data merupakan penggabungan data dari berbagai database ke dalam satu database baru. c. Seleksi data (data selection) Data yang ada pada database sering kali tidak semuanya dipakai, oleh karena itu hanya data yang sesuai untuk dianalisis yang akan diambil dari database. d. Transformasi data (data transformasi) Data diubah atau digabung ke dalam format yang sesuai untuk diproses dalam data mining. e. Proses mining Merupakan suatu proses utama saat metode diterapkan untuk menemukan pengetahuan berharga dan tersembunyi dari data. Beberapa metode yang dapat digunakan berdasarkan pengelompokan data mining dapat dilihat pada Gambar 2. Gambar 2.6 Beberapa Metode Data Mining

20 f. Evaluasi Pola (pattern evaluation) Untuk mengidentifikasi pola-pola menarik ke dalam knowledge based yang ditemukan. g. Presentasi pengetahuan (Knowledge presentation) Merupakan visualisasi dan penyajian pengetahuan mengenai metode yang digunakan untuk memperoleh pengetahuan yang diperoleh pengguna. 2.10 Naive Bayesian Classification(NBC) Bayesian Classification adalah Pengklasifikasian statistik yang dapat digunakan untuk memprediksi probabilitas ke anggotaan suatu class. Bayesian classification didasarkan pada teorema Bayes yang memiliki kemampuan klasifikasi seperti dengan decision tree dan neural network. Teorema Bayes memiliki bentuk umum seperti berikut [10] : P(H X) = P(X H)P(H)...(2.7) P(X) Keterangan : X H P(H X) P(H) P(X H) P(X) = data dengan class yang belum diketahui = hipotes data X merupakan satu class spesifik = Probabilitas Hipotesa H berdasarkan kondisi X (posteriori probability) = probabilitas hipotesis H (prior probability) = probabilitas X berdasarkan kondisi pada hipotesis H = probabilitas X 2.11 MATLAB Matlab berasal dari matrix laborator, penulisan Matlab pada awalnya digunakan untuk mempermudah penulisan pada pengaksesan perangkat lunak matrik yang dibentuk oleh LINPACK dan EISPACK.

21 Matlab merupakan bahasa dengan (high-performance) kinerja tinggi untuk melakukan komputasi masalah pada tehnik. Matlab mengintegrasikan komputasi, visualisasi, serta pemrograman dalam suatu model yang mudah diimplementasikan dimana masalah serta penyelesaiannya dengan mendeskripsikan yang terdapat dalam notasi matematika. Saat ini Matlab telah bergabung dengan LAPACK dan Blas library yang merupakan kesatuan dari sebuah seni yang terdapat pada perangkat lunak untuk pemrosesan komputasi matrik. Pengguna Matlab seperti pada bidang Pembentukan Algorithm, Matematika dan Komputasi, Pemodelan, Akuisisi Data, Analiisa data, bidang Rekayasa dan grafik keilmuan. Bagian utama yang terdapat pada sebuah sistem Matlab diantaranya adalah 1. Development Environment Susunan beberapa perangkat dan fasilitas yang dapat membantu untuk penggunaan fungsi-fungsi dan file-file yang ada pada Matlab. Beberapa perangkat tersebut merupakan sebuah Graphical User Interfaces (GUI) termasuk didalamnya adalah Matlab Dekstop & Command Window, Command History, sebuah Editor & Debugger, dan Browsers untuk melihat Help, Workspace, Files, dan Path. 2. Matlab Mathematical Function Library Sekumpulan dari algoritma-algoritma komputasi yang terdiri dari fungsi-fungsi dasar seperti : sum, sin, dan complex arithmetic, sampai dengan fungsi-fungsi yang lebih komplek seperti matrix inverse, matrix eigenvalues, Bassel functions, dan Fast Fourier, dan Fast Fourier Transforms. 3. Matlab Language Merupakan suatu high-level matrix/array language dengan control flow stattements, functions, data structures, input/output, dan fitur-fitur object-oriented programming. Hal tersebut dapat dimungkinkan untuk melakukan kedua hal sekaligus, baik pemrograman dalam lingkup yang sederhana untuk didapatkan hasil yang cepat, dan pemrograman pada

22 lingkup yang lebih besar untuk diperoleh hasil-hasil dan aplikasi yang komplek. 4. Graphics Fasilitas untuk menampilkan vektor dan matrik sebagai suatu grafik. Di graphics tersebut melibatkan high-level functions (fungsi-fungsi level tinggi) untuk memvisualisasikan data dua dimensi dan data tiga dimensi, image processing, animation, dan presentation graphics. 5. Matlab Application Program Interface (API) Suatu library yang dapat memungkinkan program yang telah ditulis dalam bahasa C dan Fortran mampu berinteraksi dengan Matlab. Hal tersebut menggunakan fasilitas untuk pemanggilan routines dari Matlab (dynamic linking), pemanggilan Matlab sebagai sebuah computational engine, dan untuk membaca dan menuliskan MAT-files. 2.12 Data Musik Data musik yang digunakan dalam penelitian ini berjumlah 60 buah data yangdibagi ke dalam 3 buah genre yaitu Jazz, Rock, dan Kasidah, (masing-masing terdiri atas 20 buah lagu). Kemudian di lakukan pelabelan genre secara subjektif terhadap klip lagu tersebut. 2.13 Kerangka Pemikiran Kerangka pemikiran merupakan garis besar dari langkah langkah penelitian yang dilakukan. Langkah langkah tersebut disusun sedemikian rupa sebagai acuan untuk tahap tahap yang dilakukan dalam proses penilitian.

23 Tabel 2.1 kerangka pemikiran Permasalahan Pengelompokkan musik berdasarkan genre masih menggunakan cara manual dan subyektif. Mengetahui keakuratan metode Naive Bayes untuk klasifikasi genre musik Tujuan Untuk menentukan genre musik secara otomatis berdasarkan data training. Menganilisa keakuratan penggunaan algoritma Naive Bayes untuk klasifikasi genre musik Eksperimen Inputan Metode Implementasi File musik *wav Naive Bayes Classifier Matlab 2012a Hasil Menghasilkan sebuah sistem yang mampu mengkalsifikasikan musik kedalam genre genre tertentu berdasarkan data training Manfaat Membantu menentukan dan mengkelompokkan musik berdasarkan genre, ini dapat digunakan sebagai data pendukung dalam pembuatan soundtrack sebuah film tertentu.