KLASIFIKASI BAHAN PANGAN BERDASARKAN KANDUNGAN ZAT GIZI BAHAN PANGAN MENGGUNAKAN FUZZY K-NEAREST NEIGHBOR ANISAUL MUAWWANAH

Ukuran: px
Mulai penontonan dengan halaman:

Download "KLASIFIKASI BAHAN PANGAN BERDASARKAN KANDUNGAN ZAT GIZI BAHAN PANGAN MENGGUNAKAN FUZZY K-NEAREST NEIGHBOR ANISAUL MUAWWANAH"

Transkripsi

1 KLASIFIKASI BAHAN PANGAN BERDASARKAN KANDUNGAN ZAT GIZI BAHAN PANGAN MENGGUNAKAN FUZZY K-NEAREST NEIGHBOR ANISAUL MUAWWANAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

2

3 PERNYATAAN MENGENAI SKRIPSI DAN SUMBER INFORMASI SERTA PELIMPAHAN HAK CIPTA Dengan ini saya menyatakan bahwa skripsi berjudul Klasifikasi Bahan Pangan berdasarkan Kandungan Zat Gizi Bahan Pangan Menggunakan Fuzzy K- Nearest Neighbor adalah benar karya saya dengan arahan dari komisi pembimbing dan belum diajukan dalam bentuk apa pun kepada perguruan tinggi mana pun. Sumber informasi yang berasal atau dikutip dari karya yang diterbitkan maupun tidak diterbitkan dari penulis lain telah disebutkan dalam teks dan dicantumkan dalam Daftar Pustaka di bagian akhir disertasi ini. Dengan ini saya melimpahkan hak cipta dari karya tulis saya kepada Institut Pertanian Bogor. Bogor, Juli 2013 Anisaul Muawwanah NIM G

4 ABSTRAK ANISAUL MUAWWANAH. Klasifikasi Bahan Pangan berdasarkan Kandungan Zat Gizi Bahan Pangan Menggunakan Fuzzy K-Nearest Neighbor. Dibimbing oleh SRI NURDIATI. Indeks glikemik merupakan salah satu parameter yang tepat untuk memilih pangan yang sesuai bagi penderita diabetes. Salah satu kendala dalam penerapan konsep ini adalah terbatasnya data indeks glikemik pangan yang telah diketahui. Dengan berbekal pengetahuan mengenai kandungan zat gizi dan proses pemasakan sebagai faktor yang memengaruhi indeks glikemik, penelitian ini mengusulkan model klasifikasi bahan pangan berdasarkan kandungan zat gizi bahan pangan menggunakan algoritme fuzzy k-nearest neighbor. Dari hasil penelitian diketahui bahwa kondisi data yang tidak seimbang membuat hasil klasifikasi menjadi kurang optimal. Model hanya mampu mencapai nilai akurasi sebesar 53.69%. Untuk mengatasi kondisi tersebut maka pada penelitian ini diterapkan 4 teknik resampling. Penerapan keempat teknik tersebut berhasil mengatasi kondisi data tidak seimbang. Secara umum teknik random oversampling memiliki kinerja terbaik dengan hasil akurasi sebesar 84.39% pada 1- NN. Teknik selanjutnya yang menghasilkan kinerja terbaik adalah SMOTE dengan nilai akurasi sebesar 73.37% pada 1-NN dan 2-NN. Kata kunci: data tidak seimbang, fuzzy k-nearest neighbor, indeks glikemik, resampling ABSTRACT ANISAUL MUAWWANAH. Classification of Food Based on Food Nutrients Using Fuzzy K-Nearest Neighbor. Supervised by SRI NURDIATI. The concept of glycemic index is an approach to select the right food for diabetics. One obstacle to implement this concept is the limited amount of known glycemic index data. With this knowledge about food nutrient and cooking process as factors that influence the glycemic index, we proposed a model to classify food based on its nutrients using fuzzy k-nearest neighbor algorithm. The results revealed that the classifier performance was not optimal because of the imbalanced data. The best accuracy for this model was only 53.69%. To overcome imbalanced data condition, we applied 4 different resampling techiques. The results showed that resampling techniques successfully solved the imbalanced data problem. In general, random over-sampling technique had the best performance with an accuracy of 84.39% in 1-NN. The next technique that had the best performance was synthetic minority over-sampling technique (SMOTE) with an accuracy of 73.37% in 1-NN and 2-NN. Keywords: fuzzy k-nearest neighbor, glycemic index, imbalanced data, resampling

5 KLASIFIKASI BAHAN PANGAN BERDASARKAN KANDUNGAN ZAT GIZI BAHAN PANGAN MENGGUNAKAN FUZZY K-NEAREST NEIGHBOR ANISAUL MUAWWANAH Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Komputer pada Departemen Ilmu Komputer DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2013

6 Penguji : 1 Dr Ir Agus Buono, MSi MKom 2 Karlina Khiyarin Nisa, SKom MT

7 Judul Skripsi : Klasifikasi Bahan Pangan berdasarkan Kandungan Zat Gizi Bahan Pangan Menggunakan Fuzzy K-Nearest Neighbor Nama : Anisaul Muawwanah NIM : G Disetujui oleh Dr Ir Sri Nurdiati, MSc Pembimbing Diketahui oleh Dr Ir Agus Buono, MSi MKom Ketua Departemen Tanggal Lulus:

8 PRAKATA Puji dan syukur penulis panjatkan kepada Allah subhanahu wa ta ala atas segala karunia-nya sehingga skripsi ini berhasil diselesaikan. Penulis menyampaikan terima kasih kepada kedua orang tua, yaitu Bapak Teguh Gunadi dan Ibu Bois Asnawati atas dukungan dan doa yang diberikan kepada penulis. Selain itu, penulis juga mengucapkan terima kasih kepada: 1 Ibu Dr Ir Sri Nurdiati, MSc selaku dosen pembimbing skripsi 2 Bapak Dr Ir Agus Buono, MSi MKom dan Ibu Karlina Khiyarin Nisa SKom, MT selaku penguji 3 Para dosen dan seluruh civitas akademik Departemen Ilmu Komputer Institut Pertanian Bogor 4 Teman-teman yang telah membantu pengerjaan skripsi ini 5 Semua pihak yang telah membantu penulis menyelesaikan skripsi ini. Semoga karya ilmiah ini bermanfaat. Bogor, Juli 2013 Anisaul Muawwanah

9 DAFTAR ISI DAFTAR TABEL vi DAFTAR GAMBAR vi DAFTAR LAMPIRAN vi PENDAHULUAN 1 Latar Belakang 1 Perumusan Masalah 2 Tujuan Penelitian 2 Manfaat Penelitian 2 Ruang Lingkup Penelitian 3 METODE 3 Identifikasi Masalah 4 Pengumpulan Data 4 Praproses Data 5 Resampling 5 Pembagian Data 6 Klasifikasi Menggunakan FKNN 6 Analisis 9 Spesifikasi Perangkat Lunak 9 HASIL DAN PEMBAHASAN 9 Pengumpulan Data 9 Praproses Data 10 Resampling 10 Pembagian Data 11 Klasifikasi Menggunakan FKNN 11 Analisis 12 SIMPULAN DAN SARAN 16 Simpulan 16 Saran 17 DAFTAR PUSTAKA 17 LAMPIRAN 19 RIWAYAT HIDUP 29

10 DAFTAR TABEL 1 Contoh data komposisi bahan pangan (USDA 2012) 4 2 Contoh data indeks glikemik pangan (Mendosa 2008) 4 3 Confusion matrix dengan dua kelas 8 4 Pengkodean data kategorik menjadi data nominal 10 5 Perbandingan banyak data asli dan data hasil resampling 10 6 Hasil akurasi rata-rata dalam satuan persen 11 DAFTAR GAMBAR 1 Metodologi penelitian 3 2 Grafik hasil akurasi 12 3 Grafik hasil precision (kiri) dan recall (kanan) 13 4 Grafik f-measure 13 5 Grafik distribusi normal kandungan protein pada kelas GI berbeda 15 6 Grafik distribusi normal kandungan serat pada kelas GI berbeda 16 7 Grafik distribusi normal kandungan lemak pada kelas GI berbeda 16 DAFTAR LAMPIRAN 1 Nilai rata-rata precision, recall, dan f-measure setiap kelas pada nilai k 1 sampai Contoh data hasil tahap praproses data (data asli) 20 3 Data hasil proses random under-sampling 21 4 Data hasil proses k-means based under-sampling 24 5 Contoh data hasil proses random over-sampling 27 6 Contoh data hasil proses SMOTE 28

11 PENDAHULUAN Latar Belakang Diabetes merupakan salah satu penyakit yang memiliki tingkat kematian tertinggi di dunia. Setiap tahun terjadi sekitar 3.2 juta kematian di seluruh dunia akibat penyakit ini. Dengan kata lain setiap hari terjadi sekitar 8700 kematian akibat diabetes. Jumlah tersebut diperkirakan akan terus meningkat sejalan dengan pertambahan penderita diabetes setiap tahun. Pada tahun 2000 tercatat sekitar 171 juta penderita diabetes di seluruh dunia dan WHO memperkirakan jumlah tersebut akan meningkat menjadi lebih dari dua kali lipatnya pada tahun 2030 (WHO 2004). Indonesia menempati peringkat keempat dalam daftar negara dengan tingkat penderita diabetes terbanyak di dunia pada tahun Saat itu Indonesia memiliki 8.4 juta penderita dan diperkirakan akan memiliki 21.3 juta penderita pada tahun 2030 (Wild et al. 2004). Salah satu penyebab penyakit diabetes adalah konsumsi zat gizi yang tidak seimbang, khususnya kelebihan asupan karbohidrat. Kelebihan asupan karbohidrat berkaitan dengan kemampuan tubuh dalam mengolah karbohidrat. Pada kasus ini tubuh akan meningkatkan sekresi (pengeluaran) insulin untuk mengimbangi banyaknya karbohidrat. Insulin akan berupaya menjaga kadar glukosa darah pada batas normal. Namun bila kondisi kelebihan karbohidrat tersebut berlangsung lama, insulin tidak mampu lagi melaksanakan fungsinya sehingga kadar glukosa darah tinggi. Kondisi kadar gula darah tinggi inilah yang menjadi masalah utama bagi penderita diabetes. Selain kondisi kadar gula darah tinggi, peningkatan kadar gula darah secara drastis merupakan masalah lain yang kerap dihadapi penderita diabetes. Kondisi ketika kadar gula darah meningkat secara drastis (hiperglikemik) sedapat mungkin harus dihindari karena dapat berakibat fatal pada kondisi kesehatannya. Salah satu solusi untuk mengendalikan kadar gula darah adalah dengan melakukan pengaturan pola makan. Memilih pangan yang tidak menaikkan kadar gula darah secara drastis merupakan salah satu upaya untuk menjaga kadar gula darah tetap normal. Salah satu pendekatan dalam memilih pangan yang tepat adalah pendekatan indeks glikemik. Secara sederhana, indeks glikemik menggambarkan respon gula darah setelah mengonsumsi suatu pangan (Rimbawan dan Siagian 2005). Semakin besar nilai indeks glikemik suatu pangan berarti pangan tersebut semakin cepat meningkatkan kadar glukosa darah. Konsep indeks glikemik menekankan pentingnya mengenal pangan berdasarkan kecepatannya menaikkan kadar gula darah. Pada konsep ini, pemilihan pangan fokus pada pemilihan pangan berindeks glikemik rendah untuk memenuhi sebagian besar sumber karbohidrat yang dibutuhkan. Bahan pangan dengan indeks glikemik rendah diketahui menaikkan kadar gula darah dengan lambat sehingga kondisi peningkatan kadar gula darah secara drastis dapat dihindari. Hal ini membantu penderita diabetes meminimalkan risiko terkena kondisi hiperglikemik. Penerapan konsep ini juga bisa diterapkan pada penderita obesitas dan olahragawan yang konsumsi makanannya sangat tergantung pada sumber karbohidrat.

12 2 Indeks glikemik bahan pangan dipengaruhi beberapa faktor seperti kandungan zat gizi dan proses pemasakan bahan pangan. Dari hasil uji laboratorium diketahui bahwa kandungan protein dan serat memiliki pengaruh yang berbanding terbalik dengan indeks glikemik bahan pangan (Trout et al. 1993). Hal yang sama juga berlaku pada pengaruh kandungan lemak pada indeks glikemik. Semakin rendah kandungan lemak suatu bahan pangan cenderung membuat indeks glikemiknya semakin tinggi (Wolever 1990). Sebaliknya, proses pemasakan yang terjadi pada bahan pangan justru memiliki efek positif terhadap indeks glikemik. Semakin rumit proses yang dilakukan, semakin tinggi pula indeks glikemik yang akan dihasilkan (Brand et al. 1985). Salah satu kendala penerapan konsep indeks glikemik adalah belum lengkapnya data indeks glikemik bahan pangan, khususnya bahan pangan Indonesia. Upaya untuk melengkapi data indeks glikemik bahan pangan hingga saat ini masih terus dilakukan. Akan tetapi penelitian di bidang ini membutuhkan waktu yang cukup lama dan biaya yang cukup besar. Oleh sebab itu, berbekal pengetahuan yang ada mengenai indeks glikemik dan faktor-faktor yang memengaruhinya, pada penelitian ini akan dibuat suatu model untuk mengklasifikasikan bahan pangan berdasarkan kandungan zat gizi bahan pangan menggunakan algoritme fuzzy k-nearest neighbor (FKNN). Algoritme ini dipilih karena mampu menghasilkan akurasi yang baik dengan proses perhitungan yang sederhana. Nilai akurasi yang dihasilkan pun lebih baik dari nilai akurasi algoritme KNN biasa. Selain itu, kesalahan klasifikasi pada kelas yang memiliki nilai membership function besar sangat jarang terjadi (Keller et al. 1985). Perumusan Masalah Perumusan masalah pada penelitian ini adalah bagaimana membuat model yang mampu mengklasifikasikan bahan pangan menurut kandungan zat gizi bahan pangan menggunakan algoritme FKNN. Tujuan Penelitian Tujuan dari penelitian ini adalah membangun sebuah model yang mampu mengklasifikasikan bahan pangan menurut kandungan zat gizi bahan pangan menggunakan algoritme FKNN. Manfaat Penelitian Manfaat dari penelitian ini adalah sebagai berikut: 1 Memudahkan prediksi status indeks glikemik pangan. 2 Membantu pemilihan sumber karbohidrat yang cocok bagi penderita diabetes. 3 Membantu penyusunan menu makanan sesuai konsep indeks glikemik untuk penderita diabetes, obesitas, dan olahragawan.

13 3 Ruang Lingkup Penelitian Ruang lingkup pada penelitian ini adalah sebagai berikut: 1 Penelitian ini difokuskan pada proses pembuatan model untuk klasifikasi bahan pangan menurut kandungan zat gizi bahan pangan. 2 Data yang digunakan meliputi data komposisi bahan pangan dan status indeks glikemik bahan pangan. 3 Zat gizi yang dilibatkan dalam penelitian ini adalah karbohidrat, protein, lemak, dan serat. Selain itu, proses pemasakan bahan pangan juga dilibatkan dalam penelitian ini. 4 Teknik yang digunakan adalah teknik FKNN. METODE Penelitian ini dilakukan dalam beberapa tahap seperti yang terlihat pada Gambar 1. Secara umum metodologi penelitian ini terdiri atas identifikasi masalah, Gambar 1 Metodologi penelitian

14 4 pengumpulan data, praproses data, resampling, pembagian data, klasifikasi menggunakan FKNN, dan analisis hasil klasifikasi. Identifikasi Masalah Tahap ini meliputi tahap pemilihan dan identifikasi masalah dan tujuan. Masalah dalam penelitian ini ialah belum tersedianya data yang lengkap terkait indeks glikemik bahan pangan sehingga tidak semua bahan pangan dapat diketahui nilai indeks glikemiknya. Salah satu solusi dari masalah tersebut adalah pembuatan model klasifikasi terhadap status indeks glikemik bahan pangan berdasarkan kandungan zat gizi bahan pangan. Model yang dihasilkan diharapkan dapat membantu proses prediksi status bahan pangan untuk bahan pangan yang belum diketahui nilai indeks glikemiknya. Pengumpulan Data Data yang digunakan dalam penelitian ini meliputi daftar komposisi pangan dan tabel indeks glikemik bahan pangan. Daftar komposisi pangan yang digunakan merupakan data sekunder yang diadopsi dari USDA National Nutrient Database for Standard Reference (USDA 2012). Daftar ini memuat kandungan energi dan beberapa zat gizi, seperi karbohidrat, protein, lemak, kalsium, fosfor, besi, vitamin A, vitamin B1, vitamin C, serat, serta kandungan air dari beberapa pangan. Adapun contoh komposisi pangan dapat dilihat pada Tabel 1. Tabel indeks glikemik bahan pangan memuat kandungan indeks glikemik dan nilai beban glikemik dari berbagai jenis pangan yang banyak dijumpai di beberapa negara. Daftar ini diadopsi dari Revised International Table of Glycemic Index and Glycemic Load Values: 2008 (Mendosa 2008). Tabel tersebut berisi nilai indeks glikemik (GI) dan beban glikemik (GL) pangan, seperti yang terdapat pada Tabel 2. Indeks glikemik dalam daftar tersebut dinyatakan dalam ukuran 50 Tabel 1 Contoh data komposisi bahan pangan (USDA 2012) Pangan Karbohidrat Lemak Protein Serat Energi (gr) (gr) (gr) (gr) (kkal) Pisang Bit Blueberry Wortel Tabel 2 Contoh data indeks glikemik pangan (Mendosa 2008) Food Glycemic Index Glycemic Load Pea, froze, boiled Pea, green Pumpkin Strawberry, fresh, raw

15 gram karbohidrat. Pangan yang terdaftar meliputi bahan pangan dan olahan bahan pangan dengan berbagai varietas dan proses pemasakan. Indeks glikemik adalah nilai yang menyatakan seberapa cepat peningkatan kadar gula darah setelah mengonsumsi suatu bahan pangan. Semakin besar nilai GI dari suatu bahan pangan menandakan semakin cepat kenaikan gula darah dapat terjadi. Adapun beban glikemik menyatakan kandungan glukosa dalam penyajian suatu bahan pangan. Semakin besar nilai GL menandakan semakin banyak glukosa yang terkandung dalam suatu bahan pangan (Mendosa 2008). 5 Praproses Data Pada penelitian ini, data yang tersedia memiliki dua jenis atribut, yaitu atribut numerik dan kategorik. Untuk memudahkan proses klasifikasi, atribut dengan tipe kategorik diubah menjadi atribut nominal dengan cara kodifikasi. Tahap selanjutnya adalah konversi kandungan lemak, protein, dan serat agar sebanding dengan indeks glikemik. Konversi kandungan lemak, protein, dan serat dilakukan dalam ukuran 50 gram karbohidrat. Tahap berikutnya dari praproses data meliputi proses pembersihan data dan normalisasi. Proses pembersihan data terdiri dari proses penghapusan missing value. Selanjutnya, data yang sudah bersih dinormalisasi untuk menyamakan range dari data. Normalisasi dilakukan untuk mencegah dominasi salah satu atribut ketika proses klasifikasi. Pada penelitian ini diterapkan min-max normalization dengan formulasi sebagai berikut (Larose 2005): dengan x * : nilai hasil proses normalisasi x : nilai sebelum normalisasi min(x) : nilai minimum dari suatu atribut max(x) : nilai maksimum dari suatu atribut a n n Resampling Proses resampling dilakukan sebagai upaya mengatasi kondisi data yang tidak seimbang. Data yang tidak seimbang ditandai dengan tidak samanya sebaran data setiap kelas. Resampling merupakan teknik menyelesaikan masalah data tidak seimbang dengan pendekatan data. Metode resampling yang digunakan terdiri atas under-sampling dan over-sampling. Pada penelitian ini digunakan 2 jenis metode under-sampling, yaitu random under-sampling dan k-means based under-sampling, dan 2 jenis metode over-sampling, yaitu random over-sampling dan synthetic minority over-sampling technique (SMOTE). Metode under-sampling akan menghapus beberapa data pada kelas mayoritas sampai banyak anggota kelas mayoritas sama dengan kelas minoritas. Pada random under-sampling, pemilihan anggota kelas mayoritas yang akan dihapus dilakukan secara acak (Liao 2008). Sementara itu, pada k-means based

16 6 under-sampling diterapkan algoritme k-means clustering pada data. Selanjutnya, dipilih beberapa data dari setiap cluster yang dihasilkan. Data pilihan tersebut kemudian digunakan untuk menggantikan kelas mayoritas (Cohen et al. 2006). Adapun untuk menentukan banyak data yang harus diambil dari setiap cluster dapat menggunakan rumus berikut: dengan C i : banyak data yang harus diambil dari cluster ke-i N min : banyak data pada kelas minoritas N max : banyak data pada kelas mayoritas N i : banyak data pada cluster ke-i n : banyak cluster n a Metode over-sampling menambahkan beberapa data pada kelas minoritas sampai banyak anggota kelas minoritas sama dengan kelas mayoritas. Serupa dengan random under-sampling, metode random over-sampling secara acak memilih beberapa anggota kelas minoritas untuk ditambahkan pada kelas itu sendiri (Liao 2008). Berbeda dengan random over-sampling yang menduplikasi anggota kelas minoritas secara acak, SMOTE membangkitkan data buatan berdasarkan konsep tetangga terdekat. Langkah pertama yang harus dilakukan pada metode ini ialah mencari 5 tetangga terdekat dari setiap anggota kelas minoritas. Selanjutnya dari data tetangga tersebut akan dibangkitkan data buatan. Proses membangkitkan data buatan dimulai dengan memilih secara acak beberapa tetangga terdekat dari suatu anggota kelas minoritas. Selanjutnya, perbedaan antara anggota kelas minoritas dengan tetangganya dihitung dan dikalikan dengan suatu bilangan acak dari 0 sampai 1. Hasil perkalian tersebut kemudian dijumlahkan dengan anggota kelas minoritas. Hasil penjumlahan tersebut merupakan data buatan yang akan digabungkan pada kelas minoritas (Chawla et al. 2002). Pembagian Data Proses pembagian data akan menggunakan k-fold cross validation. K-fold cross validation dilakukan untuk membagi data latih dan data uji secara acak menjadi k subset. Dari k subset tersebut, sebanyak k-1 subset akan berperan sebagai data latih dan 1 subset akan berperan sebagai data uji. Peran sebagai subset selanjutnya akan dilaksanakan bergantian sehingga setiap subset pernah berperan sebagai data uji. Klasifikasi Menggunakan FKNN Pada tahap ini akan dikembangkan model klasifikasi terhadap masalah yang dihadapi menggunakan algoritme FKNN. FKNN merupakan algoritme pengembangan dari algoritme KNN. Perbedaan kedua algoritme ini terletak pada penggunaan konsep logika fuzzy untuk menentukan derajat keanggotaan setiap

17 kelas yang berbeda berdasarkan jarak yang didapatkan dari hasil perhitungan KNN. Inti dari algoritme FKNN adalah memberikan derajat keanggotaan sebagai fungsi dari jarak data uji ke tetangga terdekatnya dan kelas yang mungkin (Keller et al. 1985). Langkah pertama yang harus dilakukan dalam proses FKNN adalah menghitung jarak dari objek yang akan diuji ke setiap objek yang ada pada data latih. Pada penelitian ini digunakan dua jenis atribut, yaitu atribut numerik dan atribut nominal. Oleh sebab itu, jarak yang digunakan pada proses FKNN merupakan hasil penjumlahan antara jarak numerik diboboti dan jarak nominal diboboti. Perhitungan jarak numerik dari objek yang akan diuji terhadap suatu objek pada data latih dicerminkan pada persamaan berikut: nu n 7 dengan x : objek yang akan diuji y : objek pada data latih x i : nilai atribut numerik ke-i pada objek x y i : nilai atribut numerik ke-i pada objek y n : banyak atribut numerik Adapun perhitungan jarak nominalnya dapat dicerminkan pada persamaan berikut: n n n dengan x : objek yang akan diuji y : objek pada data latih x nom : nilai atribut nominal pada objek x y nom : nilai atribut nominal pada objek y Jarak yang didapatkan dari kedua perhitungan tersebut selanjutnya diberi bobot dan dijumlahkan untuk mendapatkan total jarak menggunakan rumus berikut (Teknomo 2006): dengan x y S xy w nom w num d nom (x, y) d num (x, y) w n n w nu nu w n w nu : objek yang akan diuji : objek pada data latih : total jarak dari objek x terhadap objek y : bobot untuk jarak nominal : bobot untuk jarak numerik : jarak nominal dari objek x terhadap objek y : jarak numerik dari objek x terhadap objek y Pembobotan dilakukan agar tidak ada salah satu jenis atribut yang lebih mendominasi dibanding jenis atribut lainnya. Pada penelitian ini, jarak nominal

18 8 akan diberi bobot 0.5 dan jarak numerik diberi bobot 1 (Nurjayanti 2011). Hal ini dilakukan agar atribut nominal tidak terlalu mendominasi hasil perhitungan. Setelah didapatkan nilai total jarak, perhitungan menurut konsep FKNN mulai dilakukan. Untuk mendapatkan derajat keanggotaan dari suatu objek yang akan diuji digunakan fungsi berikut (Keller et al. 1985): u u u dengan x : objek yang akan diuji y k : tetangga terdekat ke-k dari objek x c : kelas ke-c u c (x) : derajat keanggotaan objek x pada kelas ke-c u c (x, y k ) : derajat keanggotaan objek x pada kelas ke-c dipengaruhi oleh objek y k K : banyak tetangga terdekat yang akan diperhitungkan : jarak dari objek x terhadap objek y k m : bobot untuk pengaruh jarak pada derajat keanggotaan Setelah didapatkan nilai derajat keanggotaan dari setiap kelas, nilai-nilai tersebut dibandingkan dan diambil nilai terbesar sebagai acuan pemilihan kelas. Pada akhirnya data uji akan dimasukkan ke kelas dengan nilai derajat keanggotaan terbesar. Model yang telah dibangun selanjutnya diuji menggunakan data uji yang hasil dari tahap pembagian data. Pengujian ini dilakukan untuk mengetahui akurasi dan efektifitas model yang telah dibangun. Pengujian dilakukan pada k = 1 (1-NN) sampai k = 5 (5-NN). Pengukuran kinerja algoritme akan dilakukan menggunakan confusion matrix yang ditampilkan pada Tabel 3. Confusion matrix selanjutnya digunakan untuk menghitung nilai beberapa kriteria evaluasi berikut: Akurasi merupakan proporsi jumlah prediksi yang tepat. Akurasi dinyatakan dalam persamaan berikut (Maning et al. 2008): Precision merupakan proporsi dari data kelas positif yang berhasil diprediksi dengan benar dari keseluruhan hasil prediksi kelas positif. Precision Tabel 3 Confusion matrix dengan dua kelas Aktual Prediksi Positif Negatif Positif TP FN Negatif FP TN

19 9 dinyatakan sebagai berikut (Maning et al. 2008): s n Recall merupakan proporsi dari hasil prediksi kelas positif yang benar dari seluruh data kelas positif. Recall dinyatakan dalam persamaan berikut (Maning et al. 2008): all F-measure merupakan kriteria evaluasi yang menggabungkan nilai precision dan recall ke dalam satu nilai. Nilai f-measure dapat dihitung menggunakan rumus berikut (Maning et al. 2008): asu all all s n s n Analisis Hasil dari proses klasifikasi akan dianalisis di tahap ini. Beberapa hal yang akan dianalisis antara lain kinerja algoritme FKNN secara umum, pengaruh data tidak seimbang pada hasil klasifikasi, dan pengaruh teknik resampling terhadap hasil klasifikasi. Selain itu, pada tahap ini juga akan diajukan model terbaik untuk klasifikasi data baru. Spesifikasi Perangkat Lunak Perangkat lunak yang digunakan dalam penelitian ini adalah Matlab (R2008b) dan Microsoft Office Excel Kedua perangkat lunak tersebut digunakan dalam proses praproses data sampai klasifikasi FKNN. HASIL DAN PEMBAHASAN Pengumpulan Data Daftar komposisi pangan dan indeks glikemik digabungkan sehingga didapatkan 213 data irisan, meliputi 124 data GI rendah, 51 data GI sedang, dan 38 data GI tinggi. Parameter yang digunakan meliputi 4 buah ciri, yaitu kandungan lemak, protein, serat, dan proses pemasakan. Lemak, protein, dan serat merupakan data numerik, sedangkan proses pemasakan merupakan data bertipe kategorik.

20 10 Tabel 4 Pengkodean data kategorik menjadi data nominal Proses pemasakan Kode Tanpa diolah 1 Jus 2 Direbus 3 Dikeringkan 4 Dipanggang 5 Digoreng 6 Dicampur 7 Dikukus 8 Makanan kalengan 9 Tabel 5 Perbandingan banyak data asli dan data hasil resampling Set Banyak anggota Banyak Teknik resampling data GI rendah GI sedang GI tinggi data Data Data 2 Random under-sampling Data 3 k-means based undersampling Data 4 Random over-sampling Data 5 SMOTE Praproses Data Pengkodean data kategorik menjadi data nominal dapat dilihat pada Tabel 4. Selanjutnya dilakukan normalisasi pada data bertipe numerik menggunakan minmax normalization. Setelah melalui seluruh tahapan praproses data, didapatkan 196 data pangan, meliputi 111 data GI rendah, 50 data GI sedang, dan 35 data GI tinggi. Data ini selanjutnya akan disebut sebagai data 1. Resampling Pada penelitian ini ditemukan bahwa data yang digunakan (data 1) merupakan data tidak seimbang dengan sebuah kelas mayoritas (kelas GI rendah) dan dua buah kelas minoritas (kelas GI sedang dan tinggi). Oleh sebab itu, untuk mengatasi kondisi data yang tidak seimbang dilakukan proses resampling. Proses under-sampling dilakukan sampai banyak data setiap kelas sama dengan banyak data pada kelas GI tinggi. Sebaliknya, over-sampling dilakukan sampai banyak data setiap kelas sama dengan banyak data pada kelas GI rendah. Adapun perbandingan banyak data pada data asli dan data hasil resampling dapat dilihat pada Tabel 5.

21 11 Pembagian Data Pembagian data dilakukan menggunakan teknik 10-fold cross validation agar data latih untuk setiap k mendekati data aslinya. Setiap set data akan dibagi menjadi 10 subset dengan 9 subset berperan sebagai data latih dan 1 subset berperan sebagai data uji. Data uji akan diperankan secara bergantian oleh setiap subset. Oleh sebab itu, untuk setiap set data akan memiliki 10 paket data latih dan data uji. Klasifikasi Menggunakan FKNN Model klasifikasi dibuat dengan nilai m = 2. Selanjutnya, pengujian dilakukan menggunakan data latih dan data uji hasil proses pembagian data. Untuk setiap set data dilakukan pengujian sebanyak 3 kali ulangan. Dengan kata lain, proses pembagian data perlu dilakukan sebanyak 3 kali. Hasil uji dari ketiga ulangan tersebut selanjutnya dihitung rataannya untuk mendapatkan hasil uji keseluruhan. Pada Tabel 6 disajikan akurasi rata-rata yang didapatkan untuk masing-masing set data dan k tetangga terdekat. Dari Tabel 6 diketahui bahwa nilai akurasi untuk data 1 hanya mampu mencapai akurasi tertinggi sebesar 53.69% pada 5-NN. Penerapan teknik random under-sampling pada data menyebabkan terjadinya penurunan akurasi. Penggunaan data 2 hanya mampu menghasilkan nilai akurasi antara 45-47%, dengan nilai akurasi tertinggi dicapai pada 1-NN dan 2-NN sebesar 47.48%. Teknik resampling berikutnya yang diterapkan adalah teknik k-means based under-sampling yang menghasilkan data 3. Penggunaan data 3 juga menyebabkan terjadinya penurunan nilai akurasi. Data tersebut menghasilkan nilai akurasi tertinggi sebesar 46.82% pada 1-NN dan 2-NN. Selain teknik under-sampling, penelitian ini menerapkan teknik over-sampling yang menghasilkan data 4 dan data 5. Data 4 mampu mencapai nilai akurasi 84.39% pada 1-NN. Data 5 menghasilkan nilai akurasi terbaik sebesar 73.37%. Dari hasil tersebut dapat diketahui bahwa secara umum nilai akurasi terbesar dihasilkan oleh data 4 untuk 1-NN, yaitu sebesar 84.39%. Sementara itu, nilai akurasi terkecil dihasilkan oleh data 3 untuk 3-NN, yaitu sebesar 44.30%. Dari hasil perhitungan menggunakan confusion matrix diketahui bahwa secara umum nilai precision dan recall terbaik untuk setiap kelas didapatkan ketika menggunakan data 4. Kelas GI tinggi mencapai nilai precision dan recall Tabel 6 Hasil akurasi rata-rata dalam satuan persen Set data k Data Data Data Data Data

22 12 terbaik pada 1-NN dengan nilai 84.99% dan 97.18%. Serupa dengan kelas GI tinggi, kelas GI sedang mencapai nilai precision dan recall terbaik pada 1-NN dengan nilai 81.93% dan 87.69%. Sama halnya dengan kedua kelas sebelumnya, kelas GI rendah mencapai nilai precision terbaik ketika menggunakan data 4 pada 1-NN dengan nilai 88.37%. Berbeda dengan recall pada 2 kelas sebelumnya, recall terbaik pada kelas GI rendah dicapai data 1 pada 3-NN dengan nilai 72.12%. Selain nilai precision dan recall, penelitian ini juga menghitung nilai f- measure untuk mengetahui kinerja FKNN. Ketiga kelas mencapai nilai f-measure terbaik ketika menggunakan data 4 pada 1-NN. Nilai f-measure terbesar diperoleh kelas GI tinggi (90.17%) serta disusul oleh kelas GI sedang (83.88%) dan rendah (75.58%). Sementara itu, f-measure terkecil untuk kelas GI sedang dan tinggi diperoleh data 1 dengan nilai 36.90% dan 39.07%. Nilai tersebut dicapai kelas GI sedang pada 5-NN dan GI tinggi pada 1-NN dan 2-NN. Adapun f-measure terkecil untuk kelas GI rendah dicapai data 2 pada 1-NN dan 2-NN dengan nilai 53.89%. Analisis Gambar 2 menyajikan grafik akurasi yang diperoleh untuk setiap set data dan k tetangga terdekat. Dari grafik tersebut dapat diketahui bahwa pada penelitian ini akurasi data 1 tidak besar, namun mampu melebihi nilai 50%. Selain itu, pada Gambar 3 dan Gambar 4 ditunjukkan bahwa nilai precision, recall, dan f-measure kelas GI sedang dan tinggi jauh lebih kecil dari kelas GI rendah. Ketiga hasil evaluasi menunjukkan bahwa kelas GI rendah mendominasi proses Akurasi (%) data 1 data 2 data 3 data 4 data 5 Set Data k = 1 k = 2 k = 3 k = 4 k = 5 Gambar 2 Grafik hasil akurasi

23 klasifikasi. Dengan kata lain, sebuah data akan cenderung diklasifikasi ke kelas GI rendah daripada ke 2 kelas lainnya. Kondisi ini dicurigai terjadi karena jumlah data yang tidak seimbang. Oleh sebab itu, penelitian ini menerapkan beberapa teknik resampling untuk mengatasi masalah data tidak seimbang dan meningkatkan akurasi hasil klasifikasi. Dari grafik pada Gambar 2 terlihat bahwa nilai akurasi pada data 2 dan 3 lebih rendah bila dibandingkan dengan akurasi data 1. Kedua data tersebut menunjukkan bahwa data hasil teknik under-sampling tidak berhasil meningkatkan nilai akurasi. Di sisi lain, nilai akurasi meningkat pada data yang menerapkan teknik over-sampling, yaitu data 4 dan 5. Nilai akurasi terbesar dicapai oleh data 4 yang menerapkan teknik random over-sampling. Meskipun terjadi penurunan akurasi pada data 2 dan 3, kedua data tersebut meningkatkan nilai f-measure dari kelas GI sedang dan tinggi. Di sisi lain, kelas 13 Gambar 3 Grafik hasil precision (kiri) dan recall (kanan) Gambar 4 Grafik f-measure

24 14 GI rendah pada kedua data tersebut mengalami penurunan nilai precision, recall, dan f-measure. Kondisi ini terjadi akibat penerapan teknik under-sampling. Teknik ini menghapus beberapa anggota kelas mayoritas sehingga beberapa informasi dari kelas tersebut hilang. Secara keseluruhan, hasil terbaik untuk seluruh kriteria evaluasi diperoleh ketika menggunakan data 4. Hal ini dipengaruhi teknik resampling yang digunakan, yaitu teknik random over-sampling. Pada teknik ini, data asli akan diduplikasi secara acak sehingga menghasilkan data baru. Oleh sebab itu, terdapat kemungkinan bahwa FKNN membandingkan data uji yang digunakan dengan duplikat dari data tersebut. Kondisi ini dikhawatirkan dapat mengakibatkan hasil yang kurang akurat jika data 4 digunakan untuk klasifikasi data baru. Data berikutnya yang juga memiliki hasil evaluasi cukup besar adalah data 5. Meskipun peningkatan hasil evaluasi yang dihasilkan tidak sebesar pada data 4, secara umum data 5 memberikan hasil yang baik. Pada Gambar 3 dan Gambar 4 ditunjukkan bahwa nilai precision, recall, dan f-measure yang dihasilkan data 5 meningkat sekitar 2 kali lipat kecuali pada kelas GI rendah. Pada kelas GI rendah, data 5 mengalami kenaikan nilai precision sekitar 7% dan penurunan nilai recall sekitar 8%. Hal ini disebabkan teknik resampling yang diterapkan, yaitu SMOTE. SMOTE menambahkan anggota kelas minoritas dengan membangkitkan data buatan dari tetangga yang saling berdekatan. Dengan cara tersebut, wilayah dari kelas minoritas menjadi lebih luas sehingga meningkatkan kemungkinan klasifikasi suatu data ke dalam kelas minoritas. Penurunan nilai precision, recall, dan f-measure kelas GI rendah juga dapat disebabkan oleh meluasnya wilayah dari kelas GI sedang dan tinggi. Penggunaan SMOTE juga menurunkan kemungkinan terjadinya duplikasi data seperti yang terjadi pada teknik random over-sampling. Dengan teknik ini diharapkan hasil klasifikasi data baru lebih akurat bila dibandingkan dengan teknik random over-sampling. Meskipun secara umum teknik resampling berhasil meningkatkan kinerja FKNN dan memperbaiki dominasi kelas mayoritas, hasil klasifikasi masih belum optimal. Hal ini diduga disebabkan oleh banyak data yang belum memenuhi kebutuhan. Pada kasus klasifikasi data tidak seimbang, banyak data yang digunakan menjadi salah satu faktor penentu keberhasilan klasifikasi. Semakin banyak data yang digunakan maka tingkat error yang dihasilkan akan semakin menurun. Bahkan jika ukuran data yang digunakan besar, kondisi data yang tidak seimbang tidak akan berpengaruh besar pada hasil klasifikasi (Sun et al. 2006). Gambar 5, Gambar 6, dan Gambar 7 menyajikan grafik distribusi normal untuk kandungan protein, serat, dan lemak dari data 1 pada kelas GI berbeda. Dari Gambar 5 dapat diketahui bahwa kandungan protein tidak memisahkan ketiga kelas dengan baik. Ketiga grafik tersebut berhimpit antara satu dengan yang lain. Kelas GI tinggi dan sedang terpusat pada kadar protein rendah. Sementara itu, kelas GI rendah memiliki jangkauan yang lebih luas dari kedua kelas lainnya, yaitu meliputi kadar protein rendah hingga kadar protein tinggi. Dari grafik tersebut terlihat bahwa semakin besar kadar protein suatu pangan maka semakin besar pula peluang pangan tersebut memasuki kelas GI rendah. Sebaliknya, semakin rendah kandungan protein dalam suatu pangan maka semakin besar pula kemungkinan bahwa pangan tersebut memiliki GI tinggi. Kondisi serupa ditemui pada pengaruh kandungan serat terhadap GI suatu pangan. Dari Gambar 6 diketahui bahwa kandungan serat tidak mampu

25 15 Gambar 5 Grafik distribusi normal kandungan protein pada kelas GI berbeda memisahkan ketiga kelas GI dengan baik. Selain itu, diketahui bahwa semakin besar kandungan serat dalam suatu pangan, semakin besar pula peluang pangan tersebut dikelompokkan dalam kelas GI rendah. Oleh sebab itu, pangan dengan kandungan serat rendah akan cenderung dikelompokkan dalam kelas GI tinggi. Kandungan lemak juga tidak mampu memisahkan ketiga kelas GI dengan baik, seperti yang tampak pada Gambar 7. Serupa dengan pengaruh kandungan protein dan serat tinggi pada GI suatu pangan, kandungan lemak tinggi juga membuat suatu pangan berpotensi lebih besar untuk memiliki GI rendah. Akan tetapi, hal serupa tidak terjadi pada pangan dengan kandungan lemak rendah. Berbeda dengan kandungan protein dan serat rendah yang berpotensi besar menyebabkan pangan memiliki GI tinggi, kandungan lemak rendah justru berpotensi besar menyebabkan pangan memiliki GI sedang. Hal ini bertentangan dengan teori yang menyatakan bahwa semakin rendah kandungan lemak suatu pangan maka semakin besar nilai GI dari pangan tersebut. Kondisi ini diduga terjadi karena pengaruh kandungan zat gizi lainnya dan proses pemasakan yang dilakukan pada pangan. Kandungan protein, lemak, dan serat ternyata belum mampu memisahkan ketiga kelas dengan sempurna. Grafik yang dihasilkan masing-masing zat gizi berhimpit antara satu kelas dengan kelas lainnya. Ketiga grafik berhimpit pada kandungan zat gizi sedang dan rendah. Kondisi ini mengakibatkan rentan terjadinya kesalahan klasifikasi pada kandungan protein, serat, dan lemak rendah dan sedang. Hal ini diduga merupakan penyebab rendahnya nilai akurasi pada hasil klasifikasi menggunakan data 1.

26 16 Gambar 6 Grafik distribusi normal kandungan serat pada kelas GI berbeda Gambar 7 Grafik distribusi normal kandungan lemak pada kelas GI berbeda SIMPULAN DAN SARAN Simpulan Penelitian ini telah berhasil menerapkan algoritme FKNN dalam proses klasifikasi bahan pangan berdasarkan kandungan zat gizi bahan pangan. Model klasifikasi yang menggunakan data asli ternyata belum mampu memberikan hasil klasifikasi yang optimal karena kondisi data yang tidak seimbang. Selain itu, hasil klasifikasi cenderung didominasi oleh kelas GI rendah sebagai kelas minoritas.

27 Kondisi ini berhasil diperbaiki dengan menerapkan beberapa teknik resampling, yaitu random under-sampling, k-means based under-sampling, random oversampling, dan SMOTE. Dari keempat teknik resampling yang digunakan, model yang menggunakan data hasil proses random over-sampling memberikan hasil terbaik untuk seluruh kriteria evaluasi. Saran Meskipun kinerja FKNN berhasil ditingkatkan dengan menggunakan beberapa teknik resampling, hasil klasifikasi yang diberikan dalam penelitian ini belum optimal. Oleh sebab itu, pada penelitian selanjutnya dapat dilakukan beberapa hal berikut untuk membuat hasil klasifikasi lebih optimal: 1 Menambah banyaknya data yang digunakan. 2 Menerapkan teknik penyelesaian masalah data tidak seimbang berdasarkan pendekatan algoritme. 3 Mencari fungsi distribusi peluang terbaik untuk setiap atribut data dan memanipulasi data berdasarkan parameter fungsi tersebut untuk mengatasi kondisi data tidak seimbang. 17 DAFTAR PUSTAKA Brand JC, Nicholson PL, Thorburn AW, Truswell AS Food processing and the glycemic index. The American Journal of Clinical Nutrition. 42(6): Chawla NV, Bowyer KW, Hall LO, Kegelmeyer WP SMOTE: synthetic minority over-sampling technique. Journal of Artificial Intelligence Research. 16: doi: /jair.953. Cohen G, Hilario M, Sax H, Hogonnet S, Geissbuhler A Learning from imbalanced data in surveillance of nosocomial infection. Artificial Intelligence in Medicine. 37(1): doi: /j.artmed Keller JM, Gray MR, Givens JA A fuzzy k-nearest neigbor algorithm. IEEE Trans System Man Cybernet, 15(4): doi: /TSMC Larose DT Discovering Knowledge in Data: An introduction to Data Mining. Canada (US): John Wiley & Sons, Inc. Liao TW Classification of weld flaws with imbalanced class data. Expert System with Application. 35(3): doi: /j.eswa Maning CD, Raghavan P, Schütze H An Introduction to Information Retrieval. Cambridge (GB): Cambridge University Press. Mendosa D Revised International Table of Glycemic Index (GI) and Glycemic Load (GL) Values-2008 [internet]. [diunduh 2013 Mar 18]. Tersedia dari: Nurjayanti B Identifikasi shorea menggunakan k-nearest neighbour berdasarkan karakteristik morfologi daun [skripsi]. Bogor (ID): Insitut Pertanian Bogor.

28 18 Rimbawan, Siagian A Kontroversi konsep glycemic index pada penatalaksanaan diet penderita diabetes melitus. Media Gizi dan Keluarga. 29(1): Sun Y, Kamel MS, Wong AKC, Wang Y Cost-sensitive boosting for classification of imbalanced data. Pattern Recognition. 40: doi: /j.patcog Teknomo K Similarity Measurement [internet]. [diunduh 11 April 2013]. Tersedia dari Trout DL, Behall KM, Osilesi O Prediction of glycemic index for starchy foods. The American Journal of Clinical Nutrition. 58(6): [USDA] United Stated Department of Agriculture USDA National Nutrient Database for Standard Reference, Release 25 [internet]. [diunduh 2013 Apr 23]. Tersedia dari: [WHO] World Health Organization Diabetes Action Now Boolet [internet]. [diunduh 2013 Mar 12]. Tersedia dari: / X.pdf. Wild S, Roglic G, Green A, Sicree R, King H Global prevalence of diabetes: estimates for the year 2000 and projections for Diabetes Care. 27(5): Wolever TMS Relationship between dietary fiber content and composition in foods and the glycemic index. The American Journal of Clinical Nutrition. 51(1): 72-5.

29 Lampiran 1 Nilai rata-rata precision, recall, dan f-measure setiap kelas pada nilai k 1 sampai 5 19 Kelas GI rendah sedang tinggi Kriteria Evaluasi precision recall f-measure precision recall f-measure precision recall f-measure Set Data k Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data Data

30 20 Lampiran 2 Contoh data hasil tahap praproses data (data asli) Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

31 21 Lampiran 3 Data hasil proses random under-sampling Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

32 22 Lampiran 3 Lanjutan Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

33 23 Lampiran 3 Lanjutan Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

34 24 Lampiran 4 Data hasil proses k-means based under-sampling Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

35 25 Lampiran 4 Lanjutan Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

36 26 Lampiran 4 Lanjutan Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

37 27 Lampiran 5 Contoh data hasil proses random over-sampling Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

38 28 Lampiran 6 Contoh data hasil proses SMOTE Protein (gr) Lemak (gr) Serat (gr) Pemasakan Kelas GI

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori

Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan

Lebih terperinci

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI

KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI KLASIFIKASI NASABAH KARTU KREDIT MENGGUNAKAN ALGORITME FUZZY K-NEAREST NEIGHBOR PADA DATA TIDAK SEIMBANG RETNO WIJAYANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA

KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA KLASIFIKASI DEBITUR KARTU KREDIT MENGGUNAKAN ALGORITME K-NEAREST NEIGHBOR UNTUK KASUS IMBALANCED DATA FIQROTUL ULYA DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor

Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Klasifikasi Profil Siswa SMA/SMK yang Masuk PTN (Perguruan Tinggi Negeri) dengan k-nearest Neighbor Yuandri Trisaputra, Indriyani, Shellafuri Mardika Biru, Muhammad Ervan Departemen Ilmu Komputer, FMIPA,

Lebih terperinci

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU

KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU KLASIFIKASI NAIVE BAYES PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RESIKO KREDIT DEBITUR KARTU KREDIT DEWI SRI RAHAYU DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT

Lebih terperinci

HASIL DAN PEMBAHASAN. Data

HASIL DAN PEMBAHASAN. Data Transformasi data, mengubah data ke bentuk yang dapat di-mine sesuai dengan perangkat lunak yang digunakan pada penelitian. Penentuan Data Latih dan Data Uji Dalam penelitian ini data terdapat dua metode

Lebih terperinci

Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik Morfologi dan Tingkah Laku

Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik Morfologi dan Tingkah Laku Tersedia secara online di: http://journal.ipb.ac.id/index.php/jika Volume 4 Nomor 1 halaman 6-13 ISSN: 2089-6026 Sistem Pakar Identifikasi Varietas Ikan Mas (Cyprinus carpio) Berdasarkan Karakteristik

Lebih terperinci

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH

KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH KLASIFIKASI IMBALANCED DATA MENGGUNAKAN WEIGHTED K-NEAREST NEIGHBOR PADA DATA DEBITUR KARTU KREDIT BANK AISYAH SYAHIDAH DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Setiap siswa di dalam kelas memiliki karakteristik diri yang berbeda beda, seperti : jujur, empati, sopan, menghargai dan sebagainya. Karakteristik diri tersebut berperan

Lebih terperinci

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010

JURNAL TEKNOLOGI INFORMASI & PENDIDIKAN ISSN : VOL. 2 NO. 1 SEPTEMBER 2010 PERBANDINGAN METODE K-NEAREST NEIGHBOR (KNN) dan METODE NEAREST CLUSTER CLASSIFIER (NCC) DALAM PENGKLASIFIKASIAN KUALITAS BATIK TULIS Nesi Syafitri 1 ABSTRACT Various problem that are related to classification

Lebih terperinci

ANALISIS BIAYA KONSUMSI PANGAN, PENGETAHUAN GIZI, SERTA TINGKAT KECUKUPAN GIZI SISWI SMA DI PESANTREN LA TANSA, BANTEN SYIFA PUJIANTI

ANALISIS BIAYA KONSUMSI PANGAN, PENGETAHUAN GIZI, SERTA TINGKAT KECUKUPAN GIZI SISWI SMA DI PESANTREN LA TANSA, BANTEN SYIFA PUJIANTI ANALISIS BIAYA KONSUMSI PANGAN, PENGETAHUAN GIZI, SERTA TINGKAT KECUKUPAN GIZI SISWI SMA DI PESANTREN LA TANSA, BANTEN SYIFA PUJIANTI DEPARTEMEN GIZI MASYARAKAT FAKULTAS EKOLOGI MANUSIA INSTITUT PERTANIAN

Lebih terperinci

BAB I PENDAHULUAN. upaya-upaya untuk menanggulangi permasalahan gizi dan kesehatan.

BAB I PENDAHULUAN. upaya-upaya untuk menanggulangi permasalahan gizi dan kesehatan. BAB I PENDAHULUAN 1.1 Latar Belakang Peningkatan kemajuan dan kesejahteraan bangsa sangat tergantung pada kemampuan dan kualitas sumber daya manusianya. Menurut Kusharto dan Muljono (2010) dalam Maulana

Lebih terperinci

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G

PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G PREDIKSI STATUS KEAKTIFAN STUDI MAHASISWA DENGAN ALGORITMA C5.0 DAN K-NEAREST NEIGHBOR IIN ERNAWATI G651044054 SEKOLAH PASCA SARJANA INSTITUT PERTANIAN BOGOR BOGOR 2008 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel

Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel ISSN : 2355-9365 e-proceeding of Engineering : Vol.4, No.3 Desember 2017 Page 4725 Handling Imbalanced Data pada Prediksi Churn menggunakan metode SMOTE dan KNN Based on Kernel Handling Imbalanced Data

Lebih terperinci

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017

ISSN: Yogyakarta, 27 Juli 2017 CITEE 2017 Analisis Perbandingan Metode Over-Sampling Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADSYN-kNN) untuk Data dengan Fitur Nominal-Multi Categories Sri Rahayu 1, Teguh Bharata Adji

Lebih terperinci

BAB III METODOLOGI PENELITIAN. Dataset

BAB III METODOLOGI PENELITIAN. Dataset BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar

Lebih terperinci

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X

Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: X Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 1, Januari 2018, hlm. 184-189 http://j-ptiik.ub.ac.id Klasifikasi Standar Produk Baja PT. Krakatau Steel (Persero)

Lebih terperinci

PERBANDINGAN DECISION TREE

PERBANDINGAN DECISION TREE 84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)

Lebih terperinci

BAB I PENDAHULUAN. Latar Belakang

BAB I PENDAHULUAN. Latar Belakang BAB I PENDAHULUAN 1.1 Latar Belakang Menurut WHO, Diabetes Mellitus (DM) merupakan penyakit kronis yang disebabkan karena ketidakmampuan pankreas dalam menghasilkan hormon insulin yang cukup atau ketika

Lebih terperinci

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik

3.6 Data Mining Klasifikasi Algoritma k-nn (k-nearest Neighbor) Similaritas atribut numerik DAFTAR ISI PERNYATAAN... iii PRAKATA... vi DAFTAR ISI... viii DAFTAR GAMBAR... xi DAFTAR TABEL... xiv DAFTAR PERSAMAAN... xv DAFTAR ALGORITMA... xvi DAFTAR LAMPIRAN... xvii INTISARI... xviii ABSTRACT...

Lebih terperinci

K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI

K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA. Susanti, Shantika Martha, Evy Sulistianingsih INTISARI Buletin Ilmiah Math. Stat. dan Terapannya (Bimaster) Volume 07, No. 1 (2018), hal 9-14. K NEAREST NEIGHBOR DALAM IMPUTASI MISSING DATA Susanti, Shantika Martha, Evy Sulistianingsih INTISARI Missing data

Lebih terperinci

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN

METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Metode Klasifikasi Data Mining dan Teknik Sampling Smote... METODE KLASIFIKASI DATA MINING DAN TEKNIK SAMPLING SMOTE MENANGANI CLASS IMBALANCE UNTUK SEGMENTASI CUSTOMER PADA INDUSTRI PERBANKAN Hairani

Lebih terperinci

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED

PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED PERBANDINGAN TEKNIK SAMPLING DALAM RANDOM FOREST PADA KELAS IMBALANCED Studi Kasus Perilaku Seksual Remaja di Indonesia Hasil SDKI 2012 Yogo Aryo Jatmiko 1, Septiadi Padmadisastra 2, Anna Chadidjah 3 Prodi

Lebih terperinci

SKRIPSI. Disusun Oleh : DINI PUSPITA JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG

SKRIPSI. Disusun Oleh : DINI PUSPITA JURUSAN STATISTIKA FAKULTAS SAINS DAN MATEMATIKA UNIVERSITAS DIPONEGORO SEMARANG KLASIFIKASI TINGKAT KELUARGA SEJAHTERA DENGAN MENGGUNAKAN METODE REGRESI LOGISTIK ORDINAL DAN FUZZY K-NEAREST NEIGHBOR (STUDI KASUS KABUPATEN TEMANGGUNG TAHUN 2013) SKRIPSI Disusun Oleh : DINI PUSPITA

Lebih terperinci

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI

PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI PERBANDINGAN ALGORITME C4.5 DAN CART PADA DATA TIDAK SEIMBANG UNTUK KASUS PREDIKSI RISIKO KREDIT DEBITUR KARTU KREDIT DHIETA ANGGRAINI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

International Diabetes Federation (IDF) tahun 2005 menyatakan bahwa proporsi orang dengan diabetes diduga akan meningkat menjadi 333 juta (6,3%) pada

International Diabetes Federation (IDF) tahun 2005 menyatakan bahwa proporsi orang dengan diabetes diduga akan meningkat menjadi 333 juta (6,3%) pada BAB I PENDAHULUAN A. Latar Belakang Penyakit tidak menular (PTM) sudah menjadi masalah kesehatan masyarakat, baik secara lokal, regional, nasional, dan global. Hal ini dikarenakan penyakit tidak menular

Lebih terperinci

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO

SKRIPSI RONNY BENEDIKTUS SIRINGORINGO ANALISIS PERBANDINGAN PROSES CLUSTER MENGGUNAKAN K- MEANS CLUSTERING DAN K-NEAREST NEIGHBOR PADA PENYAKIT DIABETES MELLITUS SKRIPSI RONNY BENEDIKTUS SIRINGORINGO 131421021 PROGRAM STUDI S1 ILMU KOMPUTER

Lebih terperinci

BAB II LANDASAN TEORI

BAB II LANDASAN TEORI BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)

Lebih terperinci

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah gizi merupakan masalah global yang terjadi di sebagian besar belahan

BAB I PENDAHULUAN. 1.1 Latar Belakang. Masalah gizi merupakan masalah global yang terjadi di sebagian besar belahan BAB I PENDAHULUAN 1.1 Latar Belakang Masalah gizi merupakan masalah global yang terjadi di sebagian besar belahan dunia termasuk Indonesia. Indonesia masih dihadapkan pada masalah gizi ganda yaitu gizi

Lebih terperinci

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD

TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Jurnal Teknik Komputer Unikom Komputika Volume 3, No.2-2014 TEKNIK DATA MINING UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA K-NEAREST NEIGHBORHOOD Selvia Lorena Br Ginting 1), Wendi Zarman

Lebih terperinci

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA

Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Pemanfaatan Metode K-Means Clustering dalam Penentuan Penjurusan Siswa SMA Chandra Purnamaningsih Informatika, Fakultas MIPA, Universitas Sebelas Maret Surakarta Jl. Ir. Sutami No 36 A Surakarta cpurnamaningsih@gmail.com

Lebih terperinci

IPTEK-KOM, Vol. 19 No.12, Juni 2017: ISSN

IPTEK-KOM, Vol. 19 No.12, Juni 2017: ISSN Implementasi Teknik Sampling untuk Mengatasi Imbalanced Data pada Penentuan Status Gizi Balita dengan Menggunakan Learning Vector Quantization Implementation of Sampling Techniques for Solving Imbalanced

Lebih terperinci

Lingkungan Pengembangan HASIL DAN PEMBAHASAN

Lingkungan Pengembangan HASIL DAN PEMBAHASAN aturan 3--5 untuk menentukan interval akan dibagi menjadi berapa kelompok. Hasilnya akan menjadi hirarki paling atas. Kemudian nilai maksimum dan nilai minimum diperiksa apakah nilainya masuk ke dalam

Lebih terperinci

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.

ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine. ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi

Lebih terperinci

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2. 6 tahap ini, pola yang telah ditemukan dipresentasikan ke pengguna dengan teknik visualisasi agar pengguna dapat memahaminya. Deskripsi aturan klasifikasi akan dipresentasikan dalam bentuk aturan logika

Lebih terperinci

METODE PENELITIAN HASIL DAN PEMBAHASAN

METODE PENELITIAN HASIL DAN PEMBAHASAN 5. Oleh karena itu untuk meningkatkan akurasinya, proses learning harus dihentikan lebih awal atau melakukan pemotongan tree secara umum. Untuk itu diberikan 2 (dua) buah threshold yang harus dipenuhi

Lebih terperinci

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika

Lebih terperinci

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor

Dosen Program Studi Ilmu Komputer Universitas Pakuan Bogor PENGENALAN KADAR TOTAL PADAT TERLARUT PADA BUAH BELIMBING BERDASAR CITRA RED-GREEN-BLUE MENGGUNAKAN PRINCIPLE COMPONENT ANALYSIS (PCA) SEBAGAI EKSTRAKSI CIRI DAN KLASIFIKASI K-NEAREST NEIGHBORHOOD (KNN)

Lebih terperinci

PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA ABSTRACT

PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA ABSTRACT PENGEMBANGAN PERANGKAT LUNAK DIAGNOSA PENYAKIT DIABETES MELLITUS TIPE II BERBASIS TEKNIK KLASIFIKASI DATA Rodiyatul FS 1, Bayu Adhi Tama 2, Megah Mulya 3 1,2,3 Fakultas Ilmu Komputer, Universitas Sriwijaya

Lebih terperinci

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION

KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi betris.sin@gmail.com Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi

Lebih terperinci

BAB III METODELOGI PENELITIAN

BAB III METODELOGI PENELITIAN BAB III METODELOGI PENELITIAN 3.1 Metode Penelitian Metode penelitian yang digunakan yaitu metode eksperimental dimana metode ini bekerja dengan memanipulasi dan melakukan kontrol pada objek penelitian

Lebih terperinci

Pengaruh Formula dengan Penambahan Bumbu untuk Makanan Rumah Sakit pada Status Gizi dan Kesehatan Pasien LIBER

Pengaruh Formula dengan Penambahan Bumbu untuk Makanan Rumah Sakit pada Status Gizi dan Kesehatan Pasien LIBER Pengaruh Formula dengan Penambahan Bumbu untuk Makanan Rumah Sakit pada Status Gizi dan Kesehatan Pasien LIBER SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI TESIS DAN SUMBER

Lebih terperinci

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm

Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Universitas Sebelas Maret Bidikmisi Applicant s Classification using C4.5 Algorithm Muh. Safri Juliardi Program Studi Informatika Universitas Sebelas Maret Jl. Ir. Sutami No. 36 A Surakarta juliardi@student.uns.ac.id

Lebih terperinci

BAB I PENDAHULUAN. kenaikan kadar glukosa dalam darah atau hiperglikemia, yang menimbulkan

BAB I PENDAHULUAN. kenaikan kadar glukosa dalam darah atau hiperglikemia, yang menimbulkan BAB I PENDAHULUAN A. Latar Belakang Diabetes mellitus (DM) adalah gangguan metabolisme yang ditandai dengan kenaikan kadar glukosa dalam darah atau hiperglikemia, yang menimbulkan berbagai komplikasi kronik

Lebih terperinci

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA

IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA IMPLEMENTASI ALGORITMA K-NEAREST NEIGHBOUR UNTUK PREDIKSI WAKTU KELULUSAN MAHASISWA Irwan Budiman 1, Dodon Turianto Nugrahadi 2, Radityo Adi Nugroho 3 Universitas Lambung Mangkurat 1,2,3 irwan.budiman@unlam.ac.id

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1 Dasar Penelitian Penelitian ini dilakukan berdasarkan rumusan masalah yang telah dijabarkan pada bab sebelumnya yaitu untuk mengklasifikasikan kelayakan kredit calon debitur

Lebih terperinci

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia

Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Penerapan Algoritma Genetika pada Peringkasan Teks Dokumen Bahasa Indonesia Aristoteles Jurusan Ilmu Komputer FMIPA Universitas Lampung aristoteles@unila.ac.id Abstrak.Tujuan penelitian ini adalah meringkas

Lebih terperinci

Berikut adalah beberapa istilah dan definisi yang digunakan dalam Pedoman ini.

Berikut adalah beberapa istilah dan definisi yang digunakan dalam Pedoman ini. Berikut adalah beberapa istilah dan definisi yang digunakan dalam Pedoman ini. 2.1 Label pangan adalah setiap keterangan mengenai pangan yang berbentuk gambar, tulisan, kombinasi keduanya atau bentuk lain

Lebih terperinci

ii

ii KLASIFIKASI PENDAFTAR BEASISWA BIDIKMISI UNIVERSITAS SEBELAS MARET MENGGUNAKAN ALGORITMA C4.5 SKRIPSI Diajukan untuk Memenuhi Salah Satu Syarat Mencapai Gelar Strata Satu Program Studi Informatika Disusun

Lebih terperinci

BAB I PENDAHULUAN. Menurut WHO Tahun 2013, diperkirakan 347 juta orang di dunia menderita

BAB I PENDAHULUAN. Menurut WHO Tahun 2013, diperkirakan 347 juta orang di dunia menderita BAB I PENDAHULUAN A. Latar Belakang Diabetes Melitus (DM) merupakan masalah kesehatan yang besar. Menurut WHO Tahun 2013, diperkirakan 347 juta orang di dunia menderita Diabetes Melitus jika ini dibiarkan

Lebih terperinci

BAB I PENDAHULUAN. terdapat pada waluh. Secara umum waluh kaya akan kandungan serat, vitamin, dan mineral yang bermanfaat bagi kesehatan.

BAB I PENDAHULUAN. terdapat pada waluh. Secara umum waluh kaya akan kandungan serat, vitamin, dan mineral yang bermanfaat bagi kesehatan. BAB I PENDAHULUAN A. Latar Belakang Indonesia kaya akan sumber daya alam hayati yang belum dimanfaatkan secara optimal, salah satunya adalah tanaman waluh. Pemanfaatan tanaman waluh dimasyarakat belum

Lebih terperinci

I. PENDAHULUAN. Saat ini masyarakat mengkonsumsi mie sebagai bahan pangan pokok

I. PENDAHULUAN. Saat ini masyarakat mengkonsumsi mie sebagai bahan pangan pokok I. PENDAHULUAN A. Latar Belakang dan Masalah Saat ini masyarakat mengkonsumsi mie sebagai bahan pangan pokok alternatif selain beras. Mie merupakan produk pangan yang telah menjadi kebiasaan konsumsi masyarakat

Lebih terperinci

PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB)

PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB) JIMT Vol. 12 No. 2 Desember 2016 (Hal 115-124) ISSN : 2450 766X PERBANDINGAN ANALISIS DISKRIMINAN DAN K-NEAREST NEIGHBOR (KNN) UNTUK MENGKLASIFIKASIKAN PENDERITA PENYAKIT TUBERKULOSIS (TB) Nurfajri 1,

Lebih terperinci

Versi Online tersedia di : JURNAL TECH-E (Online)

Versi Online tersedia di :  JURNAL TECH-E (Online) JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada

Lebih terperinci

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI

IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI IDENTIFIKASI JENIS SHOREA (MERANTI) MENGGUNAKAN ALGORITME VOTING FEATURE INTERVALS 5 BERDASARKAN KARAKTERISTIK MORFOLOGI DAUN EVI SUSANTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN

Lebih terperinci

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors

Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Konferensi Nasional Sistem & Informatika 2017 STMIK STIKOM Bali, 10 Agustus 2017 Perancangan Sistem Pembagian Kelas Kuliah Mahasiswa dengan Kombinasi Metode K-Means dan K-Nearest Neighbors Gede Aditra

Lebih terperinci

Apa itu is K-Nearest Neighbor (KNN) Algorithm?

Apa itu is K-Nearest Neighbor (KNN) Algorithm? K-Nearest Neighbor Pendahuluan K-Nearest Neighbour atau KNN adalah salah dari algoritma instance based learning atau case-based reasoning. Definisi case based reasoning: KNN digunakan dalam banyak aplikasi

Lebih terperinci

Abidah Elcholiqi, Beta Noranita, Indra Waspada

Abidah Elcholiqi, Beta Noranita, Indra Waspada Abidah Elcholiqi, Beta Noranita, Indra Waspada PENENTUAN BESAR PINJAMAN DI KOPERASI SIMPAN PINJAM DENGAN ALGORITMA K-NEAREST NEIGHBOR (Studi Kasus di Koperasi Simpan Pinjam BMT Bina Insani Pringapus) Abidah

Lebih terperinci

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN BAB III METODOLOGI PENELITIAN Metodologi penelitian merupakan sistematika tahapan yang dilaksanakan selama pembuatan penelitian tugas akhir. Secara garis besar metodologi penelitian tugas akhir ini dapat

Lebih terperinci

PENGARUH LAMA PENGERINGAN KENTANG DAN PERBANDINGAN TEPUNG TERIGU DAN TEPUNG KENTANG TERHADAP MUTU COOKIES KENTANG

PENGARUH LAMA PENGERINGAN KENTANG DAN PERBANDINGAN TEPUNG TERIGU DAN TEPUNG KENTANG TERHADAP MUTU COOKIES KENTANG PENGARUH LAMA PENGERINGAN KENTANG DAN PERBANDINGAN TEPUNG TERIGU DAN TEPUNG KENTANG TERHADAP MUTU COOKIES KENTANG APRILIA S.K.Y. SIMAMORA 080305018 PROGRAM STUDI ILMU DAN TEKNOLOGI PANGAN FAKULTAS PERTANIAN

Lebih terperinci

BAB I PENDAHULUAN. Sindroma metabolik merupakan kumpulan kelainan metabolik komplek

BAB I PENDAHULUAN. Sindroma metabolik merupakan kumpulan kelainan metabolik komplek BAB I PENDAHULUAN 1.1 Latar belakang Sindroma metabolik merupakan kumpulan kelainan metabolik komplek yang muncul sebagai faktor risiko penyakit kardiovaskular serta diabetes mellitus tipe 2. Komponen

Lebih terperinci

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah BAB II TINJAUAN PUSTAKA 2.1 Landasan Teori 2.1.1 Indeks Prestasi Kumulatif dan Lama Studi Mahasiswa yang telah menyelesaikan keseluruhan beban program studi yang telah ditetapkan dapat dipertimbangkan

Lebih terperinci

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK

PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK PENERAPAN METODE NAÏVE BAYES CLASSIFIER DAN ALGORITMA ADABOOST UNTUK PREDIKSI PENYAKIT GINJAL KRONIK SKRIPSI Diajukan untuk memenuhi sebagian persyaratan mendapatkan gelar Strata Satu Program Studi Informatika

Lebih terperinci

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi

HASIL DAN PEMBAHASAN. Gambar 3 Ilustrasi pencarian titik pusat dan jari-jari pupil. Segmentasi 4 Perangkat keras berupa Notebook: Processor intel Core i3 2.2 GHz. RAM kapasitas 2. GB. Harddisk Kapasitas 5 GB. Monitor pada resolusi 1366 x 768 piksel. Merek Acer Aspire 475. Perangkat lunak berupa:

Lebih terperinci

BAB I PENDAHULUAN. bersifat praktis. Salah satu contohnya dalam memenuhi kebutuhan nutrisi

BAB I PENDAHULUAN. bersifat praktis. Salah satu contohnya dalam memenuhi kebutuhan nutrisi BAB I PENDAHULUAN A. Latar Belakang Pola hidup masyarakat modern cenderung memilih sesuatu yang bersifat praktis. Salah satu contohnya dalam memenuhi kebutuhan nutrisi yang lebih suka mengkonsumsi makanan

Lebih terperinci

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract

Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1  Abstract Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan

Lebih terperinci

METODE PENELITIAN. n = N 1+ N (d 2 ) keterangan : N = besar populasi n = besar sampel d = tingkat kepercayaan/ketepatan yang diinginkan

METODE PENELITIAN. n = N 1+ N (d 2 ) keterangan : N = besar populasi n = besar sampel d = tingkat kepercayaan/ketepatan yang diinginkan METODE PENELITIAN Desain, Tempat dan Waktu Penelitian Penelitian ini menggunakan desain cross sectional study karena pengambilan data dilakukan pada suatu waktu. Penelitian dilaksanakan di Pesantren di

Lebih terperinci

STUDI PENGARUH TEPUNG KOMPOSIT BIJI-BIJIAN DAN KONSENTRASI PENSTABIL TERHADAP MUTU MAKANAN PENDAMPING ASI-BISKUIT SKRIPSI. Oleh :

STUDI PENGARUH TEPUNG KOMPOSIT BIJI-BIJIAN DAN KONSENTRASI PENSTABIL TERHADAP MUTU MAKANAN PENDAMPING ASI-BISKUIT SKRIPSI. Oleh : STUDI PENGARUH TEPUNG KOMPOSIT BIJI-BIJIAN DAN KONSENTRASI PENSTABIL TERHADAP MUTU MAKANAN PENDAMPING ASI-BISKUIT SKRIPSI Oleh : DIAN YODANA SITUNGKIR 060305005 PROGRAM STUDI TEKNOLOGI HASIL PERTANIAN

Lebih terperinci

BERITA NEGARA REPUBLIK INDONESIA

BERITA NEGARA REPUBLIK INDONESIA No.18,2012 BERITA NEGARA REPUBLIK INDONESIA BADAN PENGAWAS OBAT DAN MAKANAN. Label dan Iklan. Pangan Olahan. Pengawasan Klaim. PERATURAN KEPALA BADAN PENGAWAS OBAT DAN MAKANAN REPUBLIK INDONESIA NOMOR

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review

Lebih terperinci

PERENCANAAN DIET DIABETES NEFROPATI DENGAN PROGRAM GOL ABSTRACT

PERENCANAAN DIET DIABETES NEFROPATI DENGAN PROGRAM GOL ABSTRACT PERENCANAAN DIET DIABETES NEFROPATI DENGAN PROGRAM GOL Nurul Muyasiroh 1, Endang Lily 2, M. D. H. Gamal 2 1 Mahasiswa Program Studi S1 Matematika 2 Dosen Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas

Lebih terperinci

BAB I PENDAHULUAN. mellitus tingkat kejadiannya terus meningkat di banyak negara di dunia (Lopez et

BAB I PENDAHULUAN. mellitus tingkat kejadiannya terus meningkat di banyak negara di dunia (Lopez et BAB I PENDAHULUAN A. Latar Belakang Penyakit tidak menular yang berkaitan dengan gizi seperti diabetes mellitus tingkat kejadiannya terus meningkat di banyak negara di dunia (Lopez et al., 2006 dalam Sacks,

Lebih terperinci

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK

KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK KLASIFIKASI PELANGGAN DENGAN ALGORITME POHON KEPUTUSAN DAN PELUANG PELANGGAN YANG MERESPONS PENAWARAN DENGAN REGRESI LOGISTIK YUANDRI TRISAPUTRA & OKTARINA SAFAR NIDA (SIAP 16) Pendahuluan Latar Belakang

Lebih terperinci

BAB I PENDAHULUAN. adanya kenaikan gula darah (hiperglikemia) kronik. Masalah DM, baik aspek

BAB I PENDAHULUAN. adanya kenaikan gula darah (hiperglikemia) kronik. Masalah DM, baik aspek BAB I PENDAHULUAN A. Latar Belakang Diabetes Melitus (DM) merupakan suatu penyakit yang ditandai oleh adanya kenaikan gula darah (hiperglikemia) kronik. Masalah DM, baik aspek terus berkembang meskipun

Lebih terperinci

KLASIFIKASI STATUS GIZI MENGGUNAKAN K-NEAREST NEIGHBOR INTISARI

KLASIFIKASI STATUS GIZI MENGGUNAKAN K-NEAREST NEIGHBOR INTISARI KLASIFIKASI STATUS GIZI MENGGUNAKAN K-NEAREST NEIGHBOR Sumarni Arifin Hasani¹, Sitti Suhada², Lillyan Hadjaratie³ ¹Program Studi Sistem Informasi, Fakultas Teknik, Universitas Negeri Gorontalo Email: sumarni.hasani@gmail.com

Lebih terperinci

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 syam@stmik-indonesia.ac.id,

Lebih terperinci

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX

INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX INDEXING AND RETRIEVAL ENGINE UNTUK DOKUMEN BERBAHASA INDONESIA DENGAN MENGGUNAKAN INVERTED INDEX Wahyu Hidayat 1 1 Departemen Teknologi Informasi, Fakultas Ilmu Terapan, Telkom University 1 wahyuhidayat@telkomuniversity.ac.id

Lebih terperinci

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa Seno Setiyawan 1, Yuliana Susanti 2,Tri Atmojo Kusmayadi 3 1,3 Program Studi Matematika FMIPA, Universitas Sebelas Maret 2 Program

Lebih terperinci

ANALISIS DETERMINAN KERAGAMAN KONSUMSI PANGAN PADA KELUARGA NELAYAN DEWI MEITASARI A

ANALISIS DETERMINAN KERAGAMAN KONSUMSI PANGAN PADA KELUARGA NELAYAN DEWI MEITASARI A ANALISIS DETERMINAN KERAGAMAN KONSUMSI PANGAN PADA KELUARGA NELAYAN DEWI MEITASARI A54104035 PROGAM STUDI GIZI MASYARAKAT DAN SUMBERDAYA KELUARGA FAKULTAS PERTANIAN INSTITUT PERTANIAN BOGOR BOGOR 2008

Lebih terperinci

SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI

SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI SISTEM PAKAR IDENTIFIKASI VARIETAS IKAN MAS (Cyprinus carpio) BERDASARKAN KARAKTERISTIK MORFOLOGI DAN TINGKAH LAKU ASTERIKA PRAWESTI DEPARTEMEN ILMU KOMPUTER FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM

Lebih terperinci

Penerapan Fuzzy K-Nearest Neighbor (FK-NN) Dalam Menentukan Status Gizi Balita

Penerapan Fuzzy K-Nearest Neighbor (FK-NN) Dalam Menentukan Status Gizi Balita Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 1, No. 9, Juni 2017, hlm. 925-932 http://j-ptiik.ub.ac.id Penerapan Fuzzy K-Nearest Neighbor (FK-NN) Dalam Menentukan Status

Lebih terperinci

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER I. PENDAHULUAN Mahasiswa merupakan salah satu aspek penting dalam evaluasi keberhasilan penyelenggaraan

Lebih terperinci

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN BAB III METODE PENELITIAN Penelitian ini adalah penelitian eksperimen dengan langkah-langkah atau metode penelitian sebagai berikut: 1. Penentuan Masalah Penentuan masalah ini diperoleh dari studi literature

Lebih terperinci

PENGARUH PEMBERIAN DIIT DM TINGGI SERAT TERHADAP PENURUNAN KADAR GULA DARAH PASIEN DM TIPE-2 DI RSUD SALEWANGANG KAB. MAROS

PENGARUH PEMBERIAN DIIT DM TINGGI SERAT TERHADAP PENURUNAN KADAR GULA DARAH PASIEN DM TIPE-2 DI RSUD SALEWANGANG KAB. MAROS PENGARUH PEMBERIAN DIIT DM TINGGI SERAT TERHADAP PENURUNAN KADAR GULA DARAH PASIEN DM TIPE-2 DI RSUD SALEWANGANG KAB. MAROS Nadimin 1, Sri Dara Ayu 1, Sadariah 2 1 Jurusan Gizi, Politeknik Kesehatan, Makassar

Lebih terperinci

BAB I PENDAHULUAN. Berbagai wilayah di Indonesia memiliki lahan pertanian yang dapat ditanami

BAB I PENDAHULUAN. Berbagai wilayah di Indonesia memiliki lahan pertanian yang dapat ditanami BAB I PENDAHULUAN A. Latar Belakang Berbagai wilayah di Indonesia memiliki lahan pertanian yang dapat ditanami berbagai tanaman komoditas pangan sehingga dapat menghasilkan bermacammacam produk pangan.

Lebih terperinci

BAB 4 IMPLEMENTASI DAN PENGUJIAN

BAB 4 IMPLEMENTASI DAN PENGUJIAN BAB 4 IMPLEMENTASI DAN PENGUJIAN 4.1 Implementasi Tahap implementasi merupakan tahap pengimplementasian metode kedalam perangkat lunak simulasi, tahap lanjut dari tahap perancangan simulasi di bab sebelumnya.

Lebih terperinci

IDENTIFIKASI JAMUR MENGGUNAKAN METODE K-NEAREST NEIGHBOR DENGAN EKSTRAKSI CIRI MORFOLOGI

IDENTIFIKASI JAMUR MENGGUNAKAN METODE K-NEAREST NEIGHBOR DENGAN EKSTRAKSI CIRI MORFOLOGI IDENTIFIKASI JAMUR MENGGUNAKAN METODE K-NEAREST NEIGHBOR DENGAN EKSTRAKSI CIRI MORFOLOGI Anis Zubair 1), Ahmad Rofiqul Muslikh 2) 1,2) Fakultas Teknologi Informasi, Universitas Merdeka Malang Email: anis.zubair@unmer.ac.id

Lebih terperinci

Oleh : Rahanimi Pembimbing : Dr. M Isa Irawan, M.T

Oleh : Rahanimi Pembimbing : Dr. M Isa Irawan, M.T PERAMALAN JUMLAH MAHASISWA PENDAFTAR PMDK JURUSAN MATEMATIKA MENGGUNAKAN METODE AUTOMATIC CLUSTERING DAN RELASI LOGIKA FUZZY (STUDI KASUS di INSTITUT TEKNOLOGI SEPULUH NOPEMBER SURABAYA) Oleh : Rahanimi

Lebih terperinci

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti:

HASIL DAN PEMBAHASAN. 4. Menghitung fungsi objektif pada iterasi ke-t, 5. Meng-update derajat keanggotaan. 6. Mengecek kondisi berhenti: 2. v kj merupakan centroid term ke-j terhadap cluster ke-k 3. μ ik merupakan derajat keanggotaan dokumen ke-i terhadap cluster ke-k 4. i adalah indeks dokumen 5. j adalah indeks term 6. k adalah indeks

Lebih terperinci

MENGIDENTIFIKASI DATA REKAM MEDIS. (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian. Perindustrian, Jakarta) SKRIPSI

MENGIDENTIFIKASI DATA REKAM MEDIS. (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian. Perindustrian, Jakarta) SKRIPSI ALGORITMA ITERATIVE DICHOTOMISER 3 (ID3) UNTUK MENGIDENTIFIKASI DATA REKAM MEDIS (Studi Kasus Penyakit Diabetes Mellitus di Balai Kesehatan Kementerian Perindustrian, Jakarta) SKRIPSI Oleh: AVIA ENGGARTYASTI

Lebih terperinci

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI

ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ANALISIS PENGARUH METODE OVER SAMPLING DALAM CHURN PREDICTION UNTUK PERUSAHAAN TELEKOMUNIKASI ZK. Abdurahman Baizal 1, Moch. Arif Bijaksana 2, Angelina Sagita Sastrawan 3 Telp (022)7564108 ext 2298 Fax

Lebih terperinci

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM

PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM PREDIKSI KELULUSAN MAHASISWA PADA PERGURUAN TINGGI KABUPATEN MAJALENGKA BERBASIS KNOWLEDGE BASED SYSTEM Teknik Informatika, Teknik Industri, Teknik Informatika Fakultas Teknik - Universitas Majalengka

Lebih terperinci

Pola Konsumsi Pangan Penyandang Disabilitas di Kota Malang

Pola Konsumsi Pangan Penyandang Disabilitas di Kota Malang Indonesian Journal of Disability Studies ISSN : - Pola Konsumsi Pangan Penyandang Disabilitas di Kota Malang * Agustina Shinta Pusat Studi dan Layanan Disabilitas (PSLD), Universitas Brawijaya, Malang,

Lebih terperinci

I. PENDAHULUAN. disebabkan oleh berbagai macam masalah. Menurut McCarl et al., (2001),

I. PENDAHULUAN. disebabkan oleh berbagai macam masalah. Menurut McCarl et al., (2001), I. PENDAHULUAN A. Latar Belakang Bidang pangan telah menjadi aspek yang penting karena berkaitan erat dengan kebutuhan pokok masyarakat. Pada umumnya, masalah yang berkaitan dengan pangan dapat menjadi

Lebih terperinci

BAB I PENDAHULUAN A. Latar Belakang

BAB I PENDAHULUAN A. Latar Belakang BAB I PENDAHULUAN A. Latar Belakang Diabetes Melitus (DM) merupakan kelompok penyakit metabolik dengan karakteristik adanya peningkatan kadar glukosa darah (hiperglikemia) yang terjadi karena kelainan

Lebih terperinci

I. PENDAHULUAN. dan skeletal, akibat penimbunan lemak tubuh yang berlebihan (Dorlan, 2012). disebabkan karena kurangnya aktivitas fisik dan

I. PENDAHULUAN. dan skeletal, akibat penimbunan lemak tubuh yang berlebihan (Dorlan, 2012). disebabkan karena kurangnya aktivitas fisik dan 1 I. PENDAHULUAN 1.1. Latar Belakang Obesitas adalah peningkatan berat badan melampaui batas kebutuhan fisik dan skeletal, akibat penimbunan lemak tubuh yang berlebihan (Dorlan, 2012). Obesitas terjadi

Lebih terperinci

TINJAUAN PUSTAKA. Definisi Data Mining

TINJAUAN PUSTAKA. Definisi Data Mining TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data

Lebih terperinci

BAB I PENDAHULUAN. dapat mengkonsumsi berbagai jenis pangan sehingga keanekaragaman pola

BAB I PENDAHULUAN. dapat mengkonsumsi berbagai jenis pangan sehingga keanekaragaman pola BAB I PENDAHULUAN A. Latar Belakang Salah satu masalah yang dihadapi oleh negara berkembang termasuk Indonesia adalah peningkatan jumlah penduduk yang pesat dan tidak seimbang dengan penyediaan pangan

Lebih terperinci

MODEL PENDUGA VOLUME POHON MAHONI DAUN BESAR (Swietenia macrophylla, King) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, JAWA BARAT WAHYU NAZRI YANDI

MODEL PENDUGA VOLUME POHON MAHONI DAUN BESAR (Swietenia macrophylla, King) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, JAWA BARAT WAHYU NAZRI YANDI MODEL PENDUGA VOLUME POHON MAHONI DAUN BESAR (Swietenia macrophylla, King) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, JAWA BARAT WAHYU NAZRI YANDI DEPARTEMEN MANAJEMEN HUTAN FAKULTAS KEHUTANAN INSTITUT

Lebih terperinci

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN Latar Belakang BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet

Lebih terperinci