Perbandingan Metode-Metode Klasifikasi Untuk Indoor Positioning System
|
|
|
- Yuliani Hadiman
- 9 tahun lalu
- Tontonan:
Transkripsi
1 Perbandingan Metode-Metode Klasifikasi Untuk Indoor Positioning System Yuan Lukito #1, Antonius R. Chrismanto #2 Program Studi Teknik Informatika, Universitas Kristen Duta Wacana Jl. Dr. Wahidin Sudiro Husodo 5-25 Yogyakarta #1 #2 Abstract Indoor Positioning System can provide position and navigation guidance inside a building. This paper discusses about systematic comparisons of classifiers over Wi-Fi-based Indoor Positioning System dataset. The dataset is collected using a custom Android application, which able to receive, measure, and record Wi-Fi signal strengths from the surrounding Wi-Fi access points in UKDW campus. The dataset consists of Received Signal Strength (RSS) data from 41 public locations, spread across 11 buildings in UKDW campus. We use 10-folds cross validation and T-Test with 0.05 significance level to compare K-Nearest Neighbors (KNN), Naïve Bayes, J48, and Support Vector Machine (SVM) classifiers. Based on the experiment results, we can conclude that KNN classifier produces highest accuracy rate, 83.58%, while the lowest accuracy rate, 24.89%, produced by SVM. All classifiers implemented with little or no tuning, so it can be treated as a baseline for other experiments. Keywords Classification, Indoor Positioning System, K-NN, Naïve Bayes, J48, SVM. I. PENDAHULUAN Global Positioning System (GPS) dapat digunakan untuk menentukan posisi seseorang di Bumi, khususnya di ruangan terbuka (outdoor). GPS memiliki beberapa kelemahan, terutama pada penggunaan di dalam ruangan/gedung (indoor). Sinyal GPS umumnya sulit diterima jika posisi perangkat penerima berada di dalam gedung bertingkat. Untuk menentukan posisi seseorang di dalam gedung dapat menggunakan beberapa pendekatan yang bermacam-macam, umumnya memanfaatkan berbagai peralatan tambahan seperti sensor ultrasonic, sensor infrared, sensor LED, sensor RFID maupun menggunakan sinyal Wi-Fi. Saat ini banyak institusi menyediakan akses Internet berbasis Wi-Fi. Beberapa access points ditempatkan sedemikian rupa sehingga sinyal Wi-Fi dapat menjangkau ke sebagian besar area di dalam gedung. Kondisi tersebut dapat dimanfaatkan untuk keperluan penentuan posisi seseorang di dalam gedung (Indoor Positioning System). Kuat atau lemahnya sinyal Wi-Fi yang diterima pada umumnya berbanding lurus dengan jarak perangkat penerima dengan access point. Dengan mengumpulkan kekuatan sinyal (Received Signal Strength) yang diterima dari beberapa access points yang berbeda, posisi seseorang di dalam gedung dapat dihitung dan ditentukan. Kumpulan data mengenai kekuatan sinyal tersebut dapat digunakan untuk proses pembelajaran terbimbing (supervised learning) untuk kemudian diimplementasikan sebuah model yang dapat mempelajari pola-pola tersebut dan dapat menentukan kemiripan atau kedekatan dengan pola-pola berikutnya. Beberapa penelitian terkait Indoor Positioning System (IPS) telah banyak dilakukan, dengan berbagai metode yang berbeda-beda, namun tidak pernah dibandingkan secara langsung hasilnya. Penelitian ini berupa percobaan membandingkan beberapa metode klasifikasi dengan pembelajaran terbimbing, yaitu K-Nearest Neighbors, Naïve Bayes, J48, dan Support Vector Machine. Data yang digunakan dalam percobaan dikumpulkan dari beberapa ruang publik yang ada di kampus UKDW Yogyakarta, menggunakan aplikasi Android yang dikembangkan sendiri. Melalui penelitian ini diharapkan dapat memberikan kontribusi mengenai informasi dan hasil analisis perbandingan tingkat akurasi metode-metode klasifikasi dalam masalah Indoor Positioning System. A. Permasalahan Penelitian ini difokuskan pada permasalahan utama bagaimana hasil perbandingan dan analisis tingkat akurasi metode klasifikasi K-Nearest Neighbors, Naïve Bayes, J48 dan Support Vector Machine untuk penentuan posisi di dalam gedung. B. Tinjauan Pustaka 1) Indoor Positioning System (IPS): Global Positioning System (GPS) merupakan sebuah sistem yang dapat menghitung dan menentukan posisi seseorang di Bumi secara akurat, umumnya direpresentasikan dalam bentuk latitude dan longitude. Walaupun demikian, sinyal GPS sulit diterima jika posisi perangkat penerimanya berada di dalam gedung, terutama gedung bertingkat. IPS adalah suatu sistem yang dapat menentukan posisi seseorang di dalam suatu ruangan tertutup/ gedung. Sistem ini selain dapat menentukan posisi, juga dapat menentukan orientasi dan 123
2 arah pergerakan seseorang [1]. Implementasi IPS dapat dilakukan menggunakan beberapa pendekatan yang bermacam-macam, umumnya menggunakan peralatan tambahan seperti sensor ultrasonic, sensor infrared, RFID dan beberapa peralatan lainnya. Kombinasi sensor infrared dan ultrasonic [2] memberikan akurasi penentuan posisi yang cukup akurat dengan tingkat kesalahan ± 2 cm, untuk ruangan dengan luas 4 m 2. Selain itu juga dapat dilakukan pendekatan optis menggunakan LED [3] maupun pemanfaatan sinyal Wi-Fi [4], [5] dan [6]. 2) Wi-Fi fingerprint: Kumpulan kekuatan sinyal Wi- Fi pada suatu lokasi memiliki pola tertentu, berbeda dengan lokasi-lokasi lainnya. Pola kekuatan sinyal tersebut tersebut sering disebut sebagai Wi-Fi fingerprint. Beberapa metode yang dapat digunakan untuk menentukan tingkat kemiripan Wi-Fi fingerprint adalah Euclidean distance [5], pendekatan probabilitas [4] dan pendekatan metode clustering [6]. 3) Weka: Merupakan paket perangkat lunak terbuka (open source) berisi implementasi algoritma-algoritma machine learning yang dapat digunakan untuk pemrosesan awal data, pembangunan model machine learning dan pengujian model [7]. Metode-metode yang dibandingkan pada penelitian ini sudah tersedia dalam library Weka. Untuk klasifikasi, Weka membagi metode-metode klasifikasi menjadi beberapa kategori, seperti terlihat pada Gambar 1. Gambar 1. Kelompok-kelompok metode klasifikasi yang disediakan oleh Weka. Penelitian ini membandingkan metode Naïve Bayes (kategori bayes), KNN (lazy), J48 (trees) dan SVM (functions). 4) K-Nearest Neighbors (KNN): Merupakan salah satu metode klasifikasi instance-based learning, menggunakan pendekatan supervised learning sehingga membutuhkan data pelatihan yang sudah dilabeli. Menurut Han [8], KNN membandingkan data pelatihan dan data pengujian, dimana data pelatihan dideskripsikan dalam sejumlah atribut berjumlah n. Setiap data pelatihan merepresentasikan sebuah titik dalam ruang berdimensi n e-issn: (atau vektor berukuran n). Klasifikasi data baru dilakukan dengan cara menghitung tingkat kemiripan atau kedekatan dari data baru tersebut terhadap seluruh data pelatihan yang ada. Tingkat kemiripan dapat dihitung menggunakan beberapa metode, salah satunya adalah Euclidean distance. Jarak dua vektor berukuran n, misalnya X = (X 1, X 2,, X n ) dan Y = (Y 1, Y 2,, Y n ) dapat dihitung dengan persamaan 1: (1) Metode ini membutuhkan parameter nilai k, yaitu jumlah data pelatihan yang memiliki jarak terdekat dengan data baru, untuk menentukan hasil klasifikasi dari data baru tersebut. Nilai k dapat bervariasi, namun pada umumnya digunakan nilai ganjil sehingga tidak ada tetangga terdekat (nearest neighbors) berjumlah sama dalam kelas yang sama saat menentukan hasil akhir klasifikasi [9]. Hasil klasifikasi selain ditentukan oleh sejumlah (k) tetangga terdekat, juga dapat diimplementasikan distance weighted [10], dengan menghitung jarak sebagai fungsi pembobotan. Kelas hasil klasifikasi merupakan kelas yang memiliki bobot terbesar (jarak terkecil), yang umumnya dihitung dengan persamaan 2 berikut ini: (2) dengan W i adalah bobot jarak data ke-i, yang didapatkan dari 1 dibagi dengan jarak data ke-i dengan data baru yang akan diklasifikasikan. Hasil klasifikasi ditentukan berdasarkan kelas tetangga-tetangga terdekat yang memiliki jumlah bobot paling besar. 5) Naïve Bayes: Metode ini menggunakan pendekatan teorema Bayes, dengan asumsi setiap atribut bersifat saling bebas, tidak memiliki hubungan atau ketergantungan satu sama lain. Metode Naïve Bayes menggunakan prinsip teorema Bayes, yaitu menghitung probabilitas suatu kejadian berdasarkan suatu kondisi tertentu, dengan menggunakan persamaan 3. (3) dengan P(A B) adalah peluang terjadinya A jika diketahui B, P(A) adalah peluang terjadinya A, P(B) adalah peluang terjadinya B dan P(B A) adalah peluang terjadinya B jika diketahui A. Menurut Han [8], berikut ini adalah langkah-langkah metode Naïve Bayes: a. Ditentukan D adalah data pelatihan yang sudah dilabeli sesuai dengan kelas atau kategorinya masingmasing. Setiap data pelatihan direpresentasikan dalam 124
3 vektor berdimensi n yang berisi seluruh atribut-atribut dari data tersebut, misalnya vektor X = (X 1, X 2,, X n ). b. Jumlah kelas sudah ditentukan dari awal, misalnya sejumlah m, dinyatakan dalam bentuk vektor C = (C 1, C 2,, C m ). c. Hasil klasifikasi data baru (C d ) dihitung berdasarkan persamaan 4: (4) 6) J48: merupakan implementasi algoritma C4.5 dalam bahasa pemrograman Java yang termasuk di dalam library Weka. Metode C4.5 dapat digunakan untuk klasifikasi dengan cara membentuk pohon keputusan (decision tree) dari data pelatihan yang diberikan [11]. Contoh sebuah decision tree dapat dilihat pada Gambar 2 [8]. dengan Info(D) adalah jumlah informasi yang diperlukan untuk dapat menentukan kelas dari suatu data pelatihan yang diberikan. Nilai Info(D) dihitung menggunakan persamaan 6. (6) dengan m adalah jumlah data pelatihan, p i adalah probabilitas data pelatihan ke-i masuk dalam kelas C. Nilai Info(D) ini juga dikenal dengan nama nilai entropy. Nilai Info A (D) dihitung menggunakan persamaan 7. (7) Info A (D) adalah jumlah informasi yang diperlukan untuk mengklasifikasikan sebuah data pelatihan jika dilakukan percabangan pada A. Secara umum nilai Gain(A) menunjukkan seberapa banyak informasi yang didapatkan jika dilakukan percabangan pada atribut A. Untuk setiap proses percabangan, selalu dipilih dan dilakukan percabangan pada atribut yang dapat memberikan nilai Gain (information gain) paling maksimal. Gambar 2. Contoh sebuah decision tree [8]. Menurut Kotsiantis [12], berikut ini adalah langkahlangkah yang diperlukan untuk pembentukan sebuah decision tree: a. Lakukan pengecekan untuk base case. b. Untuk setiap atribut yang ada di data pelatihan, hitung nilai information gain yang didapatkan jika membuat cabang pada atribut tersebut. c. Setelah didapatkan atribut yang memberikan nilai information gain tertinggi, lakukan percabangan pada pohon keputusan tersebut. d. Secara rekursif, lakukan langkah-langkah b dan c pada sub-atribut yang didapatkan, kemudian tambahkan ke dalam percabangan-percabangan berikutnya. Nilai dari information gain didapatkan dengan menggunakan persamaan 5. (5) 7) Support Vector Machine (SVM): merupakan salah satu metode klasifikasi dengan pembelajaran terbimbing (supervised learning). Pada sejumlah data pelatihan yang memiliki sejumlah p atribut (vektor berukuran p dimensi), metode SVM berusaha menemukan sebuah hyperplane berukuran (p-1) dimensi yang dapat memisahkan data pelatihan berdasarkan kelasnya. Ilustrasi yang menggambarkan hyperplane (atau biasa disebut sebagai decision boundary) dari sejumlah data pelatihan dapat dilihat pada Gambar 3 [8]. Gambar 3. Contoh decision boundary untuk sejumlah data pelatihan dengan jarak/perbedaan kecil [8]. Jika diketahui data pelatihan merupakan data yang telah dilabeli dan memiliki sejumlah p atribut (atau biasa dinamakan sebagai tuple), (x i, y i ) dengan i = 1, 2,, n, dengan n adalah jumlah data pelatihan, sedangkan x i adalah kumpulan atribut pada data pelatihan ke-i dan y i adalah kelas dari data pelatihan ke-i tersebut, maka SVM secara 125
4 umum menghitung masalah optimisasi seperti pada persamaan 8 [8]. dengan ketentuan [8]: (8) e-issn: Dataset yang dihasilkan diharapkan dapat digunakan pada penelitian-penelitian berikutnya terkait dengan Indoor Positioning System berbasis Wi-Fi. II. METODOLOGI PENELITIAN Secara umum penelitian ini dilaksanakan dalam tiga tahap, yaitu pembentukan dataset, pengujian dan analisis, seperti terlihat pada Gambar 5. Metode SVM memiliki kelemahan pada proses perhitungan yang relatif lebih lama dibandingkan dengan metode-metode klasifikasi lainnya. 8) Cross validation: Merupakan salah satu metode validasi, biasa juga disebut k-fold atau rotation estimation. Ilustrasi dari k-fold atau rotation estimation dapat dilihat pada Gambar 4. Gambar 4. Ilustrasi k-fold untuk k = 10. Sebuah dataset D secara acak dibagi menjadi subset D 1, D 2,, D k yang disebut fold. untuk k = jumlah fold digunakan. Setiap fold (kotak hitam pada Gambar 4) kemudian digunakan sebagai data uji, sedangkan fold lainnya sebagai data pelatihan. Lakukan langkah tersebut sampai seluruh fold telah digunakan sebagai data uji [13]. Penggunaan cross validation diharapkan dapat mengurangi nilai bias yang mungkin muncul berdasarkan pemilihan data pelatihan dan pemilihan data uji yang kurang mewakili permasalahan yang dihadapi. C. Tujuan Penelitian Penelitian ini dilaksanakan dengan tujuan untuk mendapatkan hasil perbandingan metode-metode klasifikasi KNN, Naïve Bayes, J48 dan SVM. Tujuan lain dari penelitian ini adalah membentuk dataset Indoor Positioning System menggunakan data kekuatan sinyal Wi-Fi yang dikumpulkan dari beberapa lokasi publik di kampus UKDW. D. Manfaat Penelitian Hasil dari penelitian ini dapat dijadikan sebagai acuan dalam pemilihan metode yang terbaik untuk membuat implementasi Indoor Positioning System berbasis Wi-Fi. Gambar 5. Tahapan penelitian yang dilakukan. A. Pembentukan Dataset Tahap pembentukan dataset ini terdiri dari beberapa subtahap, yaitu: pengembangan aplikasi Android, pengumpulan data, pembersihan data dan pemberian label serta konversi dataset dalam format arff, seperti terlihat pada Gambar 6. Gambar 6. Langkah-langkah pembentukan dataset. Pengumpulan data menggunakan perangkat smartphone berbasis Android yang dilengkapi dengan Wi-Fi. Untuk penelitian ini, dikembangkan sebuah aplikasi Android yang 126
5 dapat melakukan pemindaian terhadap seluruh access point yang dapat dijangkau oleh smartphone tersebut. Tampilan aplikasi tersebut dapat dilihat pada Gambar 7. Pada penelitian ini dilakukan pengambilan data kekuatan sinyal Wi-Fi untuk 41 lokasi ruang publik yang ada di kampus UKDW, meliputi Fakultas, Biro Universitas, Unit Pembantu, Ruang Rektorat, Kantin, Koperasi dan beberapa ruang publik lainnya. Pada kampus UKDW terpasang 177 access points yang tersebar di 11 gedung, dimana beberapa gedung terdiri lebih dari 3 tingkat. Skema gedung-gedung kampus UKDW dapat dilihat pada Gambar 8. Gambar 7. Tampilan aplikasi Wi-Fi Data Collector yang digunakan untuk pengumpulan data kekuatan sinyal Wi-Fi. Gambar 8. Skema 11 gedung di kampus UKDW. Pengumpulan data dilakukan dengan bantuan mahasiswa berjumlah 10 orang. Setiap orang mengunjungi 41 lokasi ruang publik yang sudah ditentukan, kemudian merekam dan menyimpan data kekuatan sinyal Wi-Fi sebanyak 10 kali, untuk tiga rentang waktu yang berbeda (pagi, siang dan sore). Pengumpul data mengunjungi lokasi ruang publik tersebut, kemudian menjalankan aplikasi Wi-Fi Data Collector. Memilih ruangan yang sesuai, kemudian melakukan scan terhadap sinyal-sinyal Wi-Fi yang dapat ditangkap pada lokasi tersebut. Pilihan lokasi ruang publik pada aplikasi Wi-Fi Data Collector dapat dilihat pada Gambar 9. Pengumpulan data dilakukan dengan menggunakan aplikasi Wi-Fi Data Collector berbasis Android yang dikembangkan sendiri dengan pertimbangan kemudahaan dalam mengumpulkan data kekuatan sinyal Wi-Fi. Perangkat bergerak seperti tablet dan smartphone yang berbasis Android pada umumnya memiliki konektivitas Wi- Fi, mudah dibawa berkeliling dan mudah dalam pengoperasiannya. Langkah-langkah penggunaan aplikasi Wi-Fi Data Collector untuk pengumpulan data adalah: 1. Ambil posisi sedekat mungkin dengan pintu masuk dari salah satu ruang publik yang ada di kampus UKDW. 2. Jalankan aplikasi Wi-Fi Data Collector. Secara otomatis aplikasi ini akan mengaktifkan Wi-Fi jika belum aktif. 3. Pilih ruangan yang sesuai, kemudian tap pada tombol Scan. Tunggu sebentar. 4. Aplikasi akan menampilkan daftar access points yang ada di sekitar ruang publik tersebut, beserta informasi nama access point dan kekuatan sinyal yang diterima. 5. Tap tombol Save untuk menyimpan data kekuatan sinyal yang diterima ke dalam database. Gambar 9. Beberapa pilihan lokasi ruang publik pada aplikasi Wi-Fi Data Collector. 127
6 Beberapa kendala sempat ditemui dalam tahap pengumpulan data, misalnya pada ketidaktelitian mahasiswa dalam memilih ruang publik. Masalah ini dapat dipecahkan dengan mencatat ruangan dan waktu pengambilan untuk setiap pengambilan data yang tidak sesuai. Setelah tahap pengumpulan data selesai, didapatkan secara keseluruhan data. Setelah dilakukan pengecekan, beberapa data dihapus karena ada kesalahan pemilihan ruangan, berdasarkan catatan yang dibuat oleh masing-masing mahasiswa yang membantu penelitian ini. Setelah proses pengecekan dan penghapusan dilakukan, didapatkan data. Format dan contoh data kekuatan sinyal yang didapatkan pada tahap pengumpulan data dapat dilihat pada Tabel I. TABEL I FORMAT DAN CONTOH DATA KEKUATAN SINYAL Ruangan AP1 AP2 AP3 AP4 AP177 Rektorat Biro II Koperasi Fak. TI Untuk setiap baris data terdiri dari 178 kolom, dengan kolom pertama merupakan nama ruangan dan kolom-kolom berikutnya merupakan kekuatan sinyal yang diterima dari seluruh access points yang ada di kampus UKDW. Kekuatan sinyal dalam satuan dbm, semakin besar nilainya maka sinyal yang diterima lebih kuat. Untuk access points di gedung berbeda sebagian tidak dapat ditangkap sinyalnya untuk beberapa lokasi tertentu, kekuatan sinyalnya ditentukan dengan nilai -100, yang menunjukkan tidak ada sinyal yang diterima. Tahap pengumpulan data ini menghasilkan sebuah dataset dalam format CSV. Setelah tahap pengumpulan data selesai, berikutnya adalah tahap pengujian menggunakan perangkat lunak Weka. Untuk memudahkan tahap pengujian, dataset dalam format CSV tersebut dikonversi terlebih dahulu ke format ARFF (*.arff, Attribute-Relation File Format) dengan menggunakan Weka Explorer, pada sub-bagian Preprocess, seperti terlihat pada Gambar 10. Pada tahap konversi ini, kolom Ruangan dijadikan sebagai class/label. e-issn: Gambar 10. Preprocessing dataset dan konversi ke format arff menggunakan Weka Explorer. B. Pengujian Tahap pengujian dilakukan menggunakan perangkat lunak Weka. Beberapa metode yang akan dibandingkan dapat dilihat pada Tabel II. TABEL II METODE-METODE YANG DIBANDINGKAN DALAM PENGUJIAN KNN Metode Naïve Bayes J48 SVM Parameter k = 1, distance weighting = false k = 3, distance weighting = false k = 1, distance weighting = true k = 3, distance weighting = true usekernelestimator = false usekernelestimator = true unpruned = false unpruned = true parameter default Untuk metode KNN terdiri dari 4 variasi untuk melihat pengaruh nilai k maupun penggunaan metode distance weighting terhadap tingkat akurasi. Pada metode Naïve Bayes, dilakukan dalam dua variasi, yaitu penggunaan kernel estimator atau tidak. Untuk metode J48, parameter yang divariasikan adalah apakah akan dilakukan proses pruning atau tidak. Sedangkan pada metode SVM dilakukan dengan konfigurasi parameter default, tanpa mengubah parameter. Tahap ini terdiri dari beberapa langkah, yaitu: 1. Jalankan perangkat lunak Weka, pilih menu Experimenter, seperti pada Gambar 11 dan Gambar
7 Gambar 11. Tampilan awal aplikasi Weka, pilih menu Experimenter. Gambar 13. Seluruh parameter pengujian sudah dimasukkan, siap untuk tahap pengujian. 7. Pilih tab Run untuk menjalankan pengujian, tunggu sampai seluruh metode selesai dijalankan. Gambar 12. Window Experimenter pada Weka. 2. Tentukan jenis percobaan menjadi Cross-validation, dengan jumlah folds sebanyak 10 dan jumlah repetitions sebanyak Buka dataset yang dihasilkan dari tahap pengumpulan data. 4. Tentukan kolom nama ruangan sebagai kelas (class). 5. Pilih metode-metode yang akan dibandingkan, sesuaikan parameter-parameter yang dibutuhkan berdasarkan ketentuan pada Tabel II. 6. Setelah konfigurasi percobaan sudah lengkap seperti pada Gambar 13, percobaan dapat dijalankan. C. Analisis Hasil Pengujian Setelah proses pengujian selesai, tahap berikutnya adalah tahap analisis hasil pengujian. Setiap metode yang diujikan akan menghasilkan 100 hasil pengujian karena menggunakan k-fold dengan nilai k = 10 dan jumlah repetitions sebanyak 10. Dengan demikian secara keseluruhan akan didapatkan 900 hasil pengujian. Untuk menentukan metode yang menghasilkan tingkat akurasi klasifikasi tertinggi, digunakan metode uji statistik, seperti pada Tabel III. TABEL III PARAMETER YANG DIGUNAKAN PADA TAHAP ANALISIS Parameter Testing with Comparison field Significance Nilai Paired T-Tester (corrected) Percent correct 0.05 (two tailed) Tampilan konfigurasi parameter untuk tahap analisis menggunakan Weka dapat dilihat pada Gambar
8 e-issn: metode memiliki tingkat akurasi di atas test base, hanya metode SVM yang menghasilkan tingkat akurasi di bawah test base, yaitu hanya 24,89%. Hasil perbandingan tingkat akurasi dapat dilihat dalam bentuk grafik batang, seperti pada Gambar 15. Hasil Pengujian Tingkat akurasi (%) Gambar 14. Konfigurasi parameter untuk tahap analisis. Pada penelitian ini, metode Naïve Bayes tanpa kernel estimator dijadikan sebagai pembanding (test base) bagi metode-metode lainnya. Setelah tahap analisis selesai dijalankan, hasilnya dapat dilihat pada Tabel IV. TABEL IV HASIL ANALISIS PENGUJIAN CORRECTED PAIRED T-TEST Metode Akuras i (%) Perbandingan KNN (k = 1, dw = false) 83,58 (1/0/0) KNN (k = 3, dw = false) 80,92 (1/0/0) KNN (k = 1, dw = true) 83,58 (1/0/0) KNN (k = 3, dw = true) 82,72 (1/0/0) Naïve Bayes (kernel = false) 61,52 (v/ /*) Naïve Bayes (kernel = true) 64,75 (1/0/0) J48 (pruned) 76,60 (1/0/0) J48 (unpruned) 76,48 (1/0/0) SVM 24,89 (0/0/1) Kolom perbandingan pada Tabel IV merupakan informasi hasil perbandingan masing-masing metode dengan metode yang dijadikan test base, yaitu Naïve Bayes tanpa kernel estimator. Nilai (v/ /*) menunjukkan metode tersebut dijadikan sebagai test base, sedangkan nilai (1/0/0) menunjukkan metode tersebut memiliki tingkat akurasi yang lebih tinggi dibandingkan dengan test base. Nilai (0/0/1) menunjukkan metode tersebut menghasilkan tingkat akurasi yang lebih rendah dibandingkan dengan test base. Metode Naïve Bayes tanpa kernel estimator menghasilkan tingkat akurasi sebesar 61,52%, yang dijadikan sebagai acuan/ pembanding (test base) bagi metode-metode lainnya. Secara umum sebagian besar Tingkat Akurasi Gambar 15. Hasil pengujian yang didapatkan dari pengujian. Metode SVM yang diimplementasikan dalam penelitian ini menggunakan konfigurasi parameter default sehingga hasilnya tidak baik. Dengan konfigurasi parameter yang tepat, masih ada kemungkinan bagi metode SVM untuk menghasilkan tingkat akurasi yang lebih baik lagi. Metode Naïve Bayes dengan kernel estimator menghasilkan tingkat akurasi yang lebih baik (64,75%) jika dibandingkan dengan metode Naïve Bayes tanpa kernel estimator (61,52%). Penggunaan kernel estimator ternyata dapat meningkatkan tingkat akurasi metode Naïve Bayes. Metode klasifikasi berbasis decision tree, J48, menghasilkan tingkat akurasi yang lebih baik dari Naïve Bayes, yaitu 76,60% dan 76,48%, masing-masing untuk J48 dengan pruning dan J48 tanpa pruning. Proses pruning secara umum dapat meningkatkan tingkat akurasi dan mempercepat proses klasifikasi, namun dalam penelitian ini tingkat akurasi yang didapatkan hanya berbeda sedikit. Seluruh variasi metode KNN yang diimplementasikan dalam penelitian ini menghasilkan tingkat akurasi melebihi test base dan secara konsisten memberikan hasil yang lebih baik dibandingkan dengan metode-metode klasifikasi lainnya. Penggunaan nilai k=1 menghasilkan tingkat akurasi yang lebih baik dibandingkan dengan nilai k=3. Penggunaan distance weighting juga dapat meningkatkan akurasi dari KNN. Untuk nilai k=1, penggunaan distance weighting tidak berpengaruh, sehingga tingkat akurasi yang didapatkan sama. Penggunaan distance weighting berpengaruh untuk 130
9 nilai k>1, meningkatkan tingkat akurasi dari 80,92% (k=3, dw=false) menjadi 82,72% (k=3, dw=true). Penelitian ini melakukan pengujian tingkat akurasi klasifikasi beberapa metode dengan menggunakan dataset yang didapatkan dari tahap pengumpulan data. Ciri (features) yang digunakan untuk klasifikasi adalah seluruh kolom yang ada, sehingga ada kemungkinan terjadi curse of dimensionality, menyebabkan tingkat akurasi menurun karena dimensi data yang terlalu besar. Untuk menghindari masalah curse of dimensionality tersebut, dapat dilakukan langkah-langkah pemrosesan awal terhadap dataset yang digunakan, misalnya dengan menggunakan Principal Component Analysis (PCA), High Correlation Filter, Singular Value Decomposition (SVD), maupun beberapa metode-metode feature/dimensionality reduction lainnya. Untuk meningkatkan tingkat akurasi dari metode KNN dapat mencoba pengujian mengggunakan nilai k yang berbeda-beda, untuk mendapatkan hasil yang terbaik. Pengurangan dimensi ciri (dimensionality reduction) dari dataset, dapat menggunakan Condensed Nearest Neighbors (CNN) maupun Generalised Condensed Nearest Neighbors (GCNN). Peningkatan akurasi juga bisa didapatkan dengan menggabungkan beberapa metode klasifikasi sekaligus, atau menggabungkan metode klusterisasi dengan metode klasifikasi. III. SIMPULAN Dari penelitian ini, dapat ditarik beberapa simpulan berikut ini: 1. Proses pengumpulan data membutuhkan langkahlangkah tambahan untuk pengecekan dan pembersihan dataset dari kesalahan yang umumnya dilakukan, yaitu ketidaktelitian saat memilih ruangan di aplikasi Android yang digunakan. 2. Metode K-Nearest Neighbors menghasilkan tingkat akurasi tertinggi, kemudian berikutnya metode J48, Naïve Bayes dan SVM di urutan terakhir. 3. Metode K-Nearest Neighbors menghasilkan tingkat akurasi yang tertinggi jika dibandingkan dengan metode-metode lainnya, yaitu dengan tingkat akurasi tertinggi 83,58% untuk nilai k=1. 4. Penggunaan pruning pada metode J48 dapat meningkatkan tingkat akurasi yang dihasilkan, yaitu dari 76,48% menjadi 76,60%. 5. Penggunaan kernel estimator pada metode Naïve Bayes dapat meningkatkan tingkat akurasi yang dihasilkan, yaitu dari 61,52% menjadi 64,75%. 6. Metode-metode yang dibandingkan pada penelitian ini diimplementasikan dengan tidak banyak mengubah konfigurasi awal, sehingga dimungkinkan untuk dapat meningkatkan tingkat akurasi dengan mengubah konfigurasi dan melakukan tahap preprocessing pada dataset sebelum dilakukan tahap klasifikasi. UCAPAN TERIMA KASIH Penelitian ini diselenggarakan menggunakan dana penelitian Fakultas Teknologi Informasi Universitas Kristen Duta Wacana, No. 134/D.02/FTI/UKDW/2015. Kami mengucapkan terima kasih atas dukungan dan bantuan dari pihak-pihak berikut ini: 1. Fakultas Teknologi Informasi UKDW selaku pemberi dana penelitian. 2. Mahasiswa Teknik Informatika UKDW yang telah membantu dalam tahap pengumpulan data. DAFTAR PUSTAKA [1] A. Ghose, A. Pal, A. D. Choudhury, V. Chandel, C. Bhaumik & T. Chattopadhyay, Indoor Positioning System, US Patent No. 14/450,890, Feb. 5, [2] H. Yucel, T. Ozkir, R. Edizkan & A. Yazici, Development of Indoor Positioning System with Ultrasonic and Infrared Signals, Prosiding INISTA, 2012, p [3] S. Y. Jung, S. Hann, S. Park & C. S. Park, Optical Wireless Indoor Positioning System Using Light Emitting Diode Ceiling Lights, Microw. Opt. Technol. Lett., 54: Doi: /mop [4] N. Le-Dortz, N. Gain & P. Zetterberg, Wi-Fi Fingerprint Indoor Positioning System Using Probability Distribution Comparison, Prosiding ICASSP, 2012, p [5] J. Y. Lee, C. H. Hyunjae & J. So, Analysis of Location Estimation Algorithms for Wi-Fi Fingerprint-based Indoor Localization, Prosiding The 2 nd International Conference on Software Technology, 2013, vol. 19 p [6] O. Dousse, J. Eberle & M. Mertens, Place Learning via Direct Wi-Fi Fingerprint Clustering, Prosiding Mobile Data Management, 2013, 2012, p [7] (2015) Machine Learning Group at the University of Waikato. [Online]. Tersedia: [8] J. Han, M. Kamber & J. Pei, Data Mining Concepts and Techniques, 3 rd ed., Amsterdam, Elsevier, [9] C. D. Manning, P. Raghavan & H. Schutze, Introduction to Information Retrieval, New York, Cambridge University Press, [10] S. A. Dudhani, The Distance-Weighted k-nearest Neighbor Rule, Prosiding IEEE Transactions on Systems, Man and Cybernetics, 1976, vol. 6, p [11] I. H. Witten & E. Frank, Data Mining: Practical Machine Learning Tools and Techniques, 2 nd ed., San Francisco, Morgan Kaufman, [12] S. B. Kotsiantis, Supervised Machine Learning: A Review of Classification Techniques, Prosiding of the 2007 conference on Emerging Artificial Intelligence Applications in Computer Engineering: Real Word AI Systems with Applications in ehealth, HCI, Information Retrieval and Pervasive Technologies, 2007, p [13] R. Kohavi, A Study of Cross Validation and Bootstrap for Accuracy Estimation and Model Selection, Prosiding of the 14 th International Joint Conference on Artificial Intelligence, 1995, vol. 2 p
UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang
BAB 1 PENDAHULUAN 1.1 Latar Belakang Menentukan posisi seseorang dalam konteks outdoor dapat dengan mudah dilakukan menggunakan Global Positioning System (GPS). Namun, belum ada metode standar tertentu
Analisis Kinerja Struktur Data Kd-Tree Pada Metode K-Nearest Neighbors
Riau Journal of Computer Science Vol.2 No.2 Tahun 2016 : 1-6 1 Analisis Kinerja Struktur Data Kd-Tree Pada Metode K-Nearest Neighbors Yuan Lukito Program Studi Teknik Informatika, Fakultas Teknologi Informasi
Indoor Positioning System dengan Algoritma K-Means dan KNN
Indoor Positioning System dengan Algoritma K-Means dan KNN Hizkia Juan Suryanto #1, Antonius R. Chrismanto #2, Yuan Lukito #3 # Program Studi Teknik Informatika, Universitas Kristen Duta Wacana Jl. Dr.
Indoor Positioning System dengan Algoritma K-Means dan KNN
Jurnal Teknik Informatika dan Sistem Informasi e-issn : 2443-2229 Volume 2 Nomor 3 Desember 2016 Indoor Positioning System dengan Algoritma K-Means dan KNN Hizkia Juan Suryanto #1, Antonius Rachmat C.
Versi Online tersedia di : JURNAL TECH-E (Online)
JURNAL TECH-E - VOL. 1 NO. 1 (2017) Versi Online tersedia di : http://bsti.ubd.ac.id/e-jurnal JURNAL TECH-E 2581-116 (Online) Artikel Perancangan Aplikasi Prediksi Kelulusan Mahasiswa Tepat Waktu Pada
PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5
PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5 Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Jurusan Sistem Informasi, STMIK Indonesia 1 [email protected],
JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: ( Print) A-534
JURNAL TEKNIK ITS Vol. 6, No. 2, (2017) ISSN: 2337-3539 (2301-9271 Print) A-534 Rancang Bangun Sistem Navigasi Indoor Berbasis Integrasi Symbolik Location Model dan Wifi Based Positioning System Untuk
Model Multi Layer Perceptron untuk Indoor Positioning System Berbasis Wi-Fi
Tersedia di http://jtsiskom.undip.ac.id (31 Juli 2017) DOI: 10.14710/jtsiskom.5.3.2017.123-128 Jurnal Teknologi dan Sistem Komputer, 5(3), 2017, 123-128 Model Multi Layer Perceptron untuk Indoor Positioning
ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA
ANALISIS PERBANDINGAN IMPLEMENTASI KERNEL PADA LIBRARY LibSVM UNTUK KLASIFIKASI SENTIMEN MENGGUNAKAN WEKA Prawidya Destarianto 1, Wahyu Kurnia Dewanto 2, Hermawan Arief Putranto 3 1,2,3 Jurusan, Teknologi
PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU
PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU Aradea, Satriyo A., Ariyan Z., Yuliana A. Teknik Informatika Universitas Siliwangi Tasikmalaya Ilmu Komputer Universitas Diponegoro
HASIL DAN PEMBAHASAN. Praproses
5 4 MySQL sebagai database. 5 Mozilla Firefox sebagai web browser. 6 Microsoft Excel untuk perhitungan hasil penelitian dan pembuatan grafik. Perangkat keras: 1 Prosesor Intel Core i3. 2 RAM 2 GB. 3 Harddisk
BAB III METODE PENELITIAN
BAB III METODE PENELITIAN 3.1. Metode Pengumpulan Data Data yang digunakan pada penelitian ini merupakan data sentimen dari pengguna aplikasi android yang memberikan komentarnya pada fasilitas user review
Sistem Navigasi Indoor Menggunakan Sinyal Wi-fi dan Kompas Digital Berbasis Integrasi dengan Smartphone untuk Studi Kasus pada Gedung Bertingkat
Sistem Navigasi Indoor Menggunakan Sinyal Wi-fi dan Kompas Digital Berbasis Integrasi dengan Smartphone untuk Studi Kasus pada Gedung Bertingkat A448 Alifa Ridho Musthafa, R.V. Hari Ginardi, dan F.X. Arunanto
Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik
Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik Imam Sutoyo AMIK BSI JAKARTA e-mail: [email protected] Abstrak - Klasifikasi peserta didik merupakan kegiatan yang sangat penting
Moch. Ali Machmudi 1) 1) Stmik Bina Patria
UJI PENGARUH KARAKTERISTIK DATASET PADA PERFORMA ALGORITMA KLASIFIKASI Moch. Ali Machmudi 1) 1) Stmik Bina Patria 1) Jurusan Manjemen Informatika-D3 Email : 1 [email protected] 1) Abstrak Tujuan utama
PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO
PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO Wandira Irene, Mukhlisulfatih Latief, Lillyan Hadjaratie Program Studi S1 Sistem Informasi / Teknik Informatika
BAB III ANALISA DAN PERANCANGAN SISTEM
BAB III ANALISA DAN PERANCANGAN SISTEM Bab ini menjelaskan tentang analisa data, rancangan sistem, dan skenario pengujian. Bagian analisa data meliputi data penelitian, analisis data, data preprocessing.
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Internet saat ini merupakan kebutuhan pokok yang tidak bisa dipisahkan dari segenap sendi kehidupan. Berbagai pekerjaan ataupun kebutuhan dapat dilakukan melalui media
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 2.1 Data Mining Data Mining adalah proses yang mempekerjakan satu atau lebih teknik pembelajaran komputer (machine learning) untuk menganalisis dan mengekstraksi pengetahuan (knowledge)
PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE
PENERAPAN ADABOOST UNTUK KLASIFIKASI SUPPORT VECTOR MACHINE GUNA MENINGKATKAN AKURASI PADA DIAGNOSA CHRONIC KIDNEY DISEASE Eka Listiana 1*, Much Aziz Muslim 1 1 Program Studi Teknik Informatika, Fakultas
Bandung, Indonesia Bandung, Indonesia
ISSN : 2355-9365 e-proceeding of Engineering : Vol.2, No.2 Agustus 2015 Page 6353 Analisis dan Implementasi Pengklasifikasian Pesan Singkat pada Penyaringan SMS Spam Menggunakan Algoritma Multinomial Naïve
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI 1.1 Data Mining Data mining adalah proses yang menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mengekstrasi dan mengidentifikasi informasi
Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor
Perbandingan Klasifikasi Tugas Akhir Mahasiswa Jurusan Teknik Informatika Menggunakan Metode Naïve Bayes Classifier dan K-Nearest Neighbor Yusra 1, Dhita Olivita 2, Yelfi Vitriani 3 1,2,3 Jurusan Teknik
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Education data mining merupakan penelitian didasarkan data di dunia pendidikan untuk menggali dan memperoleh informasi tersembunyi dari data yang ada. Pemanfaatan education
PENGKAJIAN KUALITAS SINYAL DAN POSISI WIFI ACCESS POINT DENGAN METODE RSSI DI GEDUNG KPA POLITEKNIK NEGERI SRIWIJAYA
PENGKAJIAN KUALITAS SINYAL DAN POSISI WIFI ACCESS POINT DENGAN METODE RSSI DI GEDUNG KPA POLITEKNIK NEGERI SRIWIJAYA Aishah Garnis 1, Suroso 1, Sopian Soim 1 1 Jurusan Teknik Elektro PS Teknik Telekomunikasi,
Indoor Positioning Menggunakan Wireless LAN
Indoor Positioning Menggunakan Wireless LAN Rendy Budi Mulia +628-578-031-369-9 [email protected] Salah satu keterbatasan dalam global positioning system saat ini yaitu perlunya koneksi satelit,
BAB I PENDAHULUAN. berpindah-pindah tempat saat melakukan aktivitas sehari-hari. Tidak jarang
BAB I PENDAHULUAN 1.1. Latar Belakang Seiring dengan perkembangan dan tuntutan jaman, mobilitas manusia akan terus bertambah dan semakin kompleks. Hal ini menyebabkan seseorang harus berpindah-pindah tempat
Modul Praktikum WEKA. Pembaca modul ini diasumsikan telah mengerti dasar-dasar datamining.
Modul Praktikum WEKA Yudi Wibisono (e: [email protected] ); t: @yudiwbs Ilmu Komputer Universitas Pendidikan Indonesia (cs.upi.edu) Versi BETA : Oktober 2013 http://creativecommons.org/licenses/by-nc-sa/3.0/
BAB I PENDAHULUAN.
BAB I PENDAHULUAN 1.1. Latar Belakang Saat ini smartphone telah berevolusi menjadi komputer pribadi kecil dan portabel yang memungkinkan pengguna untuk melakukan penjelajahan internet, mengirim e-mail
PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR. Abstrak
ISSN 1858 4667 JURNAL LINK Vol 13/No.1/Januari 2010 PERBANDINGAN KLASIFIKASI DOKUMEN TEKS MENGGUNAKAN METODE NAÏVE BAYES DENGAN K-NEAREST NEIGHBOR Cahyo Darujati Fakultas Ilmu Komputer, Universitas Narotama
Materi Praktikum Data Mining Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala
Materi Decision Tree Program Studi Informatika / Matematika FMIPA Universitas Syiah Kuala Dosen Pengasuh Dr. Taufik Fuadi Abidin, M.Tech Dr. Muhammad Subianto, M.Si {tfa,subianto}@informatika.unsyiah.ac.id
BAB III ANALISIS DAN PENYELESAIAN MASALAH
BAB III ANALISIS DAN PENYELESAIAN MASALAH 3.1 Deskripsi Sistem Gambar III-1 Deskripsi Umum Sistem Pada gambar III-1 dapat dilihat deskripsi sistem sederhana yang mendeteksi intrusi pada jaringan menggunakan
Pemanfaatan Educational Data Mining (EDM)...
PEMANFAATAN EDUCATIONAL DATA MINING (EDM) UNTUK MEMPREDIKSI MASA STUDI MAHASISWA MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS: TI-S1 UDINUS) Defri Kurniawan 1*, Wibowo Wicaksono 1 dan Yani Parti Astuti 1 1
K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN
K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN Eko Prasetyo 1) 1 Program Studi Teknik Informatika, Fakultas Teknik, Universitas Bhayangkara Surabaya 2 Jalan A. Yani 11, Surabaya, 60231
ABSTRAK. Keywords : Data Mining, Filter, Data Pre-Processing, Association, Classification, Deskriptif, Prediktif, Data Mahasiswa.
ABSTRAK Kemajuan teknologi membuat begitu mudahnya dalam pengolahan suatu informasi. Waktu tidak lagi menjadi hambatan dalam pengolahan data yang sangat banyak. Hal ini didukung pula dengan adanya perkembangan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi
VISUALISASI PETA RSS FINGERPRINT DALAM FASE OFFLINE PADA LOCALIZATION DI LANTAI 3 GEDUNG TEKNIK ELEKTRO UGM MENGGUNAKAN WLAN
VISUALISASI PETA RSS FINGERPRINT DALAM FASE OFFLINE PADA LOCALIZATION DI LANTAI 3 GEDUNG TEKNIK ELEKTRO UGM MENGGUNAKAN WLAN 1 Chairani, 2 Widyawan 1 Teknik Informatika, Informatics & Business Institute
PERSYARATAN PRODUK. 1.1 Pendahuluan Latar Belakang Tujuan
BAB 1 PERSYARATAN PRODUK Bab ini membahas mengenai hal umum dari produk yang dibuat, meliputi tujuan, ruang lingkup proyek, perspektif produk, fungsi produk dan hal umum yang lainnya. 1.1 Pendahuluan Hal
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu pelayanan dalam dunia perbankan adalah pemberian pinjaman kredit kepada nasabah yang memenuhi syarat perbankan. kredit merupakan sumber utama penghasilan
KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR
KLASIFIKASI CITRA FORMULIR MENGGUNAKAN METODE SUPPORT VECTOR MACHINE (SVM) PADA PROSES DIGITALISASI FORMULIR Dewi Pramudi Ismi 1), Ardiansyah 2) 1 Program Studi Teknik Informatika, Fakultas Teknologi Industri,
PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE
PEMBENTUKAN MODEL KLASIFIKASI DATA LAMA STUDI MAHASISWA STMIK INDONESIA MENGGUNAKAN DECISION TREE DENGAN ALGORITMA NBTREE Syam Gunawan 1, Pritasari Palupiningsih 2 1,2 Program Studi Sistem Informasi, STMIK
KLASIFIKASI PADA TEXT MINING
Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 KLASIFIKASI PADA TEXT MINING Budi Susanto Text dan Web Mining - FTI UKDW - BUDI SUSANTO 2 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa
Rizky Ichsan Parama Putra Dosen Pembimbing: Waskitho Wibisono, S.Kom., M.Eng., Ph.D. Hudan Studiawan, S.Kom, M.Kom
Rancang Bangun Sistem Pendeteksi Posisi dalam Ruangan Menggunakan Kekuatan Sinyal Wi-Fi dengan Penerapan Algoritma Cluster Filtered KNN Rizky Ichsan Parama Putra 5109100026 Dosen Pembimbing: Waskitho Wibisono,
LAPORAN TUGAS AKHIR. Disusun oleh: Franky
LAPORAN TUGAS AKHIR Analisis Sentimen Menggunakan Metode Naive Bayes, Maximum Entropy, dan Support Vector Machine pada Dokumen Berbahasa Inggris dan Dokumen Berbahasa Indonesia Hasil Penerjemahan Otomatis
1 BAB I PENDAHULUAN. 1.1 Latar Belakang
1 BAB I PENDAHULUAN 1.1 Latar Belakang Pada era sekarang ini kebutuhan informasi bergeser kedudukannya, yang semula merupakan kebutuhan sekunder atau tersier saat ini berubah kedudukannya sebagai kebutuhan
Sekip Utara Yogyakarta * 1 2
IJCCS, Vol.9, No.1, January 2015, pp. 1~12 ISSN: 1978-1520 1 Klasifikasi Data NAP (Nota Analisis Pembiayaan) untuk Prediksi Tingkat Keamanan Pemberian Kredit (Studi Kasus : Bank Syariah Mandiri Cabang
IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.
IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.5 Amelia Halim 1) dan Joko Lianto Buliali 2) 1) Program Studi Magister
KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER
KLASIFIKASI KAYU DENGAN MENGGUNAKAN NAÏVE BAYES-CLASSIFIER ACHMAD FAHRUROZI 1 1 Universitas Gunadarma, [email protected] Abstrak Masalah yang akan diangkat dalam makalah ini adalah bagaimana
BAB 3 PROSEDUR DAN METODOLOGI. menawarkan pencarian citra dengan menggunakan fitur low level yang terdapat
BAB 3 PROSEDUR DAN METODOLOGI 3.1 Permasalahan CBIR ( Content Based Image Retrieval) akhir-akhir ini merupakan salah satu bidang riset yang sedang berkembang pesat (Carneiro, 2005, p1). CBIR ini menawarkan
BAB III METODOLOGI PENELITIAN. Dataset
BAB III METODOLOGI PENELITIAN Metodologi penelitian diuraikan dalam skema tahap penelitian untuk memberikan petunjuk atau gambaran yang jelas, teratur, dan sistematis seperti yang ditunjukkan pada Gambar
PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES
PREDIKSI HERREGISTRASI CALON MAHASISWA BARU MENGGUNAKAN ALGORITMA NAÏVE BAYES Selvy Megira 1), Kusrini 2), Emha Taufiq Luthfi 3) 1), 2), 3) Teknik Universitas AMIKOM Yogyakarta Jl Ring road Utara, Condongcatur,
BAB II LANDASAN TEORI
BAB II LANDASAN TEORI Pada bab ini akan dibahas teori yang berkaitan dengan pemrosesan data untuk sistem pengenalan gender pada skripsi ini, meliputi cropping dan resizing ukuran citra, konversi citra
SENTIPOL: Dataset Sentimen Komentar Pada Kampanye PEMILU Presiden Indonesia 2014 Dari Facebook Page
SENTIPOL: Dataset Sentimen Komentar Pada Kampanye PEMILU Presiden Indonesia 2014 Dari Facebook Page Antonius Rachmat dan Yuan Lukito KNASTIK 2016 Universitas Kristen Duta Wacana 19 November 2016 Latar
Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification
IJCCS, Vol.7, No.1, January 2013, pp. 13~22 ISSN: 1978-1520 13 Klasifikasi Posting Twitter Kemacetan Lalu Lintas Kota Bandung Menggunakan Naive Bayesian Classification Sandi Fajar Rodiyansyah* 1, Edi Winarko
Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra
Jurnal Ilmiah Ilmu Komputer, Vol 15 No. 2, Desember 2010 : 38-41 Klasifikasi Citra Menggunakan Metode Minor Component Analysis pada Sistem Temu Kembali Citra Vera Yunita, Yeni Herdiyeni Departemen Ilmu
DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5
DATA MINING UNTUK MENGANALISA PREDIKSI MAHASISWA BERPOTENSI NON-AKTIF MENGGUNAKAN METODE DECISION TREE C4.5 Dwi Untari A11.2010.05410 Program Studi Teknik Informatika S1 Fakultas Ilmu Komputer Universitas
Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak
TEKNIK DATA MINING MENGGUNAKAN METODE BAYES CLASSIFIER UNTUK OPTIMALISASI PENCARIAN PADA APLIKASI PERPUSTAKAAN (STUDI KASUS : PERPUSTAKAAN UNIVERSITAS PASUNDAN BANDUNG) Oleh : Selvia Lorena Br Ginting,
Implementasi Indoor Positioning System Berbasis Smartphone dengan Penambahan Access Point untuk Studi Kasus Gedung Teknik Informatika ITS
A336 Implementasi Indoor Positioning System Berbasis Smartphone dengan Penambahan Access Point untuk Studi Kasus Gedung Teknik Informatika ITS Fananda Herda Perdana, R.V. Hari Ginardi, dan F.X. Arunanto
Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori
Penghitungan k-nn pada Adaptive Synthetic-Nominal (ADASYN-N) dan Adaptive Synthetic-kNN (ADASYN-kNN) untuk Data Nominal- Multi Kategori Abstrak 1 Sri Rahayu, 2 Teguh Bharata Adji & 3 Noor Akhmad Setiawan
Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, Jurnal Politeknik Caltex Riau
Jurnal Komputer Terapan Vol. 3, No. 2, November 2017, 233-240 233 Jurnal Politeknik Caltex Riau http://jurnal.pcr.ac.id Prediksi Ketepatan Waktu Lulus Mahasiswa dengan k- Nearest Neighbor dan Naïve Bayes
KLASIFIKASI PADA TEXT MINING
Budi Susanto KLASIFIKASI PADA TEXT MINING Text dan Web Mining - FTI UKDW - BUDI SUSANTO 1 Tujuan Memahami konsep dasar sistem klasifikasi Memahami beberapa algoritma klasifikasi: KNN Naïve Bayes Decision
Sistem Pendeteksi Posisi dalam Ruangan Menggunakan Kekuatan Sinyal Wi-Fi dengan Penerapan Algoritma Cluster Filtered KNN
JURNAL TEKNIK POMITS Vol. 2, No. 1, (2013) ISSN: 2337-3539 (2301-9271 Print) 1 Sistem Pendeteksi Posisi dalam Ruangan Menggunakan Kekuatan Sinyal Wi-Fi dengan Penerapan Algoritma Cluster Filtered KNN Rizky
BAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Pendidikan adalah salah satu aspek terpenting bagi kehidupan manusia, yang dapat mempengaruhi manusia itu sendiri, juga menjadi faktor pendukung dalam setiap sektor
BAB III PEMBAHASAN. Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel
BAB III PEMBAHASAN A. Sumber Data Sumber data diperoleh dari Koperasi X yang terdiri dari 3 file excel peminjam dengan jaminan sertifikat tanah, tunjuk, dan Buku Pemilik Kendaraan Bermotor (BPKB) serta
BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah
BAB III METODOLOGI Dalam penelitian ini metodologi memegang peranan penting guna mendapatkan data yang obyektik, valid dan selanjutnya digunakan untuk memecahkan permasalahan yang telah dirumuskan. Maka
Jurnal String Vol. 1 No. 1 Tahun 2016 ISSN:
KAJIAN KOMPARASI ALGORITMA C4.5, NAÏVE BAYES DAN NEURAL NETWORK DALAM PEMILIHAN PENERIMA BEASISWA (Studi Kasus pada SMA Muhammadiyah 4 Jakarta ) Ulfa Pauziah Program Studi Teknik Informatika, Universitas
PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R)
Arifin, Perbandingan Akurasi Klasifikasi Dari Algoritma Naïve Bayes, C4.5, PERBANDINGAN AKURASI KLASIFIKASI DARI ALGORITMA NAIVE BAYES, C4.5, DAN ONER (1R) M Zainal Arifin Abstrak : Artikel ini menjabarkan
SISTEM PENENTUAN POSISI DI DALAM RUANGAN DENGAN METODE FINGERPRINT (KNN) BERBASIS KUAT SINYAL WLAN
STMIK AMIKOM Yogyakarta, 6-8 Februari 205 SISTEM PENENTUAN POSISI DI DALAM RUANGAN DENGAN METODE FINGERPRINT (KNN BERBASIS KUAT SINYAL WLAN Eko Suripto Pasinggi, Selo Sulistyo2, Bimo Sunarfri Hantono3
PERBANDINGAN DECISION TREE
84 2015 Jurnal Krea-TIF Vol: 03 No: 02 PERBANDINGAN DECISION TREE PADA ALGORITMA C 4.5 DAN ID3 DALAM PENGKLASIFIKASIAN INDEKS PRESTASI MAHASISWA (Studi Kasus: Fasilkom Universitas Singaperbangsa Karawang)
ROCCHIO CLASSIFICATION
DOSEN PEMBIMBING : Badriz Zaman, S.Si., M.Kom. 081211632016 S-1 SISTEM INFORMASI UNIVERSITAS AIRLANGGA 1 Informastion retieval system merupakan sebuah sistem yang digunakan untuk mengambil kembali informasi
Komparasi Algoritma Klasifikasi untuk dataset iris dengan rapid miner
Komparasi Algoritma Klasifikasi untuk dataset iris dengan rapid miner M. Adib Alkaromi Program Studi Teknik Informatika STMIK Widya Pratama Jl. Patriot 25 Pekalongan Telp (0285) 427816 Email: [email protected]
PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48
PERBANDINGAN KINERJA ALGORITMA KLASIFIKASI NAÏVE BAYESIAN, LAZY-IBK, ZERO-R, DAN DECISION TREE- J48 Sulidar Fitri Teknik Informatika STMIK AMIKOM Yogyakarta email : [email protected] Abstraksi Penelitian
LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)
LEARNING Jiawei Han and Micheline Kamber. 2006. Data Mining Concepts and Techniques. San Fransisco : Elsevier M.Tim Jones. Artificial Intelligence A System Approach. Slide Kuliah Data Mining - Klasifikasi,
TINJAUAN PUSTAKA. Definisi Data Mining
TINJAUAN PUSTAKA Definisi Data Mining Sistem Manajemen Basis Data tingkat lanjut dan teknologi data warehousing mampu untuk mengumpulkan banjir data dan untuk mentransformasikannya ke dalam basis data
KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION
KLASIFIKASI NASABAH ASURANSI JIWA MENGGUNAKAN ALGORITMA NAIVE BAYES BERBASIS BACKWARD ELIMINATION Betrisandi [email protected] Universitas Ichsan Gorontalo Abstrak Pendapatan untuk perusahaan asuransi
Tugas Ujian Tengah Semester (UTS) Data Mining Lanjut ABSTRAK
PERBANDINGAN KLASIFIKASI KNN DAN NAIVE BAYESIAN SERTA PERBANDINGAN CLUSTERING SIMPLE K-MEANS YANG MENGGUNAKAN DISTANCE FUNCTION MANHATTAN DISTANCE DAN EUCLIDIAN DISTANCE PADA DATASET Dresses_Attribute_Sales
BAB I PENDAHULUAN Latar Belakang
BAB I PENDAHULUAN 1.1. Latar Belakang Pertukaran informasi di zaman modern ini telah sampai pada era digital. Hal ini ditandai dengan semakin dibutuhkannya teknologi berupa komputer dan jaringan internet
PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA
PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA 1 Yulison Herry Chrisnanto, 2 Gunawan Abdillah 1,2 Jurusan Informatika Fakultas
Nur Indah Pratiwi, Widodo Universitas Negeri Jakarta ABSTRAK
Klasifikasi Dokumen Karya Akhir Mahasiswa Menggunakan Naïve Bayes Classifier (NBC) Berdasarkan Abstrak Karya Akhir Di Jurusan Teknik Elektro Universitas Negeri Jakarta Nur Indah Pratiwi, Widodo Universitas
KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE
KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE KLASIFIKASI DATA MENGGUNAKAN JST BACKPROPAGATION MOMENTUM DENGAN ADAPTIVE LEARNING RATE Warih Maharani Fakultas
TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas
TAKARIR Data Mining Clustering Cluster Iteratif Random Centroid : Penggalian data : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas : Berulang : Acak : Pusat area KDD (Knowledge
BAB IV HASIL DAN PEMBAHASAN
BAB IV HASIL DAN PEMBAHASAN 4.1 Hasil Penelitian 4.1.1 Support Vector Machines (SVM) Setelah melalui proses training dan testing dengan metode Support Vector Machines (SVM), diperoleh hasil yang tertera
ABSTRAK. Kata Kunci: data tidak seimbang, klasifikasi, KSMOTE, boosting, SSO, support vector machine.
ABSTRAK Klasifikasi dalam data mining adalah proses untuk menemukan model atau fungsi yang mendeskripsikan dan membedakan kelas-kelas data atau konsep. Salah satu permasalahan klasifikasi adalah distribusi
Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen
Implementasi Rocchio s Classification dalam Mengkategorikan Renungan Harian Kristen Elisabeth Adelia Widjojo, Antonius Rachmat C, R. Gunawan Santosa Program Studi Teknik Informatika, Fakultas Teknologi
PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM)
PREDIKSI KEBANGKRUTAN PERUSAHAAN MENGGUNAKAN SUPPORT VECTOR MACHINE (SVM) 1 Lestari Handayani, 2 Fitriandini Jurusan Teknik Informatika Fakultas Sains dan Teknologi Universitas Islam Negeri Sultan Syarif
PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0
PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C.0 Rachma Fauzia Azhary, Isnandar Slamet, Supriyadi Wibowo Program Studi Matematika Fakultas Matematika dan Ilmu Pengetahuan
UKDW 1. BAB 1 PENDAHULUAN Latar Belakang Masalah
1. BAB 1 PENDAHULUAN 1.1. Latar Belakang Masalah Universitas yang baik dan terpercaya selalu memperhatikan perkembangan dan kondisi yang terjadi di universitas tersebut, salah satunya dengan memantau kinerja
BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang
1 BAB I PENDAHULUAN BAB I PENDAHULUAN 1.1 Latar Belakang Intelligent agent, sebagai bagian dari kecerdasan buatan yang dapat diterapkan pada sistem dalam menyelesaikan sebuah permasalahan. Agen yang diterapkan
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi
Stemming pada Preprocessing Twit Berbahasa Indonesia dengan Mengimplementasikan Algoritma Fonetik Soundex untuk Proses Klasifikasi Stemming in Indonesian Language Twit Preprocessing Implementing Phonetic
Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan Lulus Tepat Waktu (Studi Kasus : Fakultas Ilmu Komputer Universitas Brawijaya)
Jurnal Pengembangan Teknologi Informasi dan Ilmu Komputer e-issn: 2548-964X Vol. 2, No. 4, April 2018, hlm. 1726-1732 http://j-ptiik.ub.ac.id Implementasi Algoritme Fuzzy K-Nearest Neighbor untuk Penentuan
Jl. A. Yani Km 36 Banjarbaru, Kalimantan selatan 1 Abstract
Penerapan K-Optimal Pada Algoritma Knn untuk Prediksi Kelulusan Tepat Waktu Mahasiswa Program Studi Ilmu Komputer Fmipa Unlam Berdasarkan IP Sampai Dengan Semester 4 Mutiara Ayu Banjarsari 1, H. Irwan
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Job Order merupakan pekerjaan yang dilakukan apabila ada order yang diterima dari konsumen. Setiap detil pekerjaan 100% ditentukan oleh calon pembeli, pihak pembuat
JURNAL TEKNIK ITS Vol. 5, No. 2, (2016) ISSN: ( Print)
JURNAL TEKNIK ITS Vol. 5, No., (016) ISSN: 337-3539 (301-971 Print) A36 Perancangan Indoor Localization Menggunakan Bluetooth Untuk Pelacakan Posisi Benda di Dalam Ruangan Anggeriko Aryasena, R.V. Hari
BAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Salah satu tanggung jawab sosial PT. Telkom dalam program kemitraan dengan masyarakat sekitarnya adalah memberikan kredit lunak bagi pelaku Usaha Kecil Menengah (UKM).
Uji Perbandingan Akurasi Analisis Sentimen Pariwisata menggunakan Algoritma Support Vektor Machine dan Naive Bayes
Uji Perbandingan Akurasi Analisis Sentimen Pariwisata menggunakan Algoritma Support Vektor Machine dan Naive Bayes Tesis Diajukan kepada Fakultas Teknologi Informasi Untuk Memperoleh Gelar Master of Computer
MODUL 12 Model Prediktif
MODUL 12 Model Prediktif Prediktif Analytics adalah teknologi yang menangkap proses data mining dalam rutinitas sederhana. Kadang-kadang disebut "one-click data mining," Model ini menyederhanakan dan mengotomatisasi
CHURN PREDICTION PELANGGAN MENGGUNAKAN CRISP-DM (Studi Kasus Pelanggan TelkomFlexi Bandung)
CHURN PREDICTION PELANGGAN MENGGUNAKAN CRISP-DM (Studi Kasus Pelanggan TelkomFlexi Bandung) Customer Churn Prediction Using CRISP DM (Case Study : Customer of TelkomFlexi Bandung) Yance Sonatha Jurusan
RSS Fingerprint Berbasis Mobile untuk Estimasi Lokasi di Dalam Gedung
RSS Fingerprint Berbasis Mobile untuk Estimasi Lokasi di Dalam Gedung Muhammad Ihsan Zul 1), Mochammad Susantok 2), Muhammad Diono 3), Hendra 4), Ari Kurniawan 5), Ronny Septio Pramono 6) 1) Jurusan Komputer,
BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.
BAB IV HASIL DAN PEMBAHASAN 4.1. Identifikasi Masalah Dalam menentukan status calon dosen dan dosen tetap terdapat masalahmasalah dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya sebagai
