Analisis Tingkat Kecelakaan Lalu Lintas dengan Metode Association Rule Menggunakan Algoritma Apriori Wardiman Alimuddin 1), Eddy Tungadi 2, Zawiyah Saharuna 3) email: Bz.diman@gmail.com 1) e_tungadi@yahoo.com 2) wia.saharuna@gmail.com 3) 1,2,3 Jurusan Teknik Elektro Politeknik Negeri Ujung Pandang Abstract Kecelakaan lalu lintas merupakan salah satu penyebab kematian yang cukup besar. Banyak faktor yang menyebabkan terjadinya kecelakaan lalu lintas. Namun tidak banyak analisis yang dilakukan terhadap faktor penyebab kecelakaan tersebut. Metode Association rules dengan algoritma apriori dapat digunakan untuk meneliti faktor-faktor penyebab kecelakaan tersebut. Association rules sangat sesuai untuk mencari keterhubungan antara faktor-faktor penyebab kecelakaan dengan kategori kecelakaan rugi material, ringan, sedang, dan berat. Pada penelitian ini, digunakan nilai support minimum (min_supp) 0.1 dan nilai confidence minimum (min_conf) 50% untuk menghasilkan pola keterhubungan yang kuat antar faktorfaktor kecelakaan lalu lintas. Dengan pola kombinasi 4 iterasi/pengulangan (K 4-itemset) diketahui bahwa tingkat keterhubungan kecelakaan terbesar yaitu pada kecelakaan dengan skala ringan yaitu sebesar 638 kali kejadian atau 68% dari total kecelakaan lalu lintas yang terjadi di Kabupaten Pinrang Keywords: data mining, association rule, apriori, kecelakaan lalu lintas I. PENDAHULUAN Berdasarkan informasi dari World Health Organization (WHO), angka kecelakaan untuk setiap tahunnya sebanyak 1.300.000 jiwa melayang, hal ini sebabkan oleh kecelakaan lalu lintas dengan tiap detik satu nyawa menjadi korban dari kecelakaan lalu lintas yang ada di dunia. Kecelakaan lalu lintas berada pada posisi 3 besar penyebab kematian (Ernita, 2013). Data statistik menunjukkan angka kecelakaan lalu lintas di Indonesia dari tahun ke tahun cenderung meningkat. Peningkatan jumlah kecelakaan secara drastis terjadi pada periode 2004-2005 dan periode 2010-2012. Pada periode 2004-2005 meningkat tajam dari 17.732 kasus pada 2004 menjadi 91.623 kasus pada 2005 atau meningkat 5 kali lipat, sedangkan periode 2010-2012 meningkat tajam dari 66.488 kasus pada 2010 menjadi 109.776 kasus pada 2011 dan 117.949 kasus pada 2012. Namun pada tahun 2013, tingkat kecelakaan mengalami penurunan menjadi 93.578 kasus atau menurun sekitar 21% dibanding tahun sebelumnya. Beberapa Kabupaten/Kota di Sulawesi perlu menjadi sorotan pihak kepolisian terkait masalah kecelakaan lalu lintas ini karena besarnya tingkat kecelakaan lalu lintas yang terjadi, terkhusus Kabupaten Pinrang yang tercatat terjadi sekitar ±1000 kecelakaan lalu lintas selama periode 2013-2016. Ketika sebuah instansi khususnya kepolisian memiliki banyak data namun miskin akan informasi, sebuah teknologi data mining berkembang dalam menjawab tantangan itu. Untuk menentukan pola dan menemukan aturan asosiatif antara suatu kombinasi item dari sekian banyaknya data yang dimiliki oleh kepolisian dapat digunakan metode Assosiation rule yang pada dasarnya menggunakan dua parameter yaitu support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif. Kepolisian berkaitan dengan fungsinya sebagai pengayom masyarakat diharapkan mampu mengambil tindakan dalam menyikapi fenomena kecelakaan lalu lintas yang dapat dilakukan dengan menggunakan teknologi data mining menggunakan metode Assosiation rule dengan menentukan kecenderungan pola yang sering terbentuk dari faktor-faktor yang menjadi penyebab terjadinya
kecelakaan di jalan raya khususnya di Kabupaten Pinrang. Dengan menggunakan metode Association rule tumpukan data kecelakaan lalu lintas yang dimiliki oleh pihak kepolisian akan dicari keterkaitan antara variabel yang akan digunakan pada penelitian ini sehingga dapat dikelola menjadi informasi yang bermanfaat, algoritma Association rule seperti Eclat dan apriori sangat cocok digunakan untuk mencari frequent itemset atau frekuensi kemunculan suatu faktor kecelakaan lalu lintas. II. LANDASAN TEORI A. DATA MINING Data Mining atau sering disebut sebagai knowledge discovery in database (KDD) adalah kegiatan yang meliputi pengumpulan, pemakaian dan historis untuk menemukan keteraturan, pola atau hubungan dalam data berukuran besar. Keluaran Data Mining ini bisa dipakai untuk pengambilan keputusan di masa depan. Pengembangan KDD ini menyebabkan penggunaan pattern recognition semakin berkurang karena telah menjadi bagian dari Data Mining (Mujisah, 2011). Metode ini merupakan gabungan 4 (empat) disiplin ilmu yakni statistic, visualisasi, database, dan machine learning. Adapun machine learning adalah suatu area dalam artificial intelligence atau kecerdasan buatan yang berhubungan dengan pengembangan teknik-teknik pemrograman berdasarkan pembelajaran masa lalu dan bersinggungan dengan ilmu statistika dan juga optimasi. B. ASSOCIATION RULE Analisis asosiasi (association rule) adalah teknik data mining untuk menemukan aturan assosiatif antara suatu kombinasi item. Analisis asosiasi dikenal juga sebagai salah satu teknik data mining yang menjadi dasar dari berbagai teknik data mining lainnya. Khususnya salah satu tahap dari analisis asosiasi yang disebut analisis pola frekuensi tinggi (frequent pattern mining) menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien. Penting tidaknya suatu aturan assosiatif dapat diketahui dengan dua parameter, support (nilai penunjang) yaitu persentase kombinasi item tersebut dalam database dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item dalam aturan assosiatif. Berikut merupakan perhitungan nilai support dan nilai confidence (1) (2) C. APRIORI Algoritma ini digunakan untuk mencari frequent itemset yang memenuhi minsup kemudian mendapatkan rule yang memenuhi konfigurasi minimum dari frequent itemset tadi. Algoritma ini mengontrol berkembangnya kandidat itemset dari hasil frequent itemset dengan support-based pruning untuk menghilangkan itemset yang tidak menarik dengan menetapkan minsup. Prinsip dari apriori iniadalah bila itemset digolongkan sebagai frequentitemset yang memiliki support lebih dari yang ditetapkan sebelumnya, maka semua subsetnya juga termasuk golongan frequent itemset, dan sebaliknya. III. METODE PENELITIAN A. DATA PENELITIAN Data yang digunakan oleh peneliti adalah data kecelakaan lalu lintas di kabupaten pinrang tahun 2013-2016 dengan total kecelakaan sebanyak 903 kejadian, data diperoleh dari korlantas.info bekerjasama pihak kepolisian kabupaten pinrang B. RANCANGAN PENELITIAN Pada penelitian ini akan dilakukan beberapa langkah untuk mencapai tujuan penelitian seperti pada gambar 1.Proses analisis yang dilakukan pada penelitian ini dimulai dari preprosesing data yang meliputi pengumpulan data, penentuan variabel, dan pengelompokan variabel,
setelah itu dilakukan pemrosesan data yang meliputi analisis frequent itemset, pembentukan aturan asosiasi menggunakan tools R. Tahap berikutnya yaitu proses mining, pada tahapan ini akan dilakukan proses frequent item/itemset dan candidate generation itemset secara bertahap untuk menghasilkan nilai support dan nilai confidence menggunakan algoritma apriori. Gambar 1 bagan praproses dan proses penelitian C. VARIABEL PENELITIAN Penelitian ini menggunakan 5 variabel condition dan 1 variabel decision. Variabel penelitian adalah suatu yang menjadi objek penelitian atau juga diartiakan sebagai faktorfaktor yang berperan dalam peristiwa atau gejala yang akan diteliti. Variabel dalam penelitian ini dirangkum dari beberapa faktor penyebab kecelakaan lalu lintas dan dari penelitian terdahulu yang dilakukan. Berikut adalah variabel penelitian yang akan diteliti. a. Variabel Tipe Kecelakaan Variabel tipe kecelakaan merupakan model kecelakaan yang terjadi di lokasi dengan pembagian sebagai berikut : Di ruas jalan, Pejalan kaki tertabrak Di ruas jalan, tabrakan dengan Di simpang, tabrakan Kendaraan dengan Tabrakan depan belakang Tabrakan depan depan Tabrakan dengan benda b. Kondisi Cahaya Variabel kondisi cahaya menjelaskan bagaimana tingkat pencahayaan, jarak pandang dan juga intensitas cahaya dilokasi kejadian, variabel adalah sebagai berikut: Gelap / Tidak terlihat Redup / Samar Terang / Jelas c. Waktu Kejadian Pada penelitian ini tidak digunakan format waktu 24:00 /24 jam tetapi waktu terjadinya kecelakaan lalu lintas dibagi menjadi lima bagian yaitu : Dini Hari (22.01 06.29) Pagi Hari (6.30 10.00) Siang Hari (10.01 14.59) Sore Hari (15.00 18.00) Malam Hari (18.01 22.00) d. Bentuk Geometri Variabel Bentuk Geometri menjabarkan bentuk/model jalan dimana terjadi kecelakaan lalu lintas, variable ini terbagi menjadi 6 yaitu Jembatan Lurus T (SIMPANG) Tikungan X atau + (Simpang) Y (Simpang) e. Status Jalan Variabel Status Jalan terbagi menjadi 4 bagian yaitu : Jalan Desa Jalan Kota/Kabupaten Jalan Nasional Jalan Provinsi f. Tingkat Kecelakaan (Variabel Condition) Variabel Tingkat Kecelakaan merupakan variable yang digunakan sebagai variable condition, variabel ini akan menghasilkan seberapa besar tingkat kecelakaan yang dialami korban/pelaku saat terjadi kecelakaan lalu lintas, variabel ini terbagi menjadi 4 tingkatan yaitu: Berat Sedang Ringan Rugi Materi Saja IV. HASIL DAN PEMBAHASAN Pada penelitian ini tingkat kecelakaan digunakan sebagai variabel decision atau variabel yang menjadi parameter dari kombinasi itemset yang menghasilkan tingkat kecelakaan dengan tingkatan yang Ringan, Sedang, Berat, ataukah Rugi Material. Nilai support minimum (min_supp) disesuaikan dengan frekuensi minimum dari class variabel tingkat kecelakaan dengan tingkatan Rugi Materi
Saja = 2%, makan nilai min_supp yang digunakan yaitu 1 % dengan tingkat kepercayaan (confidence) 50%. Pada table 1 ditunjukkan bahwa dari 903 total kecelakaan lalu lintas terjadi diketahui bahwa 638 atau 68% dari total kecelakaan dengan tingkat ringan, 123 atau 13% dari total kecelakaan dengan tingkat sedang, 156 atau 17% dari total kecelakaan dengan tingkat berat dan 16 atau 2% dari total kecelakaan yang terjadi Tabel 1. Tingkat Kecelakaan Tingkat Kecelakaan Frekuensi Persentase/supp Ringan 638 68% Sedang 123 13% Berat 156 17% Rugi Materi Saja 16 2% Association rues digunakan untuk menentukan pola terjadinya kecelakaan lalu lintas yang terjadi di kabupaten Pinrang, dengan menggunakan algoritma apriori akan dilakukan proses pencarian asosiasi hingga 4 iterasi/ kombinasi (4-k itemset) yang merupakan kombinasi terbanyak yang muncul setelah dilakukan analisis, batasan min_supp yang digunakan oleh peneliti adalah 1% (disesuaikan dengan presentase/supp Rugi Materi Saja yaitu 2%) dan min_conff sebesar 50% untuk menghasilkan kombinasi yang kuat antara faktor-faktor kecelakaan yang terjadi. Analisis dilakukan dengan menggunakan software R 3.3.0 dengan mengaktifkan library arules, gdate, arulviz. Hasil analisis selengkapnya dapat dilihat pada gambar 2. Berdasarkan batasan yang telah ditentukan, diketahui bahwa ada 322 aturan asosiasi yang terbentuk hingga 4 kali (k-4 itemset). Informasi yang diperolah adalah: 1. Setiap faktor kecelakaan dengan bentuk geometri yang lurus akan menghasilkan tingkat kecelakaan Ringan dengan nilai support 0.59=59% dengan confidence 0.67=67% dari seluruh total kecelakaan yang terjadi 2. Setiap faktor kecelakaan dengan kondisi cahaya yang terang/jelas akan menghasilkan tingkat kecelakaan Ringan dengan nilai support 0.52=52% dengan confidence 0.77=77% dari seluruh total kecelakaan yang terjadi 3. Setiap faktor kecelakaan dengan bentuk geometri yang lurus dan kondisi cahaya yang terang/jelas akan menghasilkan tingkat kecelakaan Ringan dengan nilai support 0.40=40% dengan confidence 0.78=78% dari seluruh total kecelakaan yang terjadi Gambar 2. Output Asosiasi faktor-faktor kecelakaan lalu lintas Berdasarkan gambar 3, diperoleh informasi bahwa Tingkat kecelakaan Ringan sangat sering terjadi di jalan dengan bentuk geometri yang lurus (ditandai dengan ukuran lingkaran kuning yang lebih besar dibandingankan dengan lingkaran kuning yang lain). Sementara itu, Tingkat kecelakaan Berat sangat jarang terjadi di Jalan Nasional, pada saat malam hari (ditandai dengan ukuran lingkaran kuning yang lebih kecil dibandingankan dengan lingkaran kuning yang lain), seperti tampak pada gambar 4. Gambar 3. Faktor-faktor Penyebab Kecelakaan Ringan
Gambar 4. Faktor-faktor Penyebab Kecelakaan berat V. KESIMPULAN Berdasarkan percobaan yang telah dilakukan, maka dapat disimpulkan sebagai berikut: 1. Implementasi Association rule menggunakan algoritma apriori dan Eclat untuk mengetahui tingkat kecelakaan lalu lintas menghasilkan aturan asosiasi atau Association rule dengan nilai support dan confidence yang telah ditentukan 2. Dengan pola kombinasi 4 iterasi/pengulangan (K 4-itemset) diketahui bahwa tingkat kecelakaan terbesar yaitu kecelakaan dengan tingkatan Ringan yaitu sebesar 638 kali kejadian atau 68% dari total kecelakaan lalu lintas yang terjadi di Kabupaten Pinrang UCAPAN TERIMA KASIH Ucapan terima kasih yang sebesar-besarnya saya berikan kepada pihak kepolisian Kabupaten Pinrang dan juga bapak/ibu dosen Program studi Teknik Komputer dan Jaringan Politeknik Negeri Ujung Pandang yang telah membantu penelitian ini. REFERENSI [1] Aritonang, Pathrecia. 2012. Implementasi Data Mining Dengan Association Rule Dalam Pengambilan Keputusan Untuk Korelasi Pembelian Produk Menggunakan Algoritma Apriori. Skripsi.Universitas Gadjah Mada [2] Dwina Kuswardani, M.Rahmat Widyanto, Indang Trihandini. 2011. Metode Association Rule Untuk Analisis Citra CT Organ Pasien Kanker Ovarium. Jurnal Ilmiah Kursor, pp. 1-10 [3]Faza, Sharfina. 2015. Pencarian Association Rules Pada Data Lulusan Mahasiswa Perguruan Tinggi Menggunakan Algoritma FP- Growth. Skripsi.Universitas Sumatera Utara [4] Harris Kurniawan, Fujiati, Alfa Saleh. 2014. Analisa Pola Data Penyakit Rumah Sakit Dengan Menerapkan Metode Association Rule Menggunakan Algoritma Apriori. Seminar Nasional Informatika 2014, pp. 1-7 [5] Huda, N.M. 2010. Aplikasi data mining untuk menampilkan informasi tingkat kelulusan mahasiswa. Skripsi. Universitas Diponegoro. [6] Hakim, Lukman & Fauzy, Akhmad. 2015. Penentuan Pola Hubungan Kecelakaan Lalu Lintas Menggunakan Metode Association Rule dengan Algoritma Apriori. University Research Colloquium 2015, pp. 1-9 [7] Manurung, Eva Cristy Yuliana. 2014. Analisis Perbandingan Algoritma Apriori dan Algoritma FP-Growth untuk Korelasi Pembelian Produk (Studi Kasus : Sumber Swalayan Medan). Skripsi.Universitas Indonesia [8] Ma ruf, F.A. 2013. Aplikasi data mining untuk mengetahui hubungan proses masuk dengan tingkat kelulusan mahasiswa (studi kasus: STMIK AMIKOM yogyakarta). Naskah Publikasi. Sekolah Tinggi Manajemen Informatika dan Komputer AMIKOM. [9] Sholichan, Alfiyatus. 2009. Data Mining Untuk Pembiayaan Murabahah Menggunakan Association Rule. Skripsi.Universitas Islam Negeri Maulana Malik Ibrahim Malang [10] Wikipedia.id. Kecelakaan lalu-lintas. https://id.wikipedia.org/wiki/kecelak aan_lalu-lintas (diakses 4 Juli 2015)