K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia

dokumen-dokumen yang mirip
BAB 2 TINJAUAN PUSTAKA Klasifikasi Data Mahasiswa Menggunakan Metode K-Means Untuk Menunjang Pemilihan Strategi Pemasaran

PENGELOMPOKKAN ANGKA PARTISIPASI PENDIDIKAN WAJIB BELAJAR SE-INDONESIA MENGGUNAKAN METODE FUZZY C-MEANS. Abstrak

Materi 1 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

Student Clustering Based on Academic Using K-Means Algoritms

1.2 Rumusan Masalah 1.3 Batasan Masalah 1.4 Tujuan Penelitian

DATA MINING. Pertemuan 1. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

DATA MINING ANALISA POLA PEMBELIAN PRODUK DENGAN MENGGUNAKAN METODE ALGORITMA APRIORI

PENERAPAN ALGORITMA K-MEANS PADA SISWA BARU SEKOLAHMENENGAH KEJURUAN UNTUK CLUSTERING JURUSAN

Data Mining dengan Algoritma Fuzzy C-Means Clustering Dalam Kasus Penjualan di PT Sepatu Bata

UKDW BAB I PENDAHULUAN Latar Belakang

CLUSTERING PENCAPAIAN KARAKTER SISWA MENGGUNAKAN ALGORITMA K-MEANS

Jurnal Aksara Komputer Terapan Politeknik Caltex Riau Vol. 2, No. 1, Tahun

2013 GAMBARAN PENGETAHUAN REMAJA TENTANG HIV/AIDS DI KELAS XI SMA YADIKA CICALENGKA

Abidah Elcholiqi, Beta Noranita, Indra Waspada

BAB 1 PENDAHULUAN 1.1 Latar Belakang Masalah

Clustering Terhadap Indeks Prestasi Mahasiswa STMIK Akakom Menggunakan K-Means

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 1 PENDAHULUAN. terhadap peran sistem informasi dalam perusahaan sebagai bagian dari produktivitas.

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI Tinjauan Pustaka Penelitian terkait metode clustering atau algoritma k-means pernah di

PENERAPAN METODE KLASTERING DENGAN ALGORITMA K-MEANS UNTUK PREDIKSI KELULUSAN MAHASISWA PADA PROGRAM STUDI TEKNIK INFORMATIKA STRATA SATU

KLASTERISASI KOMPETENSI GURU MENGGUNAKAN HASIL PENILAIAN PORTOFOLIO SERTIFIKASI GURU DENGAN METODE DATA MINING

BAB II TINJAUAN PUSTAKA

BAB 1 PENDAHULUAN 1.1. Latar Belakang

BAB 1 PENDAHULUAN Building A Data WareHouse for Decision Support Second Edition Data Mining : Concepts, Models, Methods, and Algorithms

BAB 1 PENDAHULUAN. Human Immunodeficiency Virus (HIV) dan Acquired Immune Deficiency

PENGELOMPOKAN MAHASISWA MENGGUNAKAN ALGORITMA K-MEANS

BAB I PENDAHULUAN I.1 Latar Belakang

TAKARIR. : Mengelompokkan suatu objek yang memiliki kesamaan. : Kelompok atau kelas

PENGKLASIFIKASIAN MINAT BELAJAR MAHASISWA DENGAN MODEL DATA MINING MENGGUNANAKAN METODE CLUSTERING

Data Mining Menggunakan Metode K-Means Klaster untuk Mengelompokkan Pemegang Polis Asuransi Kendaraan Bermotor di Indonesia

SEGMENTASI PRODUK MENGGUNAKAN TEKNIK DATA MINING CLUSTERING

BAB 3 METODE PENELITIAN. Jenis sumber data yang didapatkan peneliti adalah data primer dan data sekunder.

2. Tinjauan Pustaka. Gambar 2-1 : Knowledge discovery in database

PENERAPAN TEKNIK DATA MINING UNTUK MENENTUKAN HASIL SELEKSI MASUK SMAN 1 GIBEBER UNTUK SISWA BARU MENGGUNAKAN DECISION TREE

Oleh : Selvia Lorena Br Ginting, Reggy Pasya Trinanda. Abstrak

BAB I PENDAHULUAN. dapat menyebabkan AIDS (Acquired Immuno-Deficiency Syndrome). Virus. ibu kepada janin yang dikandungnya. HIV bersifat carrier dalam

ANALISIS KETERKAITAN DATA TRANSAKSI PENJUALAN BUKU MENGGUNAKAN ALGORITMA APRIORI DAN ALGORITMA CENTROID LINKAGE HIERARCHICAL METHOD (CLHM)

BAB I PENDAHULUAN. 1.1 Latar Belakang

IMPLEMENTASI METODE K-MEANS PADA PENERIMAAN SISWA BARU

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. menerapkan metode clustering dengan algoritma K-Means untuk penelitiannya.

PENERAPAN ALGORITMA PARTITIONING AROUND MEDOIDS (PAM) CLUSTERING UNTUK MELIHAT GAMBARAN UMUM KEMAMPUAN AKADEMIK MAHASISWA

Materi 2 DATA MINING 3 SKS Semester 6 S1 Sistem Informasi UNIKOM 2015 Nizar Rabbi Radliya

PENDAHULUAN TINJAUAN PUSTAKA

BAB II LANDASAN TEORI

PENGELOMPOKAN NASABAH BANK MENGGUNAKAN ALGORITMA K- MEANS UNTUK MEMBERIKAN PENAWARAN YANG TEPAT

BAB 1 PENDAHULUAN. Human Immunodeficiency Virus (HIV) adalah virus penyebab Acquired

BAB II LANDASAN TEORI. yang terdiri dari komponen-komponen atau sub sistem yang berorientasi untuk

DETEKSI MAHASISWA BERPRESTASI DAN BERMASALAH DENGAN METODE K- MEANS KLASTERING YANG DIOPTIMASI DENGAN ALGORITMA GENETIKA

PE DAHULUA. Latar Belakang

BAB I PENDAHULUAN. Human Immunodeficiency Virus (HIV) adalah virus yang awalnya

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

KLASIFIKASI SISWA UNTUK MENINGKATKAN NILAI RATA-RATA KELAS MENGGUNAKAN METODE DATA MINING

PENINGKATAN KINERJA ALGORITMA K-MEANS DENGAN FUNGSI KERNEL POLYNOMIAL UNTUK KLASTERISASI OBJEK DATA

MODEL DATA MINING DALAM PENGKLASIFIKASIAN KETERTARIKAN BELAJAR MAHASISWA MENGGUNAKAN METODE CLUSTERING

BAB 1 PENDAHULUAN. Dengan kemajuan teknologi informasi sekarang ini, kebutuhan akan

Jurnal Ilmiah Komputer dan Informatika (KOMPUTA) 45 Edisi... Volume..., Bulan 20.. ISSN :

MEMANFAATKAN ALGORITMA K-MEANS DALAM MENENTUKAN PEGAWAI YANG LAYAK MENGIKUTI ASESSMENT CENTER UNTUK CLUSTERING PROGRAM SDP

PENERAPAN DATAMINING PADA POPULASI DAGING AYAM RAS PEDAGING DI INDONESIA BERDASARKAN PROVINSI MENGGUNAKAN K-MEANS CLUSTERING

CLUSTERING K- MEANS ANALYSIS. (Studi Kasus : Koleksi Perpustakaan) Warnia Nengsih 1) 1)

Analisa Profil Data Mahasiswa Baru Universitas Stikubank (UNISBANK) Semarang Tahun Dengan Teknik Data Mining

BAB 2 LANDASAN TEORI. Pada bab ini akan dibahas tentang konsep dasar dan teori-teori pendukung yang berhubungan dengan sistem yang akan dibangun.

BAB II LANDASAN TEORI

BAB 1 PENDAHULUAN. kekebalan tubuh manusia, sedangkan Acquired Immunodeficiency Syndrom. penularan terjadi melalui hubungan seksual (Noviana, 2013).

BAB I PENDAHULUAN. menjadi prioritas dan menjadi isu global yaitu Infeksi HIV/AIDS.

PRISMA WAHYU WULAN DARA

BAB 2 TINJAUAN PUSTAKA DAN DASAR TEORI. yang akan diteliti. Pemanfaatan algoritma apriori sudah cukup banyak digunakan, antara lain

RENCANA PEMBELAJARAN SEMESTER (RPS)

BAB 1 PENDAHULUAN. Immunodeficiency Virus (HIV)/ Accuired Immune Deficiency Syndrome (AIDS)

IMPLEMENTASI K-MEANS KLUSTERING UNTUK REKOMENDASI TEMA TUGAS AKHIR PADA STMIK ASIA MALANG. Lia Farokhah 1), Rendy Aditya 2)

BAB II TINJAUAN PUSTAKA. pengetahuan di dalam database. Data mining adalah proses yang menggunakan

Penerapan Algoritma K-Means dalam Data Mining untuk Peminatan Jurusan Bagi Siswa Kelas X (Studi Kasus: SMA Negeri 29 Jakarta)

Penerapan Metode Clustering K- Means Untuk Mengukur Tingkat Kedisplinan Siswa Di SMK Perikanan Nusantara Demak

ALGORITMA NEAREST NEIGHBOR UNTUK MENENTUKAN AREA PEMASARAN PRODUK BATIK DI KOTA PEKALONGAN

BAB III METODOLOGI 3.1. Prosedur Penelitian Identifikasi Masalah

DATA MINING. Pertemuan 9. Nizar Rabbi Radliya 3 SKS Semester 6 S1 Sistem Informasi

BAB I PENDAHULUAN A. Latar Belakang

Kata kunci : metode pencarian, perpustakaan, Naïve Bayes Classifier.

LEARNING. Program Studi Ilmu Komputer FPMIPA UPI RNI IK460(Kecerdasan Buatan)

PENERAPAN DATA MINING UNTUK EVALUASI KINERJA AKADEMIK MAHASISWA MENGGUNAKAN ALGORITMA NAÏVE BAYES CLASSIFIER

BAB I PENDAHULUAN. Acquired Immune Deficiency Syndrom (AIDS) merupakan sekumpulan gejala

Bab 2 Tinjauan Pustaka

DATA MINING DENGAN TEKNIK CLUSTERING UNTUK MENGGALI INFORMASI TENTANG BIMBINGAN KONSELING SISWA (STUDI KASUS : SMA NEGERI 1 X KOTO SINGKARAK)

HIV/AIDS. Intan Silviana Mustikawati, SKM, MPH

BAB II LANDASAN TEORI

PERAN CERAMAH TERHADAP TINGKAT PENGETAHUAN TENTANG AIDS PADA SISWA KELAS XI SMK NEGERI 4 SURAKARTA SKRIPSI

BAB I PENDAHULUAN. AIDS adalah singkatan dari Acquired Immuno Deviciency Syndrome, yang

BAB 2 TINJAUAN PUSTAKA

DATAMINING Anief Rufiyanto.ST (Universitas Pandanaran)

HIV/AIDS (Human Immunodeficiency/Acquired Immune Deficiency. Syndrome) merupakan isu sensitive dibidang kesehatan. HIV juga menjadi isu

PENGANTAR SOLUSI DATA MINING

BAB II TINJAUAN PUSTAKA DAN DASAR TEORI. Pada penelitian Rismawan dan Kusumadewi (2008) mengelompokkan

DATA MINING DAN WAREHOUSE A N D R I

SISTEM REKOMENDASI KURIKULUM DENGAN METODE K-MEANS CLUSTERING

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

TEKNOSI, Vol. 02, No. 03, Desember Koko Handoko Universitas Putera Batam (cooresponding author)

BAB I PENDAHULUAN Latar Belakang Masalah

PENERAPAN ALGORITMA K-MEANS PADA KUALITAS GIZI BAYI DI INDONESIA

Klasterisasi Data Kesehatan Penduduk untuk Menentukan Rentang Derajat Kesehatan Daerah dengan Metode K-Means

BAB II TINJAUAN PUSTAKA

BAB 2 TINJAUAN PUSTAKA

Transkripsi:

K-Means Analysis Klasterisasi Kasus HIV/AIDS di Indonesia Okta Riveranda 1), Warnia Nengsih, S.Kom., M.Kom. 2) 1) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: okta12si@mahasiswa.pcr.ac.id 2) Program Studi Sistem Informasi, Politeknik Caltex Riau, Pekanbaru 28265, email: warnia@pcr.ac.id Abstrak Penggabungan Data mining dengan kemampuan dalam mengelola dan mengolah database, statistika dan kecerdasan buatan telah banyak diterapkan dalam berbagai bidang. Penerapannya beragam, tergantung pada bagaimana data itu didistribusikan dan dimanfaatkan. Ada yang diterapkan di bidang kemiliteran, pendidikan, kesehatan, keuangan dan masih banyak lagi lainnya. Tujuan utama dari penelitian ini ialah untuk menganalisis jumlah kasus HIV/AIDS yang ada di Indonesia dengan penyebaran di 33 provinsi. Data yang dijadikan sumber berasal dari Ditjen PP & PL Kemenkes RI. Analisis didukung dengan teknik clustering dengan pemilihan algoritma k-means dalam mengidentifikasi similaritas antar data. Jumlah kluster yang ditentukan dalam implementasi algoritma k-means adalah 3 kluster. Masing-masing kluster memiliki nilai rata-rata yang berbeda. Masing-masing kluster menunjukkan label tingkat kerawanan terjadinya HIV di provinsi-provinsi di Indonesia. Data dengan bar terendah mewakili kluster 1. Memiliki karakteristik data dengan anggota-anggota data yang jumlah kasus HIV-nya sedang mewakili kluster 2. Sementara bar tertinggi mewakili kluster 3 yang karakteristik datanya menunjukkan jumlah kasus HIV terbesar Kata Kunci : Clustering, Data Mining, HIV/AIDS, Kesehatan, k-means. 1. PENDAHULUAN HIV/AIDS atau human immunodeficiency virus/aquired immune deficiency syndrome adalah suatu spektrum kondisi yang disebabkan oleh infeksi virus HIV. Diawali dengan adanya infeksi tersebut, seseorang yang terkena virus ini akan mengalami sakit seperti influenza. Hal tersebut biasanya diikuti dengan tanpa gejala yang cukup berkepanjangan. Indonesia merupakan salah satu negara yang memiliki potensi kenaikan jumlah kasus HIV/AIDS tiap tahunnya. Hal itu dapat dilihat dari data yang diperoleh dari tahun 1987-2014 untuk AIDS dan dari tahun 2005-2014 untuk HIV. Kenaikan signifikan terjadi di hampir seluruh provinsi yang ada di Indonesia. Bukan hanya itu, kasus penderita yang meninggal akibat AIDS juga menjadi faktor penentu kenaikan potensi tersebut. Apabila pemerintah tidak menanggulangi kejadian ini, dikhawatirkan ke depannya Indonesia akan menjadi salah satu negara penyumbang terbesar penderita HIV/AIDS. Data mining merupakan suatu disiplin ilmu dalam ilmu komputer yang digunakan untuk tujuan menggali informasi tersembunyi dari sekumpulan data set untuk kemudian digunakan dalam pengambilan keputusan maupun kebijakan yang berguna dalam bidang-bidang tertentu. Merujuk kepada kasus HIV/AIDS yang ada di Indonesia, dan dengan tersedianya data mentah yang dapat diolah, penelitian ini dapat dikembangkan untuk membantu pemerintah dalam melihat daerah atau provinsi dengan potensi HIV/AIDS terburuk. Oleh karena itu, dengan menggunakan metode clustering K-Means, diperoleh gambaran dari setiap wilayah di Indonesia untuk pengambilan kebijakan dan strategi berikutnya.. 2.1 Data Mining 2. LANDASAN TEORI Data mining adalah disiplin ilmu yang membahas mengenai proses penggalian informasi, pengetahuan dan/atau pola menarik dari sekumpulan data yang berukuran sangat besar. Data tersebut tersimpan di dalam beberapa database, sebuah data warehouse, ataupun media penyimpanan data lainnya. Disiplin ilmu ini merupakan irisan dari beberapa disipilin ilmu yang sudah lebih dulu ada seperti, kemampuan pengelolaan database, statistika, matematika, visualisasi data, machine learning dan artificial intelligence (Han dan Kamber, 2006) [1]. Terlepas dari definisi-definisi data mining di atas, masih banyak peneliti yang memperdebatkan penamaan yang cocok untuk aktifitas ini. Karena, jika dianalogikan ke dalam contoh aktifitas penggalian dalam kehidupan nyata seperti penggalian emas, istilah data mining dirasa kurang tepat. Emas merupakan hasil yang diinginkan atau yang ingin dicapai dari sekumpulan aktifitas penggalian emas. Untuk mencapainya, diperlukan usaha yang besar untuk menggali bebatuan yang ada di sekitarnya. Aktifitas ini tidak disebut dengan rock mining ataupun sand mining, namun tetap disebut sebagai gold mining. Karena pada dasarnya, emas lah yang menjadi capaian akhir dari aktifitas tersebut. Oleh karena itu, beberapa peneliti memberikan nama lain untuk data mining sebagai

ganti untuk istilah yang menurut mereka kurang tepat tersebut, diantara lain, ada yang menyebut dengan Knowledge Discovery in Data (KDD), knowledge mining, knowledge extraction, dan data/pattern analysis (Han dan Kamber, 2006) [2]. 2.2 Clustering Clustering atau juga dikenal dengan istilah cluster analysis adalah salah satu metode atau teknik dalam data mining yang tepat digunakan untuk mengolah data yang tidak diketahui label atau kelasnya. Cara kerja teknik ini ialah mengelompokkan sekumpulan data ke dalam kelas-kelas atau kluster-kluster, yang mana objek-objek yang ada pada kelas tersebut memiliki similaritas yang tinggi jika dibandingkan dengan objek lain yang ada dalam kelas tersebut, namun memiliki similaritas yang rendah jika dibandingkan dengan objek yang ada di kelas/kluster lain (Han dan Kamber, 2006) [3]. Dalam sekelompok data, akan ada beberapa objek data yang ditempatkan ke dalam kluster yang sama berdasarkan sifat dan karakteristik data tersebut. Namun, dalam kasus tertentu, akan ada suatu objek data yang memiliki karakteristik dan sifat yang sangat berlainan dengan data lain, dan biasanya, data ini ditempatkan ke dalam kluster tersendiri. Jumlah anggota kluster yang menempati kluster itu biasanya sangat sedikit jika dibandingkan dengan rasio jumlah data yang ada. Data tersebut dikenal dengan istilah data anomali atau outlier. Salah satu keunggulan teknik clustering ialah dapat mendeteksi data outlier (outlier detection) karena tidak adanya label/kelas ketika data ini pertama kali diolah (Han dan Kamber, 2006) [4]. Dapat ditarik kesimpulan bahwa, semakin rendah nilai distance antar objek data, maka akan semakin tinggi similaritasnya [5]. 2.4 K-means Algoritma k-means menggunakan masukan berupa parameter, jumlah k, dan sekumpulan data set dari sekian objek untuk dimasukkan ke dalam k kelas/kluster sehingga similaritas intrakluster semakin tinggi sedangkan similaritas antarkluster semakin rendah. Similaritas kluster diukur berdasarkan nilai rata-rata dari keseluruhan objek yang ada di kluster tersebut, yang bisa dipandang sebagai pusat kluster. Cara kerja k-means adalah sebagai berikut. Pertama, algoritma ini akan memilih sejumlah k objek dari beberapa objek yang ada pada sekumpulan data. Masing-masing objek yang terpilih, merepresentasikan nilai rata-rata dari sejumlah k kluster. Kemudian objek yang tersisa, masing-masing akan di-assign ke dalam kluster yang sudah ditentukan berdasarkan similaritasnya dengan nilai rata-rata masingmasing kluster. Setelah itu, dilakukan perubahan nilai rata-rata kluster yang sudah menjadi beberapa anggota kluster. Ketiga langkah di atas dilakukan secara iteratif (berulang) hingga tidak ada lagi perubahan nilai rata-rata dan seluruh data sudah didistribusikan ke masing-masing kluster yang ada [6]. 2.3 Euclidean Distance Euclidean Distance merupakan algoritma pengukur interval jarak antara satu data dengan data yang lain. Selain algoritma ini, juga ada algoritma Manhattan Block yang juga memiliki fungsi yang sama. Namun, algoritma k-means yang digunakan dalam penelitian ini menggunakan euclidean distance untuk mengukur similaritas antar data. Formulanya dapat didefinisikan sebagai berikut: d(i, j) = (x i1 x j1 ) 2 + (x i2 x j2 ) 2 +... +(x ix x jx ) 2... (2.1) Keterangan: Gambar 1 Hasil analisis kluster dengan algoritma k-means 3. METODE PENELITIAN 3.1. Pemilihan Atribut Pemilihan atribut dilakukan agar dalam analisis kluster hanya atribut yang memiliki nilai keterkaitan paling tinggi sajalah yang akan diproses. Atribut-atribut yang dianggap tidak mewakili objek data tidak akan digunakan dalam proses analisis. Berikut ini adalah gambar yang diambil dari rapidminer ketika melakukan pemilihan atribut. d: Distance/jarak antara objek i ke objek j. x i: variabel objek i. x j: variabel objek j.

4. HASIL DAN PEMBAHASAN Gambar 2 Pemilihan Atribut Atribut-atribut yang dipilih sebagai predictor variable adalah sebagai berikut: Kasus pada tahun 1987-2009, 2010, 2011, 2012, 2013, 2014 dan jumlah korban meninggal. Sementara provinsi hanya digunakan sebagai kolom ID.Sumber data terdiri dari beberapa sheet, namun hanya digunakan 2 sheet saja sebagai data mentah untuk diolah. Kasus untuk HIV-AIDS dipisahkan untuk masing-masing sheet. Untuk kasus AIDS, datanya terdiri dari tahun 1987 hingga 2014, sementara untuk kasus HIV, dari tahun 2005 hingga 2014. Keduanya menggunakan provinsi-provinsi di Indonesia sebagai objek data. Jumlah kluster yang ditentukan dalam implementasi algoritma k-means adalah 3 kluster. Masing-masing kluster memiliki nilai rata-rata yang berbeda. Sebagai langkah identifikasi awal, apabila diamati masing-masing kluster, maka peneliti bisa mengasumsikan masing-masing kluster itu sebagai label tingkat kerawanan terjadinya HIV di provinsiprovinsi di Indonesia. Data dengan bar terendah mewakili kluster 1. Memiliki karakteristik data dengan anggota-anggota data yang jumlah kasus HIV-nya sedang. Data dengan bar menengah mewakili kluster 2. Karakteristiknya, jumlah kasus pada tiap anggota kluster adalah yang terendah di antara yang lain. Sementara bar tertinggi mewakili kluster 3 yang karakteristik datanya menunjukkan jumlah kasus HIV terbesar. Berikut ini adalah grafik dari hasil perhitungan manual k-means dengan aplikasi pengolah angka LibreOffice Calc 4.4. 3.2. Implementasi algoritma k-means Gambar di bawah ini menampilkan informasi dan opsi yang diatur sedemikian rupa untuk memproses data yang sudah dibersihkan pada tahap preprocessing. Gambar 4 Grafik hasil analisis kluster manual pada kasus HIV Untuk menghasilkan grafik di atas, dibutuhkan iterasi manual algoritma k-means sebanyak 4 kali sehingga tiap data secara konsisten berada pada masing-masing klusternya. Sementara itu, hasil dari analisis kluster dengan k-means menggunakan aplikasi RapidMiner v5.3 adalah sebagai berikut: Gambar 3 Implementasi algoritma k- means Opsi add cluster atribut secara default sudah terpilih sejak pengambilan operator k-means ke dalam bagan proses. Sementara opsi add as label digunakan apabila ingin menjadikan kluster tersebut sebagai label bagi proses selanjutnya. Kolom k pada gambar di atas merepresentasikan jumlah kluster yang objek-objek data akan didistribusikan ke dalamnya. Kolom max runs adalah jumlah iterasi maksimal yang boleh dilakukan dalam proses analisis kluster.

Gambar 7 Grafik hasil analisis kluster kasus AIDS dengan aplikasi RapidMiner Gambar 5 Grafik hasil analisis kluster kasus HIV dengan aplikasi RapidMiner Grafik di atas menunjukkan bahwa jumlah dan sebaran data untuk masing-masing kluster adalah sama dengan hasil analisis kluster manual yang dilakukan pada aplikasi pengolah angka. Provinsi DKI Jakarta, Jawa Timur dan Papua sama-sama berada pada kluster dengan ciri jumlah kasus HIV terbanyak di Indonesia. Begitu pula provinsiprovinsi yang menjadi anggota kluster dengan jumlah kasus terendah dan sedang. Sementara itu, hasil perhitungan manual k-means pada kasus AIDS di Indonesia dapat dilihat pada grafik di bawah ini. Gambar 6 Grafik hasil analisis kluster manual pada kasus AIDS Data dengan bar terendah adalah provinsi-provinsi yang memiliki jumlah kasus AIDS terendah. Lalu, data dengan bar sedang adalah provinsi-provinsi dengan jumlah kasus AIDS tertinggi. Terakhir, data dengan bar tertinggi adalah provinsi-provinsi dengan jumlah kasus AIDS menengah. Untuk menghasilkan grafik seperti di atas, diperlukan proses k-means manual sebanyak 3 kali iterasi. Berbeda halnya dengan hasil yang didapatkan dari analisis kluster dengan aplikasi RapidMiner pada kasus AIDS, pada grafik di bawah ini, hanya kluster dengan jumlah kasus tertinggi saja lah yang anggotanya konsisten dengan grafik dari hasil manual. Provinsi DKI Jakarta, Jawa Timur dan Papua berada pada kluster dengan jumlah kasus terbanyak di antara provinsi lain. Sementara untuk kluster lain, ada beberapa anggota kluster yang tidak konsisten dengan keanggotaannya. Berikut tabel yang menunjukkan perbedaan antara hasil manual dengan RapidMiner: Tabel 1 Perbandingan hasil manual terhadap RapidMiner pada kasus AIDS Manual RapidMiner Cluster 'Ringan' - Papua Barat - Sulawesi Selatan - Sumatera Utara N/A Cluster 'Menengah' N/A - Papua Barat - Sulawesi Selatan - Sumatera Utara Cluster 'Terbanyak' N/A N/A Berdasarkan tabel di atas, dapat diambil diketahui bahwa, pada kluster dengan kasus AIDS paling ringan, hasil manual berlebih 3 objek data, yang mana objek-objek data tersebut justru berada di kluster menengah pada hasil dengan RapidMiner. 5. KESIMPULAN Berdasarkan hasil analisis kluster pada data kasus HIV dan AIDS yang ada di Indonesia, dapat ditarik kesimpulan bahwa provinsi DKI Jakarta, Jawa Timur dan Papua berada dalam kondisi yang sangat kritis dan sangat rentan akan penyebaran virus HIV/AIDS. Hal itu dikarenakan jumlah kasus HIV dan AIDS terbanyak ada pada ketiga provinsi tersebut. Untuk itu, kampanye dan kebijakan pemerintah dapat difokuskan secara langsung kepada ketiga provinsi itu.

DAFTAR REFERENSI [1] Han, Jiawei; Kamber, Micheline, Data Mining: Concepts and San Fransisco. Hal. 5-6. [2] Han, Jiawei; Kamber, Micheline, Data Mining: Concepts and San Fransisco. Hal. 6-7. [3] Han, Jiawei; Kamber, Micheline, Data Mining: Concepts and San Fransisco. Hal 383. [4] Han, Jiawei; Kamber, Micheline, Data Mining: Concepts and San Fransisco. Hal. 384. [5] Han, Jiawei; Kamber, Micheline, Data Mining: Concepts and San Fransisco. Hal. 388-389. [6] Han, Jiawei; Kamber, Micheline, Data Mining: Concepts and San Fransisco. Hal. 402-403. [7] Ditjen PP & PL Kemenkes RI