ANALISIS PERBANDINGAN ALGORITMA C.45, RANDOM FOREST DENGAN CHAID DECISION TREE UNTUK KLASIFIKASI TINGKAT KECEMASAN IBU HAMIL

dokumen-dokumen yang mirip
BAB III METODE CHI-SQUARED AUTOMATIC INTERACTION DETECTION

KLASIFIKASI TINGKAT PENGETAHUAN IBU DALAM PEMBERIAN ASI EKSLUSIF DENGAN METODE DECISION TREE

BAB II LANDASAN TEORI

Klasifikasi Variabel Penentu Kelulusan Mahasiswa FMIPA Unpatti Menggunakan Metode CHAID

ANALISIS WAKTU KELULUSAN MAHASISWA DENGAN METODE CHAID (STUDI KASUS: FMIPA UNIVERSITAS UDAYANA)

Universitas Putra Indonesia YPTK Padang Fakultas Ilmu Komputer Program Studi Teknik Informatika. Classification Decision Tree

PENERAPAN K-MEANS CLUSTER UNTUK PENGARUH KECERDASAN EMOSI DAN STRES TERHADAP PRESTASI BELAJAR MAHASISWA

BAB II LANDASAN TEORI

Penerapan Algoritme C4.5 Pada Klasifikasi Produksi Ubi Jalar di Pulau Jawa

PENERAPAN DECISION TREE UNTUK PENENTUAN POLA DATA PENERIMAAN MAHASISWA BARU

POHON KEPUTUSAN DENGAN ALGORITMA C4.5

Model Data Mining sebagai Prediksi Penyakit Hipertensi Kehamilan dengan Teknik Decision Tree

BAB IV HASIL PENELITIAN DAN PEMBAHASAN

DATA MINING KLASIFIKASI BERBASIS DECISION TREE. Ramadhan Rakhmat Sani, M.Kom

Model Penentuan Potensi Status Gizi Bermasalah Menggunakan Decision Tree

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

Implementasi Metode Chi-Squared Automatic Interaction Detection pada Klasifikasi Indeks Prestasi Kumulatif Mahasiswa FMIPA UNIROW

PENERAPAN METODE CHAID (CHI-SQUARED AUTOMATIC INTERACTION DETECTION) DAN EXHAUSTIVE CHAID PADA KLASIFIKASI PRODUKSI JAGUNG DI PULAU JAWA

Jurnal EKSPONENSIAL Volume 8, Nomor 2, Nopember 2017 ISSN

BAB III LANDASAN TEORI

BAB II TINJAUAN PUSTAKA

IMPLEMENTASI ALGORITMA C4.5 UNTUK KLASIFIKASI BIDANG KERJA ALUMNI DI STMIK LPKIA BANDUNG

Versi Online tersedia di : JURNAL TECH-E (Online)

Penerapan Algoritma C4.5 Untuk Menentukan Kesesuaian Lensa Kontak dengan Mata Pasien

BAB II TINJAUAN PUSTAKA. konsep-konsep dasar pada QUEST dan CHAID, algoritma QUEST, algoritma

IDENTIFIKASI MAHASISWA YANG MEMPUNYAI KECENDERUNGAN LULUS TIDAK TEPAT WAKTU PADA PROGRAM STUDI MMT-ITS DENGAN MENGGUNAKAN ALGORITMA C4.

JURNAL IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK MEMPREDIKSI PRESTASI SISWA

BAB III METODE PENELITIAN

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

Faktor-Faktor Yang Mem pengaruhi Waktu Penyusunan Tugas Akhir Mahasiswa S1 (Studi Kasus : Mahasiswa FMIPA Unsyiah)

BAB III METODE CHAID EXHAUSTIVE

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

PENERAPAN ALGORITMA C5.0 DALAM PENGKLASIFIKASIAN DATA MAHASISWA UNIVERSITAS NEGERI GORONTALO

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (STUDI KASUS : HOCKEY KABUPATEN KENDAL)

ISSN: JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman Online di:

LEARNING ARTIFICIAL INTELLIGENT. Dr. Muljono, S.Si, M. Kom

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

BAB III METODOLOGI PENELITIAN

Decision Tree Learning Untuk Penentuan Jalur Kelulusan Mahasiswa

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

PENENTUAN PENERIMAAN SISWA BARU MENGGUNAKAN DECISION TREE

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

Penggunaan Pohon Keputusan untuk Data Mining

PERSIAPAN PERSALINAN IBU HAMIL DITINJAU DARI JUMLAH PERSALINAN DAN JUMLAH KUNJUNGAN KEHAMILAN

BAB 1 PENDAHULUAN. merupakan proses pengeluaran atau proses untuk mendorong hasil dari

PENERAPAN DATA MINING UNTUK KLASIFIKASI PREDIKSI PENYAKIT ISPA (Infeksi Saluran Pernapasan Akut) DENGAN ALGORITMA DECISION TREE (ID3)

HASIL DAN PEMBAHASAN. Setiap tahapan di dalam penelitian ini akan ditunjukkan di dalam Tabel 2.

BAB 2 LANDASAN TEORI

Perancangan Pemilihan ISP Dengan Algoritma C 4.5 Studi Kasus STMIK STIKOM BALI

IMPLEMENTASI DATA MINING PADA PENENTUAN JUMLAH SKS MENGGUNAKAN DECISION TREE

HUBUNGAN KETUBAN PECAH DINI DENGAN KEJADIAN ASFIKSIA PADA BAYI BARU LAHIR DI RSUD DR. H. MOCH. ANSHARI SALEH BANJARMASIN TAHUN 2014

DIAGNOSA KETERLAMBATAN PERKEMBANGAN PADA ANAK BALITA DENGAN ACUAN DENVER II DAN PENGAMBIL KEPUTUSAN DENGAN METODE DECISION TREE BERBASIS JSP

KLASIFIKASI KARAKTERISTIK MAHASISWA UNIVERSITAS COKROAMINOTO PALOPO MENGGUNAKAN METODE NAÏVE BAYES DAN DECISION TREE. Yuli Hastuti

ANALISIS DAYA TAHAN MAHASISWA DALAM MELANJUTKAN STUDI DENGAN CHI-SQUARED AUTOMATATIC INTERACTION DETECTION

PENERAPAN METODE POHON KEPUTUSAN DENGAN ALGORITME ITERATIVE DYCHOTOMISER 3 (ID3) PADA DATA PRODUKSI JAGUNG DI PULAU JAWA

Analisa Data Mining Menggunakan Metode Bayes Untuk Mengukur Tingkat Kerusakan Mesin Motor (Studi Kasus Pada AHASS Astra Motor Kudus)

Penerapan Fungsi Data Mining Klasifikasi untuk Prediksi Masa Studi Mahasiswa Tepat Waktu pada Sistem Informasi Akademik Perguruan Tinggi

BAB II KAJIAN PUSTAKA DAN KERANGKA PEMIKIRAN

KLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE CHAID (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN CART (CLASSIFICATION AND REGRESSION TREE)

PREDIKSI CALON MAHASISWA BARU MENGUNAKAN METODE KLASIFIKASI DECISION TREE

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

KLASIFIKASI PENENTUAN TIM UTAMA OLAHRAGA HOCKEY MENGGUNAKAN ALGORITMA C4.5 (Study Kasus : Hockey Kabupaten Kendal)

JURNAL IMPLEMENTASI ALGORITMA C4.5 DALAM PENENTUAN JURUSAN DI SMK PEMUDA PAPAR KEDIRI

Amalia Maharani, Dewi Retno Sari Saputro, dan Bowo Winarno Program Studi Matematika FMIPA UNS

KLASIFIKASI FAKTOR PENENTU WANITA BERPOTENSI DIABETES MENGGUNAKAN DECISION TREE CHAID

Perbandingan 5 Algoritma Data Mining untuk Klasifikasi Data Peserta Didik

PENERAPAN DECISION TREEALGORITMA C4.5 DALAM PENGAMBILAN KEPUTUSAN HUNIAN TEMPAT TINGGAL

: tingkat pengetahuan, kecemasan PENDAHULUAN

HUBUNGAN PELAKSANAAN ASUHAN SAYANG IBU DENGAN KECEMASAN PROSES PERSALINAN DI BPM HESTI UTAMI DESA GRANTUNG KECAMATAN BAYAN KABUPATEN PURWOREJO

PERANCANGAN APLIKASI PEMILIHAN MITRA KERJA

IMPLEMENTASI DATA MINING DALAM PENERIMAAN KARYAWAN BARU DENGAN METODE DECISION TREE DI BENDESA HOTEL

TRIMESTER III DI PUSKESMAS TEGALREJO YOGYAKARTA

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

Nina Milana 1 dan Abadyo 2 Universitas Negeri Malang

BAB IV HASIL DAN PEMBAHASAN. dan fakor-faktor penyebab masalah tersebut bisa terjadi diantaranya. dimanfaatkan dan dikelola dengan baik.

FAKTOR-FAKTOR YANG MEMPENGARUHI KEJADIAN PARTUS LAMA DI RUANG KEBIDANAN RSUD IBNU SUTOWO BATURAJA TAHUN 2015

Volume 4 No. 1, Maret 2013 ISSN : HUBUNGAN TINGKAT KECEMASAN IBU HAMIL DENGAN KESEHATAN JANIN TRIMESTER II DI RSIA KUMALA SIWI JEPARA

Jurnal Keperawatan, Volume X, No. 1, April 2014 ISSN DUKUNGAN KELUARGA TERHADAP KELANCARAN PROSES PERSALINAN DI BPS MUKSININ

BAB I PENDAHULUAN. dan dapat melahirkan bayi dengan selamat. Ada dua cara persalinan yaitu

PROGRAM BANTU PEMILIHAN PAKAIAN DAN BAHAN BATIK BAGI KONSUMEN DENGAN PENDEKATAN DECISION TREE Studi Kasus : Toko InBATIK

PEMBENTUKAN DECISION TREE DATA LAMA STUDI MAHASISWA MENGGUNAKAN ALGORITMA NBTREE DAN C4.5

Analisis Algoritma Decision Tree untuk Prediksi Mahasiswa Non Aktif

PROGRAM BANTU SELEKSI AWAL DOSEN BERPRESTASI MENGGUNAKAN METODE ITERATIVE DICHOTOMISER 3

PENENTUAN PENERIMA BEASISWA PENINGKATAN PRESTASI AKADEMIK DENGAN ALGORITME C5.0

BAB IV HASIL DAN PEMBAHASAN. Data yang digunakan dalam penelitian ini adalah data warehouse

IMPLEMENTASI DATA MINING DENGAN ALGORITMA C4.5 UNTUK PENJURUSAN SISWA (STUDI KASUS: SMA NEGERI 1 PONTIANAK)

DECISION TREE BERBASIS ALGORITMA UNTUK PENGAMBILAN KEPUTUSAN

BAB II TINJAUAN PUSTAKA Indeks Prestasi Kumulatif dan Lama Studi. menggunakan dokumen/format resmi hasil penilaian studi mahasiswa yang sudah

BAB II TINJAUAN PUSTAKA

METODE QUEST DAN CHAID PADA KLASIFIKASI KARAKTERISTIK NASABAH KREDIT

IMPLEMENTASI ALGORITMA FUZZY SEBAGAI PENGGALIAN INFORMASI KETERLAMBATAN KELULUSAN TUGAS AKHIR MAHASISWA DENGAN METODE DECISION TREE

CLUSTERING UNTUK DATA KOMPETENSI WIDYAISWARA MENGGUNAKAN ALGORITMA KMEANS

PEMBENTUKAN POHON KLASIFIKASI DENGAN METODE CHAID

BAB I PENDAHULUAN 1.1.Latar Belakang Masalah

BAB 3 ALGORITMA C4.5. Algoritma C4.5 merupakan algoritma yang digunakan untuk membentuk pohon keputusan.

Jurnal Keperawatan, Volume IX, No. 2, Oktober 2013 ISSN HUBUNGAN USIA IBU DENGAN KOMPLIKASI KEHAMILAN PADA PRIMIGRAVIDA

Penerapan Data Mining dalam Memprediksi Pembelian cat

ANALISIS KEPUASAN PESERTA KURSUS KOMPUTER MENGGUNAKAN METODE CHAID BERBASIS KOMPUTER

Transkripsi:

ANALISIS PERBANDINGAN ALGORITMA C.45, RANDOM FOREST DENGAN CHAID DECISION TREE UNTUK KLASIFIKASI TINGKAT KECEMASAN IBU HAMIL Mambang 1), Agus Byna 2) 1,), STIKES SARI MULIA Banjarmasin 2) AKBID SARI MULIA Banjarmasin Jln. Pramuka No. 02 Banjarmasin, 70123 Email : mbgche@yahoo.co.id 1) Abstrak Kecemasan dalam menghadapi proses persalinan pada ibu hamil menjelang persalinan dapat mempengaruhi proses persalinan tersebut, banyak faktor yang membuat ibu hamil merasa cemas, faktor-faktor yang mempengaruhi kecemasan ibu hamil dalam menghadapi persalinan tersebut dapat diketahui dari tingkatannya. Tingkat kecemasan dalam menghadapi persalinan dapat di klasifikasi menggunakan pohon keputusan. Pohon keputusan merupakan metode klasifikasi dan prediksi yang berguna untuk mengeksplorasi data untuk menemukan hubungan tersembunyi antar atribut data. Pada penelitian ini metode yang diusulkan untuk klasifikasi tingkat kecemasan ibu hamil adalah dengan metode Decision Tree dengan membandingkan kinerja algoritma C4.5, (Random Forest) dengan CHAID. Algoritma tersebut tersebut nantinya akan dibandingkan untuk klasifikasi error dan tingkat akurasinya. Hasil akurasi yang didapatkan menggunakan algoritma pohon keputusan C4.5, dengan CHAID yang menggunakan pruning=3 menghasilkan akurasi yang lebih baik yaitu berada pada ngaka 64% dan 62,67%, sedangkan yang menggunakan pre pruning menghasilkan akurasi lebih rendah. Kata kunci: Kecemasan, persalinan, pohon, keputusan 1. Pendahuluan Tingkat kecemasan setiap individu berbeda-beda, begitu juga dengan kecemasan yang dialami oleh ibu hamil menjelang persalinan. Tidak mudah bagi setiap ibu hamil dalam melewati proses persalinan, setiap proses persalinan yang dilalui dapat berbeda-beda yang dirasakan oleh para perempuan bahkan yang sudah pernah melahirkan lebih dari sekali. Pembicaraan di masyarakat juga berperan dalam menimbulkan rasa cemas yang dialami perempuan hamil, walaupun secara alamiah perasaan cemas merupakan proses alamiah yang terjadi pada setiap perempuan yang akan melewati proses persalinan. Perasaan cemas tersebut merupakan reaksi normal terhadap situasi yang sangat menekan kehidupan seseorang, dan karena itu berlangsung tidak lama. Penting sekali untuk mengingat bahwa kecemasan bisa muncul sendiri atau bergabung dengan gejala-gejala lain dari berbagai gangguan emosi[1]. Faktor-faktor penting dalam persalinan adalah: power seperti HIS, kontraksi otot dinding perut, kontraksi diagragma pelvis atau kekuatan mengejan, ketegangan dan kontraksi ligamentum; Pasanger antara lain seperti janin dan plasenta; Pasage yakni jalan lahir lunak dan jalan lahir tulang; serta psikis ibu bersalin[2]. Dukungan suami dan anggota keluarga yang lain untuk mendampingi ibu selama bersalin dan kelahiran sangat mempengaruhi psikis ibu bersalin. Dengan menghargai keinginan ibu untuk didampingi dapat membantu kenyamanan ibu. Menurut Stuart [3] Kecemasan atau ansietas adalah kekhawatiran yang tidak jelas dan menyebar, yang berkaitan dengan perasaan tidak pasti dan tidak berdaya. Keadaan emosi ini tidak memiliki objek spesifik. Ansietas dialami secara subjektif dan dikomunikasikan secara interpersonal. Kecemasan yang dialami ibu hamil menjelang persalinan juga berkaitan dengan gangguan non organik, beberapa diantaranya penyakit dan komplikasi tidak semata-mata ditimbulkan oleh gangguan organik namun dapat ditimbulkan atau diperberat oleh gangguan psikologik. Latar belakang timbulnya penyakit dan komplikasi dapat dijumpai dalam berbagai tingkat ketidakmatangan dalam perkembangan emosional dan psikoseksual dalam rangka kesanggupan seseorang dalam menyesuaikan diri dengan situasi tertentu yang sedang dihadapi, dalam hal ini khususnya kehamilan, persalinan dan nifas[2]. Metode klasifikasi Machine Learning telah lama digunakan di bidang data mining dan banyak bidang lain dari ilmu komputer. Sebagai algoritma klasifikasi yang melibatkan metode dari statistik, kecerdasan buatan dan manajemen database, juga dapat di kategorikan sebagai kunci elemen dalam interpretasi data dan visualisasi data[4]. Decision tree atau pohon keputusan merupakan metode klasifikasi dan prediksi yang sangat kuat dan terkenal, selain itu juga berguna untuk mengeksplor data dan menemukan hubungan yang tersembunyi[5]. Metode decion tree memiliki beberapa algoritma yang berbeda 2.1-103

cara perhitunganya untuk membuat suatu pohon keputusan. Random forest merupakan klasifikasi yang terdiri dari beberapa pohon keputusan. Setiap pohon keputusan dibangun dengan menggunakan vektor acak. Pendekatan umum yang digunakan untuk menyisipkan vektor acak dalam pembentukan pohon[6]. CHAID (Chi- Squared Automatic Interaction Detector)[7] adalah metode klasifikasi yang digunakan untuk menemukan hubungan antara variabel menggunakan chi-square berbasis kriteria untuk menentukan perpecahan multilevel. Manfaat penggunaan CHAID adalah bahwa secara visual lebih ekspresif dan lebih mudah ditafsirkan dibandingkan dengan jenis lain dari pengklasifikasi. Dalam penelitian ini model klasifikasi yang digunakan untuk menentukan apakah umur, tingkat pendidikan, pekerjaan dan paritas ibu hamil berpengaruh dengan kecemasan dan membentuk kategori tingkat kecemasan dari ibu hamil. Tujuan dari penelitian ini yaitu untuk menerapkan metode klasifikasi pohon keputusan dengan mengklasifikasi tingkat kecemasan ibu hamil berdasarkan umur, tingkat pendidikan, pekerjaan dan paritas dari ibu hamil. Sehingga dapat membantu meningkatkan hasil akurasi pada proses klasifikasi sehingga memperoleh klasifikasi tingkat kecemasan ibu hamil menjadi 3 kategori, yaitu kecemasan berat, kecemasan sedang dan kecemasan ringan. Dataset yang digunakan dalam penelitian ini merupakan data kesehatan pada Puskesmas Gambut, untuk menentukan tingkat kecemasan ibu hamil di daerah Gambut, yaitu salah satu kecamatan dari kabupaten Banjar provinsi Kalimantan Selatan. Pengklasifikasian tersebut dilakukan berdasarkan data yang diperoleh dari tenaga kesehatan yaitu salah satu Bidan Desa Puskesmas Gambut. 2. Pembahasan 2.1 Pengumpulan dan pengolahan data awal Penelitian ini dilakukan di di Wilayah Kerja Puskesmas Gambut, hal ini berhubungan dengan Luas Wilayah : 160 KM2. Topografi : berada di ketinggian ± 0,375 meter dari permukaan laut, dengan keadaan tanah berbentuk rawa dataran rendah. Pengolahan awal data yang mengidentifikasi kecemasan ibu hamil menjelang persalinan diwilayah kerja Puskesmas Gambut berdasarkan penelitian tentang kecemasan ibu hamil diketahui beberapa faktor pada kecemasan ibu hamil menjelang persalinan, yaitu: a. Umur ibu hamil Usia seorang wanita pada saat hamil sebaiknya tidak terlalu muda dan tidak terlalu tua. Umur yang kurang dari 20 tahun atau lebih dari 35 tahun, berisiko tinggi untuk melahirkan. Kesiapan seorang perempuan untuk hamil harus siap fisik, emosi, psikologi, sosial dan ekonomi[8]. Umur ibu hamil dikategorikan menjadi 3 yaitu: >= 35 tahun 20 34 tahun <=19 tahun b. Paritas ibu hamil Paritas adalah jumlah janin dengan berat badan lebih dari atau sama dengan 500 gram yang pernah dilahirkan hidup maupun mati. Bila berat badan tak diketahui maka dipakai umur kehamilan, yaitu 24 minggu [9]. Penggolongan paritas bagi ibu yang masih hamil atau pernah hamil berdasarkan jumlahnya menurut WHO, yaitu : Primigravida adalah wanita hamil untuk pertama kali Multigravida dalah wanita yang pernah hamil beberapa kali, dimana kehamilan tersebut tidak lebih dari 5 kali Grandemultigravida adalah wanita yang pernah hamil lebih dari 5 kali c. Pekerjaan Pekerjaan ibu hamil dikategorikan menjadi 2 yaitu: -Bekerja -Tidak Bekerja d. Pendidikan Pendidikan ibu hamil dikategorikan menjadi 3 yaitu: Pendidikan dasar, Pendidikan menengah dan Pendidikan tinggi Menurut UU Sisdiknas No. 20 Tahun 2005, Jenjang pendidikan formal terdiri atas pendidikan dasar, pendidikan menengah dan pendidikan tinggi. a) Pendidikan Dasar, terdiri dari : 1) Sekolah Dasar/Madrasah Ibtidaiyah 2) SMP/MTs b) Pendidikan Menengah, terdiri dari : 1) SMA dan MA 2) SMK dan MAK c) Pendidikan Tinggi, terdiri dari : 1) Akademi 2) Institut 3) Sekolah tinggi 4) Universitas 2.2 Metode Metode yang diusulkan dalam penelitian ini adalah klasifikasi tingkat kecemasan ibu hamil dengan algoritma Random Forest dan CHAID 2.2.1 Random Forest () 104

Random Forest () adalah klasifikasi yang terdiri dari beberapa pohon keputusan. Setiap pohon keputusan dibangun dengan menggunakan vektor acak. Pendekatan umum yang digunakan untuk menyisipkan vektor acak dalam pembentukan pohon adalah memilih nilai F acak, seperti F atribut (fitur) masukan untuk dibagi pada setiap node di pohon keputusan yang akan dibentuk. Dengan memilih nilai acak F maka seharusnya tidak harus memeriksa semua atribut yang ada, hanya melihat F dipilih atribut. Parameter yang digunakan untuk mengatur kekuatan dalam pemilihan nilai F dan jumlah tree yang akan dibangun [6]. Jika nilai F terlalu kecil, maka pohon tersebut memiliki kecenderungan untuk memiliki korelasi yang sangat kecil, dan itu berlaku sama untuk sebaliknya. Oleh karena itu, nilai F dapat ditentukan dengan rumus: Dari rumus tersebut di mana M adalah jumlah total fitur. Selain pemilihan atribut, juga dilakukan secara acak ketika memilih set pelatihan. Bootstrap aggregating adalah teknik yang dapat digunakan untuk membentuk sampel bootstrap. Setiap pohon keputusan dibangun dengan menggunakan sampel bootstrap dari data dan kandidat atribut untuk dibagi di setiap node yang berasal dari himpunan atribut acak dari hasil data yang dipilih dan disimpan. Berikut adalah Tahapan algoritma : 1. Pilih nilai n yang menunjukkan jumlah pohon (1) 2. Menghasilkan sampel n bootstrap dengan teknik training set. 3. Pada setiap node pada tree, pilih nilai F yang diperoleh dari persamaan (1). 4. Ambil set sebanyak atribut F yang akan menjadi kandidat atribut untuk membelah setiap node. Atribut yang menjadi simpul berikutnya ditentukan berdasarkan kriteria tertentu (berdasarkan algoritma pohon keputusan yang dipilih). Selama proses pembentukan pohon, nilai F adalah konstan. 5. terus terbentuk tanpa pemangkasan apapun. Hal ini ditunjukkan untuk menghilangkan bias dalam persentase hasil prediksi. 6. Hasil prediksi yang diperoleh dari model (frekuensi yang paling sering muncul) dari masing-masing pohon keputusan di. 2.2.2 CHAID (Chi-Squared Automatic Interaction Detector) CHAID adalah sebuah metode untuk mengklasifikasikan data kategori dimana tujuan prosedurnya adalah untuk membagi rangkaian data menjadi subgrup-subgrup berdasarkan pada variabel dependennya [7]. Hasil dari pengklasifikasian dalam CHAID akan ditampilkan dalam sebuahdiagram pohon. Menurut [9], CHAID merupakan suatu teknikiteratif yang menguji satupersatu variabel independen yang digunakan dalamklasifikasi, dan menyusunnya berdasarkan pada tingkat signifikansi statistik chi-square terhadap variabel dependennya. Algoritma CHAID digunakan untuk melakukan pemisahan dan penggabungan kategori-kategori dalam variabel yang dipakai dalam analisisnya. Secara garis besar algoritma ini dapat dibagi menjadi tiga tahap, yaitu Penggabungan (merging), Pemisahan (splitting) dan Penghentian (stopping). Diagram pohon dimulai dari root node (node akar) melalui tiga tahap tersebut pada setiap simpul (node) yang terbentuk dan secara berulang. Tahap pertama algoritma CHAID adalah penggabungan. Pada tahap ini akan diperiksa signifikansi dari masingmasing kategori variabel independen terhadap variabel dependen. Tahap penggabungan untuk setiap independen dalam menggabungkan kategori-kategori nonsignifikan adalah sebagai berikut: A.Tahap Penggabungan 1. Bentuk tabel kontingensi dua arah untuk masingmasing variabel independen dengan variabel dependennya. 2. Hitung statistik chi-square untuk setiap pasang kategori yang dapat dipilih untuk digabungkan menjadi satu, untuk menguji kebebasannya dalam sebuah sub tabel kontingensi yang dibentuk oleh sepasang kategori tersebut dengan vabriabel dependennya yang mempunyai sebanyak kategori. Langkah uji chi square adalah sebagai berikut: a. Perumusan hipotesisnya b. H 0 : tidak terdapat hubungan antara kategori i pada variabel independen dan kategori j pada variabel dependen c. H 1 : terdapat hubungan kategori i pada variabel independen dan kategori j pada variabel dependen d. Besaran-besaran yang diperlukan Menghitung e. Statistik uji f. Kriteria Pengujian H 0 di tolak, jika (2) (3) g. Kesimpulan Penaksiran dari H 0 diterima atau ditolak. 3. Untuk masing-masing nilai chi-square berpasangan, hitung p-value berpasangan bersamaan. Diantara pasangan-pasangan yang tidak signifikan, gabungkan sebuah pasangan kategori yang paling mirip (yaitu 105

pasangan yang mempunyai nilai chi-square berpasangan terkecil dan pvalue terbesar) menjadi sebuah kategori tunggal dan kemudian lanjutkan ke langkah nomor 4. 4. Periksa kembali kesignifikansian kategori baru setelah digabungkan dengan kategori lainnya dalam variabel independen. Jika masih ada pasangan yang belum signifikan, ulangi langkah nomor 3. Jika semua signifikan lanjutkan ke langkah selanjutnya. 5. Hitung p-value terkoreksi Bonferroni didasarkan pada tabel yang telah digabung B.Tahap Pemisahan Pilih variabel independen yang memiliki nilai χ2 hitung signifikan terbesar. Pembagian kelompok atau pemisahan kelompok dilakukan dengan variabel kelompok tersebut (Gunakan masing masing kategori variabel independen tersebut, yang telah digabung secara optimal, untuk menentukan sub pembagian dari kelompok induk menjadi sub kelompok yang baru). Jika tidak ada variabel independen dengan nilai χ2 hitung yang signifikan pembagian kelompok atau pemisahan kelompok tidak dapat dilakukan. C.Tahap Penghentian Kembali ke langkah penggabungan untuk menganalisis sub kelompok berikutnya. Hentikan ketika semua sub kelompok telah dianalisis dan juga telah berisi pengamatan dengan jumlah sedikit. 2.2.3 C4.5 Decision Tree Tahapan Algoritma Decision Tree C4.5 [11]: 1) Menyiapkan data training. 2) Menentukan akar dari pohon dihitung dengan menggunakan persamaan 1: n Entropy( S) pi*log 2 pi (4) i 1 3) Hitung nilai dengan menggunakan persamaan 2: n Si ( S, A) Entropy( S) * Entropy( Si ) (5) i 1 S 4) Ulangi langkah ke-2 hingga semua tupel terpartisi 5) Proses partisi pohon keputusan akan berhenti saat: -Semua tupel dalam node N mendapat kelas yang sama -Tidak ada atribut di dalam tupel yang dipartisi lagi -Tidak ada tupel di dalam cabang yang kosong 2.3 Pengujian Model Pada pengujian model menggunakan, C.45 dan CHAID yang di simulasikan menggunakan rapidminer di dapat hasil diagram pohom keputusan sebagai berikut: 2.3.1 Pengujian Dataset yang digunakan untuk pengujian dengan algoritma untuk menghasilkan tingkat akurasi menggunakan 3 kriteria, yaitu Gini Index, Rasio dan gain dengan jumlah prepruning yang telah di tentukan, dalam penelitian ini menggunakan 0 dan 3 jumlah prepruning, berikut akurasi yang didapatkan dapat dilihat pada table 1. Algorit ma Tabel 1. Tabel hasil pengujian akurasi Criterion No Pre Pruning Akurasi Ratio No 64,00% Ratio Yes 59.00% No 63,33% Yes 56.33% Gini Index Yes 42.67% CHAID Rasio No 62,67% CHAID Rasio Yes 41,33% C4.5 Rasio No 64% C4.5 Rasio Yes 35,67% Dari hasil pengujian menggunakan algoritma, banyaknya tree =10, nilai confidence=0,25, minimal gain =0,1, minimal leaf size=2 minimal size for split=4. Kriteria gain rasio dengan jumlah prepruning 3 mendapatkan hasil terbaik dari pengujian table diatas dengan akurasi sebesar 64,00%. Sedangkan pengujian yang menggunakan no pre pruning mendapatkan hasil akurasi yang rendah. 2.4 Hasil Pada pengujian model menggunakan C4.5, dan CHAID diatas di dapat tingkat akurasi yang terbaik dengan pruning=3 sebagai berikut: Tabel 2. Tabel hasil pengujian akurasi Algoritma Criterion Akurasi Ratio 64,00% CHAID 2.5 Evaluasi 62,67% C4.5 Ratio 64.00% Pengukuran yang digunakan untuk memvalidasi hasil pengujian menggunakan RMSE dapat dilihat pada table berikt ini: Tabel 3. Tabel hasil Pengukuran Algoritma Criterion RMSE Ratio 0.584 Ratio 0.538 0.588 106

0.583 Gini Index 0.616 CHAID Rasio 0.548 CHAID Rasio 0.591 C4.5 Rasio 0.588 C4.5 Rasio 0.638 3. Kesimpulan Dari hasil pengujian dan vidasi hasil akurasi yang didapatkan menggunakan algoritma pohon keputusan C4.5, dengan CHAID yang menggunakan pruning=3 menghasilkan akurasi yang lebih baik yaitu berada pada ngaka 64% dan 62%, sedangkan yang menggunakan pre pruning menghasilkan akurasi lebih rendah. Pada pengujian training dan testing yang dilakukan dapat disimpulkan bahwa metode Decision tree, C4.5 dan CHAID dapat diterapkan. Setiap akurasi akan berbeda nilainya tergantung dari pruning atau tidak menggunakan prepruning. Akurasi yang lebih baik didapat dari pruning= 3. Kriteria yang digunakan juga dapat mempengaruhi hasil akurasi dan pengukuran untuk memvalidasi dataset. Berikut tabel perbandingannya: Tabel 4. Tabel hasil perbandingan Algorit ma Criterion RMSE Akurasi Ratio 0.584 64,00% Ratio 0.538 59.00% 0.588 63,33% 0.583 56.33% Gini Index 0.616 42.67% CHAID Rasio 0.548 62,67% CHAID Rasio 0.591 41,33% C4.5 Rasio 0.588 64.00% C4.5 Rasio 0.638 35,67% Daftar Pustaka [1] Savitri, R.. 2003. Kecemasan Bagaimana Mengatasi Penyebabnya. Jakarta: Pustaka Populer Obor. [2] Yeyeh. 2009. Asuhan Kebidanan II (Persalinan). Jakarta: Trans Info Media [3] Stuart, G.W. dan Sundeen, S.J. 1998, Buku Saku Keperawatan Jiwa, Jakarta, EGC. [4] Berry, M. J., & Linoff, G. S.2004. Data Mining Techniques for marketing, sale, customer relationship management. Wiley Publishing,Inc. [5] Witten and Eibe Frank, Data Mining: Practical Machine Learning Tools and Techniques., 2005. [6] Ron Appel, Thomas Fuchs, Piotr Dollar and Pietro Perona, Proceedings of the 30th International Conference on Machine Learning, Atlanta, Georgia, USA, 2013. JMLR: W&CP volume 28, Quickly Boosting Decision Trees - Pruning Underachieving Features Earl. [7] Lehmann, T. & Eherler, D. 2001. Responder Profiling with CHAID and Dependency Analysis.. [8] Ruswana.2006. Tanya Jawab Seputar Kehamilan. Bhuana Ilmu Populer. Jakarta [9] Gallagher, C.A. 2000. An Iterative Approach to Classification Analysis. [10] Siswosudarmo, R., 2008. Obstetri Fisiologi Yogyakarta: Pustaka Cendekia [11] Wu, X., & Kumar, V. 2009. The Top Ten Algorithm In Data Mining. London: Taylor & Francis Group Biodata Penulis Mambang, memperoleh gelar Sarjana Komputer (S.Kom), Jurusan Sistem Informasi STMIK INDONESIA Banjarmasin, lulus tahun 2008. Memperoleh gelar Magister Komputer (M.Kom) Program Pasca Sarjana Magister Teknik Informatika Universitas Dian Nuswantoro Semarang, lulus tahun 2013. Saat ini menjadi Dosen di STIKES Sari Mulia Banjarmasin. Agus Byna, memperoleh gelar Sarjana Komputer (S.Kom), STMIK Bandung, lulus tahun 2012. Memperoleh gelar Magister Komputer (M.Kom) Program Pasca Sarjana Magister Teknik Informatika Universitas Dian Nuswantoro Semarang, lulus tahun 2015. Saat ini menjadi Dosen di Akademi Kebidanan Sari Mulia Banjarmasin. 4. Saran Saran yang dapat diberikan dalam pengujian menggunakan metode Decision tree Random forest(), C4.5 dengan CHAID adalah ebagai berikut: 1. Tingkat akurasi yang didapatkan hanya berada pada kisaran 64%, nilai akurasi dapat ditingkatkan lagi dengan mengoptimasi dataset yang digunakan untuk mengklasifikasi tingkat kecemasan ibu hamil menjelang persalinan. 2. Dataset yang digunakan dapat diuji kembali dengan metode dan algoritma yang berbeda, sehingga dapat menghasilkan nilai akurasi dan pengukuran yang lebih baik lagi. 107

108