PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS NARISWARI KARINA DEWI
|
|
- Irwan Yuwono
- 7 tahun lalu
- Tontonan:
Transkripsi
1 PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS NARISWARI KARINA DEWI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
2 RINGKASAN NARISWARI KARINA DEWI. Penerapan Metode Random Forest dalam Driver Analysis. Dibimbing oleh UTAMI DYAH SYAFITRI dan SONI YADI MULYADI. Driver analysis adalah analisis yang digunakan untuk mengetahui prioritas peubah penjelas yang menggerakkan peubah respons. Analisis tersebut dikenal dalam bidang riset pemasaran. Driver analysis dijalankan menggunakan metode-metode analisis yang bersesuaian dengan kondisi data. Umumnya, data yang dianalisis berupa data ordinal dan memiliki hubungan non-linier antara peubah penjelas dan peubah respons. Salah satu metode yang sesuai dengan hal tersebut adalah metode random forest. Penerapan metode random forest dalam driver analysis didasarkan pada ukuran random forest dan ukuran contoh peubah penjelas. Simulasi dilakukan untuk mengetahui ukuran yang tepat agar dihasilkan random forest berakurasi tinggi dan stabil, serta hasil driver analysis yang stabil. Dalam penelitian ini, driver analysis dilakukan dalam rangka memperbaiki kinerja produk Z, yaitu mengenai kesediaan seseorang membeli produk Z. Hasil simulasi menunjukkan bahwa akurasi yang tinggi dan stabil dicapai saat ukuran random forest lebih dari 500 dan ukuran contoh peubah penjelas sebesar 4. Pada ukuran tersebut juga dihasilkan driver analysis yang stabil. Kata kunci : Driver Analysis, Random Forest, Variable Importance.
3 PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS NARISWARI KARINA DEWI Skripsi sebagai salah satu syarat untuk memperoleh gelar Sarjana Statistika pada Departemen Statistika DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2011
4 Judul : Penerapan Metode Random Forest dalam Driver Analysis Nama : Nariswari Karina Dewi NRP : G Menyetujui : Pembimbing I, Pembimbing II, Utami Dyah Syafitri, S.Si, M.Si NIP Soni Yadi Mulyadi, S.Si Mengetahui : Ketua Departemen Statistika Fakultas Matematika dan Ilmu Pengetahuan Alam Institut Pertanian Bogor Dr. Ir. Hari Wijayanto, M.Si NIP Tanggal Lulus :
5 RIWAYAT HIDUP Penulis dilahirkan di Brebes pada tanggal 2 Mei 1989 dari pasangan Suryanto dan Tri Nurhayati. Penulis merupakan putri pertama dari tiga bersaudara. Penulis menyelesaikan sekolah dasar pada tahun 2000 di SD Al-Ahzar 1 Bandar Lampung, kemudian melanjutkan studi di SLTP Negeri 4 Bandar Lampung hingga tahun Selanjutnya, penulis menyelesaikan pendidikan sekolah menengah atas di SMA Negeri 2 Bandar Lampung dengan lulus pada tahun Pada tahun yang sama penulis lulus seleksi masuk Institut Pertanian Bogor melalui jalur Undangan Seleksi Masuk IPB (USMI). Setelah satu tahun menjalani perkuliahan Tingkat Persiapan Bersama (TPB), pada tahun 2007 penulis diterima sebagai mahasiswa Departemen Statistika, FMIPA IPB dengan mayor Statistika dan minor Matematika Keuangan dan Aktuaria. Selama masa kuliah penulis aktif sebagai anggota dari himpunan keprofesian Gamma Sigma Beta (GSB). Penulis juga berkesempatan menjadi asisten Metode Statistika pada tahun Penulis melaksanakan kegiatan praktik lapang di PT. Ipsos Indonesia selama bulan Februari hingga April 2010.
6 KATA PENGANTAR Segala puji dan syukur penulis panjatkan kehadirat Allah SWT atas segala limpahan karunia- Nya sehingga penulis dapat menyelesaikan karya ilmiah dengan judul Penerapan Metode Random Forest dalam Driver Analysis. Shalawat serta salam semoga selalu tercurah kepada suri tauladan manusia Rasulullah Muhammad SAW, beserta keluarga, sahabat, dan umatnya. Penulis menyusun karya ilmiah ini sebagai salah satu syarat untuk mendapatkan gelar Sarjana Statistika pada Departemen Statistika, Fakultas Matematika dan Ilmu Pengetahuan Alam, Institut Pertanian Bogor. Ucapan terima kasih penulis sampaikan kepada semua pihak yang telah turut berperan serta dalam penyusunan karya ilmiah ini, terutama kepada : 1. Ibu Utami Dyah Syafitri, S.Si, M.Si dan Bapak Soni Yadi Mulyadi, S.Si atas bimbingan, masukan, dan perhatiannya dalam membimbing penulis. 2. Bapak Dr. Ir. I Made Sumertajaya, M.Si selaku penguji luar dalam ujian sidang saya. Terima kasih atas saran dan masukannya. 3. Rekan-rekan pembahas seminar (Novira Sartika dan Ahmad Chaerus Suhada) serta rekanrekan yang bersedia hadir pada seminar saya. Terima kasih atas kehadiran serta masukan yang diberikan. 4. Rekan-rekan mahasiswa Departemen Statistika IPB angkatan 43/2006 atas diskusi dan semangatnya kepada penulis. 5. Kedua orang tua dan seluruh keluarga atas doa dan dukungan tulus baik moril maupun materil yang diberikan kepada penulis. Semoga Allah SWT membalas segala kebaikan yang telah diberikan kepada penulis. Harapan penulis atas karya ilmiah ini tak lain ialah semoga karya ilmiah ini dapat bermanfaat. Bogor, Maret 2011 Nariswari Karina Dewi
7 DAFTAR ISI Halaman DAFTAR GAMBAR... viii DAFTAR TABEL... viii DAFTAR LAMPIRAN... viii PENDAHULUAN... 1 Latar Belakang... 1 Tujuan... 1 TINJAUAN PUSTAKA... 1 Driver Analysis... 1 Classification and Regression Tree (CART)... 1 Random Forest... 3 METODOLOGI... 4 Data... 4 Metode... 4 HASIL DAN PEMBAHASAN... 5 Analisis Deskriptif... 5 Simulasi Ukuran Random Forest dan Ukuran Contoh Peubah Penjelas terhadap Keakuratan Prediksi Random Forest... 5 Simulasi Ukuran Random Forest dan Ukuran Contoh Peubah Penjelas terhadap Hasil Driver Analysis... 6 SIMPULAN DAN SARAN... 9 Simpulan... 9 Saran... 9 DAFTAR PUSTAKA... 9 LAMPIRAN... 10
8 DAFTAR GAMBAR viii Halaman 1. Struktur Pohon pada Metode CART Rataan tingkat misklasifikasi random forest berukuran k pada beberapa ukuran contoh peubah penjelas (m) Rataan tingkat misklasifikasi random forest berukuran contoh peubah penjelas m pada beberapa ukuran random forest (k) Diagram kotak garis tingkat misklasifikasi random forest pada ukuran contoh peubah penjelas (m) dan ukuran random forest (k) Diagram kotak garis mean decrease gini (MDG) peubah penjelas, pada random forest berukuran m = 2, 4, 8 dan k = 25, 50,100, 500, Urutan tingkat kepentingan peubah penjelas berdasarkan rataan Mean Decrease Gini (MDG), pada random forest berukuran m = 4 dan k = 25, 50,100, 500, DAFTAR TABEL Halaman 1. Kategori peubah penjelas dan peubah respons Frekuensi dan persentase kategori peubah respons (status kesediaan seseorang untuk membeli produk Z)... 5 DAFTAR LAMPIRAN Halaman 1. Tingkat misklasifikasi random forest pada ukuran random forest (k) dan ukuran contoh peubah penjelas (m) yang dicobakan Urutan tingkat kepentingan peubah penjelas berdasarkan nilai rataan Mean Decrease Gini (MDG) peubah penjelas pada ukuran random forest (k) sebesar 25, 50, 100, 500, 1000 dan ukuran contoh peubah penjelas (m) sebesar Koefisien korelasi Spearman antara peubah penjelas (X) dan peubah respons (Y) Modus frekuensi terpilihnya peubah penjelas sebagai pemilah (split) simpul dalam sebuah random forest dengan ukuran contoh peubah penjelas (m) sebesar 2 dan ukuran random forest (k) sebesar 25, 50, 100, 500, dan Modus frekuensi terpilihnya peubah penjelas sebagai pemilah (split) simpul dalam sebuah random forest dengan ukuran contoh peubah penjelas (m) sebesar 4 dan ukuran random forest (k) sebesar 25, 50, 100, 500, dan Modus frekuensi terpilihnya peubah penjelas sebagai pemilah (split) simpul dalam sebuah random forest dengan ukuran contoh peubah penjelas (m) sebesar 8 dan ukuran random forest (k) sebesar 25, 50, 100, 500, dan
9 1 PENDAHULUAN Latar Belakang Persaingan pasar mendorong setiap produsen untuk selalu memperbaiki kinerja produknya. Salah satu kinerja produk yang perlu diperhatikan adalah kesediaan seseorang untuk membeli produk tersebut. Untuk menghasilkan kinerja yang lebih baik, tindakan perbaikan dilakukan pada atribut produk yang mempengaruhi kinerja tersebut. Perbaikan yang efektif dan efisien dapat dilakukan jika produsen mengetahui prioritas atribut produk yang menggerakkan kinerja yang dimaksud. Dalam riset pemasaran, analisis yang digunakan untuk menghasilkan informasi tersebut dikenal dengan nama driver analysis. Driver analysis didasarkan pada metode analisis yang mengeksplorasi hubungan antara peubah penjelas dan peubah respons. Beberapa metode yang umum digunakan adalah analisis korelasi dan analisis regresi. Dalam driver analysis, data yang dianalisis berupa data ordinal dan umumnya memiliki hubungan non-linier antara peubah penjelas dan peubah respons. Salah satu metode yang mampu mengatasi hal tersebut adalah random forest. Random forest merupakan metode pohon gabungan yang berasal dari pengembangan metode classification and regression tree (CART). Metode ini didasarkan pada teknik pohon keputusan sehingga mampu mengatasi masalah non-linier. Untuk mengidentifikasi peubah penjelas yang relevan dengan peubah respons, random forest menghasilkan ukuran tingkat kepentingan (variable importance) peubah penjelas. Dalam bidang biostatistika, hal tersebut telah populer diterapkan pada masalah gene selection (Díaz-Uriarte & Andrés 2006). Prioritas peubah penjelas dapat diketahui melalui ukuran tingkat kepentingan peubah penjelas. Oleh karena itu, metode random forest dapat diterapkan pada driver analysis. Penelitian ini mengkaji hal tersebut. Pada penelitian ini, driver analysis dilakukan dalam rangka memperbaiki kinerja produk Z, yaitu dalam hal kesediaan seseorang membeli produk Z. Tujuan Tujuan penelitian ini adalah mengetahui ukuran random forest dan ukuran contoh peubah penjelas yang menghasilkan random forest berakurasi prediksi tinggi dan stabil, serta yang menghasilkan driver analysis yang stabil. TINJAUAN PUSTAKA Driver Analysis Driver analysis merupakan istilah yang digunakan secara luas dan meliputi berbagai metode analisis. Analisisnya melibatkan peubah respons dan peubah penjelas. Peubah respons biasanya berupa hal-hal yang para manajer usahakan untuk meningkatkan kondisi organisasinya. Peubah penjelas berupa hal-hal yang dianggap mempengaruhi peubah respons. Contoh peubah respons yang sering dianalisis dalam driver analysis adalah kepuasan keseluruhan (overall satisfaction), loyalitas, serta kesediaan merekomendasikan (Sambandam 2001). Driver analysis dilakukan untuk memahami pengaruh peubah penjelas terhadap peubah respons sehingga dapat diketahui prioritas setiap peubah penjelas dalam menggerakkan peubah respons (Weiner & Tang 2005). Metode analisis yang digunakan dalam driver analysis disesuaikan dengan kondisi data yang dianalisis (Sambandam 2001). Classification and Regression Tree (CART) CART merupakan metode eksplorasi data yang didasarkan pada teknik pohon keputusan. Metode ini diperkenalkan oleh Leo Breiman, Jerome H. Friedman, Richard A. Olshen dan Charles J. Stone. CART menghasilkan pohon klasifikasi saat peubah respons berupa data kategorik (nominal), sedangkan pohon regresi dihasilkan saat peubah respons berupa data numerik (interval dan rasio). Peubah penjelas yang dianalisis dapat berupa kategorik, numerik, maupun campuran keduanya (Breiman et al. 1984). CART menghasilkan pohon yang tersusun atas banyak simpul (node) yang terbentuk dari proses pemilahan rekursif biner. Setiap pemilahan memisahkan sebuah gugus data menjadi dua gugus data yang lebih kecil dan saling lepas. Nilai peubah respon pada setiap gugus data hasil pemilahan akan lebih homogen dibandingkan dengan sebelum dilakukan pemilahan (Breiman et al. 1984). Pemilahan dilakukan pada simpul nonterminal, yaitu simpul yang memenuhi kriteria pemilahan. Pemilahan dimulai
10 2 dengan memilah gugus data lengkap atau simpul akar, kemudian dihentikan saat suatu simpul memenuhi kriteria berhenti memilah. Simpul tersebut dinamakan simpul terminal. Gambar 1 mengilustrasikan struktur pohon yang dihasilkan metode CART. Pohon pada Gambar 1 tersusun atas simpul t 1, t 2,, t 5. t 1 adalah simpul akar. Simpul non-terminal dilambangkan dengan lingkaran, sedangkan simpul terminal dilambangkan dengan kotak. Setiap pemilah (split) memilah simpul non-terminal menjadis dua simpul yang saling lepas. Hasil prediksi respons suatu amatan terdapat pada simpul terminal. simpul akar t 4 Gambar 1 t 2 pemilah 2 t 1 pemilah 1 t 5 Struktur Pohon pada Metode CART. Dalam CART, pembentukan pohon diawali dengan membangun pohon sampai ukuran tertentu (umumnya sampai ukuran maksimum). Bila diperlukan, akan dilanjutkan dengan pemangkasan pohon sampai diperoleh ukuran yang tepat sehingga dihasilkan pohon optimum. Menurut Breiman et al. (1984), pembangunan pohon klasifikasi CART meliputi tiga hal, yaitu: 1. Pemilihan pemilah (split) 2. Penentuan simpul terminal 3. Penandaan label kelas Pemilihan pemilah (split) Pemilihan pemilah (split) pada setiap simpul bertujuan mendapatkan pemilah (split) yang mampu menghasilkan simpul dengan tingkat kehomogenan nilai peubah respons paling tinggi. Untuk mencapai tujuan tersebut, aturan pemilahan diterapkan pada proses ini. Pada setiap simpul t, pemilah s dibangkitkan dengan cara membentuk pertanyaan biner, sehingga s memilah t menjadi simpul kiri t L dan simpul kanan t R. Setiap amatan pada t yang menjawab ya dikirim menuju t L, sedangkan yang menjawab tidak dikirim menuju t R. Setiap pemilah hanya bergantung pada nilai dari sebuah peubah penjelas. Misalkan X adalah sebuah peubah penjelas numerik, pertanyaan biner yang t 3 : simpul nonterminal : simpul terminal dibangkitkan adalah semua pertanyaan yang berbentuk Apakah x c?, dengan. Sementara itu, jika X adalah peubah penjelas nominal dengan sebagai kategorinya, maka pertanyaan biner meliputi semua pertanyaan yang berbentuk Apakah?, dimana. Jika pada t telah terbentuk himpunan S, yaitu himpunan dari pemilah s, maka pemilah untuk t diperoleh dengan cara aturan pemilahan mencari s yang memaksimumkan fungsi kriteria kebaikan pemilah, dimana. Pemilah s yang terpilih kemudian dinotasikan dengan pemilah terbaik (Breiman et al. 1984). Salah satu aturan pemilahan yang umum digunakan adalah indeks Gini. Indeks Gini merupakan fungsi impurity. Nilai dari fungsi impurity dikenal dengan ukuran impurity simpul t, yaitu. Semakin besar, maka semakin besar tingkat keheterogenan nilai peubah respons pada t. Jika terdapat fungsi impurity, maka ukuran impurity pada setiap simpul t didefinisikan dengan (Breiman et al. 1984): dimana: : dugaan peluang suatu amatan merupakan kelas j, dimana amatan tersebut berada dalam simpul t. j : kelas pada peubah respons, yaitu. dinyatakan dengan: dimana. Saat, maka. dengan: : peluang prior kelas ke-j : banyaknya amatan kelas ke-j yang berada di dalam simpul t : banyaknya amatan kelas ke-j : banyaknya amatan pada simpul t Saat indeks Gini digunakan sebagai aturan pemilahan, maka i(t) dituliskan dengan (Breiman et al. 1984): dimana j adalah kelas pada peubah respons. Pada suatu t, jika s memilah t sedemikian sehingga besar proporsi amatan pada t L dan
11 3 t R adalah p L dan p R, maka penurunan impurity didefinisikan dengan (Breiman et al. 1984): digunakan sebagai fungsi kriteria kebaikan pemilah. Pemilah s yang dipilih sebagai pemilah simpul t adalah pemilah terbaik, yaitu (Breiman et al. 1984): Jika pada t 1, terpilih sebagai pemilah yang memilah t 1 menjadi t 2 dan t 3, maka dengan cara yang sama dilakukan pencarian pemilah terbaik pada simpul t 2 dan t 3, secara terpisah. Begitu juga pada simpul non-terminal lainnya (Breiman et al. 1984). Penentuan simpul terminal Pemilahan pada simpul t dihentikan jika memenuhi salah satu atau lebih dari kriteria berhenti memilah. Selanjutnya, t dinyatakan sebagai simpul terminal. Berikut adalah kriteria tersebut (Breiman et al. 1984): tidak terdapat penurunan nilai impuritas secara berarti pada t ( ). banyaknya amatan pada t mencapai batas minimum yang telah ditentukan (N(t) 5 atau bahkan N(t) = 1). amatan pada t sudah homogen. Penandaan Label Kelas Label kelas pada simpul terminal t ditentukan melalui aturan pluralitas (jumlah terbanyak), yaitu jika, dimana j = {1, 2,, J}, maka label kelas untuk simpul terminal t adalah kelas j 0. Jika dicapai oleh dua atau lebih kelas yang berbeda, maka label kelas untuk simpul terminal t adalah pilihan acak dari kelas yang maksimum tersebut (Brieman et al. 1984). Random Forest Metode random forest adalah pengembangan dari metode CART, yaitu dengan menerapkan metode bootstrap aggregating (bagging) dan random feature selection (Breiman 2001). Metode ini merupakan metode pohon gabungan. Dalam random forest, banyak pohon ditumbuhkan sehingga terbentuk suatu hutan (forest), kemudian analisis dilakukan pada kumpulan pohon tersebut. Pada gugus data yang terdiri atas n amatan dan p peubah penjelas, prosedur untuk melakukan random forest adalah (Breiman 2001; Breiman & Cutler 2003): 1. Lakukan penarikan contoh acak berukuran n dengan pemulihan pada gugus data. Tahap ini adalah tahapan bootstrap. 2. Dengan menggunakan contoh bootstrap, pohon dibangun sampai mencapai ukuran maksimum (tanpa pemangkasan). Pembangunan pohon dilakukan dengan menerapkan random feature selection pada setiap proses pemilihan pemilah, yaitu m peubah penjelas dipilih secara acak dimana m << p, lalu pemilah terbaik dipilih berdasarkan m peubah penjelas tersebut. 3. Ulangi langkah 1 dan 2 sebanyak k kali, sehingga terbentuk sebuah hutan yang terdiri atas k pohon. Random forest memprediksi respons suatu amatan dengan cara menggabungkan (aggregating) hasil prediksi k pohon. Untuk masalah klasifikasi, pohon yang dibangun adalah pohon klasifikasi dan hasil prediksi random forest adalah berdasarkan majority vote (suara terbanyak), yaitu kategori atau kelas yang paling sering muncul sebagai hasil prediksi dari k pohon klasifikasi. Pada setiap iterasi bootstrap, terdapat sekitar sepertiga amatan gugus data asli yang tidak termuat dalam contoh bootstrap. Amatan tersebut disebut data out-of-bag (OOB). Data OOB tidak digunakan untuk membangun pohon, melainkan menjadi data validasi pada pohon yang bersesuaian. Nilai salah klasifikasi random forest diduga melalui error OOB yang diperoleh dengan cara (Breiman 2001; Breiman & Cutler 2003; Liaw & Wiener 2002): 1. Lakukan prediksi terhadap setiap data OOB pada pohon yang bersesuaian. 2. Umumnya setiap amatan gugus data asli akan menjadi data OOB sebanyak sekitar 36% atau sepertiga dari banyak pohon yang dibentuk. Oleh karena itu, pada langkah 1, masing-masing amatan gugus data asli mengalami prediksi sebanyak sekitar sepertiga kali dari banyaknya pohon. Jika a adalah sebuah amatan dari gugus data asli, maka hasil prediksi random forest terhadap a adalah gabungan dari hasil prediksi setiap kali a menjadi data OOB. 3. Error OOB dihitung dari proporsi misklasifikasi hasil prediksi random forest dari seluruh amatan gugus data asli.
12 4 Breiman (2001) menyebutkan bahwa error OOB bergantung pada korelasi antar pohon dan kekuatan (strength) masingmasing pohon dalam random forest. Peningkatan korelasi meningkatkan error OOB, sedangkan peningkatan kekuatan pohon menurunkan error OOB. Saat melakukan random forest, ukuran contoh peubah penjelas (m) yang digunakan sangat mempengaruhi korelasi dan kekuatan tersebut. Meningkatkan m akan meningkatkan keduanya, begitu juga sebaliknya. Penggunaan m yang tepat akan menghasilkan random forest dengan korelasi antar pohon cukup kecil namun kekuatan setiap pohon cukup besar. Hal tersebut ditunjukkan dengan diperolehnya random forest dengan error OOB bernilai kecil (Breiman 2001; Breiman & Cutler 2001; Sartono & Syafitri 2010). Dengan demikian, nilai m tersebut dapat diketahui melalui pengamatan error OOB pada berbagai nilai m. Breiman dan Cutler (2003) menyarankan untuk mengamati error OOB saat dan k kecil, lalu memilih m yang menghasilkan error OOB terkecil. Untuk melakukan random forest yang menghasilkan variable importance, disarankan untuk menggunakan banyak pohon, misalnya 1000 pohon atau lebih. Jika peubah penjelas yang dianalisis sangat banyak, nilai tersebut sebaiknya lebih besar agar variable importance yang dihasilkan semakin stabil (Breiman & Cutler 2003). Mean Decrease Gini Mean Decrease Gini (MDG) merupakan salah satu ukuran tingkat kepentingan (variable importance) peubah penjelas yang dihasilkan oleh metode random forest. Misalkan terdapat p peubah penjelas dengan, maka MDG mengukur tingkat kepentingan peubah penjelas X h dengan cara (Breiman & Cutler 2003; Sandri & Zuccolotto 2006): dimana: k : besar penurunan indeks Gini untuk peubah penjelas X h pada simpul t : banyaknya pohon dalam random forest (ukuran random forest) METODOLOGI Data Data yang digunakan dalam penelitian ini adalah data sekunder yang diperoleh dari sebuah perusahaan riset pemasaran di Indonesia. Data tersebut terdiri atas sejumlah merek yang berbeda, dimana merek-merek tersebut merupakan jenis produk yang sama, yaitu produk Z. Banyaknya amatan dalam data adalah 1200 amatan. Data yang digunakan terdiri atas sebuah peubah respons dan dua puluh peubah penjelas. Seluruhnya berskala pengukuran ordinal dengan lima kategori. Peubah responsnya adalah status kesediaan seseorang untuk membeli produk Z, sedangkan peubah penjelasnya adalah status kesetujuan seseorang terhadap atribut produk Z. Kategori masing-masing peubah dapat dilihat pada Tabel 1. Untuk melakukan metode random forest pada masalah klasifikasi, skala pengukuran data dianggap nominal. Tabel 1 Kategori peubah penjelas dan peubah respons Peubah Kategori peubah Kode Keterangan 1 Sangat tidak setuju 2 Tidak setuju Penjelas 3 Biasa saja (X) 4 Setuju 5 Sangat setuju 1 Pasti tidak akan membeli Respons (Y) 2 Tidak akan membeli Tidak yakin akan 3 membeli atau tidak 4 Akan membeli 5 Pasti akan membeli Metode Langkah-langkah yang dilakukan dalam penelitian ini adalah: 1. Melakukan analisis statistika deskriptif terhadap peubah respons. 2. Melakukan simulasi random forest. Simulasi dilakukan dengan cara: a. Sebanyak 1000 random forest dibentuk pada setiap m dan k yang dicobakan, kemudian dicatat tingkat misklasifikasi masing-masing random forest dan Mean Decrease Gini (MDG) setiap peubah penjelas. Nilai m dan k yang disarankan Breiman (2001) dicobakan dalam simulasi ini. Nilai k yang disarankan
13 5 untuk digunakan pada metode bagging juga dicobakan, yaitu k = 50. Umumnya k = 50 sudah memberikan hasil yang memuaskan untuk masalah klasifikasi (Breiman 1996). Sementara itu, k 100 cenderung menghasilkan tingkat misklasifikasi yang konstan (Sutton 2005). Nilai m dan k yang dicobakan adalah: dimana p adalah banyaknya peubah penjelas dalam data, yaitu p = 20. b. Menganalisis tingkat misklasifikasi random forest yang dihasilkan dari langkah 2a. Analisis dilakukan secara eksploratif. c. Melakukan driver analysis menggunakan metode random forest, yaitu mengamati urutan MDG peubah penjelas. MDG setiap peubah penjelas dihasilkan pada langkah 2a. 3. Melakukan analisis korelasi Spearman terhadap data. 4. Melakukan intepretasi hasil driver analysis dan hasil analisis korelasi. Dalam penelitian ini, metode random forest dihasilkan menggunakan software R ver dengan paket randomforest ver Kriteria berhenti memilah yang digunakan adalah terdapatnya satu amatan pada simpul terminal. HASIL DAN PEMBAHASAN Analisis Deskriptif Frekuensi dan persentase dari banyaknya amatan pada setiap kategori peubah respons disajikan dalam Tabel 2. Tabel 2 Frekuensi dan persentase kategori peubah respons (status kesediaan seseorang untuk membeli produk Z) Kategori peubah respons Frekuensi Persentase Kode Keterangan (%) 1 Pasti tidak akan membeli 2 Tidak akan membeli Tidak yakin akan membeli atau tidak 4 Akan membeli Pasti akan membeli Total Berdasarkan Tabel 2, diketahui bahwa terdapat 5 kategori pada peubah respons, namun tidak terdapat responden yang menyatakan pasti tidak akan membeli. Oleh karena itu, peubah respons yang dianalisis hanya terdiri atas 4 kategori. Dari 1200 responden, 56% responden menyatakan akan membeli produk Z, 41.7% responden menyatakan pasti akan membeli produk Z, 2% responden menyatakan tidak yakin akan membeli produk Z atau tidak membelinya, dan 0.3% responden menyatakan tidak akan membelinya. Secara deskriptif dapat dikatakan bahwa sebagian besar responden bersedia membeli produk Z. Simulasi Ukuran Random Forest dan Ukuran Contoh Peubah Penjelas terhadap Keakuratan Prediksi Random Forest Keakuratan prediksi random forest diukur dari tingkat misklasifikasinya. Akurasi yang tinggi dan stabil dapat diperoleh jika ukuran contoh peubah penjelas (m) dan ukuran random forest (k) ditentukan dengan tepat. Simulasi dilakukan dengan menganalisis tingkat misklasifikasi random forest pada berbagai nilai m dan k yang dicobakan. Perubahan rataan tingkat misklasifikasi random forest akibat perubahan m disajikan dalam Gambar 2. Semakin besar k, perubahan rataan tingkat misklasifikasi akibat perubahan m menjadi semakin tidak terlihat. Meskipun demikian, terlihat bahwa rataan tingkat misklasifikasi terendah selalu dicapai saat, yaitu m = 4. Rataan tingkat misklasifikasi (%) k = 25 k = 50 k = 100 k = 500 k = 1000 m Gambar 2 Rataan tingkat misklasifikasi random forest berukuran k pada beberapa ukuran contoh peubah penjelas (m). Hal tersebut menunjukan bahwa m = 4 adalah m optimal. Gambar 2 juga menunjukkan bahwa m optimal sudah dapat diketahui meski dengan k kecil. Dengan m = 4, random forest yang terbentuk merupakan random forest dengan pohon-pohon yang
14 Tingkat misklasifikasi (%) 6 kuat, namun korelasi antar pohon cukup kecil. Oleh karena itu, tingkat misklasifikasinya adalah yang terendah. Rataan tingkat misklasifikasi (%) m = 2 m = 4 m = 8 k Gambar 3 Rataan tingkat misklasifikasi random forest berukuran contoh peubah penjelas m pada beberapa ukuran random forest (k). Gambar 3 memperlihatkan perubahan rataan tingkat misklasifikasi akibat berubahnya k. Terlihat bahwa semakin besar k maka semakin kecil rataan tingkat misklasifikasi. Breiman (2001) menyatakan bahwa tingkat misklasifikasi random forest akan konvergen menuju nilai tertentu saat ukuran random forest semakin besar. Hasil simulasi (Gambar 3) sesuai dengan hal tersebut, yaitu ditunjukkan dengan saat k semakin besar, besarnya penurunan rataan tingkat misklasifikasi menjadi semakin tidak terlihat. Peningkatan k dari 500 pohon menjadi 1000 pohon terlihat tidak memberikan penurunan rataan tingkat misklasifikasi yang berarti. Dengan demikian, dapat dikatakan bahwa akurasi random forest dalam memprediksi kesediaan membeli mulai konvergen saat menggunakan 500 pohon dan konvergen menuju 34.5%. Tingkat misklasifikasi tersebut adalah yang terendah. Nilai tingkat misklasifikasi pada seluruh k dan m yang dicobakan dapat dilihat dalam Lampiran 1. Penyebaran tingkat misklasifikasi menggambarkan kestabilan tingkat misklasifikasi. Dengan membandingkan seluruh diagram kotak garis pada Gambar 4, terlihat bahwa panjang diagram kotak garis cenderung konstan meskipun terjadi perubahan m. Akan tetapi, panjang diagram kotak garis semakin memendek saat k meningkat. Ini menunjukkan bahwa kestabilan tingkat misklasifikasi random forest hanya bergantung pada k. Semakin besar k maka semakin stabil tingkat misklasifikasi random forest. Gambar 4 juga memperlihatkan terdapatnya konvergensi tingkat misklasifikasi. Memendeknya diagram kotak garis terjadi secara perlahan dan bergerak menuju nilai tertentu. Saat k sebesar 1000, k 500 m = 2 m = 4 m = Gambar 4 Diagram kotak garis tingkat misklasifikasi random forest pada ukuran contoh peubah penjelas (m) dan ukuran random forest (k). akurasi random forest yang dihasilkan berada antara 33% dan 35.5%, dengan letak pemusatan berada pada nilai sekitar 34.5%. Pada k tersebut, akurasi prediksi random forest memiliki kestabilan yang baik dibandingkan dengan k yang lebih kecil. Selain itu, letak pemusatannya merupakan nilai konvergensi akurasi dan nilai akurasi tertinggi yang dapat dicapai. Mengenai waktu komputasi, penggunaan k dan m yang semakin besar menyebabkan meningkatnya waktu komputasi. Walau demikian, pembentukan random forest tunggal hanya memerlukan waktu komputasi yang singkat. Umumnya, waktu komputasi menjadi hal yang perlu dipertimbangkan ketika metode random forest digunakan untuk membangun banyak random forest, seperti pada simulasi ini. Simulasi Ukuran Random Forest dan Ukuran Contoh Peubah Penjelas terhadap Hasil Driver Analysis Pada penerapan random forest dalam driver analysis (DA-RF), random forest menghasilkan nilai Mean Decrease Gini (MDG) untuk setiap peubah penjelas. Driver analysis dilakukan dengan memeringkatkan peubah penjelas berdasarkan MDG. Oleh karena itu, kestabilan MDG sangat mmenentukan kestabilan hasil driver analysis. Kestabilan MDG diamati melalui diagram kotak garis MDG pada berbagai m dan k yang dicobakan. Hasil tersebut disajikan dalam Gambar 5. Dapat dilihat bahwa perubahan m, tidak mengubah
15 MDG (m = 8) MDG (m = 4) MDG (m = 2) k = 25 k = 50 k = 100 k = 500 k = 1000 DG.1 G.1_1 G.1_2 G.1_3 G.1_4 DG.2 G.2_1 G.2_2 G.2_3 G.2_4 DG.3 G.3_1 G.3_2 G.3_3 G.3_4 DG.4 G.4_1 G.4_2 G.4_3 G.4_4 DG.5 G.5_1 G.5_2 G.5_3 G.5_4 DG.6 G.6_1 G.6_2 G.6_3 G.6_4 DG.7 G.7_1 G.7_2 G.7_3 G.7_4 DG.8 G.8_1 G.8_2 G.8_3 G.8_4 DG.9 G.9_1 G.9_2 G.9_3 G.9_4 G.10.10_1.10_2.10_3.10_4 G.11.11_1.11_2.11_3.11_4 G.12.12_1.12_2.12_3.12_4 G.13.13_1.13_2.13_3.13_4 G.14.14_1.14_2.14_3.14_4 G.15.15_1.15_2.15_3.15_4 G.16.16_1.16_2.16_3.16_4 G.17.17_1.17_2.17_3.17_4 G.18.18_1.18_2.18_3.18_4 G.19.19_1.19_2.19_3.19_4 G.20.20_1.20_2.20_3.20_ G.1_5 G.1_6 G.1_7 G.1_8 G.1_9 G.2_5 G.2_6 G.2_7 G.2_8 G.2_9 G.3_5 G.3_6 G.3_7 G.3_8 G.3_9 G.4_5 G.4_6 G.4_7 G.4_8 G.4_9 G.5_5 G.5_6 G.5_7 G.5_8 G.5_9 G.6_5 G.6_6 G.6_7 G.6_8 G.6_9 G.7_5 G.7_6 G.7_7 G.7_8 G.7_9 G.8_5 G.8_6 G.8_7 G.8_8 G.8_9 G.9_5 G.9_6 G.9_7 G.9_8 G.9_9.10_5.10_6.10_7.10_8.10_9.11_5.11_6.11_7.11_8.11_9.12_5.12_6.12_7.12_8.12_9.13_5.13_6.13_7.13_8.13_9.14_5.14_6.14_7.14_8.14_9.15_5.15_6.15_7.15_8.15_9.16_5.16_6.16_7.16_8.16_9.17_5.17_6.17_7.17_8.17_9.18_5.18_6.18_7.18_8.18_9.19_5.19_6.19_7.19_8.19_9.20_5.20_6.20_7.20_8.20_ X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16 X17 X18 X19 X20 Gambar 5 Diagram kotak garis mean decrease gini (MDG) peubah penjelas, pada random forest berukuran m = 2, 4, 8 dan k = 25, 50,100, 500, Rataan MDG k = 25 k = 50 k = 100 k = 500 k = 1000 X2 X6 X14 X8 X15 X1 X13 X7 X12 X5 X19 X17 X18 X3 X10 X20 X9 X16 X4 X11 Peubah penjelas Gambar 6 Urutan tingkat kepentingan peubah penjelas berdasarkan rataan Mean Decrease Gini (MDG), pada random forest berukuran m = 4 dan k = 25, 50,100, 500, panjang diagram kotak garis. Hasil ini menunjukkan bahwa keragaman MDG selalu sama besar pada m berapapun, yang berarti m tidak mempengaruhi kestabilan MDG sehingga m tidak mengubah hasil driver analysis. Dengan demikian, diketahui bahwa m tidak mempengaruhi kestabilan hasil driver analysis. Mengenai pengaruh k terhadap MDG, peningkatan k menyebabkan diagram kotak
16 8 garis semakin pendek. Ini menunjukkan bahwa keragaman MDG semakin kecil saat k semakin besar, sehingga MDG suatu peubah penjelas semakin stabil saat k semakin besar. Berbeda dengan susunan diagram kotak garis pada Gambar 4, Gambar 5 memperlihatkan bahwa memendeknya diagram kotak garis tidak disertai dengan perubahan letak pemusatan MDG. Hasil tersebut menunjukkan bahwa kestabilan MDG sangat bergantung pada k, namun k tidak mempengaruhi besar perolehan MDG. MDG memiliki kestabilan yang baik saat k bernilai lebih dari 500, sehingga hasil driver analysis stabil pada k tersebut. Telah diketahui bahwa m tidak mengubah hasil driver analysis, namun random forest memiliki akurasi tertinggi saat m = 4. Oleh karena itu, pengamatan hasil driver analysis selanjutnya dilakukan saat m = 4. Hal tersebut dilakukan dengan menyusun driver analysis berdasarkan rataan MDG dari 1000 random forest. Hasilnya ditampilkan dalam Gambar 6. Seperti hasil sebelumnya, Gambar 6 juga memperlihatkan bahwa perubahan k tidak menyebabkan perubahan letak pemusatan. Ini menunjukkan bahwa berapapun k yang digunakan tidak mempengaruhi rataan MDG peubah penjelas. Oleh sebab itu, penyusunan driver analysis berdasarkan rataan MDG menghasilkan driver analysis yang stabil. Nilai rataan MDG peubah penjelas saat random forest berukuran m = 4 dan k = 25, 50, 100, 500, 1000 disajikan dalam Lampiran 2. Terlihat bahwa hasil driver analysis pada k = 25 dan k = 50 sedikit berbeda dengan hasil driver analysis pada k lainnya (k = 100, 500, 1000). Pada k = 25, hal tersebut terjadi saat urutan X6-X14, yaitu dengan masing-masing nilai rataan MDG sebesar dan Sementara itu, pada k = 50, hal tersebut terjadi saat urutan X1-X13, dengan masing-masing nilai rataan MDG sebesar dan Karena nilai-nilai tersebut tidak terlalu berbeda jauh, maka hasil driver analysis berdasarkan rataan MDG tetap dapat dikatakan stabil meskipun menggunakan k yang bernilai kecil. Dalam Gambar 6 diperlihatkan bahwa rataan MDG tertinggi dimiliki oleh X2. Penurunan rataan MDG secara drastis hanya terjadi pada peubah penjelas peringkat 1 dan 2, yaitu X2 dan X6. Pada peringkat selanjutnya, rataan MDG menurun secara lambat. Hasil tersebut memperlihatkan bahwa X2 teridentifikasi sebagai atribut yang paling penting dalam mempengaruhi kesediaan membeli produk Z, serta memiliki pengaruh yang jauh lebih besar daripada pengaruh atribut lainnya. Ini menunjukkan bahwa memperbaiki atribut X2 jauh lebih berpengaruh terhadap perbaikan kesediaan membeli dibandingkan dengan jika memperbaiki atribut lainnya. Oleh karena itu, untuk memperbaiki hal kesediaan seseorang dalam membeli produk Z, sangat diprioritaskan untuk memperbaiki atribut X2. Prioritas berikutnya disesuaikan dengan hasil driver analysis. Urutan prioritas atribut berdasarkan hasil driver analysis adalah X2- X6-X14-X8-X15-X1-X13-X7-X12-X5- X19-X17-X18-X3-X10-X20-X9-X16-X4- X11. Nilai koefisien korelasi Spearman antara kesediaan membeli produk Z dan atribut produk Z disajikan dalam Lampiran 3. Arah koefisien korelasi Spearman menggambarkan bentuk hubungan antara suatu atribut dengan kesediaan seseorang membeli produk Z. Saat koefisien korelasi Spearman bernilai positif, maka diindikasikan bahwa terdapatnya suatu atribut di dalam produk Z mampu menggerakkan seseorang untuk bersedia membeli produk Z. Sebaliknya, koefisien korelasi Spearman yang bernilai negatif mengindikasikan bahwa tidak terdapatnya suatu atribut di dalam produk Z akan menggerakkan seseorang untuk bersedia membeli produk Z. Untuk atribut X2, koefisien korelasi Spearman antara atribut X2 dengan kesediaan membeli produk Z bernilai positif dan nyata pada taraf nyata 5%. Hasil ini menunjukkan bahwa terdapatnya atribut X2 di dalam produk Z dapat menggerakkan seseorang untuk bersedia membeli produk Z. Jika frekuensi terpilihnya suatu peubah penjelas untuk menjadi pemilah simpul dalam sebuah random forest diamati, maka terlihat bahwa atribut X2 merupakan peubah penjelas yang paling sering terpilih sebagai pemilah simpul. Hal tersebut ternyata sejalan dengan hasil driver analysis berdasarkan rataan MDG. Akan tetapi, saat m = 8, hal tersebut tampak tidak sejalan dengan hasil driver analysis. Saat m = 8, atribut X6 menjadi peubah penjelas yang paling sering terpilih sebagai pemilah simpul. Hal tersebut dapat terjadi karena untuk menghasilkan nilai MDG suatu peubah penjelas, nilai penurunan impurity peubah penjelas tersebut juga turut diperhitungkan. Nilai modus mengenai frekuensi terpilihnya suatu peubah
17 9 penjelas untuk menjadi pemilah dalam sebuah random forest pada masing-masing m dan k yang dicobakan dapat dilihat pada Lampiran 4, Lampiran 5, dan Lampiran 6. SIMPULAN DAN SARAN Simpulan Akurasi prediksi yang tinggi dan stabil diperoleh saat random forest dibangun menggunakan ukuran contoh peubah penjelas sebesar 4 dan ukuran random forest lebih dari 500. Pada kondisi tersebut, tingkat misklasifikasi yang dicapai berkisar antara 33% dan 35.5%, dengan nilai rataan tingkat misklasifikasi sebesar 34.5%. Pada penerapan random forest dalam driver analysis, penyusunan driver analysis berdasarkan MDG menghasilkan driver analysis yang stabil jika ukuran random forest lebih dari 500. Sementara itu, jika penyusunan driver analysis dilakukan berdasarkan rataan MDG dari 1000 random forest, maka tetap dihasilkan driver analysis yang stabil meskipun ukuran random forest yang digunakan cukup kecil. Hasil driver analysis pun stabil pada berbagai ukuran contoh peubah penjelas. Saran Penelitian ini dilakukan pada ukuran bootstrap yang sama besar dengan ukuran data, yaitu sebesar Selain itu, juga dilakukan pada ukuran iterasi simulasi (banyaknya random forest dalam satu iterasi simulasi) sebesar Berkenaan dengan hal tersebut, saran untuk penelitian selanjutnya adalah: 1. Mengurangi ukuran bootstrap untuk melihat bagaimana pengaruhnya terhadap akurasi random forest dan hasil driver analysis. Salah satu keunggulan metode random forest adalah mampu menganalisis data yang ukuran datanya jauh lebih sedikit dibandingkan ukuran peubah penjelas dalam data (Breiman & Cutler 2001; Díaz-Uriarte & Andrés 2006). 2. Mengurangi ukuran iterasi simulasi untuk mengetahui ukuran iterasi yang efisien dalam menghasilkan driver analysis yang stabil. Breiman L Bagging Predictors. Machine Learning 24: Breiman L Random Forests. Machine Learning 45:5-32. Breiman L, Cutler A Random Forest. [terhubung berkala]. andomforests/cc_home.htm#intro. [8 Jul 2010] Breiman L, Cutler A Manual on Setting Up, Using, and Understanding Random Forest V4.0. [terhubung berkala]. ng_random_forests_v4.0.pdf. [8 Jul 2010] Díaz-Uriarte R, Andrés SA de Gene Selection and Classification of Microarray Data Using Random Forest. BMC Bioinformatics 7:3. Liaw A, Wiener M. Des Classification and Regression by randomforest. RNews Vol. 2/3: Sambandam R Survey of analysis methods -- Part I: key driver analysis. [30 Nopember 2009]. Sandri M, Zuccolotto P Variable Selection Using Random Forest. Di dalam: Zani S, Cerioli A, Riani M, Vichi M, editor. Data Analysis, Classification and the Forward Search. Proceedings of the Meeting of the Classification and Data Analysis Group (CLADAG) of the Italian Statistical Society; University of Parma, 6-8 Jun New York: Springer Berlin Heidelberg. hlm Sartono B, Syafitri UD Ensemble Tree: an Alternative toward Simple Classification & Regression Tree. Forum Statistika dan Komputasi 15(1):1-7. Sutton CD Classification and Regression Trees, Bagging, and Boosting. Handbook of Statistics 24: Wiener JL, Tang J Multicollinearity in Customer Satisfaction Research. Ipsos Loyalty. DAFTAR PUSTAKA Brieman L, Friedman JH, Olshen RA, Stone CJ Classification and Regression Trees. New York: Chapman & Hall.
18 LAMPIRAN 10
19 11 Lampiran 1 Tingkat misklasifikasi random forest pada ukuran random forest (k) dan ukuran contoh peubah penjelas (m) yang dicobakan Ukuran Random Forest (k) Ukuran Contoh Peubah Penjelas (m) Rataan Tingkat Misklasifikasi (%)
20 12 Lampiran 2 Urutan tingkat kepentingan peubah penjelas berdasarkan nilai rataan Mean Decrease Gini (MDG) peubah penjelas pada ukuran random forest (k) sebesar 25, 50, 100, 500, 1000 dan ukuran contoh peubah penjelas (m) sebesar 4 Urutan Tingkat Kepentingan Peubah Penjelas Peubah Penjelas Ukuran Random Forest (k) X X X X X X X X X X X X X X X X X X X X
21 13 Lampiran 3 Koefisien korelasi Spearman antara peubah penjelas (X) dan peubah respons (Y) Peubah Penjelas Y Nilai-p X X X X X X X X X X X X X X X X X X X X
22 14 Lampiran 4 Modus frekuensi terpilihnya peubah penjelas sebagai pemilah (split) simpul dalam sebuah random forest dengan ukuran contoh peubah penjelas (m) sebesar 2 dan ukuran random forest (k) sebesar 25, 50, 100, 500, dan 1000 Peubah Ukuran Random Forest (k) Penjelas X X X X X X X X X X X X X X X X X X X X
23 15 Lampiran 5 Modus frekuensi terpilihnya peubah penjelas sebagai pemilah (split) simpul dalam sebuah random forest dengan ukuran contoh peubah penjelas (m) sebesar 4 dan ukuran random forest (k) sebesar 25, 50, 100, 500, dan 1000 Peubah k Penjelas X X X X X X X X X X X X X X X X X X X X
24 16 Lampiran 6 Modus frekuensi terpilihnya peubah penjelas sebagai pemilah (split) simpul dalam sebuah random forest dengan ukuran contoh peubah penjelas (m) sebesar 8 dan ukuran random forest (k) sebesar 25, 50, 100, 500, dan 1000 Peubah k Penjelas X X X X X X X X X X X X X X X X X X X X
PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis)
, April 2011 p : -43 ISSN : 0853-811 Vol 16 No.1 PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis) Nariswari Karina Dewi 1, Utami Dyah Syafitri
Lebih terperinciPREFERENSI KARAKTERISTIK KOPI 3 IN 1 MENGGUNAKAN METODE POHON REGRESI DAN KLASIFIKASI FITRIYANTO
PREFERENSI KARAKTERISTIK KOPI 3 IN 1 MENGGUNAKAN METODE POHON REGRESI DAN KLASIFIKASI FITRIYANTO DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2010
Lebih terperinciPENENTUAN FAKTOR-FAKTOR MEMILIH MEREK DENGAN METODE CART DAMAS ESMU HAJI
PENENTUAN FAKTOR-FAKTOR MEMILIH MEREK DENGAN METODE CART DAMAS ESMU HAJI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 ABSTRAK DAMAS ESMU HAJI.
Lebih terperinciPENGARUH PERAN DOSEN PEMBIMBING TERHADAP KUALITAS TUGAS AKHIR (Studi Kasus : Mahasiswa Fmipa Unsyiah)
BIAStatistics (2016) Vol. 10, No. 1, hal. 8-16 PENGARUH PERAN DOSEN PEMBIMBING TERHADAP KUALITAS TUGAS AKHIR (Studi Kasus : Mahasiswa Fmipa Unsyiah) Nany Salwa 1, Fitriana A.R. 2, and Junita Aiza 3 1,
Lebih terperinciBAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio
21 BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) 3.1 Regresi Logistik Biner Regresi logistik berguna untuk meramalkan ada atau tidaknya karakteristik berdasarkan prediksi
Lebih terperinciMETODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG
METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG MUHAMMAD JAMAL MUTTAQIN 1311 201 205 PEMBIMBING DR. BAMBANG WIDJANARKO OTOK, M.SI. SANTI PUTERI RAHAYU, M.SI., PH.D.
Lebih terperinciPENERAPAN METODE CART
E-ISSN 2527-9378 Jurnal Statistika Industri dan Komputasi Volume 2, No. 2, Juli 2017, pp. 78-83 PENERAPAN METODE CART (CLASSIFICATION AND REGRESSION TREES) UNTUK MENENTUKAN FAKTOR-FAKTOR YANG MEMPENGARUHI
Lebih terperinciPREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI)
I Made, Prediksi Lama Studi Mahasiswa,,,201 PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI) Prediction Of Students Learning Study Periode By Using Random Forest Method
Lebih terperinciPEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA
PEMODELAN DATA PANEL SPASIAL DENGAN DIMENSI RUANG DAN WAKTU TENDI FERDIAN DIPUTRA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2012 RINGKASAN TENDI
Lebih terperinciPREDIKSI NASABAH POTENSIAL MENGGUNAKAN METODE KLASIFIKASI POHON BINER
PREDIKSI NASABAH POTENSIAL MENGGUNAKAN METODE KLASIFIKASI POHON BINER Ari Wibowo Program Studi Teknik Informatika Politeknik Negeri Batam Jl. Parkway No 1, Batam Center, Batam Telp 0778-469856, Fax 0778-463620
Lebih terperinciPENENTUAN PEUBAH PENCIRI PENERIMA JAMINAN KESEHATAN DAERAH (JAMKESDA) KOTA BOGOR DENGAN METODE CHAID DAN RANDOM FOREST SILVI NUR ARIFAH
PENENTUAN PEUBAH PENCIRI PENERIMA JAMINAN KESEHATAN DAERAH (JAMKESDA) KOTA BOGOR DENGAN METODE CHAID DAN RANDOM FOREST SILVI NUR ARIFAH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN
PENERAPAN DAN PERBANDINGAN CARA PENGUKURAN RESPON PADA ANALISIS KONJOIN (Studi Kasus: Preferensi Mahasiswa Statistika IPB Angkatan 44, 45, dan 46 terhadap Minat Bidang Kerja) DONNY ARIEF SETIAWAN SITEPU
Lebih terperinciANALISIS KINERJA INSTITUT PERTANIAN BOGOR BERDASARKAN SURVEI KEPUASAN MAHASISWA DAN EPBM AHMAD CHAERUS SUHADA
ANALISIS KINERJA INSTITUT PERTANIAN BOGOR BERDASARKAN SURVEI KEPUASAN MAHASISWA DAN EPBM AHMAD CHAERUS SUHADA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)
ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 5, Nomor 1, Tahun 2016, Halaman 81-90 Online di: http://eournal-s1.undip.ac.id/index.php/gaussian ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING
Lebih terperinciPENENTUAN KONDISI OPTIMUM PADA PEMBENTUKAN POHON TERBAIK DENGAN METODE POHON KLASIFIKASI (CLASSIFICATION TREE)
Natural Vol. 11, No. 2, Mei 2007, hal. 112-118. PENENTUAN KONDISI OPTIMUM PADA PEMBENTUKAN POHON TERBAIK DENGAN METODE POHON KLASIFIKASI (CLASSIFICATION TREE) A. Efendi dan H. Kusdarwati Program Studi
Lebih terperinciSeminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011
Surabaya, Juli 2011 Seminar Tugas Akhir Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING Ibrahim Widyandono 1307 100 001 Pembimbing : Dr. Bambang Widjanarko
Lebih terperinciANALISIS KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA FEM DAN FAPERTA MENGGUNAKAN METODE CHART
Xplore, 2013, Vol. 2(1):e3(1-8) c 2013 Departemen Statistika FMIPA IPB ANALISIS KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA FEM DAN FAPERTA MENGGUNAKAN METODE CHART Fira Nurahmah Al Amin,Indahwati,Yenni
Lebih terperinciKAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI. Oleh : SITI NURBAITI G
KAJIAN PENDEKATAN REGRESI SINYAL P-SPLINE PADA MODEL KALIBRASI Oleh : SITI NURBAITI G14102022 DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2007 ABSTRAK SITI
Lebih terperinciBAB III METODE POHON KLASIFIKASI QUEST
BAB III METODE POHON KLASIFIKASI QUEST 3.1 Metode Berstruktur Pohon Istilah pohon dalam matematika dikenal dalam teori graf. Pertama kali konsep pohon digunakan oleh Gustav Kirchhoff (184-1887) dalam bidang
Lebih terperinciBAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.
BAB I PENDAHULUAN 1.1. Latar Belakang Data mining adalah serangkaian proses untuk menggali nilai tambah berupa informasi yang selama ini tidak diketahui secara manual dari suatu basis data. Informasi yang
Lebih terperinciMETODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE
METODE LEAST MEDIAN OF SQUARES (LMS) PADA ANALISIS REGRESI DENGAN PENCILAN AMIR A DALIMUNTHE DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2010 RINGKASAN
Lebih terperinciPENERAPAN POHON KLASIFIKASI DAN BOOTSTRAP AGGREGATING DALAM KLASIFIKASI USIA MENARCHE (Studi Kasus: SMPN Ragunan dan SMPN 1 Dramaga) IIS ISTIQOMAH
PENERAPAN POHON KLASIFIKASI DAN BOOTSTRAP AGGREGATING DALAM KLASIFIKASI USIA MENARCHE (Studi Kasus: SMPN Ragunan dan SMPN 1 Dramaga) IIS ISTIQOMAH DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciPENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA DIMAS FAJAR AIRLANGGA
PENERAPAN METODE CHAID DAN REGRESI LOGISTIK DALAM ANALISIS SEGMENTASI PASAR KONSUMEN AQUA DIMAS FAJAR AIRLANGGA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciPENERAPAN METODE REGRESI BERSTRUKTUR POHON PADA PENDUGAAN LAMA PENYUSUNAN SKRIPSI MAHASISWA ARTIKEL ILMIAH
PENERAPAN METODE REGRESI BERSTRUKTUR POHON PADA PENDUGAAN LAMA PENYUSUNAN SKRIPSI MAHASISWA ARTIKEL ILMIAH Artikel Ilmiah Ini Diambil Dari Sebagian Skripsi Untuk Memenuhi Persyaratan Penyelesaian Program
Lebih terperinciSeminar Hasil Tugas Akhir
Seminar Hasil Tugas Akhir Pendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker pada pasien Kanker Tiroid Sri Hartati Selviani Handayani 1311106007 Pembimbing :
Lebih terperinciKlasifikasi Nilai Peminat SBMPTN (Seleksi Bersama Masuk Perguruan Tinggi Negeri) ITS dengan Pendekatan Classification and Regression Trees (CART)
D193 Klasifikasi Nilai Peminat SBMPTN (Seleksi Bersama Masuk Perguruan Tinggi Negeri) ITS dengan Pendekatan Classification and Regression Trees (CART) Lely Dwi Bhekti Pratiwi, Wahyu Wibowo, dan Ismaini
Lebih terperinciPEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART ( CLASSIFICATION AND REGRESSION TREES ) ( STUDI KASUS PENYAKIT DIABETES SUKU PIMA INDIAN )
PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART ( CLASSIFICATION AND REGRESSION TREES ) ( STUDI KASUS PENYAKIT DIABETES SUKU PIMA INDIAN ) PT Jasa Marga ro) C abang Semarang SKRIPSI Disusun Oleh
Lebih terperinciKlasifikasi Kegiatan Partisipasi Ekonomi Perempuan Di Jawa Timur Dengan Pendekatan CART (Classification And Regression Trees)
1 Klasifikasi Kegiatan Partisipasi Ekonomi Perempuan Di Jawa Timur Dengan Pendekatan CART (Classification And Regression Trees) Sharfina Widyandini dan Vita Ratnasari Jurusan Statistika, Fakultas MIPA,
Lebih terperinciKLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART
ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 5, Nomor 1, Tahun 2016, Halaman 183-192 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN
Lebih terperinciAnalisis CART (Classification And Regression Trees) pada Faktor-Faktor yang Mempengaruhi Kepala Rumah Tangga di Jawa Timur Melakukan Urbanisasi
JURNAL SAINS DAN SENI ITS Vol. 1, No. 1, (Sept. 2012) ISSN: 2301-928X D-100 Analisis CART (Classification And Regression Trees) pada Faktor-Faktor yang Mempengaruhi Kepala Rumah Tangga di Jawa Timur Melakukan
Lebih terperinciHary Mega Gancar Prakosa Dosen Pembimbing Dr. Suhartono, S.Si, M.Sc Co Pembimbing Dr. Bambang Wijanarko Otok, S.Si, M.
KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI PROVINSI JAWA TIMUR DENGAN PENDEKATAN BOOTSTRAP AGGREGATTING CLASSIFICATION AND REGRESSION TREES Hary Mega Gancar Prakosa 1307 100 077 Dosen Pembimbing Dr. Suhartono,
Lebih terperinciJURNAL SAINS DAN SENI POMITS Vol. 3, No.1, (2014) ( X Print) D-54
JURNAL SAINS DAN SENI POMITS Vol. 3, No.1, (2014) 2337-3520 (2301-928X Print) D-54 Klasifikasi Pengangguran Terbuka Menggunakan CART (Classification and Regression Tree) di Provinsi Sulawesi Utara Febti
Lebih terperinciBAB I PENDAHULUAN 1.1.Latar Belakang Masalah
BAB I PENDAHULUAN 1.1.Latar Belakang Masalah Mengingat kondisi perekonomian saat ini sedang tumbuh dan berkembang secara signifikan, di negara khususnya Indonesia, memiliki peningkatan permintaan produk
Lebih terperinciPOHON KLASIFIKASI DAN POHON REGRESI KEBERHASILAN MAHASISWA PASCASARJANA PROGRAM STUDI STATISTIKA IPB
Forum Statistika dan Komputasi, April 2005, p: 15 21 ISSN : 08538115 Vol. 10 No. 1 POHON KLASIFIKASI DAN POHON REGRESI KEBERHASILAN MAHASISWA PASCASARJANA PROGRAM STUDI STATISTIKA IPB Ida Mariati H. 1),
Lebih terperinciPENGGEROMBOLAN DUA TAHAP DESA-DESA DI JAWA TENGAH ALIFTA DIAH AYU RETNANI
PENGGEROMBOLAN DUA TAHAP DESA-DESA DI JAWA TENGAH ALIFTA DIAH AYU RETNANI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR 2012 RINGKASAN ALIFTA DIAH AYU RETNANI.
Lebih terperinciKLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE CHAID (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN CART (CLASSIFICATION AND REGRESSION TREE)
Surabaya, 3 Juli 2013 Seminar Hasil Tugas Akhir KLASIFIKASI PENYAKIT DIABETES MELITUS DENGAN METODE (CHI SQUARE AUTOMATIC INTERACTION DETECTION) DAN (CLASSIFICATION AND REGRESSION TREE) Dosen Pembimbing
Lebih terperinciEVALUASI PELAKSANAAN KURIKULUM SISTEM MAYOR-MINOR PROGRAM PENDIDIKAN SARJANA (S1) INSTITUT PERTANIAN BOGOR DICKY PRATAMA YENDRA
EVALUASI PELAKSANAAN KURIKULUM SISTEM MAYOR-MINOR PROGRAM PENDIDIKAN SARJANA (S1) INSTITUT PERTANIAN BOGOR DICKY PRATAMA YENDRA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT
Lebih terperinciMETODE POHON REGRESI DAN PROSEDUR REGRESI BERTATAR UNTUK SEGMENTASI DATA
JMA, VOL. 7, NO.1, JULI, 2008, 39-54 39 METODE POHON REGRESI DAN PROSEDUR REGRESI BERTATAR UNTUK SEGMENTASI DATA BUDI SUHARJO Departemen Matematika, Fakultas Matematika dan Imu Pengetahuan Alam, Institut
Lebih terperinciBAGGING CLASSIFICATION TREES UNTUK PREDIKSI RISIKO PREEKLAMPSIA (Studi Kasus : Ibu Hamil Kategori Penerima Jampersal di RSUD Dr. Moewardi Surakarta)
Prediksi Risiko (Moch. Abdul Mukid) BAGGING CLASSIFICATION TREES UNTUK PREDIKSI RISIKO PREEKLAMPSIA (Studi Kasus : Ibu Hamil Kategori Penerima Jampersal di RSUD Dr. Moewardi Surakarta) Moch. Abdul Mukid
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Kesejahteraan umum merupakan salah satu tujuan dari pembangunan nasional Negara Indonesia. Hal ini disebutkan dengan jelas pada Pembukaan Undang-Undang dasar 1945 di
Lebih terperinciANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART)
ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN BOOTSTRAP AGGREGATING CLASSIFICATION AND REGRESSION TREES (BAGGING CART) SKRIPSI Disusun Oleh : DESY RATNANINGRUM 24010211140097 JURUSAN STATISTIKA FAKULTAS
Lebih terperinciKLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART
KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART SKRIPSI Disusun Oleh : NOVIE ERISKA ARITONANG 24010211140081 JURUSAN STATISTIKA FAKULTAS SAINS DAN
Lebih terperinciBAB I PENDAHULUAN. 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Analisis survival merupakan cabang dari ilmu statistika yang meliputi metode untuk menganalisis terjadinya suatu peristiwa (event) dengan waktu pengamatan tertentu.
Lebih terperinciBambang Widjanarko Otok (1), dan Dian Seftiana (2) (1,2) Jurusan Statistika, FMIPA, Institut Teknologi Sepuluh Nopember (ITS)
1 Klasifikasi Rumah Tangga Sangat Miskin di Kabupaten Jombang Menurut Paket Bantuan Rumah Tangga yang Diharapkan dengan Pendekatan Random Forests Classification and Regression Trees (RF-CART) Bambang Widanarko
Lebih terperinciModel Machine Learning CART Diabetes Melitus
Prosiding SI MaNIs (Seminar Nasional Integrasi Matematika dan Nilai Islami) Vol.1, No.1, Juli 2017, Hal. 485-491 p-issn: 2580-4596; e-issn: 2580-460X Halaman 485 Ria Dhea Layla Nur Karisma 1, Bambang Widjanarko
Lebih terperinciPENDEKATAN CART UNTUK MENDAPATKAN FAKTOR YANG MEMPENGARUHI TERJANGKITNYA PENYAKIT DEMAM TIFOID DI ACEH UTARA
PENDEKATAN CART UNTUK MENDAPATKAN FAKTOR YANG MEMPENGARUHI TERJANGKITNYA PENYAKIT DEMAM TIFOID DI ACEH UTARA Dina Yuanita Mahasiswa Jurusan Statistika FMIPA-ITS (1306 100 056) M. Syahid Akbar, S.Si, M.Si
Lebih terperinciJurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN
Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari 2017 50 APLIKASI KLASIFIKASI ALGORITMA C4.5 (STUDI KASUS MASA STUDI MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS MULAWARMAN
Lebih terperinciResume Regresi Linear dan Korelasi
Rendy Dwi Ardiansyah Putra 7410040018 / 2 D4 IT A Statistika Resume Regresi Linear dan Korelasi 1. Regresi Linear Regresi linear merupakan suatu metode analisis statistik yang mempelajari pola hubungan
Lebih terperinciKAJIAN SENSITIVITAS PARAMETER ALGORITME PADA METODE ROTATION FOREST MUHAMMAD IQBAL
KAJIAN SENSITIVITAS PARAMETER ALGORITME PADA METODE ROTATION FOREST MUHAMMAD IQBAL DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2016 PERNYATAAN MENGENAI
Lebih terperinciANALISIS NILAI EKONOMI LAHAN (LAND RENT) PADA LAHAN PERTANIAN DAN PERMUKIMAN DI KECAMATAN CIAMPEA, KABUPATEN BOGOR. Oleh ANDIKA PAMBUDI A
ANALISIS NILAI EKONOMI LAHAN (LAND RENT) PADA LAHAN PERTANIAN DAN PERMUKIMAN DI KECAMATAN CIAMPEA, KABUPATEN BOGOR Oleh ANDIKA PAMBUDI A14304075 PROGRAM STUDI EKONOMI PERTANIAN DAN SUMBERDAYA FAKULTAS
Lebih terperinciPENYELESAIAN MASALAH PENGIRIMAN PAKET KILAT UNTUK JENIS NEXT-DAY SERVICE DENGAN MENGGUNAKAN TEKNIK PEMBANGKITAN KOLOM. Oleh: WULAN ANGGRAENI G
PENYELESAIAN MASALAH PENGIRIMAN PAKET KILAT UNTUK JENIS NEXT-DAY SERVICE DENGAN MENGGUNAKAN TEKNIK PEMBANGKITAN KOLOM Oleh: WULAN ANGGRAENI G54101038 PROGRAM STUDI MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU
Lebih terperinciIDENTIFIKASI VARIABEL YANG MEMPENGARUHI BESAR PINJAMAN DENGAN METODE POHON REGRESI (Studi Kasus di Unit Pengelola Kegiatan PNPM Mandiri)
IDENTIFIKASI VARIABEL YANG MEMPENGARUHI BESAR PINJAMAN DENGAN METODE POHON REGRESI (Studi Kasus di Unit Pengelola Kegiatan PNPM Mandiri) SKRIPSI Disusun Oleh : SHAUMAL LUQMAN NIM. J2E 009 056 JURUSAN STATISTIKA
Lebih terperinciPendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker pada Pasien Kanker Tiroid
Pendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker pada Pasien Kanker Tiroid Sri Hartati Selviani Handayani dan Santi Wulan Purnami Jurusan Statistika, Fakultas
Lebih terperinciHASIL DAN PEMBAHASAN. Deskripsi Data
metode penarikan contoh yang tepat di survei tahap I. 3. Melaksanakan survei tahap I, untuk mengetahui karakteristik pelayanan program sarjana yang diinginkan mahasiswa. 4. Menyusun kuesioner untuk survei
Lebih terperinciPERBANDINGAN KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES) Abstract
Perbandingan Klasifikasi (Agung Waluyo) PERBANDINGAN KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES) Agung Waluyo 1, Moch. Abdul Mukid 2, Triastuti
Lebih terperinciPendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker pada Pasien Kanker Tiroid
JURNAL SAINS DAN SENI POMITS Vol. 3, No.1, (2014) 2337-3520 (2301-928X Print) D-24 Pendekatan Metode Classification and Regression Tree untuk Diagnosis Tingkat Keganasan Kanker pada Pasien Kanker Tiroid
Lebih terperinciBAB II LANDASAN TEORI
BAB II LANDASAN TEORI Pada BAB II ini akan disampaikan materi-materi yang berkaitan dengan konsep data mining, yang merupakan landasan bagi pembahasan klasifikasi untuk evaluasi kinerja pegawai. 2. 1 Tinjauan
Lebih terperinciPERBANDINGAN ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES)
ISSN: 2339-2541 JURNAL GAUSSIAN, Volume 4, Nomor 2, Tahun 2015, Halaman 215-225 Online di: http://ejournal-s1.undip.ac.id/index.php/gaussian PERBANDINGAN ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN
Lebih terperinciPERBANDINGAN ANALISIS KLASIFIKASI NASABAH MENGGUNAKAN REGRESI LOGISTIK BINER DAN (CLASSIFICATION AND REGRESSION TREES)
PERBANDINGAN ANALISIS KLASIFIKASI NASABAH KREDIT MENGGUNAKAN REGRESI LOGISTIK BINER DAN CART (CLASSIFICATION AND REGRESSION TREES) SKRIPSI Oleh : AGUNG WALUYO 24010210141020 JURUSAN STATISTIKA FAKULTAS
Lebih terperinciMETODE POHON GABUNGAN PADA CART UNTUK ANALISA KESEJAHTERAAN RUMAH TANGGA DI BANJARMASIN
Technologia Vol 7, No.1, Januari Maret 2016 15 METODE POHON GABUNGAN PADA CART UNTUK ANALISA KESEJAHTERAAN RUMAH TANGGA DI BANJARMASIN Galih Mahalisa, S.Kom, M.Kom (galih.mahalisa@gmail.com) ABSTRAK Kemiskinan
Lebih terperinciMetode Ensemble pada CART untuk Perbaikan Klasifikasi Kemiskinan di Kabupaten Jombang
1 Metode Ensemble pada CART untuk Perbaikan Klasifikasi Kean di Kabupaten Jombang Muhammad Jamal Muttaqin, Bambang W. Otok, dan Santi Puteri Rahayu Jurusan Statistika, Fakultas MIPA, Institut Teknologi
Lebih terperinciMETODE KLASIFIKASI BERSTRUKTUR POHON BINER (STUDI KASUS PADA PRAKIRAAN SIFAT HUJAN BULANAN DI BOGOR) 1) T
METODE KLASIFIKASI BERSTRUKTUR POHON BINER (STUDI KASUS PADA PRAKIRAAN SIFAT HUJAN BULANAN DI BOGOR) 1) T Aan Kardiana 2), Aunuddin 3), Aji Hamim Wigena 3), Hari Wijayanto 3) 2) Jurusan Teknik Informatika,
Lebih terperinciEKSPLORASI KINERJA DOSEN TERSERTIFIKASI DALAM MELAKSANAKAN TRIDHARMA PERGURUAN TINGGI DI INDONESIA RIZKY NURKHAERANI
i EKSPLORASI KINERJA DOSEN TERSERTIFIKASI DALAM MELAKSANAKAN TRIDHARMA PERGURUAN TINGGI DI INDONESIA RIZKY NURKHAERANI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN
Lebih terperinciMETODE CART DAN CHAID UNTUK PENGKLASIFIKASIAN MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS JEMBER
1 METODE CART DAN CHAID UNTUK PENGKLASIFIKASIAN MAHASISWA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS JEMBER SKRIPSI Oleh Ida Rahmawati NIM 071810101073 JURUSAN MATEMATIKA FAKULTAS MATEMATIKA
Lebih terperinciPENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI
PENGKAJIAN KEAKURATAN TWOSTEP CLUSTER DALAM MENENTUKAN BANYAKNYA GEROMBOL POPULASI KUDSIATI SEKOLAH PASCASARJANA INSTITUT PERTANIAN BOGOR BOGOR 2006 PERNYATAAN MENGENAI TESIS DAN SUMBER INFORMASI Dengan
Lebih terperinciBAB I PENDAHULUAN 1.1 Latar Belakang
BAB I PENDAHULUAN 1.1 Latar Belakang Penentuan dosen pembimbing tugas akhir masih dilakukan secara manual di Jurusan Teknik Informatika UMM yang hanya mengandalkan pengetahuan personal tentang spesialisasi
Lebih terperinciPERSEPSI DAN SIKAP KONSUMEN TERHADAP KEAMANAN PANGAN SUSU FORMULA DENGAN ADANYA ISU BAKTERI Enterobacter sakazakii DI KECAMATAN TANAH SAREAL BOGOR
PERSEPSI DAN SIKAP KONSUMEN TERHADAP KEAMANAN PANGAN SUSU FORMULA DENGAN ADANYA ISU BAKTERI Enterobacter sakazakii DI KECAMATAN TANAH SAREAL BOGOR SKRIPSI INTAN AISYAH NASUTION H34066065 DEPARTEMEN AGRIBISNIS
Lebih terperinciANALISIS CART KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA DI FEM DAN FAPERTA FIRA NURAHMAH AL AMIN
ANALISIS CART KETEPATAN WAKTU LULUS BERDASARKAN KARAKTERISTIK MAHASISWA DI FEM DAN FAPERTA FIRA NURAHMAH AL AMIN DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR
Lebih terperinciPENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI
PENERAPAN METODE PENGGEROMBOLAN BERDASARKAN GAUSSIAN MIXTURE MODELS DENGAN MENGGUNAKAN ALGORITMA EXPECTATION MAXIMIZATION ULA SUSILAWATI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
Lebih terperinciPENERAPAN MODEL FINITE LENGTH LINE SOURCE UNTUK MENDUGA KONSENTRASI POLUTAN DARI SUMBER GARIS (STUDI KASUS: JL. M.H. THAMRIN, DKI JAKARTA)
PENERAPAN MODEL FINITE LENGTH LINE SOURCE UNTUK MENDUGA KONSENTRASI POLUTAN DARI SUMBER GARIS (STUDI KASUS: JL. M.H. THAMRIN, DKI JAKARTA) EKO SUPRIYADI DEPARTEMEN GEOFISIKA DAN METEOROLOGI FAKULTAS MATEMATIKA
Lebih terperinciPPDAFTAR GAMBAR Gambar Halaman Yuni Melawati, 2013
PPDAFTAR GAMBAR Gambar 2.1 Contoh Pohon Keputusan untuk Mengklasifikasikan Pembelian Komputer... 19 3.1 Diagram CART... 29 3.2 Pohon Keputusan Sementara... 37 3.3 Pohon Keputusan Optimum... 38 3.4 Pohon
Lebih terperinciKETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI REGRESI LOGISTIK MULTINOMIAL
KETEPATAN KLASIFIKASI PEMILIHAN METODE KONTRASEPSI DI KOTA SEMARANG MENGGUNAKAN BOOSTSTRAP AGGREGATTING REGRESI LOGISTIK MULTINOMIAL SKRIPSI Oleh : Ahmad Reza Aditya 24010210130055 JURUSAN STASTISTIKA
Lebih terperinciSKRIPSI. Disusun Oleh : ZULFA WAHYU MARDIKA NIM. J2E
PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART (CLASSIFICATION AND REGRESSION TREES) (STUDI KASUS KREDIT MACET DI PD. BPR-BKK PURWOKERTO UTARA) SKRIPSI Disusun Oleh : ZULFA WAHYU MARDIKA NIM.
Lebih terperinciPenggunaan Pohon Keputusan untuk Data Mining
Penggunaan Pohon Keputusan untuk Data Mining Indah Kuntum Khairina NIM 13505088 Program Studi Teknik Teknik Informatika, Sekolah Teknik Elektro dan Informatika Institut Teknologi Bandung, Jalan Ganesha
Lebih terperinciANALISIS KEPUASAN KONSUMEN TERHADAP ATRIBUT MUTU PELAYANAN WISATA MANCING FISHING VALLEY BOGOR
ANALISIS KEPUASAN KONSUMEN TERHADAP ATRIBUT MUTU PELAYANAN WISATA MANCING FISHING VALLEY BOGOR Oleh : Dini Vidya A14104008 PROGRAM STUDI MANAJEMEN AGRIBISNIS FAKULTAS PERTANIAN INSTITUT PERTANIAN BOGOR
Lebih terperinciSILABUS DAN SAP MATA KULIAH STATISTIKA TERAPAN (AGT6224) BOBOT: 3 (2/1) SKS SIFAT: WAJIB SEMESTER GENAP (SMT III)
1 SILABUS DAN SAP MATA KULIAH STATISTIKA TERAPAN (AGT6224) BOBOT: 3 (2/1) SKS SIFAT: WAJIB SEMESTER GENAP (SMT III) PROGRAM STUDI AGROTEKNOLOGI FAKULTAS PERTANIAN UNIVERSITAS HALU OLEO TAHUN AJARAN 2014/2015
Lebih terperinciRANDOM FOREST DAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) BINARY RESPONSE UNTUK KLASIFIKASI PENDERITA HIV/AIDS DI SURABAYA
RANDOM FOREST DAN MULTIVARIATE ADAPTIVE REGRESSION SPLINE (MARS) BINARY RESPONSE UNTUK KLASIFIKASI PENDERITA HIV/AIDS DI SURABAYA 1 Nidhomuddin, 2 Bambang Widjanarko Otok 1,2 Jurusan Statistika,Fakultas
Lebih terperinciANALISIS PORTOFOLIO KREDIT (KONSUMTIF DAN PRODUKTIF) DAN PENGARUHNYA TERHADAP LABA (STUDI KASUS PT BANK X Tbk) Oleh DIAH RISMAYANTI H
1 ANALISIS PORTOFOLIO KREDIT (KONSUMTIF DAN PRODUKTIF) DAN PENGARUHNYA TERHADAP LABA (STUDI KASUS PT BANK X Tbk) Oleh DIAH RISMAYANTI H24051975 DEPARTEMEN MANAJEMEN FAKULTAS EKONOMI DAN MANAJEMEN INSTITUT
Lebih terperinciEksplorasi Kinerja Dosen Tersertifikasi dalam Melaksanakan Tridharma Perguruan Tinggi di Indonesia
Xplore, 2013, Vol. 2(1):e2(1-8) c 2013 Departemen Statistika FMIPA IPB Eksplorasi Kinerja Dosen Tersertifikasi dalam Melaksanakan Tridharma Perguruan Tinggi di Indonesia Rizky Nurkhaerani, Hari Wijayanto,
Lebih terperinciSemakin besar persentase CCR yang dihasilkan, maka tingkat akurasi yang dihasilkan semakin tinggi (Hair et. al., 1995).
3 fungsi diskriminan cukup untuk memisahkan k buah kelompok. Karena fungsi-fungsi diskriminan tidak saling berkorelasi, maka komponen aditif dari V masing-masing didekati dengan khi-kuadrat dengan V j
Lebih terperinciANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KUNJUNGAN WISATAWAN KE KAWASAN WISATA PANTAI CARITA KABUPATEN PANDEGLANG
ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI KUNJUNGAN WISATAWAN KE KAWASAN WISATA PANTAI CARITA KABUPATEN PANDEGLANG Oleh: RINA MULYANI A14301039 PROGRAM STUDI EKONOMI PERTANIAN DAN SUMBERDAYA FAKULTAS PERTANIAN
Lebih terperinciMETODE CART UNTUK ANALISIS KOLEKTIBILITAS PEMBAYARAN KREDIT PT. N KURNIA SHOLIHAT
METODE CART UNTUK ANALISIS KOLEKTIBILITAS PEMBAYARAN KREDIT PT. N KURNIA SHOLIHAT DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR 2014 PERNYATAAN MENGENAI
Lebih terperinciPENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA
PENERAPAN REGRESI LOGISTIK ORDINAL MULTILEVEL TERHADAP NILAI AKHIR METODE STATISTIKA FMIPA IPB IIN MAENA DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM INSTITUT PERTANIAN BOGOR BOGOR
Lebih terperinciANALISIS LOYALITAS KONSUMEN TERHADAP ROKOK KRETEK DI KECAMATAN BOGOR BARAT. Oleh : Muser Hijrah Fery Andi A
ANALISIS LOYALITAS KONSUMEN TERHADAP ROKOK KRETEK DI KECAMATAN BOGOR BARAT Oleh : Muser Hijrah Fery Andi A.14102695 PROGRAM SARJANA EKSTENSI MANAJEMEN AGRIBISNIS FAKULTAS PERTANIAN INSTITUT PERTANIAN BOGOR
Lebih terperinciHASIL DAN PEMBAHASAN. Metode
nilai mutu beberapa mata kuliah pokok bidang Statistika, yaitu Metode Statistika I, Metode Statistika II, Teori Statistika I, Teori Statistika II, Perancangan Percobaan, dan Metode Penarikan Contoh. Metode
Lebih terperinciSTATISTIKA DASAR MAF Dosen: Dr. Lutfi Rohman Wenny Maulina, M.Si
STATISTIKA DASAR MAF 1212 Dosen: Dr. Lutfi Rohman Wenny Maulina, M.Si Pokok Bahasan Pokok Bahasan KONTRAK PERKULIAHAN UTS 35% UAS 35% TUGAS/QUIZ 20% KEHADIRAN 10% REFERENSI: Walpole, Ronald E. 2011. Probability
Lebih terperinciSIFAT FISIS MEKANIS PANEL SANDWICH DARI TIGA JENIS BAMBU FEBRIYANI
SIFAT FISIS MEKANIS PANEL SANDWICH DARI TIGA JENIS BAMBU FEBRIYANI DEPARTEMEN HASIL HUTAN FAKULTAS KEHUTANAN INSTITUT PERTANIAN BOGOR 2008 RINGKASAN Febriyani. E24104030. Sifat Fisis Mekanis Panel Sandwich
Lebih terperinciANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PERILAKU KONSUMEN DALAM PEMBELIAN MINYAK GORENG BERMEREK DAN TIDAK BERMEREK
ANALISIS FAKTOR-FAKTOR YANG MEMPENGARUHI PERILAKU KONSUMEN DALAM PEMBELIAN MINYAK GORENG BERMEREK DAN TIDAK BERMEREK (Kasus : Rumah Makan di Kota Bogor) EKO SUPRIYANA A.14101630 PROGRAM STUDI EKSTENSI
Lebih terperinciPENERAPAN BAGGING UNTUK MEMPERBAIKI HASIL PREDIKSI NASABAH PERUSAHAAN ASURANSI X
PENERAPAN BAGGING UNTUK MEMPERBAIKI HASIL PREDIKSI NASABAH PERUSAHAAN ASURANSI X Ari Wibowo 1, Ayu Purwarianti 2 Jurusan Teknik Informatika Polteknik Negeri Batam Sekolah Teknik Elektro dan Informatika
Lebih terperinciIV HASIL DAN PEMBAHASAN
tersembunyi berkisar dari sampai dengan 4 neuron. 5. Pemilihan laju pembelajaran dan momentum Pemilihan laju pembelajaran dan momentum mempunyai peranan yang penting untuk struktur jaringan yang akan dibangun.
Lebih terperinciANALISIS KEPUASAN KARYAWAN MELALUI FAKTOR-FAKTOR QUALITY OF WORK LIFE (QWL) DI PT INTI ABADI KEMASINDO. Oleh : ANDINI DHAMAYANTI H
ANALISIS KEPUASAN KARYAWAN MELALUI FAKTOR-FAKTOR QUALITY OF WORK LIFE (QWL) DI PT INTI ABADI KEMASINDO Oleh : ANDINI DHAMAYANTI H24103077 DEPARTEMEN MANAJEMEN FAKULTAS EKONOMI DAN MANAJEMEN INSTITUT PERTANIAN
Lebih terperinciPENGARUH PENINGKATAN JUMLAH PENDUDUK TERHADAP PERUBAHAN PEMANFAATAN RUANG DAN KENYAMANAN DI WILAYAH PENGEMBANGAN TEGALLEGA, KOTA BANDUNG
PENGARUH PENINGKATAN JUMLAH PENDUDUK TERHADAP PERUBAHAN PEMANFAATAN RUANG DAN KENYAMANAN DI WILAYAH PENGEMBANGAN TEGALLEGA, KOTA BANDUNG DIAR ERSTANTYO DEPARTEMEN ARSITEKTUR LANSKAP FAKULTAS PERTANIAN
Lebih terperinciIDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI STATUS ANEMIA PADA IBU HAMIL MENGGUNAKAN METODE CHAID DAN RANDOM FOREST AZYL YUNIA KOMALA SARI
IDENTIFIKASI FAKTOR-FAKTOR YANG MEMPENGARUHI STATUS ANEMIA PADA IBU HAMIL MENGGUNAKAN METODE CHAID DAN RANDOM FOREST AZYL YUNIA KOMALA SARI DEPARTEMEN STATISTIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN
Lebih terperinciMETODE QUEST DAN CHAID PADA KLASIFIKASI KARAKTERISTIK NASABAH KREDIT
E-Jurnal Matematika Vol. 4 (4), November 2015, pp. 163-168 ISSN: 2303-1751 METODE QUEST DAN CHAID PADA KLASIFIKASI KARAKTERISTIK NASABAH KREDIT Nur Faiza 1, I Wayan Sumarjaya 2, I Gusti Ayu Made Srinadi
Lebih terperinciHUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, DENGAN METODA STRATIFIED SYSTEMATIC SAMPLING WITH RANDOM
PENDUGAAN POTENSI TEGAKAN HUTAN PINUS (Pinus merkusii) DI HUTAN PENDIDIKAN GUNUNG WALAT, SUKABUMI, DENGAN METODA STRATIFIED SYSTEMATIC SAMPLING WITH RANDOM START MENGGUNAKAN UNIT CONTOH LINGKARAN KONVENSIONAL
Lebih terperinciEVALUASI KELAYAKAN KREDIT DENGAN METODE CLASSIFICATION AND REGRESION TREE (CART)
EVALUASI KELAYAKAN KREDIT DENGAN METODE CLASSIFICATION AND REGRESION TREE (CART) Mirfan*) Abstract : Credit worthiness evaluation is an important element in the provision of credit to borrowers. Lending
Lebih terperinciUJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR
UJI DAN APLIKASI KOMPUTASI PARALEL PADA JARINGAN SYARAF PROBABILISTIK (PNN) UNTUK PROSES KLASIFIKASI MUTU BUAH TOMAT SEGAR oleh: MOH. KHAWARIZMIE ALIM F14101030 2006 FAKULTAS TEKNOLOGI PERTANIAN INSTITUT
Lebih terperinciBAB I PENDAHULUAN. atau benda ke dalam golongan atau pola-pola tertentu berdasarkan kesamaan ciri.
BAB I PENDAHULUAN 1.1 Latar Belakang Klasifikasi merupakan pengelompokan secara sistematis pada suatu objek atau benda ke dalam golongan atau pola-pola tertentu berdasarkan kesamaan ciri. Masalah klasifikasi
Lebih terperinciKlasifikasi Hasil Pap Smear Test Kanker Serviks Berdasarkan Faktor Resiko (Studi Kasus Di Rumah Sakit Swasta Surabaya
1 Klasifikasi Hasil Pap Smear Test Kanker Serviks Berdasarkan Faktor Resiko (Studi Kasus Di Rumah Sakit Swasta Surabaya Yuristian Ramdani dan Santi Wulan Purnami Jurusan Statistika, Fakultas Matematika
Lebih terperinciPREFERENSI MAHASISWA IPB TERHADAP MATA KULIAH METODE STATISTIKA MENGGUNAKAN ANALISIS KONJOIN
PREFERENSI MAHASISWA IPB TERHADAP MATA KULIAH METODE STATISTIKA MENGGUNAKAN ANALISIS KONJOIN (Studi Kasus: Mahasiswa IPB Program Strata Satu yang Mengambil Mata Kuliah Metode Statistika 2009/2010) EKA
Lebih terperinci