BAB I PENDAHULUAN 1.1 Latar Belakang

dokumen-dokumen yang mirip
BAB I PENDAHULUAN 1.1.Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

UKDW BAB 1 PENDAHULUAN. 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. ada tiga, yaitu association rules, classification dan clustering.

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. negara di dunia, terutama negara sedang berkembang. Secara umum

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Pengangguran merupakan masalah ekonomi makro yang berpengaruh langsung bagi

BAB I PENDAHULUAN. 1.1 Latar Belakang

Seminar Tugas Akhir. Analisis Klasifikasi Kesejahteraan Rumah Tangga di Propinsi Jawa Timur dengan Pendekatan CART ARCING. Surabaya, Juli 2011

PEMBENTUKAN POHON KLASIFIKASI BINER DENGAN ALGORITMA CART ( CLASSIFICATION AND REGRESSION TREES ) ( STUDI KASUS PENYAKIT DIABETES SUKU PIMA INDIAN )

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1-1

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.1 Latar belakang

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. atau benda ke dalam golongan atau pola-pola tertentu berdasarkan kesamaan ciri.

BAB I PENDAHULUAN. Universitas Pendidikan Indonesia repository.upi.edu

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB 2 LANDASAN TEORI

BAB II TINJAUAN PUSTAKA DAN LANDASAN TEORI. yang tepat. Sistem data mining mampu memberikan informasi yang tepat dan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. yang perlu diketahui, yang disebut sebagai variabel. Variabel adalah sebuah

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB 1 PENDAHULUAN. 1.1 Latar Belakang. Keberhasilan program kesehatan dan program pembangunan sosial ekonomi pada

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN. 1.9 Latar Belakang

METODE ENSEMBLE PADA CART UNTUK PERBAIKAN KLASIFIKASI KEMISKINAN DI KABUPATEN JOMBANG

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

Jurnal Informatika Mulawarman Vol. 12, No. 1, Februari ISSN

BAB III METODE POHON KLASIFIKASI QUEST

BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan

KLASIFIKASI KARAKTERISTIK MAHASISWA UNIVERSITAS COKROAMINOTO PALOPO MENGGUNAKAN METODE NAÏVE BAYES DAN DECISION TREE. Yuli Hastuti

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN Latar Belakang

BAB I PENDAHULUAN. pendapatan perkapita diharapkan masalah-masalah seperti pengangguran, kemiskinan, dan

BAB I PENDAHULUAN 1.1 LATAR BELAKANG

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

APLIKASI KLASIFIKASI PEMENUHAN GIZI PADA LANSIA MENGGUNAKAN METODE DECISION TREE ID3

BINER UNTUK KETEPATAN KLASIFIKASI KESEJAHTERAAN RUMAH TANGGA DI KOTA PATI

BAB I PENDAHULUAN. membutuhkan pembangunan. Pembangunan pada dasarnya adalah suatu proses

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN. dengan dimensi sosial, ekonomi, budaya, dan politik.

PREDIKSI NASABAH POTENSIAL MENGGUNAKAN METODE KLASIFIKASI POHON BINER

BAB I PENDAHULUAN. telah memberlakukan Undang-Undang Nomor 32 tahun 2004 tentang pemerintah

BAB I PENDAHULUAN. pembangunan nasional. Pembangunan nasional dapat dikatakan berhasil apabila

BAB I PENDAHULUAN. yang bertujuan untuk meningkatkan taraf hidup masyarakat. Menurut Todaro dan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN. dihindarkan dari kehidupan bermasyarakat di dunia tidak terkecuali di

BAB I PENDAHULUAN. 1.1 Latar Belakang Masalah. Kemiskinan merupakan hal klasik yang belum tuntas terselesaikan terutama

BAB I PENDAHULUAN Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. Kemajuan suatu negara sangat tergantung pada jumlah penduduk

Pangan merupakan salah satu dari tiga kebutuhan pokok manusia, dan ketersediaan pangan yang cukup adalah masalah yang kompleks yang memiliki

BAB I PENGANTAR. 1.1 Latar Belakang. pendapatan masyarakat. Muara dari semua upaya tersebut adalah mewujudkan

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

PENERAPAN METODE RANDOM FOREST DALAM DRIVER ANALYSIS (The Application of Random Forest in Driver Analysis)

BAB I PENDAHULUAN. 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. masalah infrastruktur yang belum merata dan kurang memadai. Kedua, distribusi yang

Memodelkan regresi logistik biner data set hasil sampel bootstrap B.

BAB I PENDAHULUAN. pada sebuah ketidakseimbangan awal dapat menyebabkan perubahan pada sistem

BAB I PENDAHULUAN 1.1 Latar Belakang

PREDIKSI LAMA STUDI MAHASISWA DENGAN METODE RANDOM FOREST (STUDI KASUS : STIKOM BALI)

PENERAPAN METODE CART

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

BAB 1 PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

BAB I PENDAHULUAN 1.1 Latar Belakang

I. PENDAHULUAN. masalah kompleks yang telah membuat pemerintah memberikan perhatian khusus

KLASIFIKASI STATUS KERJA PADA ANGKATAN KERJA KOTA SEMARANG TAHUN 2014 MENGGUNAKAN METODE CHAID DAN CART

BAB I PENDAHULUAN 1.1. Latar Belakang dan Permasalahan

BAB I PENDAHULUAN. berjudul Kualitas SDM Indonesia di Dunia, Indonesia berada pada peringkat 108

Manfaat Pohon Keputusan

BAB 1 PENDAHULUAN. Jumlah Persentase (Juta) ,10 15,97 13,60 6,00 102,10 45,20. Jumlah Persentase (Juta)

BAB I PENDAHULUAN. waktu mendatang. Perkembangan teknologi informasi membuat pencarian. data data sangat mudah bahkan cenderung berlebihan.

I. PENDAHULUAN. Proses pembangunan memerlukan Gross National Product (GNP) yang tinggi

dengan harga jual yang lebih rendah. Sedangkan diskon atau potongan harga adalah pengurangan harga langsung dari suatu produk yang dilakukan dalam

Penerapan Data Mining dalam Memprediksi Pembelian cat

BAB VI PENUTUP. bab sebelumnya, maka kesimpulan dari penelitian ini adalah:

I. PENDAHULUAN. Keberhasilan perekonomian suatu negara dapat diukur melalui berbagai indikator

BAB I PENDAHULUAN 1.1. Latar Belakang Permasalahan

BAB III REGRESI LOGISTIK BINER DAN CLASSIFICATION AND REGRESSION TREES (CART) Odds Ratio

Transkripsi:

BAB I PENDAHULUAN 1.1 Latar Belakang Kesejahteraan umum merupakan salah satu tujuan dari pembangunan nasional Negara Indonesia. Hal ini disebutkan dengan jelas pada Pembukaan Undang-Undang dasar 1945 di alinea keempat. Kesejahteraan merupakan dambaan setiap menusia dalam hidupnya. Kesejahteraan dapat dikatakan sebagai suatu kondisi ketika seluruh kebutuhan manusia terpenuhi. Terpenuhinya kebutuhan manusia dari kebutuhan yang bersifat paling dasar seperti makan, minum dan pakaian hingga kebutuhan untuk diakui dalam kehidupan masyarakat. Kesejahteraan umum di Indonesia dapat digambarkan salah satunya berdasarkan tingkat kemiskinan penduduk di Indonesia. Terdapat hubungan negatif antara kesejahteraan umum dengan tingkat kemiskinan, semakin rendah tingkat kemiskinan di Indonesia menggambarkan semakin tinggi kesejahteraan penduduk di Indonesia. Kemiskinan menjadi salah satu penyakit dalam perekonomian di hampir setiap negara, terlebih lagi di negara berkembang seperti Indonesia yang masih memiliki tingkat kemiskinan cukup tinggi dibandingkan dengan beberapa negara di sekitarnya. Permasalahan kemiskinan merupakan permasalahan yang kompleks dan bersifat multidimensional. Oleh karena itu, upaya-upaya pengentasan kemiskinan harus dilakukan secara benar, mencakup berbagai aspek kehidupan masyarakat dan dilaksanakan secara terpadu. Kemiskinan merupakan masalah kompleks yang dipengaruhi oleh berbagai faktor yang saling berkaitan. Untuk menanggulangi kemiskinan khusus nya di Indonesia, terlebih dulu ditentukan faktor-faktor yang mempengaruhinya. Masalah kemiskinan yang dihadapi di setiap negara akan selalu dibarengi dengan masalah laju pertumbuhan penduduk yang kemudian menghasilkan pengangguran, tingkat pemenuhan kesehatan masyarakat yang berimbas pada rata-rata harapan hidup suatu

negara dan pendidikan yang menjadi modal utama untuk dapat bersaing di dunia kerja dewasa ini. Karena itu dalam makalah ini, penulis akan banyak membahas ketiga masalah tersebut sebagai beberapa faktor faktor pemicu kemiskinan yang terjadi di Indonesia. Untuk mengetahui pengaruh faktor faktor tersebut dalam mempengaruhi persentase kemiskinan di Indonesia diperlukan suatu metode atau model yang baik. Terdapat beberapa metode atau model yang dapat digunakan untuk mengestimasi persentase kemiskinan berdasarkan faktor faktor yang telah ditentukan oleh peneliti. Model yang sering digunakan adalah dengan menggunakan regresi konvensional. Namun, dewasa ini sering dijumpai beberapa kendala pada data penelitian yang bila digunakan dengan menggunakan metode regresi konvensional menjadi melanggar asumsi yang telah ada sehingga berimbas pada keakuratan hasil estimasinya. Apalagi untuk data regresi semiparametrik, metode yang selama ini ada untuk menyelesaikan kasus ini adalah dengan menggunakan teknik smoothing yang cenderung memiliki banyak aturan dan perhitungan yang rumit. Dengan melihat kondisi-kondisi di atas, maka penulis akan membahas cara mengestimasi persentase kemiskinan dengan menggunakan metode yang menawarkan kemudahan dan fleksibilitas yaitu dengan menggunakan metode regresi random forest yang merupakan pengembangan dari teknik bootstrap pada pohon keputusan. Dari penelitian pengaruh faktor faktor tersebut terhadap persentase kemiskinan di Indonesia, maka akan didapatkan solusi penanggulangan yang lebih efisien dan tepat. 1.2 Pembatasan Masalah Dalam penulisan ini, pembatasan masalah sangat diperlukan untuk menjamin keabsahan dalam kesimpulan yang diperoleh. Pembatasan skripsi ini difokuskan pada penyelesaian regresi semiparametrik dengan menggunakan metode yang lebih mudah dan fleksibel yaitu regresi random forest. Data yang digunakan pada penelitian ini

adalah data sekunder yang memuat empat prediktor. Data pada penelitian ini merupakan data persentase kemiskinan yang terdapat pada kabupaten kabupaten yang terdapat pada berbagai provinsi di pulau Jawa tahun 2012. Dengan variabel yang mepengaruhi persentase kemiskinan yaitu rata-rata harapan hidup, rata-rata lama sekolah, angka melek huruf dan kepadatan penduduk. 1.3 Tujuan Penelitian Adapun tujuan yang ingin dicapai dalam penelitian ini adalah : 1. Sebagai langkah untuk penyusunan dan penulisan skripsi yang merupakan salah satu syarat untuk memperoleh gelar sarjana sains di Program Studi Statistika FMIPA UGM 2. Memperluas wawasan keilmuan terutama teknik penyelesaian regresi dengan cara yang berbeda dari biasanya yaitu dengan menggunakan regresi random forest. 3. Menjelaskan algoritma pengerjaannya secara runtut dan jelas serta membandingkan berbagai nilai m yang dicobakan untuk menghasilkan nilai MSE terkecil. 4. Mengaplikasikan analisis tersebut ke dalam suatu contoh kasus, yaitu untuk menduga pola hubungan dan seberapa besar pengaruh prediktor prediktor terrsebut terhadap persentase kemiskinan di kabupaten kabupaten yang ada di provinsi pada pulau Jawa. 1.4 Manfaat Penelitian 1. Mengaplikasikan ilmu statistika dalam metode regresi yang baru, dengan menggunakan regresi random forest. 2. Menambah ilmu pengetahuan

3. Memberikan pengembangan pertimbangan untuk analisa mengetahui faktor penyebab kemiskinan sehingga dapat lebih bijak dalam menentukan solusi untuk menanggulanginya. 1.5 Tinjauan Pustaka Decision tree atau pohon keputusan merupakan suatu metode klasifikasi yang menggunakan struktur pohon, dimana setiap simpulnya merepresentasikan atribut, cabangnya merepresentasikan nilai dari atribut dan daunnya digunakan untuk merepresentasikan kelas. Decision tree adalah metode klasifikasi yang paling populer dan sering digunakan untuk data yang berjumlah besar atau data dengan variabel independen yang sangat banyak. Metode decision tree ini mengubah fakta yang sangat besar menjadi suatu pohon keputusan yang merepresentasikan aturan. Aturan yang dibangun pun dapat dengan mudah dipahami oleh pengguna. Banyak algoritma yang dapat dipakai dalam pembentukan pohon keputusan, antara lain ID3, CART dan C4.5. CART merupakan metode eksplorasi data yang didasarkan pada teknik decision tree. Pohon klasifikasi dihasilkan saat respon berupa data kategorik, sedangkan pohon regresi dihasilkan saat respon berupa data numerik. Pohon terbentuk dari proses pemilahan rekursif biner pada suatu gugus data sehingga nilai peubah respon pada setiap gugus data hasil pemilahan akan lebih homogen (Breiman et al. 1984) Metode random forest mulai diperbincangkan sejak Breiman menerbitkan metode ini pada machine learning. Dalam tulisannya ini, Breiman berupaya untuk memperbaiki proses pendugaan yang sebelumnya dilakukan oleh decision tree dan CART. Random forest adalah teknik klasifikasi yang terdiri dari kumpulan pohon klasifikasi yang ditumbuhkan * ( ) + dimana * + adalah vektor

random i.i.d dan masing masing pohon yang ada digunakan untuk menguji kelas yang paling popular dari data x yang diinputkan (Breiman, 2001). Konferensi dunia untuk pembangunan sosial mendefinisikan kemiskinan sebagai rendahnya tingkat pendapatan dan sumber daya produktif yang menjamin kehidupan berkesinambungan, kelaparan dan kekurangan gizi, rendahnya tingkat kesehatan, keterbatasan dan kurangnya akses pada pendidikan dan layanan-layanan pokok lainnya, kondisi tak wajar akibat penyakit yang terus meningkat, kehidupan bergelandang dan tempat tinggal yang tidak memadai, lingkungan yang tidak aman, serta diskriminasi dan keterasingan sosial dan dicirikan juga oleh rendahnya tingkat partisipasi dalam proses pengambilan keputusan dan dalam kehidupan sipil, sosial dan budaya. (United Nations, 2006) World Bank mendefinisikan kemiskinan itu merupakan kondisi dimana seseorang tidak dapat menikmati segala macam pilihan dan kesempatan dalam pemenuhan kebutuhan dasarnya seperti tidak dapat memenuhi kesehatan, standar hidup layak, kebebasan, harga diri dan rasa dihormati seperti orang lain. 1.6 Metode Penulisan Metode yang digunakan dalam melakukan penulisan skripsi ini adalah studi literatur. Studi literatur adalah metode pengumpulan data dengan cara mengumpulkan bahan-bahan yang diperoleh dari mempelajari buku-buku literature yang menyangut hal-hal yang akan dibahas serta membandingkan dan menerapkan pada permasalahan yang ada. Sumber literatur yang diperoleh penulis adalah sumber-sumber resmi yang didapatkan dari perpustakaan, buku teori yang berkaitan, jurnal atau review dan informasi dari situs-situs yang mendukung yang diperoleh dari internet. Dalam menyelesaikan penelitian ini, penulis menggunakan bantuan dari beberapa software, yakni R 2.11.1, SPSS 17.0 dan Microsoft Excel 2010.

1.7 Sistematika Penulisan Skripsi ini disusun dengan sistematika penulisan sebagai berikut : BAB I PENDAHULUAN Bab ini berisikan latar belakang masalah, pembatasan masalah, tujuan penulisan, manfaat penulisan, metode penulisan dan sistematika penulisan yang memberikan arahan terhadap penulisan skripsi ini. BAB II DASAR TEORI Bab ini membahas teori-teori penunjang yang akan digunakan dalam pembahasan estimasi persentase kemiskinan dengan menggunakan metode regresi random forest. Teori-teori penunjang tersebut diantaranya adalah variabel random, fungsi densitas, ekspektasi dan variansi variabel random, distribusi peluang bersama, distribusi bersyarat, ekspektasi dan variansi bersyarat, analisis regresi, pertidaksamaan chebychev, konvergensi pada probabilitas, decision tree dan kemiskinan dan factor penyebabnya. BAB III PEMBAHASAN Bab ini membahas secara jelas dan runtut tentang bagaimana algoritma dari random forest dapat menyelesaikan kasus regresi. Dimulai pada penjelasan algoritma CART sampai pada algoritma penggabungan pada random forest. Di bab ini juga dijelaskan bagaimana keakurasian pada regresi random forest. BAB IV STUDI KASUS Bab ini membahas tentang deskripsi data dan juga penerapan aplikasi metode yang digunakan untuk menganalisis faktor faktor yang menyebabkan kemiskinan dan mengestimasi persentase kemiskinan.

BAB V KESIMPULAN DAN SARAN Bab ini berisikan kesimpulan dari hasil pembahasan bab-bab sebelumnya dan juga saran atas kekurangan atau kelebihan dari hasil yang telah dilakukan untuk digunakan sebagai bahan perbaikan penelitian selanjutnya. DAFTAR PUSTAKA LAMPIRAN