BAB I PENDAHULUAN 1.1. Latar Belakang Masalah Metode regresi merupakan komponen integral dari suatu analisis data yang menggambarkan hubungan antara variabel respon dan satu atau lebih variabel prediktor (Hosmer, 2000). Analisis regresi ini sering digunakan dalam berbagai bidang studi, seperti kesehatan, teknik, sains, ekonomi, manajemen, dan sosial. Seringkali ditemukan kasus dimana data mempunyai variabel respon diskrit. Untuk data yang mempunyai variabel respon berskala ordinal, yaitu mempunyai lebih dari 2 kategori dan setiap kategori dapat diperingkat, dapat digunakan analisis regresi ordinal. Sebagai contoh, beberapa peneliti ingin mengetahui apakah suatu terapi yang baru mereka temukan berhasil meningkatkan tingkat kesembuhan pasien yang mempunyai kebiasaan merokok. Tingkat kesembuhan pasien dibagi menjadi 3 kategori, yaitu 1=memburuk, 2=tidak ada perubahan, dan 3=meningkat. Untuk menyelesaikan permasalahan ini, diambil sejumlah sampel acak dari beberapa rumah sakit yang menerapkan terapi ini, lalu digunakan analisis regresi ordinal untuk mengetahui hubungan antara tingkat kesembuhan pasien dan kebiasaan merokok. Ketika sampel diambil dari beberapa rumah sakit, seringkali pasien yang berasal dari rumah sakit yang sama memiliki karakteristik tingkat kesembuhan yang hampir sama, namun berbeda untuk pasien yang berasal dari rumah sakit yang berbeda. Bila hal ini terjadi, maka analisis regresi ordinal biasa tidak bisa lagi menyelesaikan permasalahan tersebut karena nantinya model regresi yang dihasilkan kurang mampu mengestimasikan model yang diinginkan. Ketika data memiliki keadaan seperti ini, data disebut sebagai data multilevel, yaitu data yang memiliki struktur hierarki, terkluster atau tersarang. Struktur hirarki artinya unitunit pada level yang lebih rendah tersarang atau tercluster dalam unit-unit pada level yang lebih tinggi. 1
Oleh karena itu, berkembanglah alat statistika lainnya, yaitu analisis multilevel untuk menyelesaikan analisis dengan data berstruktur hirarki tersebut. Analisis multilevel ini mampu mengestimasi hubungan antar pengamatan dalam satu kelompok (kluster) dan hubungan antar pengamatan dalam populasi. Untuk data ordinal seperti contoh diatas, analisis multilevel yang tepat digunakan adalah analisis multilevel data ordinal dimana didalamnya mengandung parameter skala dan parameter lokasi. Pada penulisan tugas akhir ini, akan dijelaskan mengenai proses estimasi dan pembentukan model lokasi-skala untuk analisis data ordinal 2-level dengan variansi di dalam-subjek (within-subject) dan antar-subjek (between-subject) pada data dalam contoh studi kasus yang digunakan. 1.2. Tujuan dan Manfaat Penulisan Tujuan dari penulisan tugas akhir ini antara lain: 1. Menyajikan suatu teknik statistika pembentukan model lokasi-skala untuk data ordinal 2-level dengan variansi di dalam dan antar pengamatan. 2. Menunjukan perbandingan antara model non-proportional odds dari model regresi ordinal biasa dengan model regresi ordinal 2-level berdasarkan nilai AIC. 3. Mengaplikasikan metode model lokasi-skala untuk data ordinal 2-level pada data real. 4. Menyajikan persamaan model akhir yang terbentuk berdasarkan contoh studi kasus yang digunakan. Manfaat dari penulisan ini antara lain: 1. Memperoleh model persamaan terbaik yang menerangkan pengaruh variabel prediktor terhadap variabel respon. 2. Sebagai alternative dari model regresi ordinal untuk data 2-level yang memuat variansi antar-subjek dan variansi di dalam-subjek. 3. Menambah keilmuan statistika terutama pada pengembangan Multilevel Model dengan variabel respon berskala ordinal. 2
1.3. Batasan Masalah Agar tidak terjadi penyimpangan dari tujuan semula dan pemecahan masalah lebih terfokus, maka pembahasan tugas akhir ini akan difokuskan pada pembentukan model lokasi-skala untuk data ordinal 2-level dengan variansi di dalam dan antar pengamatan dan interpretasi model. Model ordinal yang digunakan disini adalah model logit ordinal. 1.4. Tinjauan Pustaka Analisis multilevel merupakan suatu analisis statistika yang mampu menangani permasalahan yang muncul pada analisis regresi dimana asumsi setiap pengamatan independen tidak terpenuhi. Analisa ini pernah dibahas sebelumnya oleh: 1. Nindya Arintyas (2011), yang membahas tentang konsep analisis multilevel 2- level untuk regresi linear berganda dan mencari estimasinya dengan metode maksimum likelihood dan OLS. 2. Dwi Riska (2012) yang membahas tentang konsep analisis multilevel 2-level untuk regresi logistik berskala nominal dan mencari estimasinya dengan metode maksimum likelihood. Perbedaan tugas akhir ini dengan kedua tugas akhir yang telah dibahas sebelumnya adalah tugas akhir ini membahas konsep analisis multilevel untuk regresi dengan data yang mempunyai variabel respon ordinal. Model multilevel yang akan digunakan adalah model non-proportional odds yang memuat parameter lokasi dan parameter. Model ini menggunakan metode maksimum likelihood untuk mencari estimasi parameternya. Artikel yang menjadi tinjauan pustaka utama tugas akhir ini adalah jurnal yang berjudul Location-Scale Models for Multilevel Ordinal Data: Between- and Within-Subjects Variance Modelling karangan Donald Hedeeker, Michael Berbaum, dan Robin Mermelstein. Jurnal ini membahas tentang pembentukan model multilevel untuk data ordinal. Secara umum, model regresi dengan respon ordinal memasukkan asumsi proportional odds ke dalam model kovariatnya. Ketika asumsi proportional odds ini terpenuhi, model multilevel yang terbentuk 3
biasa disebut dengan model proportional odds. Parameter lokasi dimasukkan dalam model proportional odds ini untuk mengestimasi variansi subjek pengamatan antar kluster, selanjutnya disebut variansi antar subjek (BS variance). Jurnal ini juga membahas perluasan model multilevel ordinal dimana asumsi proportional odds tidak terpenuhi. dengan memasukkan parameter skala didalamnya. Tujuan dimasukkannya parameter skala berkaitan dengan estimasi variansi pengamatan dalam populasi, selanjutnya disebut variansi di dalam subjek (WS variance). 1.5. Metodologi Penulisan Metodologi penulisan yang digunakan dalam tugas akhir ini merupakan studi literature dan analisis data dengan menggunakan paket program R. Sumber penulisan yang digunakan dalam penyusunan tugas akhir ini bersumber dari buku yang terkait dengan tema tugas akhir, jurnal, serta sumber-sumber lain yang diperoleh melalui internet. 1.6. Sistematika Penulisan Tugas akhir ini disusun dengan sistematika penulisan sebagai berikut: BAB I PENDAHULUAN Bagian ini membahas mengenai pendahuluan dari tema yang diangkat dalam tugas akhir ini, meliputi: latar belakang dan permasalahan tema, tujuan dan manfaat penulisan, tinjauan pustaka, metodologi penulisan, dan sistematika penulisan. BAB II LANDASAN TEORI Bagian ini membahas mengenai teori-teori dasar yang terkait dan menunjang atau diperlukan dalam pemecahan masalah seputar Model lokasi-skala untuk data ordinal 2-level dengan variansi di dalam dan antar pengamatan. BAB III MODEL LOKASI-SKALA UNTUK DATA ORDINAL 2-LEVEL Pada bab ini akan dibahas mengenai konsep umum model multilevel, konsep dasar model lokasi-skala untuk data ordinal 2-4
BAB IV BAB V level dengan variansi di dalam dan antar pengamatan, asumsi, estimator untuk parameter, dan proses pembentukan model terbaik. STUDI KASUS Bagian ini membahas mengenai aplikasi model lokasi-skala untuk data ordinal 2-level dengan variansi di dalam dan antar pengamatan, serta perbandingan antara model proportional odds, partial proportional odds, non-proportional odds dari model regresi ordinal biasa dan model regresi ordinal 2-level pada data real. PENUTUP Bagian ini membahas kesimpulan yang didapat dari hasil pembahasan pada bab-bab sebelumnya dan memberikan saran untuk perkembangan tema tugas akhir ini pada khususnya dalam perkembangan ilmu statistika secara umumnya. 5