Pemodelan Data Besar Klaim Asuransi Kendaraan Bermotor Menggunakan Distribusi Mixture Erlang

dokumen-dokumen yang mirip
BAB II TINJAUAN PUSTAKA

Prosiding Statistika ISSN:

BAB I PENDAHULUAN. memperkecil atau meminimumkan ketidakpastian tersebut. Risiko dapat terjadi

Pemodelan Data Curah Hujan Menggunakan Proses Shot Noise Modeling Rainfall Data Using a Shot Noise Process

Prosiding Statistika ISSN:

Prosiding Statistika ISSN:

Penerapan Model Frailty Weibull-Eksponensial pada Data Tabel Mortalitas Indonesia Tahun 1999

MODEL DISTRIBUSI TOTAL KERUGIAN AGGREGAT MANFAAT RAWAT JALAN BERDASARKAN SIMULASI

BAB I PENDAHULUAN 1.1. Latar Belakang

Penaksiran Parameter Model Kalibrasi Linier yang Berdistribusi Skew-Normal dengan Algoritma-EM

Catatan Kuliah. MA4183 Model Risiko Forecast, assess, and control your risk. Dosen: Khreshna I.A. Syuhada, MSc. PhD.

MA4183 MODEL RISIKO Control your Risk!

Catatan Kuliah. MA4183 Model Risiko

MA4181 MODEL RISIKO Risk is managed, not avoided

MA4183 MODEL RISIKO Control your Risk!

MA4181 MODEL RISIKO Risk is managed, not avoided

Kinerja Metode Pengujian Dua Populasi Berdistribusi Log-Logistik yang Mengandung Pengamatan Tidak Terdeteksi

BAB III MODEL REGRESI BINOMIAL NEGATIF UNTUK MENGATASI OVERDISPERSI PADA MODEL REGRESI POISSON

Catatan Kuliah. MA4183 Model Risiko

Membangkitkan Data Klaim Individu Pemegang Polis Asuransi Kendaraan Bermotor Berdasarkan Data Klaim Agregat

BAB 1 PENDAHULUAN Latar Belakang

Catatan Kuliah. MA4183 Model Risiko Risk: Quantify and Control. Dosen: Khreshna I.A. Syuhada, MSc. PhD.

Catatan Kuliah. MA4183 Model Risiko

M-2 PERHITUNGAN PREMI ASURANSI KENDARAAN MENGGUNAKAN PENDEKATAN DISTRIBUSI PELUANG

Catatan Kuliah. MA4183 Model Risiko Forecast, assess, and control your risk. Dosen: Khreshna I.A. Syuhada, MSc. PhD.

MODEL ASURANSI KENDARAAN BERMOTOR MENGGUNAKAN DISTRIBUSI MIXED POISSON ABSTRACT

PERSATUAN AKTUARIS INDONESIA

MA4181 MODEL RISIKO Risk is managed, not avoided

MA4183 MODEL RISIKO Control your Risk!

BAB III REGRESI SPASIAL DENGAN PENDEKATAN GEOGRAPHICALLY WEIGHTED POISSON REGRESSION (GWPR)

PERSATUAN AKTUARIS INDONESIA

ESTIMASI PARAMETER MODEL REGRESI ZERO ADJUSTED INVERSE GAUSSIAN (ZAIG) UNTUK MENENTUKAN BESAR KLAIM

BAB 2 LANDASAN TEORI

ESTIMASI PARAMETER DISTRIBUSI WEIBULL DENGAN TRANSFORMASI MODEL REGRESI MENGGUNAKAN METODE KUADRAT TERKECIL LINIER

ESTIMASI PARAMETER MODEL MIXTURE AUTOREGRESSIVE (MAR) MENGGUNAKAN ALGORITMA EKSPEKTASI MAKSIMISASI (EM) Abstract

Kinerja Metode Perhitungan Premi Program Asuransi Usaha Tani Padi di Indonesia

BAB II LANDASAN TEORI

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

ESTIMASI PARAMETER DISTRIBUSI WEIBULL DENGAN TRANSFORMASI MODEL REGRESI MENGGUNAKAN METODE KUADRAT TERKECIL LINIER

Prosiding Statistika ISSN:

SIMULASI UNTUK MENENTUKAN MODEL DISTRIBUSI TOTAL KERUGIAN AGREGAT (STUDI KASUS DATA KLAIM POLIS ASURANSI KESEHATAN MANFAAT RAWAT INAP)

Masalah Overdispersi dalam Model Regresi Logistik Multinomial

Aplikasi Pemodelan Klaim Asuransi dengan Pendekatan Mixture Exponential Untuk Mencari Value-at-Risk Sebagai Threshold Dalam Menentukan Nilai Ekstrim

Catatan Kuliah. MA4283 Teori Risiko dan Kredibilitas Forecasting Risk: Precise and Prospective. Dosen: Khreshna I.A. Syuhada, MSc. PhD.

BAB I PENDAHULUAN 1.1. Latar Belakang

Prediksi Indeks Saham Syariah Indonesia Menggunakan Model Hidden Markov

LANDASAN TEORI. Generalized Lambda Distribution (GLD) awalnya diusulkan oleh Ramberg dan

TINJAUAN PUSTAKA Asuransi Kelompok Penyakit Lanjut Usia (Lansia) di Indonesia

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI EKSPONENSIAL. Jln. Prof. H. Soedarto, S.H., Tembalang, Semarang.

II. LANDASAN TEORI. sєs (S ruang sampel) dengan sebuah bilangan real. Salah satu peubah acak adalah

PENDUGAAN PARAMETER BEBERAPA SEBARAN POISSON CAMPURAN DAN BEBERAPA SEBARAN DISKRET DENGAN MENGGUNAKAN ALGORITME EM ADE HARIS HIMAWAN

OPTIMASI PARAMETER α DAN γ DALAM PEMULUSAN EKSPONENSIAL DUA PARAMETER DENGAN METODE MODIFIKASI GOLDEN SECTION

Analisis Survival Parametrik Pada Data Tracer Study Universitas Sriwijaya

ESTIMASI MODEL PERSAMAAN STRUKTURAL MELALUI PENDEKATAN BAYESIAN (Studi Kasus: Data Kinerja Pegawai Universitas Bina Darma Palembang)

Model Regresi Zero Inflated Poisson Pada Data Overdispersion

GENERALIZED LINEAR MODELS (GLM) UNTUK DATA ASURANSI DALAM MENENTUKAN HARGA PREMI

Algoritma Expectation-Maximization(EM) Untuk Estimasi Distribusi Mixture

BAB I PENDAHULUAN 1.1 Latar Belakang

PEMANFAATAN MODEL MIXTURE OF MIXTURE DALAM PENYUSUNAN PORTOFOLIO SAHAM BANK BCA DAN BNI DENGAN MINIM RESIKO

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN Latar Belakang

Generalized Linear Model

LANDASAN TEORI. Dalam proses penelitian pendugaan parameter dari suatu distribusi diperlukan

BAB I PENDAHULUAN. 1.1 Latar Belakang

BAB I PENDAHULUAN 1.1. Latar Belakang

BAB I PENDAHULUAN 1.1 Latar Belakang dan Permasalahan

Generalized Ordinal Logistic Regression Model pada Pemodelan Data Nilai Pesantren Mahasiswa Baru FMIPA Universitas Islam Bandung Tahun 2017

BAB 1 PENDAHULUAN. masing-masing individu untuk terhindar dari kerusakan dan kehilangan. Asuransi

BAB II LANDASAN TEORI

ANALISIS MODEL RISIKO KOLEKTIF PADA ASURANSI JIWA KREDIT MENGGUNAKAN MODEL KLAIM AGREGASI

Catatan Kuliah. MA4283 Teori Risiko dan Kredibilitas Forecasting Risk: Precise and Prospective. Dosen: Khreshna I.A. Syuhada, MSc. PhD.

KAJIAN DATA KETAHANAN HIDUP TERSENSOR TIPE I BERDISTRIBUSI EKSPONENSIAL DAN SIX SIGMA. Victoria Dwi Murti 1, Sudarno 2, Suparti 3

I. PENDAHULUAN. Perkembangan teori statistika telah mempengaruhi hampir semua aspek. Dalam teori statistika dan peluang, distribusi gamma (

ANALISA SAHAM MENGGUNAKAN TRANSFORMASI FOURIER STOKASTIK

ANALISA SAHAM MENGGUNAKAN TRANSFORMASI FOURIER STOKASTIK

ESTIMASI PARAMETER MODEL REGRESI ZERO-INFLATED POISSON (ZIP) MENGGUNAKAN METODE BAYESIAN

ESTIMASI TOTAL DAYA LISTRIK YANG HILANG MELALUI PROSES POISSON TERPANCUNG MAJEMUK

BAB I PENDAHULUAN. Cure rate models merupakan model survival yang memuat cured fraction dan

Bab III Studi Kasus III.1 Decline Rate

MODEL NON LINIER GARCH (NGARCH) UNTUK MENGESTIMASI NILAI VALUE at RISK (VaR) PADA IHSG

BAB I PENDAHULUAN 1.1 Latar Belakang Masalah

DISTRIBUSI ERLANG DAN PENERAPANNYA. Rini Kurniasih 1, Getut Pramesti 2 Mahasiswi Pendidikan Matematika FKIP UNS, Dosen Pendidikan Matematika FKIP UNS

ESTIMASI PARAMETER DISTRIBUSI RAYLEIGH TUNGGAL DAN DISTRIBUSI RAYLEIGH DUA CAMPURAN TUGAS AKHIR. Oleh : ISMA NETI

BAB 2 TINJAUAN PUSTAKA

Model Biaya Garansi Satu Dimensi Polis FRW (Non-Renewing Free Replacement Warranty)

BAB IV HASIL DAN ANALISIS

II. LANDASAN TEORI. beberapa konsep dan teori yang berkaitan dengan penduga parameter distribusi GB2

BAB II TINJAUAN PUSTAKA. keuntungan atau coumpouding. Dari definisi di atas dapat disimpulkan bahwa

BAB I PENDAHULUAN. risiko finansial yang disebabkan oleh peristiwa aktuaria (actuarial events).

BAB I PENDAHULUAN 1.1. Latar Belakang Masalah

BAB I PENDAHULUAN 1.1 Latar Belakang Permasalahan

BAB III ESTIMASI BIAYA GARANSI TV. Pada bab ini akan dibahas tahapan-tahapan yang dilakukan untuk

PENGGUNAAN ANALISIS KETAHANAN HIDUP UNTUK PENENTUAN PERIODE GARANSI DAN HARGA PRODUK PADA DATA WAKTU HIDUP LAMPU NEON

BAB 3 METODOLOGI DAN DATA PENELITIAN

II. TINJAUAN PUSTAKA. 2.1 Fungsi Keberlangsungan Hidup (Survival Function) Misalkan adalah usia seseorang saat menutup polis asuransi, sehingga adalah

ESTIMASI PARAMETER MODEL MIXTURE AUTOREGRESSIVE (MAR) MENGGUNAKAN ALGORITMA EKSPEKTASI MAKSIMISASI (EM)

UJIAN A70 PERIODE JUNI 2014 SOLUSI UJIAN PAI A70. A70-Pemodelan dan Teori Risiko 9/14/2014

BAB I PENDAHULUAN. banyak orang agar mau menjadi pemegang polis pada perusahaan tersebut. Salah

MODEL REGRESI DATA TAHAN HIDUP TERSENSOR TIPE III BERDISTRIBUSI EKSPONENSIAL SKRIPSI

LANDASAN TEORI. menyatakan hubungan antara variabel respon Y dengan variabel-variabel

Transkripsi:

Statistika, Vol. 17 No. 1, 45 51 Mei 2017 Pemodelan Data Besar Klaim Asuransi Kendaraan Bermotor Menggunakan Distribusi Mixture Erlang Indah permatasari, aceng komarudin mutaqin, lisnur wachidah Program Studi Statistika Fakultas MIPA Universitas Islam Bandung Jln. Ranggamalela No. 1 Bandung 40116, e-mail: indahpermatasari.xia3@gmail.com ABSTRAK Distribusi mixture Erlang dengan parameter skala yang sama merupakan salah satu distribusi yang dapat digunakan untuk memodelkan data yang mempunyai karakteristik bermodus banyak (lebih dari satu). Penaksiran parameter distribusi mixture Erlang dengan parameter skala yang sama menggunakan algoritme Expectation-Maximization (EM), sedangkan uji kecocokan model distribusinya akan digunakan uji kecocokan Anderson-Darling. Sebagai bahan aplikasi akan digunakan data besar klaim asuransi kendaraan bermotor di Indonesia yang bersumber dari instansi pemerintah XYZ. Hasil pemodelannya menunjukkan bahwa data besar klaim asuransi kendaraan bermotor Kategori 1 dan 2 Wilayah 1 di Indonesia berdistribusi mixture Erlang dengan parameter skala yang sama dan distribusi Erlang yang dilibatkan sebanyak 2. Dari distribusi mixture Erlang dengan parameter skala yang sama diperoleh nilai taksiran parameter bentuk ; ; taksiran parameter bobot ; ; dan taksiran parameter skala Kata Kunci: Distribusi Mixture Erlang, Modus Banyak, Algoritme EM, Asuransi Kendaraan Bermotor, Uji Anderson-Darling. 1. PENDAHULUAN Kehidupan yang dialami oleh manusia berhadapan dengan suatu keadaan yang tidak dapat diramalkan atau diprediksikan secara tepat. Sehingga keadaan tersebut tidak akan pernah memberikan kepastian yang menyebabkan keadaan tidak pasti. Keadaan inilah yang disebut dengan risiko. Risiko bisa datang dari mana saja. Manusia sebagai makhluk ciptaan Tuhan dianugerahi berbagai kelebihan, sehingga manusia dapat berpikir dan berupaya untuk mengatasi risiko tersebut. Manusia selalu berusaha menghindari risiko-risiko yang timbul dengan cara menghindarinya, atau mengalihkannya kepada pihak lain. Usaha menghindari risiko dengan cara mengalihkannya kepada pihak lain beserta proses pelimpahannya itu merupakan usaha perasuransian. Usaha perasuransian semakin berkembang, karena risiko-risiko yang mungkin terjadi jumlahnya semakin banyak. Oleh karena itu, usaha perasuransian dikenal dan berkembang di sebagian besar negara di dunia, salah satunya adalah Indonesia. Secara garis besar asuransi terdiri dari dua macam, yaitu asuransi jiwa dan asuransi kerugian. Salah satu jenis asuransi kerugian di Indonesia adalah asuransi kendaraan bermotor. Asuransi Kendaraan Bermotor merupakan asuransi yang diminati konsumen karena asuransi ini memberikan pertanggungan atas kerugian/berkurangnya nilai secara finansial atas obyek pertanggungan kendaraan bermotor yang disebabkan karena menabrak, ditabrak, dicuri, terbakar, dan tergelincir, sesuai dengan kondisi yang tercantum dalam Polis Kendaraan Bermotor Indonesia. Seiring dengan perkembangan zaman, banyak perusahaan asuransi yang berlomba-lomba untuk memasarkan produknya, oleh karena itu perlu penetapan besar premi yang bersifat wajar tidak memberatkan tertanggung dan tidak bersifat diskriminatif. Dalam menetapkan besarnya premi ada 2 hal penting yang harus dimodelkan, yaitu besar klaim dan frekuensi klaim. Para aktuaris secara teknis mengolah data klaim asuransi untuk memodelkan frekuensi klaim dan besar klaim yang diajukan agar dapat diperoleh distribusi yang cocok. Distribusi parametrik umum yang sering digunakan untuk memodelkan data besar klaim adalah distribusi gamma, distribusi lognormal, distribusi Weibull, atau distribusi Pareto. 45

46 Indah Permatasari dkk. Distribusi-distribusi tersebut mempunyai karakteristik bermodus satu (bermodus tunggal). Namun demikian, seringkali ada beberapa kumpulan data yang mempunyai karakteristik bermodus banyak (lebih dari satu), oleh karena itu dibutuhkan distribusi untuk memodelkan data yang mempunyai karakteristik bermodus banyak. Ada beberapa distribusi bermodus banyak yang dapat digunakan, diantaranya adalah distribusi hyper-eksponensial; distribusi mixture dari hyper-eksponensial, gamma, lognormal, dan Pareto; serta distribusi mixture Erlang dengan parameter skala yang sama (Lee dan Lin, 2010). Dalam makalah ini akan dibahas pemodelan data besar klaim asuransi kendaraan bermotor menggunakan distribusi mixture Erlang dengan parameter skala yang sama. Berdasarkan uraian latar belakang di atas, maka masalah yang dapat diidentifikasi adalah Bagaimana prosedur pemodelan data menggunakan distribusi mixture Erlang dengan parameter skala yang sama dan penerapan distribusi mixture Erlang dengan parameter skala yang sama dalam memodelkan data besar klaim asuransi kendaraan bermotor di Indonesia. 2. Distribusi Mixture Erlang dengan Parameter Skala yang Sama 2.1. Sifat-sifat Klugman dkk. (2008) menyatakan bahwa peubah acak merupakan komponen mixture dari peubah acak jika fungsi distribusi kumulatifnya adalah: dimana semua dan. Dengan demikian fungsi densitas peluang untuk peubah acak X adalah: Jika peubah acak ;, berdistribusi Erlang dengan parameter bentuk, untuk, dan parameter skala yang sama yaitu, maka distribusi dari peubah acak disebut distribusi mixture Erlang dengan parameter skala yang sama (Lee & Lin, 2010). Fungsi distribusi kumulatif dan fungsi densitas peluang untuk peubah acak yang berdistribusi mixture Erlang dengan parameter skala yang sama adalah sebagai berikut: ( ) Ekspektasi dan varians dari distribusi mixture Erlang dengan parameter skala yang sama masing-masing adalah: ( ) 2.2. Penaksir Kemungkinan Maksimum Misalkan sampel acak berukuran, yaitu dari distribusi mixture Erlang dengan parameter skala yang sama dan fungsi densitasnya ada dalam Persamaan (4). Realisasi dari sampel acak tersebut adalah. Fungsi kemungkinan untuk sampel acak tersebut adalah { }

Pemodelan Data Besar Klaim Asuransi Kendaraan Bermotor... 47 dimana,. Fungsi log-kemungkinannnya adalah: { } Fungsi log-kemungkinan di atas sulit untuk dimaksimumkan karena mengandung logaritma natural dari jumlah (Bilmes, 1998). Salah satu cara untuk mengatasi masalah di atas adalah dengan menggunakan algoritme ExpectationMaximize (algoritme EM). 2.3. Algoritme EM Algoritme EM seringkali digunakan untuk masalah penaksiran parameter dari distribusi mixture. Dalam bagian ini akan diterapkan algoritme EM untuk menaksir parameter distribusi mixture Erlang dengan parameter skala yang sama. Misalkan merupakan peubah laten (pengamatan yang tidak terobservasi) yang menentukan komponen dimana pegamatan berasal. Nilai didefinisikan sebagai berikut: Dengan demikian fungsi kemungkinannya adalah: { ( ( )) Fungsi log-kemungkinannya adalah:., -/ Algoritme EM untuk distribusi mixture Erlang dengan parameter skala yang sama memiliki 2 tahapan yaitu: tahap E (tahap ekspektasi) dan tahap M (tahap Maksimisasi). Tahap E (Tahap Ekspektasi) Mengganti pada Persamaan (10) menjadi, yang menghasilkan ekspektasi logkemungkinan sebagai berikut:, -., -/ dimana adalah:, -, - Tahap M (Tahap Maksimisasi) Maksimumkan Persamaan (11) untuk menaksir dan. Proses pemaksimumannya dilakukan dengan cara menurunkan fungsi Persamaan (11) terhadap parameter-parameternya, taksiran parameter dan pada iterasi ke-k untuk distribusi mixture Erlang dengan parameter skala yang sama menggunakan algoritme EM adalah:

48 Indah Permatasari dkk. 2.4. Penentuan Nilai Awal Nilai awal algoritme EM untuk menaksir parameter distribusi mixture Erlang dengan parameter skala yang sama didasarkan pada pendekatan Tijms. Dengan pendekatan ini, fungsi densitas dari distribusi mixture Erlang dengan parameter skala yang sama dapat didekati oleh:, ( )- Lee dan Lin (2010) menggunakan suku pertama dalam Persamaan (15) untuk taksiran nilai awal parameter distribusi mixture Erlang dengan parameter skala yang sama melalui algoritme EM. Dalam kasus ini,. Langkah pertama akan ditetapkan nilai dan untuk inisialisasi parameter. Untuk setiap yang tetap, ditetapkan sedemikian sehingga sama dengan titik data maksimum. Aturan yang sederhana untuk menentukan nilai adalah menggunakan aturan 80-8 (Lee dan Lin, 2010). Di bawah aturan ini, nilai ditetapkan sedemikian sehingga sama dengan lebar dari interval terpendek yang memuat titik data. Dengan menggunakan aturan ini biasanya akan menghasilkan jumlah distribusi Erlang yang optimal. Bobot,, ditetapkan sebagai fungsi densitas empiris, yaitu frekuensi relatif dari titik data pada interval ( -. Jika ternyata tidak ada titik data dalam ( - untuk beberapa, maka akan selalu bernilai nol dalam setiap iterasi. 2.5. Penyesuaian Nilai Taksiran Parameter dan Jumlah Distribusi Erlang yang Optimal Setelah menerapkan algoritme EM dengan nilai taksiran awal sebagaimana yang dimaksud pada Subbab sebelumnya, parameter skala dan bobotnya menghasilkan nilai maksimum lokal untuk fungsi kemungkinan. Hal ini karena parameter bentuknya ditetapkan pada tahap awal dan tidak diubah-ubah melalui algoritme EM. Di bawah ini adalah sebuah prosedur untuk meyesuaikan nilai taksiran parameter distribusi mixture Erlang dengan parameter skala yang sama melalui algoritme EM. 1. Inisialisasi, untuk yang diberikan, algoritme EM dijalankan untuk parameter bentuk * +, dengan fungsi log-kemungkinan. 2. Algoritme EM dijalankan lagi untuk parameter bentuk * + dengan bobot awal * +. Jika nilai fungsi kemungkinannya lebih tinggi, nilai parameter baru menggantikan nilai parameter lama. Lainnya lanjutkan ke langkah 4. Langkah ini diulang sampai fungsi kemungkinan tidak meningkat. 3. Lakukan langkah yang sama pada parameter bentuk kedua sampai parameter bentuk terakhir. 4. Menentukan banyaknya distribusi Erlang yang optimal. Untuk menentukan banyaknya distribusi Erlang yang optimal akan digunakan kriteria BIC (Bayesian Information Criterion). Rumus BIC adalah (16) dimana menyatakan fungsi log-kemungkinan, menyatakan jumlah parameter, dan menyatakan jumlah titik data. Banyaknya distribusi Erlang yang dipilih adalah yang meminimumkan nilai BIC. Untuk menentukan banyaknya distribusi Erlang yang optimal, distribusi Erlang yang mempunyai bobot terkecil dihilangkan satu demi satu sampai diperoleh nilai BIC yang minimum. 3. Aplikasi Data yang digunakan dalam makalah ini adalah data besar klaim total loss dan partial loss pemegang polis asuransi kendaraan bermotor Kategori 1 dan 2 (Rp. 0 sampai Rp. 200.000.000 untuk jenis kendaraan non bus dan non truk) Wilayah 1 (Sumatera dan kepulauan di

Pemodelan Data Besar Klaim Asuransi Kendaraan Bermotor... 49 sekitarnya) di Indonesia yang bersumber dari instansi XYZ. Nilai-nilai statistik dari data tersebut adalah: Nilai maksimum data adalah 199.800.000; Standar deviasi dari data 52.679.365; Skewness dan kurtosis dari data masing-masing adalah -0,45 dan -0,71. Dengan menggunakan pendekatan Tijms, didapat nilai awal taksiran parameter skala dan nilai taksiran parameter bentuknya ada sebanyak 12, yaitu,,,. Langkah selanjutnya menghitung taksiran nilai awal parameter bobot, yaitu frekuensi relatif dari titik data pada interval ( -, untuk. Tabel 1 kolom (4) menyajikan nilai awal parameter bobot Tabel 1 Taksiran Nilai Awal Parameter Bobot Interval ( - F 1 (0;16.675.000] 17 0,0988 2 (16.675.000;33.350.000] 9 0,0523 3 (33.350.000;50.025.000] 5 0,0291 4 (50.025.000;66.700.000] 4 0,0233 5 (66.700.000;83.375.000] 14 0,0814 6 (83.375.000;100.050.000] 12 0,0698 7 (100.050.000;116.725.000] 24 0,1395 8 (116.725.000;133.400.000] 27 0,1570 9 (133.400.000;150.075.000] 17 0,0988 10 (150.075.000;166.750.000] 19 0,1105 11 (166.750.000;183.425.000] 14 0,0814 12 (183.425.000;200.100.000] 10 0,0581 Langkah selanjutnya adalah menghitung nilai taksiran parameter distribusi mixture Erlang dengan parameter skala yang sama melalui algoritme EM menggunakan software Matlab R2015b dengan nilai awal yang telah diperoleh di atas. Hasil taksiran parameter untuk distribusi mixture Erlang dengan parameter skala yang sama disajikan pada Tabel 2. Tabel 2 Nilai Taksiran Parameter 1 2 4,12 2 2 0,1865 3 5 1,04 4 7 4,67 5 8 3,19 6 9 4,86 7 11 3,83 8 11 7,24 9 16 1,53 10 13 0,8135 9.924.437

50 Indah Permatasari dkk. Langkah berikutnya adalah menentukan banyaknya distribusi Erlang yang optimal dengan jalan menghilangkan satu demi satu distribusi Erlang yang mempunyai bobot terkecil sampai diperoleh nilai BIC yang minimum. Tabel 3 menyajikan nilai BIC distribusi mixture Erlang dengan parameter skala yang sama untuk berbagai banyaknya distribusi Erlang yang dilibatkan. Terlihat bahwa nilai BIC minimum dimiliki oleh distribusi mixture Erlang dengan parameter skala yang sama dan distribusi Erlang yang dilibatkan sebanyak 2. Dengan demikian distribusi yang dipilih untuk memodelkan data besar klaim asuransi kendaraan bermotor Kategori 1 dan 2 Wilayah 1 di Indonesia adalah distribusi mixture Erlang dengan parameter skala yang sama dan distribusi Erlang yang dilibatkan sebanyak 2. Nilai-nilai taksiran parameter untuk distribusi tersebut disajikan dalam Tabel 4. Tabel 3 Nilai BIC Distribusi Mixture Erlang dengan Parameter Skala yang Sama untuk Berbagai Banyaknya Distribusi Erlang yang Dilibatkan Banyaknya Distribusi Erlang BIC 10 21 6.665,5995 9 19 6.718,6554 8 17 6.708,3597 7 15 6.698,0648 6 13 6.687,7698 5 11 6.677,4748 4 9 6.667,1798 3 7 6.656,8848 2 5 6.583,2396 1 3 7.180,2693 Tabel 4 Nilai-Nilai Taksiran Parameter untuk Distribusi Mixture Erlang dengan Parameter Skala yang Sama 2 13 0,1865 0,8135 9.924.437 Dengan menggunakan uji kecocokan Anderson-Darling, dapat disimpulkan bahwa data besar klaim kendaraan bermotor Kategori 1 dan 2 Wilayah 1 di Indonesia berdistribusi mixture Erlang dengan parameter skala yang sama dan distribusi Erlang yang dilibatkan sebanyak 2. Fungsi densitas dari distribusi mixture Erlang dengan parameter skala yang sama tersebut adalah: ( ) ( ) Gambar 1 menampilkan kurva fungsi densitas dari distribusi mixture Erlang dengan parameter skala yang sama dan distribusi Erlang yang dilibatkan sebanyak 2 untuk data besar klaim asuransi kendaraan bermotor Kategori 1 dan 2 Wilayah 1 di Indonesia.

f(x) Pemodelan Data Besar Klaim Asuransi Kendaraan Bermotor... 51 1E-08 8E-09 6E-09 r=13; α=0,8135; θ=9.924.437 r=2; α=0,1865; θ=9.924.437 Mixture Erlang 4E-09 2E-09 0 Gambar 1 Kurva Fungsi Densitas dari Distribusi Mixture Erlang dengan Parameter Skala yang Sama dan Distribusi Erlang yang Dilibatkan Sebanyak 2 untuk Data Besar Klaim Asuransi Kendaraan Bermotor Kategori 1 dan 2 Wilayah 1 di Indonesia 4. KESIMPULAN Ada beberapa kesimpulan dalam penulisan makalah ini, yaitu: Distribusi mixture Erlang dengan parameter skala yang sama dapat digunakan untuk memodelkan data yang memiliki modus lebih dari satu. Prosedur pemodelan data menggunakan distribusi mixture Erlang dengan parameter skala yang sama adalah: (1) menentukan maksimum distribusi Erlang yang dilibatkan didasarkan pada pendekatan Tijms, (2) menaksir parameter distribusi mixture Erlang dengan parameter skala yang sama menggunakan Algoritme EM, (3) menentukan banyaknya distribusi Erlang yang optimal didasarkan pada nilai BIC yang minimum, (4) menguji kecocokan distribusi mixture Erlang dengan parameter skala yang sama, salah satunya menggunakan uji kecocokan Anderson- Darling. Dalam makalah ini distribusi mixture Erlang dengan parameter skala yang sama diaplikasikan untuk data besar klaim asuransi kendaraan bermotor Kategori 1 dan 2 Wilayah 1 di Indonesia. Hasil pemodelannya menunjukan bahwa data besar klaim asuransi kendaraan bermotor Kategori 1 dan 2 Wilayah 1 di Indonesia berdistribusi mixture Erlang dengan parameter skala yang sama dan distribusi Erlang yang dilibatkan sebanyak 2. Dari distribusi mixture Erlang dengan parameter skala yang sama diperoleh nilai taksiran parameter bentuk ; ; taksiran parameter bobot ; ; dan taksiran parameter skala DAFTAR PUSTAKA 0 80000000 160000000 240000000 x Bilmes, J.A. (1998). A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models. International Computer Science Institute. Barkeley, California. Klugman, S.A., Panjer, H.H., dan Wilmot, G.E. (2008). Loss Models. From data to decisions. Edisi Ketiga. Hoboken, NJ: John Wiley and Sons. Lee, S.C.K. & Lin, X.S. (2010). Modeling and Evaluating Insurance Losses Via Mixtures of Erlang Distributions. North American Actuarial Journal. Vol. 14 No.1.