Econometric : Model Specification Tjipto Juwono, Ph.D. Nov 18, 2015
Model Spesification Error Salah satu asumsi dalam CLRM adalah bahwa model regresi yang digunakan dalam analisa adalah model yang dispesifikasi secara tepat. Jika tidak, maka kita berurusan dengan Model Spesification Error.
Beberapa Pertanyaan Penting 1 Bagaimana cara menentukan model yang tepat? Apa kriteria penentuan model dalam suatu analisa empirik? 2 Apa saja model specification error yang dijumpai dalam praktek? 3 Apa konsekuensi dari model specification error? 4 Bagaimana cara mendeteksi model specification error? 5 Setelah berhasil mendeteksi adanya model specification error, apa saja tindakan perbaikan yang dapat dilakukan? 6 Bagaimana cara mengevaluasi berbagai model yang diajukan untuk data yang sama?
Kriteria Pemilihan Model 1 Ketersediaan data: Model harus dapat digunakan untuk memprediksi. 2 Konsisten dengan teori: Masuk akal secara ekonomik. 3 Variabel independen harus independen terhadap suku error, baik itu di masa lampau, masa kini, atau di masa depan. 4 Parameter-parameter harus bersifat konstan/stabil. Jika tidak, maka prediksi menjadi sulit atau tidak dapat dipercaya. 5 Koherensi data: residu yang diperoleh dari model harus bersifat random. Jika tidak, maka berarti ada specification error. 6 Jika ada model baru yang diajukan, maka model baru ini harus juga dapat menjelaskan model yang lama.
Mengabaikan variabel yang penting Misalkan model yang benar adalah: Y i = β 1 +β 2 X i +β 3 X 2 i +β 4 X 3 i +u 1i (1) dengan Y = total cost, dan X = output. Namun model yang digunakan adalah: Y i = α 1 +α 2 X i +α 3 X 2 i +u 2i (2) Sehingga suku error dalam persamaan (2) menjadi u 2i = u 1i +β 4 X 3 i (3)
Menambahkan variabel yang tidak relevan Misalkan model yang benar adalah persamaan (1), namun yang digunakan adalah: Y i = λ 1 +λ 2 X i +λ 3 X 2 i +λ 4 X 3 i +λ 5 X 4 i +u 3i (4) Sehingga suku error dalam persamaan (4) menjadi u 3i = u 1i λ 5 X 4 i (5)
Y vs X Y=β 1 +β 2 X 2 200 150 Y 100 50 0 0 5 10 15 20 X Figure 1: Y vs X
Y vs X 2 Y=β 1 +β 2 X 2 200 150 Y 100 50 0 0 100 200 300 400 X 2 Figure 2: Y vs X 2
Menggunakan Bentuk Fungsional yang Keliru lny = γ 1 +γ 2 X i +γ 3 X 2 i +γ 4 X 3 i +u 4i (6) Persamaan (1) berbentuk linear, sedangkan persamaan (6) adalah log-lin.
Bias Pengukuran Dengan Yi = Y i +ǫ i Xi = X i +ω i. Y i = β 1 +β 2X i +β 3X 2 i +β 4X 3 i +u 1i (7)
Kekeliruan Spesifikasi Suku Error Yang benar: Y i = βx i u i (8) Yang digunakan: Y i = αx i +u i (9)
Underfitting vs Overfitting Jika ada variabel independen yang seharusnya ada tetapi diabaikan, maka kita melakukan underfitting Jika kita menambahkan variabel independen yang seharusnya tidak ada, maka kita melakukan overfitting
Beberapa akibat Underfitting Misalkan model yang benar adalah Y i = β 1 +β 2 X 2i +β 3 X3i 2 +u i (10) Tetapi kita menggunakan persamaan (11) untuk analisa regresi. Y i = α 1 +α 2 X 2i +ν i (11) Maka kita melakukan underfitting.
Beberapa akibat Underfitting Jika X 2 berkorelasi dengan X 3 maka r 23 tidak sama dengan nol. Akibatnya, ˆα 1 dan ˆα 2 menjadi bias dan tidak konsisten. Jika X 2 tidak berkorelasi dengan X 3 (r 23 =0). Dalam hal ini, ˆα 1 tetap bias walaupun ˆα 2 menjadi tidak bias. Variance σ 2 menjadi tidak tepat. Variance dari ˆα 2 adalah biased estimator dari variance dari estimator yang sesungguhnya, yaitu ˆβ 2. Confidence interval dan prosedur uji hipotesa akan memberikan konklusi yang kurang tepat tentang seberapa signifikan secara statistik hasil estimasi-estimasi parameternya. Secara umum, hasil prediksi berdasarkan model yang keliru cenderung kurang dapat dipercaya.
Beberapa akibat Overfitting Misalkan model yang benar adalah: Y i = β 1 +β 2 X 2i +u i (12) Tetapi kita menggunakan persamaan (13): Y i = α 1 +α 2 X 2i +α 3 X 3i +ν i (13) Maka kita melakukan overfitting.
Beberapa akibat Overfitting OLS estimator dari parameter dari model yang keliru adalah unbiased dan konsisten. Dengan kata lain: E(α 1 ) = β 1, E( ˆα 2 ) = β 2, E( ˆα 3 ) = β 3 = 0 σ 2 diestimasi dengan cukup tepat. Prosedur confidence interval dan uji hipotesa tetap valid. Variance dari α s secara umum lebih besar dari variance dari β s. Sehingga estimasi α menjadi tidaak efisien.
TUGAS Download Spesifikasi1.xlsx dari website. 1 Buat regresi lengkap Y vs X1, Y vs X1,X2, dan Y vs X1,X2,X3. 2 Berdasarkan regresi di atas, tentukan manakah dari ketiga regresi di atas yang menunjukkan (a) regresi yang benar, (b) underfitting, (c) overfitting. Jelaskan alasannya!