BAB I PENDAHULUAN A. Latar Belakang Ariani Arsad, 2014

dokumen-dokumen yang mirip
A. LATAR BELAKANG MASALAH

KATA PENGANTAR. Bandung, Juli Ariani Arsad

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. A. Latar Belakang Masalah

PERBEDAAN KETEPATAN ESTIMASI TINGKAT KESUKARAN BUTIR TES PILIHAN GANDA PADA PENSKORAN KOREKSI DAN KONVENSIONAL DENGAN PENERAPAN MODEL RASCH

Partial Credit Model (PCM) dalam Penskoran Politomi pada Teori Respon Butir

DEPARTEMEN PENDIDIKAN NASIONAL DIREKTORAT JENDERAL MANAJEMEN PENDIDIKAN DASAR DAN MENENGAH Jakarta 26 Agustus 2008

METHOD OF SCORE EQUALITY AND SAMPLE SIZE

BAB III METODE PENELITIAN

BAB III PROSEDUR PENGEMBANGAN INSTRUMEN DALAM PEMBELAJARAN

PENINGKATAN KOMPETENSI TENAGA PENDIDIK DALAM PENGEMBANGAN TES MENGGUNAKAN METODE EQUATING

BAB I PENDAHULUAN. meningkatkan martabat dan kualitas bangsa. Pendidikan adalah investasi

DAFTAR ISI. A. Latar Belakang... 1 B. Batasan Masalah... 3 C. Rumusan Masalah... 4 D. Tujuan Penelitian... 4 E. Manfaat Penelitian...

Kegiatan Belajar 4: Menelaah Tes Hasil Belajar

BAB III METODE PENELITIAN

ABSTRAK KATA PENGANTAR UCAPAN TERIMA KASIH DAFTAR ISI DAFTAR TABEL DAFTAR GAMBAR DAFTAR LAMPIRAN BAB I PENDAHULUAN

DAFTAR ISI. PERNYATAAN... i KATA PENGANTAR... ii UCAPAN TERIMA KASIH... iii ABSTRAK... vi DAFTAR ISI... vii DAFTAR TABEL... x DAFTAR GAMBAR...

atau siswa yang mendapatkan sekor lebih tinggi daripada kemampuan yang sebenarnya (spuriously high). Sekor bisa menjadi tidak wajar ketika responden

BAB III METODE PENELITIAN

AKURASI METODE CONCORDANCE BERDASARKAN PANJANG TES DAN UKURAN SAMPEL

BAB I PENDAHULUAN. keterampilan yang diperlukan dirinya, masyarakat, bangsa dan Negara. lanjutan dari hasil belajar yang diakui sama/setara SMP/MTs.

ANALISIS SOAL. 1. Analisis Butir Soal 2. Analisis Perangkat Soal

BAB III METODOLOGI PENELITIAN. eksperimen. Pada penelitian ini peneliti melakukan satu macam perlakuan yang

BAHAN AJAR Kompetensi Dasar Pendidikan Jarak Jauh (PJJ) TOPIK-4: Evaluasi HAsil Belajar dalam PJJ

BAB III METODOLOGI PENELITIAN. penelitian deskriptif analisis. Metode penelitian ini diambil karena berkesesuaian

ANALISIS BUTIR SOAL DAN KEMAMPUAN BAHASA INDONESIA SISWA SMK DALAM UJIAN NASIONAL TAHUN 2011

2. Validitas adalah ketepatan mengukur apa yang seharusnya diukur. 8 Dalam. penelitian ini, validitas tes diukur dari materi, konstruksi, dan bahasa.

BAB V SIMPULAN DAN IMPLIKASI

BAB III METODOLOGI PENELITIAN

PENGARUH METODE DAN UKURAN SAMPEL TERHADAP VARIANSI SKOR HASIL PENYETARAAN. Tri Rijanto

BAB III METODE PENELITIAN

BAB I PENDAHULUAN. Evaluasi merupakan salah satu bagian dari proses pembelajaran. Evaluasi itu

Perbandingan Penskoran Dikotomi dan Politomi dalam Teori Respon Butir untuk Pengembangan Bank Soal Matakuliah Matematika Dasar

BAB I PENDAHULUAN. Undang-Undang Nomor 20 Tahun 2003, Sistem Pendidikan Nasional, Pasal 1, ayat (21).

BAB I PENDAHULUAN A. LATAR BELAKANG Komparasi Estimasi Reliabilitas Pada Mata Pelajaran Sejarah Ditinjau Dari Homogenitas Dan Heterogenitas Kelompok

ANALISIS SOAL. 1. Analisis Butir Soal. 2. Analisis Perangkat Soal

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

BAB I PENDAHULUAN. didik. Penilaian hasil belajar dilakukan oleh pendidik, satuan pendidikan dan

BAB I PENDAHULUAN. sendiri. Tuntutan itu sangat wajar dan masuk akal serta bukan termasuk isu

Hal ini sejalan dengan firman Allah SWT dalam Al-Qur an surah Al-Mujadalah

BAB III METODE PENELITIAN. deskriptif. Metode penelitian deskriptif digunakan untuk memecahkan atau

Kegiatan Belajar 3: Menulis Tes Hasil Belajar

PENSKORAN POLITOMI DALAM TEORI RESPON BUTIR MENGGUNAKAN GRADED RESPONSE MODEL (GRM) Kata Kunci: Item Respon Teori (IRT), Graded Response Model (GRM)

III. METODE PENELITIAN. Populasi penelitian ini yaitu siswa kelas VII SMPN 2 Bandar Lampung. pada semester ganjil Tahun Pelajaran 2013/2014.

I. PENDAHULUAN. informasi kepada lembaga, maupun kepada pihak-pihak lain yang. dengan mata pelajaran yang telah diberikan.

EQUATING THE COMBINED DICHOTOMOUS AND POLITOMOUS ITEM TEST MODEL IN AN ACHIEVEMENT TEST. Kartono

Efektivitas Pendekatan Matematika Realistik Ditinjau Dari Sikap Dan Pemahaman Konsep Matematis Siswa

AKTERISTIK BUTIR TES MATEMATIKA PADA TES BUATAN MGMP MATEMATIKA KOTA PALOPO BERDASARKAN TEORI KLASIK

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. Penelitian ini dimaksudkan untuk mengungkapkan seberapa besar hasil

BAB I PENDAHULUAN A. Latar Belakang Masalah Purnama Adek, 2014

PENYETARAAN HORISONTAL PERANGKAT TES UJICOBA UJIAN NASIONAL MATEMATIKA SMA PROGRAM IPA DI SMAN KOTA YOGYAKARTA TAHUN PELAJARAN 2009/2010

Penyetaraan (Equating) Ujian Akhir Sekolah Berstandar Nasional (UASBN) Dengan Teori Tes Klasik

BAB III METODOLOGI PENELITIAN

BAB I PENDAHULUAN. Pendidikan merupakan suatu proses pengubahan tingkah laku dan

BAB I PENDAHULUAN. perkembangan potensi siswa secara optimal. Pada jenjang SMA, upaya

r P1, r P2,..., r p30 r R1, r R2,..., r R30

METODE PENELITIAN. A. Tempat dan Waktu Penelitian

BAB I PENDAHULUAN. akan maju. Indonesia adalah salah satu negara yang terus berupaya menjadi negara

BAB III METODE PENELITIAN. Jenis penelitian ini merupakan penelitian eksperimen (experiment research).

BAB III METODOLOGI PENELITIAN. perkiraan bagi peneliti yang dapat diperoleh melalui eksperimen

BAB III METODE PENELITIAN. Definisi operasional bertujuan memberikan persamaan persepsi terhadap

BAB III METODE PENELITIAN

III. METODE PENELITIAN. Populasi dalam penelitian ini adalah seperangkat soal Latihan Ujian

KUALITAS BUTIR SOAL ULANGAN SEMESTER GENAP IPA BIOLOGI DI SMP TAHUN PELAJARAN 2012/2013 JURNAL. Oleh SRI NURLAILA DJAKARIA NIM :

BAB III METODOLOGI PENELITIAN. Penelitian ini akan dilaksanakan di SMK Negeri 1 Batudaa Kabupaten

NILAI UJIAN NASIONAL DAN PENGUASAAN MATEMATIKA SISWA SMP/MTS

BAB III METODOLOGI PENELITIAN. Definisi operasional diperlukan agar tidak terjadi salah pengertian dan

BAB I PENDAHULUAN 1.1 Latar Belakang

BAB 4 HASIL PENELITIAN

BAB I PENDAHULUAN. Fakultas Pendidikan Teknologi dan Kejuruan (FPTK) Universitas

BAB III METODOLOGI PENELITIAN. Bab ini membahas mengenai hal-hal yang berkaitan dengan metode dan

alam proses pembelajaran, penilaian dilakukan untuk mengukur pencapaian kompetensi

BAB I PENDAHULUAN A. Latar Belakang Masalah

BAB I PENDAHULUAN. akan berorientasi kepada tujuan pembelajaran. Apakah tujuan pembelajaran

RENCANA PELAKSANAAN PEMBELAJARAN

BAB III METODOLOGI PENELITIAN

SALINAN LAMPIRAN PERATURAN MENTERI PENDIDIKAN NASIONAL NOMOR 20 TAHUN 2007 TANGGAL 11 JUNI 2007 STANDAR PENILAIAN PENDIDIKAN

DAFTAR ISI KATA PENGANTAR. BAB I PENDAHULUAN 1 A. Pengukuran dalam Pendidikan 1 B. Teori Sekor Klasik dan Teori Sekor Modern 4

Hasil Ujian Nasional 2016

BAB III METODE PENELITIAN

III. METODE PENELITIAN. Metode yang digunakan dalam penelitian ini adalah research and development

BAB I PENDAHULUAN. A. Latar Belakang. Pendidikan merupakan hal yang terpenting bagi kehidupan

Rapat Koordinasi Sosialisasi UN & USBN Tahun Badan Penelitian dan Pengembangan Kementerian Pendidikan dan Kebudayaan Republik Indonesia

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. tujuan, gambaran hubungan antar variabel, perumusan hipotesis sampai dengan

BAB III METODE PENELITIAN. generalisasi yang terdiri atas: obyek/subyek yang mempunyai kualitas dan

BAB III METODE PENELITIAN O X O

BAB III METODE PENELITIAN. Metode yang digunakan dalam penelitian ini adalah metode quasi. eksperimen dengan one group pre-test and post-test design.

Indeks Integritas UN SMP/MTs Meningkat

BAB III METODE PENELITIAN. A. Jenis Penelitian Jenis penelitian yang digunakan yaitu penelitian eksperimen semu (quasi

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN. Suatu pendekatan metode penelitian digunakan untuk memecahkan

UJIAN SEKOLAH/MADRASAH 12/14/2016

BAB III METODOLOGI PENELITIAN. dilaksanakan adalah randomized control group pretest-posttest design. Dimana

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB I PENDAHULUAN. berpikir dalam menyelesaikan soal. Namun setelah diprediksi lebih lanjut,

II. TINJAUAN PUSTAKA

Transkripsi:

BAB I PENDAHULUAN A. Latar Belakang Peraturan Menteri Pendidikan dan Kebudayaan Nomor 59 Tahun 2011 tentang Kriteria kelulusan peserta didik dari satuan pendidikan dan penyelenggaraan ujian sekolah/madrasah dan ujian nasional menguraikan bahwa Ujian Nasional (UN) bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran tertentu dalam kelompok mata pelajaran ilmu pengetahuan dan teknologi. Tujuan Ujian Nasional (UN) tersebut secara eksplisit mengisyaratkan bahwa Ujian Nasional (UN) merupakan penentu kelulusan bagi setiap peserta didik pada satuan pendidikan tertentu. Dengan demikian, bagi satuan pendidikan Ujian Nasional (UN) merupakan beban berat karena menyangkut krediabilitas dan cerminan kualitas satuan pendidikan. Sehubungan dengan hal tersebut, maka setiap satuan pendidikan berupaya sekuat tenaga untuk mensukseskan pelaksanaan Ujian Nasional (UN) sehingga memperoleh hasil yang memuaskan. Ujian Nasional merupakan salah satu perjuangan akhir dari siswa untuk mengakhiri setiap jenjang pendidikan tertentu, oleh karena itu diperlukan persiapan yang matang untuk menghadapinya, apalagi nilai Ujian Nasional sangat menentukan besar kecilnya peluang dalam memasuki jenjang pendidikan selanjutnya. Ujian ini bertujuan untuk menilai pencapaian kompetensi lulusan secara nasional pada mata pelajaran Matematika, Ilmu Pengetahuan Alam (IPA) Bahasa Indonesia, Bahasa Inggris serta mendorong tercapainya target wajib belajar pendidikan dasar yang bermutu (Depdiknas, 2007:6). Dalam perkembangan ujian nasional, soal UN sejak ujian ini diperkenalkan sudah didesain lebih dari satu paket. Selama beberapa tahun soal UN menggunakan dua paket, yaitu paket A dan paket B dengan tujuan untuk memperkecil angka kecurangan. Pada pelaksanaan UN 2012 soal untuk tingkat SMP/MTs dibuat sekitar lima paket yakni paket A, B, C, D dan E dimana kelima paket naskah ujian untuk tiap mata pelajaran yang akan dibagikan secara acak

2 pada para peserta UN. Mulai tahun 2013, Kemdikbud mengeluarkan format baru untuk naskah soal dan lembar jawaban UN 2013. Barcode digunakan pula dalam pelaksanaan UN tertulis bagi peserta didik jenjang pendidikan SMP/MTs dan SMA/MA/SMK sebagai sesuatu khas terbaru. Selain penggunaan barcode dan penyatuan naskah soal dengan lembar jawaban UN, Kemdikbud juga menyiapkan 20 variasi soal pada UN tahun ini sehingga siswa bisa berkonsentrasi pada soalnya masing-masing tanpa perlu melihat pekerjaan temannya. Penambahan jumlah paket soal ini merupakan cara pemerintah untuk menekan angka kecurangan dalam pelaksanaan ujian nasional. Maklum walaupun selama ini jumlah paket soal sudah cukup banyak, yakni lima, tetapi kebocoran masih terjadi di sejumlah daerah. Meski naskah soal UN memiliki banyak paket, pihak penyelenggara tetap meyakinkan bahwa tingkat kesulitannya tetap sama antara satu soal dan soal yang lainnya. Komposisi soalnya sendiri terdiri dari 70 persen soal sedang, 20 persen soal sulit, dan 10 persen soal mudah. Instrumen penilaian yang digunakan oleh pemerintah dalam bentuk Ujian Nasional (UN) menurut Peraturan Menteri Pendidikan Nasional RI Nomor 20 Tahun 2007 tentang Standar Penilaian Pendidikan memenuhi persyaratan substansi, konstruksi, bahasa, dan memiliki bukti validitas empirik serta menghasilkan skor yang dapat diperbandingkan antar sekolah, antar daerah, dan antar tahun (Depdiknas, 2007:9). Keterbandingan skor antar sekolah, kabupaten/kota, provinsi, dan antar tahun dapat diperoleh jika semua peserta tes mengerjakan soal-soal (paket tes) yang sama. Perbedaan skor antar mereka menunjukkan perbedaan tingkat kemampuannya. Pada program pengujian, khususnya dalam skala besar, penyusunan beberapa perangkat tes yang setara adalah salah satu kegiatan penting karena salah satu tugasnya adalah menjaga keamanan perangkat tes tersebut. Pada taraf tertentu kesetaraan beberapa perangkat tes dapat dilaksanakan pada saat mengembangkan tes itu sendiri, tetapi biasanya bervariasi antara perangkat tes yang satu dengan perangkat tes lainnya terutama dalam hal tingkat kesukaran. Hal ini dapat diatasi

3 dengan melakukan kegiatan penyetaraan skor antar perangkat tes dengan cara yang tepat dan benar. Walaupun sampai taraf tertentu kesetaraan beberapa tes dapat diupayakan pada saat menyusun tes-tes itu sendiri, tetapi pada umumnya variasi taraf sukar antar tes tetap terjadi (Swediati,1997:1). Selain itu, penyetaraan tes perlu dilakukan mengingat bahwa menyusun tes yang benar-benar paralel tidaklah mudah. Jadi secara empirik membuat dua tes yang sama, tidak pernah secara sempurna paralel, terandalkan atau unidimensional, sehingga skor-skor yang dihasilkannya tidak dapat dibandingkan (Grounlund, 1985:169). Jika hasil tes digunakan untuk menentukan kenaikan kelas atau penjurusan program, tentunya hal itu menjadi tidak adil karena tidak dilakukan ekuivalensi skor untuk tes yang berbeda tersebut. Oleh karena itu, penting dilakukan penyesuaian skor-skor tersebut sehingga peserta tes yang berbeda, menggunakan tes yang berbeda tersebut dapat dibandingkan. Ujian nasional menggunakan tes objektif yang terdiri dari butir-butir pilhan ganda yang secara luas dikenal dan digunakan. Soal pilihan ganda terdiri dari suatu masalah yang dinyatakan sebagai pertanyaan langsung atau suatu pernyataan tidak lengkap dan suatu daftar pilihan solusi yang merupakan alternatif atau pilihan jawaban. Keunggulan tes jenis ini diantaranya adalah dapat di skor dengan mudah dan cepat serta ruang lingkup bahan yang ditanyakan sangat luas. Pada soal UN mata pelajaran Matematika SMP/MTs terdapat soal inti (anchor items) sebanyak lima butir dari 40 butir soal atau sebanyak 12,5 persen dalam 20 paket soal. Tujuan anchor items ini diperlukan agar antar paket memiliki keterkaitan yang sama. Dengan menggunakan anchor items dapat dihilangkan bias penyetaraan yang ditimbulkan perbedaan kemampuan dua kelompok atau lebih. Penempatan anchor items dalam paket soal UN diletakkan pada nomor urutan yang sama. Pada situasi demikian, terdapat beberapa paket tes yang digunakan untuk mengukur variabel yang sama, namun skor hasil tes atau skor mentah yang dihasilkan tes tidak dapat langsung diperbandingkan walaupun tes-tes tersebut dibuat dengan kisi-kisi yang sama. Alasannya, skor mentah yang dihasilkan tes

4 sering tidak memiliki titik nol yang sama atau ukuran yang sama. Selanjutnya, untuk menghasilkan skor tes yang dapat diperbandingkan dari beberapa paket tes, perlu disusun skor tes yang memiliki skala tunggal (common scale). Masalah tersebut dapat diatasi dengan melakukan penyetaraan skor yang diperoleh dari peserta yang mengambil tes-tes tersebut yang dikenal sebagai metode penyetaraan (equating). Dengan kata lain penyetaraan adalah proses untuk menentukan hubungan antara skala skor dari dua tes atau lebih tes agar skor-skor tersebut diperlakukan secara adil. Kegiatan penyetaraan tes dapat dilakukan dengan mengembangkan konversi suatu sistem unit tes ke sistem unit tes yang lain sehingga setelah dikonversi skor yang berasal dari dua perangkat tes menjadi setara dan dapat dipertukarkan. Penyetaraan skor dapat digunakan untuk memantau mutu pendidikan. Melalui penyetaraan skor dapat dilakukan pengukuran perkembangan siswa, komparasi hasil tes yang berasal dari perangkat tes yang berbeda. Penyetaraan ini perlu dilakukan agar jangan sampai seseorang dirugikan atau diuntungkan karena kebetulan mengambil perangkat tes yang lebih sukar atau lebih mudah. Di negara maju seperti Amerika Serikat, penyetaraan tes sangat diperlukan oleh lembaga-lembaga yang menangani tes khusus yaitu test battery, misalnya Iowa Test of Basic Skills (ITBS) dan Iowa Test of Educational Development (ITED). Tes tersebut digunakan untuk mengukur perkembangan kemampuan atau prestasi siswa pada jenjang dan kelas tertentu, terdiri dari beberapa tingkat yang terkait dengan umur dan kelas (Hieronymus, et al, dalam Kartono, 2008). Kelompok siswa yang mempunyai umur dan kelas yang sama, dalam perkembangannya, terdapat siswa yang cepat belajarnya dan ada yang lambat belajarnya. Khusus untuk siswa yang cepat belajarnya, siswa tersebut cocok diberi tes tingkat lanjut, tetapi untuk anak yang lambat belajarnya, siswa tersebut tidak cocok diberi tes tingkat lanjut. Tidak perlu diadakan tes tingkat lanjut untuk siswa yang lambat belajar, karena tes yang terlalu sulit dapat menyebabkan siswa frustasi, cukup dilakukan penyesuaian skor pada tes tingkat di bawahnya untuk mengetahui kemampuan pada tes tingkat lanjut.

5 Dengan memfasilitasi siswa-siswa dengan kemampuan yang berbeda, akan terdapat beberapa paket tes dengan tingkat yang berbeda, skala skor hasil tes berbeda. Perlu diadakan penyesuaian skor yang berasal dari hasil tes dengan tingkat yang berbeda pada skala yang sama, sehingga hasil tes dapat diperbandingkan. Dalam hal ini, untuk menyesuaikan skor-skor dari beberapa paket tes dengan tingkat yang berbeda agar skor tersebut dapat dibandingkan juga diperlukan penyetaraan tes. Penyetaraan atau equating merupakan suatu prosedur secara empiris dalam rangka menyetarakan skor dari perangkat tes yang satu ke perangkat tes yang lain. Melalui proses penyetaraan yang dilakukan dengan benar, dapat diukur perkembangan dan memetakan berbagai kecenderungan, serta mendapatkan dan menggabungkan informasi dan perangkat tes yang berbeda. Hasil penyetaraan memungkinkan kita melakukan perbandingan atau konvensi secara langsung hasil-hasil tes individu yang mengikuti perangkat tes yang berbeda. Terdapat dua cara penyamaan skor pada teori klasik yaitu penyamaan cara linier dan cara ekuipersentil. Penyetaraan secara linier melalui kesamaan nilai baku dapat dilakukan pada masing-masing rancangan penyetaraan dari rancangan A sampai rancangan D. Pada penyetaraan, gandengan internal atau eksternal adalah sama saja sehingga tidak dibedakan. Penyetaraan secara ekuipersentil adalah penyetaraan pada peringkat persentil yang sama. Peringkat persentil suatu skor responden adalah letak skor itu di dalam kumpulan skor responden yang menyatakan bahwa skor itu lebih tinggi dari sekian persen skor responden lainnya. Pada umumnya penyetaraan ekuipersentil adalah nonlinier. Hal ini berbeda dengan penyetaraan linier yang adalah linier. Menurut Hambleton, Swaminathan, dan Roger (1991:124) asumsi penyetaraan dengan cara linier adalah kedua skor tes distribusinya berbeda. Distribusi tersebut terkait dengan rerata dan simpangan bakunya. Pengukuran dalam dunia pendidikan mengenal dua macam kekeliruan, yaitu kekeliruan acak atau kekeliruan sampel (sampling error) dan kekeliruan sistematik (systematic error). Kekeliruan sampel adalah perbedaan antara keadaan sebenarnya yang ada pada populasi (true score). Hal ini disebabkan oleh karena

6 hasil ukuran pada sampel tersebut hanya merupakan salah satu dari sekian banyak kemungkinan hasil pengukuran yang dapat dicuplik berulang-ulang dari suatu populasi. Kekeliruan sistematik menyebabkan munculnya hasil penyetaraan yang menjurus ke arah yang sama dengan jumlah tertentu. Misalnya, hasil penyetaraan selalu lebih tinggi dalam jumlah tertentu dibandingkan dengan skor sesungguhnya. Kekeliruan semacam ini terjadi karena adanya faktor kesalahan alat ukur (instrumental error) dan faktor kesalahan manusia (human error). Penelitian lebih lanjut yang disarankan oleh Livingston, Doran dan Wright (1990) terhadap kombinasi terbaik penarikan sampel dan metode-metode penyetaraan adalah terkait dengan banyaknya metode penyetaran dan variansinya serta metode sampel yang dimungkinkan. Dengan demikian, uraian di atas memberi gambaran perlu adanya penelitian tentang penyetaraan linier dan penyetaraan ekuipersentil terhadap perangkat tes dalam hal ini soal UN sebagai salah satu upaya pengembangan alat ukur dalam mengevaluasi hasil belajar dalam berbagai bidang ilmu. Matematika sebagai suatu bidang ilmu, diajarkan mulai dari tingkat SD sampai perguruan tinggi. Peran dan pentingnya matematika dalam berbagai ilmu dan juga dalam kehidupan sehari-hari cukup besar dan tidak dapat diabaikan. Di lain pihak prestasi Indonesia dibidang matematika masih tertinggal jauh, dimana pada PISA 2012 Indonesia masih berada pada sepuluh besar peringkat terbawah. Sehubungan dengan masalah pada penelitian ini, maka soal UN matematika yang digunakan untuk penelitian ini adalah tingkat SMP/MTs. B. Identifikasi Masalah Berdasarkan latar belakang masalah maka dapat diidentifikasikan permasalahan yang muncul, sebagai berikut : 1. Proporsi anchor items dalam soal UN sebesar 12,5 persen dalam 20 paket atau sebanyak 5 butir soal dalam 40 butir soal. 2. Skor yang diperoleh dari dua perangkat yang berbeda tidak dapat langsung dibandingkan.

7 3. Terdapat berbagai metode penyetaraan tes, baik yang tercakup dalam teori tes klasik maupun tes modern (teori respon butir). Pada teori klasik terdapat metode penyetaraan linier dan metode penyetaraan ekuipersentil. Dalam teori respon butir, untuk jawaban dikotomi, terdapat metode penyetaraan regresi, rerata dan sigma, tegar rerata dan sigma, dan lengkung karakteristik. 4. Perangkat tes yang disamakan ukurannya harus memenuhi syarat, yaitu mengukur ciri yang sama pada peserta yang setara, reliabilitas yang sama dan merata, dan memiliki taraf kesukaran yang merata. 5. Kekeliruan acak dan kekeliruan sistemik juga mempengaruhi skor hasil penyetaraan. C. Batasan Masalah Dari uraian yang dikemukakan pada identifikasi masalah di atas, penelitian ini dilakukan dengan pendekatan teori tes klasik dengan membatasi masalah pada karakteristik perangkat tes, konversi skor penyetaraan dan skor hasil penyetaraan dengan menggunakan metode linier dan metode ekuipersentil pada dua paket soal UN Matematika SMP/MTs tahun pelajaran 2012/2013 di Kota Ambon yang mempunyai kisi-kisi yang sama dan anchor items yang sama sebesar 12,5%. Terdapat tiga desain dasar yang dapat digunakan untuk pengumpulan data dalam melakukan penyetaraan tes. Desain yang dimaksud adalah desain grup tunggal, desain grup ekuivalen, dan desain tes jangkar. Pemilihan desain yang digunakan dalam penyetaraan sangat tergantung pada situasi pelaksanaannya. Dalam penelitian ini dibatasi pada disain tes jangkar karena merupakan disain yang digunakan dalam UN. D. Rumusan Masalah Berdasarkan uraian pada latar belakang di atas, maka rumusan masalah dalam penelitian ini sebagai berikut: 1. Bagaimanakah karakteristik perangkat tes dari dua instrumen yang digunakan berdasarkan teori tes klasik?

8 2. Bagaimanakah konversi skor hasil penyetaraan dengan menggunakan metode penyetaraan linear dan metode penyetaraan ekuipersentil pada anchor items 12,5%? 3. Apakah terdapat perbedaan hasil penyetaraan bila skor hasil UN pada dua perangkat tes yang berbeda disetarakan menggunakan metode penyetaraan linier dan metode penyetaraan ekuipersentil pada anchor items 12,5%? E. Tujuan Penelitian Sesuai dengan perumusan masalah di atas, maka tujuan penelitian ini adalah: 1. Menganalisis karakteristik dari dua instrumen yang digunakan berdasarkan teori tes klasik. 2. Mendeskripsikan konversi skor hasil penyetaraan dengan menggunakan metode linear dan metode ekuipersentil pada anchor items 12,5%. 3. Membandingkan skor hasil penyetaraan bila skor hasil UN pada dua perangkat tes yang berbeda disetarakan dengan menggunakan metode linear dan metode ekuipersentil pada anchor items 12,5%. F. Manfaat Penelitian Kegunaan hasil penelitian ini dapat memberikan manfaat baik secara teoritis maupun praktis. Secara teoritis, hasil penelitian ini memberikan kontribusi tentang pengukuran dan penilaian pendidikan, khususnya tentang bagaimana memperbandingkan skor ujian nasional. Hasil penelitian ini juga dapat dimanfaatkan sebagai masukan awal untuk melakukan penelitian lanjutan. Secara praktis, penyetaraan diharapkan dapat digunakan sebagai bagian dalam kurikulum diklat oleh lembaga pelaksana diklat bagi tenaga pendidik dan kependidikan. Dengan diketahuinya perbandingan skor ujian nasional dapat digunakan untuk memperbaiki dan meningkatkan mutu pendidikan di daerah.