: <Dr: SamsuCjfadi, M.Kpm

dokumen-dokumen yang mirip
Keakuratan Hasil Analisis Butir Menurut Teori Tes Klasik dan Teori Respons Butir Ditinjau dari Ukuran Sampel

Kata Kunci: Analisis Butir Tes, Teori respons butir, soal matematika

ANALISIS ITEM DENGAN PENDEKATAN IRT

ANALISIS BUTIR SOAL A. PENDAHULUAN

BAB I PENDAHULUAN. Evaluasi merupakan salah satu bagian dari proses pembelajaran. Evaluasi itu

Laporan Penelitian. Analisis Kualitas Butir Soal Mata Kuliah Membaca 2 (PBIN4329)

HASIL DAN PEMBAHASAN. Tabel 2. Statistik skor mahasiswa UAS TPB IPB mata kuliah Fisika

Suhariyono, Sriyono, Nur Ngazizah

KARAKTERISTIK SOAL UASBN MATA PELAJARAN BAHASA INDONESIA DI DAERAH ISTIMEWA YOGYAKARTA PADA TAHUN PELAJARAN 2008/2009

Partial Credit Model (PCM) dalam Penskoran Politomi pada Teori Respon Butir

Abstrak Pengembangan Bank Soal Matematika. Oleh : Heri Retnawati Jurdik Matematika FMIPA UNY Yogyakarta. Abstrak

Karakteristik Butir Tes dan Analisisnya. Oleh: Heri Retnawati

AKTERISTIK BUTIR TES MATEMATIKA PADA TES BUATAN MGMP MATEMATIKA KOTA PALOPO BERDASARKAN TEORI KLASIK

ANALISIS HASIL TEST. Classical Theory Test. Tingkat Kesukaran(

ANALISIS BUTIR SOAL DENGAN ANBUSO Oleh: Ali Muhson

ABSTRAK.

BAB III METODE PENELITIAN. Metode penelitian adalah cara yang digunakan oleh peneliti dalam

PENSKORAN POLITOMI DALAM TEORI RESPON BUTIR MENGGUNAKAN GRADED RESPONSE MODEL (GRM) Kata Kunci: Item Respon Teori (IRT), Graded Response Model (GRM)

Jurnal Pedagogika dan Dinamika Pendidikan

BAB III METODE PENELITIAN

Jurnal Materi dan Pembelajaran Fisika (JMPF)

KUALITAS TES PRA OLIMPIADE BIDANG STUDI MATEMATIKA TINGKAT SMP DI KOTA BAUBAU

BAB III METODE PENELITIAN. Dalam penelitian ini digunakan metode Pre eksperimental design.

Perbandingan Nilai Ujian Nasional dan Ujian Sekolah Mata Pelajaran Matematika SMA Program IPA Tahun Pelajaran 2010/2011

Skripsi disusun sebagai salah satu syarat untuk memperoleh gelar Sarjana Pendidikan Program Studi Pendidikan Biologi. oleh Mahanani

Perbandingan Nilai Ujian Nasional dan Ujian Sekolah Mata Pelajaran Matematika SMA Program IPA Tahun Pelajaran 2010/2011

BAB 1 PENDAHULUAN A. Latar Belakang

Materi Evaluasi Pembelajaran SD. PRAKTIK ANALISIS BUTIR TES Teguh Prasetyo, M.Pd.

BAB I PENDAHULUAN A. Latar Belakang Masalah

ANALISIS TES BUATAN GURU BIDANG STUDI MATEMATIKA KELAS V SD 1 KATOBENGKE

Aplikasi IRT dalam Analisis Aitem Tes Kognitif

KEBERFUNGSIAN BUTIR DIFERENSIAL PERANGKAT TES UJIAN AKHIR SEKOLAH BERSTANDAR NASIONAL (UASBN) MATA PELAJARAN MATEMATIKA DI KOTA KENDARI

ANALISIS BUTIR SOAL DENGAN PENDEKATAN CLASSICAL TEST THEORY DAN ITEM RESPONSE THEORY. Wiwin Mistiani Teacher Training and Tarbiyah Faculty, IAIN Palu

BAB III METODE PENELITIAN. berupa deskriptif dari gejala yang diamati, berupa angka-angka atau koefisien

KEBERFUNGSIAN ITEM DIFFERENSIAL PADA PERANGKAT TES UJIAN NASIONAL MATEMATIKA SEKOLAH MENENGAH ATAS DI JAWA TENGAH. Samsul Hadi

PENGANTAR TEORI TES KLASIK (TTK)*)

BAB III METODOLOGI PENELITIAN. Metode yang digunakan pada penelitian ini adalah metode quasi

III. METODE PENELITIAN. Pembahasan mengenai bab ini akan dikemukakan mengenai rancangan

ANALISIS BUTIR SOAL DENGAN TEORI TES KLASIK: SEBUAH PENGANTAR. Oleh: Djunaidi Lababa*

BAHAN AJAR EVALUASI PEMBELAJARAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. Metode yang digunakan dalam penelitian ini adalah Pre Experimental Design

BAB III METODE PENELITIAN

ANALISIS BUTIR SOAL UJIAN TENGAH SEMESTER MATA KULIAH BIOLOGI UMUM DI UNIVERSITAS PAPUA

KARAKTERISTIK TES YANG BAIK

LAPORAN HASIL PENELITIAN HIBAH PENELITIAN TIM PASCASARJANA (TAHUN I) MODEL ASESMEN KOMUNIKATIF YANG TERSKALA BAKU DALAM PEMBELAJARAN BAHASA

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. Sebuah penelitian memerlukan metode pendekatan yang digunakan untuk

r P1, r P2,..., r p30 r R1, r R2,..., r R30

BAB III METODE PENELITIAN. Penelitian dilakukan di SMP Negeri 7 Medan yang beralamat di Adam

ANALISIS BUTIR SOAL DENGAN TEORI TES KLASIK

BAB III METODE PENELITIAN. perlakuan, yaitu penerapan strategi pembelajaran Inquiry pada pembelajaran. matematika dan pembelajaran konvensional.

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN. Metode penelitian yang digunakan dalam penelitian ini adalah metode

BAB III METODE PENELITIAN. Penelitian ini dirancang untuk melihat hubungan sebab-akibat antara

BAB III METODE PENELITIAN. Pada penelitian eksperimen murni, kelompok subjek penelitian ditentukan secara

BAB III METODE PENELITIAN. Jenis penelitian ini adalah penelitian deskriptif eksploratif. Pemilihan

Perbandingan Penskoran Dikotomi dan Politomi dalam Teori Respon Butir untuk Pengembangan Bank Soal Matakuliah Matematika Dasar

PENGEMBANGAN DAN ANALISIS SOAL ULANGAN KENAIKAN KELAS KIMIA SMA KELAS X BERDASARKAN CLASSICAL TEST THEORY DAN ITEM RESPONSE THEORY

BAB III METODOLOGI PENELITIAN

KUALITAS TES PILIHAN GANDA (MULTIPLE-CHOICE) SEBAGAI UPAYA MEMBENTUK PROSES BERFIKIR MAHASISWA

BAB III METODOLOGI PENELITIAN. eksperimen. Pada penelitian ini peneliti melakukan satu macam perlakuan yang

BAB III METODOLOGI PENELITIAN

EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI TERHADAP RELIABILITAS SKOR TES

BAB III METODE PENELITIAN. Metode penelitian yang digunakan dalam penelitian ini adalah Quasy

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. 3.1 Metode Penelitian dan Desain Penelitian. mengumpulkan data penelitiannnya (Arikunto, 2006: 160).

BAB III METODA PENELITIAN. 1. Pembelajaran model pembelajaran PQ4R adalah model rangkaian kegiatan

Jurnal Evaluasi Pendidikan Volume 4, No 1, Maret 2016 (58-68) Online:

ANALISIS BUTIR SOAL DAN KEMAMPUAN BAHASA INDONESIA SISWA SMK DALAM UJIAN NASIONAL TAHUN 2011

PERBEDAAN KETEPATAN ESTIMASI TINGKAT KESUKARAN BUTIR TES PILIHAN GANDA PADA PENSKORAN KOREKSI DAN KONVENSIONAL DENGAN PENERAPAN MODEL RASCH

BAB III METODE PENELITIAN. IPA semester ganjil yaitu pada bulan September - Oktober Tahun Ajaran

BAB III METODOLOGI PENELITIAN. proses pembelajara, sampai pada hasil belajarnya. (Sutedi, 2009 : 25).

BAB II KAJIAN TEORETIK

BAB III METODOLOGI PENELITIAN. Metode adalah cara teratur untuk melaksanakan suatu pekerjaan agar

BAB IV PEMBAHASAN HASIL PENELITIAN

ANALISIS BUTIR ULANGAN HARIAN BIOLOGI KELAS XI IPA 3 SMA KARTIKA III-1 BANYUBIRU MENGGUNAKAN KORELASI POINT BISERIAL

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN. Metode merupakan cara yang ditempuh dalam suatu penelitian dengan

BAB III METODE PENELITIAN. yang digunakan pada penelitian ini adalah metode quasi eksperimen. Menurut

BAB III METODE PENELITIAN

A. Pengantar. B. Validitas dan Reliabilitas instrumen

EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI TERHADAP RELIABILITAS SKOR TES. Saifuddin Azwar Universitas Gadjah Mada

BAB III METODE PENELITIAN. pengembangan atau Research and Development (R&D). Menurut Sugiyono

BAB III METODE PENELITIAN. variabel. Secara khusus rancangan penelitian ini menggunakan hubungan

BAB III METODE PENELITIAN

(Luhut Panggabean, 1996: 31)

BAB III METODE PENELITIAN

KUALITAS TES UJIAN NASIONAL MATA PELAJARAN MATEMATIKA SMP PADA SUB RAYON II KOTA KENDARI TAHUN PELAJARAN 2011/2012. Muhammad Idris 1), Arvyaty 2)

BAB III METODE PENELITIAN. Metode penelitian yang digunakan pada penelitian ini adalah metode penelitian

Kriteria Instrumen dalam suatu Penelitian

BAB III METODE PENELITIAN. Dalam bab ini akan diuraikan hal-hal yang berkaitan dengan metode

BAB III METODE PENELITIAN

Transkripsi:

KEMENTERIAN PENDIDIKAN NASIONAL DIREKTORAT JENDERAL MANAJEMEN PENDIDIKAN DASAR DAN MENENGAH DIREKTORAT PEMBINAAN SEKOLAH MENENGAH PERTAMA IKama Vnit %erja y/arasum6er : <Dr: SamsuCjfadi, M.Kpm Nomor: 0630/C3/KP/2010 Diberikan kepada : VNYYogyakarta, %a6upaten SCeman,./ Yogyakarta JZtas partisipasi aktif se6agai (PeCatihan Calon (Pe(atifi(Training o f drainer) 6agi Tun Pengembang Kjiri^uCum (Propinsi yang diselenggarakan diinasimpang - SuraSaya, JL (jubenursuryo 1-3, Sura6aya -Jawa 'Hmur Jakarta, 25 Maret 2010 a.n. Direktur Jenderal Manajemen Pendidikan Dasar dan Menengah Direktur Pembinaan Sekolah Menengah Pertama Didik Suhardi, SH., M.Si. NIP. 19631203 198303 1 004 A

STRUKTUR PROGRAM ToT Tim Pengembang Kurikulum (TPK) Propinsi Tahun 2010 NO. PROGRAM DAN MATERI JUMLAH JAM A. PROGRAM UMUM 1. Kebijakan Direktorat Pembinaan SMP 2 JP 2. Ujian Nasional 2009/2010 2 JP 3. Karakteristik SMP Terbuka 3 JP B. PROGRAM INTI 4. Identifikasi Materi UN yang Sulit Dikuasai Siswa 2 JP 5. Pengkajian dan Pendalaman Materi UN yang Sulit Dikuasai Siswa 8 JP 6. Penjabaran Kisi-Kisi UN 2009/2010 4 JP 7. Pengembangan dan Pembahasan Soal sesuai Kisi-Kisi UN 2009/2010 16 JP 8. Teori Respon Butir 2 JP 9. Praktik Analisis Soal dengan Pendekatan Teori Respon Butir 4 JP 10. Rancangan Bimbingan/Pendampingan Teknis untuk Peningkatan Rerata Nilai UN dan Angka Kelulusan SMP 4 JP 11. Pre & Post test 2 JP 12. Evaluasi Bimtek (Direktorat) 1 JP JUMLAH 50 JP

PENGANTAR TEORI RESPONS BUTIR Materi Disampaikan pada Training of Trainer Tim Pengembang Propinsi di Hotel Ina Simpang Surabaya 25 Maret 2010 Oleh: Samsul Hadi (Fakultas Teknik Universitas Negeri Yogyakarta) Kementerian Pendidikan Nasional Direktur Jenderal Manajemen Pendidikan Dasar dan Menengah Direktorat Pembinaan Sekolah Menengah Pertama 2010

PENGANTAR TEORI RESPONS BUTIR Samsul Hadi (Fakultas Teknik Universitas Negeri Yogyakarta) A. Pendahuluan Tes yang dilalukan oleh guru digunakan untuk mengetahui pencapaian standar kompetensi lulusan atau turunannya berupa standar kompetensi, kompetensi dasar, atau indikator dari suatu mata pelajaran yang harus dikuasai oleh siswa. Supaya tes dapat mengukur pencapaan kompetensi, maka tes harus dibuat memenuhi validitas isi, yaitu butir-butir soal yang ada harus benar-benar diturunkan dari standar kompetensi lulusan, standar kompetensi, kompetensi dasar, atau indikator dari suatu mata pelajaran. Supaya tes memenuhi validitas isi penyusunan butir soal diawali dengan mengkaji standar kompetensi lulusan, standar kompetensi, kompetensi dasar, atau indikator dari suatu mata pelajaran. Berdasarkan kisi-kisi tersebut kemudian dibuat butir-butir soal. Butir-butir soal yang sudah jadi kemudian diminta untuk ditelaah oleh pihak lain yang dianggap mampu dengan memperhatikan: materi, konstruksi, dan bahasa yang digunakan dalam butir soal. Telaah materi bertujuan untuk melihat kesesuaian soal sudah sesuai dengan indikator, kesesuaian materi soal dengan tuntutan kompetensi (urgensi, relevansi, kontinyuitas, keterpakaian yang tinggi), dan kesesuaian materi dengan jenjang jenis sekolah atau tingkat kelas. Telaah konstruksi bertujuan untuk menjamin bahwa soal telah dirumuskan dengan singkat, bebas dari pernyaatn yang tidak relevan, bebas dari pernyataan negatif ganda, dan bebas dari 1

pernyataan yang multi interpretasi. Telaah bahasa dilakukan agar soal komunikatif dan sesuai dengan jenjang pendidikan siswa serta menggunakan bahasa Indonesia yang baku. Hasil telaah materi, konstruksi, dan bahasa dijadikan masukan perbaikan terhadap butir soal yang ada. Setelah perbaikan dilakukan berdasarkan telaat ketiga hal tersebut, soal siap diujicobakan kepada siswa. Data yang diperoleh dari hasil ujicoba perlu dianalisis untuk mengetahui karakteristik soal atau butir soal secara empiris. Ada dua pendekatan untuk menganalisis data hasil ujicoba soal, yaitu menggunakan teori tes klasik dan menggunakan teori respons butir. A. Teori Tes Klasik Kualitas tes atau butir soal penyusun tes yang baik dapat dilihat dari karakteristikya. Karakteristik tes atau butir dapat diketahui dengan dua pendekatan teori. Kedua pendekatan tersebut yakni teori tes klasik dan teori respons butir. Teori tes klasik, atau disebut juga teori tes skor murni klasik, didasarkan pada model aditif, yaitu skor amatan merupakan penjumlahan dari skor sebenarnya dan skor kesalahan pengukuran (Allen & Yen, 1979: 57). Secara matematis pernyataan tersebut dapat dirumuskan sebagai berikut. X = T + E dengan : X : skor amatan, T : skor murni, E : skor kesalahan pengukuran (error score). 2

Kesalahan pengukuran dalam teori tes klasik merupakan kesalahan yang tidak sistematis atau acak. Kesalahan pengukuran merupakan penyimpangan secara teoretis dari skor amatan yang diperoleh dengan skor amatan yang diharapkan. Kesalahan pengukuran yang sistematis dianggap bukan merupakan kesalahan pengukuran. Asumsi-asumsi yang mendasari teori tes klasik tersebut dijadikan dasar untuk mengembangkan rumus-rumus matematis untuk mengestimasi validitas dan koefisien reliabilitas tes. Validitas dan koefisien reliabilitas pada perangkat tes digunakan untuk menilai kualitas tes. Kualitas tes dalam teori tes klasik juga dapat ditentukan dengan indeks kesukaran dan daya pembeda. 1. Tingkat Kesukaran Tingkat kesukaran, disimbolkan dengan p, merupakan salah satu parameter butir soal yang sangat berguna dalam analisis soal. Tingkat kesukaran dapat dihitung dengan berbagai cara, yaitu (a) skala kesukaran linear, (b) skala bivariat, (c) indeks Davis, dan (d) proporsi menjawab benar (Bahrul Hayat, dkk., 1999). Secara matematis tingkat kesukaran yang dihitung dengan proporsi menjawab benar dirumuskan dengan: I B P = dengan keterangan B adalah banyak peserta tes yang menjawa benar, dan N jumlah peserta tes yang menjawab. Dengan rumus tersebut, maka dapat diketahui bahwa jika p mendekati 0, maka soal tersebut terlalu sukar, sedang jika p mendekati 1 maka soal tersebut terlalu mudah. Soal yang terlalu mudah atau 3

terlalu sukar tidak dapat membedakan kemampuan peserta tes sehingga perlu dibuang. Menurut Allen dan Yen (1979) tingkat kesukaran butir soal sebaiknya antara 0,3-0,7. Pada rentang tersebut informasi tentang kemampuan siswa akan diperoleh secara maksimal. Namun angka tersebut perlu disesuaikan dengan tujuan pengembangan soal. Soal untuk keperluan seleksi, remidi, atau ulangan umum seharusnya mempunyai p yang berbeda-beda untuk mencapai tujuan yang maksimal. 2. Daya Beda Daya beda merupakan parameter butir soal yang memberikan informasi tentang seberapa besar butir soal tersebut dapat membedakan peserta tes yang skornya tinggi dan peserta tes yang skornya rendah. Daya beda dapat dihitung dengan beberapa cara antara lain dengan menghitung koefisien korelasi point biserial dan koefisien korelasi biserial. Korelasi point biserial secara matematis dirumuskan sebagai berikut. dimana: Mp Mq ---- rpbis n Vp9 ^t rpbis Mp : koefisien korelasi point biserial : mean skor pada tes dari peserta tes yang memiliki jawaban benar pada butir soal Mq : mean skor pada tes dari peserta tes yang memiliki jawaban salah pada butir soal 4

p : proporsi peserta tes yang menjawab benar pada butir soal q St : 1 - p : standar deviasi seluruh skor tes Korelasi biserial secara matematis dinyatakan dengan rumus sebagai berikut. Mv-M t p dengan keterangan rbis adalah koefisien korelasi biserial, y adalah ordinat p dalam distribusi normal, sedangkan simbol lain sama dengan keterangan sebelumnya. Nilai korelasi point biserial selalu lebih rendah dibanding dengan nilai korelasi biserial. Hubungan antara keduanya dinyatakan dengan rumus: y rpbis rb is i------- vp.q 3. Efektivitas Distraktor Soal pilihan ganda perlu memiliki pengecoh, yaitu jawaban yang tidak bernilai benar. Pengecoh perlu dibuat sedemikian rupa sehingga menarik perhatian peserta tes yang belum memiliki konsep yang baik terhadap materi yang diujikan. Allen dan Yen (1979) menyatakan bahwa pengecoh yang baik minimum berindeks 0,1 yang berupa koefisien korelasi point biserial, bernilai positif untuk kunci jawaban dan bernilai negatif untuk pengecoh. 4. Kesalahan Pengukuran Kesalahan Pengukuran (Standard Error of Measurement, SEM) membantu penyusun tes dalam memahami kesalahan yang bersifat acak yang mempengaruhi 5

skor peserta tes. Kesalahan pengukuran dihitung dengan rumus sebagai berikut (Bahrul Hayat, dkk., 1999): e = xv 1 pxx' dengan keterangan ox adalah standar deviasi dari skor total dan pxx' adalah koefisien reliabilitas tes. 5. Reliabilitas Tes Reliabilitas tes dapat diartikan sebagai keajegan atau konsistensi hasil pengukuran atau hasil tes yang dilakukan pada waktu yang berbeda pada subjek yang sama. Allen dan Yen (1979) menyatakan bahwa tes disebut reliabel jika skor amatan mempunyai korelasi yang tinggi dengan skor yang sebenarnya. Mereka juga menyatakan bahwa reliabilitas merupakan koefisien korelasi antara dua skor amatan yang diproleh dari hasil pengukuran menggunakan tes yang paralel. Reliabilitas suatu tes dapat dihitung dengan beberapa cara dan formula. Cara atau formula belah dua, alfa (a) Cronbach, Guttman, dan paralel dapat digunakan. Nilai hasil perhitungan dari formula tersebut sering dikatakan sebagai koefisien reliabilitas. Mehrens dan Lehmann (1973) menyatakan bahwa meskipun tidak ada ketentuan umum, tetapi secara luas dapat diterima bahwa untuk tes yang digunakan untuk membuat keputusan secara perorangan harus memiliki koefisien reliabilitas minimal 0,85. Keterbatasan pada teori tes klasik adalah adanya sifat group dependent dan item dependent (Hambleton, Swaminathan, & Rogers, 1991: 2-5), juga indeks daya pembeda, tingkat kesulitan, dan koefisien reliabilitas tes juga tergantung kepada peserta tes yang mengerjakan tes tersebut. 6

Untuk mengatasi kelemahan-kelemahan yang ada pada teori tes klasik, para ahli pengukuran mencari model alternatif. Hambleton, Swaminathan, & Rogers (1991: 2-5) serta Hulin, Drasgow, & Parsons (1983), menyatakan seharusnya model alternatif ini memiliki sifat : (a) statistik butir tidak tergantung pada kelompok subjek, (b) skor tes dapat menggambarkan kemampuan subjek, (c) model dinyatakan dalam tingkatan butir, tidak dalam tingkatan tes, d) model tidak memerlukan tes paralel untuk menghitung koefisien reliabilitas, dan e) model menyediakan ukuran yang tepat untuk setiap skor kemampuan. Model alternatif ini adalah model pengukuran yang disebut dengan teori respons butir (Item Response Theory). B. Teori Respons Butir Hambleton, Swaminathan, & Rogers (1991: 2-5) menyatakan bahwa teori respons butir didasarkan pada dua buah postulat, yaitu : (a) prestasi subjek pada suatu butir soal dapat diprediksikan dengan seperangkat faktor yang disebut kemampuan laten (latent traits), dan (b) hubungan antara prestasi subjek pada suatu butir soal dan perangkat kemampuan yang mendasarinya sesuai dengan grafik fungsi naik monoton tertentu, yang disebut kurva karakteristik butir (item characteristic curve, ICC). Kurva karakteristik butir ini menggambarkan bahwa semakin tinggi level kemampuan peserta tes, semakin meningkat pula peluang menjawab benar suatu butir. Ada tiga model logistik dalam teori respons butir, yaitu model logistik satu parameter (1 PL), model logistik dua parameter (2 PL), dan model logistik tiga parameter (3 PL). Perbedaan dari ketiga model tersebut terletak pada banyaknya 7

parameter yang digunakan dalam menggambarkan karakteristik butir dalam model yang digunakan. Parameter-parameter yang digunakan tersebut adalah indeks kesukaran, indeks daya beda butir dan indeks tebakan semu (pseudoguessing). Sesuai dengan namanya, model logistik tiga parameter ditentukan oleh tiga karakteristik butir yaitu indeks kesukaran butir soal, indeks daya beda butir, dan indeks tebakan semu (pseudoguessing). Dengan adanya indeks tebakan semu pada model logistik tiga parameter, memungkinkan subjek yang memiliki kemampuan rendah mempunyai peluang untuk menjawab butir soal dengan benar. Secara matematis, model logistik tiga parameter dapat dinyatakan sebagai berikut (Hambleton, & Swaminathan, 1985 : 49; Hambleton, Swaminathan, & Rogers, 1991: 17). Keterangan : (1 - c.)e Dai(6-bi) ^ (0 ) = Q + 1 + gdai(6-6i) 6 : tingkat kemampuan (ability) peserta tes P (6) : probabilitas peserta tes yang memiliki kemampuan 6 dapat menjawab butir i dengan benar ai bi ci : indeks daya pembeda : indeks kesukaran butir ke-i : indeks tebakan semu butir ke-i e : bilangan natural yang nilainya mendekati 2,718 D : faktor penskalaan yang harganya 1,7. 8

Kurva karakteristik butir soal yang dianalisis dengan model 3 parameter logistik yang memiliki a = 1,00; b = 0,50; dan c = 0,13 ditunjukkan pada Gambar 1. Gambar ini menunjukkan bahwa probabilitas menjawab benar tidak berawal dari 0, tetapi berawal dari 0,13. Jadi jawaban yang sifatnya tebakan mempunyai kemungkinan benar 13,0%. Daya beda pada kurva karakteristik butir ditunjukkan dengan kemiringan grafik yang ada. Semakin vertikal kurva karakteristik suatu butir soal, berarti butir soal tersebut semakin bisa membedakan peserta pandai atau kurang pandai. </> c o Q. CO0> cr < > o <D O 0 1 5.Q ron o p d l l l I l -4-2 0 2 4 Achievement Index (Theta) Gambar 1. Kurva Karakteristik Butir Soal dengan a = 1,00; b = 0,50; dan c = 0,13 Model 2 parameter dan 1 parameter merupakan bagian dari model 3 parameter. Model 2 parameter merupakan kasus khusus dari model 3 parameter, yakni ketika c = 0. Model 1 parameter merupakan kasus khusus dari model 2 parameter, yakni ketika a = 1 atau a merupakan tetapan untuk keseluruhan butir 9

tes. Model 2 parameter logistik secara matematika dapat dirumuskan sebagai berikut: edai(9-bi) sedagkan model 1 parameter logistik rumus matematikanya adalah sebagai berikut: g(0 b{) Estimasi parameter dapat dilakukan dengan menggunakan bantuan program komputer. Nilai-nilai indeks parameter butir dan kemampuan peserta merupakan hasil estimasi. Karena merupakan hasil estimasi, maka kebenarannya bersifat probabilistik dan tidak terlepaskan dengan kesalahan pengukuran. Dalam teori respons butir, kesalahan pengukuran standar (Standard Error of Measurement, SE) berkaitan erat dengan fungsi informasi. Fungsi informasi dengan SE mempunyai hubungan yang berbanding terbalik kuadratik, semakin besar fungsi informasi maka SE semakin kecil atau sebaliknya (Hambleton, Swaminathan, & Rogers, 1991, 94). Jika nilai fungsi informasi dinyatakan dengan I( 0), nilai estimasi SE dinyatakan denganse(0), dan N adalah jumlah butir yang ada, hubungan keduanya menurut Hambleton, Swaminathan, & Rogers (1991 : 94) dan Baker (2001, 119) dinyatakan dengan SE(9) = l C. Kesimpulan Teori tes klasik punya kelemahan pada group dependent dan item dependent. Ini berarti indeks daya pembeda, tingkat kesulitan, dan koefisien 10

reliabilitas tes tergantung kepada peserta tes yang mengerjakan tes tersebut, selain dipengaruhi oleh soal atau butir soal yang ada. Karena itu indeks daya pembeda, tingkat kesulitan, dan koefisien reliabilitas tes berbeda jika soal yang sama dikerjakan oleh dua kelompok siswa yang berbeda, misalnya kelompok siswa yang pandai dan kelompok siswa yang kurang pandai. Teori respons butir mengatasi masalah tersebut. Maksudnya, hasil perhitungan indeks kesukaran butir soal, indeks daya beda butir, dan indeks tebakan semu (pseudoguessing) akan menghasilkan angka yang sama meskipun diterapkan pada kelompok siswa yang berbeda. Tetapi karena indeks parameter butir dan kemampuan peserta merupakan hasil estimasi, maka kebenarannya bersifat probabilistik dan mengandung kesalahan pengukuran. Tetapi karena bebas dari group dependent dan item dependent, teori respons butir dapat digunakan untuk mengetahui karakteristik soal ata butir soal secara lebih meyakinkan dibanding dengan teori tes klasik. 11

DAFTAR PUSTAKA Allen, M. J & Yen, W. M. (1979). Introduction to measurement theory. Belmont: Wadsworth. Bahrul Hayat, Sumarno S. Pranata, dan Herwindo Haribowo. (1999). Manual item and test analysis (ITEMAN). Jakarta: Pusbang Sisjian Depdikbud. Hambleton, R.K. & Swaminathan, H. (1985). Item response theory. Boston, MA: Kluwer Inc. Hambleton, R.K., Swaminathan, H., & Rogers, H.J. (1991). Fundamental of item response theory. Newbury Park, CA: Sage Publication Inc. Hulin, C.L., Drasgow, F. & Parsons, C.K. (1983). Item response theory: Application to psychological measurement. Homewood, IL: Dow Jones- Irwin. Mehrens, W. A. & Lehmann, I. J. (1973). Measurement and evaluation in education and psychology. New York: Hold Rinehart and Wiston. 12