EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI TERHADAP RELIABILITAS SKOR TES

dokumen-dokumen yang mirip
EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI TERHADAP RELIABILITAS SKOR TES. Saifuddin Azwar Universitas Gadjah Mada

Kualitas Tes Potensi Akademik Versi 07A

THE QUALITY OF THE TES POTENSI AKADEMIK (TPA) 07A. Saifuddin Azwar

RELIABILITAS DAN V ALIDITAS AITEM

Psikometri Reliabilitas 2

KONSISTENSI PARAMETER TES. Rustam (Universitas Terbuka) Abstrak

BEBERAPA KRITERIA EMPIRIK PADA ANALISIS BUTIR. Oleh Dali S. Naga

PSIKOMETRI. Oleh: Prof. Dr. I Wayan Koyan, M.Pd. Pascasarjana Undiksha Singaraja

ABSTRAK.

HASIL DAN PEMBAHASAN. Tabel 2. Statistik skor mahasiswa UAS TPB IPB mata kuliah Fisika

ANALISIS BUTIR SOAL DENGAN TEORI TES KLASIK: SEBUAH PENGANTAR. Oleh: Djunaidi Lababa*

BAB II TINJAUAN PUSTAKA

Psikometri. Aplikasi uji Reliabilitas dan. Validitas

Psikometri. Reliabilitas 1

KOMPARASI KETEPATAN ESTIMASI KOEFISIEN RELIABILITAS TES UJIAN NASIONAL KIMIA PROVINSI JAMBI TAHUN AJARAN 2014/2015

Analisis Butir Soal Tes Prestasi Hasil Belajar

DEPARTEMEN PENDIDIKAN NASIONAL UNIVERSITAS NEGERI YOGYAKARTA PROGRAM PASCASARJANA

VALIDITAS & RELIABILITAS. Sami an

CONTENT VALIDITY (Validitas Isi)

PENGARUH TES FORMATIF PILIHAN GANDA DAN GAYA BERPIKIR SISWA TERHADAP HASIL KUIS STATISTIKA

Laporan Penelitian. Analisis Kualitas Butir Soal Mata Kuliah Membaca 2 (PBIN4329)

SILABI. Pokok Bahasan Sub Pokok Bahasan dan Sasaran Belajar Cara Pengajaran. : memahami dan menjelaskan definisi pengukuran

Panduan Penggunaan AnBuso 2015

Psikometri Validitas 1

EFEK PEMUSATAN DATA TERHADAP PARAMETER ITEM BERBASIS CLASICAL TEST THEORY (CTT)

ABSTRAK. Universitas Kristen Maranatha

Ketidaktepatan Penggunaan Validitas Butir dan Koefisien Reliabilitas dalam Penelitian Pendidikan dan Psikologi

PERBEDAAN KETEPATAN ESTIMASI TINGKAT KESUKARAN BUTIR TES PILIHAN GANDA PADA PENSKORAN KOREKSI DAN KONVENSIONAL DENGAN PENERAPAN MODEL RASCH

Fakultas Psikologi UGM. Wahyu Widhiarso [UJI LINIERITAS HUBUNGAN] Manuskrip tidak dipublikasikan, Tahun 2010

STUDI GENERALIZABILITAS TES TIPE DUA FACET DENGAN MENGGUNAKAN ANALISIS VARIAN TIGA JALUR. Oleh. Purwo Susongko

Jurnal Sosio Humaniora Vol. 3 No. 4, September 2012 ISSN : EVALUASI KUALITAS TES PSIKOLOGI KEPRIBADIAN I

RENCANA PEMBELAJARAN SEMESTER (RPS)

Ketepatan model tes dapat dibuktikan secara empirik berdasarkan data Setiap model tes tidak akan pernah mencerminkan keadaan data secara sempurna,

SATUAN ACARA PERKULIAHAN

Karakteristik Butir Tes dan Analisisnya. Oleh: Heri Retnawati

RELIABILITAS ORDINAL PADA METODE TEST-RETEST

BAB II TINJAUAN PUSTAKA. Pada dasarnya ilmu pengukuran memiliki dua pendekatan, yaitu

ANALISIS HASIL TEST. Classical Theory Test. Tingkat Kesukaran(

PENGANTAR TEORI TES KLASIK (TTK)*)

Keakuratan Hasil Analisis Butir Menurut Teori Tes Klasik dan Teori Respons Butir Ditinjau dari Ukuran Sampel

Jurnal Media Pendidikan Matematika J-MPM Vol. 2 No. 1, ISSN

ANALISIS ITEM SOAL UTS PEDOLOGI SEMESTER GANJIL ) Abstrak. Abstract

KODE MK POR 587 PROGRAM STUDI PENDIDIKAN JASMANI, KESEHATAN DAN REKREASI JURUSAN PENDIDIKAN OLAHRAGA FPOK UPI

ANALISIS BUTIR SOAL PILIHAN GANDA UJIAN AKHIR SEMESTER MAHASISWA DI UNIVERSITAS TERBUKA DENGAN PENDEKATAN TEORI TES KLASIK

Kriteria Instrumen dalam suatu Penelitian

AKTERISTIK BUTIR TES MATEMATIKA PADA TES BUATAN MGMP MATEMATIKA KOTA PALOPO BERDASARKAN TEORI KLASIK

UJI VALIDITAS KUISIONER

r P1, r P2,..., r p30 r R1, r R2,..., r R30

BAB III METODE PENELITIAN

KODE MK POR 587 PROGRAM STUDI PENDIDIKAN JASMANI, KESEHATAN DAN REKREASI JURUSAN PENDIDIKAN OLAHRAGA FPOK UPI

BAB III METODE PENELITIAN. variabel dependen adalah minat beli konsumen.

Abstrak Pengembangan Bank Soal Matematika. Oleh : Heri Retnawati Jurdik Matematika FMIPA UNY Yogyakarta. Abstrak

MENYUSUN INSTRUMEN YANG VALID Dalam menyusun dan menganalisis instrument non tes pada makalah ini, kami menggunakan Skala Likert supaya dalam

Reliabilitas & Konfidensi. Wahyu Widhiarso Fakultas Psikologi UGM

BAB I PENDAHULUAN A. LATAR BELAKANG Komparasi Estimasi Reliabilitas Pada Mata Pelajaran Sejarah Ditinjau Dari Homogenitas Dan Heterogenitas Kelompok

KEMENTERIAN RISET TEKNOLOGI DAN PENDIDIKAN TINGGI

BAB III METODOLOGI PENELITIAN. Penelitian ini menggunakan pendekatan kuantitatif. Pendekatan kuantitatif

JURNAL PENDIDIKAN AKUNTANSI INDONESIA Vol. VI No. 1 Tahun 2008 Hal VALIDITAS SEBAGAI ALAT PENENTUAN KEHANDALAN TES HASIL BELAJAR.

BAB IV HASIL PENELITIAN, ANALISA DAN PEMBAHASAN

ANALISIS & SELEKSI AITEM

ANALISIS BUTIR SOAL DENGAN ANBUSO Oleh: Ali Muhson

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. kuantitatif. Pendekatan kuantitatif adalah metode penelitan yang digunakan

ABSTRAK. Kata Kunci: korelasi, dukungan sosial teman sebaya, prokrastinasi akademik, mahasiswa. vii. Universitas Kristen Maranatha

ANALISIS TES BUATAN GURU BIDANG STUDI MATEMATIKA KELAS V SD 1 KATOBENGKE

membeli aksesoris yang sedang menjadi trend dengan kepercayaan diri pada siswi kelas XI jurusan sekretaris SMK Kristen 1 Salatiga.

TEKNIK PENSKORAN TES OBYEKTIF MODEL PILIHAN GANDA Khaerudin 1

SILABUS MATAKULIAH EVALUASI OLAHRAGA

Rencana Pelaksanaan Perkuliahan

BAB III METODE PENELITIAN 3.1 Jenis Metode Penelitian Penelitian ini termasuk penelitian kuasi eksperimen (eksperimen semu). Populasi tidak dapat

BAB IV HASIL PENELITIAN. variabel yang diperoleh dari hasil penelitian di lapangan. Variabel dalam

BAB III METODE PENELITIAN. terhadap hasil penelitian. Kegiatan penelitian harus mengikuti langkah-langkah

Validitas dan Reliabilitas

BAB IV HASIL PENELITIAN DAN PEMBAHASAN. 1. Persiapan dan Pelaksanaan Penelitian

: <Dr: SamsuCjfadi, M.Kpm

INAPPROPRIATNESS SCORE BASED ON ITEM RESPONSE THEORY

BAB III METODE PENELITIAN. data, (6) uji instrumen, (7) teknik analisis data dan pengujian hipotesis. yang lain dalam kondisi yang terkendalikan.

BAB III METODOLOGI PENELITIAN

Jurnal Penelitian dan Evaluasi Pendidikan

BAB III METODE PENELITIAN. (2010: 11) karena penelitian ini banyak menggunakan angka-angka, mulai dari

Psikometri. Analisis Item 1

Model-Model Pengukuran dalam Pemodelan Persamaan Struktural

BAB III METODE PENELITIAN

Analisisi Data (Reliabilitas)

KUALITAS TES PILIHAN GANDA (MULTIPLE-CHOICE) SEBAGAI UPAYA MEMBENTUK PROSES BERFIKIR MAHASISWA

Uji Validitas dan Reliabilitas

BAB III METODE PENELITIAN

PENGEMBANGAN PERANGKAT LUNAK ANALISIS BUTIR SOAL DAN ANGKET

Citra Tubuh dan Kasus Konstruk Pengukuran yang Bersifat Multidimensi

Keterangan : korelasi item total terkoreksi : korelasi item total sebelum dikoreksi. r ix

ANALISIS BUTIR SOAL A. PENDAHULUAN

DOC # RUMUS KOEFISIEN KORELASI MOMENT TIGA VARIABEL OPERATING INSTRUCTIONS DOCUMENT

RELIABILITAS DAN VALIDITAS KONSTRUK SKALA KONSEP DIRI UNTUK MAHASISWA INDONESIA

Pengembangan Tes Berpikir Tingkat Tinggi pada Mata Kuliah Mikrobiologi Berbantuan Komputer dengan Microsoft Office dan Visual Basic for Application

PENGARUH JUMLAH ALTERNATIF JAWABAN TES OBYEKTIF BENTUK PILIHAN GANDA TERHADAP RELIABILITAS, TINGKAT KESUKARAN DAN DAYA PEMBEDA

KOMPARASI ESTIMASI RELIABILITAS PADA MATA PELAJARAN SEJARAH DITINJAU DARI HOMOGENITAS DAN HETEROGENITAS KELOMPOK

SILABUS MATA KULIAH S T A T I S T I K A

BAB III METODOLOGI PENELITIAN. 3.1 Desain Penelitian dan Metode Penelitian

Psikometri Validitas 2

BAB III METODE PENELITIAN. A. Variabel Penelitian dan Definisi Operasional. 1) Variabel Terikat (Dependent): Konflik Kerja (Y)

Transkripsi:

BULETIN PSIKOLOGI FAKULTAS PSIKOLOGI UNIVERSITAS GADJAH MADA VOLUME 17, NO. 1, 2009: 28 32 ISSN: 0854 7108 EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI TERHADAP RELIABILITAS SKOR TES Saifuddin Azwar Fakultas Psikologi Universitas Gadjah Mada E mail: sfazwar@ugm.ac.id Abstract Seventy three items of IPA (science) test used in the 2006 University of Gadjah Mada under graduate admission procedure (Utul UM UGM) were analyzed to reveal the effect of eliminating items based on corrected item total correlation coefficient on reliability of the test. Computations of reliability estimates for four different lengths of test (n=11.287) showed that reducing less discriminating items did not lower reliability coefficients as predicted by Spearman Brown prophecy. In fact, length of test was practically irrelevant to reliability coefficient when the test consisted of highly discriminating items. Keywords: Spearman Brown Prophecy, Reliability, Item total correlation Dalam pengembangan tes sebagai instrumen pengukuran untuk riset psikologi dan pendidikan, seleksi aitem berdasarkan statistik daya diskriminasi aitem merupakan salah satu tehnik guna meningkatkan reliabilitas skor tes (Azwar, 1997). Hal tersebut adalah penting terutama dalam pendekatan teori skor murni klasik (Allen & Yen, 1979; Crocker, & Algina, 1986). Salah satu statistik daya diskriminasi aitem adalah koefisien korelasi antara skor aitem dan skor total tes yang dikenal dengan nama korelasi aitem total (rix) dan koefisien r point biserial (rpbis). Sudah diketahui bahwa estimasi terhadap perubahan reliabilitas yang disebabkan oleh perubahan panjang tes dapat dilakukan dengan komputasi formula Spearman Brown prophecy (Thompson, 2003) atau formula stepped up reliability (Allen & Yen, 1979), yaitu: rxx = k(rxx)/(1+(k 1)rxx) rxx = reliabilitas tes sebelum perubahan jumlah aitem rxx = reliabilitas tes setelah perubahan jumlah aitem k = perbandingan jumlah aitem setelah dan sebelum perubahan yang menghasilkan kenaikan reliabilitas bila harga k (yaitu rasio banyaknya aitem tes setelah perubahan dibanding sebelum perubahan) lebih besar daripada 1. Estimat perubahan reliabilitas tersebut tidak bersifat linear dengan perubahan besarnya k dan akurasinya tergantung pada terpenuhi tidaknya asumsi paralelisme antar aitem yang ada. Dalam kasus estimasi reliabilitas belah dua, misalnya, koefisien alpha yang dihasilkan akan terhindar dari underestimasi bila kedua belahan bersifat τ equivalent (Allen & Yen, 1979) sedangkan koefisien Spearman Brown (S B) akan akurat bila kedua belahan bersifat paralel. Dalam hal penambahan jumlah aitem, yaitu menambah panjang tes, peningkatan reliabilitas dapat diprediksi secara akurat bila aitem aitem yang ditambahkan berkualitas setara dengan aitem aitem yang sudah 28 BULETIN PSIKOLOGI

EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI ada dalam tes. Bila aitem yang ditambahkan ke dalam tes berkualitas lebih rendah (memiliki daya diskriminasi lebih rendah) dibanding aitem yang sudah ada, maka peningkatan yang diharapkan oleh formula Spearman Brown prophecy tidak dapat tercapai. Begitu pula dalam hal pengurangan jumlah aitem atau pemendekan tes, perubahan reliabilitas tes hanya dapat diprediksi secara akurat bila kualitas aitem yang dikeluarkan dari tes adalah setara dengan aitem aitem yang ditinggalkan. Bila kualitas aitem yang dikeluarkan dari tes lebih baik dibanding kualitas aitem yang disisakan maka penurunan reliabilitas akan lebih besar daripada prediksi formula Spearman Brown prophecy dan sebaliknya bila kualitas aitem yang dikeluarkan dari tes lebih buruk dibanding kualitas aitem yang disisakan maka penurunan reliabilitas tidak akan sebesar prediksi bahkan mungkin saja menaikkan reliabilitas. Kondisi yang terakhir inilah yang akan diverifikasi secara empiris dalam penelitian ini. 1. Sumber Data Metode Data skor bersumber dari 11.287 orang peserta Ujian Tulis (Utul) UM UGM Tahun 2006 yang merespon tes IPA yang soalsoalnya berupa pilihan ganda dengan lima pilihan. Tes IPA terdiri dari 75 aitem, namun dikarenakan aitem nomor 18 dan nomor 52 tidak diskor maka keseluruhan aitem yang disertakan dalam analisis berjumlah 73 buah. Skor aitem IPA adalah 4 untuk jawaban benar, 1 untuk jawaban salah, dan 0 untuk tidak menjawab namun untuk analisis dalam penelitian ini digunakan data skor yang telah didikotomikan menjadi 1 untuk jawaban yang benar dan 0 untuk jawaban yang salah. 2. Cara Analisis Formula estimasi reliabilitas alpha (Cronbach, 1951) digunakan untuk menghitung reliabilitas skor ketujuh puluh tiga aitem dalam tes IPA beserta statistik daya diskriminasi aitem masing masing yang diperlihatkan oleh koefisien korelasi aitemtotal. Sekalipun dengan adanya 73 aitem yang dianalisis tidak diperlukan koreksi terhadap spurious overlap (Guilford, 1953; Guilford, 1956; Wolf, 1967; Azwar, 1997) namun dalam penelitian ini tetap digunakan korelasi aitem total yang telah dikoreksi sehingga estimasinya menjadi lebih cermat. Daya beda yang ideal diperoleh bila rpbis atau rix mendekati angka 1,00 (Scorepak, 2005). Pada umumnya daya beda dianggap memuaskan bila mencapai angka 0,30 (Azwar, 1997). Angka ini lebih tinggi dibanding rekomendasi Thorndike sebesar 0,20 (Thorndike et. al., 1991) dan rekomendasi ahli lain (Crocker & Algina, 1986) dan masih jauh lebih tinggi daripada yang disarankan oleh Kehoe yaitu 0,15 (Kehoe, 1997). Untuk melihat efek perubahan panjang tes terhadap reliabilitas dilakukan dengan mengeliminasi secara bertahap aitem aitem yang tidak mencapai batas daya diskriminasi tertentu. Pertama tama korelasi aitem total dan reliabilitas dihitung pada ketujuh puluh tiga aitem. Kemudian, aitemaitem yang memiliki korelasi aitem total kurang dari 0,15 dieliminasi dan reliabilitas dihitung kembali. Proses ini dilakukan untuk eliminasi korelasi aitem total kurang dari 0,20; kurang dari 0,25; dan kurang dari 0,30 mengikuti rekomendasi masingmasing ahli di atas. Pada setiap tahap eliminasi, reliabilitas tes dihitung ulang. Perubahan reliabilitas yang diperoleh dari komputasi dibandingkan dengan perubahan yang diprediksikan oleh formula Spearman Brown prophecy. BULETIN PSIKOLOGI 29

AZWAR Hasil dan Kesimpulan Skor aitem dari sampel penelitian berukuran n=11.287 yang merespon 73 aitem tes IPA menghasilkan koefisien korelasi aitem total yang bervariasi mulai dari terendah rix = 0,063 sampai tertinggi rix=0,462. Ketujuh puluh tiga aitem tersebut menghasilkan koefisien reliabilitas rxx= 0,833. Hasil estimasi reliabilitas pada sisa aitem setelah dilakukan eliminasi bertahap terhadap aitem aitem yang tidak mencapai kriteria koefisien korelasi aitem total rix= 0,15; rix=0,20; rix=0,25; dan rix=0,30; beserta hasil prediksi Spearman Brown (S B) disajikan dalam Tabel 1. Tampak jelas sebagaimana formulasi Spearman Brown memprediksikan bahwa secara teoretis pengurangan jumlah aitem (pemendekan tes) akan berakibat penurunan drastis koefisien reliabilitas ketika jumlah aitem menjadi 2/3 jumlah semula (dari 73 aitem menjadi 48 aitem) dan reliabilitas turun dari rxx =0,833 menjadi hanya rxx =0,426. Penurunan tersebut secara bertahap terjadi dengan makin sedikitnya jumlah aitem yang disisakan berdasar kriteria eliminasinya sehingga mencapai serendah rxx =0,193 sewaktu jumlah aitem hanya tersisa 26 buah. Prediksi pengurangan ini, sekali lagi, akan terjadi secara akurat bila aitem yang dieliminasi dan yang disisakan adalah paralel, atau paling tidak dalam hal ini memiliki daya diskriminasi yang setara. Dalam data skor penelitian ini, pengurangan aitem tidak dilakukan untuk alasan pemendekan tes (efisiensi) dari suatu tes yang berisi aitem homogen (content homogeneous) melainkan untuk tujuan seleksi aitem berdasar daya diskriminasi. Dengan demikian, aitem yang dieliminasi adalah aitem aitem yang dikategorikan sebagai tidak memuaskan. Sebagaimana diduga, dikarenakan aitem aitem yang diambil memiliki daya beda yang lebih tinggi dibanding aitem aitem yang dieliminasi maka prediksi penurunan reliabilitas tidak terjadi dan bahkan tampak jelas adanya kenaikan sebesar 0,023 angka seperti tampak pada waktu sisa aitem sebanyak 48, 38, dan 34 buah. Bahkan ketika tes dipendekkan menjadi hanya 26 aitem, peningkatan reliabilitas tetap terjadi sekalipun hanya 0,011 angka, yaitu dari semula rxx =0,833 menjadi rxx =0,844. Perbandingan perubahan reliabilitas berdasar seleksi aitem dan berdasar prediksi Spearman Brown ini secara visual tampak lebih jelas dalam Gambar 1. Dengan demikian analisis ini menyimpulkan bahwa seleksi aitem berdasar koefisien korelasi aitem total dapat mempertahankan bahkan meningkatkan reliabilitas skor tes. Tes yang pendek namun berisi aitem aitem berdaya diskriminasi Tabel 1 Komputasi rxx empirik dan rxx prediksi Spearman Brown (n = 11.287) Kriteria eliminasi Banyaknya aitem yang dieliminasi Banyaknya aitem k rxx diperoleh rxx prediksi S B 0 73 1 0,833 0,833 rix < 0,15 25 48 0,657 0,856 0,426 rix < 0,20 35 38 0,521 0,856 0,310 rix < 0,25 39 34 0,466 0,855 0,269 rix < 0,30 47 26 0,356 0,844 0,193 30 BULETIN PSIKOLOGI

EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI 0.800 0.600 rxx diperoleh rxx S-B Reliabilitas 0.400 0.200 73 48 38 34 26 Banyaknya aitem Gambar 1. Perbandingan perubahan reliabilitas berdasar seleksi aitem dan berdasar prediksi Spearman Brown (n = 11.287) tinggi adalah lebih baik reliabilitasnya dibanding tes yang panjang namun berisi aitem aitem yang berkualitas rendah. Implikasi lebih lanjut adalah bahwa efisiensi tes dengan mengurangi aitem dapat dipertimbangkan tanpa mengorbankan reliabilitas, bila didasarkan pada pemilihan aitem yang berdaya dikriminasi tinggi. Daftar Pustaka Allen, M.J. & Yen, W.M. (1979). Introduction to measurement theory. Monterey, CA: Brooks/Cole Publishing Company. Azwar, S. (1997). Reliabilitas dan validitas. Edisi ke 3. Yogyakarta: Pustaka Pelajar. Crocker, L. & Algina, J. (1986). Introduction to classical and modern test theory. Forth Worth: Holt, Rinehart, and Winston, INC., Cronbach, L.J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297 334. Guilford, J.P. (1953). The correlation of an item with a composite of the remaining items in a test. Educational and Psychological Measurement, 13, 1, 87 93. Guilford, J.P. (1956). Fundamental statistics in psychology and education (3 rd ed.). New York: McGraw Hill. Kehoe, J. (1997). Basic item analysis for multiple choice tests. ERIC Digest. http://www.ericdigests.org/1997 1/basic.html Scorepak (2005). Item analysis. Office of Educational Assessment, University of Washington. http://www.washington.edu/oea/pdfs/r esources/item_analysis.pdf Thompson, B. (2003). Understanding reliability and coefficient alpha, really. Dalam Bruce Thompson (Ed.), Score reliability Contemporary thinking on reliability issues. Thousand Oaks, CA: Sage Publications. Thorndike, R.M., Cunningham, G.K., Thorndike, R.L., & Hagen, E.P. (1991). BULETIN PSIKOLOGI 31

AZWAR Measurement and evaluation in psychology and education. New York, NY: Macmillan Publishing Company. Wolf, R. (1967). Evaluation of several formulae for correction of item total correlations in item analysis. Journal of Educational Measurement, 4, 1, 21 26. 32 BULETIN PSIKOLOGI