Ketidaktepatan Penggunaan Validitas Butir dan Koefisien Reliabilitas dalam Penelitian Pendidikan dan Psikologi

dokumen-dokumen yang mirip
BEBERAPA KRITERIA EMPIRIK PADA ANALISIS BUTIR. Oleh Dali S. Naga

PSIKOMETRI. Oleh: Prof. Dr. I Wayan Koyan, M.Pd. Pascasarjana Undiksha Singaraja

r P1, r P2,..., r p30 r R1, r R2,..., r R30

Psikometri. Aplikasi uji Reliabilitas dan. Validitas

BAB III METODE PENELITIAN

KRITERIA EMPIRIK DALAM MENENTUKAN UKURAN SAMPEL PADA PENGUJIAN HIPOTESIS STATISTIKA DAN ANALISIS BUTIR

EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI TERHADAP RELIABILITAS SKOR TES. Saifuddin Azwar Universitas Gadjah Mada

Jurnal Media Pendidikan Matematika J-MPM Vol. 2 No. 1, ISSN

AKTERISTIK BUTIR TES MATEMATIKA PADA TES BUATAN MGMP MATEMATIKA KOTA PALOPO BERDASARKAN TEORI KLASIK

KONSISTENSI PARAMETER TES. Rustam (Universitas Terbuka) Abstrak

EFEK SELEKSI AITEM BERDASAR DAYA DISKRIMINASI TERHADAP RELIABILITAS SKOR TES

Laporan Penelitian. Analisis Kualitas Butir Soal Mata Kuliah Membaca 2 (PBIN4329)

ANALISIS BUTIR TES Oleh: Rufi i *

SILABI. Pokok Bahasan Sub Pokok Bahasan dan Sasaran Belajar Cara Pengajaran. : memahami dan menjelaskan definisi pengukuran

BAB III METODE PENELITIAN

HASIL DAN PEMBAHASAN. Tabel 2. Statistik skor mahasiswa UAS TPB IPB mata kuliah Fisika

ANALISIS BUTIR DAN KONSISTENSI INTERNAL TES *) Makalah. Oleh I Wayan Santyasa **)

Psikometri. Reliabilitas 1

BAB III METODE PENELITIAN

III. METODE PENELITIAN. Populasi penelitian ini yaitu siswa kelas VII SMPN 2 Bandar Lampung. pada semester ganjil Tahun Pelajaran 2013/2014.

KUALITAS INSTRUMEN PENGUKURUAN DALAM PEMBELAJARAN

KOMPARASI ESTIMASI RELIABILITAS PADA MATA PELAJARAN SEJARAH DITINJAU DARI HOMOGENITAS DAN HETEROGENITAS KELOMPOK

DOC # RUMUS KOEFISIEN KORELASI MOMENT TIGA VARIABEL OPERATING INSTRUCTIONS DOCUMENT

Psikometri Reliabilitas 2

PERBEDAAN KETEPATAN ESTIMASI TINGKAT KESUKARAN BUTIR TES PILIHAN GANDA PADA PENSKORAN KOREKSI DAN KONVENSIONAL DENGAN PENERAPAN MODEL RASCH

BAB III METODOLOGI PENELITIAN. Penelitian ini merupakan penelitian eksperimen kuasi yang difokuskan

BAB III METODE PENELITIAN. berhubungan langsung dengan permasalahan yang diteliti (Cooper dan

BAB III METODE PENELITIAN. Jenis penelitian ini adalah penelitian korelasional. Menurut Sugiyono (2009)

PERTEMUAN 2 (IDENTIFIKASI KEBUTUHAN PELANGGAN) SENIN-SELASA, OKTOBER 2016

BAB III METODE PENELITIAN Jenis Penelitian Penelitian yang akan dilakukan merupakan penelitian kuantitatif yaitu metode

BAB III METODE PENELITIAN. Hos Cokroaminoto Ruko Grogol C2, Pekalongan. Alasan dipilihnya toko

BAB III METODE PENELITIAN. dan retail peralatan petualangan alam terbuka terbesar di Indonesia.

BAB III METODE PENELITIAN. digunakan dalam penelitian ini adalah explanatory research. Jenis penelitian yang

BAB 3 METODOLOGI PENELITIAN. mencari sebab akibat antara dua atau lebih konsep (variabel) yang akan diteliti. Periset

BAB III METODE PENELITIAN

PENGARUH TES FORMATIF PILIHAN GANDA DAN GAYA BERPIKIR SISWA TERHADAP HASIL KUIS STATISTIKA

BAB IV ANALISIS DAN PEMBAHASAN

S - 28 PEMBENTUKAN SAMPEL BARU YANG MEMENUHI SYARAT VALID DAN RELIABEL DENGAN TEKNIK RESAMPLING PADA DATA KUISIONER TIPE YES/NO QUESTIONS

RELIABILITAS ORDINAL PADA METODE TEST-RETEST

Pengantar Psikodiagnostik

BAB III. METODE PENELITIAN. penelitian eksploratif (explorative research), penelitian deskriptif

BAB IV ANALISIS DAN PEMBAHASAN. 4.1 Karakteristik Responden Penelitian. Pengumpulan data dalam penelitian ini dilakukan melalui penyebaran kuesioner

BAB III METODE PENELITIAN

BAB 3 METODE PENELITIAN. Desain penelitian yang digunakan adalah penelitian deskriptif asosiatif

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. Penelitian ini menggunakan pendekatan kuantitatif. Penelitian kuantitatif adalah

BAB III METODE PENELITIAN. Didalam suatu penelitian, obyek penelitian merupakan hal yang sangat penting

BAB 4 METODE PENELITIAN. Penelitian ini merupakan penelitian penjelasan (explanatory research), yaitu variabelvariabel

BAB IV KUALITAS INSTRUMEN PENGUKURUAN DALAM PEMBELAJARAN

BAB III METODE PENELITIAN. A. Tempat dan waktu penelitian. bendo Kabupaten Sidoarjo mulai bulan Maret sampai dengan September. B.

ANALISIS BUTIR SOAL A. PENDAHULUAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN. data hasil penelitian dengan mempergunakan statistik. Penelitian ini dilakukan di tempat karaoke QYU-QYU.

BAB III METODE PENELITIAN. hendaknya metode penulisan dengan memperhatikan kesesuaian antara objek yang

dan 3 variabel independen, serta 1 variabel moderating, yang diadopsi dari jurnal

BAB III METODE PENELITIAN. penelitiannya. Dengan menggunakan metode penelitian akan diketahui hubungan

ABSTRAK. Universitas Kristen Maranatha

BAB III METODE PENELITIAN. Lokasi penelitian adalah sekolah SMP Negeri 1 Tapa Kabupaten Bone Bolango,

III. METODE PENELITIAN

ABSTRAK. i Universitas Kristen Maranatha

BAB III METODE PENELITIAN. A. Lokasi Penelitian Penelitian ini dilakukan di Madrasah Aliyah Negeri Karanganyar Paiton

BAB 5 HASIL PENGUMPULAN DATA

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN. korelasi, yang menggambarkan secara sistematik mengenai pengaruh pelayanan,

BAB III OBJEK DAN METODE PENELITIAN. Objek penelitian ditujukan untuk meneliti objek-objek yang terlibat dalam

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. di Inspektorat Kabupaten/Kota dan Provinsi di Lampung yang mendapatkan opini Wajar

BAB 3 METODE PENELITIAN

BAB IV PENGUMPULAN DAN PENGOLAHAN DATA

BAB III METODOLOGI PENELITIAN

BAB 3 METODE PENELITIAN. Dalam penelitan ini yang menjadi populasi oleh penulis adalah Satuan Kerja

BAB II METODE PENELITIAN. metode penelitian yang meneliti hubungan antara variabel-variabel yang ada.

BAB 4 PENGOLAHAN DAN INTERPRETASI DATA

BAB III METODOLOGI PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN. Metode penelitian yang digunakan dalam penelitian ini adalah metode

BAB III METODELOGI PENELITIAN

PENGARUH JUMLAH ALTERNATIF JAWABAN TES OBYEKTIF BENTUK PILIHAN GANDA TERHADAP RELIABILITAS, TINGKAT KESUKARAN DAN DAYA PEMBEDA

BAB III METODE PENELITIAN. digambarkan lewat angka simbol, kode dan lain-lain. Data itu perlu dikelompokkelompokkan

BAB III METODOLOGI PENELITIAN. Penelitian dilakukan terhadap dua lokasi penelitian yaitu :

UJI PERSYARATAN INSTRUMEN

BAB IV HASIL PENELITIAN

BAB III METODE PENELITIAN

Kelurahan Bendan Duwur terdapat 40 pertanyaan yang masing-masing. pertanyaan memiliki empat alternatif jawaban, yaitu:

1

BAB III METODE PENELITIAN

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

BAB III PENYAJIAN DAN ANALISIS DATA. jawaban kuesioner yang diisi oleh responden. Untuk melakukan analisis ini

BAB II METODE PENELITIAN. bebas (X) dengan variabel terikat (Y) yang menggunakan rumus statistik. Dengan

BAB III METODOLOGI PENELITIAN. penelitian ini, maka permasalahan yang ingin dijawab melalui penelitian ini adalah

A. Populasi dan Sampel

BAB III METODOLOGI PENELITIAN

BAB III METODE PENELITIAN

III. METODE PENELITIAN. Penelitian ini merupakan studi eksperimen dengan populasi penelitian yaitu

III. METODE PENELITIAN. Populasi dalam penelitian ini adalah seluruh Siswa Semester 2 MIA. SMA N 1 Pringsewu Semester Genap Tahun Ajaran

BAB III METODE PENELITIAN. kuantitatif merupakan metode untuk menguji teori-teori tertentu. Cara

Transkripsi:

Ketidaktepatan Penggunaan Validitas Butir dan Koefisien Reliabilitas dalam Penelitian Pendidikan dan Psikologi Dali S. Naga 1 bstract: Item validity is applied in educational and psychological research through item analysis to enhance the reliability of respondent scores. Recently, there are a couple of inappropriate ways of treating item validity, which neither ensures the reliability nor justifies the validity of the measurement. Similar cases also happen in the application of reliability coefficient. Kata kunci: validitas butir, koefisien reliabilitas, kesalahan pengukuran, penelitian pendidikan. Validitas butir digunakan pada analisis butir dalam rangka uji coba pengukuran untuk memperbaiki alat ukur. Melalui validitas butir, ada butir yang dapat dipertahankan di dalam alat ukur serta ada butir yang perlu dibuang, diperbaiki, atau diganti. Diharapkan melalui uji coba dan perbaikan yang berulang-ulang, kita akan memperoleh alat ukur yang baik dan dapat dipercaya. Dalam bentuk statistika, validitas butir dinyatakan dalam bentuk koefisien korelasi di antara skor-satuan butir ke-i dengan skor responden (skor total). Karena itu, koefisien korelasi ini dikenal juga sebagai koefisien korelasi butir-total, ρ i atau r i, seperti tampak pada Gambar 1. Di dalam penelitian pendidikan dan mungkin juga psikologi, belakangan ini, muncul dua ketidaktepatan terhadap penggunaan validitas butir. Demikian 1 Dali S. Naga adalah dosen Universitas Negeri Jakarta. 99

100 JURNL ILMU PENDIDIKN, JUNI 004, JILID 11, NOMOR pula telah muncul ketidaktepatan dalam penggunaan koefisien reliabilitas. Ketidaktepatan itu adalah sebagai berikut. Pertama, di dalam analisis butir pada uji coba pengukuran, butir dipertahankan di dalam alat ukur melalui penolakan hipotesis H 0 untuk r i pada taraf signifikansi α tertentu. Kedua, validitas butir digunakan untuk menentukan validitas pengukuran sebagai pengganti validitas isi, kriteria, atau konstruk. Ketiga, koefisien reliabilitas dianggap memadai jika hipotesis H 0 untuk koefisien reliabilitas itu berhasil ditolak pada taraf signifikansi α tertentu. Tulisan ini bertujuan untuk menjelaskan mengapa tiga hal ini tidak tepat sehingga perlu dihindari di dalam penelitian pendidikan dan psikologi. Responden Butir 1 3 i j N 1 X X X X g X X h X X M X X Gambar 1 Koefisien korelasi butir-total untuk butir ke-i ρ i atau r i PERNN VLIDITS BUTIR Melalui koefisien korelasi butir-total, ρ i atau r i pada Gambar 1, validitas butir adalah korelasi di antara skor-satuan butir ke-i dengan skor responden. pa artinya kalau nilai koefisien korelasi butir-total adalah positif tinggi? Skor responden dapat kita susun dalam urutan peringkat (dari tinggi ke rendah atau sebaliknya). Skor-satuan pada butir ke-i dapat juga kita susun dalam urutan peringkat. Koefisien korelasi butir-total akan bernilai positif tinggi jika kedua peringkat itu mirip atau cukup konsisten. Dengan kata lain,

S. Naga, Penggunaan Validitas Butir dalam Penelitian Pendidikan 101 jika koefisien korelasi butir-total bernilai tinggi, maka skor tinggi pada butir ke-i berpasangan dengan skor tinggi pada responden (yakni banyak responden yang menjawab betul). Demikian pula, skor rendah pada butir ke-i berpasangan dengan skor rendah pada skor responden (yakni banyak responden yang menjawab salah). Dengan demikian, butir itu memiliki daya untuk mengenal skor responden tinggi (melalui banyak jawaban benar) dan skor responden rendah (melalui banyak jawaban salah). Itulah sebabnya, koefisien korelasi butir-total (ρ i atau r i ) atau validitas butir dikenal juga sebagai daya beda butir (validitas butir = daya beda butir = koefisien korelasi butir-total). Untuk menghindari pencampuradukan validitas butir dengan validitas pengukuran, penulis lebih menyukai istilah daya beda butir daripada istilah validitas butir. Selanjutnya, apa dampak atau peranan dari koefisien korelasi butir-total di dalam penelitian? Kita mulai dengan memisalkan bahwa semua butir di dalam alat ukur memiliki validitas butir positif tinggi. Dalam hal ini, setiap skorsatuan butir, masing-masing, memiliki koefisien korelasi yang positif tinggi dengan skor responden. Peringkat skor-satuan pada setiap butir konsisten dengan peringkat skor responden. kibatnya, peringkat skor-satuan di antara sesama butir juga saling konsisten. Karena itu, koefisien korelasi di antara butir atau interkorelasi butir (di antara butir ke-i dan ke-j) berupa ρ ij atau r ij juga bernilai positif tinggi. pa dampak atau peranan interkorelasi butir yang bernilai positif tinggi di dalam penelitian? Melalui hubungan statistika ij = ρ ij i j kita temukan bahwa interkorelasi ρ ij yang bernilai positif tinggi menyebabkan kovariansi di antara butir juga bernilai positif tinggi. Hal ini dapat kita kaitkan dengan koefisien reliabilitas alpha Cronbach ρ α dan koefisien reliabiltas Kuder- Richardson ρ KR-0. Rumus koefisien reliabilitas ini dapat kita tulis sebagai berikut. N N 1 KR0 ij i N i j N 1 N N 1 p q i i ij N i j N 1 dengan N sebagai banyaknya butir dan sebagai variansi pada skor responden.

10 JURNL ILMU PENDIDIKN, JUNI 004, JILID 11, NOMOR Dari rumus di atas tampak bahwa interkorelasi atau kovariansi butir ij yang tinggi menyebabkan koefisien reliabiltas menjadi tinggi. Jadi, validitas butir atau daya beda butir atau koefisien korelasi butir-total yang positif tinggi berdampak kepada atau berperan pada peningkatan koefisien reliabilitas. Selain melalui validitas butir, koefisien reliabilitas dapat juga ditingkatkan melalui perpanjangan alat ukur. Dengan memperpanjang dua paruhan setara (dengan koefisien korelasi paruh-paruh ρ pp ) pada alat ukur menjadi L bagian setara, maka melalui rumus koefisien reliabilitas Spearman-Brown SB L pp 1 ( L 1) koefisien reliabilitas dapat ditingkatkan. Dengan demikian, koefisien reliabilitas pengukuran dapat ditingkatkan melalui validitas butir yang tinggi, dan perpanjangan alat ukur. Jadi, peran dan fungsi validitas butir atau daya beda butir atau koefisien korelasi butir-total adalah untuk peningkatan reliabilitas pengukuran. pp KETIDKTEPTN PENGGUNN VLIDITS BUTIR DN RELIBILITS Pertama, prosedur uji hipotesis terhadap koefisien korelasi butir-total r i menghasilkan statistik ri n t 1 r dengan n sebagai banyaknya responden dan ukuran sebesar 10 kali jumlah butir atau minimal sebesar 5 kali jumlah butir di dalam alat ukur (Nunnally, 1970: 14-15). Kalau nilai t cukup besar (melebihi t tabel ) maka pada taraf signifikansi α tertentu, hipotesis H 0 dapat ditolak. Memang benar bahwa nilai t dapat diperbesar melalui r i yang besar atau koefisien reliabilitas yang tinggi. Karena itu, penolakan H 0 menunjukkan bahwa butir itu layak dipertahankan di dalam alat ukur. Meskipun demikian, masih ada cara lain untuk memperbesar nilai t. Dari rumus tampak bahwa nilai t dapat juga diperbesar melalui peningkatan n atau peningkatan banyaknya responden. Walaupun nilai r i kecil, kalau n cukup besar, maka nilai t menjadi cukup besar sehingga mampu menolak H 0. i

S. Naga, Penggunaan Validitas Butir dalam Penelitian Pendidikan 103 Variabel n yang besar dengan nilai r i yang kecil yang mampu menolak hipotesis H 0 menghasilkan koefisien reliabiltas yang rendah. Di sinilah terletak ketidaktepatannya. Penolakan hipotesis H 0 belum dapat menjamin peningkatan koefisien reliabilitas karena n yang besar dengan r i yang kecil juga mampu menolak hipotesis H 0. Penolakan hipotesis H 0 dengan n yang cukup besar tetapi dengan nilai r i yang cukup kecil mampu mempertahankan butir yang tidak baik di dalam alat ukur. Dengan kata lain, tidak jelas bagi kita apakah tertolaknya hipotesis H 0 itu karena r i yang tinggi ataukah karena n yang besar. Sebenarnya keberatan terhadap pensampelan (sampling) responden seperti ini telah dikemukan oleh Nunnally (1970: 15). Menurut Nunnally, pengkaji psikologi sering terjebak pada anggapan bahwa reliabilitas suatu ujian meningkat dengan banyaknya orang yang digunakan di dalam studi reliabilitas. Selanjutnya Nunnally juga menyatakan bahwa perkiraan reliabilitas yang diperoleh pada suatu studi adalah independen terhadap banyaknya orang di dalam studi melainkan, di setiap studi, reliabilitas berhubungan dengan banyaknya butir di dalam ujian, seperti tampak pada rumus koefisien reliabilitas Spearman-Brown di atas. Hal ini telah kita lihat pada uraian di atas. Karena itu, pada sejumlah bacaan, kriteria untuk mempertahankan butir di dalam alat ukur ditentukan oleh nilai koefisien korelasi butir-total. Kriteria empirik mencakup nilai 0,0 (iken, 1997: 65; Crocker & lgina, 1986: 34; Nunnally, 1970: 0) atau nilai 0,5 (Henning, 1987: 53). Sekali lagi, kriteria untuk mempertahankan butir di dalam alat ukur bukan ditentukan melalui penolakan hipotesis H 0. Kedua, validitas butir atau daya beda butir atau koefisien korelasi butirtotal hanya berbicara tentang hubungan di antara skor-satuan pada butir dengan skor responden. papun yang diungkapkan oleh skor-satuan pada butir dan skor responden tidak menjadi masalah. Selama korelasi di antara mereka bernilai positif tinggi, selama itu pula validitas butir adalah tinggi. Validitas butir akan tetap tinggi sekalipun skor responden (dan skor-satuan pada butir) tidak mengukur sasaran yang hendak diukur. Di sinilah letak ketidaktepatannya. Validitas butir melalui koefisien korelasi butir-total tidak mampu menjelaskan apakah skor-satuan pada butir dan skor responden telah mengukur apa yang memang hendak diukur. Validitas butir tidak dapat menjamin apakah pengukuran telah mengukur apa yang seharusnya diukur.

104 JURNL ILMU PENDIDIKN, JUNI 004, JILID 11, NOMOR Validitas pengukuran perlu dilakukan melalui validitas yang telah kita kenal (validitas isi, kriteria, konstruk) dengan prosedur yang berkaitan dengan validitas pengukuran. Mereka tidak dapat digantikan dengan validitas butir. Ketiga, pada dasarnya, koefisien reliabilitas adalah koefisien korelasi terhadap pengukuran itu sendiri (Naga, 1997) baik pada butir yang sama maupun pada butir yang setara. Di sini, koefisien reliabilitas itu (ukur-ukur ulang, ukur-ukur setara, Spearman-Brown, alpha Cronbach, dan Kuder-Richardson) kita nyatakan dengan ρ atau r. Seperti halnya pada ketidaktepaan pertama, statistik r ini adalah r t 1 r n dengan n sebagai banyaknya responden, berukuran sebesar 5 sampai 10 kali jumlah butir di dalam uji coba pengukuran. Tampak dari statistik itu, jika nilai t cukup besar sehingga melampaui t tabel, maka hipotesis H 0 dapat ditolak. Memang benar bahwa nilai koefisien reliabilitas r yang tinggi dapat meningkatkan nilai t. Namun masih ada cara lain untuk meningkatkan nilai t. Sekalipun nilai r kecil, jika nilai n cukup besar, maka nilai t dapat juga ditingkatkan sehingga mampu menolak hipotesis H 0. Di sinilah letak ketidaktepatannya. Penolakan hipotesis H 0 tidak selalu menjamin koefisien reliabilitas yang tinggi. Dengan n yang cukup besar serta koefisien reliabilitas yang rendah pun, hipotesis H 0 mampu ditolak. Padahal koefisien reliabilitas yang rendah tidak kita kehendaki di dalam penelitian. Dengan kata lain, tidak jelas bagi kita apakah tertolaknya hipotesis H 0 karena r yang tinggi ataukah karena n yang besar. Sesungguhnya hal ini telah juga dikemukan oleh Nunnally (1970: 15) bahwa "di dalam studi tentang reliabilitas dari suatu pengukuran baru, diperlukan penentuan berapa reliabilitasnya; hanya pernyataan bahwa koefisien reliabilitas berbeda secara signifikan terhadap nol adalah hampir tidak berguna." Untuk mengatasi ketidaktepatan pada validitas butir ini, kita menggunakan kriteria empirik yang telah dikemukakan oleh sejumlah penulis seperti yang telah disinggung di atas. Mereka mencakup banyaknya responden uji coba dan ukuran daya beda butir. Sekalipun telah dikemukakan di atas, angkaangka itu ditampilkan sekali lagi dalam bentuk kriteria empirik berikut ini. Dalam hal banyaknya responden, Nunnally (1970: 14-15) menyatakan bahwa ukuran responden pada uji coba adalah sebesar sepuluh kali jumlah butir.

S. Naga, Penggunaan Validitas Butir dalam Penelitian Pendidikan 105 Jadi, untuk uji coba alat ukur 50 butir, misalnya, diperlukan 10 x 50 = 500 responden. Namun apabila uji coba itu akan melibatkan banyak sekali responden, minimal ukuran responden adalah lima kali jumlah butir. Jadi, untuk uji coba alat ukur 100 butir, minimal diperlukan 5 x 100 = 500 responden. Crocker dan lgina (1986: 3) membahas ukuran yang dikemukakan oleh Nunnally serta menambahkan bahwa demi kestabilan informasi, minimal diperlukan 00 responden. Jadi, sekalipun alat ukur mengandung hanya 0 butir, minimal diperlukan 00 responden. Lebih dari itu, kriteria Nunnally digunakan untuk menentukan jumlah responden selanjutnya. Sekiranya kita menghendaki kestabilan yang lebih tinggi, kita dapat menggunakan kriteria yang dikemukakan oleh Davis (1966: 83) untuk kelompok skor tinggi dan kelompok skor rendah yang biasa digunakan pada daya beda butir. Davis menganjurkan 100 responden untuk masing-masing 7% kelompok skor tinggi dan kelompok skor rendah sehingga keseluruhannya mencakup minimal 371 responden atau dapat kita bulatkan menjadi 400 responden. da beberapa penulis mengemukakan kriteria empirik untuk menentukan batas validitas butir dalam mempertahankan butir di dalam alat ukur. Crocker dan lgina (1986: 34) mengemukakan angka minimum 0,. Nunnally (1970: 0) mengemukakan angka minimum 0,. iken (1994: 65) mengemukakan angka minimum 0,. Mehrens dan Lehmans (1991: 167) mengemukakan angka minimum 0,. Henning (1987: 53) mengemukakan angka minimum 0,5. Tampak di sini bahwa mayoritas penulis buku mengemukakan kriteria empirik sebesar 0,. PENUTUP Tulisan ini menunjukkan dan menjelaskan ketidaktepatan yang terjadi di sekitar penggunaan validitas butir dan koefisien reliabilitas. Penelitian pendidikan dan psikologi berikut laporan hasil penelitian hendaknya menghindari ketidaktepatan ini. Pengujian hipotesis untuk r i pada taraf signifikasi tertentu tidak menjamin kelayakan reliabilitas pada pengukuran. Validitas butir tidak juga dapat menjamin validitas pengukuran sehingga tidak dapat digunakan sebagai pengganti validitas pengukuran (isi, kriteria, atau konstruk). Demikian pula pengujian hipotesis untuk r pada taraf signifikansi tertentu tidak menjamin kelayakan reliabilitas pada pengukuran di dalam penelitian. Khusus mengenai validitas butir atau daya beda butir, sejumlah penulis mengemukakan kriteria empirik berupa jumlah responden di atas 00 (atau 400)

106 JURNL ILMU PENDIDIKN, JUNI 004, JILID 11, NOMOR untuk selanjutnya bertambah dengan minimal lima kali jumlah butir. Sejumlah penulis juga mengemukakan kriteria empirik sebesar 0, untuk validitas butir atau daya beda butir atau koefisien korelasi butir-total. Kriteria empirik ini dapat digunakan untuk menghindari ketidaktepatan yang sedang terjadi sekarang ini di dalam penelitian pendidikan dan psikologi. DFTR RUJUKN iken, L.R. 1997. Psychological Testing and ssessment. Boston: llyn and Bacon. Crocker, L. & lgina, J. 1986. Introduction to Classical and Modern Test Theory. New York: Holt, Rinehart and Winston. Davis, F.B. 1966. Item Selection Technique: Educational Measurement. Washington, D.C.: merican Council on Education. Henning, G. 1987. Guide to Language Testing: Development, Evaluation, Research. Cambridge: Newbury House Publishers. Mehrens, W.. & Irvin, J.L. 1991. Measurement and Evaluation in Education and Psychology. Fort Worth: Hartcourt Brace College Publishers. Naga, D.S. 1997. The Misuses of Reliability Coefficient and Sampling Variance in Educational Research. The Journal of Education, 4 (Special Edition): 305-309. Nunnally Jr., J.C. 1970. Introduction to Psychological Measurement. New York: McGraw-Hill Book Company.