Pengembangan Instrumen Tes Program Aplikasi Berorientasi Performance Assessment Fitrianto Eko Subekti 1, Eka Setyaningsih 2 1,2 Program Studi Pendidikan Matematika, FKIP, Univeritas Muhammadiyah Purwokerto Jl. Raya Dukuhwaluh, PO BOX 202 Purwokerto Email : efitrians@ymail.com 1 ABSTRAK Penelitian ini mencoba memperbaiki dan menghasilkan instrumen tes Program Aplikasi berorientasi performance assessment yang valid dan baik. Penelitian menggunakan model pengembangan 4-D Thiagarajan (1974), yang terdiri dari tahap define, design, develop, dan disseminate. Dalam penelitian ini hanya sampai tahap develop. Uji validitas diolah dengan uji proporsi, sedang hasil uji coba dianalisa dengan uji validitas, dan reliabilitas. Hasil penelitian menunjukan : (1) instrumen tes yang dikembangkan dinyatakan valid oleh validator, dengan skor rata-rata 3,28 dari skor maksimal 4. (2) Analisa hasil uji coba dihasilkan instrumen tes yang valid dan reliabel, Berdasarkan penjelasan tersebut dapat dikatakan pengembangan instrumen tes valid dan baik. Kata Kunci :instrumen tes, performance assessment, 4-D PENDAHULUAN Mata kuliah program aplikasi merupakan salah satu mata kuliah wajib yang diambil oleh mahasiswa program studi pendidikan matematika di Universitas Muhammadiyah Purwokerto. Mata kuliah ini merupakan mata kuliah yang mendukung mata kuliah statistika dasar dan mata kuliah penelitian pendidikan matematika. Mata kuliah ini diberikan dengan tujuan untuk memberikan kesempatan pada mahasiswa untuk mendalami materi olah data statistika berbantuan SPSS. Mata kuliah yang mendasari mata kuliah program aplikasi adalah mata kuliah statistika dasar dan penelitian pendidikan matematika. Mahasiswa untuk menguasai materi yang ada di dalam mata kuliah program aplikasi dengan baik, maka harus sudah menguasai materi statistika dasar dan penelitian pendidikan matematka. Untuk dapat mengetahui apakah perilaku mahasiswa sudah menguasai materi dari mata kuliah yang dipelajari, maka perlu disusun intrumen tes. Instrumen tes berupa kisi-kisi soal, soal, dan pedoman penskorannya.dengan adanya instrumen tes yang baik, maka soal yang dibuat tentunya dapat mengukur, apa yang hendak diukur. Salah satu penilaian yang dapat digunakan adalah performance assessment (penilaian kinerja). Dengan penilaian kinerjatidak hanya tulisan peserta didik yang dinilai, tetapi juga produk maupun sikap peserta didik ikut dinilai. Karena penilaian kinerja merupakan penilaian belajar peserta didik yang meliputi semua penilaian dalam bentuk tulisan, produk ataupun sikap (Iryanti, 2004).Berdasarkan penjelasan tersebut, maka peneliti ingin mengembangkan intrumen tes yang dapat mengukur kinerja mahasiswa, khususnya instrumen tes untuk mata kuliah program aplikasi. Tes merupakan alat yang digunakan untuk mengukur sesuatu sesuai dengan cara dan aturanaturan yang telah ditentukan (Arikunto, 2010). Sedangkan menurut Sukardi (2010) tes merupakan prosedur sistematis yang direncanakan dan mempunyai tujuan untuk membandingkan perilaku dua siswa atau lebih. Pelaksanaan tes dapat terlaksana jika tersedia perangkat, tugas, pertanyaan atau latihan. Perangkat tersebut dinamakan instrumen tes. Berdasarkan pengertian tersebut instrumen tes merupakan perangkat yang digunakan untuk mengetahui perbandingan perilaku dua siswa atau lebih. Sebuah tes dapat dikatakan baik, sebagai alat pengukur, jika memenuhi persyaratan tes, yang meliputi : (1) validitas; (2) reliabilitas; (3) objektivitas; dan (4) praktibilitas (Arikunto, 2010). Sebuah tes dikatakan valid jika dapat mengukur apa yang hendak diukur. Artinya jika ingin mengukur kemampuan menginput dan mengolah data, serta menginterpretasikan hasilnya, maka soal-soal yang dibuat harus dapat mengukur kemampuan tersebut. Sedangkan tes dikatakan reliabel jika tes tersebut memiliki keajegan, artinya jika tes tersebut diberikan kepada siswa yang sama dalam waktu yang berlainan, siswa tersebut masih dalam rangking kelompok yang sama. Objektivitas berkaitan dengan skoring, artinya dalam penilaian dalam soal yang sama terhadap orang yang berbeda penskorannya selalu sama. 231
Praktikabilitas berkaitan dengan kepraktisan sebuah tes, artinya tes tersebut mudah dilaksanakan, mudah pemeriksaannya dan terdapat petunjuk-petunjuk pengerjaan tes secara jelas.dalam hal ini tes dikatakan baik, jika tes tersebut dalam kriteria valid, dan reliabel. Penilaian kinerja merupakan sebuah pendekatan untuk mengukur kinerja siswa berdasarkan bagaimana siswa menyelesaikan tugas tertentu (Aliyn and Bacon, 1994). Danielson (Iryanti, 2004) mendefinisikan Penilaian kinerja merupakan bentuk penilaian yang menilai berbagai aspek, baik jawaban siswa, produk atau perilakunya. Sedangkan Iryanti (2004) menyatakan bahwa Penilaian kinerja merupakan penilaian belajar peserta didik yang meliputi semua penilaian dalam bentuk tulisan, produk. Dalam penelitian ini indikator penilaian kinerja yang digunakan meliputi: (1) kedisiplinan; (2) percaya diri; (3) ketelitian dan kecermatan; (4) kemampuan menginput data; (5) kemampuan mengolah data; (6) kemampuan merumuskan hipotesis; (7) kemampuan interpretasi hasil. Intrumen tes berorientasi performance assessment(penilaian kinerja) merupakan perangkat tes, dimana perangkat tes tersebut soal-soalnya dibuat dengan tujuan untuk dapat mengukur kinerja mahasiswa. Segala catatan, produk atau sikap mahasiswa dalam menyelesaiakan permasalahan yang diberikan diukur menggunakan rubrik penilaian kinerja. METODE PENELITIAN Jenis penelitian yang dikembangkan adalah Penelitian Pengembangan. Adapun yang dikembangkan adalah instrumen tes. Pengembangan yang dimaksud dalam penelitian ini adalah pengembangan yang mengahasilkan produk tertentu serta menilai produk tersebut (Sugiyono, 2010). Model pengembangan yang digunakan adalah model pengembangan Thiagarajan (1974), dengan tahapan sebagai berikut : (1) define (pendefinisian); (2) design (perancangan); (3) develop (pengembangan); dan (4) disseminate (penyebaran). Model yang dipakai hanya sampai tahap pengembangan. Tahap penyebaran tidak dilakukan, karena keterbatasan waktu dan biaya dari penelitian ini. Selain itu pada tahap perancangan, langkah pemilihan media tidak dilakukan, karena dalam pengembangan ini hanya mengembangkan instrumen tes. Penelitian dilaksanakan selama 4 bulan, dimulai dari bulan November 2013 sampai dengan bulan Februari tahun 2014 dan dilaksanakan di Universitas Muhammadiyah Purwokerto.Untuk mendapatkan data tentang instrumen tes yang valid digunakan lembar validasi instrumen tes. Sedangkan untuk mendapatkan data tentang analisa butir soal, digunakan tes. Tes berisi pertanyaan pertanyaan, dimana setiap item pertanyaan disusun berdasarkan indikator materi dan jawaban soal tersebut dinilai dengan menggunakan penilaian kinerja, selain itu segala aktivitas di dalam pengerjaan tes juga dinilai dengan menggunakan rubrik penilaian kinerja. Data yang diperoleh untuk selanjutnya dilakukan analisis terhadap data tersebut. Adapun teknik analisis yang dilakukan adalah sebagai berikut : 1. Data yang diperoleh dari hasil validasi instrumen tes dianalisis berdasarkan rata rata skor. Data tersebut kemudian dianalisis berdasarkan rata-rata skor. Rata-rata skor dari instrumen tes dihitung dengan cara jumlah skor rata-rata instrumen tes dibagi dengan jumlah validator yang menilai intrumen tes tersebut. 2. Data yang diperoleh dari ujicoba instrumen tesdilakukan analisis butir tes. Analisis butir tes dilakukan untuk menentukan kualitas butir tes tersebut. Adapun yang dilakukan adalah melakukan uji validitas dan uji reliabilitas. Hasil ini dijadikan dasar dan masukan untuk melakukan revisi terhadap butir tes, sehingga didapatkan butir tes yang baik. Arikunto (2010) menyatakan bahwa validitas merupakan suatu ukuran yang menunjukkan tingkat kevalidan atau kesahihan suatu instrumen. Sebuah instrumen dikatakan valid apabila mampu mengukur apa yang diinginkan. instrumen tes dalam kategori valid jika t hitung > t tabel. Selanjutnya Arikunto (2010) menyatakan bahwa reliabilitas berhubungan dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap. Instrumen tes dikatakan reliabel jika r 11 > r hitung. Selain itu mahasiswa dinilai dengan menggunakan rubrik penilaian kinerja. Tujuannya adalah untuk melihat perilaku mahasiswa dalam menyelesaikan persoalan yang diberikan. Adapun rubrik penilaian didasarkan pada indikator penilaian kinerja, yaitu : 232
Untuk indikator (1) kedisiplinan; dan (2) percaya diri menggunakan keterangan Ya dan Tidak. Jawaban Ya dikonversi menjadi skor 1, sedangkan jawaban tidak dikonversi menjadi skor 0. Sedangkan untuk indikator : (3) ketelitian dan kecermatan; (4) kemampuan menginput data; (5) kemampuan mengolah data; (6) kemampuan merumuskan hipotesis; (7) kemampuan interpretasi hasil. Menggunakan pilihan tidak sesuai (0); sebagian sesuai (1); dan sesuai seluruhnya (2). HASIL DAN PEMBAHASAN Modifikasi teori Thiagarajan (1974) yang dipilih dalam pengembangan instrumen tes mata kuliah program aplikasi berorientasi performance assessment pada bagian ini akan dipaparkan tahapantahapannya. Adapun tahapan pengembangan dimulai dari tahap pendefinisian, perancangan sampai pada tahap ujicoba. Tahap Pendefinisian Mata kuliah program aplikasi merupakan salah satu mata kuliah wajib pada program pendidikan matematika. Mata kuliah ini membekali mahasiswa untuk dapat memecahkan masalah yang berkaitan dengan statistik penelitian pendididikan menggunakan bantuan SPSS serta dapat menginterpretasikan hasilnya. Mahasiswa yang mengambil mata kuliah program aplikasi secara bersamaan mereka juga sedang mengambil mata kuliah statistik dasar, dimana dalam mata kuliah tersebut dipelajari statistika deskriptif dan statistika inferensia. Mahasiswa tersebut juga belum mendapatkan mata kuliah statistik penelitian pendikan. Dengan kondisi tersebut, menjadikan kesulitan sendiri bagi pengampu mata kuliah program aplikasi. Hal ini dikarenakan mata kuliah statistik dasar dan statistik penelitian pendidikan merupakan materi yang mendasari mata kuliah program aplikasi. Berdasarkan usia, mereka sudah berada dalam usia dewasa. Sehingga perlu diberikan soal-soal yang memberikan kesempatan mereka untuk berfikir. Tipe soal yang digunakan adalah soal essay. Selain itu soal-soal yang diberikan menuntut mereka untuk memecahkan masalah dan dapat menginterpretasikan hasilnya. Pada tahap ini juga dihasilkan peta konsep untuk mata kuliah program aplikasi. Berikut peta konsep mata kuliah program aplikasi. Statistika Deskriptif Inferensia Deskripsi Data Nominal Ordinal Interval Rasio Uji- uji dengan SPSS Interpretasi Korelasi Regresi Banding Hasil Satu Sampel Sampel Berpasangan Dua Sampel Dalam hal ini intrumen yang dikembangkan mengambil materi uji regresi dan uji banding dua sampel. Selanjutnya berdasarkan analisis konsepmata kuliah program aplikasi diperoleh mahasiswa mampu menyelesaikan masalah yang berkaitan dengan statistik penelitian berbantuan SPSS dan menginterpretasikan hasilnya. Berdasarkan keterampilan-keterampilan yang harus dikuasai oleh mahasiswa, maka untuk mengoptimalkannya perlu dirancang tugas mandiri. Dengan tugas mandiri 233
kemampuan mahasiswa dalam memecahkan masalah yang berkaitan dengan statistik penelitian berbantuan SPSS dan menginterpretasikan hasilnya semakin baik. Hasil analisis konsep dan tugas kemudian dijadikan rujukan untuk membuat tujuan intruksional yang ingin dicapai. Adapun tujuan intruksional yang ingin dicapai adalahmahasiswa mampu memecahkan masalah yang berkaitan dengan regresi linier sederhana, uji banding dua sampel menggunakan bantuan SPSS dan menginterpretasikan hasilnya. Tahap Perancangan Analisis pada tahap perancangan digunakan untuk menyusun instrumen tes berorientasi performance assessment. Dasar penyusunan instrumen tes adalah analisis materi, analisis tugas dan perumusan tujuan intruksional. Tes disusun berbentuk essay yang didahului dengan membuat kisi-kisi dan acuan penskoran butir soal. Soal-soal disusun untuk mengukur kemampuan menyelesaikan masalah yang berkaitan dengan regresi linier sederhana, dan uji banding dua sampel dengan bantuan SPSS dan mampu menginterpretasikan hasilnya. Selain itu soal tes disusun untuk melihat kinerjamahasiswa dalam mengolah data menggunakan SPSS dan menginterpretasikan hasilnya. Untuk keperluan ini dibuat lembar penilaian kinerja mahasiswa. Pada langkah ini merupakan langkah penyusunan instrumen tes, yang meliputi: (a) kisi kisi soal; (b) soal evaluasi; (c) kunci jawaban; dan (d) lembar penilaian kinerjamahasiswa. Instrumen tes yang disusun didasarkan pada analisis kompetensi dasar dan dijabarkan dalam spesifikasi tujuan intruksionalmata kuliah program aplikasi. Hasil dari desain awal ini disebut draft I. Tahap Pengembangan Hasil tahap perancangan kemudian divalidasi, dan diujicobakan untuk dianalisis validitas dan reliabilitas instrumen tesnya. Berikut hasil dari uji validasi dan analisa hasil ujicoba. enilaian ahli meliputi validasi produk, yaitu mencakup validasi terhadap instrumen tes yang dikembangkan pada tahap perancangan. Validasi dilakukan oleh 2 orang untuk menilai kevalidaninstrumen tes yang telah dibuat pada tahap perencanaan. Hasil validasi diperoleh rata-rata 3,28 dengan skor maksimal 4. Sedangkan hasil rata-rata setiap indikator dapat dilihat pada tabel 1berikut : Tabel 1 Rata-Rata Validator Tiap Indikator Ind. Ke Rata-rata Ind. ke Rata-rata Ind. Ke Rata-rata 1 3,5 4 3,5 7 3 2 3 5 3,5 8 3 3 3,5 6 3,5 9 3 Keterangan : (1) Kesesuaian isi soal dengan KD dan Indikator; (2) Kesesuaian isi soal dengan tujuan yang ingin dicapai; (3) Prosedur pengerjaan soal menggunakan bahasa yang mudah dipahami; (4) Bahasa soal mudah dipahami; (5) Kesesuaian waktu dengan jumlah soal; (6) Pertanyaan yang dikembangkan dalam instrument tes dapat mengukur keterampilan mahasiswa dalam mengimput dan mengolah data menggunakan SPSS;(7) Pertanyaan yang dikembangkan dalam instrumen tes dapat mengukur keterampilan mahasiswa dalam menyelesaikan masalah; (8) Pertanyaan yang dikembangkan dalam instrument tes dapat mengukur keterampilan mahasiswa dalam menginterpretasikan hasil output SPSS; dan (9) Pertanyaan yang dikembangkan dalam instrument tes dapat mengukur kemampuan berpikir kritis. Berdasarkan tabel 1 semua indikator memiliki rata-rata > dari 2,5. Indikator ke- 1 sampai dengan ke-5, merupakan karakteristik umum dari instrumen tes. Berdasarkan hasil tersebut dapat dikatakan bahwa soal yang dibuat sesuai dengan KD, indikator dan tujuan yang ingin dicapai, prosedur soal dan bahasa soal yang digunakan mudah dipahami, serta waktu sesuai dengan jumlah soal yang diberikan. Sedangkan indikator ke- 6 sampai dengan indikator ke-9, merupakan karakteristik performance assessment. Berdasarkan hasil tersebut dapat dikatakan bahwa soal-soal yang kembangkan dapat mengukur kinerja mahasiswa terutama dalam hal menginput, mengolah, dan meninterpretasikan output yang dihasilkan. Selain itu juga dapat dikatakan bahwa soal-soal yang dikembangkan dapat mengukur kemampuan pemecahan masalah dan kemampuan berpikir kritis mahasiswa. 234
Untuk selanjutnya draf 1 diujicobakan kepada 16 mahasiswa. Uji Coba Intrumen Tes Uji validitas menghasilkan r xy = 0,882 untuk soal nomor 1 dan r xy = 0,871 untuk soal nomor 2. Dengan demikian didapat nilai t hitung 6,996 untuk soal nomor 1 dan 6,639 untuk soal nomor 2. Sedangkan nilai t tabel sebesar 1,761.Berdasarkan hasil tersebut terlihat bahwa semua butir soal t hitung > t tabel. Dengan demikian dapat dikatakan bahwa semua butir soal tersebut valid. Sedangkan hasil dari uji reliabilitas soal dilakukan menggunakan rumus alpha. Dihasilkan nilai r 11 = 0,698,dengan r tabel = 0,327. Karena r 11 > r tabel, maka soal dikatakan reliabel. Hasil uji coba juga dinilai menggunakan rubrik penilaian kinerja. Adapun hasilnya dapat dilihat pada tabel 2 berikut : Tabel 2 Rata-Rata kinerjamahasiswa Kode Rata-rata Keterangan Kode Rata-rata Keterangan A.1 0,87 Sangat baik B.5 1,07 Cukup A.2 0,53 Cukup B.6 1,13 Cukup A.3 0,67 Baik B.7 1,13 Cukup A.4 0,07 Sangat kurang B.8 1,40 Baik A.5 1,00 Sangat baik B.9 1,27 Baik B.1 1,60 Baik B.10 1,20 Cukup B.2 1,87 Sangat Baik B.11 1,13 Cukup B.3 1,20 Cukup B.12 1,27 Baik B.4 1,20 Cukup Keterangan : A.1) Datang tepat waktu; A.2) Bekerja sendiri dan tidak bekerjasama dengan teman yang lain; A.3) Tulisan dapat dibaca dengan jelas; A.4) Meminimalisir coretan dalam hasil pekerjaan; dan A.5) Hasil pekerjaan dikumpulkan tepat waktu. B.1 Kesesuaian penginputan data dengan tujuan soal; B.2) Kesesuaian langkah-langkah pengerjaan dengan bantuan SPSS dengan tujuan soal; B.3) Kesesuaian perumusan hipotesis dengan tujuan soal; B.4) Perumusan hipotesis menggunakan bahasa yang mudah dipahami; B.5) Perumusan hipotesis menggunakan simbol dan bahasa verbal yang benar; B.6) Kesesuaian rancangan analisis dengan tujuan soal; B.70 Rancangan analisis menggunakan bahasa yang mudah dipahami; B.8) Kesesuaian pengisian output dengan tujuan soal; B.9) Interpretasi hasil disajikan menggunakan bahasa yang sistematis; B.10) Kesesuaian interpretasi hasil dengan hipotesis yang diberikan; B.11) Kesesuaian interpretasi hasil dengan tujuan soal; B.12) Mengerjakan semua soal dengan cermat dan teliti. Berdasarkan tabel tersebut dilihat dari segi afektif terlihat bahwa kinerjamahasiswa dalam kategori AMendapatkan hasil yang berbeda-beda. Dalam hal kedisiplinan (A.1 dan A.5) dalam kategori sangat baik. Dalam hal bekerja mandiri (A.2) dalam kategori cukup. Hal ini terlihat dari pengamatan pada saat uji coba, beberapa mahasiswa masih terlihat bertanya kepada teman sebelahnya. Dalam hal tulisan (A.3 dan A.4) dalam kategori baik untuk A.3, dan dalam kategori sangat kurang untuk A.4. Hal ini terlihat dari hasil pekerjaan mahasiswa, tulisan mereka dapat dibaca dengan jelas, hanya saja mereka terlihat masih kurang percaya diri, karena masih terlihat banyak coretan pada hasil pekerjaan mereka. Hasil tersebut didukung oleh rata-rata B.12, dalam hal ketelitian dan kecermatan mengerjakan soal dalam kategori baik. Berdasarkan hasil tersebut dapat dikatakan bahwa kinerja mahasiswa dari segi afektif cukup menggembirakan.hal ini terlihat dari hasil rubrik penilaiankinerjamahasiswa terlihat bahwa dari segi kedisiplinan, kecermatan dan ketelitian cukup menggembirakan. Hanya saja dari segi kepercayaan diri dalam mengerjakan soal cukup memprihatinkan karena dari hasil pekerjaan mahasiswa masih banyak coretan-coretan kesalahan dalam penulisan jawaban. Sedangkan dari segi kognitif, yang meliputi: kemampuan dalam menginput, mengolah, menuliskan output, merumuskan hipotesis, membuat rancangan analisis, dan kemampuan menginterpretasikan output cukup menggembirakan. 235
KESIMPULAN Berdasarkan proses pengembangan instrumen tes dengan menggunakan modifikasi pengembangan model 4-D yang telah dilakukan, dapat disimpulkan sebagaiberikut :(1) Instrumen tes yang dihasilkan dalam kategori valid, hal ini terlihat dari hasil rata-rata skor validator 3,28 dari skor maksimal 4; (2) Dihasilkan soal yang baik. Hal ini terlihat bahwa semua soal yang dihasilkan dalam kategori valid dan reliabel. Berdasarkan hasil penelitian ini, beberapa saran yang dapat peneliti kemukakan, diantaranya : (1) Untuk menyusun soal evaluasi sebaiknya perlu dilihat apa tujuan dan siapa sasarannya; (2) Penelitian ini hendaknya dapat digunakan sebagai bahan masukkan dalam implementasi penelitian lebih lanjut. DAFTAR PUSTAKA Allyn and Bacon (1994). Classroom Assessment What Teachers Need to Know. A Simon & Schuster Company. Arikunto, S. (2010). Dasar-Dasar Evaluasi Pendidikan (Edisi Revisi). Jakarta. Bumi Aksara. Iryanti, P. (2004). Penilaian Unjuk Kerja.Yogyakarta: Depdiknas. Nur, M. (1999). Pemotivasian Siswa Untuk Belajar. Surabaya : Universitas Negeri Surabaya. Sugiyono. (2010). Metode penelitian Pendidikan Pendekatan Kuantitatif, Kualitatif dan R & D. Bandung : Tarsito. Sukardi. (2010). Evaluasi Pendidikan Prinsip & Operasionalnya. Jakarta. Bumi Aksara. Thiagarajan. (1974). Intructional Development for Training Teachers of Exceptional Student : A Sourcebook. Midieapolis : Indiana University Bloomington. Trianto. (2010). Mendesain Model Pembelajaran Inovatif-Progresif. Jakarta: Kencana Prenada Media Group. 236