Jurnal Pedagogika dan Dinamika Pendidikan ISSN 2252-6676 Volume 8, No. 3, Desember 2017 http://www.jurnalpedagogika.org - email: jurnalpedagogika@yahoo.com KARAKTERISTIK TES ENTRY BEHAVIOUR MATERI KIMIA BERDASARKAN CLASSICAL TEST THEORY (CTT) DAN ITEM RESPONS THEORY (IRT) MODEL RASCH (1PL) PADA MAHASISWA PROGRAM STUDI PENDIDIKAN KIMIA UNIVERSITAS PATTIMURA Yance Manoppo 1, Christi Matitaputty 2 1 Dosen Program Studi Pendidikan Kimia 2 Dosen Program Studi Pendidikan Matematika Email: molucanano@yahoo.com ARTICLE INFO Article History: Accepted 28-09-2017 Available online 31-12- 2017 Keywords: Entry Behaviour, Classical Test Theory, Item Respons Theory, Rasch. ABSTRAK Penelitian ini bertujuan untuk mengetahui Karakteristik Tes Entry Behaviour Materi Kimia Berdasarkan Classical Test Theory (CTT) Dan Item Respons Theory (IRT) Model Rasch (1PL) Pada Mahasiswa Program Studi Pendidikan Kimia Universitas Pattimura. Subjek penelitian adalah seluruh lembar jawaban peserta Tes Entry Beahaviour Mahasiswa Program Studi Pendidikan Kimia Tahun 2017. Penelitian ini merupakan penelitian kuantitatif menggunakan pendekatan ex-post facto. Hasil analisis dengan pendekatan teori tes klasik menunjukkan 77,5% butir memiliki tingkat kesulitan butir berfungsi baik, 55% butir daya bedanya belum memenuhi syarat, dan 70% butir memiliki pengecoh berfungsi baik dengan indeks reliabilitas tes 0,772. Analisis dengan pendekatan teori respons butir menunjukkan terdapat 9 (22,5%) butir soal cocok (fit) dengan model, fungsi informasi maksimum 5,28 pada θ = -0,41, dan besarnya kesalahan pengukuran (SEM) 0,24.
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 2 PENDAHULUAN Mutu pendidikan dapat dilihat dari hasil evaluasi terhadap prestasi belajar siswa dan evaluasi terhadap prestasi belajar siswa sebagian besar bersumber pada hasil pengukuran. Berdasarkan hasil pengukuran dapat diperoleh informasi yang bermakna sebagai masukan kepada pihak-pihak yang terkait dengan pendidikan, sebagai dasar pengambilan keputusan atau sebagai dasar penilaian dalam rangka menentukan kebijakan bagi guru atau lembaga penyelenggara pendidikan terhadap peserta didik.untuk menilai mutu setiap butir soal yang pada akhirnya untuk mengetahui seperangkat soal dalam berbagai aspek, perlu dilakukan analisis butir soal. Tujuan utama analisis butir soal adalah untuk mendapatkan informasi tentang karakteristik setiap butir soal, baik melalui telaah butir soal maupun analisis empiris. Hasil analisis tersebut dapat digunakan untuk mengetahui mutu soal, mutu belajar peserta didik, dan sebagai salah satu indikasi keberhasilan lembaga pendidikan. Konsep Paradigma pengembangan butir-butir tes berdasarkan acuan patokan digunakan untuk mengukur sejauh mana peserta didik telah mencapai tujuan instruksional. Hal ini dapat dilakukan dengan cara membandingkan penampilan peserta didik dalam pengujian dengan patokan yang telah ditentukan sebelumnya. Tes acuan patokan disebut juga tes acuan tujuan dalam pengukuran proses pembelajaran yang berpusat pada peserta didik (learned-centered) adalah penilaian yang berpusat pada peserta didik (learner-centered assessment). Definisi learner-centered assessment sejajar dengan definisi tradisional test acuan patokan, sebagai element utama dari pembelajaran yang didesain secara sistematis. Bagi seorang perancang pembelajaran harus mengembangkan butir tes acuan patokan, karena hasil tes pengukuran tersebut berguna untuk: (i). mendiagnosis dan menempatkan dalam kurikulum; (ii). Memeriksa hasil belajar dan kesalahan pengertian sehingga dapat diberikan pembelajaran remedial sebelum pembelajaran dilanjutkan; (iii). menjadi dokumen kemajuan belajar. Dalam mengembangkan butir-butir tes acuan patokan, Dick and Carrey (1985) merekomendasikan empat macam tes acuan patokan antara lain: (1) Entry behavior test yang diberikan kepada peserta didik sebelum memulai pembelajaran. Tes ini berguna untuk mengukur keterampilan syarat atau keterampilan yang harus sudah dikuasai sebelum pembelajaran dimulai. Keterampilan syarat akan muncul di bawah garis entry behavior. (2) Pre-test yang dilakukan pada awal pembelajaran untuk mengetahui apakah peserta didik sudah menguasai beberapa atau semua keterampilan yang akan diajarkan. Tujuannya adalah untuk efisiensi. Jika semua keterampilan sudah dikuasai maka tidak perlu ada pembelajaran. Namun jika hanya sebagian materi yang sudah dikuasai maka data tes ini memungkinkan desainer untuk lebih efisien. Mungkin hanya review atau pengingat yang dibutuhkan. Bila program tersebut merupakan sesuatu yang baru, maka tes inipun dapat ditiadakan. Maksud dari pretes ini bukanlah untuk menentukan nilai akhir tetapi lebih mengenal profil anak didik berkenaan. Biasanya pretest dan entry behavior test dijadikan satu. Hasil dari tes entry behavior dapat digunakan untuk mengetahui apakah peserta didik siap memulai pembelajaran, sedangkan dari hasil pretest dapat diutuskan
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 3 apakah pembelajaran akan menjadi terlalu mudah untuk peserta didik.(3) Practice test yang diberikan selama peserta didik sedang dalam proses belajar (Uno, 2007: 28, tes tersebut tes sisipan). Tes ini berfungsi untuk melihat apakah peserta didik memang telah dapat menangkap apa yang sedang dibicarakan dan juga untuk membuat peserta didik lebih aktif berpartisipasi selama pembelajaran. Tes ini memungkinkan peserta didik untuk menampilkan pengetahuan dan keterampilan baru dan untuk refleksi diri sampai level berapa keterampilan dan pengetahuan mereka. Tes ini berisi keterampilan yang lebih sedikit dan lebih fokus pada materi setiap. Hasil tes ini digunakan instruktur untuk memberikan feedback dan untuk memonitor pembelajaran.(4) Post-test yang diparalel dengan pre-test. Sama dengan pre-test, post-test mengukur tujuan pembelajaran. Post-test harus menilai semua objektif dan terutama fokus pada objektif terakhir. Namun jika waktu tidak memungkinkan, maka hanya tujuan akhir dan keterampilan penting saja yang diujikan. Post-test mungkin digunakan untuk menilai performa peserta didik dan untuk memberi kredit karena telah menyelesaikan program. Tujuan yang terutama dari tes ini adalah agar pendidik dapat mengidentifikasi area pembelajaran yang tidak bisa dilakukan dengan baik. Jika peserta didik gagal dalam tes, pendidik harus dapat teridentifikasi dalam proses pembelajaran yang mana tidak dimengerti oleh peserta didik. Tes ini merupakan tes acuan patokan yang mencakup pengukuran semua tujuan intruksional khusus yang ada terutama tujuan intruksional yang bersifat terminal. Dengan tes ini dapat diketahui bagian-bagian mana diantara pembelajaran yang belum dicapai. Terdapat beberapa saran yang dapat membantu dalam menentukan berapa banyak tes item pilihan yang diperlukan. Jika tes item memerlukan sebuah format respon yang memungkinkan peserta didik dapat menebak jawaban dengan benar, maka dapat memasukkan beberapa tes item paralel untuk tujuan yang sama jika kemungkinan menebak jawaban yang benar kecil kemungkinan, dapat diputuskan satu atau dua item untuk menentukan kemampuan peserta didik. Tiap-tiap program studi yang ada di FKIP Unpatti memiliki karakteristik bidang studi yang berbeda-beda, sehingga menghasilkan perbedaan kemampuan dan prestasi belajar pada mahasiswa. Untuk itu perlu dilakukan penelitian terhadap validity differensial. Hal ini bertujuan agar pemilihan program studi yang akan diminati mahasiswa memiliki kesesuaian bidang dengan kemampuannya. Dengan mengetahui kemampuan setiap mahasiswa, maka setiap mahasiswa dapat diseleksi untuk dapat menempati kelas Unggulan. Karakteristik soal tes tes entry behaviour tidak hanya sebatas pada deteksi kemampuan setiap peserta tes, tetapi kedepan estimasi kemampuan dapat diintegrasikan pada penyusunan soal berbasis online yang lebih dikenal dengan CAT (Computerize Adaptif Test). CAT memformulasikan estimasi kemampuan peserta tes disamping menggunakan skor jawaban benar yang diperoleh oleh masing-masing peserta tes. Berdasarkan uraian di atas untuk menguji mutu setiap butir soal Kimia tes entry behaviour, diperlukan analisis yang dapat memberikan informasi tentang karakteristik setiap butir soal tersebut khususnya yang berkaitan dengan karakteristik responden dengan menggunakan teori tes klasik dan teori respon butir.
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 4 KAJIAN PUSTAKA Pengukuran, Penilaian dan Evaluasi Dalam kehidupan sehari-hari, secara tidak sadar sering dilakukan tiga kegiatan atau pekerjaan tersebut. Sementara itu, orang lebih cenderung mengartikan tiga hal tersebut adalah sama pengertiannya. Menurut Allen & Yenn (1979: 2), measurement is the assigning of numbers to individuals in a systematic way as a means of representing properties of in individuals yakni pengukuran adalah penetapan angka dengan cara yang sistematik untuk menyatakan keadaan individu.guilford (1936: 1) mengemukakan bahwa pengukuran adalah penetapan angka terhadap suatu objek menurut aturan tertentu. Hal ini sejalan dengan definisi dari Cronbach (1970) yang dikutip oleh Chabib Thoha (1996: 2) bahwa pengukuran merupakan prosedur yang sistematis untuk mengamati perilaku seseorang dan menggambarkannya dengan bantuan skala numerik atau sistem kategori. Menurut Badrun Kartowagiran (2006), pengukuran adalah kegiatan yang mencoba mengkuantifikasikan suatu obyek atau subyek, yang di dalamnya termasuk potensi dan nonpotensi. Karenanya pengukuran ada yang melalui tes, yaitu untuk mengukur potensi dan ada yang tidak melalui tes, yakni untuk mengukur nonpotensi. Penilaian sebagai salah satu hasil dari pengukuran, merupakan suatu kegiatan penafsiran terhadap skor hasil pengukuran yang implikasinya lebih dikenakan pada perseorangan atau individual. Penilaian juga digunakan untuk mengambil keputusan terhadap sesuatu dengan ukuran baik dan buruk, sehingga lebih bersifat kualitatif.penilaian atau assessment merupakan suatu proses pengumpulan, pelaporan dan penggunaan informasi tentang hasil belajar peserta didik (perorangan atau kelompok) yang diperoleh melalui pengukuran. Penilaian bertujuan untuk menganalisis atau menjelaskan unjuk kerja/prestasi siswa dalam mengerjakan tugastugas yang terkait dan mengefektifkan penggunaan informasi tersebut untuk mencapai tujuan pendidikan. Pengumpulan informasi dapat dilakukan dalam suasana resmi maupun tidak resmi, di dalam atau di luar kelas, menggunakan waktu khusus, misalnya untuk penilaian aspek sikap/nilai dengan tes, non tes atau terintegrasi dalam seluruh kegiatan belajar mengajar. Di sekolah sering digunakan bentuk tes dengan alasan kepraktisan, karena tes sebagai alat ukur sangat praktis digunakan untuk melihat prestasi siswa dalam kaitannya dengan tujuan yang telah ditentukan. Tes Entry Behaviour Kemampuan awal (Entry Behavior) adalah kemampuan yang telah diperoleh siswa sebelum dia memperoleh kemampuan terminal tertentu yang baru. Kemampuan awal menunjukkan status pengetahuan dan keterampilan siswa sekarang untuk menuju ke status yang akan datang yang diinginkan guru agar tercapai oleh siswa. Dengan kemampuan ini dapat ditentukan dari mana pengajaran harus dimulai. Kemampuan terminal merupakan arah tujuan pengajaran diakhiri. Jadi, pengajaran berlangsung dari kemampuan awal sampai ke kemampuan terminal itulah yang menjadi tanggung jawab pengajar. Dalam pengukuran, Entry Beaviour termasuk kategori domain kognitif maka harus melalui tes, sedangkan yang masuk domain afektif dan psikomotor, maka
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 5 melalui non tes yaitu dengan pengamatan atau dengan wawancara terhadap individu peserta didik. Oleh karena itu, pengukuran pada dasarnya bersifat deskriptif dan kuantitatif. Hasil pengukuran merupakan informasi atau data yang diwujudkan dalam bentuk angka-angka. Fungsi utama pengukuran adalah untuk memperoleh informasi guna keperluan penilaian dan evaluasi. Teori Pengukuran Dalam Tes Teori Tes Klasik Teori tes klasik atau disebut teori skor murni klasik (Allen dan Yen, 1979:57) didasarkan pada suatu model aditif, yakni skor amatan merupakan penjumlahan dari skor sebenarnya dan skor kesalahan pengukuran. Jika dituliskan dengan pernyataan matematis, maka kalimat tersebut menjadi X = T + E dengan : X : skor amatan, T : skor sebenarnya, E : skor kesalahan pengukuran (error score). Kesalahan pengukuran yang dimaksudkan dalam teori ini merupakan kesalahan yang tidak sistematis atau acak. Kesalahan ini merupakan penyimpangan secara teoretis dari skor amatan yang diperoleh dengan skor amatan yang diharapkan. Kesalahan pengukuran yang sistematis dianggap bukan merupakan kesalahan pengukuran. BadrunKartowagiran (2006:1) menguraikan asumsi tersebut sebagai berikut: 1) Skor perolehan terdiri dari skor murni dan skor kesalahan pengukuran 2) Nilai harapan skor perolehan sama dengan skor murni 3) Skor murni dan skor kesalahan yang dicapai oleh suatu populasi subjek pada suatu tes tidak berkorelasi satu sama lain 4) Skor-skor kesalahan pada dua tes (yang dimaksud untuk mengukur hal yang sama) tidak saling berkorelasi 5) Jika ada dua tes yang dimaksudkan untuk mengukur atribut yang sama, maka ksor-skor kesalahan pada tes pertama tidak berkorelasi dengan skorskor murni pada tes kedua 6) Jika kedua perangkat tes yang dimaksudkan untuk mengukur atrinut yang sama mempunyai skor murni dan skor kesalahan yang sama maka kedua perangkat tes itu disebut paralel 7) Jika dua perangkat tes yang dimaksudkan untuk mengukur atribut yang sama mempunyai skor perolehan Xt1 dan Xt2 yang memenuhi asumsi 1 sampai 5, dan jika untuk setiap populasi subjek X.1=X.2+C12, dimana C12 adalah konstanta maka kedua tes itu disebut setara (equivalent test). Asumsi-asumsi pada teori tes klasik ini dijadikan dasar untuk mengembangkan formula-formula dalam menentukan validitas dan reliabilitas tes.validitas dan reliabilitas pada perangkat tes digunakan untuk menentukan kualitas tes. Kriteria lain yang dapat digunakan untuk menentukan kualitas tes adalah indeks kesukaran dan daya pembeda. Dalam bidang pendidikan, pengukuran tidak dapat langsung
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 6 dilakukan pada ciri atau karakter yang akan diukur karena biasanya bersifat abstrak. Hal ini menyebabkan sulitnya memperoleh alat ukur yang stabil untuk mengukur karakteristik seseorang (Mehrens dan Lehmann, 1973: 103). Berdasarkan uraian di atas, maka dalam pembuatan alat ukur dalam dunia pendidikan harus dilakukan secermat mungkin dan disesuaikan dengan kaidah-kaidah yang telah ditentukan oleh ahli-ahli pengukuran di bidang pendidikan. Untuk melihat reliabilitas suatu alat ukur, yang berupa suatu indeks reliabilitas, dapat dilakukan penelaahan secara statistik. Harga ini biasa dinamakan dengan koefisien reliabilitas (reliability coefficient).untuk menentukan harga reliabilitas suatu tes/butir soal berbentuk pilihan ganda (multiple choice) dapat digunakan rumus sebagai berikut. ^ 2 R si 1... ( 2 ) R 1 2 sx dengan : R 2 i : banyaknya butir soal, s : varians butir soal ke-i, 2 s x : varians skor total.h Mehrens dan Lehmann (1973: 104) menyatakan bahwa meskipun tidak ada perjanjian secara umum, tetapi secara luas dapat diterima bahwa tes yang digunakan untuk membuat keputusan pada siswa secara perorangan harus memiliki koefisien reliabilitas minimal sebesar 0,85. Tingkat kesukaran suatu butir soal, yang disimbolkan dengan p i, merupakan salah satu parameter butir soal yang sangat berguna dalam penganalisisan suatu tes. Hal ini disebabkan karena dengan melihat parameter butir ini, akan diketahui seberapa baiknya kualitas suatu butir soal. Jika harga pi mendekati 0, maka soal tersebut terlalu sukar, sedangkan jika pi mendekati 1, maka soal tersebut terlalu mudah, sehingga perlu dibuang. Hal ini disebabkan karena butir tersebut tidak dapat membedakan kemampuan seorang siswa dengan siswa lainnya. Untuk menentukan indeks kesukaran dari suatu butir pada perangkat tes pilihan ganda, digunakan persamaan sebagai berikut : B p =...( 3 ) N dengan : p = proporsi menjawab benar pada butir soal tertentu. B = banyaknya peserta tes yang menjawab benar. N = jumlah peserta tes yang menjawab. Daya pembeda soal (d i ) merupakan parameter tes yang memberikan informasi seberapa besar daya soal itu untuk dapat membedakan peserta tes yang jumlah skornya tinggi dan peserta tes yang jumlah skornya rendah (Allen dan Yen, 1979:
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 7 122). Dengan demikian, besaran ini akan dapat digunakan untuk melihat kemampuan butir soal itu dalam membedakan peserta yang mampu dan yang tidak mampu memahami materi yang ditanyakan dalam butir tersebut. Semakin besar indeks daya pembeda butir soal maka semakin besar kemampuan butir soal membedakan peserta yang mampu dan tidak mampu. Untuk menentukan daya pembeda, dapat digunakan indeks diskriminasi, indeks korelasi biserial, indeks korelasi point biserial, dan indeks keselarasan. Korelasi point biserial maupun korelasi biserial adalah korelasi product moment yang ditetapkan pada data dengan variabel yang dikorelasikan masing-masing berbeda sifat. Pada analisis butir ini hanya akan digunakan indeks korelasi point biserial yang ditentukan dengan rumus: N r pbis XY X Y =...( 4 ) 2 2 2 2 N X X. N Y Y dengan r pbis = koefisien korelasi poit biserial. Pada suatu butir soal, indeks daya beda dikatakan baik jika lebih besar atau sama dengan 0,2. Koefisien korelasi point biserial selalu lebih rendah dibanding dengan korelasi biserial karena merupakan kombinasi hubungan antara tes dengan kriteria dan tingkat kesukaran. Depdikbud (1999: 126) mengatakan korelasi point biserial lebih cenderung menggunakan tes yang memiliki tingkat kesukaran rerata dan maksimal, yaitu bila tingkat kesukaran 0,5 maka r pbis = Y r pbis = r bis.....( 5 ) p. q Efektivitas distraktor dari suatu butir soal pilihan ganda dapat dianalisis dari distribusi pilihan jawaban yang disediakan. Efektivitas distraktor diperiksa untuk melihat apakah semua distraktor atau semua pilihan jawaban yang bukan kunci telah berfungsi sebagaimana mestinya. Fungsi pilihan jawaban distraktor harus tampak sebagai jawaban yang benar bagi peserta tes dari kelompok kemampuan rendah. Bagi peserta kelompok kemampuan tinggi, distraktor harus tampak sebagai jawaban yang salah. Kesalahan Pengukuran (Standard Error of Measurement, SEM) dapat digunakan untuk mamahami kesalahan yang bersifat acak/random yang mempengaruhi skor peserta tes dalam pelaksanaan tes. Kesalahan pengukuran, yang disimbulkan dengan E, dapat dihitung dengan rumus yang diturunkan dari rumus reliabilitas (Allen dan Yen, 1979: 73). E = x,.......( 6 ) 1 xx dengan x merupakan deviasi standar dari skor total dan xx merupakan koefisien reliabilitas.
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 8 Teori Respons Butir(Item Response Theory) Konsep Dasar Selain teori pengukuran klasik, dalam pengukuran pendidikan dikembangkan teori pengukuran modern. Teori pengukuran modern dikembangkan karena teori pengukuran klasik memiliki keterbatasan, karena teori pengukuran klasik terdapat keterbatasan karena bersifat groupdependent dan itemdependent (Hambleton, Swaminathan dan Rogers, 1991: 2-5). Group dependent artinya hasil pengukuran tergantung dari kelompok peserta yang mengerjakan tes. Jika tes diujikan kepada kelompok peserta dengan kemampuan tinggi, tingkat kesulitan butir soal akan rendah. Sebaliknya jika tes diujikan kepada kelompok peserta dengan kemampuan rendah, tingkat kesulitan butir soal akan tinggi. Item dependent artinya hasil pengukuran tergantung dari tes mana yang diujikan. Jika tes yang diujikan mempunyai tingkat kesulitan tinggi, estimasi kemampuan peserta tes akan rendah. Sebaliknya jika tes yang diujikan mempunyai tingkat kesulitan rendah, estimasi kemampuan peserta tes akan tinggi. Kelemahan pengukuran semacam ini tidak terdapat dalam teori pengukuran modern, yang selanjutnya disebut teori respons butir (Item Response Theory). Teori respons butir memperbaiki keterbatasan yang ada dalam teori pengukuran klasik. Menurut Hambleton, Swaminathan dan Rogers (1991: 2-5) serta Hulin dkk. (1983), teori respons butir bertujuan membentuk : (1) statistik butir yang tidak tergantung pada kelompok subjek, (2) skor tes yang dapat menggambarkan profisiensi subjek dan tidak tergantung pada taraf kesulitan tes, (3) model tes yang dapat memberikan dasar pencocokan antara butir tes dan level kemampuan, (4) model tes yang asumsi-asumsinya mempunyai dukungan kuat (5) model tes yang tidak memerlukan asumsi paralel dalam pengujian reliabilitasnya. MenurutHambleton, Swaminathan, dan Rogers (1991: 2-5), pemikiran teori respons butir (Item Response Theory) didasarkan pada dua buah postulat, yaitu : (1) prestasi subjek pada suatu butir soal dapat diprediksikan dengan seperangkat faktor yang disebut kemampuan (latent traits) (2) hubungan antara prestasi subjek pada suatu butir dan perangkat kemampuan yang mendasarinya digambarkan oleh fungsi naik monoton yaitu item characteristic curve (ICC). Pernyataan tersebut mengindikasikan bahwa prestasi peserta tes dalam merespons suatu butir tes tergantung dari kemampuan yang dimilikinya. Semakin tinggi kemampuan yang dimiliki semakin baik prestasi yang ditampilkan peserta tes. Tujuan teori respons butir ialah membentuk parameter butir dan parameter peserta yang bersifat invarians. Tujuan tersebut akan terwujud jika ada kecocokan antara perangkat data tes dengan model yang digunakan. Model yang digunakan akan berlaku atau cocok jika data tes memenuhi asumsi-asumsi dalam teori respons butir.
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 9 Asumsi-asumsi Teori Respons Butir Dalam teori respons butir, model matematisnya mempunyai makna bahwa probabilitas subyek untuk menjawab butir dengan benar tergantung pada kemampuan subyek dan karakteristik butir. Ini berarti peserta tes dengan kemampuan tinggi akan mempunyai probabilitas menjawab benar lebih besar jika dibandingkan dengan peserta yang mempunyai kemampuan rendah. Hambleton, Swaminathan, dan Rogers (1991: 9) menyatakan bahwa ada tiga asumsi yang mendasari teori respon butir, yaitu unidimensi, independensi lokal dan invariansi parameter. Ketiga asumsi dapat dijelaskan sebagai berikut. Unidimensi, artinya setiap butir tes hanya mengukur satu kemampuan. Contohnya, pada tes prestasi belajar bidang studi matematika, butir-butir yang termuat di dalamnya hanya mengukur kemampuan siswa bidang studi matematika saja, bukan bidang yang lainnya. Pada praktiknya, asumsi unidimensi tidak dapat dipenuhi secara ketat karena adanya faktor-faktor kognitif, kepribadian dan faktorfaktor administratif dalam tes, seperti kecemasan, motivasi, dan tendensi untuk menebak. Memperhatikan hal ini, asumsi unidimensi dapat ditunjukkan hanya jika tes mengandung hanya satu komponen dominan yang mengukur prestasi suatu subjek. Independensi lokal terjadi jika faktor-faktor yang mempengaruhi prestasi menjadi konstan, maka respons subjek terhadap pasangan butir yang manapun akan independen secara statistik satu sama lain. Asumsi ini akan terpenuhi apabila jawaban peserta terhadap sebuah butir soal tidak mempengaruhi jawaban peserta terhadap terhadap butir soal yang lain. Tes untuk memenuhi asumsi independensi lokal dapat dilakukan dengan membuktikan bahwa peluang dari pola jawaban setiap peserta tes sama dengan hasil kali peluang jawaban peserta tes pada setiap butir soal. Model Logistik Pada teori respons butir, digunakan model logistik. Ada tiga model logistik dalam teori respon butir, yaitu model logistik satu parameter, model logistik dua parameter, dan model logistik tiga parameter. Perbedaan dari ketiga model tersebut terletak pada banyaknya parameter yang digunakan dalam menggambarkan karakteristik butir dalam model yang digunakan. Parameter-parameter yang digunakan tersebut adalah indeks kesukaran, indeks daya beda butir dan parameter tebakan semu (pseudoguessing). Dalam hal ini hanya akan disinggung model yang menggunakan satu parameter saja. a) Model Logistik Satu Parameter (1P) Pada model logistik satu parameter, probabilitas peserta tes untuk menjawab benar suatu butir soal ditentukan oleh satu karakteristik butir, yaitu indeks kesukaran butir. Menurut Hambleton, Swaminathan, dan Rogers (1991: 12), secara matematis model logistik satu parameter dapat dinyatakan sebagai berikut. ( b ) e i P i ( ) = ( b ) 1 e, dengan i : 1,2,3,,n i P i ( ): probabilitas peserta tes yang memiliki kemampuan dipilih
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 10 secara acak dapat menjawab butir i dengan benar : tingkat kemampuan subyek b i : indeks kesukaran butir ke-i e : bilangan natural yang nilainya mendekati 2,718 n : banyaknya butir dalam tes Parameter b i merupakan suatu titik pada skala kemampuan agar peluang menjawab benar sebesar 50%. Misalkan suatu butir tes mempunyai parameter b i = 0,3, artinya diperlukan kemampuan minimal 0,3 pada skala untuk dapat menjawab benar dengan peluang 50%. Semakin besar nilai parameter b i, maka semakin besar kemampuan yang diperlukan untuk menjawab benar dengan peluang 50%. Dengan kata lain, semakin besar nilai parameter b i, maka makin sulit butir soal tersebut. b) Fungsi Informasi Butir dan Tes Fungsi informasi butir (Item Information Functions) merupakan suatu metode untuk menjelaskan kekuatan suatu butir pada perangkat tes, pemilihan butir tes, dan pembandingan beberapa perangkat tes. Fungsi informasi butir menyatakan kekuatan atau sumbangan butir tes dalam mengungkap latent trait yang diukur dengan tes tersebut. Dengan fungsi informasi butir diketahui butir yang mana yang cocok dengan model sehingga membantu dalam seleksi butir tes. Secara matematis, fungsi informasi butir memenuhi persamaan sebagai berikut: 2 I i p ' ( ) = i ( ) Pi ( ) Qi ( ) keterangan : i : 1,2,3,,n I i ( ) : fungsi informasi butir ke-i P i ( ) : peluang peserta dengan kemampuan menjawab benar butir i P' i ( ) : turunan fungsi P i ( ) terhadap Q i ( ) : peluang peserta dengan kemampuan menjawab salah butir ke-i Fungsi informasi tes merupakan jumlah dari fungsi informasi butir penyusun tes tersebut (Hambleton dan Swaminathan, 1985: 94). Berhubungan dengan hal ini, fungsi informasi perangkat tes akan tinggi jika butir tes mempunyai fungsi informasi yang tinggi pula. Fungsi informasi perangkat tes secara matematis dapat dituliskan sebagai berikut: n I i ( ) = I i ( ) i 1 Brennan dalam Jurnal JEM menulis: In IRT, error variance is taken as the inverse of the information function. More specifically, for all examinees with the same ability θ their (conditional) error variance is the inverse of the information function at θ. The logic for this perspective on error variance has nothing to do with semantic interpretations of the word information or its inverse (Brennan, 2001: 303).
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 11 Dalam teori respon butir, kesalahan penaksiran standar (Standard Error of Measurement, SEM) berkaitan erat dengan fungsi informasi (Nitko & Brookhart, 2007: 76; Putri. R. I., dkk, 2015: 265). Fungsi informasi dengan SEM mempunyai hubungan yang berbanding terbalik kuadratik, semakin besar fungsi informasi maka SEM semakin kecil atau sebaliknya (Hambleton, Swaminathan dan Rogers, 1991: 94). Jika nilai fungsi informasi dinyatakan dengan I i ( ) dan nilai estimasi SEM dinyatakan dengan SEM ( ), maka hubungan keduanya, menurut Hambleton, Swaminathan, dan Rogers (1991: 94) dinyatakan dengan 1 SEM ( ^ ) I( ) Fungsi informasi dalam teori respons butir memiliki pengertian hampir sama seperti koefisien reliabilitas pada teori tes klasik. Perbedaan keduanya adalah bila pada koefisien reliabilitas berlaku untuk semua butir dalam tes sehingga antara butir satu dengan yang lain tidak independen, sedang pada fungsi informasi skor butir yang satu dengan yang lainnya independen (Badrun Kartowagiran, 2006: 53). METODOLOGI PENELITIAN Penelitian ini merupakan penelitian kuantitatif menggunakan pendekatan expost facto. Data utama yang digunakan dalam penelitian ini adalah data set berupa jawaban/respons (lembar jawaban tes) peserta Tes Entry beahviour 2017 sebanyak 85 peserta. Prosedur Penelitian Analisis butir tes dilakukan menggunakan perangkat lunak Iteman versi 3.0 untuk melihat karakteristik butir tes yang meliputi tingkat kesukaran butir, daya pembeda butir, dan statistik sebaran jawaban. Selain itu ditentukan juga kehandalan/reliabilitas tes, kesalahan pengukuran (SE) dan distribusi skor. Selanjutnya pendekatan teori respons butir dilakukan menggunakan program Bilog- MG 3.0. Dari analisis ini diperoleh parameter butir, parameter peserta, fungsi informasi tes, dan grafik informasi tes. Dari analisis ini diperoleh besarnya Fungsi Informasi maksimum tiap butir, dan skala kemampuan yang diambil antara -4,0 dan 4,0 dengan interval 0,25. Kecocokan butir dengan model dapat dilihat dari harga p yang muncul dari hasil analisis dengan program Bilog-MG. Data, Intrumen, dan Teknik Pengumpulan Data Data yang digunakan dalam penelitian ini adalah respon peserta tes Entry Behaviour Program Studi Pendidikan Kimia FKIP Unpatti Tahun 2017 yang sudah dilakukan menggunakan instrumen tes. Analisis terhadap butir soal secara kuantitatif (empiris) menggunakan pendekatan teori tes klasik dan teori respon butir (IRT). Secara Teori Tes Klasik, dilakukan dengan mengukur Tingkat Kesukaran Butir Soal, Daya Pembeda Butir, Keberfungsian Pengecoh dan Indeks Realibilitas, Selanjutnya menggunakan Teori Respon Butir, dilakukan menggunakan Program Bilog-MG yang
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 12 menghasilkan output dalam bentuk tiga fase untuk mengukur estimasi butir berdasar teori klasik, estimasi parameter butir dan estimasi kemampuan peserta. Secara empiris, kualitas butir ditelaah berdasarkan kecocokan data dengan model dan nilai parameter butir. Kecocokan suatu butir dengan model dapat dilihat dari nilai chi kuadrat butir dibandingkan dengan harga kritik distribusi chi kuadrat sesuai dengan dk butir yang bersangkutan pada taraf signifikansi α. HASIL PENELITIAN DAN PEMBAHASAN 1. Karakteristik Butir Tes Klasik dengan Program Iteman a. Statistik Butir Soal Pada tampilan hasil statistik butir soal dapat diketahui hasilnya untuk soal yang dikategorikan sukar 17 butir, kategori sedang 23 butir, dan tidak terdapat soal dalam kategori mudah. Soal yang memiliki daya beda yang baik 22 butir, kurang baik 18 butir sedangkan untuk pengecoh 36 butir yang berfungsi baik. b. Statistik Tes/Skala Berdasarkan statistik hasil analisis program Microcat Iteman versi 3.0 terhadap 30 butir soal Kimia Tes Entry Behaviour Tahun 2013 yang direspon oleh peserta ujian sebanyak 85 orang pada Tabel 1 dapat bahwa peserta ratarata dapat menjawab dengan benar sebesar 13 butir soal (mean = 12,518), berarti rata-rata kurang dari setengah (32,5%) dari jumlah butir soal dapat dijawab dengan benar oleh peserta ujian, skor tertinggi 29 dan terendah 3. Nilai rerata (12,518) yang berdekatan dengan nilai median (12,00). Rata-rata tingkat kesukaran butir soal pada umumnya sedang (mean p = 0,313), cenderung banyak pada kisaran indeks 0,30 sampai 0,70. Butir soal cukup mampu membedakan kelompok siswa berkemampuan tinggi dengan kelompok siswa berkemampuan rendah, hal tersebut dinyatakan oleh rerata indeks daya pembeda 0,269. Indeks reliabilitas soal 0,679 dapat dinyatakan baik, artinya 68% perbedaan skor yang terdapat pada peserta ujian adalah kemampuan mereka yang sebenarnya, sedangkan 32% perbedaan skor yang ada merupakan kesalahan pengukuran. Menurut Linn (Djemari Mardapi, 1999: 14), kesalahan pengukuran bisa disebabkan oleh variasi acak dalam diri manusia, faktor lingkungan, subjektivitas pengukur, dan alat ukur. Kesalahan baku pengukuran pada perangkat soal hasil analisis secara klasik adalah sebesar 2,736. Tabel 1. Karakteristik Tes Entry Behaviour dengan Program Iteman Karakteristik N of Item N of Examinees Mean Variance Nilai 40 85 12,518 23,309
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 13 Karakteristik Std. Dev. Skew Kurtosis Minimum Maximum Median Alpha SEM Mean P Mean Item-Tot. Mean Biserial Nilai 4,828 0,900 1,919 3,000 29,000 12,000 0,679 2,736 0,313 0,269 0,363 Berdasarkan Tabel 1, rerata tingkat kesulitan dan daya pembeda soal yaitu 0,313 dan 0,269 artinya soal tes ini rata-rata dijawab dengan benar butirnya sebesar 31% dan soal dapat membedakan siswa yang berkemampuan tinggi dan berkemampuan rendah sebesar 33,1%. Hasil analisis soal Entry Behaviour Kimia menunjukkan bahwa tes tersebut memiliki reliabilitas yang cukup baik yaitu 0,679. Kesalahan pengukuran dapat disebabkan oleh beberapa faktor, seperti lingkungan ketika ujian yang kurang mendukung, kondisi psikologis maupun biologis peserta tes atau kurang menguasai materi yang ada. Berdasarkan analisis pogram Iteman, soal Entry Behaviour Kimia memiliki kualitas sedang pada tingkat kesulitan, karena 23 (57,5%) butir soal memenuhi kriteria dan 17 (42,5%) butir soal yang tidak memenuhi kriteria. Hal ini didukung juga dengan 90% pengecoh bekerja dengan baik meskipun dari kategori daya beda hanya 55%. Hasil temuan dari 40 butir soal, terdapat 8 butir soal dengan tanda check the key dari print out program Iteman, yaitu butir soal nomor 3, 7, 13, 27, 33, 36 dan 39. Tanda tersebut merupakan suatu peringatan bagi pembuat soal untuk melihat kembali pada pilihan jawaban apakah sudah tepat atau belum. Selanjutnya dari 40 butir soal Entry Behaviour yang diujikan ditemukan 12 butir soal yang perlu diperiksa kembali sebelum digunakan. Dengan demikian, berdasarkan kriteria yang telah ditetapkan dalam penentuan penerimaan butir soal, maka butir soal yang tidak sesuai dengan teori tes klasik adalah sebanyak 17 (42,5%) butir perlu direvisi dan 4 (10%) butir perlu diganti. 2. Karakteristik Karakteristik Butir Soal berdasarkan Pendekatan IRT Pada analisis fase pertama, nilai biserial digunakan untuk menentukan apakah suatu butir diikutkan pada analisis berikutnya atau tidak. Fase pertama hasil outputbilog-mg menunjukan bahwa dari 40 butir yang dianalisis terdapat 29 butir soal yang tidak dapat dilanjutkan pada fase kedua. Hal ini untuk mengantisipasi munculnya nilai negatifyang tidak signifikansehingga akan menyebabkan keputusan bias.). Dalam konteks ujian yang beracuan kriteria (criterion referenced test (CRT)) butir soal dengan tingkat kesulitan mudah dapat digunakan.
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 14 Butir soal yang tidak diikutkan dalam fase pertama dapat dilihat pada Tabel 2 berikut. Tabel 2. Butir Hasil Analisis Bilog Fase Pertama yang Tidak Dapat Dilanjutkan ke Fase Kedua Correlatio No n Biserial Keterangan 1 0,150 Tidak Dilanjutkan 2 0,261 Tidak Dilanjutkan 3 0,289 Tidak Dilanjutkan 4 0,066 Tidak Dilanjutkan 6 0,000 Tidak Dilanjutkan 7 0,000 Tidak Dilanjutkan 8 0,000 Tidak Dilanjutkan 9 0,000 Tidak Dilanjutkan 10 0,000 Tidak Dilanjutkan 11 0,000 Tidak Dilanjutkan 12-0,15 Tidak Dilanjutkan 14 0,000 Tidak Dilanjutkan 15 0,000 Tidak Dilanjutkan 16 0,000 Tidak Dilanjutkan 18-0,044 Tidak Dilanjutkan 20 0,164 Tidak Dilanjutkan 22 0,000 Tidak Dilanjutkan 26 0,124 Tidak Dilanjutkan 27 0,051 Tidak Dilanjutkan 28 0,000 Tidak Dilanjutkan 29 0,250 Tidak Dilanjutkan 31 0,265 Tidak Dilanjutkan 32-0,160 Tidak Dilanjutkan 34 0,000 Tidak Dilanjutkan 35-0,019 Tidak Dilanjutkan 36-0,028 Tidak Dilanjutkan 37 0,000 Tidak Dilanjutkan 38-0,325 Tidak Dilanjutkan 39 0,000 Tidak Dilanjutkan 40 0,000 Tidak Dilanjutkan Suatu butir dengan biserial kurang dari 0,3 tidak diikutkan pada analisis berikutnya, karena akan mengganggu proses analisis yakni munculnya nilai negatif yang tidak signifikan sehingga akan menimbulkan keputusan bias. Keputusan bias yang terjadi akan cenderung menolak butir pada sampel yang besar dan menerima butir pada sampel yang kecil. Menarik jika diperhatikan butir dengan biserial pada output tersebut yang memiliki nilai negatif dimana setelah dikorelasikan dengan
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 15 bentuk butir pertanyaan, ternyata opsi jawaban yang diberikan memberikan sedikit kebingungan bagi siswa dalam menjawab oleh karna terlalu sulit dibedakan butir jawabannya. Pada fase kedua hasil analisis model teori respons-butir dapat dikemukakan bahwa dari 11 butir soal yang dianalisis terdapat 10 butir soal yang baik atau 35 % dan 10 butir soal yang tidak baik atau 25%. Butir soal yang baik adalah butir soal dengan tingkat kesukaran soal (bi) terletak antara (-2, 2). Hasil analisis estimasi parameter butir soal Entry Behaviour Kimia menggunakan model 1-PL. Hasilnya, jumlah butir soal kimia yang layak dianalisis menggunakan IRT adalah sebanyak 11 butir. Rerata tingkat kesukaran soal kimia ditunjukkan oleh indeks -0,41 yang cenderung mengarah ke soal dengan kategori yang mudah. Pada Tabel 3 diperoleh informasi bahwa seluruh butir yang dianalisis lanjut ke fase kedua terdapat butir cocok dengan model 1-PL yang berjumlah 19 butir dengan memiliki nilai parameter daya pembeda berada pada interval 0 sampai 2. Informasi ini berarti kurang dari setengah dari keseluruhan butir soal Entry Behaviour Kimia memiliki cukup kemampuan untuk membedakan tingkat kemampuan peserta ujian. Tabel 3. Karakteristik Butir Soal Entry Behaviour Kimia dengan IRT Butir a b Kecocokan model Ket 1 0,468-1,910 Cocok Baik 2 0,492-4,105 TC TB 4 0,727-2,689 Cocok TB 5 0,716-2,474 Cocok TB 6 0,572-2,863 Cocok TB 7 0,587-3,432 TC TB 8 1,174-1,596 Cocok Baik 10 0,808-1,990 Cocok Baik 12 0,805-1,040 Cocok Baik 13 0,792-1,628 Cocok Baik 15 0,409-3,551 TC TB 16 0,763-1,912 Cocok Baik 17 0,978-1,694 Cocok Baik 20 0,887-1,947 Cocok Baik 23 0,764-1,896 Cocok Baik 24 1,279-1,250 TC TB 25 0,592-1,883 Cocok Baik 29 1,417-1,749 Cocok Baik 30 1,035-1,893 Cocok Baik 31 1,280-1,273 Cocok Baik 32 0,507-2,387 Cocok TB 34 1,056-1,827 Cocok Baik
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 16 Butir a b Kecocokan model Ket 35 0,548-2,146 Cocok TB 37 0,703-2,458 TC TB Keterangan : TC=Tidak Cocok, TB=Tidak Baik Hasil estimasi parameter tingkat kesukaran menunjukkan terdapat 15 butir yang berada pada interval -2 sampai 2, yang berarti memiliki tingkat kesukaran yang baik. Sebanyak 9 butir soal memiliki indeks kesukaran dibawah -2,0, sehingga dapat dikatakan sebagai butir yang mudah. Hasil estimasi parameter di atas dapat dijadikan informasi untuk menentukan karakteristik butir yang baik. Butir yang baik hendaknya memenuhi 3 persyaratan yaitu, butir cocok model dan tingkat kesulitan-2 sampai +2.Berdasarkan kriteria tersebut maka dapat dikatakan bahwa untuk memilih soal yang baik terdapat 9 butir atau 35% butir soal yang memenuhi persyaratan sebagai butir yang baik. Butir soal tersebut adalah butir nomor 3, 18, 19, 23, 24, 31, 33, 35, dan 38 Estimasi parameter butir dengan model 1 parameter logistik pada soal Entry Behaviour Kimia, menghasilkan nilai informasi tes sebesar 5,28 dengan tingkat kesalahan pengukuran 0,24. Nilai tersebut tercapai jika parameter kemampuan mahasiswa(θ) sebesar -0,41. Perhitungan fungsi informasi tes dihitung dengan bantuan program Excel 2007 for windows.grafik nilai fungsi informasi tes dengan parameter kemampuan peserta yang sesuai disajikan dalam Gambar 1 berikut. Subtest: TEST0001 6 1.34 5 1.07 I n fo rm a ti o n 4 3 2 0.80 0.54 S ta n d a rd E rro r 1 0.27 0-3 -2-1 0 1 2 3 Scale Score 0 Gambar 1. Grafik Nilai Fungsi Informasi, Sekor Kemampuan dan Kesalahan Baku
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 17 Kesalahan pengukuran perangkat soal Entry Behaviour Kimia berdasarkan hasil analisis menunjukkan bahwa besarnya kesalahan pengukuran sebesar 0,24. Kesalahan pengukuran dipergunakan untuk memahami kesalahan yang bersifat acak yang mempengaruhi skor peserta yang sebenarnya dalam pelaksanaan tes. Hasil perhitungan kesalahan pengukuran, diperoleh kesalahan pengukuran sebesar 0,24 dan skor maksimum yang dapat dicapai oleh peserta adalah 29, maka skor peserta Entry Behaviour Kimia sebenarnya berkisar pada X i ± 0,24. KESIMPULAN Berdasarkan hasil penelitian dan pembahasan pada soal Entry Behaviour Kimia dapat disimpulkan sebagai berikut. 1. Berdasarkan pendekatan teori tes klasik terdapat 57,5% butir memiliki tingkat kesulitan butir berfungsi baik, 55% butir daya bedanya belum memenuhi syarat dan 90% butir pengecoh (distractor) berfungsi baik dengan indeks reliabilitas tes 0,679. 2. Berdasarkan pendekatan teori respons butir terdapat 9 (22,5%) butir soal cocok (fit) dengan model, fungsi informasi maksimum 5,28 pada θ = -0,41, dan besarnya kesalahan pengukuran (SEM) 0,24. DAFTAR PUSTAKA Allen,M.J.&Yen,W.M.(1979).Introductiontomeasurementtheory.Monterey, CA:Brooks/ColePublishingCompany. Badrun Kartowagiran, (2006). Teori klasik dan teori respon butir. Bahan Kuliah. Yogyakarta: Pasca Sarjana Universitas Negeri Yogyakarta Brennan, R. L. (Ed.) (2006). Educational measurement (4 th ed.). Portsmouth: Greenwood Publishing Group DeMars, C. E. (2010). Understanding measurement: item response theory. New York: Oxford University Press. Hambleton, R.K. & Swaminathan, H. (1985). Item response theory. Boston, MA : Kluwer Inc. Hullin, C. L., et al. (1983). Item response theory : Application to psichologycal measurement. Homewood, IL : Dow Jones-Irwin. Hambleton, R.K., Swaminathan, H & Rogers, H.J. (1991). Fundamental of item response theory. Newbury Park, CA : Sage Publication Inc Guilford, JP (1936). Psychometric methods. New York: Mc Graw Hill. Mehrens, W.A. & Lehmann, I.J. (1973). Measurement and evaluation in education and psychology. New York : Hold, Rinehart and Wiston,Inc. Nitko, A. J., & Brookhart, S. M. (2007). Educational assessment of students, 5th Edition. Upper Saddle River, NJ: Pearson Education, Inc. Thorndike, R. M., & Thorndike, C. T. (2010). Measurement and evaluation in psychology and education (8th ed.). Pearson: Upper Saddle River, NJ.
Jurnal Pedagogika dan Dinamika Pendidikan. Vol 8, No. 3, Desember 2017, (01-22) 18 Mislevy, R.J., & Bock, R. D. (1990). BILOG-3 (3 nd ed.): Item analysis and test scoring with binary logistic models. Mooresville, IN: Scientific Software,Inc. Putri, R. I, Dkk. (2015). Keefektifan Strategi React Ditinjau Dari Prestasi Belajar, Kemampuan Penyelesaian Masalah, Koneksi Matematis, Self Efficacy, Jurnal Riset Pendidikan Matematika, Vol 2, No 2, 262-272 Kubiszyn, T., & Borich, G. (2010). Educational testing & measurement: clashroom application and practice (9th ed.). New York: Jhon Wiley and Sons.