PENDIDIKAN JASMANI DAN OLAHRAGA: STATISTIKA PENJAS: Validasi Instrumen Tes

Menurut Olson dalam Sundayana (2013:2) "Statistika adalah ilmu untuk menjawab pertanyaan berdasarkan data empiris". Statistika penjas sama halnya dengan statistika pendidikan pada umumnya. Statistika Penjas merupakan metode untuk menjawab pertanyaan dengan mengumpulkan data-data empiris dalam bidang ilmu pendidikan jasmani dan olahraga. Tahapan-tahapan statistika penjas yaitu: mendesain, merencanakan, mengobservasi, mencatat, menganalisis, merangkum, menarik kesimpulan, melaporkan dan menyajikan hasil.

Dalam statistika penjas dikenal juga statistika infrensial yang merupakan inti dari statistika itu sendiri. dalam analisis data, statistika infrensial terbagi atas dua, yaitu: statistika parametrik statistika non parametrik. Statistika parametrik cirinya adalah datanya harus berdistribusi normal, penarikan sampel dengan cara acak (random) dan datanya interval atau rasio. Sedangkan, Statistika nonparametrik cirinya adalah datanya tidak harus berdistribusi normal, penarikan sampel tidak harus random.

JENIS, TUJUAN, MANFAAT, FUNGSI VALIDASI INSTRUMEN TES

Jenis Validasi Instrumen Tes

Terdapat tiga karakteristik utama dari sebuah instrumen atau tes, yakni validitas, reliabilitas dan objektivitas. Ketiga kriteria ini sering disebut sebagai prasyarat bagi setiap tes yang akan dipilih atau yang akan disusun.

1. Validasi

Validitas atau kesahihan alat ukur berhubungan dengan ketepatan mengukur sesuatu yang seharusnya diukur. Selain itu, validitas menunjukkan tingkat kevalidan atau kesahihan suatu alat ukur atau instrumen. Suatu alat ukur yang valid atau sahih berarti alat ukur tersebut tepat untuk mengukur sesuatu yang seharusnya diukur. (Kirkendal, Gruber dan Johnson: 1980).

Suatu instrumen pengumpul data yang valid berarti instrumen tersebut dapat mengungkap informasi suatu variabel yang sedang dikumpulkan. Tujuan penggunaan suatu alat ukur merupakan faktor yang menentukan validitas alat ukur. Tes yang sudah baku (terstandar) digunakan untuk mengukur hasil belajar keterampilan olahraga peserta didik di sekolah mungkin tidak valid untuk mengukur keterampilan atlit yang akan mengikuti kejuaraan atau perlombaan. Perbedaan tujuan penggunaan tes tentu memerlukan validitas yang berbeda pula.

a). Validitas Isi

Penggunaan tes atau alat ukur dalam proses belajar mengajar biasanya untuk menaksir pencapaian hasil belajar peserta didik tentang kemampuan pengetahuan atau keterampilan peserta didik. Yang paling baik, keseluruhan isi topik atau materi bahasan dituangkan ke dalam tes tersebut. Tetapi hal tersebut mungkin akan sulit dilakukan.

Pada umumnya cara menaksir pencapaian hasil belajar peserta didik adalah mengambil sampel dari keseluruhan isi topik atau materi bahasan. Oleh karena itu sampel tersebut harus mewakili keseluruhan isi. Dengan kata lain, hasil yang diperoleh berdasarkan sampel tersebut harus mencerminkan keseluruhan isi yang dikehendaki, sehingga sampel harus valid. Hal ini merupakan masalah validitas isi.

Prosedur tersebut diawali dengan menyusun suatu kerangka atau kisi-kisi topik atau materi bahasan. Dalam kisi-kisi mencakup keseluruhan isi bidang studi dan aspek-aspek yang akan diukur dilengkapi dengan katagori pentingnya setiap topik. Berdasarkan kisi-kisi tersebut dikembangkan butir-butir materi tes. Selanjutnya secara acak diambil sampel butir-butir tes dalam jumlah yang sesuai dengan bobot katagori setiap topik dari keseluruhan isi (Kirkendal, Gruber dan Johnson: 1980).

Pada dasarnya validitas isi diperoleh berdasarkan pertimbangan subyektif, secara teliti dan kritis terhadap butir-butir tes yang secara logis dapat mewakili keseluruhan isi tes yang dikehendaki dan diperkirakan sesuai dengan tujuan pengukuran. Maka suatu alat ukur atau tes harus memiliki validitas logis. Selain itu, pertimbangan isi dan tujuan yang akan diukur, suatu tes harus mencerminkan dan sesuai dengan materi pengajaran dan tujuan pengajaran yang dinyatakan dalam pedoman kurikulum atau silabus. Dengan demikian suatu alat ukur atau tes harus memenuhi validitas kurikulum.

Dalam menyusun tes keterampilan olahraga dalam pendidikan jasmani, validitas isi diperoleh melalui analisis keterampilan - keterampilan yang akan di ukur dan di jadikan butir tes. Butir tes tunggal atau tes berangkai keterampilan olahraga dalam pendidikan jasmani biasanya digunakan untuk menentukan keterampilan umum dalam suatu cabang olahraga. Untuk menentukan butir-butir tes keterampilan olahraga yang akan diukur harus dilakukan secara cermat, teliti, dan kritis dengan berdasar pada pertimbangan - pertimbangan yang logis. Selain itu, tes keterampilan olahraga tersebut harus sesuai dengan materi dan tujuan pendidikan yang dinyatakan dalam pedoman kurikulum pendidikan jasmani.

b). Validitas Konstruk

Konstruk adalah kerangka dari suatu konsep. Untuk mengukur suatu konsep, maka harus dilakukan identifikasi lebih dahulu kerangka yang membentuk konsep tersebut. Dengan mengetahui kerangka tersebut maka dapat disusun suatu tolok ukur secara operasional konsep tersebut.

Thomas dan Nelson (1990) menjelaskan bahwa banyak karakter manusia yang tidak diamati secara langsung. Sebaiknya, dibentuk hipotesis yang memuat sejumlah pengertian yang berkaitan bagaimana sifat seseorang pada kelompok tingkat tinggi dibanding dengan sifat seseorang pada kelompok yang rendah. Kecemasan, intelegensi, sportmanship, kreatifitas dan sikap adalah sedikit dari hipotetik konstruk. Validitas konstruk adalah tingkatan suatu tes mengukur konstruk secara hipotetis dan biasanya ditetapkan dengan menghubungkan hasil tes dengan beberapa perilaku.

Kirkendal, Gruber dan Johnson (1980) menjelaskan bahwa secara umum ada tiga teknik yang digunakan untuk menentukan validitas konstruk, yaitu analisis faktor, regresi ganda dari tes berangkai, dan menguji perbedaan dengan kelompok lain. Untuk menentukan validitas konstruk digunakan analisis faktor, ditetapkan suatu konstruk atau struktur teoritis tentang fenomena diacu. Biasanya dengan melakukan penjabaran fenomena menjadi berbagai komponen. Beberapa butir tes disiapkan untuk masing-masing komponen dan dilakukan tes terhadap kelompok subyek. Suatu waktu butir-butir tes berangkai diarahkan untuk mengukur kemampuan yang rumit. Berikutnya ditetapkan kriterion yang sesuai, kemudian teknik regresi ganda digunakan untuk menentukan rangkaian konstruk yang cocok untuk mengukur fenomena. Cara berikutnya untuk menentukan validitas konstruk yang juga mengacu pada concurrent validity. Diberikan dua tes yang berbeda terhadap kelompok yang berbeda. Beberapates olahraga ditentukan validitas konstruknya melalui pem-bandingan dua kelompok.

Verducci (1980) mengemukakan bahwa suatu kunstruk adalah suatu gagasan teoritis yang menerangkan dan mengatur beberapa aspek keberadaan pengetahuan. Di bidang lain, konstruk meliputi gagasan seperti inteligensi, sikap, kesiapan, dan kecemasan; dalam pendidikan jasmani istilah kesegaran jasmani diklasifikasi sebagai suatu konstruk. Validitas konstruk dapat ditentukan dengan pertimbangan secara luas berdasarkan logika dan stitistika data yang mendukung konstruk.

c). Validitas Kriteria

Validitas kriteria diperoleh dengan cara menghubungkan antara alat ukur atau tes sebagai prediktor dengan suatu kriteria luar. Perhatian yang utama untuk jenis validitas ini adalah kriterianya, bukan pada alat ukur atau tes itu sendiri. Pendekatan empiris digunakan untuk menganalisis hubungan antara alat ukur atau tes dengan kriteria. Meng-identifikasi kriteria yang akan digunakan merupakan hal yang penting. Suatu kriteria yang akan digunakan harus memenuhi syarat dan memiliki ciri-ciri yang dapat diyakini mengukur sesuatu yang seharusnya akan diukur. Ciri yang penting adalah kriteria tersebut harus mempunyai relevansi dan mencerminkan dengan tepat sesuatu yang akan diukur. Ciri kedua, suatu kriteria harus dapat diandalkan dan dapat dipercaya. Ciri yang lainnya, suatu kriteria diharapkan bebas dari bias. Skor pada suatu ukuran kriteria hendaknya tidak dipengaruhi oleh aspek-aspek selain kemampuan atau penampilan yang sesungguhnya pada kriteria tersebut (Safrit: 1981).

Dalam penyusunan suatu tes keterampilan olahraga, ada tiga cara memperoleh validitas yang dihubungkan dengan kriteria.

Cara pertama, menggunakan hasil tes standard atau tes yang sudah dibakukan sebagai kriterion. Validitas kriteria diperoleh dengan cara mengkorelasikan antara skor hasil tes menggunakan tes eksperimen (prediktor) dengan skor hasil tes menggunakan tes standard (kriterion). Jika hasil analisis diperoleh koefisien korelasi yang tinggi maka berarti ada hubungan antara tes eksperimen (prediktor) dengan tes standard. Berarti pula bahwa testi yang mempunyai skor yang baik dari hasil tes kriterion, akan diduga memperoleh skor yang baik pula pada hasil tes prediktor. Contoh: Brady Volley Test merupakan tes standar bola voli digunakan sebagai kriterion untuk memperoleh validitas kriteria suatu tes keterampilan eksperimen bola voli (Budiwanto: 2001).

Cara kedua, sebagai kriterion adalah hasil penilaian para juri (judges rating). Tiga sampai dengan lima juri melakukan pengamatan dan memberikan penilaian menggunakan skala penilaian pada waktu testi melakukan permainan. Kemudian skor hasil penilaian juri dikorelasikan dengan skor tes prediktor. Diharapkan, pemain yang baik akan mendapatkan skor yang baik dari penilaian para juri dan mendapat skor baik pula dalam tes prediktor (Kirkendal, Gruber dan Johnson: 1980).

Cara ketiga, menggunakan hasil pertandingan kompetisi sebagai kriteria. Pertandingan kompetisi dilakukan antar testi dalam kelompok sampel. Jumlah nilai menang setiap testi dari seluruh pertandingan merupakan kriterion yang dikorelasikan dengan skor tes prediktor. Testi yang banyak menang akan mendapat skor tinggi, diharapkan memperoleh skor yang tinggi pula pada tes prediktor (Kirkendal, Gruber dan Johnson: 1980).

2. Reliabilitas

Reliabilitas suatu tes menggambarkan konsistensi dari hasil pengukuran terhadap orang yang sama dengan alat ukur atau tes yang sama. Reliabilitas merupakan syarat penting bagi suatu tes, tapi tidak menjamin tercapainya validitas (Lutan dan Suherman, 2000).

Reliabilitas (keterandalan) Menggambarkan derajat keajegan, atau konsistensi hasil pengukuran. Suatu alat pengukur atau tes dikatakan reliabel jika alat pengukur itu menghasilkan suatu gambaran yang benar-benar dapat dipercaya dan dapat diandalkan untuk membuahkan hasil pengukuran yang sesungguhnya (Nurhasan, 2000).

Cara mencari koefisien reliabilitas alat ukur, dapat dilakukan dengan menggunakan beberapa cara, yang masing-masing mempunyai kekurangandan keunggulan. Berbagai pilihan tentang cara menetapkan tingkat reliabilitas alat ukur tersebut adalah:

a). Teknik Pengulangan (Test and ReTest Reliability)

Cara ini disebut sebagai teknik ulangan, karena dilakukan dengan memberikan dua kali pengukuran dengan rentang waktu tertentu dengan menggunakan alat ukur yang sama. Skor yang di peroleh pada pengukuran pertama dikorelasikan dengan skordari hasil pengukuran pada pengukuran yang kedua. Koefisien yang diperoleh dengan cara ini menunjuk pada derajat stabilitas alat ukur. Pada umumnya sumber error pada teknik pengulangan ini dapat bersumber dari berbagai faktor yang menyebabkan seseorang mempunyai skor berbeda pada saat dua kali mengerjakan tes yang sama. Sangat mungkin perubahan skor yang terjadi bukan karena perubahan hal yang diukur, tetapi karena situasi yang berbeda atau pengalaman dari responden pada saat mengerjakan soal yang pertama, sehingga dalam pengerjaan tes kedua lebih hati-hati dan lebih baik hasilnya.

b). Teknik Bentuk Paralel ( Alternate Form Reliability)

Mencari reliabilitas dengan teknik bentuk parallel dilakukandengan cara pengukuran pada subyek yang sama tetapi menggunakan alat ukur berbeda yang mempunyai tingkat kesamaan. Dengan cara ini peneliti perlu mempersiapkan dua set alat ukur yang berbeda dengan mempertimbangkan keseimbangan diantara kedua alat ukur tersebut. Keseimbangan diperlukan karena alat ukur ini ditujukan untuk mengukur gejala yang sama. Teknik ini sering juga disebut sebagai Parallel Test Reliability. Penggunaan dua set alat ukur dimaksudkan untuk mengurangi kemungkinan terjadinya pengaruh ingatan terhadap pengukuran yang pertama. Teknik ini dapat dilakukan dengan mengadakan pengukuran dengan alat ukur yang pertama berturutan waktunya dengan pengukuran dengan menggunakan alat ukur yang kedua pada subyek yang sama. Kemudian skor dari pengukuran alat ukur yang pertama dikorelasikan dengan skor hasil pengukuran yang kedua. Koefisien korelasi yang diperoleh akan mengungkap derajad ekuivalensi dan indeks stabilitas.

c). Teknik belah dua (Split Half reliability)

Teknik belah dua ini dikembangkan dengan menggunakan satu jenis alat ukur, dan hanya diberikan satu kali pada subyek, kemudian hasilnya diolah sedemikian rupa. Yaitu dengan cara mengelompokkan butir-butir itemnya menjadi dua bagian sama besar (belah dua). Pembagian item menjadi dua kelompok sama besar dapat dilakukan dengan cara acak atau pengelompokan berdasar nomor ganjil-genap, dapat pula dengan cara membagi menjadi separo kelompok bagian awal dan separo bagian akhir dalam jumlah yang sama. Setelah itu skor yang berasal dari belahan yang pertama dikorelasikan dengan skor pada belahan yang kedua. Koefisien korelasi yang diperoleh mencerminkan derajad ekuivalensinnya antara dua belahan tersebut. Teknik ini baru mencerminkan koefisien reliabilitas dari masing-masing belahan tersebut. Oleh karenanya untuk mendapatkan gambaran koefisien secara keseluruhan, koefisien antar belahan tersebut masih perlu dikoreksi dengan rumus sebagai berikut:

N r x1 x2

Reliability = ------------

1 + r x1 x2

Dimana x1 adalah skor dari belahan satu, x2 adalah skor dari belahan kedua, dan n adalah banyaknya subyek pada setiap bagian (belahan). Rumus tersebut didasarkan pada asumsi bahwa kedua belahan mengukur hal yang sama, yang memiliki varian yang sama.

d). Kuder Richardson Reliability

Cara ini diberlakukan bila instrumen digunakan untuk mengukur satu gejala psikologis atau perilaku yang sama, artinya alat ukur tersebut dapat dikatakan reliabel bilater bukti ada konsistensi jawaban antar item yang satu dengan item yang lain. Sehingga apabila sifat dan tingkatan homogenitas antar item tidak terpenuhi, artinya alat tersebut dianggap mengukur lebih dari satu variabel. Bila dalam kenyataan dalam satu instrumen terdapat lebih dari satu skala pengukuran atau mengukur lebih dari satu variabel, dan setiap variabel memiliki beberapa dimensi, maka pengecekan reliabilitas dilakukan terhadap masing-masing skala pengukuran. Model Kuder Richardson Reliability ini menghasilkan koefisien konsistensi internal yang menunjuk pada derajad konsistensi antara item yang satu dengan item yang lain. Sehingga lebih cocok untuk alat ukur yang menggunakan item dua pilihan dengan salah satu jawaban benar.

e). Cronbach Alpha Reliability

Cara ini juga dikembangkan untuk menguji r konsistensi internal dari suatu alat ukur, perbedaan pokok dengan model Kuder Richardson adalah bahwa teknik ini tidak hanya untuk instrumen dengan dua pilihan tetapi tidak terikat pada dua pilihan saja, sehingga penerapannya lebih luas. Misalnya untuk menguji reliabilitas skala pengukuran sikap dengan 3, 5 atau 7 pilihan.

3. Objektivitas

Objektivitas suatu tes didefinisikan sebagai derajat kesepakatan diantara beberapa orang pengetes. Suatu tes dikatakan objektif, manakala terdapat kesaman skor yang diberikan oleh beberapa penilai (Lutan dan Suherman, 2000). Istilah lain dari objektivitas ialah reliabilitas penilai,yakni konsistensi skor yang diberikan oleh beberpa penilai terhadap suatu performa.

Tujuan, Manfaat, dan Fungsi Validasi Instrumen

Tujuan di adakannya validasi instrumen penilaian adalah untuk menjamin mutu instrumen yang akan digunakan untuk menilai hasil belajar peserta didik.

Manfaat validasi instrumen adalah agar hasil penilaian yang diperoleh dari peserta didik menggambarkan kompetensi peserta didik yang sesungguhnya, tidak bias karena instrumen yang digunakan kurang baik.

Fungsi validasi instrumen penilaian adalah agar akuntabilitas instrumen terjaga sehingga hasil belajar peserta didik dapat dipertanggungjawabkan baik kepada pemerintah. Sekolah, orangtua peserta didik, maupun masyarakat.

Cara Memvalidasi Instrumen

Di atas telah dijelaskan pengertian dan jenis validitas dan reliabilitas instrumen. Secara ringkas cara memvalidasi dan mengestimasi reliabilitas instrumen dapat dilihat pada instrumen berikut.

Tabel di atas menunjukkan bahwa untuk mengestimasi validitas dan reliabilitas instrumen di perlukan kerja yang sangat hati-hati,harus diupayakan agar proses dan estimasi ini dilaksanakan dengan sebaik-baiknya. Jadi dalam kegiatan ini, yang harus dilakukan dalam penyusunan instrumen hanya menulis butir-butir instrumen dan menelaah butir. Setelah butir ditulis lalu ditelaah (diusahakan telaah dilakukan oleh orang lain atau bukan penulis butir).

Hal-hal yang harus diperhatikan adalah: (1) butir instrumen harus sesuai indikator, (2) butir ditulis secara singkat dan jelas, (3) pilihan jawaban yang berbentuk angka atau waktu, sebaiknya diurutkan, (4) dalam satu komponen, setiap butir diberi skor sama (skor sama tidak berarti pilihan jawabannya sama), dan (5) butir ditulis dengan menggunakan bahasa baku. Selain itu, untuk menarik responden agar mau merespon dengan baik maka instrumen sebaiknya : (1) dikemas dalam bentuk yang menarik, misal dalam bentuk buku yang agak kecil, (2) diusahakan jumlah butir untuk setiap jenis responden tidak terlalu banyak (maksimum 40 butir), dan (3) diusahakan butir pertanyaan dan jawaban pada halaman yang sama.

Cara lain yang bisa digunakan dalam memvalidasi alat instrumen tes dalam pendidikan jasmani olahraga dan kesehatan adalah dengan melakukan kalibrasi terhadap peralatan atau instrumen tes yang akan digunakan. Kalibrasi adalah suatu tindakan untuk membandingkan antara nilai yang ditunjukkan oleh suatu alat / instrumen dengan nilai yang telah diketahui dari standarnya atau kalibrator. Kalibrator merupakan alat standard yang mempunyai akurasi yang lebih tinggi dibanding instrument yang dikalibrasi.

Sumber:

Arikunto,S.2002. Dasar-dasar Evaluasi Pendidikan. Bumi Aksara. Jakarta

Balitbang Depdiknas. (2006). Panduan Penilaian Berbasis Kelas. Jakarta: Depdiknas.

Brookhart Susan M, Nitko J. Anthony. 2007. Educational Assesment of Student. Fifth edition. Meril Prentice Hall. New Jersey

Johson David, W & Johson, Roger T. (2002). Meaningful Assessment

Ally & Dacon A Pearson Education Company. Arlington Street Boston.

Silverius, S. (2001). Evaluasi Hasil Belajar dan Umpan Balik. Gramedia Widya Sarana. Jakarta.

Sudiyono, A. (1996). Pengantar Evaluasi Pendidikan .PT Raja Grafindo Persada. Jakarta.

Sundayana, Rostina. (2013). Statistika Penelitian Pendidikan. STKIP Garut Press: Garut

PENDIDIKAN JASMANI DAN OLAHRAGA

Monday, 3 October 2016

STATISTIKA PENJAS: Validasi Instrumen Tes

No comments:

Post a Comment