Sabtu, 18 Mei 2013

DDPEP update tingkat kesukaran soal, daya beda soal, omit, and distraktor



II. PEMBAHASAN



1.    Tingkat Kesukaran (TK) Soal

     Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.
     Dalam literatur lain disebutkan bahwa Tingkat kesukaran tes adalah pernyataan tentang seberapa mudah atau seberapa sukar sebuah butir tes itu bagi testee atau siswa terkait.
Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 - 1,00. Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu.  Rumus ini dipergunakan untuk soal obyektif. Rumusnya adalah seperti berikut ini :
      Tingkat kesukaran =
Klasifikasi tingkat kesukaran soal dapat dicontohkan seperti berikut ini.

Ø  0,00 - 0,30 soal tergolong sukar
Ø  0,31 - 0,70 soal tergolong sedang
Ø  0,71 - 1,00 soal tergolong mudah

Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu :

1.1    kegunaan bagi guru

 Kegunaannya bagi guru adalah:
(a) sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi   masukan kepada siswa tentang hasil belajar mereka
(b) memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang bias

1.2    kegunaan bagi pengujian dan pengajaran

 Adapun kegunaannya bagi pengujian dan pengajaran adalah:

(a) pengenalan konsep yang diperlukan untuk diajarkan ulang,
(b) tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah,
(c) memberi masukan kepada siswa,
(d) tanda-tanda kemungkinan adanya butir soal yang bias,
(e) merakit tes yang memiliki ketepatan data soal.

Di samping kedua kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir dapat: (1) mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antarsoal), (2) berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi antar soal, semakin tinggi reliabilitas..

Tingkat kesukaran butir soal juga dapat digunakan untuk memprediksi alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi yang diajarkan guru. Misalnya satu butir soal termasuk kategori mudah, maka prediksi terhadap informasi ini adalah seperti berikut :
1)    Pengecoh butir soal itu tidak berfungsi.
2)    Sebagian besar siswa menjawab benar butir soal itu; artinya bahwa sebagian besar siswa telah memahami materi yang ditanyakan.

Bila suatu butir soal termasuk kategori sukar, maka prediksi terhadap informasi ini adalah seperti berikut.
1)    Butir soal itu "mungkin" salah kunci jawaban.
2)    Butir soal itu mempunyai 2 atau lebih jawaban yang benar.
3)    Materi yang ditanyakan belum diajarkan atau belum tuntas pembelajarannya, sehingga kompetensi minimum yang harus dikuasai siswa belum tercapai.
4)    Materi yang diukur tidak cocok ditanyakan dengan menggunakan bentuk soal yang diberikan (misalnya meringkas cerita atau mengarang ditanyakan dalam bentuk pilihan ganda).
5)    Pernyataan atau kalimat soal terlalu kompleks dan panjang.

Dalam kaitannya dengan hasil analisis item dari segi derajat kesukarannya seperti yang telah dikemukakan di atas, maka tindak lanjut yang perlu dilakukan oleh tester adalah sebagai berikut :
Pertama, untuk butir-butir item yang berdasarkan hasil analisis termasuk dalam kategori baik(dalam arti derajat kesukaran itemnya cukup atau sedang), seyogyanya butir item tersebut segera di catat dalam buku bank soal.  Selanjutnya butir-butir soal tersebut dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan datang.
Kedua, untuk butir-butir item yang termasuk dalam kategori terlalu sukar, ada tiga kemungkinan tindak lanjut, yaitu :

Ø  Butir item tersebut di buang atau  di drop dan tidak akan dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang
Ø  Diteliti ulang, di lacak dan ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang bersangkutan sulit di jawab oleh testee. Setelah dilakukan perbaikan, butir-butir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang
Ø  Haruslah dipahami bahwa tidak setiap butir item yang termasuk dalam kategori  terlalu sukar itu sama sekali  tidak memiiliki kegunaan.

Ketiga,untuk butir-butir item  yang termasuk dalam kategori terlalu mudah, juga ada tiga kemungkinan tindak lanjut, sama halnya pada butir-butir item yang termasuk dalam kategori terlalu sukar yang telah dibahas sebelumnya.

Contoh penerapannya :
“Ada 10 orang dengan nama kode A sampai dengan J yang mengajarkan tes yang terdiri dari 10 soal. Jawaban tes nya di analisis dan jawaban tertera seperti berikut ini :
(1= jawaban benar ; 0= jawaban salah)

Siswa
Nomor soal
Skor siswa
1
2
3
4
5
6
7
8
9
10

A
1
1
1
0
1
1
0
1
0
0
6
B
0
1
1
0
0
0
0
1
1
1
5
C
1
0
0
1
0
1
0
0
0
1
4
D
1
0
0
1
0
1
0
0
1
0
4
E
1
0
1
1
1
0
1
1
0
1
7
F
1
1
0
1
1
1
0
1
1
1
8
G
1
0
0
1
0
0
1
0
0
0
3
H
0
1
0
1
0
0
1
1
0
1
5
I
1
0
1
0
1
1
1
1
0
0
6
J
1
1
0
1
1
1
0
1
0
1
7
Jumlah
8
5
4
7
5
6
4
7
3
6


Dari 10 orang siswa yang mengikuti tes, ada 8 orang siswa yang menjawab soal nomor 1 dengan benar. Maka tingkat  kesukarannya (P) adalah :

      P =
         =

         = 0,8

Dari tabel di atas dapat diketahui bahwa soal nomor 9 adalah soal tersukar, karena hanya dapat di jawab benar oleh 3 orang siswa dengan tingkat kesukaran :



      P =
         =
       = 0,3
     


2.    Daya Pembeda (DP)
Daya pembeda soal adalah kemampuan suatu butir soal dapat membedakan antara siswa yang telah menguasai materi yang ditanyakan dan siswa yang tidak/kurang/belum menguasai materi yang ditanyakan. Manfaat daya pembeda butir soal adalah seperti berikut ini.
Ø  Untuk meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi, atau ditolak.
Ø  Untuk mengetahui seberapa jauh setiap butir soal dapat mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memahami atau belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat dicurigai "kemungkinannya" seperti berikut ini.
•    Kunci jawaban butir soal itu tidak tepat.
•    Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar
•    Kompetensi yang diukur tidak jelas
•    Pengecoh tidak berfungsi
•    Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang menebak
•    Sebagian besar siswa yang memahami materi yang ditanyakan berpikir ada yang salah informasi dalam butir soalnya

Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin mampu soal yang bersangkutan membedakan siswa yang telah memahami materi dengan siswa yang belum memahami materi. Indeks daya pembeda berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu soal, maka semakin kuat/baik soal itu. Jika daya pembeda negatif (<0) berarti lebih banyak kelompok bawah (siswa yang tidak memahami materi) menjawab benar soal dibanding dengan kelompok atas (siswa yang memahami materi yang diajarkan guru).

Untuk mengetahui daya pembeda soal bentuk pilihan ganda adalah dengan menggunakan rumus berikut ini :

DP =       atau     DP =

DP = daya pembeda soal,
BA = jumlah jawaban benar pada kelompok atas,
BB = jumlah jawaban benar pada kelompok bawah,
N  =jumlah siswa yang mengerjakan tes.

Hasil perhitungan dengan menggunakan rumus di atas dapat menggambarkan tingkat kemampuan soal dalam membedakan antar peserta didik yang sudah memahami materi yang diujikan dengan peserta didik yang belum/tidak memahami materi yang diujikan. Adapun klasifikasinya adalah seperti berikut :  

0,40 - 1,00    soal diterima baik
0,30 - 0,39    soal diterima tetapi perlu diperbaiki
0,20 - 0,29    soal diperbaiki
0,19 - 0,00     soal tidak dipakai/dibuang

Langkah-langkah yang dilakukan untuk menganalisis daya pembeda butir tes adalah sebagai berikut :
1.   Mengurutkan jawaban siswa mulai dari yang tertinggi sampai dengan yang terendah.
2.  Membagi kelompok Atas dan kelompok Bawah masing-masing 25 % atau 30 % atau 40 %.
3.   Memberi skor 1 untuk setiap jawaban yang benar dan 0 untuk jawaban yang salah pada tes pilihan ganda. Sedangkan pada tes essay diberikan skor sesuai pada rentangan yang ditentukan.
4.   Menghitung daya beda dengan rumus yang telah ditentukan.

Contoh :
Tes pilihan ganda dengan options 4 diberikan kepada 30 siswa. Jumlah soal 15. setelah diperiksa, datanya adalah sebagai berikut :













No
soal
Jumlah  siswa yang menjawab salah kelompok rendah (SR)
Jumlah  siswa yang menjawab salah kelompok tinggi (ST)


SR - ST


Keterangan
1.
6
1
5
2.
6
1
5
3.
5
2
3
4.
6
1
5
5.
2
1
1
6.
5
1
4
7.
2
1
1
8.
7
1
6
9.
7
1
6
10.
4
2
2
11.
3
1
2
12.
6
1
5
13.
2
1
1
14.
6
1
5
15.
5
2
3

N = 30 orang                           N = 27 % dari 30 = 8
Kriteria yang digunakan dari tabel Ross dan Stanley adalah sebagai berikut :

Jumlah Testee (N)
n
(27 % N)
Option
2
3
4
5
28 – 31
32 – 35
36 – 38
dst. Lihat tabel pada lampiran
8
9
10
4
5
5
5
5
5
5
5
5
5
5
5





Kriteria pengujian daya penbeda adalah sebagai berikut :
Bila SR –ST sama atau lebih besar dari nilai tabel, artinya butir soal itu mempunyai daya pembeda.
Dari  data di atas, batas pengujian adalah 5, yakni yang pertama dalam tabel di atas dengan jumlah N (28 - 31), n = 8 pada option 4. Dengan demikian dapat disimpulkan sebagai berikut :
No.item
SR –ST
Batas nilai tabel
Keterangan
1.
5
5
Diterima
2.
5
5
Diterima
3.
3
5
Ditolak
4.
5
5
Diterima
5.
1
5
Ditolak
6.
4
5
Ditolak
7.
1
5
Ditolak
8.
6
5
Diterima
9.
6
5
Diterima
10.
2
5
Ditolak
11.
2
5
Ditolak
12.
5
5
Diterima
13.
1
5
Ditolak
14.
5
5
Diterima
15.
3
5
Ditolak

Dari kesimpulan di atas hanya soal nomor 1, 2, 4, 8, 9, 12, dan 14 yang memenuhi daya pembeda, sedangkan soal nomor lainnya tidak memiliki daya pembeda.

3.      Omit
Suatu kemungkinan dapat terjadi pada soal jenis pilihan jamak, dimana keseluruhan alternatif yang di pasang pada butir soal tersebut sama sekali tidak di pilih oleh testee. Dengan kata lain, testee menyatakan “blangko”. Pernyataan blangko ini sering di kenal dengan istilah omit dan biasa di beri lambang dengan huruf O.
Omit adalah testee tidak memilih pilihan manapun ( Blangko ), baik pilihan A, B, C, D atau E.  Omit yang baik tidak lebih dari 10% dari peserta tes.

4.      Distraktor

Untuk setiap soal pada jenis soal pilihan jamak, diamana pilihan jawabannya ada empat sampai dengan lima pilihan. Dan dari kemungkinan jawaban-jawaban yang terpasang pada soal tersebut salah satunya merupakan jawaban benar, sedangkan sisanya merupakan jawaban salah. Jawaban-jawaban salah itulah yang biasa di kenal dengan istilah distraktor ( distraktor = pengecoh ).

Tujuan utama dari pemasangan distraktor pada setiap butir soal adalah agar dari sekian banyak testee yang mengikuti tes hasil belajar ada yang tertarik atau terangsang untuk memilihnya, sebab mereka menyangka bahwa  distraktor yang mereka pilih itu merupakan jawaban benar. Makin banyak testee yang terkecoh, berarti semakin baik distraktor tersebut berfungsi. Begitupula sebaliknya, jika tidak ada testee yang memilih distraktor tersebut sebagai jawaban, berarti distraktor tersebut tidak menjalankan fungsinya dengan baik.
  
Cara menganalisis fungsi distraktor dapat dilakukan dengan menganalisis pola penyebaran jawaban butir. Pola penyebaran jawaban sebagaimana dikatakan sudijono (2005: 411) adalah suatu pola yang dapat menggambarkan bagaimana peserta tes dapat menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban yang telah dipasangkan pada setiap butir.
Menurut Depdikbud (1993: 27) sebuah distraktor dapat dikatakan berfungsi dengan baik jika dipilih oleh paling sedikit 5% untuk 4 pilihan jawaban dan 3% untuk 5 pilihan jawaban. Sedangkan menurut Fernandes (1984: 29) distraktor dikatakan baik jika dipilih oleh minimal 2% dari seluruh peserta. Distraktor yang tidak memenuhi kriteria tersebut sebaiknya diganti dengan distraktor lain yang mungkin lebih menarik minat peserta tes untuk memilihnya.
Berikut ini contoh bagaimana cara menganalisis fungsi distraktor. Misalnya tes hasil belajar bidang studi pendidikan moral pancasila diikuti oleh 50 orang siswa madrasah tsanawiyah. Bentuk soalnya adalah multiple choice item dengan item sebanyak 40 butir, dimana setiap butir item dilengkapi dengan 5 alternatif, yaitu A, B, C, D dan E. Dari 40 butir item tersebut, khusus untuk butir item nomor 1, 2 dan 3 diperoleh pola penyebaran jawaban item sebagai berikut :   
Nomor  Butir item
Alternatif ( Options )

Keterangan
A
B
C
D
E
1
4
6
5
(30)
5

( ) : Kunci jawaban
2
1
(44)
2
1
2
3
1
1
(10)
1
37

Dengan pola penyebaran jawaban item sebagaimana tergambar pada tabel analisis di atas, maka dengan mudah dapat kita ketahui berapa persen teste yang telah “terkecoh ” untuk memilih distraktor yang dipasangkan pada item 1, 2 dan 3. Sebagai contohnya untuk item  nomor 1 adalah sebagai berikut :


Untuk item nomor 1 :
Kunci jawaban adalah D, sedangkan pengecoh atau distraktornya adalah A, B, C dan E.
v  Pengecoh A di pilih oleh 4 orang siswa, berarti  x 100 % = 8 %. Jadi, pengecoh A sudah dapat menjalankan fungsinua dengan baik. Sebab, angka persentasenya sudah melebihi 5 %.
v  Dengan perhitungan yang sama, persentase pengecoh B diperoleh sebesar 12 %, pengecoh C 10 %, dan pengecoh E sebesar 10 %. Jadi, keempat pengecoh yang dipasangkan pada item nomor 1 sudah dapat menjalankan fungsinya dengan baik sebagai distraktor.

Untuk item 2 dan 3 dapat pula dilakukan analisis fungsi distraktor dengan cara yang sama seperti halnya item nomor 1. 

Reactions:

0 comments:

Poskan Komentar