Menurut Stufflebeam (1971), penilaian adalah proses mengenalpasti, memperoleh dan menyediakan maklumat berguna bagi keputusan mempertimbangkan pilihan-pilihan yang ada pada kita. Penilaian menentukan jurang perbezaan antara “apa yang dihasilkan” dengan “apa yang dihasratkan” dari sesuatu program pendidikan. Secara ringkas, penilaian merupakan satu proses sistematik untuk menentukan sejauh mana objektif pengajaran dan pembelajaran di dalam kelas dicapai.
Sebagaimana yang kita ketahui, ujian atau peperiksaan adalah satu aspek penting dalam sistem pendidikan kita. Berbagai bentuk ujian bertulis boleh diadakan oleh guru dari semasa ke semasa, seperti ujian betul/salah, mengisi tempat kosong, mamadankan, ujian beraneka pilihan dan juga bentuk esei.
Bagi melakukan penilaian, ujian yang berkesan dan bermutu perlu dibina dan dilaksanakan. Ini bermaksud, ujian tersebut dibina dengan mematuhi prinsip-prinsip pembinaan ujian iaitu kesahan, kebolehpercayaan, keobjektifan, kebolehtadbiran dan kebolehtafsiran. kami telah memilih prinsip kesahan dan kebolehpercayaan sebagai pertimbangan untuk membina Ujian Pertengahan Tahun Bahasa Melayu (Kefahaman) bagi tahun 5. Kedua-dua prinsip ini dijadikan sebagai panduan dan dipatuhi semaksima mungkin semasa membina set ujian ini.
1) Kesahan
Kesahan sesuatu ujian merujuk kepada sejauh mana ujian berkenaan dapat mengumpul maklumat berkaitan bidang yang ditetapkan. Dengan perkataan lain, sesuatu ujian itu dikatakan sah, sekiranya ujian berkenaan boleh mengukur sesuatu yang sebenarnya hendak diukur atau sepatutnya diukur.
Menurut Youngman & Eggleston (1982) serta Sax & Newton (1997) kesahan bermaksud kebolehan ujian mengukur apa yang sepatutnya diukur. Kesahan merujuk kepada kesesuaian dan kekuatan interpretasi markah ujian dan lain-lain keputusan penilaian dengan merujuk kepada kegunaan tertentu alat ukur tersebut. Menurut Fraenkel & Wallen (1996) kesahan boleh dibuktikan melalui beberapa kaedah seperti kesahan isi (content validity), kesahan telahan (predictive validity), kesahan serentak (concurrent validity) dan kesahan gagasan (construct validity).
Kesahannya bergantung kepada beberapa jenis kesahan:
a) Kesahan isi (content validity)
Ini ialah kesahan yang terpenting bagi seseorang guru yang hendak menyediakan ujian. Isi ujian ditentukan dengan menilai apakah tujuan ujian itu diadakan, kandungan sukatan pelajaran, penekanan yang diberi kepada tajuk-tajuk dalam sukatan pelajaran serta peringkat atau kategori objektif pelajaran bagi tiap-tiap tajuk. Bagi sebarang ujian bertulis maka sangat penting bagi guru supaya sentiasa menyedari tujuan utama ujian itu. Kemudian guru hendaklah memilih atau menyediakan item ujian-ujian yang sesuai. Jenis-jenis item pula bergantung kepada jenis pencapaian murid-murid, aras kesukaran, dan peringkat objektif pelajaran yang hendak diuji.
Sepanjang proses menyediakan JSU dan membina soalan berdasarkan JSU yang telah disediakan, kami amat mementingkan aspek kesahan isi ini. Kami sedaya upaya menyediakan satu set soalan Bahasa Melayu Tahun 5 yang mengandungi 30 item soalan objektif yang meliputi semua tajuk dalam sukatan pelajaran Tahun 5. Sebelum membina item bagi soalan objektif ini, kami dikehendaki membina Jadual Spesifikasi Ujian (JSU). Kami telah memilih tiga bidang untuk diuji iaitu tatabahasa, membaca dan memahami serta peribahasa. Secara umumnya, dengan pemilihan ketiga-tiga bidang ini, kami telah merangkumkan semua kandungan pelajaran Bahasa Melayu Tahun 5 dalam pembinaan ujian. Hal ini penting dalam menjamin kesahan ujian yang dibina kerana item objektif ini digunakan untuk peperiksaan akhir tahun. Oleh itu, seharusnya murid Tahun 5 telah mempelajari kesemua topik dalam Bahasa Melayu Tahun 5.
Jika dilihat dari aspek aras soalan yang dipilih, kami lebih banyak membina soalan aras kefahaman berbanding aras-aras yang lain. Hal ini menggambarkan bahawa aktiviti serta pengajaran yang dilaksanakan di dalam kelas banyak menekankan aras kefahaman. Oleh yang demikian, terdapat 13 soalan kefahaman yang diuji dalam set soalan ini. Keadaan ini tidak bermakna kami tidak menguji aras-aras yang lain. Kami membina 4 soalan aras pengetahuan, 5 soalan aras aplikasi, 6 soalan aras analisis dan 2 soalan aras penilaian.
Akan tetapi, kami menyedari bahawa pengalaman kami yang amat terhad dalam proses membina soalan mengehadkan kemampuan kami menyediakan set soalan objektif yang benar-benar berkualiti.
b) Kesahan telahan/ ramalan
Kesahan ramalan adalah berkait rapat dengan ujian meramal kebolehan atau kelayakan seseorang calon untuk menjalankan sesuatu tugas pada masa depan. Contohnya guru biasa mengadakan peperiksaan percubaan di peringkat sekolah sebelum murid-murid mengambil peperiksaan PMR, SPM, atau sebagainya. Berdasarkan pencapaian murid-murid ini maka kita dapat meramal kejayaan murid-murid dalam peperiksaan sebenar tersebut.
Dari aspek ini, kami tidak dapat mengukur tahap kesahan telahan/ramalan set soalan objektif yang kami sediakan. Kesahan ramalan ini dapat diukur apabila murid telah selesai menjawab soalan yang kami sediakan ini, kemudian, kami akan membina satu lagi set soalan objektif 30 soalan berdasarkan aras dan isi pelajaran yang sama. Dengan demikian, kami dapat membuat ramalan markah yang bakal diperoleh murid berdasarkan set soalan yang kami sediakan ini. Seharusnya, markah murid tidak akan jauh berbeza antara kedua-kedua set soalan.
Akan tetapi, sepanjang proses membina soalan, kami sentiasa merujuk kepada pensyarah dan bahan-bahan rujukan tambahan bagi memastikan set soalan yang kami bina benar-benar menguji tajuk yang terdapat dalam sukatan pelajaran Bahasa Melayu.
c) Kesahan Semasa/Serentak
Kesahan semasa penting bagi guru merujuk pencapaian seseorang dalam sesuatu ujian itu selaras dengan pencapaian kemudian dalam suatu ujian yang serupanya. Sekiranya ujian kedua yang sama taraf dengan ujian yang pertama ditakbirkan tidak lama kemudian, pencapaian calon biasanya lebih baik daripada ujian pertama, kerana calon yang berkenaan telah memperolehi sedikit sebanyak pengalaman daripada ujian yang pertama.
d) Kesahan Gagasan
Kesahan gagasan amat penting diadakan untuk mengukur sejauh mana seseorang itu menunjukkan trait personaliti, tingkah laku, atau trait mental, seperti sifat peramah, bertanggung jawab, adil, introvert, bermotivasi, kreatif, cergas otak dan sebagainya. Semua ini merupakan idea atau gagasan psikologi perlu dianalisa untuk mengenal pasti proses-proses atau ciri-ciri yang dikaitkan dengan sesuatu trait agar item-item ujian yang khusus dan tepat dapat disediakan. Berdasarkan teori atau kajian ini, kita boleh membuat berbagai-bagai ramalan yang ada hubungannya dengan gagasan tersebut. Misalnya kita boleh menelah bahawa seseorang murid yang kreatif juga merupakan seorang yang imaginatif.
Meningkatkan Kesahan Dalam Ujian
a) Cara yang baik untuk meningkatkan dan memastikan kesahan sesuatu ujian ialah dengan menyediakan blue print, atau rancangan persediaan yang dinamakan Jadual Spesifikasi Ujian (JSU). JSU ini dapat memastikan kesahan isi ujian yang akan disediakan. Di mana dalam JSU guru hendaklah menetapkan tajuk-tajuk yang hendak diuji, peringkat objektif mengikut Taksonomi Bloom atau Taksonomi yang seumpamanya, bilangan soalan bagi tiap-tiap satu objektif dan tajuk.
Penentuan objektif pelajaran ataupun aras-aras kemahiran bergantung kepada mata pelajaran, tajuk-tajuk yang diuji serta peringkat kebolehan murid- murid yang menduduki ujian itu. Ini bermakna guru perlu meneliti dan memahami isi kandungan tiap-tiap tajuk dalam sukatan pelajaran. Seperti yang telah dinyatakan sebelum ini, kami telah membina satu JSU soalan peperiksaan mata pelajaran Bahasa Melayu Tahun 5 sebelum membina set soalan berdasarkan JSU tersebut.
b) Cara yang ideal bagi meningkatkan kesahan ialah mencari korelasi di antara ujian yang diberi sebelum calon-calon itu melalui pengalaman yang berkenaan dengan perlakuan yang di dalam konteks kriteria pada akhir pengalaman itu. Kesahan ujian itu boleh diterima jikalau didapati calon yang tinggi markah dalam ujian itu mencapai prestasi yang dikehendaki di dalam kriteria itu, dan calon yang rendah markahnya tidak menunjukkan prestasi di dalam kriteria itu.
2) Kebolehpercayaan
Salah satu daripada kriteria tersebut di atas ialah kebolehpercayaan (reliability). Menurut Mokhtar (1995), kebolehpercayaan ujian boleh disebut sebagai darjah ketekalan antara dua pengukuran terhadap sesuatu benda, sesuatu ciri, atau sifat seseorang. Persoalan asas kebolehpercayaan adalah: “Adalah penilai lain setuju dengan interpretasi tingkah laku pelajar?” Tetapi variasi yang mengganggu pula adalah: “Adakah saya menterjemah tingkah lakunya dalam keadaan yang sama jika saya melihatnya lagi?” ( Rowntree:1977 ). Aspek kebolehpercayaan bukan sahaja dibuktikan dengan pemberian skor yang sama oleh beberapa orang penilai, tetapi kita juga harus memberikan skor yang sama walaupun kita menilai pada masa yang berbeza.
Soalan yang dibina jika tidak mempunyai reliabilti atau mempunyai reliabiliti rendah tidak akan dapat menggambarkan pencapaian pelajar dan seterusnya akan menjadikan sistem penilaian yang sia-sia. Oleh itu para pendidik perlu berhati-hati dalam membina alat penilaian. Kebolehpercayaan sesuatu ujian merujuk kepada ketekalan, ketepatan dan kebolehbergantungan ujian berkenaan. Ini bermaksud sesuatu ujian yang boleh dipercayai akan menghasilkan maklumat yang tekal (merujuk kepada beberapa pentadbiran ujian yang telah dijalankan), tepat seperti yang sepatutnya serta boleh diterima pakai tanpa keraguan.
Kebiasaannya, sesuatu ukuran itu tidak lepas daripada ralat (error). Ini amat ketara dalam prestasi fizikal. Jauh lompatan seseorang misalnya, tidak sentiasa sama kerana pengaruh halaju angin kedaan fizikalnya, keadaan atau jenis kasut yang dipakai, latihan, larian atau sebagainya. Sedangkan berat seseorang pun boleh berubah dalam satu hari disebabkan oleh pakaiannya, kenyang laparnya dan lain-lain.
Kepentingan Kebolehpercayaan
Apabila kita menilai ataupun menguji murid-murid, kita akan menyoal diri kita sendiri adakah jawapan yang diberikan itu tidak berubah-ubah dan dapat mencerminkan kemahiran, kebolehan dan nilai pada murid itu. Jika benar maka ujian yang kita berikan itu bolehlah kita anggapkan sebagai stabil. Ujian yang stabil ialah ujian yang dapat memberikan markah yang sama apabila murid itu mengambil ujian itu beberapa kali di dalam satu jangka masa yang pendek. Bagi set soalan objektif Bahasa Melayu Tahun 5 yang kami sediakan ini, untuk menentukan sama ada ujian itu stabil atau tidak, kami boleh memberikan dua kali ujian kepada murid yang sama. Biarkan jarak di antara ujian pertama dengan yang kedua itu lebih kurang satu ataupun dua minggu. Jika markah bagi murid berkenaan dalam ujian pertama itu lebih kurang sama dengan markah yang diperolehi untuk ujian kedua, maka ujian itu bolehlah dianggap stabil ataupun boleh dipercayai.
Kebolehpercayaan ujian sangat penting oleh kerana kita tidak mahu markah yang diperolehi itu adalah disebabkan oleh nasib. Kita mahukan markah itu datangnya daripada kemampuan murid itu sendiri. Kebolehpercayaan adalah satu perkara yang senang dilihat di dalam ukuran seperti berat, panjang, tinggi dan lain-lain yang berbentuk maujud. Sesuatu ukuran panjang itu sudah tentu memberi bacaan yang sama jika barang yang sama diukur berulang kali. Begitu juga dengan sesuatu penimbang berat itu sudah tentu memberi bacaan yang sama apabila kita menimbang benda yang sama berulang kali. Bacaan yang berlainan akan menimbulkan syak wasangka kepada kita oleh kerana alat-alat sukatan itu tidak lagi stabil.
Bagi ujian ataupun penilaian yang kita sediakan, kebolehpercayaan adalah satu ciri yang patut kita pastikan sebagai dapat diterima. Jika tidak, penilaian yang kita lakukan itu tidak akan memberi peluang yang cukup kepada murid-murid membuktikan yang mereka mempunyai kemahiran, pengetahuan dan sikap yang dinilaikan itu. Satu peluang sahaja sudah tentu tidak mencukupi. Umpamanya kita mahu menguji sama ada murid itu dapat memahami penggunaan kata kerja, kita tidak hanya memberikan satu soalan sahaja. Kita akan mengemukakan beberapa soalan yang dapat menguji kemahiran yang sama. Jika murid itu dapat peluang menjawab sebilangan besar soalan-soalan itu, maka barulah kita berpuas hati dan menerima hasilnya sebagai mencerminkan keupayaan murid itu. Dengan kata lain, kebolehpercayaan pada ujian ini ialah untuk kita memastikan yang ujian atupun alat penilaian itu memberi peluang kepada murid mengemukakan jawapan yang mencerminkan keupayaannya dan bukanlah disebabkan oleh nasib.
Faktor-faktor Yang Mempengaruhi Kebolehpercayaan
Panjang pendek ujian itu boleh mempengaruhi keutuhan. Biasanya, semakin panjang ujian maka semakin tepat skornya kerana semakin kurang pergantungan kepada tekaan atau kebetulan. Bagi set soalan yang kami sediakan, kami menetapkan 30 soalan objektif yang perlu dijawab dalam masa 40 minit. Jangka masa yang kami tetapkan bagi menjawab set soalan ini bertepatan dengan taburan aras soalan yang kami pilih. Hampir 50% item yang kami bina terdiri daripada soalan aras kefahaman. Oleh itu, masa yang diperuntukkan sangat bersesuaian dengan soalan yang dikemukakan.
Demikian juga ujian yang bersifat objektif yang mempunyai keutuhan yang lebih tinggi kerana tidak terdedah kepada berbagai-bagai interpretasi. Ujian yang sah juga biasanya utuh, tetapi ujian yang utuh tidak semestinya sah. Skor yang konsisten tidak semestinya mengukur apa yang hendak diukur. Item-item ujian hanya merupakan sampel bagi bidang yang diuji. Variasi dalam sampel mungkin terdapat dalam dua ujian yang setara bentuknya. Hal ini merupakan satu lagi punca ralat. Dalam pada itu, kami juga memastikan bahawa jawapan yang kami sediakan bagi setiap soalan mempunyai panjang yang hampir sama. Dengan demikian, murid perlu membaca setiap jawapan yang diberi sebelum menjawab soalan. Aspek ini juga dapat menjamin kebolehpercayaan set soalan yang disediakan.
Oleh kerana guru yang membina dan mentadbir ujian kepada murid-murid, maka perhubungan guru murid yang baik biasanya akan menambah keutuhan keputusannya. Keadaan fizikal dan mental yang positif, azam dan motivasi, galakan guru, kebiasaan dengan format ujian juga akan memberi kesan yang positif terhadap kebolehpercayaan.
Perbezaan skor mungkin timbul lantaran perbezaan cara ujian itu ditadbirkan. Untuk meningkatkan kebolehpercayaan, arahan-arahan mestilah tepat dan jelas. Murid-murid haruslah diberi masa yang cukup. Mereka mestilah diawasi dengan teliti semasa ujian. Kadang-kadang kebolehpercayaan ditentukan dengan cara uji-ulang (retest). Sebarang manfaat yang didapati oleh murid-murid daripada ujian pertama akan mengurangkan kebolehpercayaan. Contohnya dalam ulang uji murid-murid mungkin lebih biasa dengan format , atau lebih faham dengan item-item ujian. Oleh itu, mereka mendapat skor yang lebih tinggi. Hal ini menunjukkan betapa perlunya penjelasan yang sempurna sebelum ujian pertama dimulakan.
Keadaan persekitaran boleh mempengaruhi murid-murid dan skor mereka. Persekitaran yang sesuai, seperti kerusi meja yang selesa, ruang dan cahaya yang cukup, ventilasi yang baik, akan menambahkan kebolehpercayaan, manakala keadaan hingar-bingar, misalnya akan menganggu konsentrasi murid-murid dan menjejaskan kebolehpercayaan ujian.
Apabila sesuatu ujian itu bersifat subjektif, biasanya markah yang diberi untuk jawapan yang sama adalah berbeza mengikut pemeriksa, walaupun skim pemarkahan ada disediakan. Malahan, penilaian seseorang pemeriksa mungkin berubah mengikut masa dan keadaan. Perkara ini tidak berlaku dalam ujian objektif, kerana semua responnya adalah tepat. Mana-mana pemeriksa akan memberi markah yang sama untuk respon yang sama. Oleh itu, keobjektifan merupakan satu syarat bagi keutuhan.
Meningkatkan Kebolehpercayaan Dalam Ujian
Lazimnya, adalah sangat sukar bagi guru untuk membentuk satu ujian yang mempunyai ciri kebolehpercayaan yang tinggi. Ini adalah kerana pencapaian murid dalam situasi yang berlainan akan dipengaruhi oleh faktor-faktor berlainan seperti bilangan soalan, emosi dan kesihatan calon, keadaan persekitaran dan cara memeriksa. Oleh itu untuk meninggikan ciri kebolehpercayaan dalam sesuatu ujian, guru harus mengurangkan segala punca perubahan faktor-faktor tersebut.
Faktor pertama ialah keadaan tempat murid-murid itu mengambil ujian. Keadaan yang tidak selesa menyebabkan murid-muird tidak dapat menjawab seperti yang selalu ditunjukkan. Jika bilik itu bising dan panas umpamanya, murid tidak akan dapat menjawab soalan dengan sebaik-sebaiknya. Jika murid itu tidak sihat ketika mengambil ujian, maka jawapannya juga tidak sebaik yang dapat ditunjukkannya semasa dia di dalam keadaan sihat. Oleh itu, guru haruslah memastikan yang keadaan tempat murid itu semasa mengambil ujian adalah baik.
Faktor kedua ialah kejelasan yang terdapat pada arahan dan item-item ujian itu. Arahan dan item-item yang kurang jelas boleh menimbulkan interpretasi yang berlainan dariapada murid-murid. Oleh itu semasa menyediakan ujian ataupun penilaian, guru seharusnya memastikan yang arahan dan item-item, sama ada dalam bentuk kenyataan, gambar dan lain-lain lagi itu jelas.
Faktor ketiga berkait dengan panjangnya ujian ataupun penilaian itu. Ujian yang banyak itemnya itu selalunya lebih stabil oleh kerana guru berpeluang menyoalnya beberapa kali. Sebaliknya, ujian yang banyak item itu memakan masa yang panjang. Murid yang rendah umurnya sudah tentu tidak dapat memberi tumpuan yang dikehendaki. Kita sedia maklum bahawa tempoh masa yang dapat ditumpukan oleh murid terhadap sesuatu itu berbeza. Walau bagaimanapun, murid di peringkat sekolah rendah mempunyai tumpuan yang terhad. Mereka cepat jemu dan dengan itu tidak akan dapat menjawab soalan-soalan yang dikemukakan. Bagi mengelakkan perkara ini daripada berlaku, guru seharusnya menyediakan ujian yang tidak terlalu memakan masa yang panjang. Guru juga boleh memenggalkan ujian guru untuk diberikan beberapa kali.
Faktor keempat ialah, pemeriksaan dan pemarkahan. Ujian objektif tidak menimbulkan masalah. Tetapi ujian ataupun penilaian yang berkaitan dengan sikap, nilai dan juga amali sukar diperiksa dan diberikan markah secara objektif. Masalah ini sering berlaku di dalam ujian-ujian terbuka yang guru lakukan. Di dalam pemerhatian juga, guru dapati yang pemarkahan sukar diberi dengan tepat. Bagi mengelakkan perkara-perkara ini, guru harus menyediakan satu skim pemeriksaan dan pemarkahan yang jelas dan kita patuhi pada skim ini apabila membuat pemeriksaan dan pemarkahan.
Faktor kelima dalam meninggikan ciri kebolehpercayaan dalam sesuatu ujian ataupun penilaian ialah dengan memberikan bilangan soalan yang berpatutan. Biasanya semakin bertambah bilangan soalan, maka semakin tepat pencapaian murid itu kerana bilangan soalan ditambah akan dapat mengurangkan peluang untuk murid meneka.
Penutup
Isu kesahan dan kebolehpercayaan adalah amat penting dalam pembinaan sesuatu alat ukur sebelum boleh diguna pakai. Walaupun sesuatu alat ukur yang digunakan telah pernah dipakai oleh penyelidik terdahulu, dan telah teruji kebolehpercayaan dan keesahannya, namun alat ukur tersebut masih perlu diuji rintis semula kerana inferens yang diperolehi hanya sesuai untuk tujuan dan sampel kajian tertentu sahaja.