A.
HAKEKAT ASSESSMENT/EVALUATION DALAM
PEMBELAJAR
Assessment is a broad term
defined as a process for obtaining information that is used for making
decisions about student, curricula and programs, and educational policy
(Nitko, 2001). Assessment is an integrated process of gaining information about
students’ learning and making value judgments about their progress (Linn
& Miller in Seifert & Sutton, 2009).Secara
umum, asesment
dapat diartikan sebagai proses untuk mendapatkan informasi dalam bentuk apapun
yang dapat digunakan untuk dasar pengambilan keputusan tentang siswa baik
yangmenyangkut kurikulumnya, program pembelajarannya, iklim sekolah maupun
kebijakan-kebijakan sekolah. Pembahasan tentang kompetensi untuk melakukan
asesmen tentang siswa akan meliputi bagaimana guru mengkoleksi semua informasi
untuk membantu siswa dalam mencapai target pembelajaran dengan berbagai teknik
asesmen, baik teknik yang bersifat formal maupun nonformal, seperti teknik paper
and pencil test, unjuk kerja siswa dalam menyelesaikan pekerjaan rumah,
tugas-tugas di laboratorium maupun keaktifan diskusi selama proses
pembelajaran. Semua informasi tersebut dianalisis untuk kepentingan laporan
kemajuan siswa. Assesmen secara sederhana dapat diartikan sebagai proses
pengukuran dan non pengukuran untuk memperoleh data karakteristik peserta didik
dengan aturan tertentu. Dalam pelaksanaan assesmen pembelajaran, guru akan
dihadapkan pada 3 (tiga) istilah yang sering dikacaukan pengertiannya, atau
bahkan sering pula digunakan secara bersama yaitu istilah pengukuran, penilaian
dan test. Untuk lebih jauh bisa memahami pelaksanaan assesmen pembelajaran
secara keseluruhan, perlu dipahami dahulu perbedaan pengertian dan hubungan di
antara ketiga istilah tersebut, dan bagaimana penggunaannya dalam asesmen
pembelajaran.
1. Pengukuran
Measuramentis defined as a
procedure for assigning numbers (usually called scores) to a specified
attribute or characteristic of a person in such a way that numbers describe the
degree to which the person possessed the attribute
(Nitko, 2001). Secara
sederhana pengukuran dapat diartikan sebagai kegiatan atau upaya yang dilakukan
untuk memberikan angka-angka pada suatu gejala atau peristiwa, atau benda,
sehingga hasil pengukuran akan selalu berupa angka. Alat untuk melakukan
pengukuran ini dapat berupa alat ukur standar seperti meter, kilogram, liter
dan sebagainya, termasuk ukuran-ukuran
ubyektif yang bersifat relatif, seperti depa, jengkal, “sebentar lagi”,
dan lain-lain. Dalam proses pembelajaran guru juga melakukan pengukuran
terhadap proses dan hasil belajar yang hasilnya berupa angka-angka yang
mencerminkan capaian dan proses dan hasil belajar tersebut. Angka 50, 75, atau
175 yang diperoleh dari hasil pengukuran proses dan hasil pembelajaran tersebut
bersifat kuantitatif dan belum dapat memberikan makna apa, karena belum
menyatakan tingkat kualitas dari apa yang diukur. Angka hasil pengukuran ini
biasa disebut dengan skor mentah. Angka hasil pengukuran baru mempunyai makna
bila dibandingkan dengan kriteria atau patokan tertentu.Contoh: Budi dinyatakanmemiliki IQ 150
setelahmengikutiteskecerdasan, Anggundinyatakanmendapatskor 590
setelahmengikutites TOEFL bahasaInggris.
2. Evaluasi
Evaluation is defined as the
process of making a value judgment about the worth of student’s product or
performance. (Nitko, 2001).Evaluation is the process of making judgments about
the assessment information (Airasian,
2005).Evaluasi adalah proses pemberian makna atau penetapan
kualitas hasil pengukuran dengan cara membandingkan angka hasil pengukuran
tersebut dengan kriteria tertentu. Kriteria sebagai pembanding dari proses dan
hasil pembelajaran tersebut dapat ditentukan sebelum proses pengukuran atau
dapat pula ditetapkan sesudah pelaksanaan pengukuran. Kriteria ini dapat berupa
proses/kemampuan minimal yang dipersyaratkan, atau batas keberhasilan, dapat
pula berupa kemampuan rata-rata unjuk kerja kelompok dan berbagai patokan yang
lain. Kriteria yang berupa batas kriteria minimal yang telah ditetapkan sebelum
pengukuran dan bersifat mutlak disebut dengan Penilaian Acuan Patokan atau
Penilaian Acua Kriteria (PAP/PAK), sedang kriteria yang ditentukan setelah
kegiatan pengukuran dilakukan dan didasarkan pada keadaan kelompok dan bersifat
relatif disebut dengan Penialain Acuan Norma/ Penilaian Acuan Relatif
(PAN/PAR).Contoh: Si
Lalaadalahmahasiswacerdas, Si Toto dinyatakantidaklulusujianskripsi, Si
Bolangharusmengikuti remedial.
3. Tes
Test is an
instrument or systematic procedure for observing and describing one or more
characteristic of a student using either
a numerical scale or a classification scheme. Test is a concept narrower than
assessment (Nitko, 2001). Tes adalah
seperangkat tugas yang harus dikerjakan atau sejumlah pertanyaan yang harus
dijawab oleh peserta didik untuk mengukur tingkat pemahaman dan penguasaannya
terhadap cakupan materi yang dipersyaratkan dan sesuai dengan tujuan pengajaran
tertentu. Sehingga dapat disimpulkan bahwa pada dasarnya tes merupakan alat
ukur yang sering digunakan dalam asesmen pembelajaran disamping alat ukur yang
lain.
Dalam
melaksanakan proses asesmen pembelajaran, guru selalu berhadapan dengan
konsep-konsep evaluasi, pengukuran, dan tes yang dalam penerapannya sering
dilakukan secara simultan. Sebab itu, dalam praktik ketiganya sering tidak
dirasakan pemisahannya, karena melakukan asesmen berarti telah pula melakukan
ketiganya. Waktu melaksanakan asesmen guru pasti telah menciptakan alat ukur
berupa tes maupun nontes seperti soal-soal ujian, observasi proses pembelajaran
dan sebagainya. Melakukan pengukuran, yaitu mengukur atau memberi angka
terhadap proses pembelajaran ataupun pekerjaan siswa sebagai hasil belajar yang
merupakan cerminan tingkat penguasaan terhadap materi yang dipersyaratkan,
kemudian membandingkan angka tersebut dengan kriteria tertentu yang berupa
batas penguasaan minimum ataupun berupa kemampuan umum kelompok,
sehinggamunculah nilai yang mencerminkan kualitas proses dan hasil
pembelajaran. Akhirnya diambillah keputusan oleh guru tentang kualitas proses
dan hasil belajar.
Dengan
uraian di atas, nampak jelas hubungan antara ketiga pengertian tersebut dalam
kegiatan asesmen pembelajaran, meskipun sering dilakukan oleh guru secara
simultan. Melakukan asesmen selalu diawali dengan menyusun tes atau nontes
sebagai alat ukur, hasil pengukuran berupa angka bersifat kuantitatif belum
bermakna bila tidak dilanjutkan dengan proses penilaian dengan membandingkan
hasil pengukuran dengan kriteria tertentu sebagai landasan pengambilan
keputusan dalam pembelajaran. Sebaliknya, penilaian (penentuan kualitas) tidak
dapat dilakukan tanpa didahului dengan proses pengukuran.
Keputusan
tentang siswa ini termasuk bagaimana guru mengelola pembelajaran di kelas,
bagaimana guru menempatkan siswa pada program-program pembelajaran yang
berbeda, tingkatan tugas-tugas untuk siswa yang sesuai dengan kemampuan dan
kebutuhan masing-masing, bimbingan dan penyuluhan, dan mengarahkan mereka pada
studi lanjut. Keputusan tentang kurikulum dan program sekolah, termasuk
pengambilan keputusan tentang efektifitas program ataupun langkah-langkah
untukmeningkatkan kemampuan siswa dengan remidial teaching. Kemudian, keputusan
untuk kebijakan pendidikan menyangkut kebijakan di tingkat sekolah, kabupaten,
maupun nasional. Sehingga ketika pembahasan tentang kompetensi untuk melakukan
asesmen tentang siswa akan meliputi bagaimana guru mengkoleksi semua informasi
untuk membantu siswa dalam mencapai target pembelajaran, sehingga teknik-teknik
asesmen yang digunakan untuk mengkoleksi informasi ini, baik teknik yang
bersifat formal maupun non formal dengan mengamati perilaku siswa dengan
menggunakan paper and pencil test, untuk
kerja siswa dalam menyelesaikan pekerjaan rumah, tugas-tugas di laboratorium
maupun keaktifan diskusi selama proses pembelajaran. Semua informasi tersebut
dianalisis sebagai laporan kemajuan siswa.Adapuntujuandari
assessment iniadalah (1) SCREENING :
Untukmengidentifikasitentangkemungkinanseseorangmengalamigangguan/kelainan, (2)
DETERMINING ELIGIBITY :
Untukmengetahuidanmenetapkanapakahseseorangmasukdalamkategori orang yang
membutuhkanlayanankhusus (ALB), (3) PROGRAM PLANNING :
Asesmenuntukkeperluanpenyusunan/pengembangan program pembelajaran yang tepat,
(4) MONITORING STUDENT PROGRESS :
Untukmengetahuitingkatkemajuansiswaselamadansetelahmengikuti program
pendidikantertentu, (4) EVALUATING PROGRAM : Untukmengetahuikeberhasilansuatu
program yang telahdilaksanakan
B.
PENDEKATAN DALAM ASSESSMENT
Pandangan dewasa ini mengenai
hubungan penilaian dengan pembelajaran dan motivasi juga berarti penilaian
harus mencangkup penyusunan tujuan atau target pembelajaran yang tepat dan
jelas. Target pembelajaran terdiri dari apa-apa yang harus diketahui oleh murid
dan mampu dilakukan. Adalah penting untuk menyusun kriteria penilaian tentang
apakah murid sudah mencapai target pembelajaran (McMillan in Santrock, 2001).
Tujuan penting lain kelas untuk kelas
sebagai konteks penilaian adalah menghasilkan penilaian bermutu tinggi
(Kubiszyn & Borich, 2000; Wright, 2001 in Santrock 2001:643). Penilaian
mencapai level bermutu tinggi jika penilaian menghasilkan informasi yang
reliable, valid dan berguna bagi kinerja murid (Carey, 2001 in Santrock,
2001:643). Penilaian bermutu tinggi juga harus adil (McMillan, 2001 in
Santrock, 2001:643). Validitas dan reliabilitas akan mempengaruhi konsistensi
dan akurasi dari inferensi atau kesimpulan guru yang diambil dari informasi
penilaian muridnya.
·
Norma
Norma adalah gambaran tentangkondisi suatu group ataukelompok
yang akan menjadi kriteria atau rujukan dalam membandingkan hasil pengukuran.
·
Validitas
Validitas adalah sejauh mana penilaian mengukur apa yang
hendak diukur, validitas juga mencangkup seberapa akurat dan bergunakan
inferensi guru terhadap penilaian tersebut (Santrock, 2001:643)
·
Reliabilitas
Reliabilitas adalah sejauh mana sebuah tes menghasilkan nilai
yang konsisten dan dapat direproduksi. Nilai yang reliabel adalah nilai yang
stabil, dependable, dan relatif bebas dari kesalahan pengukuran. Konsistensi
tergantung pada situasi dalam pelksanaan tes dan faktor murid yang bervariasi
dari satu tes ke tes lainnya (McMillan, 2001). Secara sederhana reliabilitas
dinyatakan sebagai tentang penentuan seberapa konsistenkah penilaian itu
mengukur hal-hal yang akan diukur (Santroct, 2001:645)
·
Keadilan
Penilaian kelas yang bermutu tinggi bukan hanya valid dan
reliable, tapi juga adil (fair) (McMillan, 2001). Penilaian dikatakan fair
apabila semua murid mendapatkan kesempatan yang sama untuk belajar dan
menunjukkan kemampuan dan pengetahuan mereka (Rearden, 2001: Young, 2001 in
Santrock, 2001:645). Penilaian adalah adil jika guru membuat target
pembelajaran yang tepat, memberi pelajaran dan materi yang baik untuk mencapai
target tersebut, dan memberikan penilaian yang merefleksikan target, isi
materi, dan instruksi (Santrock, 2001).
Bias penilaian terjadi jika ada penilaian yang menyinggung
atau memojokkan dan hukuman yang tidak adil (Popham, 2002). Sebah penilian
dikatakan bias jika penilaian itu bersifat ofensif terhadap satu kelompok
murid. Ini terjadi ketika stereotip negatif dari kelompok tertentu dimasukkan
kedalam tes. Misalnya, sebuah soal ujian menggambarkan seorang pria memiliki
pekerjaan prestisius dan bergaji tinggi (dokter dan eksekutif bisnis) dan
wanita dengan pekerjaan kurang prestisius dan bergaji rendah (juru tulis dan
sekertaris). Karena beberapa wanita yang mengikuti ujian itu mungkin tersinggung
oleh kesenjangan gender ini, maka tekanan ini mungkin menyebabkan hasil tes
yang kurang baik bagi si wanita itu. Sebuah penilaian mungkin juga bersifat
bias jika penilaian itu secara tidak adil menyinggung latar belakang seorang
murid,seperti etnis, status sosioekonomi, gender, agama, ketidak mampuan
(cacat), dan sebagainya.
1.
Standardized Test
Standardized tests are created by a team—usually test
experts from a commercial testing company who consult classroom teachers and
university faculty—and are administered in standardized ways…. Standardized tests are designed to be taken by many students within a
state, province, or nation, and sometimes across nations(Seifert & Sutton, 2009:266).Secara sederhana diartikan sebagai perangkat tes yang memiliki prosedur
yang baku (tersestandar atau seragam), baik dalam penggunaan maupun
penilaiannya (Supena, 2010).
Tujuan penggunaan standarized test
adalah:
·
Assessing
students’ progress in a wider context
·
Diagnosing
student’s strengths and weaknesses
·
Selecting
students for specific programs
·
Assisting
teachers’ planning
·
Accountability
Jenis-jenis standarized test:
·
Achievement
tests
Achievement tests are designed to
assess what students have learned in a specific content area (Seifert
& Sutton, 2009:270). Dengan kata lain adalah
tes yang dirancang untuk mengukur tingkat penguasaan anak terhadap suatu
kemampuan yang telah dipelajarinya dalam kurun waktu tertentu (Supena, 2010).
·
Diagnostic
tests
Profiling skills and abilities: Some
standardized tests are designed to diagnose strengths and weaknesses in skills,
typically reading or mathematics skills(Joshi 2003 in Seifert
& Sutton, 2009:271). Secara sederhana pengertiannya menunjukan kepada “proses
pengumpulan sejumlah informasi untuk mengetahui faktor penyebab dari suatu
penyakit untuk keperluan penetapan tindakan penyembuhan (treatment) yang tepat(Supena,
2010). For example, an elementary school
child may have difficult in reading and one or more diagnostic tests would
provide detailed information about three components: (1) word recognition,
which includes phonological awareness (pronunciation), decoding, and spelling;
(2) comprehension which includes vocabulary as well as reading and listening
comprehension, and (3) fluency.
The
examiner typically records not only the results on each question but also
observations of the child’s behavior such as distractibility or frustration.
The results from the diagnostic standardized tests are used in conjunction with
classroom observations, school and medical records, as well as interviews with
teachers, parents and students to produce a profile of the student’s skills and
abilities, and where appropriate diagnose a learning disability.
·
Aptitude
tests
Predicting the future: Aptitude
tests, like achievement tests, measure what students have learned, but rather
than focusing on specific subject matter learned in school (e.g. math, science,
English or social studies), the test items focus on verbal, quantitative,
problem solving abilities that are learned in school or in the general culture (Linn & Miller, 2005). Dengan
kata lain ialah test yang dirancang untuk mengukur kemampuan atau
kecakapan mental yang bersifat
potensial, sehingga hasilnya dapat digunakan untuk memprediksi kesuksesan anak
di masa mendatang, baik dalam mengikuti pendidikan, pekerjaan atau menguasai
bidang kemampuan tertentu (Supena, 2010).
2.
Classroom Assessement
Berdasarkan strategi kontemporer,
penilaian (assessement) bukan hanya
tes dan ujian, tetapi penilaian adalah sebuah proses yang terus menerus.
Penilaian adalah sesuatu yang harus dilakukan guru untuk menentukan apakah
muridnya sudah belajar dengan baik atau belum. Tanpa penilaian yang terus
menerus, guru tak akan pernah tahu apakah pengajarannya efektif atau tidak,
atau apakah perlu modifikasi pengajaran atau tidak (Santrock, 2001:637).
Guru ternyata menghabiskan lebih
banyak waktu dalam penilaian. Dalam satu analisis, mereka menghabiskan 20
sampai 30 persen waktu profesional mereka untuk menghadapi persoalan penilaian
(Stiggins, 2001). Dengan begitu karena memerlukan banyak waktu, maka penilaian
semestinya dilakukan dengan baik (Brookhart, 2002). Pakar penilaian James
McMillan (2001) percaya bahwa guru yang kompeten sering mengevaluasi muridnya
dalam konteks tujuan pembelajaran dan mengadaptasi instruksinya (pengajarannya)
sesuai dengan evaluasi tersebut. Untuk itu penilaian merupakan bagian integral
dalam pembelajaran di kelas.
Kelas merupakan bagian dari konten
penilaian. Berdasarkan Standard for
Teacher Competence in Educational Assessement yang dikembangkan bersama-sama
pada awal 1990-an oleh American
Federation of Teachers, National Council on Measurement in Education, dan National Education Association,mendeskripsikan
tanggung jawab guru atas penilaian murid dalam tiga kerangka (pra-instruksi,
selama instruksi, dan pasca-instruksi).
a.
Penilaian Pra-instruksi
Penilaian pra-instruksi dilakukan
guru sebelum memberikan pelajaran atau dapat dilakukan di minggu pertama
pengajaran. Guru dianjurkan mengetahui prestasi murid pada kelas sebelumnya
dalam pelajaran yang diampunya. Banyak juga dari penilaian pra-instruksi berupa
observasi informal. Dalam beberapa minggu awal sekolah, guru memiliki banyak
kesempatan untuk mengamati karakteristik dan perilaku murid. Setalah melakukan
pengamatan, guru perlu menginterpretasikannya.
b.
Penilaian selama instruksi
Penilaian selama instruksi atau
penilaian formatif adalah penilaian selama jalannya pelajaran atau instruksi,
bukan setelah pelajaran selesai. Observasi guru secara terus menerus dan
memantau proses belajar murid saat mengajar akan membuat guru mengetahui apa
yang harus dilakukan berikutnya. Penilaian selama instruksi membantu guru
menentukan pengajaran pada level yang menantang murid dan memperluas cakrawala
pemikiran mereka.
Penilaian selama instruksi
berlangsung pada saat yang sama ketika guru membuat banyak keputusan lain
tentang apa yang akan dilakukan, dikatakan, atau ditanyakan, untuk membuat
kelas berjalan lancar dan membantu murid belajar aktif (Airasian, 2001).
c.
Penilaian Pasca-instruksi
Penilaian pasca-instruksi atau
penilaian sumatif (penilaian formal) adalah penilaian setelah instruksi
selesai, dengan tujuan mencatat kinerja murid. Penilaian sesudah instruksi akan
menghasilkan informasi tentang seberapa baikkah murid dalam menguasai materi,
apakah murid sudah siap untuk pelajaran lanjutan, grade apa yang harus diberikan kepada mereka, komentar apa saja
yang harus dikatakan kepada orang tua mereka, dan bagaimana guru harus
menyesuaikan instruksi (McMillan, 2001).
3.
Alternatif Assessement (Penilaian Alternatif)
Ada beberapa tren penilaian dewasa
ini disamping penilaian tradisional yang sudah banyak diterapkan di sekolah.
Salah satu tren penilaian alternatif yakni menuruh murid untuk memecahkan
beberapa tipe problem autentik atau menyelesaikan suatu proyek atau
mendemonstrasikan beberapa keahlian di luar konteks ujian dan esai (Montgomery,
2001). Tern lainnya adalah menyuruh murid untuk membuat portfolio pembelajaran
untuk menunjukkan apa yang telah mereka pelajari (Berryman & Russell,
2001). Penilain alternatif dibutuhkan agar instruksi kompatibel dengan
pandangan kontemporer tentang pemebelajaran dan motivasi.
Penilaian alternatif menawarkan pada
murid lebih banyak pilihan ketimbang ujian tradisional atau ujian esai.
Penilaian alternatif ini juga biasa disebut sebagai penilaian autentik.
Penilaian autentik berarti mengevaluasi pengetahuan atau keahlian murid dalam
konteks yang mendekati dunia riil atau kehidupan nyata sedekat mungkin (Pokey
& Siders, 2001). Aplikasi penilaian autentik dapat tercermin dalam
penilaian berbasis kinerja, penilaian portfolio, dan penilaian alternatif
lainnya. Namun McMillan (dalam Santrock, 2001) menyatakan tidak semua penilaian
berbasis kinerja itu autentik.
Kritik terhadap penilaian autentik
menyatakan bahwa penilaian seperti itu tidak selalu baik ketimbang penilaian
konvensional, seperti soal pilihan ganda dan esai (Terwilliger, 1997). Kritikus
menyatakan pendukung penilaian autentik jarang memberikan data untuk mendukung
validitas penilaian autentik. Mereka juga percaya bahwa penilaian autentik
tidak bisa menilai pengetahuan dan keahlian dasar secara memadai. (Santrock,
2001).
a.
Penilaian Berbasis Kinerja
Berpindah dari
penilaian tradisional dengan tes objektif ke penilaian berbasis kinerja telah
dideskripsikan sebagai berpindah dari “mengetahui” ke “menunjukkan” (Burz &
Marshall, 1996). Penilaian kinerja mencakup sejumlah bagian kinerja aktual
murid (seperti dalam bidang tari, musik, dan pendidikan olahraga), dan juga
paper esai, proyek, presentasi oral, eksperimen, dan portofolio (Santrock,
2001:658). Perubahan utama dalam penilaian kinerja adalah diperkenalkannya
bentuk penilaian ini ke dalam “area akademik” tradisional (Powell, 2002). Hal
itu dikarenakan penilaian berbasis kinerja telah digunakan selama
bertahun-tahun pada disiplin ilmu tertentu saja seperti seni, musik, dan
pendidikan fisik/olahraga.
1)
Ciri-ciri Penilaian Berbasis Kinerja
Penilaian kinerja mencakup penekanan
pada “melakukan” aktivitas terbuka di mana tidak ada jawaban yang benar dan
objektif dan penilaian ini bisa menilai pemikiran level tinggi (Santrock,
2001:658). Evaluasi kinerja menggunakan metode evaluasi langsung, penilaian
diri, penilaian kinerja kelompok dan individual, serta lebih banyak memakan
waktu (Hambleton, 1996).
Jika ujian tradisional menekankan
pada apa yang diketahui murid, maka penilaian berbasis kinerja didesain untuk
mengevaluasi apa yang diketahui dan dapat dilakukan murid (Maki, 2001; Moon
& Callahan, 2001). Di dalam penilaian berbasis kinerja tidak ada jawaban
yang benar dan objektif. Misalnya, tidak ada “jawaban benar” saat murid
memberikan presentasi di depan kelas, membuat lukisan, melakukan senam/tari,
atau mendesain proyek sains.
Banyak penilaian berbasis kinerja
memberi banyak kebebasan kepada murid untuk menyusun sendiri jawaban mereka.
Walaupun ini menyulikan dalam penilaian, namun hal ini memberi kontens untuk
menilai keahlian berpikir level tinggi dari si murid, seperti kemampuan
berpikir mendalam tentang suatu isu atau topik. Banyak penilaian berbasis
kinerja juga realistis dalam pengertian bersifat autentik, walaupun beberapa
diantaranya tidak realistik. Misalnya, membolehkan murid menggunakan kalkulator
atau komputer untuk memecahkan soal matematika pada saat ujian merupakan upaya
merefleksikan hubungan yang dekat dengan dunia riil, ketimbang melarang murid
menggunakan alat bantu tersebut. Pasalnya, ketika murid harus memecahkan
masalah matematika di dunia nyata, mereka kemungkinan besar menggunakan
kalkulator atau komputer.
Ciri-ciri penilaian berbasis kinerja
juga diantaranya menggunakan metode evaluasi langsung, seperti mengevaluasi
contoh tulisan untuk menilai kemampuan menulis dan evaluasi presentasi oral
untuk menilai kemampuan berbicara. Beberapa penilaian ini juga mensyaratkan
murid untuk mengevaluasi kinerja mereka sendiri. Misalnya, murid diminta untuk
menilai kualitas dari presentasi oral mereka sendiri, kinerja tari mereka, atau
akting drama mereka. Selain menilai individual, beberapa dari penilaian ini
juga menilai dan mengevaluasi hasil kelompok. Alat bantu untuk evaluasi mandiri
ini dengan menggunakan rubrik, yang didalamnya terdapat kriteria nilai murid
berikut penjelasannya seperti sangat baik, baik, tidak cukup baik.
Terakhir, penilaian kinerja mungkin
dilakukan dalam periode waktu yang cukup panjang. Berbeda dengan penilain
tradisional yang dilakukan dalam satu kerangka waktu saja, semisal guru memberi
soal pilihan ganda dan murid diberi waktu satu jam saja untuk menyelesaikannya.
Namun sebaliknya, penilaian kinerja sering ditujukan untuk tugas yang memakan
waktu beberapa hari, minggu, dan bahkan bulan (Bracken, 2000).
2)
Pedoman Penilaian Berbasis Kinerja
Airasian (dalam Santrock, 2001)
membagi 4 tahapan/pedoman yang merupakan isu umum dalam penilaian berbasis
kinerja: (1) menentukan tujuan yang jelas; (2) mengidentifikasi kriteria yang
dapat diamati; (3) memberi setting
yang tepat; dan (4) menilai kinerja.
Tujuan dari penialaian kinerja juga
harus jelas seperti memberi nilai/grade,
mengevaluasi kemajuan murid, mengenali langkah-langkah penting dalam kinerja,
menghasilkan produk yang dapat dimasukkan dalam portfolio pembelajaran,
refrensi karya murid untuk pendaftaran ke jenjang pendidikan tinggi atau
program lain, dan sebagainya (Santrock, 2001:660).
3)
Kriteria Kinerja
Kriteria kinerja adalah perilaku
spesifik yang harus dilakukan murid secara efektif sebagai bagian dari
penilaian. Kriteria kinerja akan membantu guru mendeskripsikan apa yang harus
dilakukan murid seperti, “Kerjakan presentasi lisan” atau “Selesaikan sebuah
proyek sains”. Tanpa kriteria, observasi guru bisa jadi tidak sistematis dan
tidak beraturan. Kriteria kinerja harus dikomunikasikan kepada murid pada awal
instruksi agar murid mengetahui fokus dari pembelajaran.
Selanjutnya, guru perlu memberi nilai
kinerja. Rubrik penilaian menggunakan kriteria yang dipakai untuk menilai
kinerja, penilaian kualitas kinerja, nilai yang harus diberikan dan apa
maknanya, serta bagaimana tingkat kualitas yang berbeda-beda harus
dideskripsikan dan dibedakan dari satu murid ke murid lain (Arter &
McTighe, 2001).
4)
Mengevaluasi Penilaian Berbasis
Kinerja
Walaupun dukungan pada penilaian
berbasis kinerja sangat tinggi di banyak kawasan di AS dan Kanada, namun
implementasi efektifnya masih menghadapi kendala (Hambleton dalam Santrock,
2001:664). Dibanding tes objektif, penilaian kinerja sering membutuhkan banyak
waktu dalam penyusunannya, pelaksanaannya, dan penilaiannya. Selain itu juga
banyak tes kinerja tidak memenuhi standar validitas dan reliabilitas yang
ditetapkan oleh kelompok pendidikan.
Walaupun perencanaan, penyusunan, dan
penilaian tes kinerja masih sulit, guru harus berusaha keras untuk memasukkan
tes kinerja sebagai aspek penting dari pengajaran mereka (Mabry, 1999). Dan
tampaknya penilaian berbasis kinerja juga belum sepenuhnya diaplikasikan oleh
para guru di sekolah di Indonesia. Hal ini mungkin dikarenakan sumber daya
manusia yang belum memadai atau hal lain yang menyangkut penggunaan penilaian
berbasis kinerja di sekolah dan perguruan tinggi belum dapat dipraktekkan.
b.
Penialaian Portofolio
Sebuah
portofolio adalah sekumpulan hasil kerja yang berguna untuk memberi tahu
tentang kemajuan dan prestasi murid (Minzes, Wandersee & Novak, 2001;
Weasmer & Woods, 2001). Portofolio lebih dari sekadar kompilasi paper murid yang ditumpuk di map atau
kumpulan catatan saja (Haton, 2001).
Santrock
menjelaskan, agar bisa disebut portofolio, setiap karya atau hasil kerja harus
dibuat dan ditata sedemikian rupa sehingga menunjukkan kemajuan dan mengarah
pada satu tujuan. Portofolio dapat mencakup banyak tipe karya, seperti contoh
tulisan, entri jurnal, rekaman video, karya seni, komentar guru, poster,
wawancara, puisi, hasil ujian, problem
solving, penilaian diri dan prestasi-prestasi lainnya.
Penggunaan
portofolio secara efektif untuk penilaian membutuhkan:
1)
Penentuan Tujuan Portofolio
Portofolio dapat digunakan untuk
tujuan yang berbeda-beda (Lyons, 1999). Dua tipe tujuan umum portofolio adalah
mendokumentasikan perkembangan (portofolio perkembangan) dan menunjukkan karya
terbaik (portofolio karya terbaik).
Portofolio perkembangan (developmental portfolio) terdiri dari
hasil karya/kerja murid dalam kerangka waktu yang panjang (selama satu tahun
ajaran atau bahkan lebih lama) untuk menunjukkan kemajuan murid dalam memenuhi
target pembelajaran. Portofolio karya terbaik (best-work portfolio) menunjukkan hasil tugas atau karya murid yang
paling baik.Portofolio ini berguna untuk pertemuan guru-orang tua, refrensi
pendaftaran pendidikan murid ke jenjang yang lebih tinggi atau program lainnya.
2)
Melibatkan Murid
Banyak guru membiarkan murid memilih
setidaknya beberapa keputusan tentang isi portofolio (Weasmer & Woods,
2001). Ketika murid diizinkan memilih isi untuk portofolio mereka, cara terbaik
adalah mendorong refleksi diri mereka dengan menyuruh menulis deskripsi singkat
tentang mengapa mereka memilih suatu tugas (Airasian, 2001).
3)
Me-review Bersama Murid
Menjelaskan kepada murid sejak awal
tahun ajaran tentang apa portofolio dan kegunaannya merupakan hal yang penting.
Guru juga harus mengadakan beberapa pertemuan guru-murid pada tahun ajaran itu
untuk me-review kemajuan murid dan membantu merencanakan tugas selanjutnya
untuk dimasukkan dalam portofolio.
4)
Menentukan Kriteria untuk Evaluasi
Kriteria kinerja yang jelas dan
sistematis sangat penting dalam rangka menggunakan portofolio secara efektif
(Fallon & Watts, 2001; Linn & Gronlund, 2000). Target pembelajaran yang
jelas bagi murid akan memudahkan pembuatan kriteria kinerja. Guru harus
menentukan pengetahuan dan keahlian apa yang harus dipunyai murid.
5)
Memberi Penilaian
Untuk menilai portofolio dibutuhkan
waktu yang cukup. Guru harus mengevaluasi bukan hanya setiap item tetapi juga
portofolio secara keseluruhan. Bila tujuan portofolio adalah memberi informasi
deskriptif tentang murid untuk guru level selanjutnya, maka portofolio itu tidak
perlu diberi nilai atau diringkas. Namun jika tujuannya adalah untuk
mendiagnosis, perbaikan, memberi data untuk instruksi yang efektif, memotivasi
murid untuk merefleksikan kinerja mereka, atau memberi nilai (grade) kepada
murid, maka penilaian dan ringkasan harus dilakukan. Sebagaimana aspek
penilaian portofolio lainnya, guru boleh memberi murid kesempatan untuk
mengevaluasi dan mengkritik karya mereka sendiri.
Glossary
Inferensi; kesimpulan yang diambil seseorang dari
informasi.
stereotip; klise; citra yang tetap; ciri;
klasifikasisebagaibiasaatautipikal
Dependable dapatdipercaya;
handal; andal; dapatdiandalkan; reliable
Gender; jeniskelamin
Valid;sah; absah; berlaku
Grade; mutu; tingkatkwalitas; kadar
Penilaian formatif; penilaian selama jalannya pelajaran atau instruksi, bukan setelah
pelajaran selesai.
Penilaian sumatif; penilaian setelah instruksi selesai, dengan tujuan mencatat kinerja
murid.
Portofolio;
sekumpulan hasil karya murid yang sistematis dan terorganisir, yang menunjukkan
keahlian dan prestasi murid.
Developmental portfolio; portofolio hasil karya/kerja murid dalam kerangka waktu yang
panjang.
Best-work portfolio; portofolio yang menunjukkan hasil tugas/karya murid yang terbaik.
Daftar Pustaka
Santrock
W. John (2001). Educational Psychology
(edisi terjemahan). Boston: Mc Graw Hill.
Seifert
Kelvin &Sutton Rosemary (2009). Education
Psychology (second edition). Zurich: The Global Text Project.
Martyn
Long (2000). The Psychology of
Education. London: RoutledgeFalmer.
Tidak ada komentar:
Posting Komentar