Jumat, 21 November 2014

HAKEKAT ASSESSMENT/EVALUATION DALAM PEMBELAJAR



A.   HAKEKAT ASSESSMENT/EVALUATION DALAM PEMBELAJAR
Assessment is a broad term defined as a process for obtaining information that is used for making decisions about student, curricula and programs, and educational policy (Nitko, 2001). Assessment is an integrated process of gaining information about students’ learning and making value judgments about their progress (Linn & Miller in Seifert & Sutton, 2009).Secara umum, asesment dapat diartikan sebagai proses untuk mendapatkan informasi dalam bentuk apapun yang dapat digunakan untuk dasar pengambilan keputusan tentang siswa baik yangmenyangkut kurikulumnya, program pembelajarannya, iklim sekolah maupun kebijakan-kebijakan sekolah. Pembahasan tentang kompetensi untuk melakukan asesmen tentang siswa akan meliputi bagaimana guru mengkoleksi semua informasi untuk membantu siswa dalam mencapai target pembelajaran dengan berbagai teknik asesmen, baik teknik yang bersifat formal maupun nonformal, seperti teknik paper and pencil test, unjuk kerja siswa dalam menyelesaikan pekerjaan rumah, tugas-tugas di laboratorium maupun keaktifan diskusi selama proses pembelajaran. Semua informasi tersebut dianalisis untuk kepentingan laporan kemajuan siswa. Assesmen secara sederhana dapat diartikan sebagai proses pengukuran dan non pengukuran untuk memperoleh data karakteristik peserta didik dengan aturan tertentu. Dalam pelaksanaan assesmen pembelajaran, guru akan dihadapkan pada 3 (tiga) istilah yang sering dikacaukan pengertiannya, atau bahkan sering pula digunakan secara bersama yaitu istilah pengukuran, penilaian dan test. Untuk lebih jauh bisa memahami pelaksanaan assesmen pembelajaran secara keseluruhan, perlu dipahami dahulu perbedaan pengertian dan hubungan di antara ketiga istilah tersebut, dan bagaimana penggunaannya dalam asesmen pembelajaran.

1.    Pengukuran
Measuramentis defined as a procedure for assigning numbers (usually called scores) to a specified attribute or characteristic of a person in such a way that numbers describe the degree to which the person possessed the attribute (Nitko, 2001). Secara sederhana pengukuran dapat diartikan sebagai kegiatan atau upaya yang dilakukan untuk memberikan angka-angka pada suatu gejala atau peristiwa, atau benda, sehingga hasil pengukuran akan selalu berupa angka. Alat untuk melakukan pengukuran ini dapat berupa alat ukur standar seperti meter, kilogram, liter dan sebagainya, termasuk ukuran-ukuran  ubyektif yang bersifat relatif, seperti depa, jengkal, “sebentar lagi”, dan lain-lain. Dalam proses pembelajaran guru juga melakukan pengukuran terhadap proses dan hasil belajar yang hasilnya berupa angka-angka yang mencerminkan capaian dan proses dan hasil belajar tersebut. Angka 50, 75, atau 175 yang diperoleh dari hasil pengukuran proses dan hasil pembelajaran tersebut bersifat kuantitatif dan belum dapat memberikan makna apa, karena belum menyatakan tingkat kualitas dari apa yang diukur. Angka hasil pengukuran ini biasa disebut dengan skor mentah. Angka hasil pengukuran baru mempunyai makna bila dibandingkan dengan kriteria atau patokan tertentu.Contoh: Budi dinyatakanmemiliki IQ 150 setelahmengikutiteskecerdasan, Anggundinyatakanmendapatskor 590 setelahmengikutites TOEFL bahasaInggris.

2.    Evaluasi
Evaluation is defined as the process of making a value judgment about the worth of student’s product or performance. (Nitko, 2001).Evaluation is the process of making judgments about the assessment information (Airasian, 2005).Evaluasi adalah proses pemberian makna atau penetapan kualitas hasil pengukuran dengan cara membandingkan angka hasil pengukuran tersebut dengan kriteria tertentu. Kriteria sebagai pembanding dari proses dan hasil pembelajaran tersebut dapat ditentukan sebelum proses pengukuran atau dapat pula ditetapkan sesudah pelaksanaan pengukuran. Kriteria ini dapat berupa proses/kemampuan minimal yang dipersyaratkan, atau batas keberhasilan, dapat pula berupa kemampuan rata-rata unjuk kerja kelompok dan berbagai patokan yang lain. Kriteria yang berupa batas kriteria minimal yang telah ditetapkan sebelum pengukuran dan bersifat mutlak disebut dengan Penilaian Acuan Patokan atau Penilaian Acua Kriteria (PAP/PAK), sedang kriteria yang ditentukan setelah kegiatan pengukuran dilakukan dan didasarkan pada keadaan kelompok dan bersifat relatif disebut dengan Penialain Acuan Norma/ Penilaian Acuan Relatif (PAN/PAR).Contoh: Si Lalaadalahmahasiswacerdas, Si Toto dinyatakantidaklulusujianskripsi, Si Bolangharusmengikuti remedial.

3.    Tes
Test is an instrument or systematic procedure for observing and describing one or more characteristic of a student  using either a numerical scale or a classification scheme. Test is a concept narrower than assessment (Nitko, 2001). Tes adalah seperangkat tugas yang harus dikerjakan atau sejumlah pertanyaan yang harus dijawab oleh peserta didik untuk mengukur tingkat pemahaman dan penguasaannya terhadap cakupan materi yang dipersyaratkan dan sesuai dengan tujuan pengajaran tertentu. Sehingga dapat disimpulkan bahwa pada dasarnya tes merupakan alat ukur yang sering digunakan dalam asesmen pembelajaran disamping alat ukur yang lain.
Dalam melaksanakan proses asesmen pembelajaran, guru selalu berhadapan dengan konsep-konsep evaluasi, pengukuran, dan tes yang dalam penerapannya sering dilakukan secara simultan. Sebab itu, dalam praktik ketiganya sering tidak dirasakan pemisahannya, karena melakukan asesmen berarti telah pula melakukan ketiganya. Waktu melaksanakan asesmen guru pasti telah menciptakan alat ukur berupa tes maupun nontes seperti soal-soal ujian, observasi proses pembelajaran dan sebagainya. Melakukan pengukuran, yaitu mengukur atau memberi angka terhadap proses pembelajaran ataupun pekerjaan siswa sebagai hasil belajar yang merupakan cerminan tingkat penguasaan terhadap materi yang dipersyaratkan, kemudian membandingkan angka tersebut dengan kriteria tertentu yang berupa batas penguasaan minimum ataupun berupa kemampuan umum kelompok, sehinggamunculah nilai yang mencerminkan kualitas proses dan hasil pembelajaran. Akhirnya diambillah keputusan oleh guru tentang kualitas proses dan hasil belajar.
Dengan uraian di atas, nampak jelas hubungan antara ketiga pengertian tersebut dalam kegiatan asesmen pembelajaran, meskipun sering dilakukan oleh guru secara simultan. Melakukan asesmen selalu diawali dengan menyusun tes atau nontes sebagai alat ukur, hasil pengukuran berupa angka bersifat kuantitatif belum bermakna bila tidak dilanjutkan dengan proses penilaian dengan membandingkan hasil pengukuran dengan kriteria tertentu sebagai landasan pengambilan keputusan dalam pembelajaran. Sebaliknya, penilaian (penentuan kualitas) tidak dapat dilakukan tanpa didahului dengan proses pengukuran.
Keputusan tentang siswa ini termasuk bagaimana guru mengelola pembelajaran di kelas, bagaimana guru menempatkan siswa pada program-program pembelajaran yang berbeda, tingkatan tugas-tugas untuk siswa yang sesuai dengan kemampuan dan kebutuhan masing-masing, bimbingan dan penyuluhan, dan mengarahkan mereka pada studi lanjut. Keputusan tentang kurikulum dan program sekolah, termasuk pengambilan keputusan tentang efektifitas program ataupun langkah-langkah untukmeningkatkan kemampuan siswa dengan remidial teaching. Kemudian, keputusan untuk kebijakan pendidikan menyangkut kebijakan di tingkat sekolah, kabupaten, maupun nasional. Sehingga ketika pembahasan tentang kompetensi untuk melakukan asesmen tentang siswa akan meliputi bagaimana guru mengkoleksi semua informasi untuk membantu siswa dalam mencapai target pembelajaran, sehingga teknik-teknik asesmen yang digunakan untuk mengkoleksi informasi ini, baik teknik yang bersifat formal maupun non formal dengan mengamati perilaku siswa dengan menggunakan paper and pencil test, untuk kerja siswa dalam menyelesaikan pekerjaan rumah, tugas-tugas di laboratorium maupun keaktifan diskusi selama proses pembelajaran. Semua informasi tersebut dianalisis sebagai laporan kemajuan siswa.Adapuntujuandari assessment iniadalah (1) SCREENING : Untukmengidentifikasitentangkemungkinanseseorangmengalamigangguan/kelainan, (2) DETERMINING ELIGIBITY : Untukmengetahuidanmenetapkanapakahseseorangmasukdalamkategori orang yang membutuhkanlayanankhusus (ALB), (3) PROGRAM PLANNING : Asesmenuntukkeperluanpenyusunan/pengembangan program pembelajaran yang tepat, (4) MONITORING STUDENT PROGRESS : Untukmengetahuitingkatkemajuansiswaselamadansetelahmengikuti program pendidikantertentu, (4) EVALUATING PROGRAM : Untukmengetahuikeberhasilansuatu program yang telahdilaksanakan

B.   PENDEKATAN DALAM ASSESSMENT
Pandangan dewasa ini mengenai hubungan penilaian dengan pembelajaran dan motivasi juga berarti penilaian harus mencangkup penyusunan tujuan atau target pembelajaran yang tepat dan jelas. Target pembelajaran terdiri dari apa-apa yang harus diketahui oleh murid dan mampu dilakukan. Adalah penting untuk menyusun kriteria penilaian tentang apakah murid sudah mencapai target pembelajaran (McMillan in Santrock, 2001).
Tujuan penting lain kelas untuk kelas sebagai konteks penilaian adalah menghasilkan penilaian bermutu tinggi (Kubiszyn & Borich, 2000; Wright, 2001 in Santrock 2001:643). Penilaian mencapai level bermutu tinggi jika penilaian menghasilkan informasi yang reliable, valid dan berguna bagi kinerja murid (Carey, 2001 in Santrock, 2001:643). Penilaian bermutu tinggi juga harus adil (McMillan, 2001 in Santrock, 2001:643). Validitas dan reliabilitas akan mempengaruhi konsistensi dan akurasi dari inferensi atau kesimpulan guru yang diambil dari informasi penilaian muridnya.
·         Norma
Norma adalah gambaran tentangkondisi suatu group ataukelompok yang akan menjadi kriteria atau rujukan dalam membandingkan hasil pengukuran.
·         Validitas
Validitas adalah sejauh mana penilaian mengukur apa yang hendak diukur, validitas juga mencangkup seberapa akurat dan bergunakan inferensi guru terhadap penilaian tersebut (Santrock, 2001:643)
·         Reliabilitas
Reliabilitas adalah sejauh mana sebuah tes menghasilkan nilai yang konsisten dan dapat direproduksi. Nilai yang reliabel adalah nilai yang stabil, dependable, dan relatif bebas dari kesalahan pengukuran. Konsistensi tergantung pada situasi dalam pelksanaan tes dan faktor murid yang bervariasi dari satu tes ke tes lainnya (McMillan, 2001). Secara sederhana reliabilitas dinyatakan sebagai tentang penentuan seberapa konsistenkah penilaian itu mengukur hal-hal yang akan diukur (Santroct, 2001:645)
·         Keadilan
Penilaian kelas yang bermutu tinggi bukan hanya valid dan reliable, tapi juga adil (fair) (McMillan, 2001). Penilaian dikatakan fair apabila semua murid mendapatkan kesempatan yang sama untuk belajar dan menunjukkan kemampuan dan pengetahuan mereka (Rearden, 2001: Young, 2001 in Santrock, 2001:645). Penilaian adalah adil jika guru membuat target pembelajaran yang tepat, memberi pelajaran dan materi yang baik untuk mencapai target tersebut, dan memberikan penilaian yang merefleksikan target, isi materi, dan instruksi (Santrock, 2001).
Bias penilaian terjadi jika ada penilaian yang menyinggung atau memojokkan dan hukuman yang tidak adil (Popham, 2002). Sebah penilian dikatakan bias jika penilaian itu bersifat ofensif terhadap satu kelompok murid. Ini terjadi ketika stereotip negatif dari kelompok tertentu dimasukkan kedalam tes. Misalnya, sebuah soal ujian menggambarkan seorang pria memiliki pekerjaan prestisius dan bergaji tinggi (dokter dan eksekutif bisnis) dan wanita dengan pekerjaan kurang prestisius dan bergaji rendah (juru tulis dan sekertaris). Karena beberapa wanita yang mengikuti ujian itu mungkin tersinggung oleh kesenjangan gender ini, maka tekanan ini mungkin menyebabkan hasil tes yang kurang baik bagi si wanita itu. Sebuah penilaian mungkin juga bersifat bias jika penilaian itu secara tidak adil menyinggung latar belakang seorang murid,seperti etnis, status sosioekonomi, gender, agama, ketidak mampuan (cacat), dan sebagainya.
1.    Standardized Test
Standardized tests are created by a team—usually test experts from a commercial testing company who consult classroom teachers and university faculty—and are administered in standardized ways…. Standardized tests are designed to be taken by many students within a state, province, or nation, and sometimes across nations(Seifert & Sutton, 2009:266).Secara sederhana diartikan sebagai perangkat tes yang memiliki prosedur yang baku (tersestandar atau seragam), baik dalam penggunaan maupun penilaiannya (Supena, 2010).
Tujuan penggunaan standarized test adalah:
·         Assessing students’ progress in a wider context
·         Diagnosing student’s strengths and weaknesses
·         Selecting students for specific programs
·         Assisting teachers’ planning
·         Accountability
Jenis-jenis standarized test:
·         Achievement tests
Achievement tests are designed to assess what students have learned in a specific content area (Seifert & Sutton, 2009:270). Dengan kata lain adalah tes yang dirancang untuk mengukur tingkat penguasaan anak terhadap suatu kemampuan yang telah dipelajarinya dalam kurun waktu tertentu (Supena, 2010).
·         Diagnostic tests
Profiling skills and abilities: Some standardized tests are designed to diagnose strengths and weaknesses in skills, typically reading or mathematics skills(Joshi 2003 in Seifert & Sutton, 2009:271). Secara sederhana pengertiannya menunjukan kepada “proses pengumpulan sejumlah informasi untuk mengetahui faktor penyebab dari suatu penyakit untuk keperluan penetapan tindakan penyembuhan (treatment) yang tepat(Supena, 2010). For example, an elementary school child may have difficult in reading and one or more diagnostic tests would provide detailed information about three components: (1) word recognition, which includes phonological awareness (pronunciation), decoding, and spelling; (2) comprehension which includes vocabulary as well as reading and listening comprehension, and (3) fluency.
      The examiner typically records not only the results on each question but also observations of the child’s behavior such as distractibility or frustration. The results from the diagnostic standardized tests are used in conjunction with classroom observations, school and medical records, as well as interviews with teachers, parents and students to produce a profile of the student’s skills and abilities, and where appropriate diagnose a learning disability.
·         Aptitude tests
Predicting the future: Aptitude tests, like achievement tests, measure what students have learned, but rather than focusing on specific subject matter learned in school (e.g. math, science, English or social studies), the test items focus on verbal, quantitative, problem solving abilities that are learned in school or in the general culture (Linn & Miller, 2005). Dengan kata lain ialah test yang dirancang untuk mengukur kemampuan atau kecakapan  mental yang bersifat potensial, sehingga hasilnya dapat digunakan untuk memprediksi kesuksesan anak di masa mendatang, baik dalam mengikuti pendidikan, pekerjaan atau menguasai bidang kemampuan tertentu (Supena, 2010).

2.    Classroom Assessement
Berdasarkan strategi kontemporer, penilaian (assessement) bukan hanya tes dan ujian, tetapi penilaian adalah sebuah proses yang terus menerus. Penilaian adalah sesuatu yang harus dilakukan guru untuk menentukan apakah muridnya sudah belajar dengan baik atau belum. Tanpa penilaian yang terus menerus, guru tak akan pernah tahu apakah pengajarannya efektif atau tidak, atau apakah perlu modifikasi pengajaran atau tidak (Santrock, 2001:637).
Guru ternyata menghabiskan lebih banyak waktu dalam penilaian. Dalam satu analisis, mereka menghabiskan 20 sampai 30 persen waktu profesional mereka untuk menghadapi persoalan penilaian (Stiggins, 2001). Dengan begitu karena memerlukan banyak waktu, maka penilaian semestinya dilakukan dengan baik (Brookhart, 2002). Pakar penilaian James McMillan (2001) percaya bahwa guru yang kompeten sering mengevaluasi muridnya dalam konteks tujuan pembelajaran dan mengadaptasi instruksinya (pengajarannya) sesuai dengan evaluasi tersebut. Untuk itu penilaian merupakan bagian integral dalam pembelajaran di kelas.
Kelas merupakan bagian dari konten penilaian. Berdasarkan Standard for Teacher Competence in Educational Assessement yang dikembangkan bersama-sama pada awal 1990-an oleh American Federation of Teachers, National Council on Measurement in Education, dan National Education Association,mendeskripsikan tanggung jawab guru atas penilaian murid dalam tiga kerangka (pra-instruksi, selama instruksi, dan pasca-instruksi).

a.    Penilaian Pra-instruksi
Penilaian pra-instruksi dilakukan guru sebelum memberikan pelajaran atau dapat dilakukan di minggu pertama pengajaran. Guru dianjurkan mengetahui prestasi murid pada kelas sebelumnya dalam pelajaran yang diampunya. Banyak juga dari penilaian pra-instruksi berupa observasi informal. Dalam beberapa minggu awal sekolah, guru memiliki banyak kesempatan untuk mengamati karakteristik dan perilaku murid. Setalah melakukan pengamatan, guru perlu menginterpretasikannya.

b.    Penilaian selama instruksi
Penilaian selama instruksi atau penilaian formatif adalah penilaian selama jalannya pelajaran atau instruksi, bukan setelah pelajaran selesai. Observasi guru secara terus menerus dan memantau proses belajar murid saat mengajar akan membuat guru mengetahui apa yang harus dilakukan berikutnya. Penilaian selama instruksi membantu guru menentukan pengajaran pada level yang menantang murid dan memperluas cakrawala pemikiran mereka.
Penilaian selama instruksi berlangsung pada saat yang sama ketika guru membuat banyak keputusan lain tentang apa yang akan dilakukan, dikatakan, atau ditanyakan, untuk membuat kelas berjalan lancar dan membantu murid belajar aktif (Airasian, 2001).

c.    Penilaian Pasca-instruksi
Penilaian pasca-instruksi atau penilaian sumatif (penilaian formal) adalah penilaian setelah instruksi selesai, dengan tujuan mencatat kinerja murid. Penilaian sesudah instruksi akan menghasilkan informasi tentang seberapa baikkah murid dalam menguasai materi, apakah murid sudah siap untuk pelajaran lanjutan, grade apa yang harus diberikan kepada mereka, komentar apa saja yang harus dikatakan kepada orang tua mereka, dan bagaimana guru harus menyesuaikan instruksi (McMillan, 2001).

3.    Alternatif Assessement (Penilaian Alternatif)
Ada beberapa tren penilaian dewasa ini disamping penilaian tradisional yang sudah banyak diterapkan di sekolah. Salah satu tren penilaian alternatif yakni menuruh murid untuk memecahkan beberapa tipe problem autentik atau menyelesaikan suatu proyek atau mendemonstrasikan beberapa keahlian di luar konteks ujian dan esai (Montgomery, 2001). Tern lainnya adalah menyuruh murid untuk membuat portfolio pembelajaran untuk menunjukkan apa yang telah mereka pelajari (Berryman & Russell, 2001). Penilain alternatif dibutuhkan agar instruksi kompatibel dengan pandangan kontemporer tentang pemebelajaran dan motivasi.
Penilaian alternatif menawarkan pada murid lebih banyak pilihan ketimbang ujian tradisional atau ujian esai. Penilaian alternatif ini juga biasa disebut sebagai penilaian autentik. Penilaian autentik berarti mengevaluasi pengetahuan atau keahlian murid dalam konteks yang mendekati dunia riil atau kehidupan nyata sedekat mungkin (Pokey & Siders, 2001). Aplikasi penilaian autentik dapat tercermin dalam penilaian berbasis kinerja, penilaian portfolio, dan penilaian alternatif lainnya. Namun McMillan (dalam Santrock, 2001) menyatakan tidak semua penilaian berbasis kinerja itu autentik.
Kritik terhadap penilaian autentik menyatakan bahwa penilaian seperti itu tidak selalu baik ketimbang penilaian konvensional, seperti soal pilihan ganda dan esai (Terwilliger, 1997). Kritikus menyatakan pendukung penilaian autentik jarang memberikan data untuk mendukung validitas penilaian autentik. Mereka juga percaya bahwa penilaian autentik tidak bisa menilai pengetahuan dan keahlian dasar secara memadai. (Santrock, 2001).
a.    Penilaian Berbasis Kinerja
Berpindah dari penilaian tradisional dengan tes objektif ke penilaian berbasis kinerja telah dideskripsikan sebagai berpindah dari “mengetahui” ke “menunjukkan” (Burz & Marshall, 1996). Penilaian kinerja mencakup sejumlah bagian kinerja aktual murid (seperti dalam bidang tari, musik, dan pendidikan olahraga), dan juga paper esai, proyek, presentasi oral, eksperimen, dan portofolio (Santrock, 2001:658). Perubahan utama dalam penilaian kinerja adalah diperkenalkannya bentuk penilaian ini ke dalam “area akademik” tradisional (Powell, 2002). Hal itu dikarenakan penilaian berbasis kinerja telah digunakan selama bertahun-tahun pada disiplin ilmu tertentu saja seperti seni, musik, dan pendidikan fisik/olahraga.
1)    Ciri-ciri Penilaian Berbasis Kinerja
Penilaian kinerja mencakup penekanan pada “melakukan” aktivitas terbuka di mana tidak ada jawaban yang benar dan objektif dan penilaian ini bisa menilai pemikiran level tinggi (Santrock, 2001:658). Evaluasi kinerja menggunakan metode evaluasi langsung, penilaian diri, penilaian kinerja kelompok dan individual, serta lebih banyak memakan waktu (Hambleton, 1996).
Jika ujian tradisional menekankan pada apa yang diketahui murid, maka penilaian berbasis kinerja didesain untuk mengevaluasi apa yang diketahui dan dapat dilakukan murid (Maki, 2001; Moon & Callahan, 2001). Di dalam penilaian berbasis kinerja tidak ada jawaban yang benar dan objektif. Misalnya, tidak ada “jawaban benar” saat murid memberikan presentasi di depan kelas, membuat lukisan, melakukan senam/tari, atau mendesain proyek sains.
Banyak penilaian berbasis kinerja memberi banyak kebebasan kepada murid untuk menyusun sendiri jawaban mereka. Walaupun ini menyulikan dalam penilaian, namun hal ini memberi kontens untuk menilai keahlian berpikir level tinggi dari si murid, seperti kemampuan berpikir mendalam tentang suatu isu atau topik. Banyak penilaian berbasis kinerja juga realistis dalam pengertian bersifat autentik, walaupun beberapa diantaranya tidak realistik. Misalnya, membolehkan murid menggunakan kalkulator atau komputer untuk memecahkan soal matematika pada saat ujian merupakan upaya merefleksikan hubungan yang dekat dengan dunia riil, ketimbang melarang murid menggunakan alat bantu tersebut. Pasalnya, ketika murid harus memecahkan masalah matematika di dunia nyata, mereka kemungkinan besar menggunakan kalkulator atau komputer.
Ciri-ciri penilaian berbasis kinerja juga diantaranya menggunakan metode evaluasi langsung, seperti mengevaluasi contoh tulisan untuk menilai kemampuan menulis dan evaluasi presentasi oral untuk menilai kemampuan berbicara. Beberapa penilaian ini juga mensyaratkan murid untuk mengevaluasi kinerja mereka sendiri. Misalnya, murid diminta untuk menilai kualitas dari presentasi oral mereka sendiri, kinerja tari mereka, atau akting drama mereka. Selain menilai individual, beberapa dari penilaian ini juga menilai dan mengevaluasi hasil kelompok. Alat bantu untuk evaluasi mandiri ini dengan menggunakan rubrik, yang didalamnya terdapat kriteria nilai murid berikut penjelasannya seperti sangat baik, baik, tidak cukup baik.
Terakhir, penilaian kinerja mungkin dilakukan dalam periode waktu yang cukup panjang. Berbeda dengan penilain tradisional yang dilakukan dalam satu kerangka waktu saja, semisal guru memberi soal pilihan ganda dan murid diberi waktu satu jam saja untuk menyelesaikannya. Namun sebaliknya, penilaian kinerja sering ditujukan untuk tugas yang memakan waktu beberapa hari, minggu, dan bahkan bulan (Bracken, 2000).

2)    Pedoman Penilaian Berbasis Kinerja
Airasian (dalam Santrock, 2001) membagi 4 tahapan/pedoman yang merupakan isu umum dalam penilaian berbasis kinerja: (1) menentukan tujuan yang jelas; (2) mengidentifikasi kriteria yang dapat diamati; (3) memberi setting yang tepat; dan (4) menilai kinerja.
Tujuan dari penialaian kinerja juga harus jelas seperti memberi nilai/grade, mengevaluasi kemajuan murid, mengenali langkah-langkah penting dalam kinerja, menghasilkan produk yang dapat dimasukkan dalam portfolio pembelajaran, refrensi karya murid untuk pendaftaran ke jenjang pendidikan tinggi atau program lain, dan sebagainya (Santrock, 2001:660).

3)    Kriteria Kinerja
Kriteria kinerja adalah perilaku spesifik yang harus dilakukan murid secara efektif sebagai bagian dari penilaian. Kriteria kinerja akan membantu guru mendeskripsikan apa yang harus dilakukan murid seperti, “Kerjakan presentasi lisan” atau “Selesaikan sebuah proyek sains”. Tanpa kriteria, observasi guru bisa jadi tidak sistematis dan tidak beraturan. Kriteria kinerja harus dikomunikasikan kepada murid pada awal instruksi agar murid mengetahui fokus dari pembelajaran.
Selanjutnya, guru perlu memberi nilai kinerja. Rubrik penilaian menggunakan kriteria yang dipakai untuk menilai kinerja, penilaian kualitas kinerja, nilai yang harus diberikan dan apa maknanya, serta bagaimana tingkat kualitas yang berbeda-beda harus dideskripsikan dan dibedakan dari satu murid ke murid lain (Arter & McTighe, 2001).

4)    Mengevaluasi Penilaian Berbasis Kinerja
Walaupun dukungan pada penilaian berbasis kinerja sangat tinggi di banyak kawasan di AS dan Kanada, namun implementasi efektifnya masih menghadapi kendala (Hambleton dalam Santrock, 2001:664). Dibanding tes objektif, penilaian kinerja sering membutuhkan banyak waktu dalam penyusunannya, pelaksanaannya, dan penilaiannya. Selain itu juga banyak tes kinerja tidak memenuhi standar validitas dan reliabilitas yang ditetapkan oleh kelompok pendidikan.
Walaupun perencanaan, penyusunan, dan penilaian tes kinerja masih sulit, guru harus berusaha keras untuk memasukkan tes kinerja sebagai aspek penting dari pengajaran mereka (Mabry, 1999). Dan tampaknya penilaian berbasis kinerja juga belum sepenuhnya diaplikasikan oleh para guru di sekolah di Indonesia. Hal ini mungkin dikarenakan sumber daya manusia yang belum memadai atau hal lain yang menyangkut penggunaan penilaian berbasis kinerja di sekolah dan perguruan tinggi belum dapat dipraktekkan.

b.    Penialaian Portofolio
Sebuah portofolio adalah sekumpulan hasil kerja yang berguna untuk memberi tahu tentang kemajuan dan prestasi murid (Minzes, Wandersee & Novak, 2001; Weasmer & Woods, 2001). Portofolio lebih dari sekadar kompilasi paper murid yang ditumpuk di map atau kumpulan catatan saja (Haton, 2001).
Santrock menjelaskan, agar bisa disebut portofolio, setiap karya atau hasil kerja harus dibuat dan ditata sedemikian rupa sehingga menunjukkan kemajuan dan mengarah pada satu tujuan. Portofolio dapat mencakup banyak tipe karya, seperti contoh tulisan, entri jurnal, rekaman video, karya seni, komentar guru, poster, wawancara, puisi, hasil ujian, problem solving, penilaian diri dan prestasi-prestasi lainnya.
Penggunaan portofolio secara efektif untuk penilaian membutuhkan:
1)    Penentuan Tujuan Portofolio
Portofolio dapat digunakan untuk tujuan yang berbeda-beda (Lyons, 1999). Dua tipe tujuan umum portofolio adalah mendokumentasikan perkembangan (portofolio perkembangan) dan menunjukkan karya terbaik (portofolio karya terbaik).
Portofolio perkembangan (developmental portfolio) terdiri dari hasil karya/kerja murid dalam kerangka waktu yang panjang (selama satu tahun ajaran atau bahkan lebih lama) untuk menunjukkan kemajuan murid dalam memenuhi target pembelajaran. Portofolio karya terbaik (best-work portfolio) menunjukkan hasil tugas atau karya murid yang paling baik.Portofolio ini berguna untuk pertemuan guru-orang tua, refrensi pendaftaran pendidikan murid ke jenjang yang lebih tinggi atau program lainnya.

2)    Melibatkan Murid
Banyak guru membiarkan murid memilih setidaknya beberapa keputusan tentang isi portofolio (Weasmer & Woods, 2001). Ketika murid diizinkan memilih isi untuk portofolio mereka, cara terbaik adalah mendorong refleksi diri mereka dengan menyuruh menulis deskripsi singkat tentang mengapa mereka memilih suatu tugas (Airasian, 2001).

3)    Me-review Bersama Murid
Menjelaskan kepada murid sejak awal tahun ajaran tentang apa portofolio dan kegunaannya merupakan hal yang penting. Guru juga harus mengadakan beberapa pertemuan guru-murid pada tahun ajaran itu untuk me-review kemajuan murid dan membantu merencanakan tugas selanjutnya untuk dimasukkan dalam portofolio.

4)    Menentukan Kriteria untuk Evaluasi
Kriteria kinerja yang jelas dan sistematis sangat penting dalam rangka menggunakan portofolio secara efektif (Fallon & Watts, 2001; Linn & Gronlund, 2000). Target pembelajaran yang jelas bagi murid akan memudahkan pembuatan kriteria kinerja. Guru harus menentukan pengetahuan dan keahlian apa yang harus dipunyai murid.

5)    Memberi Penilaian
Untuk menilai portofolio dibutuhkan waktu yang cukup. Guru harus mengevaluasi bukan hanya setiap item tetapi juga portofolio secara keseluruhan. Bila tujuan portofolio adalah memberi informasi deskriptif tentang murid untuk guru level selanjutnya, maka portofolio itu tidak perlu diberi nilai atau diringkas. Namun jika tujuannya adalah untuk mendiagnosis, perbaikan, memberi data untuk instruksi yang efektif, memotivasi murid untuk merefleksikan kinerja mereka, atau memberi nilai (grade) kepada murid, maka penilaian dan ringkasan harus dilakukan. Sebagaimana aspek penilaian portofolio lainnya, guru boleh memberi murid kesempatan untuk mengevaluasi dan mengkritik karya mereka sendiri.




Glossary
Inferensi;  kesimpulan yang diambil seseorang dari informasi.
stereotip; klise; citra yang tetap; ciri; klasifikasisebagaibiasaatautipikal
Dependable dapatdipercaya; handal; andal; dapatdiandalkan; reliable
Gender; jeniskelamin
Valid;sah; absah; berlaku
Grade; mutu; tingkatkwalitas; kadar
Penilaian formatif; penilaian selama jalannya pelajaran atau instruksi, bukan setelah pelajaran selesai.
Penilaian sumatif; penilaian setelah instruksi selesai, dengan tujuan mencatat kinerja murid.
Portofolio; sekumpulan hasil karya murid yang sistematis dan terorganisir, yang menunjukkan keahlian dan prestasi murid.
Developmental portfolio; portofolio hasil karya/kerja murid dalam kerangka waktu yang panjang.
Best-work portfolio; portofolio yang menunjukkan hasil tugas/karya murid yang terbaik.



Daftar Pustaka
Santrock W. John (2001). Educational Psychology (edisi terjemahan). Boston: Mc Graw Hill.
Seifert Kelvin &Sutton Rosemary (2009). Education Psychology (second edition). Zurich: The Global Text Project.
Martyn Long (2000). The Psychology of Education. London: RoutledgeFalmer.

Tidak ada komentar:

Posting Komentar