Hva er vurderingskompetanse?

Læreres vurderingskompetanse er sentralt i arbeidet med å utvikle bedre vurderingspraksis. Basert på en rekke FoU-prosjekter har forskere kommet fram til seks viktige dimensjoner i arbeidet.

Ikke en konkret definisjon for vurderingskompetanse

Begrepet vurderingskompetanse er ofte brukt som en norsk oversettelse av begrepet assessment literacy. I boken Vurderingskompetanse i skolen (2016) definerer Fjørtoft og Sandvik begrepet på denne måten: 

Å ha vurderingskompetanse handler om å vite noe om vurdering, å kunne utføre vurdering på en faglig god måte i undervisning, å forstå hvilke kontekster vurdering foregår i og hvordan vurdering kan brukes på gode og mindre gode måter. 

Det er likevel ikke etablert én konkret definisjon for vurderingskompetanse. 

Seks dimensjoner ved vurderingskompetanse

Fjørtoft og Sandvik (2016) peker på at vurderingskompetanse har seks dimensjoner. Hver av disse dimensjonene kan være en mulig inngang for  arbeidet med vurdering for læring på hver enkelt skole. 

Ut fra forståelsen om at vurderingskompetanse blir til i en “forhandling” mellom generelle prinsipper for god vurdering, slik de for eksempel blir beskrevet hos Utdanningsdirektoratet, og “lokale forutsetninger og behov” på hver enkelt skole, kan det være lurt å la lærene vurdere og velge to av de seks dimensjonene for å videreutvikle vurderingskompetansen på egen skole. 

Nedenfor omtaler vi disse seks dimensjonene.

Dimensjon 1: Metoder og praksis i vurdering

Hvilke metoder bruker lærere for å avdekke elevenes kompetanse?

Tre grunnleggende prinsipper er av betydning for arbeidet med vurdering og ikke minst kvalitet i vurdering (Fjørtoft & Sandvik, 2016). Utviklingen av vurderingskompetanse skjer i samspillet mellom disse prinsippene:

  1. Det er behov for en teoretisk modell som sier noe om hvordan elever utvikler sin kompetanse og hvordan denne kompetansen kan komme til syne på ulike måter. Slike teoretiske modeller vil være ulike fra fag til fag. Det betyr at det er legitimt at vurderingskulturen varierer fra fag til fag. 
  2. Elever må gjøre oppgaver og delta i aktiviteter hvor lærere kan observere prestasjon. I faglig relevante situasjoner kan elevene både utvikle og dokumentere sin kompetanse i faget – eller i tverrfaglige prosjekter. 
  3. Lærere må, i det de observerer sine elever, kunne fortolke observasjonen og trekke slutninger om læringsprosess og –utbytte. Denne fortolkningen blir grunnlaget for karakter, respons, tilbakemelding, fremovermelding.

Lærere må beherske et bredt spekter av undervisningsaktiviteter og arbeidsformer og må kunne tolke elevenes deltakelse i disse. Vurdering favner en rekke praksiser i skolen, fra kartleggingsprøver til vurdering for læring. Mangfoldet i praksiser kan bidra med en bredere, mer utfyllende og mer presis forståelse av hva elevene kan enn enkeltstående tester gjør. Lærere trenger derfor kunnskap om forskjellige metoder og praksiser i vurdering. 

Dimensjon 2: Pålitelighet og gyldighet

Reliabilitet og validitet

Disse to begrepene er særlig viktig i tilknytning til punkt tre under dimensjon 1 ovenfor. Lærere må gjøre en fortolkning av kompetansen til elevene som både er pålitelig og gyldig. Begrepene pålitelighet og gyldighet kan bidra med å stille formelle krav til vurdering, og de sier derfor noe om kvaliteten på vurderingen (Fjørtoft, 2016, s. 46)

Begrepet pålitelighet (reliabilitet)

Reliabilitet beskriver hvor konsistente resultatene av en vurdering er. En reliabel vurdering vil kunne gjennomføres flere ganger på ulike individer og grupper og gi samme resultat. 

Eksempler:

Fjørtoft viser i boka Effektiv planlegging og vurdering at trynefaktor er et eksempel med lav reliabilitet. Elever opplever å få forskjellige karakterer fra ulike lærere på grunn av lærerens subjektive oppfatning av eleven (Fjørtoft, 2016, s. 46). 

Et annet eksempel er studenter som klager på et resultat og hopper flere trinn opp eller ned fordi sensor er byttet ut, selv om kriteriene er de samme. Slike tilfeller viser hvor lite inter-reliabilitet det kan være i en samlet gruppe med sensorer på en gitt eksamen. 

Forskning viser at lærerens dømmekraft alene ikke er tilstrekkelig nok for å sikre pålitelig karaktersetting og at det derfor er behov for en form for standardisering eller formalisering av karaktersetting/vurdering. 

I forskningen finnes det en rekke eksempler på hvordan det kan arbeides i skolen for å styrke reliabiliteten. Parkes (2013) for eksempel kommer med følgende forslag til bedret reliabilitet: 

  • Bruk stramt definerte oppgaver
  • Gi detaljerte instruksjoner til elevene
  • Modulér for elevene best practice i utforming av spørsmål og oppgaver
  • Gi retningslinjer for hvordan arbeidet blir vurdert
  • Skap sammen med andre lærere et praksisfellesskap for vurdering

Begrepet gyldighet (validitet)

Validitet handler om hvordan konkrete bevis eller teoretiske begrep støtter tolkningene av et vurderingsresultat. 

Når det kommer til validitet så må vi erkjenne at: 

  1. vurderingen som gjøres av et resultat (for eksempel et elevprodukt) er en tolkning og ikke en objektiv sannhet og 
  2. vi må kunne begrunne tolkningen ut ifra de bevisene vi har tilgjengelig. Handler om hvor fullstendig og sammenhengene begrunnelsen for tolkningen er. 

Validitet er noe vi må argumentere for i lys av våre tolkninger av elevens resultater og i lys av bruken av disse resultatene. Dette er viktig fordi vurdering alltid har et eller flere formål, og fordi vurderingen kan ha store og uforutsette konsekvenser for elever, lærere og andre.

Både reliabilitet og validitet viser til resultatene og tolkningen av resultatene i en vurdering situasjon (en prøve kan ikke være reliabel eller valid i seg selv).

Dimensjon 3: Formativ og summativ vurdering

Underveisvurdering og sluttvurdering er ikke det samme. 

Begrepene formativ og summativ vurdering er mye brukt i internasjonal sammenheng. I norsk sammenheng brukes ofte underveisvurdering og sluttvurdering. Begrepene er delvis overlappende, men gir gjerne en beskrivelse på litt ulike analytiske nivåer. 

La oss begynne internasjonalt: 

I introduksjonen til Handbook of formative assessment defineres summativ og formativ vurdering som to ulike kategorier basert på når de gjennomføres og formålet for gjennomføringen (Ciztek, 2010).

En vurdering kalles summativ hvis den

  1. gjennomføres på slutten av et læringsforløp (for eksempel emneområde, eller semester) og
  2. har som primært formål å kategorisere prestasjonen til en elev eller et system. Dette kalles ofte vurdering av læring. (Ciztek, 2010, s. 3).

En vurdering kalles formativ hvis den

  1. gjennomføres underveis i et læringsforløp
  2. har ett eller flere av de følgende formålene: identifisere en elevs sterke og svake faglige sider, støtte til lærere i planleggingen av den videre undervisningen, støtte til elevene i å regulere sin egen læring, i revideringen av elevarbeid og for å utvikle elevenes evne til å vurdere seg selv, og for å fremme økt autonomi og ansvar for læring hos eleven (Ciztek, 2010, s. 3).

Fjørtoft skriver også: «I norsk sammenheng brukes også underveis- og sluttvurdering. Disse termene sier noe om når vurderingen er gjennomført og ikke formålet med den. De norske begrepene oppfyller med andre ord bare en av to sider ved formativ og summativ vurdering slik begrepen brukes internasjonalt. Underveisvurdering kan med andre ord noen ganger være formativ og andre ganger summativ (Fjørtoft, 2016, s. 43).

Det er også viktig å være klar over at det å se summative og formative vurdering som gjensidig utelukkende kategorier ikke er helt enkelt. For eksempel arbeider elevene sjelden i helt avgrensede arbeidsperioder. 

Enkelte ser derfor forholdet mellom de to begrepene som et spektrum. Black og Wiliam (2009) skriver blant annet: 

en klasseromspraksis er (…) formativ i den grad bevis for elevers læring blir samlet inn, tolket og anvendt av lærereelever og medelever for å ta avgjørelser om de neste stegene i undervisningen. Slike avgjørelser vil sannsynligvis være bedre, eller bedre fundert, enn avgjørelser som blir tatt uten slike bevis. (Black og Wiliam, 2009, s. 9)

Black og Wiliam sier dermed at alle vurderingspraksiser kan ha formative trekk hvis de brukes til å planlegge og utvikle videre undervisning.

For at formative og summative aspekter ved vurdering skal fungere som et helhetlig konsept for undervisning, må det være interaksjon mellom disse elementene. 

Dimensjon 4: Feedback

All tilbakemelding er vurdering 

På norsk blir ofte ordet tilbakemelding brukt i stedet for Feedback. Dette kan være problematisk. Feedback betyr egentlig å bruke informasjon til å endre tilstand. 

Å bruke det norske ordet “tilbakemelding” synonymt med feedback kan i enkelte tilfeller overskygge det kontinuerlige aspektet ved det engelske ordet “feedback” (Fjørtoft, 2016, s. 44). 

Vi skal derfor se litt på begrepet Feedback og hvor det kommer fra i den internasjonale forskningen. (Begrepet er generelt brukt i forskningen til Hattie & Timberley, 2007)

Sadler (1989, 1998) har tre betingelser for at elevene skal ha utbytte av Feedback. Eleven må vite: 

  • Hva kjennetegner god praksis (forståelse for læringsmålene)?
  • Hvordan står elevens prestasjon i forhold til målene?
  • Hva skal eleven gjøre for å minske avstanden mellom sin prestasjon og læringsmålene? 

Disse tre punktene er også vektlagt i en stor gjennomgang av forskning om det å gi feedback. Denne sammenfaller i stor grad med Hattie og Timperley (2007) sine tre spørsmål:

  1. Hvor skal jeg? (feed up)
  2. Hvor er jeg? (feed back)
  3. Hvordan skal jeg gå videre? (feed forward)

Disse spørsmålene forutsetter kommunikasjon mellom lærer og elev i form av en kontinuerlig dialog. 

Vurderingsforskeren Paul Black (2013) beskriver en lærende dialog som en forutsetning for at en læringsaktivitet skal virke formativt. Og denne lærende dialogen kan knyttes opp mot Vygotsky sitt begrep om nærmeste utviklingssone

I denne sonen, som er preget av dialog og prosess, er det plass til elevenes handlinger, valg og kreativitet, samtidig som læringen av henger av møte med den logiske tenkingens strukturer innfor ulike kunnskapsfelt (som lærer eller “den voksne” kan bidra med).  

Vurdering som forholder seg til sosiokulturelle perspektiver på læring og den nærmeste utviklingssonen som begrep vil kunne gi et nyansert bilde av elevens ferdigheter og utviklingspotensial. 

I et slikt lys kan feedback forstås som en kombinasjon av det å se etter bevis for læring og det å kommunisere med eleven i den dialogen som føres om læringens prosess og resultat.

Gamlem og Smith (2013) finner at elevene ikke alltid opplever feedback som verdifullt. Noen påpeker at de opplever at de bare skal gi og få “snille kommentarer” som ikke hjelper dem å bli bedre i faget. Derfor er det viktig at lærere hjelper elevene med å utvikle feedbackferdigheter.

Lærere bør trekke elevene inn i prosessen med å diskutere feedback, slik kan læreren få bedre innblikk i elevenes preferanser, behov og evne til å delta i produktive dialoger om læring og utvikling. 

Dimensjon 5: Læringsmål og kriterier

Elevene kan involveres i arbeid med kjennetegn og kriterier

Den femte dimensjonen handler om hvordan lærere bedre kan gi elevene forståelse av hva de skal lære og hvordan de vil bli vurdert. Denne delen har også en åpning for at elevene kan medvirke i prosessen med å sette målene og hvordan de skal vurderes i arbeidet med faget. 

Gjennom mål og kriterier kommuniserer vi til elevene hva vi ønsker at de skal vite noe om, kunne gjøre eller forstå (Fjørtoft, 2016).

Tydelige mål og kriterier kan bidra til en mer transparent læringsprosess for både lærere og elever. 

Vurderingskriterier kan brukes av læreren for å gi informasjon til elevene om hva de har oppnådd og hva de trenger å forbedre. I tillegg gir de et rammeverk for elevens egenvurdering og planlegging av kommende arbeidsoppgaver. 

Elevene utvikler sin vurderingskompetanse ved å anvende kriterier på eget og medelevers arbeid. 

Når lærere og elever kan samles om en felles forståelse som grunnlags for vurdering kalles det et tolkningsfellesskap. Derfor er det viktig at vurdering også oppleves som meningsfylt for elevene. 

Arbeidet med å formulere og synliggjøre mål og kriterier kan være krevende, men det kan også bidra til å utvikle et felles begrepsapparat og en felles vurderingskultur. 

Dimensjon 6: Styring, ledelse og ansvar

Formelle regler og forhold utenfor skolen påvirker vurderingen

Denne dimensjonen skiller seg noe fra de andre. Den handler om hvordan ledelsen på skolen, og også skoleeier og nasjonale myndigheter, arbeider med å lede profesjonsfellesskapet. 

I dette perspektivet er det en rekke begreper det er interessant å se nærmere på. Her har vi bare valgt ut to, før vi viser til en modell som samler ulike sider ved vurderingskompetanse.

Washback – hvordan vurdering virker tilbake på undervisning og læring. 

Et eksempel på dette er når informasjon om innholdet i en vurdering påvirker hvordan elevene organiserer og prioriterer i arbeidet sitt frem mot vurdering.

Accountability – skolepolitisk og organisasjonsteoretisk begrep. Dette dreier seg om ansvarliggjøring av skolen som virksomhet, for eksempel viktigheten av å delta i kunnskapsbasert dialog og stå til ansvar for yrkesutøvelsen. 

Et eksempel på dette er nasjonale tester som grunnlag for sammenligning av skoler og lærere med utgangspunkt i elevers prestasjoner. Resultater fra slike tester må tolkes med omhu om de skal bidra positivt.

Vurderingskompetanse i praksis - et sammensatt fenomen

Vurderingskompetanse er et sammensatt konsept. 

Xu og Brown (2016) har gjort et forsøk på å samle de ulike aspektene ved begrepet i en modell som skal gi en mer enhetlig beskrivelse av begrepet og vise hvordan lærere i praksisfeltet kontinuerlig kan utvikle sin vurderingskompetanse.

En modell for vurderingskompetanse

 Modellen har seks bestanddeler: 

  1. Kunnskapsgrunnlag 
  2. Læreres forståelse av vurdering. 
  3. Institusjonelle og sosiokulturelle kontekster (makro og mikro) 
  4. Læreres vurderingskompetanse i praksis 
  5. Lærernes læring 
  6. Lærernes identitet som vurderer rekonstrueres

Pyramideformet modell av læreres vurderingskompetanse

(Xu og Brown, 2016, s. 155-156). Model av vurderingskompetanse (Xu og Brown, 2016; norsk oversettelse ved Fjørtoft og Sandvik, 2016) 

Modellen illustrerer de ulike bestanddelene som utgjør grunnlaget for forståelse og handling i vurderingssammenhenger, hvordan dette kunnskapsgrunnlaget kan deles inn i nivå og hvordan ulike kontekster bidrar til kontinuerlig utvikling av den enkelte lærers forståelse. 

Modellen er også syklisk. Endringer i en bestanddel er avhengig av endringer i en annen. En endringsflyt går fra bunnen til toppen (fra kunnskapsgrunnlaget til konstruksjonen av lærerens identitet som vurderer). 

Samtidig “sildrer” for eksempel kontekstuelle praksiserfaringer fra toppen til bunnen og gir ny kunnskap til kunnskapsgrunnlaget (Xu og Brown, 2016, s. 159)

Modellen er kompleks, men den viser at alle lærere får bedre forståelse for vurdering gjennom visse aktiviteter: 

kontinuerlig refleksjon over egen vurderingspraksis, deltakelse i felles skoleutviklingsaktiviteter om vurdering og i profesjonelle samtaler om vurdering samt gjennom en søken etter ressurser som kan fornye forståelsen av vurdering og av lærernes rolle som vurderer. (Fjørtoft og Sandvik, 2016, s. 36). 

Andre dimensjoner ved vurdering

Andre har vektlagt vurderingens sosiale dimensjoner og konsekvenser. Dette innebærer blant annet bevissthet rundt mulige negative ringvirkninger av vurdering. 
Noen har også påpekt at også elever trenger vurderingskompetanse i forbindelse med egenvurdering og medelevvurdering.  

Vurderingskompetanse finnes ikke bare hos hver enkelt lærer, men også i skolenes læringsmiljø. Vurdering gjøres ikke i et vakuum, og derfor vil innholdet i begrepet vurderingskompetanse variere med kontekst og faktorer som hva og hvem som skal vurderes. Vurderingskompetanse vil derfor alltid innebære en forhandling mellom generelle prinsipper på den ene siden og lokale forutsetninger og behov på den andre (Fjørtoft og Sandvik, 2016, s. 22).

Forskjellige skolekulturer stiller ulike forventninger til læreres vurderingskompetanse.
Videre vil ulike aktører ha ulike kunnskapsbehov innenfor vurderingsfeltet.

Vurderingskompetanse i norsk skolepolitikk. 

I Norge har Utdanningsdirektoratet definert vurderingskompetanse på denne måten:

Vurderingskompetanse forstås som bruk av metoder, vurderingsformer og vurderingsresultater, utvikling av et fagspråk om vurdering og som sammenheng mellom mål og vurdering. Å utvikle vurderingskompetanse innebærer også å etablere en vurderingskultur med fokus på elevenes og lærlingenes læring, med rom for å prøve og feile og for å gi hverandre konstruktive tilbakemeldinger. 
(Fjørtoft og Sandvik, 2016, s. 21).

Fjørtoft og Sandvik påpeker at denne definisjonen legger vekt på hvilke metoder som tas i bruk og lærer sin evne til å se sammenheng mellom målene for læring, bruke vurderingsverktøy som støtter eleven i læringen og som bidrar til å etablere en konstruktiv og læringsfremmende kultur. 

Mer om vurderingsforskning

Ulike forskere peker på ulike aspekter ved hvilken kunnskap en lærer må ha for å være “god i vurdering”. Fjørtoft og Sandvik trekker særlig frem to anerkjente forskere som legger vekt på litt ulike sider ved denne kompetansen: 

Stiggings

I følge Stiggins (1995) har lærere med høy vurderingskompetanse:
•    Et klart definert formål for vurderingen
•    Dyp forståelse for innholdet i og sammenhengen mellom læringsmål
•    Evne til å velge passende vurderingsmetode
•    Kunnskap om innsamling av data om elevenes læringsutbytte
•    Bevissthet om mulige feilkilder og fordommer (bias) i vurdering

Popham

I følge Popham (2009a) har legger lærere med vurderingskompetanse vekt på: 
•    Formålet med vurderingen
•    Pålitelighet (reliabilitet) og gyldighet (validitet)
•    Fordommer (bias)
•    Utvikling av flervalgstester og lignende oppgaveformer
•    Retting av elevbesvarelser
•    Utvikling av mappevurdering og metoder for å dokumentere for eksempel kunstneriske prestasjoner
•    Utvikle læringsstøttende (formative) vurderingspraksiser
•    Innsamling og tolkning av bevis for elevers sosiale og holdningsmessige læring
•    Tolkning av større standardiserte datasett om elevers læring
•    Vurdering av minoritetsspråklige elever og andre med spesielle utfordringer
•    Kunnskap om hvordan elever bør forberedes til prøver og eksamen
•    Kunnskap om sammenhengen mellom undervisningskvalitet og vurderingsresultater

 

Kilder

Black, P. (2013). Formative and Summative Aspects of Assessment: Theoretical and Research Foundations in the Context of Pedagogy. I H.H. MacMillan (red.), SAGE Handbook of Research on Classroom Assessment (s. 167-178). Los Angles: SAGE Publications

Black, P. og William, D. (2009). Developing the the Theory of Formative Assessment. Educational Assessment, Evaluation and Accountability, (21(1), s. 5-23

Cizek, G.J. (2010). An Introduction to Formative assessment. I H.L: Andrade og G.J: Cizek (red.), Handbook of Formative Assessment (s. 3-17). New York: Routledge.

Fjørtoft, H. (2016) Effektiv Planlegging og vurdering: Læring med mål og kriterier i skolen (2. utg). Bergen: Fagbokforlaget

Fjørtoft, H. og Sandvik, L. V. (2016). Innledning. Vurdering og Vurderingskompetanse. I: Fjørtoft og Sandvik (red.), Vurderingskompetanse i skolen: praksis, læring og utvikling (s. 17 – 41)Oslo: Universitetsforlaget

Gamlem, S.M., & Smith, K. (2013). Student perceptions of classroom feedback. Assessment in Education: Principles, Policy & Practice, 20(2), s. 150-169.

Hattie, J. og Timperley, H. (2007). The Power of Feedback. Review of Educational Research, 77, s. 81-112

Parks, J. (2013). Reliability in Classroom Assessment. I J.H. McMillan (red), SAGE Handbook of Research on Classroom Assessment. Los Angeles: SAGE Publications.

Popham, W.J. (2009a). Assessment Literacy for Teachers: Faddish or Fundamental? Theory into Practice, 48(1), s. 4-11. Hhtp://doi.org/10.1080/00405840802577536

Sadler, R. (1989). Formative Assessment and the Design of Instructional Systems. Instructional Science, 18, 119-144.

Sadler, R. (1998). Formative Assessment Revisiting the Territory. Assessment in Education: Principles, Policy & Practice, 5(1), s. 77-84.

Stiggins (1995). Assessment Literacy for the 21st century. Phi Delta Kappan, 77(3)

Xu, Y. og Brown, G.T.L (2016). Teacher Assessment Literacy in Practice: A Reconceptualization. Teaching and Teacher Education, 58, s. 149-162. http://doi:org/10.1016/j.tate.2016.05.010.

Av Øystein Gilje, professor og Åslaug Bjerke, forskningsassistent
Publisert 6. juli 2021 10:39 - Sist endret 23. sep. 2021 12:58