Constructie van een gestandaardiseerde test: 4 stappen

Dit artikel werpt licht op de vier hoofdstappen die betrokken zijn bij de constructie van een gestandaardiseerde test. De stappen zijn: 1. Planning 2. De test voorbereiden 3. De test uitproberen 4. De test evalueren.

Stap # 1. Planning:

"Testplanning omvat alle verschillende bewerkingen die de tests opleveren. Het omvat niet alleen de werking van een overzicht of een tabel die de inhoud of opties vermeldt die door de test moeten worden gedekt, maar het moet ook een zorgvuldige aandacht zijn voor itemmoeilijkheden, soorten items, richting van de onderzoeker, enz. " (Lindquist )

Voor gestandaardiseerde tests is een systematische en bevredigende planning noodzakelijk. Naar de mening van Ross: "Goede testen gebeuren niet alleen, noch zijn ze het resultaat van een paar momenten van hoge inspiratie en verhoging."

Het is de constructeur van de test die in ieder geval verantwoordelijk is om zijn testonderdelen goed vorm te geven en die de test met alle zorgen en oprechtheid construeert.

Het omvat de volgende activiteiten:

1. Opstellen van de doelstellingen.

2. Bepaling van de weging voor verschillende instructiedoelen.

3. Bepaling van de weging naar verschillende inhoudsgebieden.

4. Bepalen welke itemtypen moeten worden opgenomen.

5. Voorbereiding van de specificatietabel - Blue Print.

6. Beslissen over de mechanische aspecten zoals tijdsduur, testgrootte, totaal aantal markeringen, afdrukken, lettergrootte etc.

7. Instructies geven voor het scoren van de toets en de bijbehorende beheerprocedure.

8. De hoogte van de verschillende moeilijkheidsniveaus van de vragen moet worden vastgesteld.

(De in de punten 1 tot en met 5 gespecificeerde activiteiten behoeven nadere toelichting)

1. Opstellen van de doelstellingen / doelen:

Vóór de constructie van de test is het noodzakelijk dat de objecten zijn geformuleerd. Er moet aandacht worden besteed aan de testcapaciteit om efficiënt te meten in hoeverre de doelstellingen van het onderwijs zijn bereikt. De doelstellingen van het onderwijs kunnen op vele manieren worden geclassificeerd. Maar wat ook de classificatie mag zijn, het curriculum moet de veranderingen in het kind tot stand brengen die worden beoogd door middel van doelstellingen.

De toets moet zo worden geformuleerd dat deze kan aangeven in hoeverre de doelstellingen, om veranderingen in het gedrag van het kind aan te brengen, zijn bereikt door het curriculum dat hen is geleerd.

De aandacht moet ook worden gericht op het doel waarvoor de test moet worden uitgevoerd. Als de test is geconstrueerd om de studenten te classificeren, dan moet in de constructie aandacht worden besteed aan de mogelijkheid van classificatie. Maar als het doel ervan diagnostisch is, dan zou het zo geconstrueerd moeten zijn dat het de individuele moeilijkheden van de studenten kan diagnosticeren.

2. Bepaling van het gewicht van verschillende educatieve doelstellingen:

De belangrijkste stap bij het plannen van een test is het identificeren van de instructiedoelen. Elk onderwerp heeft een andere reeks educatieve doelstellingen. In de vakken wetenschappen, sociale wetenschappen en wiskunde worden de belangrijkste doelstellingen gecategoriseerd als kennis, begrip, toepassing en vaardigheid, terwijl in talen de belangrijkste doelstellingen worden gecategoriseerd als kennis, begrip en expressie.

Kennisdoelstelling wordt beschouwd als het laagste niveau van leren, terwijl begrip, toepassing van kennis in de wetenschap of gedragswetenschappen als een hoger niveau van leren worden beschouwd.

3. Bepaling van het gewicht naar verschillende inhoudsgebieden:

De belangrijkste activiteit bij het opstellen van een prestatietest is het specificeren van een overzicht van het inhoudsgebied. Het geeft het gebied aan waarin van de studenten wordt verwacht dat ze hun prestaties laten zien. Het helpt om een representatief voorbeeld van het hele inhoudsgebied te verkrijgen.

Het voorkomt ook herhaling of weglating van een eenheid. Nu rijst de vraag hoeveel gewicht moet worden gegeven aan welke eenheid. Sommige deskundigen zeggen dat de docent het belang van het hoofdstuk in gedachten moet houden.

Anderen zeggen dat het moet worden bepaald aan de hand van het onderwerp van het onderwerp in het handboek. Over het algemeen wordt besloten op basis van de pagina's van het onderwerp, de totale pagina's in het boek en het aantal items dat moet worden voorbereid.

4. Bepaling van de itemtypes:

Onderdelen die in de testconstructie worden gebruikt, kunnen grofweg worden onderverdeeld in twee typen, zoals items van het objectieve type en artikelen van het type essay. Voor sommige educatieve doeleinden zijn de items van het objectieve type het meest efficiënt, terwijl voor anderen de essayvragen bevredigend zijn.

Passende itemtypen moeten worden geselecteerd op basis van de te meten leerresultaten. Als het resultaat bijvoorbeeld wordt geschreven, zijn artikelen van het type levering nuttig.

Als het resultaat een juiste antwoordselectietypen identificeert of items van het herkenningstype nuttig zijn. Dus, het moet in deze fase worden besloten en gepland.

LA = lang antwoord

SA = Kort antwoord

VSA = Zeer kort antwoord

5. Voorbereiding van de "BLAUWDRUK" of driedimensionale grafiek:

De blauwdruk of specificatietabel voorbereiden in driedimensionale kaartinhoud, doelstelling en type items, met vermelding van het aantal items in elke cel of compartiment. Het is gewoon een lijstwerk dat een duidelijk beeld geeft van het ontwerp van de test en dat als leidraad dient.

De drie dimensies van de blauwdruk bestaan uit inhoudsgebieden in horizontale rijen en doelen en vormen van vragen in verticale kolommen. Zodra de blauwdruk is voorbereid, kan de papierzetter de items schrijven / selecteren en het vragenpapier voorbereiden.

Hieronder ziet u een voorbeeld van de blauwdruk:

Notitie:

Plaats het aantal vragen tussen haakjes en de cijfers buiten de haakjes.

E = Vraagstuktype-vraag, SA = Kort antwoordtype, VS A = Zeer kort antwoord.

Stap # 2. De test voorbereiden:

De volgende stap na de afronding van de blauwdruk is het schrijven van passende vragen in overeenstemming met de brede parameters uiteengezet in de blauwdruk. Men zou één klein blok van de blauwdruk per keer moeten nemen en de vereiste vragen moeten opschrijven.

Dus, voor elk blok van blauwdruk dat is ingevuld, moeten vragen één voor één worden geschreven. Zodra dit is gebeurd, hebben we alle vragen die voldoen aan de vereisten die in de blauwdruk zijn vastgelegd.

Gestandaardiseerd testen van de test vereist alle soorten zorgen en overwegingen. Er moet voldoende tijd worden besteed aan het nadenken over de weging van de inhoud en de te behandelen gebieden.

In deze stap bespreken we de specifieke regels voor het samenstellen van verschillende soorten testitems.

In deze fase moeten we voorbereiden:

(i) De testitems.

(ii) De aanwijzingen om items te testen.

(iii) De aanwijzingen voor toediening.

(iv) De aanwijzingen voor scoren.

(v) Een diagram met vraagsgewijze analyse.

(i) Voorbereiding van testitems:

Voorbereiding van testitems is de belangrijkste taak in de voorbereidingsstap. Daarom moet er voorzichtig mee worden omgegaan met het voorbereiden van een testitem. Constructie van testitems is niet zo eenvoudig. Het is de taak van testspecialisten en experts. Een ervaren docent die voldoende is getraind in testconstructie kan geschikte testitems voorbereiden.

Er zijn bepaalde regels en richtlijnen voor de constructie van testitems. Hiervoor moet men toegang hebben tot al deze richtlijnen en ook toegang hebben tot de taxonomie van doelstellingen. Over het algemeen moeten de testitems duidelijk en volledig zijn en mogen ze niet dubbelzinnig zijn.

De taal van de items moet zo worden gekozen dat de inhoud en niet de vorm van de items het antwoord bepaalt. De items met verborgen betekenissen mogen niet worden opgenomen. De verklaring van de items mag niet zomaar uit de boeken worden gehaald. Alle items van een bepaald type moeten bij elkaar worden geplaatst.

Het vocabulaire dat in de items wordt gebruikt, moet eenvoudig genoeg zijn om door iedereen te worden begrepen. Een regelmatige volgorde in het patroon van correcte responsen moet worden vermeden. Er kunnen meer dan één type testitems in de test zijn.

De test moet met tussenpozen worden onderworpen aan een kritische revisie. Vaak zal het wenselijk zijn dat in de test meer items worden opgenomen dan het aantal dat daadwerkelijk nodig is. In de voorontwerpen is het beter om het dubbele aantal items op te nemen dat nodig is.

Bij de constructie van de testitems mogen alleen die items niet worden opgenomen die het geheugen of de herkenning benadrukken. De items moeten zo worden gekozen dat de studenten de gewoonte leren om hun kennis te correleren met hun echte leven.

Nadat de testitems zijn ingekaderd, moeten ze correct worden gerangschikt en tot een test worden samengevoegd. Als verschillende vormen van testitems worden gebruikt, moeten deze bij voorkeur worden gegroepeerd. Bovendien krijgen eenvoudige items een plaats in het begin, de items met gemiddelde moeilijkheidsgraad in het midden en moeilijke items aan het einde.

De testitems kunnen worden gerangschikt in de volgorde van de verwachte moeilijkheidsgraad. Natuurlijk zijn er verschillende manieren om de vragen samen te stellen en we kunnen de vragen samenstellen die passen bij ons doel en het gemak van interpretatie.

(ii) Voorbereiding van richting om voorwerpen te testen:

Dit is het meest verwaarloosde aspect van de testconstructie. Over het algemeen besteedt iedereen aandacht aan de constructie van testitems. Dus de testfabrikanten voegen geen aanwijzingen bij met de testitems. Maar de validiteit en betrouwbaarheid van de testitems hangt in grote mate af van de instructies voor de test.

NE Gronlund heeft gesuggereerd dat de testfabrikant duidelijke richtlijnen moet geven over:

1. Het doel van testen.

2. De toegestane tijd voor het beantwoorden.

3. De basis van antwoorden.

4. De procedure voor het opnemen van antwoorden.

5. De methoden om met gokken om te gaan.

Soms zijn de aanwijzingen om voorwerpen te testen zo dubbelzinnig dat het kind ze niet kan volgen en reageert hij als zodanig op de items op een manier die hij op dat moment geschikt acht of geeft hij het volgende item gewoon door, zodat het onbeantwoord blijft.

Door een gebrek aan duidelijkheid van aanwijzingen zal het kind op verschillende tijdstippen anders reageren, wat de betrouwbaarheid van de test zou verminderen.

(iii) Voorbereiding van aanwijzingen voor toediening:

Er moet een duidelijke en gedetailleerde richting worden gegeven over hoe de test moet worden toegediend. De omstandigheden waaronder de test moet worden afgenomen, wanneer de test moet worden afgenomen (in het midden van de sessie of aan het einde van de sessie, enz.), Binnen welke termijn deze moet worden toegediend, enz. Zijn duidelijk worden vermeld.

Als de test aparte secties heeft, moeten de tijdslimieten voor elke sectie worden vermeld. De benodigde materialen (indien aanwezig) voor de test zoals grafiekpapier, logaritmetabellen enz. Moeten worden vermeld.

In de aanwijzingen moet duidelijk worden aangegeven welke voorzorgsmaatregelen de beheerder op het moment van toediening moet nemen. Er moet dus een juiste en duidelijke richting voor testadministratie worden opgesteld.

(iv) Voorbereiding van de richting voor scoren:

Om objectiviteit bij het scoren mogelijk te maken, moeten 'scoretoetsen' worden gegeven. Scoresleutel is een voorbereide lijst met antwoorden op een gegeven reeks objecttypevragen. Een scoringssleutel wordt opgesteld door serieel de sleutel (of het juiste antwoord) voor elke vraag op te nemen tegen elk item.

Voor vragen van het korte antwoordtype en essay-type vragen moeten markeringsschema's worden voorbereid. Dergelijke scoretoetsen en markeringsschema's moeten zorgvuldig worden voorbereid. Ze helpen als gids bij het scoren van de test en ze zorgen voor objectiviteit bij het scoren.

(v) Voorbereiding van een vraagsgewijze analysetabel:

Een vragend analyseschema kan worden opgesteld waarin elke vraag wordt geanalyseerd. Deze grafiek toont het inhoudsgebied dat de vraag omvat, het doel (met specificatie) dat het van plan is te meten, het type, toegewezen punten, verwachte moeilijkheidsgraad en de tijd die nodig is om het te beantwoorden.

Deze grafiek analyseert niet alleen de items, maar geeft ons ook een beeld van de inhoud, doelen, soort vraag en een bereik van verschillende moeilijkheidsniveaus enz. Bovendien geeft dit ons enig idee over de totale tijd die moet worden genomen voor het nemen van de test. Deze grafiek helpt ons om te controleren of de test volgens de blauwdruk is voorbereid of niet.

Stap # 3. Het uit de test halen:

Aangezien de test wordt voorbereid door een groep personen en experts, kan deze niet geheel foutvrij zijn. Daarom vereist alle standaardisatie de voorbereiding van een testvorm van de test en het testen ervan op een steekproefpopulatie.

De doeleinden van het uitproberen zijn als volgt:

1. Om de defecte of dubbelzinnige items te identificeren.

2. Om de zwakte in het mechanisme van testadministratie te ontdekken.

3. Om de niet-functionerende of ongeloofwaardige afleiders te identificeren in het geval van meerkeuzetests.

4. Gegevens verschaffen voor het bepalen van de moeilijkheidsgraad van items.

5. Gegevens verschaffen voor het bepalen van de discriminerende waarde van de artikelen.

6. Om het aantal items te bepalen dat moet worden opgenomen in de definitieve vorm van de test.

7. Om de tijdslimiet voor het definitieve formulier te bepalen.

Het belangrijkste doel van het uitproberen is om de goede items te selecteren en de slechte items te weigeren.

De try-out verloopt in drie fasen:

1. Voorbereidende test.

2. Juiste try-out.

3. Laatste try-out.

1. Preliminary Tryout:

Voorafgaande try-out wordt individueel gedaan om de taalproblemen en ambiguïteit van de items te verbeteren en aan te passen. Deze try-out wordt gedaan op 10 of 15 personen. De verwerkbaarheid van de items wordt geobserveerd. Op basis van observatie en individuele reacties kunnen de items tegelijkertijd worden verbeterd en gewijzigd. De initiële diepgang wordt dus voorbereid en wordt geprint of cyclostyled voor de juiste try out of groep try-out.

2. De juiste try-out:

De juiste try-out wordt gedaan op een groep van ten minste 40 studenten / individuen. Het doel is om goede items te selecteren voor de test en om slechte items te weigeren.

Deze stap bevat de volgende activiteiten:

(A) Itemanalyse.

(B) Final draft van de test voorbereiden.

(A) Itemanalyse:

Een test moet niet te gemakkelijk en niet te moeilijk zijn; en elk item zou de validiteit van de hoog en laag presterende studenten moeten discrimineren. De procedure die wordt gebruikt om de kwaliteit van een artikel te beoordelen, wordt itemanalyse genoemd.

De procedure voor artikelanalyse volgt de volgende stappen:

1. De testpapieren moeten worden ingedeeld van de hoogste tot laagste score.

2. Selecteer 27% testpapier van de hoogste en 27% vanaf het laagste uiteinde. Als de test bijvoorbeeld wordt afgenomen op 120 studenten, selecteert u 32 testpapieren van het hoogste end en 32 testpapieren vanaf het laagste uiteinde.

3. Houd de andere testpapieren opzij, omdat deze niet vereist zijn in de artikelanalyse.

4. Tabuleer het aantal leerlingen in de bovenste en onderste groep die elk alternatief voor elk testitem hebben geselecteerd. Dit kan worden gedaan op de achterkant van het testpapier of een afzonderlijke testitemkaart kan worden gebruikt zoals weergegeven in tabel (14.1).

Zoals we weten, hangt de kwaliteit of verdienste van een test af van de individuele items waaruit het bestaat. Dus, alleen die items die geschikt zijn voor ons doel moeten worden bewaard. Artikelanalyse is een integraal onderdeel van de betrouwbaarheid en validiteit van een test.

De waarde van een item wordt beoordeeld vanuit drie belangrijke invalshoeken:

(i) Moeilijkheidsindex van het artikel,

(ii) Discriminerende kracht van het item,

(iii) Effectiviteit van afleiders.

Een hypothetische illustratie:

Als een test wordt afgenomen op 120 studenten, is 27% van de proefschriften van het hoogste punt 32 en 27% van de testbladen van het laagste eind is 32.

(i) Moeilijkheidsgraad van het item / Item moeilijkheid:

Moeilijkheidsindex van het artikel is een belangrijk onderdeel van de testconstructie. Als een bepaald item te gemakkelijk is, beantwoorden alle studenten het. Als alle leerlingen gelijke scores krijgen, is het doel van de test gewoon verslagen. Als een item niet door een testee kan worden beantwoord, is het item te moeilijk of verkeerd geconstrueerd. Wat is het nut van dergelijke items in een test? Het is dus duidelijk dat te gemakkelijke en te moeilijke items volledig moeten worden weggegooid.

Het is wenselijk dat artikelen met een gemiddelde moeilijkheidsgraad in een test moeten worden opgenomen. Bij de analyse tijdens de testfase houden de testers over het algemeen items vast in het bereik van 16% tot 84% moeilijkheidsgraad.

Item moeilijkheid (ID) wordt berekend met behulp van de formule.

ID = R / NX 100

waarbij R = Aantal testees dat correct antwoordt.

N = Totaal aantal testees dat het item heeft geprobeerd.

In ons voorbeeld van de 64 studenten van zowel de bovenste als de onderste groep hebben 40 studenten het item correct beantwoord en 60 studenten hebben het item geprobeerd. Dan wordt de item moeilijkheid als berekend

Item Moeilijkheid = 40/60 x 100 = 66, 67

Aangezien het gebruikelijk is om een regel van 16% tot 84% te volgen om de item-moeilijkheidsgraad te overwegen, valt onze berekende ID binnen dat bereik. Vandaar dat het item de juiste moeilijkheidsgraad heeft. Het betekent dat als een item een ID heeft van meer dan 84%, het een te gemakkelijk item is, als het minder dan 16% is, dan is het item een te moeilijk item.

(ii) Discriminerende kracht van het item:

De discriminerende macht (dwz de geldigheidsindex) van een item verwijst naar de mate waarin een bepaald item discrimineert bij studenten die sterk verschillen in de functie (s) gemeten door de test als geheel.

Een schatting van de discriminatie-index van een artikel kan worden verkregen met de formule:

waar

RU = Aantal juiste antwoorden van de bovenste groep.

RL = Aantal juiste reacties van de onderste groep.

N = Totaal aantal leerlingen dat ze heeft geprobeerd.

In ons voorbeeld hebben 30 leerlingen uit de bovenste groep het item correct beantwoord en 10 van de onderste groep hebben het item correct beantwoord.

Dus R _U = 30, R _L = 10 en N = 60

Discriminerende index = (30 - 10) / (60/2) = 20 / 30.67

Een discriminatie-index wordt meestal uitgedrukt als een decimaal. Als het een positieve waarde heeft, heeft het item een positieve discriminatie. Dit betekent dat een groter deel van de meer deskundige studenten dan arme studenten het item correct hebben ontvangen. Als de waarde nul is, heeft het item geen discriminatie.

Dit kan gebeuren:

ik. Omdat het item te gemakkelijk of te moeilijk is; of

ii. Omdat het dubbelzinnig is.

Als meer slechte studenten dan goede studenten het item correct krijgen, zou er een negatieve discriminatie ontstaan. Met een klein aantal studenten kan dit een toevalsresultaat zijn; maar dit kan erop duiden dat het item dubbelzinnig is of verkeerd is gecodeerd.

Het item met nul of negatieve discriminatie-index moet worden weggegooid of herzien. In het algemeen geldt hoe hoger de discriminatie-index, hoe beter het item.

(iii) Doeltreffendheid van Distractors:

Een afleider wordt als een goede afleider beschouwd wanneer hij meer leerlingen uit de lagere groep trekt dan de bovenste groep.

Voorbeeld:

Stel dat er in totaal 40 antwoordboeken zijn (zowel in boven- als ondergroep, 20 in elk).

Hieronder wordt een hypothetische illustratie gegeven, waarbij asterisk het juiste antwoord aangeeft:

In de illustratie zijn de alternatieven A en C effectief in die zin dat ze meer studenten uit de lagere groep aantrekken dan uit de bovenste groep. Maar alternatief D is een slechte afleider omdat het niemand aantrekt en daarom nutteloos is. Het item heeft alleen voor opties en de kansen op succes door louter raden worden verbeterd. Alternatief E is ook arm omdat het een groter deel van het goede trekt dan van slechte studenten.

De itemschrijver moet zich afvragen:

"Waarom waren de lichtere studenten aangetrokken tot E? Was het vanwege ambiguïteit? Was het omdat er twee even correcte antwoorden waren? "Kortom, dit item zou moeten worden herzien door de alternatieven D en E.

(B) Eindresultaat van de test voorbereiden:

Na itemanalyse worden alleen goede items met de juiste moeilijkheidsgraad en met voldoende onderscheidend vermogen bewaard en deze items vormen de laatste test. Daarom worden goede items geselecteerd uit het grote aantal items.

Sommige ervan kunnen worden aangepast en het gewenste aantal items wordt geselecteerd voor de definitieve trekking volgens de blauwdruk. Items worden gerangschikt in volgorde van moeilijkheid in de definitieve trekking. De tijd die nodig is voor de test wordt bepaald. Nu wordt de test toegediend aan een groot representatief monster en worden de testpapieren gescoord.

3. Laatste try-out:

Laatste try-out wordt gedaan op een grote steekproef van ongeveer 400 personen voor het schatten van de betrouwbaarheid en validiteit van de test. Het doel ervan is om ook de duur van de test te bepalen. Het doel van deze test is om de defecten en tekortkomingen van testitems te identificeren. Tijdens de artikelanalyse worden te gemakkelijke en te moeilijke items weggegooid. Alleen items met gemiddelde moeilijkheidsgraad worden opgenomen of behouden.

Bijna alle voorzorgsmaatregelen in de try-out moeten worden genomen tijdens het afnemen van de laatste test. Voltooid antwoordblad moet worden gescoord met behulp van scoresleutel en de scores worden getabelleerd om het een statistische behandeling te geven.

Stap # 4. Evaluatie van de test:

Standaardisatie en evaluatie van de test gebeurt op de volgende manier:

1. De definitieve vorm van de test wordt afgedrukt. Het antwoordblad wordt ook afgedrukt.

2. De tijd die nodig is voor de test wordt bepaald door bij het beantwoorden van de test gemiddeld drie leerlingen de tijd te nemen. De leerlingen die voor dit doel zijn geselecteerd, vertegenwoordigen drie groepen: helder, gemiddeld en onder het gemiddelde.

3. Instructie voor de personen die de test zullen uitvoeren, wordt voorbereid en afgedrukt.

4. De scores zijn getabelleerd en verschillende maten van centrale tendensen, mediaan en modus, en variatiemaatstaven - standaardafwijking, kwartielafwijking, enz., Zijn uitgevonden.

De scores worden geplot op een grafiekblad om de normaliteit van de verdeling te vergelijken en te tekenen en te geven om verschillende percentielscores te krijgen. Afgeleide scores zoals T-score en Z-score enz. Worden geschat.

Normen zoals leeftijdsnormen, klassennormen, geslachtsnormen, landelijke-stedelijke normen, enz., Worden berekend volgens de vereiste.

5. De validiteit van de testscores wordt geschat door de testscores te correleren met een ander criterium. De constructvaliditeit kan worden bepaald door factoranalyse. Verschillende methoden voor het bepalen van de geldigheid zijn besproken in een afzonderlijke eenheid.

6. Bij het evalueren van nieuw geconstrueerde testen wordt ook de betrouwbaarheid geschat. In het geval van twee parallelle vormen kunnen we de betrouwbaarheid berekenen door de scores op deze twee parallelle vormen te correleren.

Als er geen parallelle vormen zijn opgesteld, kan de betrouwbaarheid worden bepaald volgens de methode van de gesplitste helft of via de methode van rationele equivalentie. De test kan worden gelezen en de betrouwbaarheid kan worden geschat met de test-hertest-methode.

7. Ten slotte zullen we moeten evalueren in hoeverre een test bruikbaar is vanuit het oogpunt van administratie, scoren, tijd en economie. De toets moet percentielnormen, normscore-normen, leeftijdsnormen en graadnormen bevatten die de interpretatie van scores zullen vergemakkelijken.