Geldigheid van een test: 5 factoren

Dit artikel werpt licht op de vijf belangrijkste factoren die van invloed zijn op de geldigheid van een test. De factoren zijn: 1. Factoren in de Test zelf 2. Functionerende inhoud en onderwijsprocedure 3. Factoren in de testadministratie en scoren 4. Factoren in de reactie van leerlingen 5. Aard van de groep en het criterium.

1. Factoren in de Test zelf:

Elke test bevat items en een nauwkeurig onderzoek van testitems geeft aan of de test de inhoud van het onderwerp lijkt te meten en of de mentale functies van de docent willen testen.

De volgende factoren in de test zelf kunnen voorkomen dat de testitems naar wens functioneren en daardoor de geldigheid verlagen:

(a) Duur van de test:

Een test is meestal een voorbeeld van veel vragen. Als de test te kort is om een representatieve test te worden, zal de geldigheid hiervan worden beïnvloed. Homogene verlenging van een test verhoogt zowel de validiteit als de betrouwbaarheid.

De formule die bepaalt hoe lang een test mag worden verhoogd, is:

Waarin:

n = aantal keren dat een test moet worden verlengd

r _t = betrouwbaarheid van de test

r _tc = correlatie van de test met het criterium

r _tx = geldigheid van de test

De betrouwbaarheidscoëfficiënt van een test is bijvoorbeeld .57 en correleert .65 met de waardering van de docent. Hoe vaak moet het worden verlengd als een geldigheidscoëfficiënt van .80 wordt gevraagd.

(b) onduidelijke richting:

Als aanwijzingen over hoe te reageren op de items, of het nu geoorloofd is om te raden en hoe de antwoorden moeten worden vastgelegd, niet duidelijk zijn voor de leerling, dan zal de geldigheid de neiging hebben te verminderen.

(c) Lezing van vocabulaire en zinsstructuren die te moeilijk zijn:

Het gecompliceerde vocabulaire en de zinsstructuur die bedoeld is voor de leerlingen die de test afleggen, kan mislukken bij het meten van de aspecten van de leerprestaties; dus verlaagt de geldigheid.

(d) Ongepaste moeilijkheidsgraad van de testitems:

Als de testitems een onjuiste moeilijkheidsgraad hebben, heeft dit invloed op de geldigheid van de tool. In criterium-verwezen testen bijvoorbeeld, zal het niet-matchen van de moeilijkheid gespecificeerd door de leeruitkomst de geldigheid verlagen.

(e) Slecht geconstrueerde testitems:

De testitems die onbedoelde aanwijzingen voor het antwoord geven, hebben de neiging de alertheid van de leerlingen te meten bij het opsporen van aanwijzingen en de aspecten van de leerprestaties die uiteindelijk de geldigheid beïnvloeden.

(f) Dubbelzinnigheid:

Ambiguïteit in uitspraken in de testitems leidt tot verkeerde interpretatie, verschillende interpretaties en verwarring. Soms kan het de betere studenten meer verwarren dan de armere, wat resulteert in de discriminatie van items in een negatieve richting. Als gevolg hiervan wordt de geldigheid van de test verlaagd.

(g) Testitems die niet geschikt zijn voor de resultaten die worden gemeten:

Vaak gebeurt het dat we bepaalde complexe vormen van prestatie, begrip, denken, vaardigheden enz. Proberen te meten met testvormen die alleen geschikt zijn voor het meten van feitelijke kennis. Dit beïnvloedt de resultaten en leidt tot een vervorming van de geldigheid.

(h) Onjuiste indeling van artikelen:

Items in de test zijn meestal in volgorde van moeilijkheid gerangschikt met de gemakkelijkste items eerst. Als de moeilijke items vroeg in de test worden geplaatst, kan dit ertoe leiden dat de studenten te veel van hun tijd aan deze besteden en niet in staat zijn om andere items te bereiken die ze gemakkelijk kunnen beantwoorden.

Ook kan een dergelijke onjuiste regeling de geldigheid beïnvloeden door een negatief effect op de leermotivatie te hebben.

(i) Identificeerbaar antwoordpatroon:

Wanneer de studenten het systematische patroon van correct antwoord identificeren (bijv. TTFF of ABCD, ABCD), kunnen ze de antwoorden slim raden en dit zal de geldigheid beïnvloeden.

2. Functionerende inhoud en onderwijsprocedure:

Bij prestatietests kan de functionele inhoud van testitems niet alleen worden bepaald door de vorm en inhoud van de test te onderzoeken. De docent moet volledig leren hoe een bepaald probleem op te lossen voordat het in de test wordt opgenomen.

Het testen van complexe leerresultaten lijkt geldig als de testitems functioneren zoals bedoeld. Als de studenten eerdere ervaring hebben met de oplossing van het probleem in de test, dan zijn dergelijke tests niet meer een valide instrument om de meer complexe mentale processen te meten en hebben ze dus invloed op de geldigheid.

3. Factoren in testadministratie en scoren:

De testadministratie en de scoreprocedure kunnen ook van invloed zijn op de geldigheid van de interpretaties van de resultaten. Bijvoorbeeld, in door de leraar gemaakte tests kunnen factoren zoals onvoldoende tijd om de test te voltooien, oneerlijke hulp aan individuele studenten, vals spelen tijdens het onderzoek en het onbetrouwbaar scoren van essayantwoorden ertoe leiden dat de validiteit afneemt.

Evenzo zou bij gestandaardiseerde tests het ontbreken van de volgende standaardrichtingen en tijdslimieten, ongeoorloofde hulp aan studenten en fouten bij het scoren de geldigheid verminderen.

Of het nu een door een leraar gemaakte test is of een gestandaardiseerde test, nadelige fysieke en psychologische omstandigheden tijdens het testen kunnen van invloed zijn op de geldigheid.

4. Factoren in de reactie van leerlingen:

Er zijn bepaalde persoonlijke factoren die de reactie van de leerlingen op de testsituatie beïnvloeden en de testinterpretatie ongeldig maken. De emotioneel gestoorde studenten, het gebrek aan motivatie van studenten en studenten die bang zijn voor de testsituatie zullen mogelijk niet normaal reageren en dit kan uiteindelijk de geldigheid beïnvloeden.

Respons ingesteld beïnvloedt ook de testresultaten. Het is de gewoonte van de test die de score van de leerlingen beïnvloedt. Als een test steeds opnieuw wordt gebruikt, kan de geldigheidsduur afnemen.

5. Aard van de groep en het criterium:

Er is al aan u uitgelegd dat de geldigheid altijd specifiek is voor een bepaalde groep. Een rekenkundige test op basis van verhaalproblemen kan ons bijvoorbeeld helpen bij het meten van redeneervermogen in een langzame groep en een combinatie van eenvoudige herinnering van informatie en computervaardigheden in een meer geavanceerde groep.

Er zijn bepaalde factoren zoals leeftijd, geslacht, vaardigheidsniveau, educatieve achtergrond en culturele achtergrond die de testmaatregelen beïnvloeden. Daarom moet de aard van de validatiegroep een vermelding vinden in de testhandleidingen.

De aard van het gebruikte criterium is een andere belangrijke overweging bij het evalueren van de geldigheidscoëfficiënt. Bijvoorbeeld, scores op een wetenschappelijke proeve van bekwaamheid zullen waarschijnlijk een meer accurate voorspelling van prestatie opleveren in een studie-omgeving.

Als andere dingen gelijk zijn, geldt dat hoe groter de overeenkomst tussen de prestaties gemeten met de test en de prestaties die in het criterium worden weergegeven, hoe groter de geldigheidscoëfficiënt.