Methoden die worden gebruikt voor het beoordelen van taakprestaties

De industriepsycholoog kan kiezen uit verschillende methoden om een procedure vast te stellen voor de beoordeling van de werkprestaties met beoordelingen door individuen. Deze methoden kunnen worden gegroepeerd in klassen afhankelijk van de soort vergelijking die wordt vereist van het individu dat de beoordeling uitvoert. De drie meest gebruikte zijn classificatiesystemen, classificatiesystemen en gepaarde vergelijkingen.

1. Beoordelingssystemen:

De mechanica van elk classificatieschaalsysteem is vrij eenvoudig. De taak van de rechter is om een oordeel te vellen over de mate waarin het individu een bepaald kenmerk bezit of wordt beschreven. Hoewel het vele verschillende vormen kan aannemen, is zijn enige onderscheidende kenmerk dat de rechter twee personen dezelfde score kan geven, een kenmerk dat niet wordt gevonden in de andere twee methoden.

Numerieke beoordelingsschalen:

Dit formulier is waarschijnlijk het populairste en meest voorkomende type beoordelingsschaal. Dergelijke schalen worden vaak "grafische schalen" genoemd.

Een voorbeeld wordt hieronder gegeven:

De taak van de rechter is om elke werknemer een score van 1 tot 9 te geven die zijn "mate van betrouwbaarheid" het beste beschrijft. De criteriumscore voor een werknemer is meestal de gemiddelde score van alle juryleden. In de situatie waarin een aantal verschillende vragen het criterium vormen (bijvoorbeeld mate van betrouwbaarheid, algemeen niveau van werkkennis, relaties met andere werknemers, enz.), Wordt het probleem gecompliceerder. Vaak is het totale gebruikte criterium gewoon de totale score van alle vragen.

Als er echter meerdere vragen worden gebruikt om werknemers te evalueren, moet er onmiddellijk een oplossing worden gevonden voor het probleem van de samengestelde of meervoudige criteria. Een aanpak die in dergelijke situaties populairder wordt, is om factoren te analyseren om de onderliggende onafhankelijke criteriumdimensies te bepalen en vervolgens "factorscores" toe te kennen aan elk van deze dimensies die dan als criteria worden gebruikt.

Standaard schalen:

Een ander type beoordelingsschaal omvat het gebruik van een reeks normen of voorbeelden voor vergelijkingsdoeleinden. Deze worden gebruikt in plaats van of samen met de verbale ankerpunten die worden gevonden met de grafische schaal.

Een standaard schaal ontworpen om de betrouwbaarheid te evalueren kan er als volgt uitzien:

De beoordelaar kan dan de man die hij beoordeelt vergelijken met mannen in de baan die worden aangeduid als schaalreferentpunten. Deze methode wordt ook wel een man-to-man vergelijkingsschaal genoemd. De grootste moeilijkheid met standaardschalen bestaat in het vinden van geschikte normen. Dit vereist meestal een zorgvuldige voorschaling van een groep huidige werknemers. Er is ook het zeer gevoelige probleem van het gebruik van de namen van deze mannen zonder enige schaamte. Daarom moet men heel voorzichtig zijn dat de standaardschaal niet openbaar mag worden gemaakt. Een andere moeilijkheid is dat de intervallen tussen de mannen op de schaal vaak niet van dezelfde orde zijn.

Het voordeel van de methode is vrij duidelijk. Zolang een groep rechters overeenstemming kan bereiken over de kwalificaties van een kleine groep werknemers die bekend is bij alle rechters, wordt een kant-en-klare vergelijkingsschaal verstrekt die verzekert dat alle rechters een gemeenschappelijke referent hebben bij het beoordelen van de rest van de mannen.

Gecumuleerde puntenschaal (checklist):

Veel beoordelingsschalen vereisen dat de rechter controleert of aangeeft welke van een aantal uitspraken, bijvoeglijke naamwoorden of attributen beschrijvend zijn voor de persoon die wordt beoordeeld. Het beoordelingsformulier dat wordt weergegeven in Afbeelding 7.3 is bijvoorbeeld representatief voor een controlelijst met bijvoeglijk naamwoord.

Elke persoon krijgt een totaalscore toegewezen op basis van de gecontroleerde items. In het getoonde voorbeeld kan een persoon een + 1 ontvangen voor elk gunstig adjectief en een - 1 voor elk ongunstig bijvoeglijk naamwoord. In gedetailleerdere checklists kunnen aan de verschillende items differentiaalgewichten worden toegewezen. Uhrbrock (1961) heeft bijvoorbeeld 2000 verklaringen over het gedrag van werknemers geschaald.

Elke bewering heeft een gemiddelde schaalwaarde gekregen van de gepercipieerde favourableheid bij het beschrijven van een werknemer. Verklaringen kunnen vervolgens worden geselecteerd voor gebruik op een checklist die op zijn beurt wordt gebruikt door supervisors om hun werknemers te beoordelen. De scoremethode kan gebaseerd zijn op de totale (algebraïsche som) score voor de gecontroleerde items of, misschien, de mediaan (middelste) schaalwaarde van alle gecontroleerde items. Enkele voorbeelden van Uhrbrocks uitspraken, samen met hun schaalwaarden, worden getoond in Tabel 7.3.

Kritieke checklist voor incidenten:

De critical-incident techniek is een procedure ontwikkeld door Flanagan (1954). Zoals normaal gebruikt, kan het waarschijnlijk het beste worden omschreven als een checklist-beoordelingsprocedure. Het is echter ook in zijn ontwikkeling voldoende verschillend dat het een aparte vermelding verdient.

De methode omvat drie verschillende stappen:

1. Het verzamelen van kritieke incidenten

2. Schalen van de incidenten

3. Construeren van de checklistschaal

De eerste stap is wat deze methode uniek maakt. De term kritisch incident verwijst naar al het on-the-job gedrag van mensen dat de supervisor als 'opmerkelijk' zou beschouwen. Opmerkelijk is dat op zijn beurt kan worden verwezen naar instanties van 'buitengewoon' of 'slecht' aan de hand van werkgedrag. Elke supervisor wordt met andere woorden gevraagd om zoveel voorbeelden te geven van uitstekend werkelijk werkgedrag als hij zich kan herinneren. Deze jobincidenten worden vervolgens gepresenteerd (stap twee) aan een groep experts die schaalwaarden toewijzen met betrekking tot de mate van wenselijkheid van dit incident.

In stap drie wordt een checklist samengesteld met alleen die uitspraken of incidenten die relevant worden geacht voor het definiëren van 'goede' en 'arme' werknemers. Deze checklists kunnen vervolgens door een supervisor worden gebruikt om zijn werknemers te beoordelen. Bij het beoordelen van een werknemer plaatst hij eenvoudigweg een vinkje naast elk incident dat hij heeft waargenomen dat de werknemer 'vastlegt' of vertoont. De score voor een werknemer wordt meestal genomen als de gemiddelde of mediaanwaarde van alle voor hem gecontroleerde incidenten (totale score kan ook worden gebruikt).

De checklist voor kritieke incidenten heeft het grote voordeel dat deze is gebaseerd op feitelijk werkgedrag of incidenten. Een supervisor wordt niet geplaatst in de positie om gedwongen te worden eigenschappen te beoordelen of om zijn werknemers te rangschikken, enz. Hij hoeft alleen te antwoorden in termen van het al dan niet hebben van een bepaald incident van de kant van elke werknemer. Kirchner en Dunnette (1957) hebben gunstige resultaten gerapporteerd in een studie na enigszins de hierboven geschetste procedure.

Alvorens de kritieke-incident methode te verlaten, moet worden opgemerkt dat het meer algemeenheid en toepassing heeft dan eenvoudigweg een bron zijn voor prestatiebeoordelingscontrolelijstitems. Jobgebaseerde gedragsincidenten zijn zeer succesvol gebruikt in onderzoek op het gebied van leiderschap (Fleishman, 1955), organisatiewaarden (Shartle, Brumback en Rizzo, 1964) en creativiteit (Buel, 1960).

2. Ranking-systemen:

Een kenmerk van een beoordelingssysteem is dat het twee of meer individuen toelaat dezelfde rating of schaalwaarde te hebben. Een classificatiesysteem van nature ontmoedigt dit. Eenvoudig rangschikken vereist dat de rechter de individuen van het hoogste tot het laagste gebied beveelt.

Een bepaalde groep supervisors zou dus tien werknemers kunnen rangschikken zoals hieronder getoond:

Ranglijstsystemen hebben het inherente voordeel dat ze uitermate eenvoudig uit te leggen zijn en meestal gemakkelijk aanvaard worden door de personen die als rechters zijn aangewezen. De procedure is 'logisch' voor hen. Het heeft ook het voordeel dat een beoordelaar vrij grote aantallen individuen kan rangschikken zonder grote moeilijkheden. Een vuistregel erkent dat bevredigende en betrouwbare resultaten met een classificatiesysteem kunnen worden bereikt met N's zo groot als 50 tot 60.

Guilford (1954) heeft nog een ander voordeel van rangschikking genoemd. Aangezien de rechter gedwongen is man-tegen-man vergelijkingen te maken in plaats van absolute vergelijkingen, moet hij individuen vergelijken bij het besluit om de een boven de ander te plaatsen.

De methode dwingt de rechter om onderscheid te maken tussen de gerangschikte personen, ongeacht of hij vindt dat ze echt anders zijn! Stel dat de tien mannen die in ons eerdere voorbeeld zijn gegeven, vrij gelijkwaardig waren in hun kunnen. De rechters zouden dan waarschijnlijk een buitengewoon moeilijke tijd hebben om de mannen te rangschikken, en de rankings van een rechter zouden zeer misleidend zijn ten aanzien van de relatieve verdiensten van de tien mannen in kwestie.

Een manier om deze mogelijkheid te controleren, is natuurlijk om meerdere rechters te gebruiken. Als de juryleden het eens zijn over hun rangorde, kan de mogelijkheid worden uitgesloten dat er geen "echte" of echte verschillen tussen de mannen zijn. In het eerdere voorbeeld lijken de beoordelaars redelijk consistent te zijn in het beoordelen van wie goed is en wie een arme werknemer is. Dus, hun keuzes moeten gebaseerd zijn op een aantal echte in plaats van willekeurige redenen om de mannen in kwestie te bevelen. Dit is een uitstekende reden om zoveel mogelijk rechters te gebruiken en om de overeenstemming tussen rechters te berekenen met een bepaalde index, zoals een correlatiecoëfficiënt.

3. Gepaarde vergelijkingen:

Hoewel de rangorde-systemen impliciet vereisen dat een man wordt vergeleken met anderen op de lijst tijdens het rangschikkingsproces, is dit niet systematisch ingebouwd in de methode. Een procedure die de beoordelaar systematisch dwingt om elke man met elke andere man te vergelijken, staat bekend als de methode van gepaarde vergelijking. Denk bijvoorbeeld aan de situatie waarin vier medewerkers worden beoordeeld door een supervisor. Als we alle mogelijke paren van mannen vormen, zullen we N (N-l) / 2 zulke paren vormen; in ons geval is 4 (3/2) = 6 paar.

De gebruikelijke procedure is dan om elk van de paren (één tegelijk) aan de supervisor te presenteren. De supervisor geeft (meestal met een vinkje) aan welke van de twee mannen hij het beste vindt. Een gepaarde vergelijkingsmatrix kan vervolgens worden geconstrueerd zoals hieronder wordt getoond, waarbij de volgende regel wordt gebruikt: Wanneer een supervisor een kolom op een rij verkiest, plaatst u een markering in die cel.

Stel dat supervisor X de volgende beoordelingen maakt over de zes paren van werknemers:

Als we tally marks in onze matrix plaatsen met behulp van bovenstaande regel, hebben we het volgende:

Deze toezichthouder beoordeelt B als de beste werker, op volgorde gevolgd door C, A en D. In de praktijk zijn de beoordelingen van een aantal beoordelaars opgenomen in de matrix om een stabielere schatting te geven van de volgorde van verdienste van de mannen die worden geëvalueerd. Bovendien is het gebruikelijk om de verhoudingen binnen elke cel te converteren naar standaardscores (Z-scores) en vervolgens een gemiddelde Z-score te vinden voor elke kolom.

Deze gemiddelde Z-score is dan de schaalwaarde voor de persoon die wordt vertegenwoordigd door die kolom in de matrix. Het voordeel van deze laatste procedure is dat deze schaalwaarden niet alleen worden beschouwd als de rangorde van het vermogen van de werknemer, maar ook als een indicatie van de mate waarin twee werknemers verschillen qua bekwaamheid.

Een eenvoudige illustratie op basis van de antwoorden van tien hypothetische supervisors op de vier mannen die hierboven zijn beoordeeld, kan nuttig zijn. Laten we eerst de volgende matrix bekijken

Laten we de matrix nu converteren naar een evenredigheidsmatrix, waarbij we een deel definiëren als ⁿ / _N, waarbij n gelijk is aan het aantal overeenstemmingsmarkeringen in een cel en N gelijk is aan het aantal beoordelaars of het aantal mogelijke overeenstemmingsmarkeringen. Het is gebruikelijk om verhoudingen van 0, 50 in alle diagonale cellen in te voeren, ook al presenteren we een persoon die aan zichzelf is gekoppeld nooit echt aan de juryleden.

De volgende stap is om de verhoudingen om te zetten in Z-scores. (Een tabel hiervoor is te vinden in elk elementair boek over statistieken.)

Als we een constante van 0, 78 toevoegen aan alle schaalwaarden om negatieve tekens te verwijderen, kunnen de individuen vervolgens worden gerepresenteerd in een continuüm van verdienste

Merk op dat de afstand tussen C en A aanzienlijk groter is dan de afstand tussen D en A of B en C. Als aan de aannamen van deze methode is voldaan, kunnen deze relatieve afstanden worden beschouwd als een aanwijzing voor de relatieve verschillen in verdienste onder de personen die worden beoordeeld - een aantrekkelijk kenmerk van deze beoordelingsmethode voor prestaties. Zie Edwards (1957) of Guilford (1954) voor een meer gedetailleerde beschrijving van gepaarde vergelijking.

Een van de nadelen van de methode van gepaarde vergelijkingen is dat het niet bijzonder nuttig is wanneer het aantal te beoordelen individuen groot wordt. Eerder werd erop gewezen dat een supervisor waarschijnlijk orde 50 of 60 werknemers zou kunnen rangschikken. Als we de gepaarde vergelijkingsprocedure zouden gebruiken, zouden we dat gedaan hebben

50 (49) 72 = 1225 paren

Zelfs als een supervisor zou kunnen werken met een snelheid van zes paar per minuut, zou het meer dan drie uur duren om de beoordeling te voltooien. Hoe groter het aantal te beoordelen personen, des te astronomischer wordt de tijdvereiste.