Niet-parametrische tests: concepten, voorzorgsmaatregelen en voordelen

Na het lezen van dit artikel zul je leren over: - 1. Concepten van niet-parametrische tests 2. Aannames van niet-parametrische tests 3. Voorzorgsmaatregelen 4. Sommige niet-parametrische tests 5. Voordelen 6. Nadelen.

Concepten van niet-parametrische tests:

Iets meer recentelijk hebben we de ontwikkeling gezien van een groot aantal inferentiemechnieken die niet veel of strenge aannames doen over de populatie waarvan we de gegevens hebben bemonsterd. Deze distributie-vrije of niet-parametrische technieken resulteren in conclusies die minder kwalificaties vereisen.

Als we er een hebben gebruikt, kunnen we misschien zeggen: "Ongeacht de vorm van de populatie (s), kunnen we concluderen dat ...."

De twee alternatieve namen die vaak aan deze tests worden gegeven zijn:

Distributie-Free:

Niet-parametrische tests zijn "distributievrij". Ze nemen niet aan dat de te analyseren scores afkomstig zijn van een populatie die op een bepaalde manier is verdeeld, bijvoorbeeld van een normaal verdeelde populatie.

Bij het testen van de significantie van het verschil tussen twee gemiddelden (in termen van de CR of t, bijvoorbeeld), gaan we ervan uit dat de scores waarop onze statistieken zijn gebaseerd normaal verdeeld zijn in de populatie. Wat we feitelijk doen - onder de nulhypothese - is om uit onze steekproefstatistieken de waarschijnlijkheid van een echt verschil tussen de twee parameters te schatten.

Wanneer N vrij klein is of de gegevens slecht zijn scheef, zodat de aanname van normaliteit twijfelachtig is, zijn "parametrische methoden" van dubieuze waarde of helemaal niet toepasbaar. Wat we in dergelijke gevallen nodig hebben, zijn technieken waarmee we steekproeven kunnen vergelijken en conclusies of tests van betekenis kunnen maken zonder de normaliteit van de bevolking te moeten aannemen.

Dergelijke methoden worden niet-parametrisch of distributievrij genoemd. De chi- square test X ² -test, bijvoorbeeld, is een niet-parametrische techniek. De betekenis van X ² hangt alleen af van de vrijheidsgraden in de tabel; Voor de variabelen ingedeeld in de categorieën van de X ^2- tabel hoeft geen enkele aanname te worden gedaan met betrekking tot de distributievorm.

De rangverschilvercorrelatiecoëfficiënt (rho) is ook een niet-parametrische techniek. Wanneer p wordt berekend uit scores gerangschikt in volgorde van verdienste, is de verdeling waarvan de scores worden genomen waarschijnlijk slecht scheef en is N bijna altijd klein.

Ranking Tests:

Als alternatief worden veel van deze tests geïdentificeerd als 'ranking tests', en deze titel suggereert hun andere belangrijkste verdienste: niet-parametrische technieken kunnen worden gebruikt met scores die niet exact zijn in een willekeurige numerieke betekenis, maar die in feite gewoon rangen zijn.

Aannames van niet-parametrische tests:

Een niet-parametrische statistische test is gebaseerd op een model dat alleen zeer algemene voorwaarden specificeert en geen enkele met betrekking tot de specifieke vorm van de distributie waaruit het monster is getrokken.

Bepaalde veronderstellingen houden verband met de meeste niet-parametrische statistische tests, namelijk:

1. Dat de waarnemingen onafhankelijk zijn;

2. De onderzochte variabele heeft onderliggende continuïteit;

3. Niet-parametrische procedures voor verschillende hypotheses over populatie dan parametrische procedures;

4. In tegenstelling tot parametrische tests zijn er niet-parametrische tests die geschikt kunnen worden toegepast op gegevens die op een ordinale schaal zijn gemeten, en andere op gegevens op een nominale of categorische schaal.

Voorzorgsmaatregelen bij het gebruik van niet-parametrische tests:

Bij het gebruik van niet-parametrische tests wordt de student gewaarschuwd voor de volgende fouten:

1. Wanneer metingen in termen van interval- en verhoudingsschalen zijn, zal de transformatie van de metingen op nominale of ordinale schalen leiden tot het verlies van veel informatie. Vandaar dat, voor zover mogelijk, parametrische tests in dergelijke situaties moeten worden toegepast. Door een niet-parametrische methode als een snelkoppeling te gebruiken, gooien we dollars weg om centen te sparen.

2. In situaties waarbij wordt voldaan aan de aannames die aan een parametrische test ten grondslag liggen en zowel parametrische als niet-parametrische tests kunnen worden toegepast, moet de keuze op de parametrische test zijn omdat de meeste parametrische tests in dergelijke situaties meer macht hebben.

3. Niet-parametrische tests bieden ongetwijfeld een middel om de veronderstelling van normaliteit van distributie te vermijden. Maar deze methoden doen niets om de aannames van onafhankelijkheid ten aanzien van homoscedasticiteit waar mogelijk te vermijden.

4. Gedragswetenschapper moet de nulhypothese, de alternatieve hypothese, de statistische test, de steekproefverdeling en het significantieniveau specificeren voordat de gegevens worden verzameld. Jagen rond voor een statistische test nadat de gegevens zijn verzameld, heeft de neiging om de effecten van eventuele toevalsverschillen te maximaliseren die de ene test boven de andere verkiezen.

Dientengevolge is de mogelijkheid om de nulhypothese te verwerpen wanneer deze waar is (Type I-fout) enorm toegenomen. Deze waarschuwing is echter ook van toepassing op zowel parametrische als niet-parametrische tests.

5. We hebben niet het probleem van het kiezen van statistische tests voor categorische variabelen. Niet-parametrische tests alleen zijn geschikt voor enumeratieve gegevens.

6. De F- en t-tests worden over het algemeen als robuust beoordeeld omdat de schending van de onderliggende aannames de conclusies niet ongeldig maakt.

Het is gebruikelijk om het gebruik van een normale theorie te rechtvaardigen in een situatie waarin normaliteit niet kan worden gegarandeerd, door te stellen dat het robuust is onder niet-normaliteit.

Enkele niet-parametrische tests:

We zullen een paar algemene niet-parametrische tests bespreken.

1. Tekentest:

De tekentest is de eenvoudigste van alle distributievrije statistieken en heeft een zeer hoge mate van algemene toepasbaarheid. Het is van toepassing in situaties waarin de kritieke ratio, t, test voor gecorreleerde monsters niet kan worden gebruikt omdat niet aan de aannamen van normaliteit en homoscedasticiteit is voldaan.

De studenten zijn zich bewust van het feit dat bepaalde omstandigheden in de setting van het experiment het element van de relatie tussen de twee datasets introduceren.

Deze voorwaarden zijn over het algemeen een pre-test, post-testsituatie; een test- en hertestsituatie; testen van een groep onderwerpen op twee tests; vorming van 'gematchte groepen' door te koppelen aan enkele externe variabelen die niet het onderwerp van onderzoek zijn, maar die de waarnemingen kunnen beïnvloeden.

In de ondertekentest testen we de betekenis van het teken van verschil (als plus of min). Deze test wordt toegepast wanneer N minder is dan 25.

Het volgende voorbeeld maakt ons duidelijk over ondertekentesten:

Voorbeeld:

De scores onderwerpen vaak onder twee verschillende omstandigheden, A en B worden hieronder gegeven. Tekentest toepassen en de hypothese testen dat A superieur is aan B.

Exclusief 0 (nul) hebben we negen verschillen, waarvan er zeven plus zijn.

We moeten nu de binomiaal uitbreiden, (p + q) ⁹

(p + q) ⁹ = p ⁹ + 9p ⁸ q + 36p ⁷ q ² + 84p ⁶ q ³ + 126 p ⁵ q ⁴ + 126 p ⁴ q ⁵ + 84p ³ q ⁶ + 36 p ² q ⁷ + 9 pq ⁸ + q ⁹ .

Het totale aantal combinaties is 2 ⁹ of 512. Als we de eerste 3 termen toevoegen (namelijk p ⁹ + 9p ⁸ q + 36 p ⁷ q ² ), hebben we een totaal van 46 combinaties (dwz 1 van 9, 9 of 8 en 36 van 7) die 7 of meer plustekens bevatten.

Ongeveer 46 keer in 512 trials zullen er 7 of meer plus tekens van 9 voorkomen wanneer het gemiddelde aantal + tekens onder de nulhypothese 4, 5 is. De kans op 7 of meer + tekens is daarom 46/512 of .09 en is duidelijk niet significant.

Dit is eenzijdige toets, omdat onze hypothese stelt dat A beter is dan B. Als de hypothese van meet af aan was dat A en B van elkaar verschillen zonder te specificeren wat superieur is, zouden we een 2-staartige test hebben gehad waarvoor P = 0, 18.

Er zijn tabellen beschikbaar die het aantal tekens geven dat nodig is voor significantie op verschillende niveaus, wanneer N in grootte varieert. Wanneer het aantal paren zo groot is als 20, kan de normale curve worden gebruikt als een benadering van de binomiale uitzetting of de x ² -test die wordt toegepast.

2. Mediane test:

De mediane test wordt gebruikt om de prestaties van twee onafhankelijke groepen te vergelijken, bijvoorbeeld een experimentele groep en een controlegroep. Eerst worden de twee groepen samengegooid en wordt een gemiddelde mediaan berekend.

Als de twee groepen willekeurig uit dezelfde populatie zijn getrokken, moet de helft van de scores in elke groep boven en 1/2 onder de algemene mediaan liggen. Om deze nulhypothese te testen, moeten we een 2 x 2 tabel opstellen en x 2 berekenen.

De methode wordt getoond in het volgende voorbeeld:

Voorbeeld:

Een klinisch psycholoog wil de effecten van een kalmerend medicijn op handtremor onderzoeken. Veertien psychiatrische patiënten krijgen het medicijn en 18 andere patiënten krijgen een onschadelijke dosis. De eerste groep is de experimentele, de tweede de controlegroep.

Verhoogt het medicijn de stabiliteit - zoals blijkt uit lagere scores in de experimentele groep? Omdat we ons alleen zorgen als het medicijn tremor vermindert, is dit een eenzijdige test.

Mediane test toegepast op experimentele en controlegroepen. Plustekens geven scores aan boven de gemiddelde mediaan, minus tekens die lager zijn dan de gemiddelde mediaan.

N = 14 N = 18

Algemene mediaan = 49.5

De gemiddelde mediaan is 49, 5. In de experimentele groep 4 zijn de scores boven en 10 onder de gemiddelde mediaan in plaats van de 7 hierboven en 7 hieronder die bij toeval te verwachten zijn. In de controlegroep zijn 12 scores boven en 6 onder de gemiddelde mediaan in plaats van de verwachte 9 in elke categorie.

Deze frequenties worden in de volgende tabel ingevoerd en X2 wordt berekend met de formule (hieronder vermeld) met correctie voor continuïteit:

AX ² c van 3, 17 met 1 vrijheidsgraad levert een p op die ligt op .08 ongeveer halverwege tussen .05 en .10. We wilden weten of de mediaan van de experimentele groep significant lager was dan die van de controle (wat duidt op meer stabiliteit en minder tremor).

Voor deze hypothese is een eenzijdige test, p / 2, ongeveer 0, 04 en X2c is significant op het 0, 5-niveau. Als onze hypothese was dat de twee groepen verschillen zonder de richting aan te geven, zouden we een tweezijdige toets hebben gehad en zou X2 niet als significant zijn gemarkeerd.

Onze conclusie, enigszins aarzelend gemaakt, is dat het medicijn enige vermindering in tremor produceert. Maar vanwege de kleine steekproeven en het ontbreken van een zeer significante bevinding, zou de klinisch psycholoog het experiment vrijwel zeker herhalen - misschien meerdere keren.

X ² is algemeen toepasbaar in de mediane test. Wanneer N ₁ en N ₂ klein zijn (bijvoorbeeld minder dan ongeveer 10) en de X ² -test niet nauwkeurig is, moet de exacte berekeningsmethode worden gebruikt.

Voordelen van niet-parametrische tests:

1. Als de steekproefomvang erg klein is, kan er geen alternatief zijn voor het gebruik van een niet-parametrische statistische test, tenzij de aard van de populatieverdeling exact bekend is.

2. Niet-parametrische tests maken doorgaans minder aannames over de gegevens en zijn wellicht relevanter voor een bepaalde situatie. Bovendien kan de hypothese die door de niet-parametrische test wordt getest wellicht meer geschikt zijn voor het onderzoek.

3. Niet-parametrische statistische tests zijn beschikbaar om gegevens te analyseren die inherent in rangen zijn, evenals gegevens waarvan de schijnbaar numerieke scores de sterkte van de rangen hebben. Dat wil zeggen, de onderzoeker kan alleen van zijn of haar onderwerpen zeggen dat men min of meer het kenmerk heeft dan een ander, zonder te kunnen zeggen hoeveel meer of minder.

Bij het bestuderen van een dergelijke variabele, zoals angst, kunnen we bijvoorbeeld stellen dat onderwerp A angstiger is dan onderwerp B zonder precies te weten hoeveel angstiger A is.

Als gegevens inherent in rangen zijn, of zelfs als ze alleen als plus of minus (meer of minder, beter of slechter) kunnen worden gecategoriseerd, kunnen ze worden behandeld met niet-parametrische methoden, terwijl ze niet kunnen worden behandeld met parametrische methoden tenzij ze precair zijn en misschien worden onrealistische veronderstellingen gemaakt over de onderliggende uitkeringen.

4. Niet-parametrische methoden zijn beschikbaar om gegevens te behandelen die eenvoudigweg classificerend of categorisch zijn, dat wil zeggen die op een nominale schaal worden gemeten. Er is geen parametrische techniek van toepassing op dergelijke gegevens.

5. Er zijn geschikte niet-parametrische statistische tests voor het behandelen van monsters die zijn samengesteld uit waarnemingen van verschillende populaties. Parametrische tests kunnen dergelijke gegevens vaak niet verwerken zonder dat we schijnbaar onrealistische aannames hoeven te maken of omslachtige berekeningen vereisen.

6. Niet-parametrische statistische tests zijn doorgaans veel gemakkelijker te leren en toe te passen dan parametrische tests. Bovendien is hun interpretatie vaak directer dan de interpretatie van parametrische tests.

Nadelen van niet-parametrische tests:

1. Als aan alle aannames van een parametrische statistische methode in de gegevens wordt voldaan en de onderzoekshypothese kan worden getest met een parametrische test, dan zijn niet-parametrische statistische tests verspilling.

2. De mate van verspilling wordt uitgedrukt door de energie-efficiëntie van de niet-parametrische test.

3. Een ander bezwaar tegen niet-parametrische statistische tests is dat ze niet systematisch zijn, terwijl parametrische statistische tests zijn gesystematiseerd en verschillende tests gewoon variaties op een centraal thema zijn.

4. Een ander bezwaar tegen niet-parametrische statistische tests heeft te maken met gemak. Tabellen die nodig zijn om niet-parametrische tests te implementeren, zijn wijdverspreid en verschijnen in verschillende formaten.