Betekenis van het verschil tussen middelen

Na het lezen van dit artikel leert u over de betekenis van het verschil tussen middelen.

Stel dat we willen testen of 12-jarige jongens en 12-jarige meisjes van openbare scholen verschillen in mechanisch vermogen. Omdat de populaties van dergelijke jongens en meisjes te groot zijn, nemen we een willekeurige steekproef van dergelijke jongens en meisjes, voeren we een test uit en berekenen we afzonderlijk de middelen van jongens en meisjes.

Stel dat de gemiddelde score van zulke jongens 50 is en die van zulke meisjes 45. We markeren een verschil van 5 punten tussen de middelen van jongens en meisjes. Het kan een feit zijn dat een dergelijk verschil zich zou kunnen voordoen als gevolg van schommelingen in de bemonstering.

Als we twee andere steekproeven trekken, één uit de populatie van 12-jarige jongens en andere uit de populatie van 12-jarige meisjes, zullen we enig verschil vinden tussen de middelen als we het blijven herhalen gedurende een groot aantal keren in het nemen van voorbeelden van 12-jarige jongens en 12-jarige meisjes zullen we merken dat het verschil tussen twee sets van middelen zal variëren.

Soms is dit verschil positief, soms negatief en soms nul. De verdeling van deze verschillen vormt een normale verdeling rond een verschil van nul. De SD van deze verdeling wordt de standaardfout van het verschil tussen gemiddelden genoemd.

Hiervoor worden de volgende symbolen gebruikt:

SEM 1 - M 2 of SE D of σ DM

Er doen zich twee situaties voor met betrekking tot verschillen tussen gemiddelde:

(a) Degenen in welke middelen niet-gecorreleerd / onafhankelijk zijn, en

(b) Die waarbij de gemiddelden gecorreleerd zijn.

(a) SE van het verschil tussen twee onafhankelijke middelen:

De gemiddelden zijn niet-gecorreleerd of onafhankelijk wanneer ze worden berekend uit verschillende monsters of uit niet-gecorreleerde tests die aan hetzelfde monster zijn toegediend.

In dergelijke gevallen kunnen zich twee situaties voordoen:

(i) Wanneer middelen niet-gecorreleerd of onafhankelijk zijn en de steekproeven groot zijn, en

(ii) Wanneer middelen niet-gecorreleerd of onafhankelijk zijn en de steekproeven klein.

(i) SE van het verschil (SE D ) wanneer middelen niet-gecorreleerd of onafhankelijk zijn en de steekproeven groot zijn:

In deze situatie kan de SE D worden berekend met behulp van de formule:

waarin SE D = standaardfout van het verschil in gemiddelden

SEm 1 = standaardfout van het gemiddelde van het eerste monster

SEm 2 = standaardfout van het gemiddelde van het tweede monster

Voorbeeld 1:

Twee groepen, een samengesteld uit 114 mannen en de andere uit 175 vrouwen. De gemiddelde scores van mannen en vrouwen in een woordopbouwtest waren respectievelijk 19, 7 en 21, 0 en SD's van deze twee groepen zijn respectievelijk 6, 08 en 4, 89. Test of het waargenomen verschil van 1, 3 ten gunste van vrouwen significant is op 0, 05 en op 0, 01 niveau.

Oplossing:

Het is een tweestaartstest → Omdat de richting niet duidelijk is.

Om de significantie van een verkregen verschil tussen twee steekproefgemiddelden te testen, kunnen we de volgende stappen uitvoeren:

Stap 1:

In de eerste stap moeten we duidelijk zijn of we een tweeaderige test of een eenzijdige toets willen maken. Hier willen we testen of het verschil significant is. Het is dus een tweezijdige toets.

Stap 2:

We hebben een nulhypothese opgesteld (Ho) dat er geen verschil is tussen de populatiemiddelen van mannen en vrouwen in woordopbouw. We nemen aan dat het verschil tussen de populatiemiddelen van twee groepen nul is, dat wil zeggen, Ho : D = 0.

Stap 3:

Dan moeten we het significantieniveau van de test bepalen. In ons voorbeeld moeten we het verschil testen op .05 en .01 significantieniveau.

Stap 4:

In deze stap moeten we de standaardfout van het verschil tussen gemiddelden, dwz SE D, berekenen.

Omdat ons voorbeeld niet-gecorreleerde gemiddelden en grote steekproeven is, moeten we de volgende formule toepassen om SE D te berekenen:

Stap 5:

Na het berekenen van de waarde van SE D moeten we het verschil van steekproefgemiddelden uitdrukken in termen van SE D. Aangezien ons voorbeeld een gemak is voor grote steekproeven, zullen we Z moeten berekenen waar,

Stap 6:

Met betrekking tot de aard van de test in ons voorbeeld moeten we de kritische waarde voor Z uit tabel A opzoeken op zowel .05 als op .01 significantieniveau.

Van tabel A, Z.05 = 1.96 en Z.01 = 2.58. (Dit betekent dat de waarde van Z significant moet zijn op 0, 05 niveau of minder 1, 96 of hoger moet zijn).

Nu 1, 91 <1, 96, het opvallende verschil is niet significant op 0, 05 niveau (dat wil zeggen dat H 0 wordt geaccepteerd).

Interpretatie:

Omdat het monster groot is, kunnen we uitgaan van een normale verdeling van Z's. De verkregen Z haalt net niet het 0, 05-niveau van significantie, wat voor grote monsters 1, 96 is.

Daarom zouden we de nulhypothese niet verwerpen en zouden we zeggen dat het verkregen verschil niet significant is. Er is misschien een verschil, maar we hebben er geen voldoende zekerheid over.

Een meer praktische conclusie zou zijn dat we onvoldoende bewijs hebben van enig sekseverschil in het vermogen om woorden te bouwen, althans in het soort populatie dat wordt bemonsterd.

Voorbeeld 2:

Gegevens over de prestaties van jongens en meisjes worden gegeven als:

Test of de jongens of meisjes beter presteren en of het verschil van 1, 0 ten gunste van jongens significant is op .05-niveau. Als we accepteren dat het verschil significant is, wat zou dan de Type 1-fout zijn.

Oplossing:

1, 85 <1, 96 (Z, 05 = 1, 96). Daarom wordt H 0 geaccepteerd en het opvallende verschil van 1, 0 ten gunste van jongens is niet significant op .05-niveau.

Als we accepteren dat het verschil significant is, hebben we een Type 1-fout gemaakt. Door tabel A te lezen, zien we dat ± 1, 85 Z 93, 56% van de gevallen bevat. Vandaar dat het accepteren van het duidelijke verschil significant is, we zijn 6, 44% (100 - 93, 56) fout, dus Type 1-fout is 0644.

Voorbeeld 3:

Klasse A werd onderwezen in een intensieve coachingfaciliteit, terwijl klasse B lesgaf in een normale klas. Aan het einde van een schooljaar klasse A en B gemiddeld 48 en 43 met respectievelijk SD 6 en 7, 40.

Test of intensieve coaching winst in gemiddelde score heeft behaald tot klasse A. Klasse A bestaat uit 60 en klasse B 80-studenten.

. . . 4.42 is meer dan Z.01 of 2.33. Dus Ho wordt afgewezen. Het duidelijke verschil is significant op .01-niveau.

Daarom concluderen we dat intensieve coaching goede gemiddelde scores van klasse A behaalde.

(ii) de SE van het verschil (SE D ) wanneer middelen niet-gecorreleerd of onafhankelijk zijn en de steekproeven klein zijn:

Wanneer de N's van twee onafhankelijke steekproeven klein zijn, kan de SE van het verschil van twee gemiddelden worden berekend door de volgende twee formules te gebruiken:

Wanneer scores worden gegeven:

waarin x 1 = X 1 - M 1 (dwz afwijking van de scores van de eerste steekproef van het gemiddelde van de eerste steekproef).

X 2 = X 2 - M 2 (di deviatie van scores van het tweede monster van hun gemiddelde)

Wanneer middelen en SD's van beide monsters worden gegeven:

Voorbeeld 4:

Een rentetest wordt toegediend aan 6 jongens in een beroepsopleiding en aan 10 jongens in een Latijnse klas. Is het gemiddelde verschil tussen de twee groepen significant op .05-niveau?


Het invoeren van de tabel:

D we vinden dat met df = 14 de kritieke waarde van t op .05-niveau 2.14 is en op .01-niveau 2.98. De berekende waarde van 1, 78 is minder dan 2, 14 op .05 significantieniveau.

Vandaar dat H 0 wordt geaccepteerd. We concluderen dat er geen significant verschil is tussen de gemiddelde scores van de Interest Test van twee groepen jongens.

Voorbeeld 5:

Een persoonlijkheidsinventaris wordt op een privéschool beheerd door 8 jongens wiens gedragsgegevens exemplarisch zijn, en door 5 jongens van wie de administratie slecht is.

Gegevens worden hieronder gegeven:

Is het verschil tussen groep significant op het .05-niveau? op het 01-niveau?

Als we tabel D invoeren, zien we dat met df 11 de kritieke waarde van t op .05-niveau 2.20 is en op .01-niveau 3.11. De berekende waarde van 2, 28 is iets meer dan 2, 20 maar minder dan 3, 11.

We concluderen dat het verschil tussen groepsgemiddelden significant is op .05-niveau, maar niet significant op .01-niveau.

Voorbeeld 6:

Op basis van een rekenkundige redenering testten 11 tienjarige jongens en 6 tienjarige meisjes de volgende scores:

Is het gemiddelde verschil van 2.50 significant op het .05-niveau?

Oplossing:

Door formule (43 b) toe te passen.

Als we tabel D invoeren, zien we dat met df 15 de kritieke waarde van t op .05-niveau 2, 13 is. De verkregen waarde van 1, 01 is minder dan 2, 13. Daarom is het duidelijke verschil van 2, 50 niet significant op het .05-niveau.

(b) SE van het verschil tussen twee gecorreleerde gemiddelden:

(i) De methode met één enkele groep:

We hebben al het probleem behandeld van het bepalen of het verschil tussen twee onafhankelijke middelen significant is.

Nu gaan we ons bezighouden met de betekenis van het verschil tussen gecorreleerde middelen. Gecorreleerde middelen worden verkregen uit dezelfde test die twee keer aan dezelfde groep is toegediend.

Stel dat we een test hebben afgenomen voor een groep kinderen en na twee weken moeten we de test herhalen. We willen het effect van oefening of van speciale training op de tweede reeks scores meten. Om de significantie te bepalen van het verschil tussen de gemiddelden verkregen in de eerste en laatste test.

We moeten de formule gebruiken:

waarin σ M1 en σ M2 = SE's van de eerste en laatste testmiddelen

r 12 = correlatiecoëfficiënt tussen de scores op de eerste en laatste tests.

Voorbeeld 7:

Aan het begin van het academische jaar was de gemiddelde score van 81 studenten op een educatieve prestatietest bij het lezen 35 met een SD van 5.

Aan het einde van de sessie was de gemiddelde score op een equivalente vorm van dezelfde test 38 met een SD van 4. De correlatie tussen de scores op de eerste en laatste test was .53. Heeft de klas gedurende het jaar aanzienlijke vooruitgang geboekt met lezen?

We kunnen onze gegevens als volgt in tabelvorm weergeven:

(Test op .01 niveau van significantie)

Oplossing:

Omdat we ons alleen bezig houden met vooruitgang of winst, is dit een eenzijdige toets.

Door de formule toe te passen:

Omdat er 81 studenten zijn, zijn er 81 paren scores en 81 verschillen, zodat de df 81 - 1 of 80 wordt. Vanaf tabel D is de t voor 80 df 2, 38 op het 0, 02-niveau. (De tabel geeft 2, 38 voor de tweezijdige toets, die 0, 01 is voor de eenzijdige toets).

De verkregen t van 6.12 is veel groter dan 2.38. Vandaar dat het verschil significant is. Het lijkt zeker dat de klas aanzienlijke vooruitgang boekte tijdens het schooljaar.

(ii) Verschilmethode:

Wanneer groepen klein zijn, gebruiken we de "verschilmethode" omwille van eenvoudige en snelle berekeningen.

Voorbeeld 8:

Tien proefpersonen krijgen 5 opeenvolgende proeven met een cijfer-symbooltest waarvan alleen de scores voor de proeven 1 en 5 worden getoond. Is de gemiddelde winst van de eerste tot de laatste proef significant?

De kolom met verschillen wordt gevonden uit het verschil tussen scorespaar. Het gemiddelde verschil is 4 en de SD rond dit gemiddelde (SD D )

SE van het gemiddelde verschil berekenen:

In welke SE MD = standaardfout van het gemiddelde verschil

SD = standaardafwijking rond het gemiddelde verschil.

De verkregen t van 5.26> 2.82. Onze t van 5.26 is veel groter dan het .01-niveau van 2.82 en er is weinig twijfel dat de winst van proef 1 tot en met proef 5 aanzienlijk is.

(iii) De methode van gelijkwaardige groepen:

Matching per paar:

Soms moeten we misschien de gemiddelde prestaties van twee equivalente groepen vergelijken die door paren worden vergeleken.

In de methode van equivalente groepen gebeurt de aanpassing aanvankelijk per paar, zodat elke persoon in de eerste groep een overeenkomst heeft in de tweede groep.

In dergelijke gevallen is het aantal personen in beide groepen hetzelfde, nl. N 1 = n 2 .

Hier kunnen we SE D berekenen met behulp van de formule:

waarin SE M1 en SE M2 = standaardfouten van de uiteindelijke scores van respectievelijk Groep I en Groep II.

r 12 = Coëfficiënt van correlatie tussen eindscores van groep I en groep II.

Voorbeeld 9:

Twee groepen werden gevormd op basis van de scores behaald door studenten in een intelligentietest. Een van de groepen (experimentele groep) kreeg een extra instructie voor een maand en de andere groep (gecontroleerde groep) kreeg geen dergelijke instructie.

Na één maand kregen beide groepen dezelfde test en de gegevens met betrekking tot de eindscores worden hieronder weergegeven:

Interpretatie:

Het invoeren van de tabel van t (tabel D) met df 71 de kritische waarde van t op .05 niveau in het geval van eenzijdige toets is 1.67. De verkregen t van 2, 34> 1, 67. Daarom is het verschil significant op .05-niveau.

. . . Het gemiddelde is toegenomen als gevolg van aanvullende instructie.

Met df van de kritische waarde van t op .01 niveau in het geval van eenzijdige test is 2.38. Aldus verkregen t van 2, 34 <2, 38. Daarom is het verschil niet significant op het .01-niveau.

Standaardfout van het verschil tussen andere statistieken:

(i) SE van het verschil tussen niet-gecorrigeerde medianen:

De betekenis van het verschil tussen twee medianen verkregen uit onafhankelijke monsters kan worden gevonden uit de formule:

(ii) SE van het verschil tussen standaardafwijkingen: