Standaardfout van het gemiddelde

Na het lezen van dit artikel zult u meer te weten komen over de norm van het gemiddelde.

Statistische gevolgtrekking helpt ons ook om de hypothese te testen dat "de statistiek op basis van de steekproef niet significant verschilt van de populatieparameter en dat het verschil, indien genoteerd, alleen te wijten is aan kansvariatie" .

Standaardfout van het gemiddelde (SE M of σ M )

Standaardfout van het gemiddelde (SE M ) is vrij belangrijk om de representativiteit of betrouwbaarheid of significantie van het gemiddelde te testen.

Stel dat we de gemiddelde score van 200 jongens van de 10e klas van Delhi in de Numerical Ability Test op 40 hebben gesteld. Dus 40 is het gemiddelde van slechts één steekproef uit de populatie (alle jongens die in X in Delhi lezen).

We kunnen net zo goed verschillende willekeurige steekproeven van 200 jongens uit de populatie trekken. Stel dat we willekeurig 100 verschillende monsters kiezen, elk monster bestaat uit 200 jongens uit dezelfde populatie en bereken het gemiddelde van elk monster.

Hoewel 'n' in elk geval 200 is, zijn 200 willekeurig gekozen jongens om de verschillende monsters te vormen niet identiek en dus als gevolg van fluctuatie in bemonstering zouden we 100 gemiddelde waarden van deze 100 verschillende monsters krijgen.

Deze gemiddelde waarden zullen van elkaar verschillen en ze zullen een reeks vormen. Deze waarden vormen de steekproefverdeling van middelen. Het kan mathematisch uitgedrukt worden dat deze steekproefgemiddelden normaal verdeeld zijn.

De 100 gemiddelde waarden (in ons voorbeeld) vallen in een normale verdeling rond M- pop, waarbij de M- pop het gemiddelde is van de steekproefverdeling van gemiddelden. De standaardafwijking van deze 100 steekproefgemiddelden wordt SE M of standaardfout van het gemiddelde genoemd, wat gelijk zal zijn aan de standaardafwijking van de populatie gedeeld door vierkantswortel van (steekproefomvang).

De SE M toont de spreiding van de steekproefgemiddelden rond M pop . SEM is dus een maat voor de variabiliteit van de steekproefgemiddelden. Het is een maat voor de divergentie van steekproefgemiddelden van M pop . SE M wordt ook geschreven als σ M.

Standaardfout van het gemiddelde (SE M of σ M ) wordt berekend met behulp van de formule (voor grote steekproeven)

(A) Berekening van SE M in grote monsters :

waarin σ = standaardafwijking van de populatie en

n = aantal gevallen in de steekproef

(Aangezien we zelden de SD van een populatie kunnen hebben, gebruiken we voor σ de waarde van SD van de steekproefgemiddelden).

Betrouwbaarheidsinterval:

De twee betrouwbaarheidsintervallen, dwz 95% en 99%, worden algemeen gebruikt. RA Fisher noemt de limieten van het betrouwbaarheidsinterval dat de parameter als "fiduciaire limieten" bevat en noemde het in het interval geplaatste vertrouwen als fiduciaire waarschijnlijkheid.

(a) 95% van het betrouwbaarheidsinterval:

Onder verwijzing naar de tabel met gebieden onder normale kromme, vinden we dat 95% van de gevallen ligt tussen M ± 1, 96 SE M. Dat we 95% zeker of juist zijn om te zeggen dat M pop zou liggen in het interval M + 1.96 SE M en M + 1.96 SE M en we zijn 5% fout om te zeggen dat M pop aan dit interval zal liggen.

Met andere woorden de waarschijnlijkheid dat M pop in het bereik M ± 1, 96 SE M is 95% (of 0, 95) en de waarschijnlijkheid dat M pop buiten het bereik ligt is 5% (of 0, 05). De waarde 1, 96 is de kritieke waarde op 0, 05 significantieniveau.

(b) 99% van het betrouwbaarheidsinterval:

Onder verwijzing naar de tabel met gebieden onder de normale curve, vinden we dat 99% van de gevallen ligt tussen M ± 2, 58 SE M. Dat we 99% zeker of juist zijn om te zeggen dat M pop zou liggen in het interval M - 2.58 SE M en M + 2.58 SE M en we zijn 1% fout om te zeggen dat M pop buiten dit interval zal liggen.

Met andere woorden, de waarschijnlijkheid dat M- pop zich in het bereik M ± 2, 58 SE M bevindt is 99% (of .99) en de waarschijnlijkheid dat M- pop buiten het bereik ligt, is 1% (of 0, 01). De waarde, 2, 58 is de kritieke waarde op 0, 01 significantieniveau.

Hier zien we dat het significantieniveau omgekeerd evenredig is aan de mate van precisie. Op het niveau van 05 zouden we in 95% van de gevallen accuraat zijn en in .01 significantieniveau zouden we in 99% van de gevallen correct zijn.

De onderstaande tabel gaat voor u verder:

Voorbeeld 1:

Het gemiddelde en SD van 225 jongens van klasse XII van Delhi in een test van Numerical Ability waren respectievelijk 48 en 6. Hoe goed deze gemiddelde staat voor M pop of schat M pop . (n = 225, σ = 6, Mean = 48]

Door te verwijzen naar de tabel van normale verdeling (Tabel A), vinden we dat alle meest alle (99.7) gevallen liggen met in ± 3σ. In het geval van ons voorbeeld zullen alle steekproefgemiddelden liggen tussen M pop + 3σ m en M pop - 3σ M. Dus, elk steekproefgemiddelde is het beste 3σ m minder dan M pop op 3σ M meer dan M pop .

Dus als we de waarde van σ M kennen, kunnen we de M pop afleiden uit ons steekproefgemiddelde. Hier 4 is de standaarddeviatie van de verdeling van steekproefgemiddelden waarvan ons gemiddelde één is. Alle voorbeeldgemiddelden die normaal rond M pop worden gedistribueerd, liggen tussen M pop + 3 SE M en M pop - 3 SE M.

3 SE M = 3 x .4 = 1.2

Hoewel we de precieze waarde van M pop niet weten, kunnen we op zijn minst met zekerheid zeggen dat M pop ertussenin ligt

(48 -1, 2) en (48 + 1, 2) of 46, 8 → 49, 2

Uit tabel A blijkt dat 95% van de verzwakkingen liggen tussen ± 1, 96 σ. In het geval van ons voorbeeld 95% betrouwbaarheidsinterval voor M-popbereiken van M - 1, 96 SE M tot M + 1, 96 SE M.

Nu, 1, 96 SE M = 1, 96 x .4 = .78

. . . M- 1, 96 SE M = 48 - .78 = 47.22 en M + 1.96 SE M = 48 + .78 = 48.78

. . . Het betrouwbaarheidsinterval van 95% varieert van 47, 22 tot 48, 78. Het 99% betrouwbaarheidsinterval voor M- pop varieert van M - 2, 58 SE M tot M + 2, 58 SE M.

Nu 2, 58 SE M = 2, 58 X, 4 = 1, 03

. . . M - 2.58 SE M = 48 -1.03 = 46.97 en M + 2.58 SE M = 48 + 1.03 = 49.03

. . . 99% betrouwbaarheidsinterval voor Mpopreeksen van 46, 97 tot 49, 03.

Voorbeeld 2:

Het gemiddelde en de SD van 400 studenten in een test bleken 42 en 8. Kun je de gemiddelde score van de populatie schatten met een betrouwbaarheidsinterval van 99% en 95%?

Oplossing:

(i) 95% betrouwbaarheidsinterval voor M-popbereiken van M - 1, 96 SE M tot M + 1, 96 SE M.

Nu 1.96 SE M = 1.96 x .4 = .784

. . . M-1, 96 SE M = 42-.784 = 41.22

en M + 1, 96 SE M = 42 + .784 = 42, 78 (tot twee decimalen).

Dus 95% betrouwbaarheidsinterval varieert van 41.22 tot 42.78. We zijn 95% nauwkeurig dat M pop tussen 41.22 en 42.78 ligt.

(ii) 99% betrouwbaarheidsinterval voor M-popbereiken van M - 2, 58 SE M tot M + 2, 58 SE M

Nu 2, 58 SE M = 2, 58 x 4 = 1, 03

. . . M - 2, 58 SE M = 42 - 1, 03 = 40, 97

en M + 2, 58 SE M = 42 + 1, 03 = 43, 03

Het 99% betrouwbaarheidsinterval varieert dus van 40, 97 tot 43, 03. We zijn er 99% zeker van dat M pop tussen 40.97 en 43.03 ligt.

Voorbeeld 3:

De gemiddelden en de SD van een steekproef van 169 jongens in een test van numeriek vermogen zijn respectievelijk 50 en 6:

(i) Bepaal het 95% -interval voor het populatiegemiddelde en interpreteer het.

(ii) Bepaal de aanvaardbare steekproeffout op 0, 05 en 0, 01 significantieniveau.

(iii) Bepaal een betrouwbaarheidsinterval van 99% voor M pop .

Oplossing:

M = 50

(i) 95% betrouwbaarheidsinterval voor Mp 0p varieert van M - 1, 96 SE M tot M + 1, 96 SE M.

Nu 1, 96 SE m = 1, 96 x 0, 46 = .90

Aldus M-1, 96 SE M = 50-.90 = 49.10

en M + 1, 96 SE M = 50 +, 90 = 50, 90

. . . Het betrouwbaarheidsinterval van 95% voor M- pop varieert van 49, 10 tot 50, 90. Uit de steekproef van 50 schatten we dat de M- pop een vaste waarde is tussen 49.10 en 50.90 en dat we daarmee voor 95% zeker zijn.

Met andere woorden, ons steekproefgemiddelde van 50 zal de M- pop met meer dan .90 niet missen en dit zal waar zijn voor 95 gevallen in 100. Als alternatief zal slechts in 5 gevallen in 100 ons steekproefgemiddelde van 50 de M- pop missen door meer dan .90.

(ii) Kritieke waarde op .05 significantieniveau = 1.96

Kritieke waarde op .01 significantieniveau = 2.58

"Sampling error = Critical value x SE M "

De bemonsteringsfout op .05 significantieniveau is dus 1, 96 SE M en die op .01 significantieniveau is 2, 58 SE M

Acceptabele steekproeffout op 0, 05-niveau = 1, 96 SE M = 1, 96 x 0, 46 = .90

Toegestane bemonsteringsfout op 0, 01 niveau = 2, 58 SE M = 2, 58 X 0, 46 = 1, 19

(iii) Het 99% betrouwbaarheidsinterval varieert van M - 2, 58 SE M tot M + 2, 58 SE M

Nu 2, 58 SE M = 2, 58 X, 46 = 1, 19

Aldus M-2, 58 SE M = 50 - 1, 19 = 48, 81

en M + 2, 58 SE M = 50 + 1, 19 = 51, 19

Het betrouwbaarheidsinterval van 99% varieert van 48, 81 tot 51, 19.

Voorbeeld 4:

Voor een bepaalde groep van 500 soldaten is de gemiddelde AGCT-score 95, 00 en SD 25.

(ii) Bepaal het .99-betrouwbaarheidsinterval voor het ware gemiddelde.

(ii) Het is onwaarschijnlijk dat het ware gemiddelde groter is dan welke waarde?

Oplossing:

(i) Het betrouwbaarheidsinterval van 99% varieert van M - 2, 58 SE M tot M + 2, 58 SE M.

Nu 2, 58 SE M = 2, 58 x 1, 12 = 2, 89

Aldus M-2, 58 SE M = 95, 0-2, 89 = 92, 11

en M + 2, 58 SE M = 95, 0 + 2, 89 = 97, 89

. . . Het betrouwbaarheidsinterval van 99% varieert van 92, 11 tot 97, 89.

Uit onze steekproefgemiddelden van 95, 0 schatten we dat het werkelijke gemiddelde een vaste waarde is tussen 92, 11 en 97, 89 en dat we dus voor 99% overtuigd zijn.

(ii) Ons steekproefgemiddelde van 95, 0 zal het ware gemiddelde met niet meer dan 2, 89 missen, dwz de waar is niet groter dan 97, 89.

(B) Berekening van SE M in kleine steekproef:

Het is gebruikelijk om elk monster groter dan 30 te bellen als een groot monster. Wanneer N groot is, is het niet de moeite waard om de correctie uit te voeren. Maar wanneer N "klein" is (minder dan 30), is het raadzaam om (N - 1) te gebruiken, en het is absoluut noodzakelijk wanneer N vrij klein is - zeg, minder dan 10.

De student moet onthouden (i) dat theoretisch (N - 1) altijd moet worden gebruikt wanneer SD een schatting van de populatie a moet zijn; en dat (ii) het onderscheid tussen "grote steekproefstatistieken" en "kleine steekproefstatistieken" in termen van een snijpunt van N = 30 arbitrair is, en gedeeltelijk een kwestie van gemak is.

Wanneer N kleiner is dan ongeveer 30, zou de formule voor de σ M of SE M moeten luiden:

Voorbeeld 5:

Volgend vijf studenten hebben scores in een test beveiligd:

Bepaal de limieten van 95% betrouwbaarheidslimiet voor het populatiegemiddelde.

De scores zijn - 11, 13, 9, 12, 15:

Oplossing:

M = 12

Hier is de df = n- 1 = 5-1 = 4

Verwijzend naar tabel D, met df = 4, is de t- waarde op .05 significantieniveau (dat wil zeggen 95% betrouwbaarheidsniveau) 2, 78.

Het betrouwbaarheidsinterval van 95% definieert M ± 2, 78 SE M

2, 78 SE M = 2, 78 x 1, 0 = 2, 78

M - 2, 78 SE M = 12 - 2, 78 x1, 0 = 9, 22 en

M + 2, 78 SE M = 12 + 2, 78 x 1, 0 = 14, 78

. . . De limieten van 95% betrouwbaarheidsinterval zijn 9.22 en 14.78.

Dit betekent dat P = .95 dat M- pop in het interval 9.22 tot 14.78 ligt.

Voorbeeld 6:

Tien metingen van reactietijd voor licht worden afgenomen van een ervaren waarnemer. Het gemiddelde is 175, 50 ms (milliseconden) en de S is 5, 82 ms. Bepaal het .95-betrouwbaarheidsinterval voor de M- pop ; het .99 betrouwbaarheidsinterval.

Oplossing:

n = 10, S = 5, 82 ms, M = 175, 50 ms

De df (vrijheidsgraden) beschikbaar voor het bepalen van t zijn (n - 1) of (10 - 1) = 9

(i) Bepaling 95% (of, 95) betrouwbaarheidsinterval:

Als u tabel D met 9 df invoert, lezen we dat t = 2, 26 op het punt .05.

95% betrouwbaarheidsinterval voor M-popbereiken van M - 2, 26 SE M tot M + 2, 26 SE M.

Nu 2, 26 SE M = 2, 26 x 1, 84 = 4, 16

Aldus M - 2, 26 SE M = 175, 50 -4, 16 = 171, 34

en M + 2, 26 SE M = 175, 50 + 4, 16 = 179, 66

. . . 95% betrouwbaarheidsinterval voor Mpopreeksen van 171, 34 tot 179, 66. De P is .95 dat de Mpop niet minder is dan 171.34 en niet groter is dan 179.66. Als we afleiden dat M pop binnen dit interval ligt, zouden we gedurende een lange reeks experimenten 95% van de tijd gelijk hebben en 5% fout.

(ii) Bepaling 99% (of .99) betrouwbaarheidsinterval:

Als we tabel D met 9 df ingeven, lezen we dat t = 3, 25 op 0, 01 punt. 99% betrouwbaarheidsinterval voor M-popbereiken van M - 3, 25 SE M tot M + 3, 25 SE M.

Nu 3, 25 SE M = 3, 25 x 1, 84 = 5, 98

Dus M - 3, 25 SE M = 175, 50 - 5, 98 = 169, 52

en M + 3, 25 SE M = 175, 50 + 5, 98 = 181, 48

. . . 99% betrouwbaarheidsinterval voor Mpopreeksen van 169, 52 tot 181, 48.

De P is .99 dat de M- pop niet minder is dan 169.52 en niet groter is dan 181.48. Als we afleiden dat M pop binnen dit interval ligt, zouden we gedurende een lange reeks experimenten gelijk moeten hebben - 99% van de tijd en 1% fout.

Inferenties met betrekking tot andere statistieken:

Omdat alle statistieken bemonsteringsverdelingen en standaardfouten hebben, kan de significantie van de mediaan, kwartielafwijking, standaarddeviatie, percentages en andere statistieken worden geïnterpreteerd als die van het gemiddelde en kunnen we de parameter schatten.

(i) Standaardfout van de mediaan (of SE Mdn -):

In termen van SD en Q kunnen de SE's van de mediaan voor grote steekproeven worden berekend aan de hand van de volgende formules:

waarin σ = SD van het monster, n = grootte van het monster en Q = Kwartielafwijking van het monster.

Een voorbeeld illustreert het gebruik en de interpretatie van de formules:

Voorbeeld 7:

Op de Trabue Language Scale A maakten 801 elfjarige jongens het volgende record:

Mediaan = 21, 40 en Q = 4, 90. Hoe goed vertegenwoordigt deze mediaan de mediaan van de populatie waaruit dit monster wordt getrokken?

Oplossing:

n = 801, Mdn = 21, 40, Q = 4, 90.

Door de tweede formule toe te passen, de

Omdat N groot is, kan de steekproefverdeling als normaal worden beschouwd en het betrouwbaarheidsinterval worden gevonden uit de laatste regel in tabel D. Het .99-betrouwbaarheidsinterval voor de Mdn- pop is 21, 40 ± 2, 58 x 0, 32 of 21, 40 ± 0, 83.

We mogen er zeker van zijn dat de mediaan van de populatie niet minder is dan 20, 57 noch meer dan 22, 23. Dit smalle bereik toont een hoge mate van betrouwbaarheid in de mediaan van het monster.

(ii) Standaardfout van standaarddeviatie (SE σ ):

De standaardfout van standaarddeviatie, zoals SE M, wordt gevonden door de waarschijnlijke divergentie van de voorbeeld-SD uit zijn parameter (populatie-SD) te berekenen. De formule voor SE σ is

Voorbeeld 8:

n = 400, σ = 6

Hoe goed vertegenwoordigt deze SD de SD van de populatie waaruit het monster is getrokken?

Oplossing:

Wanneer de steekproeven groot zijn en willekeurig van hun bevolking worden getrokken, kan de bovengenoemde formule op dezelfde manier als SE M worden toegepast en worden geïnterpreteerd.

Omdat N groot is, kan het .99-betrouwbaarheidsinterval voor SD pop veilig worden genomen bij de limieten ± 2.58 σ σ . Vervanging voor σ σ we hebben 6 ± 2.58 x .21 ie de limieten tussen (6 - .54) en (6 + .54) of 5.46 en 6.54.

Als we aannemen dat de SD- pop tussen de limieten 5.46 en 6.54 ligt, moeten we 99% van de tijd gelijk hebben en 1% fout.

(iii) Standaardfout van de kwartielafwijking (of SE Q of σ q ):

SE Q is te vinden in de formules:

Voorbeeld 9:

n = 801, Q = 4, 90

Hoe goed vertegenwoordigt deze Q de kwartielafwijking van de bevolking?

Oplossing:

Door de formule toe te passen

Het .99-vertrouwensinterval voor de Q- pop is van 4.90 ± 2.58 x .203, dwz van 4.38 tot 5.42. Dit bereik laat zien dat de sample Q een zeer betrouwbare statistiek is.

(iv) Standaard-foutpercentage (of SE% of σ%):

Geef het percentage dat voorkomt aan een gedrag, vaak rijst de vraag hoeveel vertrouwen we in de figuur kunnen plaatsen. Hoe betrouwbaar is een index ons percentage van de incidentie van het gedrag waarin we geïnteresseerd zijn? Om deze vraag te beantwoorden,

We moeten de SE van een percentage berekenen met de formule:

waarin

p = het percentage dat het gedrag voorkomt, q = (1 - p)

n = aantal gevallen.

Voorbeeld 10:

In een onderzoek naar valsspelen onder basisschoolkinderen bleek dat 100 of 25% van de 400 kinderen uit huizen met een hoge sociaaleconomische status verschillende tests hadden bedrogen. Hoe goed staat het voor het bevolkingspercentage?

Oplossing:

p = 25% (percentage voorkomen)

q = 75% (100% - 25%)

99% betrouwbaarheidsinterval voor bevolkingspercentage varieert van

25% ± 2, 58 x 2, 17%.

25% - 2, 58 x 2, 17% = 25% - 5, 60% = 19, 4%

en 25% + 2, 58 x 2, 17% = 25% + 5, 60 = 30, 60%

We kunnen er met 99% vertrouwen van uitgaan dat basisschoolkinderen met een hoge sociaaleconomische status vals spelen met ten minste 19, 4% en niet groter dan 30, 60%.

(v) Standaardfout van de coëfficiënt van correlatie (SE r of σ r ):

De klassieke formule voor de SE van a-is

(SE van een coëfficiënt van correlatie r wanneer N groot is)

Voorbeeld 11:

n = 120, r = .60.

Wat zijn de limieten van 99% betrouwbaarheidsinterval voor populatie r

Oplossing:

99% betrouwbaarheidsinterval

= r ± 2, 58 SE r =. 60 ± 2, 58 SE r

= .60 ± .15 of .45 tot .75

Belangrijke statistische voorwaarden:

(i) Niveaus:

.05:

Kans om fout te gaan in 5 van de 100 monsters.

.01:

Kans om fout te gaan in 1 van de 100 monsters.

(ii) Vertrouwen:

Op .05-niveau van significantie heeft de onderzoeker 95% zekerheid dat de gegevens de populatie moeten representeren.

In .01-niveau van significantie heeft de onderzoeker 99% zekerheid dat de steekproefstatistiek de populatie moet representeren.

(iii) Niveaus van betekenis:

Voordat de hypothese wordt getest, moeten we de criteria bepalen waarmee we de nulhypothese willen accepteren of verwerpen. We moeten het niveau van significantie voorafgaand aan de test instellen. Twee niveaus van significantie worden algemeen gebruikt, namelijk .05 niveau en .01 niveau.

(a) .05 niveau van significantie:

We lezen uit tabel A dat 95% van de gevallen in een normale verdeling binnen de limieten ± 1, 96 SE M valt . Als we de limieten nemen die zijn gespecificeerd met M ± 1, 96 SE M, definiëren we een interval waarvoor het vertrouwensniveau .95 is. Op basis van ons oordeel dat deze limiet zo groot is als M pop op deze limieten, hebben we 95% van de tijd gelijk en 5% verkeerd.

Het gebied tussen - 1, 96 SE M en + 1, 96 SE M staat bekend als het aanvaardingsgebied van Ho en het gebied daarbuiten - 1, 96 SE M en + 1, 96 SE M staat bekend als het gebied van afstoting. Als een steekproefgemiddelde in het acceptatiegebied ligt, accepteren we de H o . Bij het afwijzen van de H o geven we toe dat het steekproefgemiddelde buiten ± 1, 96 SE M valt .

Dus bij het afwijzen van H o maken we een fout van 5% omdat in 5% van de 100 eases zo'n steekproefgemiddelde kan voorkomen. We zijn bereid om een ​​risico van 5% te nemen om H o af te wijzen als het waar is. Dus de criteria voor het afwijzen van Ho zijn geschokt door het niveau van significantie.

(b) .01 niveau van significantie:

We lezen in tabel A dat 99% van de verzwakkingen in een normale verdeling binnen de limieten ± 2, 58 SE M vallen . Als we de limieten gespecificeerd door M ± 2, 58 SE M overschrijden, definiëren we een interval waarvoor het vertrouwensniveau .99 is. Op basis van ons oordeel over de grootte van M pop op deze limieten, hebben we 99% van de tijd gelijk en 1% fout.

Het gebied tussen - 2, 58 SE M en + 2, 58 SE M zou het acceptatiegebied van H 0 zijn en het gebied erachter zou het gebied zijn van afwijzing van Ho . We zijn bereid om 1% risico te nemen in het afwijzen van H o als het waar is.

.01 niveau van significantie is veeleisender dan het .05 niveau, omdat in .01 niveau de fout in het afwijzen van H o 1% is, terwijl in .05 niveau zo'n fout 5% is.

(iv) t-distributie:

Wanneer N kleiner is dan ongeveer 30 dwz wanneer het monster klein is, wordt de steekproefverdeling " t -verdeling" genoemd.

De t-verdeling verschilt niet veel van de normale tenzij N vrij klein is. Naarmate N groter wordt, benadert de t- verdeling steeds meer de normale vorm.

Eigenschappen van t-distributie:

1. Het ziet eruit als een klokvormige curve. Maar de verdeling ervan is meer variabel met nul scheefheid en 'Ku' groter dan 3.

2. Het is symmetrisch over de lijn t = 0.

3. Het is unimodaal met maximale ordinaat op t = 0.

4. Als N klein is, ligt de t- verdeling onder de normale curve, maar de staarten of uiteinden van de curve zijn hoger dan de overeenkomstige delen van de normale curve.

5. De eenheden langs de basislijn van de t- verdeling zijn in feite σ scores, dwz

(v) Vrijheidsgraden (df):

Het concept van vrijheidsgraden is zeer belangrijk in kleine voorbeeldstatistieken. Het is ook cruciaal, in de analyse van variantie en in andere procedures. Vrijheidsgraden betekent vrijheid om te variëren.

Laten we vijf scores kiezen waarvan het gemiddelde 15 is. Stel nu dat de vier scores 18, 10, 20, 15 zijn. Wil het gemiddelde gelijk zijn aan 15, dan moet de vijfde score 12 zijn. We hebben natuurlijk vrijheid om elke vier scores te kiezen.

Maar we hebben geen vrijheid om de 5e score te kiezen omdat de 5e score aanpassingen maakt in de variatie veroorzaakt door de eerste vier scores en met een aanname dat het gemiddelde 15 zal zijn. Hier is de N = 5 en één beperking is opgelegd, dwz de gemiddeld moet 15. Daarom is de vrijheidsgraad N - 1 of 4.

Als we 5 scores 5, 6, 7, 8 en 9 hebben, is het gemiddelde 7; en de afwijkingen van onze scores van 7 zijn - 2, - 1, 0, 1 en 2. De som van deze afwijkingen is nul. Van de 5 afwijkingen, kan alleen 4 (N - 1) "vrij" worden geselecteerd als de voorwaarde dat de som gelijk aan nul onmiddellijk de waarde van de 5e afwijking beperkt.

De SD is natuurlijk gebaseerd op de vierkanten van de afwijkingen die rondom het gemiddelde zijn gemaakt. Er zijn N df voor het berekenen van het gemiddelde, maar alleen (N - 1) beschikbaar voor de 'S' (de SD) als één df verloren gaat bij het berekenen van het gemiddelde.

In een ander voorbeeld, waarbij N = 10, werd de df beschikbaar voor het schatten van de M- pop gegeven als 9 of (N-1), di één minder dan het aantal waarnemingen, namelijk 10. Eén df gaat verloren bij het berekenen van de M en dienovereenkomstig er zijn er nog maar 9 over om de M- pop te schatten door middel van 'S' en de t-verdeling.

Telkens wanneer een statistiek wordt gebruikt om een ​​parameter te schatten, is de regel dat de beschikbare df gelijk is aan N minus het aantal parameters dat al is geschat op basis van de steekproef. De M is een schatting van M pop en bij het berekenen verliezen we 1 df .

Bij het schatten van de betrouwbaarheid van een r, bijvoorbeeld (die afhangt van de afwijkingen van twee gemiddelden), zijn de df (N - 2). In het geval van chikwadraattests en variantie-analyse worden afzonderlijke procedures gevolgd voor het bepalen van de df .

(vi) Null hypothese:

De nulhypothese is een nuttig hulpmiddel bij het testen van de significantie van verschillen. Deze hypothese stelt dat er geen echt verschil is tussen twee populatiemiddelen, en dat het verschil dat wordt gevonden tussen steekproefgemiddelden daarom per ongeluk en onbelangrijk is.

De nulhypothese heeft te maken met het rechtsbeginsel dat "een man onschuldig is totdat hij schuldig is bevonden." Het is een uitdaging en de functie van een experiment is om de feiten een kans te geven om deze uitdaging te weerleggen (of niet te weerleggen).

Om te illustreren, stel dat er beweerd wordt dat "de instructienormen van scholen met één ploeg beter zijn dan de scholen met dubbele dienst". Deze hypothese is vaag gesteld en kan niet nauwkeurig worden getest.

Als we beweren dat "scholen met één ploeg geen betere onderwijsnormen opleveren dan scholen met een dubbele ploeg" (het echte verschil is nul). Deze nulhypothese is exact en kan worden getest. Als onze nulhypothese niet-belastbaar is, moet deze worden afgewezen. De verklaring zonder verschil veronderstelt dat de twee groepen worden getest en gelijk blijken te zijn.

De nulvorm heeft de voorkeur van de meeste ervaren onderzoekspersoneel. Deze vorm van verklaring definieert gemakkelijker het wiskundige model dat moet worden gebruikt in de statistische test van de hypothese.

Een nulhypothese wordt nooit bewezen of weerlegd. Het kan worden aanvaard of afgewezen met een zekere mate van vertrouwen (of op een bepaald niveau van significantie).

Voordat we een hypothese testen, moeten we rekening houden met het volgende:

1. Of het monster groot of klein is.

2. Wat is het niveau van significantie.

3. Of de test een tweezijdige toets of een eenzijdige toets is.

(vii) Fouten bij het maken van conclusies:

Terwijl we een nulhypothese aanvaarden of verwerpen, bestaat de mogelijkheid om twee soorten fouten te begaan en de onderzoekers rekening te houden met lust.

Wat type I- en Type II-fouten worden genoemd, kan hieronder worden uitgelegd:

Type I-fouten:

Dergelijke fouten worden vastgelegd wanneer we een nulhypothese verwerpen door een verschil significant te markeren, hoewel er geen echt verschil is. Stel dat het verschil tussen twee populatiemiddelen (M pop - M pop = 0) eigenlijk nul is. (Jongens en meisjes kunnen bijvoorbeeld worden beschouwd als dezelfde populatie met betrekking tot de meeste mentale tests). Als het testen van de significantie van twee steekproefgemiddelden een feit weergeeft dat het verschil in populatiemiddel significant is, begaan we Type I-fout.

Type II fouten:

Zulk soort fouten worden gepleegd wanneer we een nulhypothese accepteren door een verschil te markeren dat niet significant is, hoewel er een echt verschil is. Stel dat er een echt verschil is tussen de twee populatiemiddelen.

Als onze toetsing van significantie toegepast op de twee steekproef betekent dat we geloven dat het verschil in populatiemiddelen niet significant is, plegen we een Type II-fout.

Er kunnen verschillende voorzorgsmaatregelen worden genomen om beide soorten fouten te voorkomen. Als we een laag niveau van significantie instellen (P is groter dan .05), verhogen we de kans op Type I-fouten; terwijl, als we een hoog niveau van significantie instellen (P is minder dan .05), de Type I-fouten minder zullen zijn. De mogelijkheid om verkeerde gevolgtrekkingen van type II-sortering te trekken, wordt verbeterd wanneer we een zeer hoog niveau van significantie vaststellen.

(viii) Two-tailed en One-tailed tests van betekenis:

In de nulhypothese kunnen verschillen tussen de verkregen gemiddelden (dwz M 1 - M 2 ) plus of minus zijn. Bij het bepalen van kansen nemen we beide zijden van de steekproefverdeling.

(ix) Kritieke verhouding (CR):

Kritische verhouding (CR) wordt gevonden door het verschil tussen de steekproefgemiddelden te delen door zijn standaardfout (CR = D / SE D ). Wanneer N's ​​van de monsters groot zijn (30 of meer is "groot"), is bekend dat de verdeling van CR's normaal is rond het ware verschil tussen de populatiemiddelen, t is een kritieke verhouding waarin een meer exacte schatting van de σ D is gebruikt. De steekproefverdeling van t is niet normaal wanneer N klein is (minder dan 30, zeg maar), t is een CR; maar alle CR's zijn geen t's.

Tweestaarttest:

1. Bij een tweeaderige test houden we rekening met zowel de staarten van de normale curve.

2. In het geval van alternatieve hypotheses zonder staart maken we een tweezijdige toets.

3. Voorbeeld:

Een rentetest wordt toegediend aan bepaalde jongens in een beroepsopleiding. Trainingsles en bepaalde jongens in een Latijnse klas. Is het gemiddelde verschil tussen de twee groepen significant op het .05-niveau?

4. Het steekproefgemiddelde wijkt af van M- pop in beide richtingen + of -.

5. H 0 : M 1 - M 2 = 0

H A : M 1 = M 2

6. Waarde significant te zijn:

1.96 op .05 niveau

2.58 op .01 niveau

7. Het gebied van afwijzing wordt gesplitst aan beide uiteinden (staarten) van de normale curve (dwz 05 in .025 en .025, 01 in .005 en .005).

Eenzijdige toets:

1. We moeten één kolom nemen, dwz aan de linker- of rechterkant van de normale curve.

2. In het geval van directionele alternatieve hypotheses maken we een eenzijdige test nl., M 1 > M 2 . In een dergelijk geval is de richting heel duidelijk - eenzijdig.

3.Example:

Tien onderwerpen krijgen 5 opeenvolgende paden bij een cijfer-symbool test waarvan alleen de scores voor paden 1 en 5 worden getoond. Is de gemiddelde winst van de eerste tot de laatste proef significant?

4. Het steekproefgemiddelde wijkt in één richting af van het populatiegemiddelde.

5. H 0 : M 1 = M 2

H A : M 1 > M 2 of M 1 <m 2

6. Waarde significant te zijn:

1.62 op .05 niveau

2.33 op .01 niveau

7. Er is één afkeurgebied aan de rechterzijde van de distributie of de linkerstaart van de verdeling.