5 Methoden voor het weergeven van frequentieverdeling

De volgende methoden worden gewoonlijk gebruikt om frequentieverdelingen in grafische vorm weer te geven: 1. Histogram of kolomdiagram 2. Staafdiagram of staafdiagram 3. Frequentie Veelhoek 4. Afgevlakte frequentie Veelhoek 5. Cirkeldiagram.

Methode # 1. Histogram of kolomdiagram:

Het is een van de meest populaire en meest gebruikte ontmoetingen met het presenteren van een frequentieverdeling. Een histogram is een reeks rechthoeken waarvan de gebieden evenredig zijn aan klassefrequenties. Het is een grafiek waarin de frequenties worden gerepresenteerd door balken. Het histogram wordt weergegeven als een reeks staafdiagrammen die naast elkaar op een verticale manier worden geplaatst.

Let op de volgende eigenschappen van het histogram:

(i) Frequenties liggen langs de verticale as en de scores (CI) liggen langs de horizontale as.

(ii) Men veronderstelt dat de scores gelijkmatig verdeeld zijn binnen het klasse-interval, waardoor we rechthoekige balken krijgen.

(iii) De frequenties binnen elk interval van een histogram worden weergegeven door een rechthoek, waarbij de grootte van het interval de basis is en de frequentie van dat interval de hoogte.

(iv) Het gebied van elke rechthoek in een histogram komt overeen met de frequentie binnen een gegeven interval, terwijl het totale gebied van een histogram overeenkomt met de totale frequentie (N) van de verdeling.

(v) Een histogram kan het beste worden geconstrueerd op een ruitjespapier, dat wordt bepaald met horizontale en verticale lijnen met gelijke tussenruimte.

Laten we eens kijken hoe het histogram voor de frequentieverdeling in twee situaties kan worden geconstrueerd, dat wil zeggen wanneer klassenintervallen gelijk zijn en klassenintervallen ongelijk zijn.

Histogram (gelijk klasseninterval):

Stap 1:

In tabel 2.12 worden klassen gegeven en als een eerste stap moeten deze worden omgezet in klassen met echte of feitelijke klassenlimieten zoals gegeven in de tweede kolom van dezelfde tabel.

Stap 2:

Over het algemeen is een vrije klasse ook toegestaan ​​aan beide uiteinden van de klassen en om te worden gereflecteerd aan twee extreme uiteinden van de horizontale schaal, dwz 9.5 en 99.5 (zie figuur 2.1). Dit verbetert de leesbaarheid van de grafiek en is ook nuttig bij de constructie van een frequentiepolygoon.

Stap 3:

Vervolgens worden deze echte klassenlimieten samen met de horizontale as (X-as) uitgezet met behulp van een geschikte meetschaal. Om symmetrie en balans te geven aan het histogram of een grafische weergave, moet men voorzichtig zijn bij het selecteren van eenheidsafstanden om de klassenlimiet op X-as en de frequenties op de Y-as te vertegenwoordigen.

Voor het weergeven van deze afstanden worden de schalen van metingen op twee assen zo geselecteerd dat de hoogte van het histogram of een andere grafische weergave ongeveer 75 procent van de breedte ervan is.

Stap 4:

Wanneer de onderlimiet toevallig een verre score van de oorsprong is, geeft u een pauze in de X-as (∫∫) om aan te geven dat de verticale as voor het gemak is verplaatst. Start dan de X-as met de ondergrens van het laagste klasseninterval.

Een histogram dat de frequentieverdeling van scores in tabel 2.12 voorstelt, wordt getoond in figuur 2.1. In deze figuur is de hoogte van de rechthoek gevormd over klasse 19.5- 29.5 4 eenheden langs de verticale schaal en als zodanig wordt het gebied 4 x 1 = 4 vierkante eenheden, wat gelijk is aan de frequentie van de klasse. Evenzo worden hoogten van andere rechthoeken gevormd over opeenvolgende klassen genomen als respectievelijk 6, 8, 12. 9, 7 en 4.

Histogram (ongelijk klasseninterval):

Laten we om een ​​voorbeeld te nemen de klassen 150 - 154 en 155-159 willekeurig in een klasse onderbrengen als 150 - 159 * en 185 - 189 en 190 - 194 in een klasse als 185 - 194 ** in tabel 2.13.

Het klasse-interval van de vierde en tiende klas is twee keer dat van de rest van de klassen. De frequenties in deze twee klassen zijn dus niet vergelijkbaar met andere klassen. Om deze vergelijkbaarheid vast te stellen, moeten de frequenties in de grotere klassen gehalveerd of gedeeld worden door twee.

Alvorens een histogram te vormen voor frequentieverdeling met ongelijke klasse-intervallen, moeten dus alle grotere klassen worden uitgedrukt als veelvouden van kleinere klassen; en verdeelde vervolgens de corresponderende klassenfrequenties met deze veelvouden.

Deze indeling geeft dan de hoogte van de rechthoeken zoals getoond in tabel 2.14. Hoogtes van andere rechthoeken gevormd over klassen van eenheidslengtes zullen echter gelijk blijven aan overeenkomstige klassenfrequenties. De frequentieverdeling van scores in tabel 2.14 wordt weergegeven in figuur 2.3.

voordelen:

1. Het is eenvoudig en gemakkelijk gemaakt.

2. Alle voordelen van de grafische weergave zoals eerder getoond, zijn hier van toepassing.

beperkingen:

1. Het is moeilijk om meer dan één histogram op dezelfde grafiek te plaatsen.

2. Vergelijkingen van verschillende frequentieverdelingen kunnen niet gemakkelijk worden gemaakt via histogrammen. Frequentiepolygonen zijn veel beter geschikt voor dat doel.

3. De aanname dat de scores gelijkmatig binnen de CI worden verdeeld, produceert een grotere fout wanneer N klein is dan wanneer N groot is.

4. Het kan niet worden geëffend.

Methode # 2. Staafdiagram of staafdiagram:

Staafdiagram is een van de gemakkelijkste en meest gebruikte apparaten voor het presenteren van discrete seriegegevens. Deze zijn vooral bevredigend voor categorische gegevens of reeksen. Ze bestaan ​​uit een groep equidistante rechthoeken, één voor elke groep of categorie van de gegevens waarin de waarden of de magnituden worden weergegeven door de lengte of hoogte van de rechthoeken, waarbij de breedte van de rechthoeken willekeurig en immaterieel is.

Deze diagrammen worden eendimensionaal genoemd omdat in dergelijke diagrammen slechts één dimensie, namelijk hoogte (of lengte) van de rechthoeken, in aanmerking wordt genomen om de gegeven waarden te presenteren.

De volgende punten kunnen in gedachten worden gehouden om staafdiagrammen te tekenen:

(i) Alle in een enkele studie getrokken staven moeten een uniforme (hoewel willekeurige) breedte hebben, afhankelijk van het aantal te tekenen staven en de beschikbare ruimte.

(ii) Tussen verschillende staven moet een juiste maar uniforme tussenruimte worden gegeven om het diagram er aantrekkelijker en eleganter uit te laten zien.

(iii) De hoogte (lengte) van de rechthoeken of staven wordt genomen in verhouding tot de grootte van de waarnemingen, waarbij de schaal wordt geselecteerd met het oog op de omvang van de grootste waarneming.

(iv) Alle staven moeten op dezelfde basislijn worden geconstrueerd.

(v) Het is wenselijk om de cijfers (magnitudes) te schrijven die worden gerepresenteerd door de balken aan de bovenkant van de balken, zodat de lezer een precies idee van de waarde kan hebben zonder naar de schaal te kijken.

(vi) Staven mogen verticaal of horizontaal worden getrokken. In de praktijk worden verticale balken meestal gebruikt omdat ze een aantrekkelijke en aantrekkelijke opstaan ​​geven.

(vii) Waar mogelijk moeten de staven van links naar rechts worden gerangschikt (van boven naar beneden in het geval van horizontale staven) in de orde van grootte om een ​​aangenaam effect te geven.

In een bepaalde stad is het totale aantal scholen 24 en de managementsgewijze verdeling van scholen zoals weergegeven in tabel 2.15.

Voor een discrete variabele is de maateenheid op de horizontale as niet belangrijk. Ook zijn de klassen niet gerelateerd aan elkaar. De staven zijn dus op gelijke afstanden geplaatst en hebben dezelfde breedte op de horizontale as.

De hoogte van de balken is echter evenredig met de respectieve frequenties. Staafdiagrammen worden vaak gebruikt voor de grafische weergave van discrete gegevens. Als twee variabelen tegelijkertijd worden gebruikt, kunnen zelfs de grafieken behoorlijk effectief zijn.

Als bijvoorbeeld naast het totale aantal scholen (op managementniveau) ook het aantal jongensscholen, meisjesscholen en co-ed-scholen wordt vermeld, dan kan dit op hetzelfde millimeterpapier worden gedaan door verschillende kleuren te gebruiken, die elk de geslachtsspecifieke categorie aanduiden. Voor elk beheer zijn er 4 balken met verschillende kleuren die verschillende categorieën aangeven.

Methode # 3. Frequentie Polygoon:

Een veelhoek is een close-up met veel hoeken. De frequentiepolygoon is een grafische weergave van de frequentieverdeling waarin de middelpunten van de CI zijn uitgezet tegen de frequenties.

Laten we bespreken hoe een frequentiepolygoon kan worden getekend:

Stap 1:

Trek twee rechte lijnen loodrecht op elkaar, de verticale lijn aan de linkerkant van het papier, de horizontale lijn aan de onderkant. Label de verticale lijn (Y-as) OY en de horizontale lijn (X-as) OX. Plaats de O waar de twee lijnen elkaar kruisen. Dit punt is de oorsprong.

Om symmetrie en balans te geven aan de polygoon, moet voorzichtigheid worden betracht bij het selecteren van eenheidsafstanden op beide assen. Een goede algemene regel is om X- en Y-eenheden te selecteren die de hoogten van de figuur ongeveer 75% van de breedte ervan zullen maken.

Stap 2:

Vervolgens moet de middelpunten van de CI op de horizontale as worden aangegeven in plaats van de grenzen van de integraal aan te geven. Hier moet ook het middelpunt van de intervallen net voor het laagste interval en net na het hoogste interval worden aangegeven (de middelpunten 137 en 202 in Tabel 2.16). Langs de verticale lijn markeert u de eenheden om de frequenties van de klassenintervallen weer te geven.

Stap 3:

Ga bij het middelpunt van elk interval op de X-as in Y-richting een afstand gelijk aan het aantal scores op het interval. Plaats punten op deze locaties.

Stap 4:

Na het plotten van alle punten op de grafiek worden deze punten samengevoegd door een reeks korte rechte lijnen om de frequentiepolygoon te vormen.

Methode # 4. Afgevlakte frequentieveelhoek:

Een frequentiepolygoon moet worden geëffend:

ik. Om toevallige onregelmatigheden glad te strijken;

ii. Om een ​​betere indruk te krijgen van hoe het cijfer eruit zou kunnen zien als de gegevens talrijker waren;

iii. Weten hoe een polygoon eruit zou zien als groeperingsfouten en steekproeffouten eruit worden verwijderd, en

iv. Bepalen welke vorm het zou aannemen als het omstandigheden weergeeft die vrij zijn van kleine toevallige fluctuaties.

Bij het effenen van een frequentiepolygoon wordt een reeks bewegende of lopende gemiddelden genomen, waaruit nieuwe of aangepaste frequenties worden bepaald. Om een ​​aangepaste of afgevlakte ' f te vinden, voeg je de f toe op het opgegeven interval en de fs op de twee aangrenzende intervallen (het interval net eronder en het interval net erboven) en deel je ze door 3.

Bijvoorbeeld, de afgevlakte f voor interval 170-174 in tabel 2.17 is (8 + 10 + 6) / 3 of 8.00. Om de afgevlakte fs te vinden voor de twee intervallen aan de uiteinden van de verdeling, namelijk 140-144 en 195-199, is een iets andere procedure noodzakelijk. Eerst voegen we 0 toe, de f op het stapinterval onder of boven, aan de f op het gegeven interval en aan de f op het aangrenzende interval, en delen door 3. De afgevlakte f voor 140-144 is (0 + 1 + 3) / 3 is of 1, 33; en de afgevlakte f voor 195-199 is (2 + 1 + 0) / 3 of 1.00.

We moeten nog twee CI nemen op 135-139 en de andere 200-204, waarvoor de f wordt genomen als 0. Hun afgevlakte f in elk geval is (0 + 0 + 1) / 3 of .33 en (0 + 0 + 1) / 3 of .33. De opname van deze laatste twee intervallen maakt N = 50, 00 voor de afgevlakte verdeling.

Als N groot is, kan vloeiend maken de vorm van een grafiek niet sterk veranderen en is deze daarom vaak niet nodig.

voordelen:

(i) Het is eenvoudig en gemakkelijk gemaakt.

(Ii) Het is mogelijk om meer dan één frequentiepolygoon in dezelfde grafiek op elkaar te plaatsen met gekleurde lijnen, stippellijnen, stippellijnen, enzovoort.

(iii) Vergelijkingen van verschillende frequentieverdelingen kunnen eenvoudig worden gemaakt via frequentiepolygonen.

(iv) Alle voordelen van de grafische weergave zoals eerder besproken zijn hier van toepassing.

(v) Het kan worden afgevlakt. Beperkingen.

Beperking:

(ii) Het deel van het gebied dat boven een bepaald interval ligt, kan niet worden genomen als evenredig aan de frequentie van dat CI als gevolg van onregelmatigheden in het frequentieoppervlak.

(Ii) De aanname dat alle scores binnen een CI in het midden van dat interval vallen, levert een grotere fout op wanneer N groter is dan wanneer N klein is.

(Iii) Het is minder precies dan het histogram in die zin dat het niet nauwkeurig, dat wil zeggen in termen van oppervlakte, de frequentie bij elk interval weergeeft.

De cumulatieve frequentie grafiek:

De cumulatieve frequentiegrafiek is een andere manier om een ​​frequentieverdeling weer te geven door middel van een diagram. Voordat we een cumulatieve frequentiegrafiek kunnen plotten, moeten de scores van de verdeling serieel of gecumuleerd worden toegevoegd, zoals weergegeven in tabel 2.18.

Om de Cum.f voor elke rij te bepalen, moeten we de f s geleidelijk vanaf de onderkant toevoegen. Ter illustratie, bij de verdeling van scores is de eerste cumulatieve frequentie 1; 1 + 3, vanaf het laagste punt van de verdeling, geeft 4 als de volgende invoer; 4 + 2 = 6; 6 + 4 = 10, etc. De laatste cumulatieve / is natuurlijk gelijk aan 50 of N, de totale frequentie.

Bij het plotten van de frequentiepolygoon wordt de frequentie van elk interval genomen in het midden van het klasse-interval. Maar bij het construeren van een cumulatieve frequentiekromme wordt elke cumulatieve frequentie uitgezet tegen de exacte bovengrens van het interval waarop deze valt.

Dit komt omdat bij het geleidelijk optellen van elke cumulatieve frequentiedraaggolf tot de exacte bovengrens van het klasse-interval. Met een gekozen schaal kunnen we, als we de bovenste limieten van de ci's langs de X-as nemen en de Cum-s langs de Y-as nemen, een grafiek tekenen voor de cumulatieve frequentieverdeling.

In een cumulatieve frequentiekromme wordt elke cumulatieve frequentie geplot op de bovengrens van het interval. Om de curve op de X-as te laten beginnen, wordt deze gestart op 139, 5 (exacte bovenlimiet van 134, 5-139, 5), waarvan de cumulatieve frequentie 0 is.

De cumulatieve percentagecurve of Ogive:

Bij het tekenen van een 'Ogive' moeten we het cumulatieve percentage frequenties berekenen aan de bovengrens van elke ci 'Cumulatief percentage Frequentie' betekent welk percentage van N het Cum- f is . De cumulatieve percentagecurve of ogive verschilt van de cumulatieve frequentiegrafiek doordat frequenties worden uitgedrukt als cumulatieve percentages van N op de Y-as in plaats van als cumulatieve frequenties. Tabel 2.19 laat zien hoe cumulatieve frequenties in een percentage van N kunnen worden omgezet.

In kolommen (1), (2) en (3) klasse-intervallen worden de bovengrenzen van ci's en frequenties vermeld; en in kolom (4) zijn de f 's gecumuleerd vanaf het lage uiteinde van de verdeling naar boven. Deze Cumulaties worden uitgedrukt als percentages van N in kolom (5). De omzetting van Cum. S in cumulatieve percenten kan worden uitgevoerd door elke cumulatieve / door N te delen; bijv. 2 + 40 = .05, 6 + 40 = .15, enzovoort.

Een betere methode, vooral als er een rekenmachine beschikbaar is, is om eerst het omgekeerde te bepalen. 1 / N, genaamd de snelheid, en vermenigvuldig elke cumulatieve f in volgorde met deze fractie. Zoals weergegeven in tabel 2.19 is de snelheid 1/40 of 0, 025. Dus vermenigvuldigen we 2 met 0, 025, we krijgen 0, 05 of 5%; 6 X. 025 =. 15 of 15%, etc.

De curve in figuur 2.8 vertegenwoordigt een ogive geplot op basis van de gegevens in kolom (5), tabel 2.19. De exacte intervallimieten zijn op de X-as afgelegd en een schaal bestaande uit 10 gelijke afstanden, die elk 10% van de verdeling vertegenwoordigen, is op de Y-as gemarkeerd. Het eerste punt op het ogief is geplaatst op 5 Y-eenheden net boven de 35, 5. Het laatste punt is 100 Y-eenheden boven 56, 5 exacte bovengrens van het hoogste klasinterval.

Van het ogive kunnen we PR lezen. van verschillende scores en ook de percentielen:

(a) percentielen uit het ogief lezen:

Stel dat we P 2 5 willen achterhalen. Zoals we weten, is P 25 een punt waaronder 25% van de gevallen ligt. Laten we 25 op Y-as lokaliseren en vanaf dit punt een horizontale lijn tekenen. Het zal op een gegeven moment het ogive ontmoeten.

Teken vanaf dat punt een loodrechte X-as. Van X-as kunnen we de score lezen. Van het ogief kunnen we lezen dat P 2 5 = 41.5. Evenzo kunnen we lezen dat P 50 = 46, 6 en P 75 = 49. We kunnen andere percentielen op dezelfde manier van het ogief lezen.

(b) Het lezen van percentielranglijsten van scores:

Stel dat we die PR van een score van 53, 5 willen weten. We moeten deze score op de X-as vinden en vanaf dit punt een verticale lijn tekenen. De lijn zal op een gegeven moment het ogive ontmoeten van waaruit we een horizontale lijn naar links kunnen tekenen en deze lijn zou op een bepaald punt de Y-as kunnen raken. We kunnen het cum% f op dit punt lezen. Dit cum% / waarde is de PR. van de score.

Zo kunnen we dat lezen:

PR van een score, 40 = 20

PR van een score, 53 = 90.

We kunnen PR's van elke andere score van het ogive op dezelfde manier lezen.

Methode # 5. Cirkeldiagram:

Cirkeldiagrammen worden in de volksmond gebruikt om het percentage afbraak aan te duiden. Het wordt zo genoemd omdat de hele grafiek op een cirkel lijkt en de onderdelen van de taart lijken op plakjes uit de cirkel. Het presenteert de percentages en geen absolute cijfers.

Cirkeldiagrammen zijn erg handig bij het weergeven van de uitgaven van een regering, of van een bedrijf, enz. Verdeeld over verschillende hoofden. Het wordt ook gebruikt in het onderwijzen van aardrijkskunde, wetenschap, enz.

De volgende stappen kunnen worden gevolgd bij het construeren van een cirkeldiagram:

1. Teken een cirkel van de juiste grootte met een kompas. De grootte van de straal hangt af van de beschikbare ruimte en andere factoren.

2. Bereid de gegevens in de vorm van% onder verschillende hoofden voor. Deze% voor verschillende sectoren moet in overeenkomstige graden in de cirkel worden omgezet.

Hiervoor moet de hoekwaarde van elk subgedeelte worden gevonden. We weten dat de waarde van alle hoeken op elk punt gelijk is aan 360 °, dat wil zeggen dat de hele cirkel 360 ° is, wat 100% vertegenwoordigt. Dus één% betekent 360 ° / 100 = 3, 6 °.

De volgende formule is daarom van toepassing voor het vinden van de hoekwaarde van elke subgroep:

3. Stel dat er 3 componenten zijn met de waarde 60% als hoogste presteerders, 25% als middenpresteerders en 15% als lage presteerders. Daarom moeten ze respectievelijk 216 ° (60 x 3, 6 °), 90 ° (25 x 3, 6 °) en 54 ° (15 x 3, 6 °) voorstellen.

4. Wanneer de waarden van alle hoeken aldus zijn bepaald, kan hun totaal niet exact 360 ° zijn als gevolg van de benadering. Als dit het geval is, moet een deel van de hoekwaarde enigszins worden aangepast om het totaal gelijk aan 360 ° te maken.

5. Meet de punten op de cirkel om de grootte van elke sector weer te geven met behulp van een hoekmeter. Het is gebruikelijk om de sectoren naar grootte te rangschikken, met de grootste sector bovenaan en andere in

volgorde met de klok mee. De sectoren kunnen worden gelabeld. De labels kunnen binnen de sector of buiten de cirkel worden geplaatst.