3 fasen van normalisatie van gegevens

Enkele van de belangrijke stadia die betrokken zijn bij het proces van normalisatie van gegevens zijn de volgende:

Er zijn verschillende manieren om gegevenselementen in tabellen te groeperen. De databaseontwerper zou geïnteresseerd zijn in het selecteren van de manier die geen anomalieën in gegevensgroepering garandeert. Deze anomalieën omvatten gegevensredundantie, verlies van gegevens en onechte relaties in gegevens.

Afbeelding Courtesy: 4.bp.blogspot.com/-MTnjMQCPoRI/Tu4HGFKjV2I/AAAAAAAAAHQ/md1Cz89KH1U/s1600/2service.jpg

Normalisatie is gericht op het elimineren van de anomalieën in gegevens. Het proces van normalisatie omvat drie fasen, waarbij elke fase een tabel genereert in de normale vorm.

1. Eerste normale vorm:

De eerste stap bij normalisatie is om alle herhaalde velden in afzonderlijke bestanden te plaatsen en er de juiste sleutels aan toe te wijzen.

Rekening houdend met het verwerken van inkooporders, kunnen de volgende gegevenselementen worden geïdentificeerd in een bestelling:

Leverancier ID

Naam van de leverancier

Adres

Aankoop order nummer

Datum

Betalingsvoorwaarden

Verzend voorwaarden

S. Nee.

Productcode

Omschrijving

Meet eenheid

Prijs

Hoeveelheid besteld

Bedrag

Zoals hierboven uiteengezet, worden de 'verzendvoorwaarden' herhaald voor elk S.-nummer en worden er meerdere records in elke inkooporder opgenomen. In de eerste fase van normalisatie worden de herhaalde gegevenselementen in afzonderlijke tabellen geplaatst. Daarom hebben we de gegevenselementen opgesplitst in twee tabellen, zoals hieronder wordt weergegeven:

De belangrijkste gegevenselementen worden in hoofdletters weergegeven. De tabel bevindt zich nu in de eerste normale vorm (INF) omdat alle herhaalde gegevenselementen (velden) zich in een afzonderlijke tabel bevinden (tabel 1.2) en de ophaaltoetsen aan elke tabel zijn toegewezen. Aangezien er twee belangrijke elementen in beide tabellen zijn, kan worden gezegd dat elke tabel samengestelde / samengestelde sleutels heeft. Dit proces van normalisatie heeft de gegevens vereenvoudigd.

2. Tweede normale vorm:

In dit stadium van normalisatie worden alle niet-sleutelelementen die volledig zijn gespecificeerd door iets anders dan de complete sleutel in een afzonderlijke tabel geplaatst. Normaal gesproken zijn deze niet-sleutelelementen afhankelijk van slechts een deel van een samengestelde sleutel.

Rekening houdend met tabel 1.1, bestaat een samengestelde sleutel bestaande uit Supplier ID en Purchase Order No. wordt gebruikt. De niet-sleutelelementen, zoals de naam en het adres van de leverancier, zijn echter alleen afhankelijk van leverancier-ID en niet van Inkooporder nr. Deze niet-sleutelgegevenselementen worden dus samen met het sleutelgegevenselement-leverancier-id in afzonderlijke tabellen geplaatst.

Evenzo zijn de niet-sleutelgegevenselementen zoals datum, betalingsvoorwaarden en verzendvoorwaarden alleen afhankelijk van bestelnr. en worden dus in een afzonderlijke tabel geplaatst samen met bestelling nr. als sleutelelement. Nu hebben we drie tabellen in plaats van tabel 1.1:

Evenzo kunnen we tabel 1.2 splitsen door niet-sleutelelementen, zoals beschrijving, maateenheid en prijs, te scheiden die alleen afhankelijk zijn van een productcode in een tabel. Evenzo worden de productcode, hoeveelheid en hoeveelheid afhankelijk van bestelnummer en het S.-nummer in een aparte tabel geplaatst.

De tweede normale vorm (2NF) is nu gereed en er zijn vijf tabellen.

3. Derde normale vorm:

Deze normalisatiefase maakt het elimineren van overtollige gegevenselementen en tabellen die subsets van andere tabellen zijn, mogelijk. De overtollige elementen zijn die niet-sleutelgegevenselementen die in meer dan één tabel van de virtuele gegevenselementen worden geplaatst.

De virtuele gegevenselementen zijn die elementen waarvan de waarde kan worden berekend met behulp van andere elementen als en wanneer de waarde wordt geëist. De waarde van het bedraggegevenselement in tabel 1.2.2 kan worden berekend door de hoeveelheid te vermenigvuldigen met de prijs, waardoor dergelijke overtollige gegevenselementen worden geëlimineerd.

Als een andere tabel die de leveranciersmaster-tabel wordt genoemd, ook in de database wordt bijgehouden, is het waarschijnlijk dat tabel 1.1.2 een subset van de mastertabel van de leverancier is. Dus deze tabel kan ook worden geëlimineerd.

De derde normale vorm (3NF) biedt de groepering van gegevens die eenvoudig, gemakkelijk te onderhouden en met minimale redundantie is.

Normalisatie kan dus helpen om de redundantie te verminderen en andere anomalieën in gegevens te elimineren. Het hierboven besproken proces van normalisatie in drie stappen is slechts suggestief. Verdere pogingen kunnen worden gedaan bij het ontwerpen van databases, indien nodig op basis van de aard van gegevens.