Normalformen im relationalen Datenbanktheorie

March 15

Normalformen im relationalen Datenbanktheorie behandeln wie der Redundanz der Daten in einer Tabelle zu reduzieren. Jeder normale Form stellt eine Ebene dar. Um den Anforderungen für eine bestimmte Ebene jeweils zu erfüllen, müssen die Anforderungen für das frühere Niveau erfüllt werden. Um die optimale Normalform für die Tabellen in einer Datenbank zu erreichen, der Ersteller beginnt mit einer großen Liste aller Daten, die in der Datenbank gespeichert werden soll, und dann durch die Normalformen arbeitet, bis er nicht mehr die Daten in kleinere Tabellen unterteilen kann.

Erste Normalform

Die erste Normalform wird durch Entfernen der wiederholten oder mehrwertige Attribute innerhalb einer Tabelle zu einer untergeordneten Tabelle erstellt. Jeder Eintrag in einer Spalte muss einen Wert haben. Jede Spalte muss ein single-Datentyp. Sie können keine Spalte aufweisen, die sowohl Zeichen-als auch numerische Daten enthält.

Jede Zeile muss eindeutig sein. Es kann nicht mehrere Instanzen der gleichen Adresse. Die Reihenfolge der Spalten und Zeilen spielt keine Rolle. Alle Spalten müssen einen eindeutigen Namen innerhalb einer Tabelle. Die Namen können in mehreren Tabellen, aber nicht innerhalb derselben Tabelle wiederholt werden.

Zweite Normalform

In der zweiten Normalform muss jede Spalte innerhalb der Tabelle für die gesamten Primärschlüssel relevant sein. Die Beziehung muss eine eins zu eins oder eins-zu-viele-Beziehung sein. Die zweite Normalform ist nur relevant, wenn mehr als eine als Primärschlüssel verwendet Spalte. Beispielsweise ist wenn wir eine Tabelle haben, in der der Primärschlüssel Spalten PART_NO und Lager ist, und es eine Spalte namens WAREHOUSE_ADDRESS gibt, die WAREHOUSE_ADDRESS-Spalte nur relevant für den WAREHOUSE-Teil des Primärschlüssels. Er sollte in eine andere Tabelle platziert werden, wo ist der Primärschlüssel einfach WAREHOUSE.

Dritte Normalform

Für die dritte Normalform werden alle Spalten, die Nichtschlüsselspalten abhängen entfernt. Auch alle Daten, die von anderen Spalten abgeleitet werden können wird entfernt. Beispielsweise haben Sie eine Tabelle, die hat den Spaltennamen, Kunden, Unternehmen und COMPANY_ADDRESS, die Spalte COMPANY_ADDRESS ist abhängig von der Firma-Spalte. Um die dritte Normalform zu erfüllen, sollte zwei Tabellen. Einen mit den Spalten und KUNDENUNTERNEHMEN und einen mit den Spalten COMPANY und COMPANY_ADDRESS.Der zweite Teil der dritten Normalform sagt, dass entfernt, können Daten, die von anderen Spalten abgeleitet werden kann. Z. B. eine Tabelle, die die Säulen, Kunde, ITEM_NO, QUANT_PURCHASED, UNIT_PRICE und insgesamt hatten dritte Normalform verletzt, da TOTAL von QUANT_PURCHASED abgeleitet werden kann * UNIT_PRICE. Dritte Normalform der Spalte TOTAL erfüllen würden entfernt werden.

Vierte Normalform

Unter der vierte Normalform kann keine Tabelle mehr als eine mehrwertige Spalte haben. Eine mehrwertige Spalte gehört, wo eine Einheit kann mehrere Attribute für diese Spalte haben. Eine Tabelle mit den Spalten Mitarbeiter, Fähigkeiten und Auszeichnungen würde vierte Normalform verletzen, weil der Arbeitnehmer mehrere Fähigkeiten hätte und mehrfach ausgezeichnet. Vierte Normalform zu erfüllen, sollten die Daten in eine Tabelle mit den Spalten Mitarbeiter und Kompetenzen und eine zweite Tabelle mit den Spalten Mitarbeiter und Auszeichnungen aufgeteilt werden.

Fünfte Normalform

Die Fünfte Normalform entsteht durch Entfernen von Spalten, die aus kleineren Stücken von Daten erstellt werden können, die mit weniger Redundanz erhalten bleiben können. Eine Tabelle mit den Spalten würde PERFORMER, SHOW, Ort Fünfte Normalform verletzen, wenn die Darsteller in mehreren Shows und mehrere Ort auftreten konnte. Um die Fünfte Normalform zu erfüllen, würden die Daten in drei Tabellen aufgeteilt werden. Die erste Tabelle hätte die Spalten PERFORMER und SHOW. Die zweite Tabelle hätte die Spalten anzeigen und Veranstaltungsort. Die dritte Tabelle hätte die Spalten Ort und PERFORMER. Die richtigen Daten aus die Tabellen kombinieren noch abgeleitet werden können, aber die Daten sind nicht mehr zyklischen Natur.