Was sind die wichtigsten Merkmale eines Data Warehouse?

February 2

Ein Datawarehouse ist eine relationale Datenbank, eine elektronische Datenbank, in dem Daten in Tabellen, Zeilen und Spalten gespeichert ist. Es dient zur Abfrage und Analyse, anstatt jeden Tag Transaktionsverarbeitung. Eine Transaktion ist eine unteilbare Einheit der Arbeit wie bezahlen eine Stromrechnung von Ihrem Bankkonto, die entweder erfolgreich ist oder fehlschlägt. Anders als ein Transaktionssystem Verarbeitung ein Datawarehouse muss nicht sofort auf Anfragen reagieren und andere einzigartige Merkmale aufweist.

Motiv-orientierte

Eine Datenbank soll helfen, Analysten, die Daten zu analysieren. Als solche werden Daten von Gegenstand und nicht von der Anwendung gespeichert; mit anderen Worten, sind die Daten "Betreff-orientierte." Der genaue Gegenstand kann von Unternehmen zu Unternehmen variieren, aber ein Unternehmen kann beschließen, strukturieren ihre Datawarehouse durch Verkäufe, Lieferungen oder Inventar, so dass es z. B., Fragen kann "welcher Kunde die meisten dieses Produkts letztes Jahr gekauft?"

Extrahieren, Transformieren und laden

Ein weiteres Merkmal eines Data Warehouse ist, dass es Daten aus verschiedenen operativen Datenbanken, Dateien und Datensegmente zusammenraufen muss; dann werden sie in einem einheitlichen Format präsentiert. Das heißt, bevor Daten in einem Datawarehouse verschoben werden, es, ein Prozeß bekannt unterziehen muss als extrahieren, Transformieren und laden. Zunächst extrahiert dieser Prozeß Daten aus einem oder mehreren operativen Datenquellen. Zweitens werden Inkonsistenzen aus den Daten entfernt; Schließlich werden die Daten in das Datawarehouse geladen. Die Effizienz dieses Prozesses bestimmt letztlich die Qualität der Daten in einem Datawarehouse.

Nicht flüchtig

Sobald in ein Datawarehouse zu übertragen, die Daten nicht geändert und werden beschrieben als "nicht flüchtig." Die Daten ist nicht das Tagesgeschäft führen sollen; im Gegensatz zu Daten in Betriebsdatenbanken stattfand wird es nicht nach jeder einzelnen Transaktion aktualisiert. Stattdessen werden die Daten in das Datawarehouse in regelmäßige, bestimmten Abständen, z. B. einmal pro Tag, einmal pro Woche oder einmal pro Monat, abhängig von der genauen Art der Daten übertragen.

Historische Daten

Im Gegensatz zu einer Transaktion Verarbeitungssystem muss welche historischen Daten archiviert werden um die Leistung der Datenbank zu erhalten ein Datawarehouse historische Daten enthalten. Um Business-Trends zu identifizieren, benötigen Analysten große Datenmengen, im Laufe der Zeit abgetastet werden, so dass ein Datawarehouse historische "Momentaufnahmen" der Betriebsdaten zu bestimmten Zeiten enthält. Mit anderen Worten, ist die Daten in einem Datawarehouse als "Zeit-Variante" bezeichnet, da seine Schwerpunkte vor allem im Laufe der Zeit ändern.