Homepage
Unternehmensprofil
Angebot
Tools
Vorträge
Gedanken
Tips
Kunden und Presse
Ihre Meinung
Kontakt
|
Einführung
Das zentrale Data Warehouse (DWH) eines Unternehmens, aus dem mehrere Anwendungen
und abteilungsspezifische Data Marts mit geprüften Daten versorgt
werden, wird sinnvollerweise relational und normalisiert modelliert. Es
muß alle Daten enthalten, die später für Auswertungen benötigt
werden, und soll möglichst wenig Speicherplatz verbrauchen. Dabei
muß das DWH so aufgebaut sein, daß sich alle Benutzer leicht
zurechtfinden. Deshalb entsprechen die Entitäten im Data Warehouse
den Einheiten im Unternehmen, über die berichtet wird. Die Daten werden
aus verschiedenen Entitäten der operativen Datenbanken neu gruppiert
und verknüpft. Zum Teil werden auch Daten, die sonst nur über
umfangreichere Programme zu ermitteln wären, beim Laden des DWH berechnet
und gespeichert.
Es reicht also nicht aus, die Herkunft der Daten aus den operativen
Systemen zu dokumentieren. Vielmehr muß für das DWH in einer
vorangehenden Modellierungsphase ein eigenes Datenmodell erstellt werden,
das den Bezug zwischen den realen Einheiten und Vorgängen im Unternehmen
und ihrer Repräsentation im DWH beschreibt. Das Datenmodell eines
DWH dient damit gleichermaßen als Plan für die Entwickler des
DWH wie auch als Information für die späteren Benutzer, die im
Modell alle notwendigen Informationen über den Inhalt und den Aufbau
des DWH finden müssen.
Als Medium für eine Online-Dokumentation hat sich HTML bewährt.
Damit läßt sich die Dokumentation über einen Intranet-Server
ohne großen Aufwand an allen Arbeitsplätzen zur Verfügung
stellen. Alternativ können die Dateien auch auf einem normalen File-Server
bereitgestellt werden, wobei die Verknüpfungen beim Zugriff mit einem
Browser erhalten bleiben.
Im Einzelnen besteht das Datenmodell eines DWH aus folgenden Teilen:
-
In der fachlichen Beschreibung wird der Inhalt nach zusammenhängenden
Themengebieten gegliedert. Zu jedem Themengebiet werden die Inhalte aus
fachlicher Sicht beschrieben. Sie wird mit einem Editor für HTML-Dokumente
erstellt.
-
In Enity-Relationship-Diagrammen werden die physikalischen Entitäten
und ihre Relationen in einer Gesamtübersicht und in Auszügen
für die Themengebiete dargestellt. Die Diagramme werden mit einem
Flow-Charter erstellt und für die HTML-Dokumentation als GIF-Datei
exportiert.
-
In der Definition des physikalischen Aufbaus werden alle Dateien, Variablen
und benutzerdefinierten Formate beschrieben. Diese Definition wird mit
dem XDWH-Tool in eine Datenbank eingegeben und gepflegt. Die entsprechende
HTML-Dokumentation wird dann automatisch erzeugt.
-
Speziell beim Einsatz des SAS-Systems ist es sinnvoll, die Erstellung der
benutzerdefinierten Formate in das physikalische Modell mit aufzunehmen.
Hierzu gehören alle im Unternehmen verwendeten Schlüssel und
die physikalische Abbildung von n:1-Relationen für spätere Auswertungen.
Zusätzlich muß in der Modellierungsphase kontrolliert werden,
ob alle notwendigen Sichten durch Denormalisierungen dargestellt werden
können. Deshalb wird ein spezieller Tabellentyp (Data Mart) benötigt,
in dem die Tabellen des DWH über ihre Schlüssel zu denormalisierten
Sichten für Auswertungssysteme verknüpft werden.
Features
Im Rahmen des oben beschriebenen Konzepts unterstützt das XDWH-Tool
die physikalische Modellierung des Enterprise DWH mit folgenden Features:
-
Zentrale Verzeichnisse für Variablen, Indexes und Formate als "Resoucen"
mit umfangreichen Kommentaren
-
Definition der Dateien incl. Beschreibung und folgenden Historisierungskonzepten:
-
Gültigkeitszeitraum: es wird nur ein neuer Satz angelegt, wenn sich
eine Variable geändert hat, (z.B. für Vertragsdaten)
-
Stichtag: es wird für jeden Stichtag ein neuer Satz angelegt (z.B.
für Salden)
-
Intervall: es wird für jeden Stichtag ein neuer Satz angelegt, die
Werte können über beliebige Intervalle aggregiert werden (z.B.
für Umsätze)
-
Kommentare für die Zuordnung von Variablen und Indexes zu Dateien
-
Automatische Erstellung der Dateien und des Codes zur Erstellung der Dateien
-
Automatische Erstellung der definierten Formate und des Codes zur Erstellung
der Formate und Informate aus Dateien. Dabei werden folgende Varianten
unterstützt:
-
direkte Zuordnung, d.h. ein Wert entspricht genau einem Label und umgekehrt
-
"von bis unter" - Logik für Gruppierungen, d.h. alle Werte, die kleiner
sind als der nächst größere, erhalten dasselbe Label,
-
"über bis einschließlich" - Logik für Gruppierungen und
verkürzte Eingaben, d.h. alle Werte, die größer sind als
der nächst kleinere, erhalten dasselbe Label, entsprechendes gilt
für Angaben bei Informaten zur Beschleunigung der Eingaben.
Bei Informaten wird zusätzlich die Upcase-Option zur Unterdrückung
der Unterscheidung von Groß- und Kleinschreibung unterstützt.
-
Automatsche Erstellung von Dummy-Äquivalenten für bereits deklarierte
aber noch nicht erstellte Formate und Informate in der Modellierungsphase.
Damit wird die Angabe der Formate und Informate bei der Definition der
Variablen unterstützt.
-
Automatische Erstellung der vollständigen Dokumentation in verknüpften
HTML-Files. Hierzu gehören:
-
vollständige Verzeichnisse für Dateien, Formate und Variablen,
-
je ein HTML-File zur Beschreibung eines Formats und seiner Verwendung bei
Variablen,
-
je ein HTML-File zur Beschreibung einer Variablen und ihrer Verwendung
in Dateien,
-
je ein HTML-File zur Beschreibung einer Datei mit allen Variablen und Indexes
sowie ihrer Verwendung zur Erstellung von Data Marts und Formaten,
-
je ein HTML-File zur Beschreibung der Zusammensetzung von Data Marts.
Verfügbarkeit
XDWH ist in der Version 1.4 für die SAS Version 6.12 verfügbar.
Für die SAS Version 8 (u.a. lange Datei- und Variablennamen) wird das Tool zur Zeit grundlegend
überarbeitet und modernisiert.
Die Erfahrung hat gezeigt, daß eine Installation solcher Tools
ohne praktische Einführung mit viel vermeidbarem Einarbeitungsaufwand
verbunden und deshalb nicht sinnvoll ist.
Deshalb wird das XDWH-Tool grundsätzlich zusammen mit einer zweitägigen
Einführung angeboten. Darüberhinaus ist eine einmonatige betreute
Testinstallation möglich.
|