Data-Vault ist eine Modellierungstechnik für Data-Warehouses, die insbesondere für agile Data-Warehouses geeignet ist. Sie bietet eine hohe Flexibilität bei Erweiterungen, eine vollständige Historisierung der Daten und erlaubt eine starke Parallelisierung der Datenladeprozesse. Entwickelt wurde die Data-Vault-Modellierung seit 1990 von Daniel Linstedt, wobei erst im Jahr 2000 die erste Veröffentlichung dazu erschien. Sie ist eine Kombination aus der relationalen Datenbankmodellierung mit der dritten Normalform (3NF) und dem Sternschema. Bei der Modellierung werden alle zu einem Objekt gehörenden Informationen in drei Kategorien eingeteilt und strikt voneinander getrennt. In die erste Kategorie „Hub“ gehören Informationen, die ein Objekt eindeutig beschreiben, d. h. ihm seine Identität geben (z. B. Kundennummer beim Kunden). Attribute, die ein Objekt beschreiben (z. B. Kundenname), gehören in die zweite Kategorie „Satellit“. Daten der dritten Kategorie „Link“ beschreiben Beziehungen zwischen Objekten (z. B. Zuordnung eines Kunden zu einer Branche). Durch diese Art der Modellierung sind Änderungen flexibel möglich, so dass in der Regel keine bestehenden Tabellen angepasst werden müssen, sondern einfach neue Tabellen (z. B. neue Attribute als Satellit) hinzugefügt werden. Durch die starke Schematisierung der Datenladeprozesse können ETL-Prozess-Templates verwendet werden, so dass im besten Fall zur Änderung bzw. Erweiterung des Datenladeprozesses nur eine Anpassung der Konfiguration notwendig ist. Mit dem PDI Data Vault framework ist es z. B. sehr einfach möglich, ein Data-Vault auf Basis von Metadaten vollautomatisch aufzubauen. Dabei setzt das Framework komplett auf das Open-Source-ETL-Tool Pentaho Data Integration (Kettle) auf. (de)
Data-Vault ist eine Modellierungstechnik für Data-Warehouses, die insbesondere für agile Data-Warehouses geeignet ist. Sie bietet eine hohe Flexibilität bei Erweiterungen, eine vollständige Historisierung der Daten und erlaubt eine starke Parallelisierung der Datenladeprozesse. Entwickelt wurde die Data-Vault-Modellierung seit 1990 von Daniel Linstedt, wobei erst im Jahr 2000 die erste Veröffentlichung dazu erschien. Sie ist eine Kombination aus der relationalen Datenbankmodellierung mit der dritten Normalform (3NF) und dem Sternschema. (de)