Data Vault

Data Vault:
Die Modellierungsmethode für agile Entwicklung im Data Warehouse

Erfolgreiche Unternehmen wachsen heute schneller als noch vor wenigen Jahren. Damit ändern sich auch die Anforderungen an Data Warehouses: Wenn Sie mit rasanten Entwicklung Schritt halten sollen, ist ein hohes Maß an Standardisierung und Automatisierung gefragt. In diesem Kontext gewinnt Data Vault als Methode für die Modellierung von Data-Warehouse-Systemen zunehmend an Bedeutung.
Ein Data Vault repräsentiert eine Menge von normalisierten Tabellen, die eindeutig miteinander verknüpft sind. Dabei verbindet der Modellierungsansatz Elemente der dritten Normalform und des Star Schemas – die dimensionierte und die normalisierte Modellierungswelt.

Die SQL Projekt AG: Vorreiter in allen Fragen der Datenmodellierung

Datenmodellierung im Data Warehouse mittels Data Vault wurde in den 90er-Jahren entwickelt und hat noch eine relativ junge Geschichte. Wir von der SQL Projekt AG haben das Potenzial der Methode früh erkannt und uns in Projekten einen großen Erfahrungsschatz erarbeitet. Entsprechend umfassend ist unser Serviceangebot.
Wir beraten Unternehmen in allen Fragen rund um Data-Vault-Systeme: von der Einführung über die Implementierung bis hin zur Pflege. Unser Know-how deckt transaktionale Systemen (ER-Modellierung, Star Schema) ebenso ab wie dimensionale Systeme (Star Schema, Snowflake Schema). Ihr Vorteil: Wir haben den nötigen Überblick, um Anwendungsszenarien umfassend zu bewerten und mit ähnlichen Modellierungsansätzen zu vergleichen.

Wir haben den Blick fürs Ganze: Datenbanklösung, Data Vault, BI & Analytics

Als Spezialisten für Datenbanktechnologie sind wir auch der richtige Absprechpartner für Fragen zu Auswahl und Betrieb der passenden Datenbanklösung für einen Data Vault. Neben der reinen Datenbewirtschaftung tragen wir ergänzend Kenntnisse und Erfahrungen im Bereich BI & Analytics bei. Das erleichtert die Erstellung bedarfsgerechter Analysen.

Datenbankschema basierend auf Data Vault

So profitieren Sie von unserer Data-Vault-Kompetenz

  • Flexibilität bei Erweiterungen
  • Bestehende Komponenten müssen bei Erweiterungen nicht angepasst werden
  • Vollständige Historisierung der Daten
  • Starke Parallelisierung der Datenladeprozesse
  • Agilität, Skalierbarkeit sowie eine starke Business Orientierung
  • Automatisierte Erstellung von Data-Vault-Objekten

Einfach erweiterbar dank einfacher Paradigmen: So funktioniert ein Data Vault

Die Grundidee von Data Vault ist ganz einfach: Informationen im Data Warehouse werden so aufgeteilt, dass Daten einfach zu integrieren und zu historisieren sind – ohne Migration der bestehenden Tabellen. Zu diesem Zweck werden die fachspezifischen Elemente im Data Vault in ihre einzelnen Bestandteile zergliedert und in separaten Tabellen gespeichert.
Die zugrunde liegenden Informationen sind im Zuge der Modellierung entweder zu Hubs (blau) oder zu Links (rot) oder zu Satellites (gelb) zuzuordnen. Ein Hub beschreibt ein fachliches Objekt eindeutig über sog. Business Keys. Zusätzliche Informationen sind in Satellites abgelegt, die mit ihren Hubs verknüpft sind. Im Sinne einer einfachen Erweiterbarkeit werden neue Informationen als separate Tabellen eingeführt, die zusätzlich mit dem jeweiligen Hub verknüpft werden müssen. Beziehungen zwischen Hubs werden in Links gespeichert. Auch hier können Zusatzinformationen in Satellites abgelegt werden.

Evaluierung, Implementierung, Beladung:
Wir sind Ihr Garant für eine starke Performance

Für viele Unternehmen ist Data Vault eine immense Herausforderung. Haben sie sich bisher nur mit den Themen Star-Schema und dritte Normalform auseinandergesetzt, sind nun zusätzliche Skills für die Modellierung mittels Data Vault gefragt. Zudem muss im Rahmen einer Evaluierung ermittelt werden, für welche Anwendungsfälle im Unternehmen Data Vault überhaupt sinnvoll ist.
Auch bei der Implementierung von Data-Vault-Systemen sind einige Hürden zu nehmen. Durch die Zerlegung der fachspezifischen Elemente in eigene Bestandteile und ihre Verteilung in verschiedene Tabellen sind eine Vielzahl an Datenbankobjekten zu erstellen und zu pflegen – ein enormer Aufwand, mit dem auch der Bedarf an Datenbankspezialisten steigt.
Eine weitere Herausforderung liegt in der Beladung eines Data Vaults. Dafür sind konzeptionell zwei Schichten vorgesehen: der Raw Vault und der Business Vault. Zwischen diesen Schichten müssen Transformationsprozesse gestaltet und gepflegt werden. Der Raw Vault kennzeichnet die Herkunft der Daten und stellt damit Auditierbarkeit und Rückverfolgung sicher. Im Business Vault spiegeln sich die Geschäftsregeln wider, die wiederum die Grundlage für dimensional modellierte Data Marts bilden. Die Tabellen werden durch zahlreiche Joints miteinander verknüpft, damit sie optimale ausgewertet werden können. Auch in diesem Zusammenhang ist eine performante Datenbanklösung wichtig für den Erfolg eines Data Vaults.

Sprechen Sie uns an!

TECHNOLOGIE & BERATUNG

Dr. Tom Hänel

Dr. Tom Hänel

SQL Projekt AG

TERMINE & INFOMATERIAL

Karin Seidel

Karin Seidel

SQL Projekt AG