Use Case getriebener Einsatz von Datenvirtualisierung

Der Begriff Datenvirtualisierung (oder kurz: DV) hat in den letzten Jahren immer mehr an Bedeutung gewonnen. Unter dem Begriff versteht man den Einsatz einer Software, die in der IT-Infrastruktur Datenquellen (Datenbanken, Data Warehouse, Cloudspeicher, Dateien) anbindet, in einer Metadaten-Schicht die Daten logisch verknüpft und diese dann sogenannten Konsumenten (BI-Tools, Web Services oder dem Poweruser via Excel ODBC-Zugriff) zu Anzeige- und Analyse-Zwecken bereitstellt.

Die Daten werden dabei NICHT kopiert, sodass die Hauptvorteile im Vergleich zum klassischem ETL in weniger Ressourcen-/ Speicherbedarf und auch schnelleren Umsetzungszeiten liegen.

In diesem Blogartikel möchte ich die drei aktuellen Trends, in denen Datenvirtualisierung ideal eingesetzt werden kann, vorstellen und beschreiben.

Top 1: Realtime Analytics

Betrachten wir IT-Architekturen beim Kunden, so ist die bisherige Analytics-Landschaft oft nicht realtimefähig. Auswertungen stammen meist noch aus dem Data Warehouse, welches mit Vortages-Daten nicht die nötige Datenaktualität mit sich bringt.
Mit einer DV-Lösung hingegen sind die Daten per se mit Realtime-Zugriff abrufbar.

Use Case „Historische und aktuelle Umsatzzahlen aus Salesforce“

Nehmen wir an, man möchte den aktuellen Jahresumsatz (YTD) aus Salesforce abrufen und mit anderen Daten verknüpfen:

  1. Hierzu ist eine erste View zu erstellen, die von Mitternacht bis zum aktuellen Zeitstempel (via Parameter) die aktuellen Umsatzzahlen per Realtime aus der Cloud abruft und aufsummiert (mit ca. 2.000-3.000 Datensätzen und somit schneller Ausführungszeit).
  2. In einer zweiten View, die als Datenquelle das Data Warehouse nutzt, liegen die historischen tagesaktuellen Umsatzzahlen bereits aggregiert vor (wenige hundert Datensätze für die YTD Darstellung).
  3. Die beiden Ergebnismengen der zwei Views werden über das Join-Attribut „Tag“ in einer dritten View in der Metadaten-Schicht der Datenvirtualisierung zusammengeführt. Der Anwender erhält so die Umsatzzahlen des aktuellen Jahres bis zum aktuellen Zeitpunkt in einem Echtzeit-Report mit der Möglichkeit, diese Zahlen noch weiter mit anderen Daten zu verknüpfen.
Datenvirtialisierung in Real Time Analytics

Top 2: Im Kontext einer DWH-Modernisierung ist Datenvirtualisierung flexibel einsetzbar

Viele in die Jahre gekommene DWH-Systeme müssen oder sollten erneuert werden, um weiterhin wartbar zu sein und auf die häufig und schnell ändernden Anforderungen reagieren zu können. Vor dem Hintergrund der heutigen Anforderungen (Komplexität, Geschwindigkeit, Datenmenge), die in den letzten Jahren – im Vergleich zu denen vor zwei oder fünf Jahren – rasant gestiegen sind, besteht hier Handlungsbedarf.
Beispielsweise kann die gewünschte 360° Kundensicht ein Use Case für den Einsatz von Datenvirtualisierung sein. Ein Unternehmen möchte gerne alle Daten zu einem Kunden verknüpft und auswertbar wissen. Hierfür müssen viele verschiedene Systeme angebunden werden und KPIs zentral definiert werden. Oftmals ist dies bei Kunden mit „gewachsenen“, komplexen technischen Systemen eine große Herausforderung.
Als kompletter logischer DWH Layer kann Datenvirtualisierung in solch einem Szenario zum Einsatz kommen, um Daten aus unterschiedlichsten Quellsystemen zu vereinen und zentralisiert an die Konsumenten (zum Beispiel Reports, ad-Hoc via Excel) weiterzugeben.

Use Case – aus der Versicherungsbranche:
Die Versicherung „AB“ muss durch Zukauf die IT-Landschaft vom Versicherer „CD“ integrieren. Dabei ergibt sich die Anforderung, aus zwei Hauptquellen „AB“ und „CD“ die Daten zu laden.  Selbstredend soll das in einem einheitlichen Reporting- und Analyse-Becken für Controlling sowie der Geschäftsführung bereitgestellt werden. Mit Datenvirtualisierung ist dieses Szenario abbildbar und das sogar mit schnelleren Umsetzungszeiten als mit klassischem ETL und dem Kopieren der Daten.

Integration & Konsolidierung von Quellen mit Datenvirtualisierung

Oder aber man setzt Datenvirtualisierung für einen Teilbereich ein, um rasche Projektergebnisse von „unten“, d.h. den Quellsystemen, an die BI-Entwicklungsabteilung oder die Fachabteilung zukommen zu lassen. In dem vom DV-Hersteller mitgelieferten Data Catalog Tool können die Poweruser oder die Fachabteilung nun die verfügbaren und gewünschten Daten einfach per Selfservice einsehen und ausführen.

Prototyping_mit_Datenvirtualisierung

Top 3: Skalierbarkeit und hybride Ansätze

Die Erweiterbarkeit und das nachjustieren von mehr Rechenpower möchte sich wohl jeder offenhalten – je nach Projektumfang oder Anforderung. DV-Systeme sind durch Clustering skalierbar sowie auch offen für hybride Szenarien die sich in jeder Firma wiederfinden.

Use Cases
Oftmals sind es die Webtracker wie Google Analytics, Open Data-Projekte für Wetterdaten oder Produktkataloge externer Lieferanten an die man über die Cloud angebunden ist. Demzufolge ist die Integration eben dieser Dienste und Daten eine Herausforderung, die man mit Hilfe von Datenvirtualisierung einfach und rasch abbilden kann.


Weitere Use Cases im Vertrieb oder Marketing sind:

  • Gebietsstrukturen im Außendienst (Verknüpfung von CRM-Systemen in der Cloud mit Data Warehouse on-Premise)
  • Absicherung für etwaige Betrugsfälle in der Fraud Detection (externer Dienstleister in der Cloud, verknüpft mit SAP-Leistungssystemen on-Premise)
Datenvirtualisierung in der Hybrid-Umgebung

Fazit:

Immer komplexer werdende IT-Systemarchitekturen und Anforderungen können gerade mit Datenvirtualisierung umgesetzt werden. Der Realtime-Datenzugriff bis in die Leistungssysteme ist möglich, in heterogenen on-Premise sowie Cloud Umgebungen integriert Datenvirtualisierung die Daten in einer Metadatenschicht.
Fehlende KPI-Definitionen sind in Unternehmen mit heterogenen Reportingquellen oder –systemen oftmals zu finden und damit eine große Störquelle im Tagesgeschäft. Mit Datenvirtualisierung hingegen besteht die Möglichkeit die KPI im Business Layer zentral zu definieren und so unternehmensweit vorzugeben.
Darüber hinaus ist Datenvirtualisierung flexibel einsetzbar wenn DWH-Systeme modernisiert werden oder – wie in dem Beispiel aus der Versicherungsbranche – komplett neue Systeme in den Analytics Scope aufgenommen und Daten konsolidiert werden müssen.

Jetzt teilen auf:

Jetzt kommentieren