Data Warehouse – Quo Vadis?

Das Data Warehouse als zentrale Datenhaltung hat mittlerweile eine lange Tradition und findet man in vielen Unternehmen vor. Aus unterschiedlichen Quellen (bspw. Warenwirtschaft, CRM Tool und Supply Chain) werden Daten in das Data Warehouse per ETL importiert und dort zur weiteren Analyse aufbereitet und dauerhaft gespeichert. Für betriebswirtschaftliche Entscheidungen und Berichtswesen (u.a. Controlling) ist das Data Warehouse ein wesentliches Fundament.

Wie sieht es in der Realität aus

Unternehmensprozesse werden schnell geändert oder müssen komplett neu definiert werden, um am Markt bestehen zu können. Marketing und Vertrieb sind gefordert durch Multi-Channel Strategien und erleben den wachsenden Einfluss durch Social Media und e-Commerce. Dies führt dazu, dass die Daten nicht mehr wohldefiniert und strukturiert sind, sondern oftmals auch unstrukturiert und (hoch) volatil. Die Fachbereiche erwarten, dass sich das Data Warehouse und die BI Landschaft diesen Anforderungen zügig anpasst und somit die Entscheidungsprozesse wesentlich unterstützen. Diese Erwartungen kann die IT nur selten erfüllen und nachkommen.

BARC befragt Unternehmen zum Thema Data-Warehouse

Die BARC Studie „Data Warehousing 2011 – Status quo, Herausforderungen und Nutzen“ aus dem Jahr 2011 liefert dazu hinreichendes Zahlenmaterial. Fast alle Anwender (98%) bewerten das Data Warehouse im Unternehmen als kritisch/wichtig, jedoch kommt die Befragung zu dem Ergebnis, dass die Zielerreichung eines Data Warehouses nur bedingt erfüllt ist. Weiterhin erfährt man, dass das Vertrauen in Daten als wichtigstes Ziel (96 %) eingeschätzt wird, welches jedoch nur bei 51 % der Befragten wirklich erreicht wird. Hinsichtlich der Herausforderungen erfährt man, dass Datenqualität und Umsetzungsgeschwindigkeit (Agilität) die wichtigsten Erfordernisse an ein Data Warehouse darstellen.

Status quo – Zusammenfassung

Die Zielerreichung von Data Warehouse Initiativen und Projekten ist als nicht befriedigend einzustufen. Herausforderungen wie Datenqualität, Agilität und die unternehmensweite Integration wichtiger Fachbereiche stellt die IT vor große Probleme und lässt damit die Fachbereiche am Konzept Data Warehousing zweifeln. Dennoch wird das Data Warehouse als wichtiger Bestandteil angesehen und für Unternehmensentscheidungen genutzt. Dies ist damit zu begründen, dass es noch mangelnde Alternativen gibt bzw. nicht hinreichend geprüft und bewertet wurden.

Welche Alternativen gibt es?

Data Warehouse kein reines IT-Projekt

Ich selbst habe schon oft die Erfahrung gemacht, dass Data Warehouse Projekte rein IT gesteuert ablaufen. Am Anfang des Projektes werden die Anforderungen der Fachbereich aufgenommen, wobei diese natürlich ihre Anforderungen möglichst detailliert und genau benennen sollen. Nach dieser Anforderungsaufnahme passiert die Implementierung und erst kurz vor der Abnahme darf der Fachbereich die Umsetzung „sehen“ und bitte ohne Beanstandung abnehmen.
Diese Vorgehensweise, wenn auch ein wenig überspitzt formuliert, führt unweigerlich dazu, dass die Fachbereiche unzufrieden sind. Außerdem passiert es häufig, dass sich während der Implementierungsphase Anforderungen aus Sicht der Fachbereiche ändern.
Ein agiler Ansatz mit kurzen Entwicklungszyklen (Sprints) an deren Ende immer ein lauffähiges (Zwischen-)Ergebnis steht, welches von den Fachbereich bewertet werden kann, hilft solchen Entwicklungen entgegenzuwirken. Auch ist das Data Warehouse und die darauf aufbauende BI Landschaft kein IT Selbstzweck, sondern muss sich eng an den Anforderungen der Fachbereiche orientieren. Fachbereiche haben das Recht aber auch die Pflicht maßgeblich in einem Data Warehouse Projekt mitzuarbeiten, damit am Ende das gewünschte Ergebnis realisiert ist.

Analytische Datenbanken

Analytische Datenbanken zeichnen sich dadurch aus, dass deren Architektur und Funktionsweise auf analytische Anwendungen ausgerichtet sind. Man spricht dabei auch von einer Abfrageorientierung, das heißt, dass schnelles Lesen und Verarbeiten von Daten im Fokus steht. Damit die genannten Mehrwerte geboten werden können, werden verschiedene Technologien eingesetzt: In-Memory Speicherung, Spaltenorientierung, (massive) Parallelisierung und Datenkompression.
Bekannte Vertreter sind u.a. Exasol (ExaSolution), Teradata (Database) und HP (Vertica).
Analytische Datenbanken können damit eine echte Alternative oder zumindestens Erweiterung zu einem bestehenden Data Warehouse sein

Data Vault (2.0)

Dan Linstedt veröffentlichte 2000 die erste Version das Data Vault Modelling. Seit 2013 gibt es Data Vault 2.0, welches die ursprüngliche Version um Big Data Anforderungen erweitert und Themen wie Methodik, Architektur und Best Practices in der Implementierung erweitert.
Mit Data Vault 2.0 ist eine „echte“ agile Data Warehouse Entwicklung möglich. Dabei ersetzt Data Vault die bisherige Core Implementierung (nach Kimball oder Inmon) im Data Warehouse.
Data Vault
Das Data Vault Modell enthält drei Entitätstypen: Hubs, Links und Satellites. Die Hubs speichern dabei die Business Keys, mit Hilfe der Links werden Beziehungen abgebildet und die Satellites enthalten alle beschreibenden Informationen. Aufgrund der Einfachheit der Architekturkomponenten ist es möglich Anforderungen zeitnah einzubauen und auszuliefern.

Fazit

Data Warehousing im klassischen Sinne muss sich ändern. Die derzeitige mangelnde Zielerreichung und die „langen“ Entwicklungszyklen unterstützen die betriebswirtschaftlichen Entscheidungsprozesse nur bedingt. Agile Entwicklungsansätze, die sich in der Anwendungsentwicklung seit Längerem bewährt haben, können helfen, dass die Entwicklung schneller voran geht und die Fachbereiche dauerhaft in die Entwicklung eingebunden sind. Klassische Themen wir Datenqualität und Anfrageperformance dürfen dabei trotz aller Trendentwicklungen nicht vernachlässigt werden, damit das Vertrauen in die Daten ausgebaut werden kann. Moderne Datenbanksystem wie Analytische Datenbanken oder neuartige Architekturmodelle (Data Vault) runden die Möglichkeiten ab, dass Data Warehouse von gestern auf die Anforderungen von morgen vorzubereiten.

By | 2016-12-26T18:13:46+00:00 Dezember 19th, 2016|Data Warehouse|0 Kommentare

Hinterlassen Sie einen Kommentar