Online Analytical Processing – das Multitalent für die mehrdimensionale Datenanalyse

Online Analytical Processing ermöglicht eine schnelle, flexible und multidimensionale Datenanalyse für Business Intelligence und erweist sich als echtes Multitalent.

AIFER - Lageinformationssystem mit KI

Betrachtet man Daten und ihre Struktur einmal genauer, stellt man schnell fest, dass sie nie gleich sind: Sie können einfach strukturiert sein, aber auch sehr viele Beziehungen untereinander enthalten oder auf andere Datensätze verweisen. Besonders für die Analyse komplex strukturierter Daten braucht man deshalb Methoden und Hilfsmittel, um den vermeintlichen Datendschungel zu durchdringen. Online Analytical Processing (kurz: OLAP) ist eine solche Methodik, mit der Komplexität reduziert und Daten aus verschiedenen Blickwinkeln analysiert werden können. Das Bild eines Würfels hilft dabei, gezielt in die Daten „einzutauchen“ und wertvolle Erkenntnisse zu gewinnen.

Das verbirgt sich hinter dem Begriff OLAP

Der Begriff OLAP wurde bereits 1993 von Edgar F. Codd geprägt. Heutzutage steht er als Überbegriff für Technologien, Methoden und Tools zur Ad-hoc-Analyse von Daten, die komplex strukturiert sind. Ziel von OLAP ist es, Daten gezielt zu filtern, indem die untersuchte Menge durch Filterung reduziert wird und man so u. a. zu multidimensionalen Informationen gelangt. OLAP findet seine Anwendung oft im Bereich Business Intelligence.

Mithilfe dieser Methodik können Antworten auf viele Fragestellungen gefunden werden. Einst mit der Analyse von Geschäftsdaten in Verbindung gebracht, beispielsweise im Finanz- oder Vertriebs-Controlling, lässt sich dieser Ansatz auch sehr gut für die Analyse von Messungen der verschiedenen fachlichen Disziplinen in der öffentlichen Verwaltung einsetzen.

Ein Würfel als Erklärmodell für OLAP

Die Systematik von OLAP lässt sich anhand des Bilds eines Würfels, im Softwarebereich oft auch als Cube bezeichnet, erklären. Die Kanten des Würfels bilden dabei die Dimensionen der Daten ab. Aus der Kombination verschiedener Dimensionen erhält man eine oder mehrere Würfelzellen; aus den darin enthaltenen Werten wird die Kennzahl als Anzahl oder Wert gebildet. Dimensionen beschreiben also die Kennzahlen, indem sie die Daten in Kategorien einteilen. Sie liefern den Kontext, in den die Daten eingeordnet werden, und haben einen Einfluss auf die Detailgenauigkeit in der Darstellung. Dimensionen können unterschiedliche Datentypen haben. Welche Kennzahlen ermittelt werden, hängt vom konkreten Anwendungsfall ab.

Ein Beispiel für die praktische Ermittlung im Bereich des Personal-Controllings finden Sie hier.

Einige Dimensionen können Besonderheiten aufweisen: Sie haben eine hierarchische Beziehung. Neben räumlichen Hierarchien (Beispiel: Bundesland > Landkreis > Gemeinde > Straße > Hausnummer), können auch Datumsattribute zur Erzeugung von zeitlichen Hierarchien herangezogen werden, z. B. bei der Aggregation von Kennzahlen auf Monats-, Quartals- oder Jahresebene.

OLAP-Operationen im Überblick

Das OLAP-Würfelmodell bietet verschiedene Operationen, um Daten zu analysieren:

Am Modell des OLAP-Würfels lassen sich die Operationen, die an den Daten vorgenommen werden, sehr anschaulich darstellen.

OLAP-Operationen anhand des Würfelmodells dargestellt

Slicing

Wird nach einer Dimension des OLAP-Würfels gefiltert, spricht man von Slicing: Aus dem Würfel wird eine Scheibe „herausgeschnitten“, die Daten werden auf die ausgewählte Dimension (z. B. die Zeit) eingeschränkt. Die „Dicke“ der Scheibe ist davon abhängig, nach wie vielen Werten innerhalb einer Dimension gefiltert wird.

Dicing

Filtert ein Nutzer nach mehreren Dimensionen (z. B. Zeit und Ort) gleichzeitig, führt er ein sogenanntes Dicing durch. Er „schneidet“ quasi aus dem vorherigen OLAP-Würfel einen Teilwürfel aus.

Drill-up und Drill-down

Auch für den Wechsel zwischen verschiedenen Detailebenen gibt es entsprechende Fachbegriffe: Ein Wechsel auf die höhere Abstraktionsebene (z. B. von Quartals- zu Jahreswerten) wird als Drill-up, ein Wechsel auf die tiefere Abstraktionsebene (z. B. von Quartals- auf Monatsebene) als Drill-down bezeichnet.

Drill-through

Von einem Drill-through spricht man hingegen, wenn man z. B. mittels einer Verlinkung auf eine andere Auswertung oder in andere Daten springt, die inhaltlich mit den bisher untersuchten Daten zusammenhängen. Der Drill-through wird oft dafür verwendet, um in weitere OLAP-Würfel zu wechseln.

Splitting

Im Würfelmodell spricht man vom Splitting, wenn die bisherigen Kennzahlen nach den Werten einer weiteren Dimension aufgeteilt, also „gesplittet" werden (z. B. den Umsatz einer Filiale für eine bestimmte Menge von Produkten). Nutzende können ein Datenmodell auch reduzieren, indem nicht mehr benötigte Dimensionen entfernt werden. Die Kennzahlwerte werden entsprechend angepasst.

Pivotierung

Eine weitere mögliche Operation ist die Pivotierung. Dabei handelt es sich um eine Rotation des Würfels. In der praktischen Anwendung ist das die Veränderung der Tabellendarstellung bspw. das Ändern der Spaltenreihenfolge in einer Tabelle. Die Werte der Kennzahlen verändern sich hierbei nicht, die Nutzenden können diese aber aus verschiedenen Perspektiven betrachten. Somit wird der Blickwinkel auf die zuvor vermeintlich schon bekannten Daten verändert und es können neue Erkenntnisse gewonnen werden.

Diese Vorteile bieten mehrdimensionale Analysen mit OLAP

Auf OLAP basierende Auswertungen bieten zahlreiche Vorteile:

  • Flexibilität und Ad-hoc-Einsatz: Die Daten können hinsichtlich jeder Dimension untersucht und selektiert werden. Ändert sich während der Analyse das Erkenntnisziel, kann jederzeit flexibel darauf reagiert werden.
  • Große und komplexe Daten ohne Limit analysieren: Während Tabellenkalkulationsprogramme, wie beispielsweise in Microsoft Excel abgelegte Daten, in der Regel nur zwei Dimensionen darstellen können, lassen sich mittels OLAP große Mengen an Daten mit mehreren Dimensionen verwalten.
  • Geringere Fehleranfälligkeit: Bei Auswertungen mit Hilfe von Tabellenkalkulationsprogrammen besteht immer die Gefahr, dass Zeilen oder Spalten verrutschen und Daten manuell überschrieben werden. Das kann bei OLAP nicht geschehen: Die Daten liegen in einer Datenbank bereit. OLAP „holt“ sich die benötigten Daten zur Auswertung.
  • Zeitersparnis: Damit die Daten aus jedem Blickwinken betrachtet und Informationen entdeckt werden können, bietet unsere Business & Location Intelligence-Software disy Cadenza eine grafische Oberfläche, in die die Daten zur Analyse per Drag-and-drop gezogen werden können. Die Software übernimmt automatisch die richtige Gruppierung, Kennzahlberechnung und bis hin zum Vorschlag einer Visualisierung.
  • Neue Erkenntnisse: Analysten fallen Werte-Ausreißer oft zuerst ins Auge, verstecktere Informationen und Zusammenhänge sind erst nach gezielter Suche auffindbar. OLAP hilft, neue Erkenntnisse zu gewinnen, indem alle Informationen in den Daten zugänglich werden.

Versucht man aus Zahlen und Daten neue Erkenntnisse zu gewinnen und damit die Entscheidungsfindung zu unterstützen, müssen Analysen oftmals flexibel und ad-hoc durchgeführt werden. OLAP ermöglicht hier innerhalb des Business Intelligence-Kontextes eine leistungsstarke Datenanalyse, die es Organisationen ermöglicht, bessere Einblicke in ihre Daten zu gewinnen und fundierte Entscheidungen zu treffen. Mit Hilfe der Business & Location Intelligence-Software disy Cadenza gelingt dies sowohl Profi-Analysten als auch gelegentlich Anwendenden.