Mit Advanced Analytics und Künstlicher Intelligenz (KI) immer einen Schritt weiter gehen: Analyseerweiterungen in disy Cadenza
Wir haben in disy Cadenza die Tür zur Welt von Künstlicher Intelligenz (KI) und Advanced Analytics weit geöffnet, denn: von nun an ist es möglich, Analyseerweiterungen nahtlos einzubetten. Die Beta-Version der Analyseerweiterung war bereits in disy Cadenza 2023 Autumn verfügbar.
Eine Analyseerweiterung erweitert das Funktionsspektrum von disy Cadenza um eine Analysefunktion oder einen Visualisierungstyp und kann über die disy Cadenza-API angebunden werden. Dadurch eröffnen sich neue Perspektiven für die Datenanalyse. Analyseerweiterungen können beispielsweise mit R oder Python erstellt werden. Neue Informationen und Erkenntnisse werden dabei in disy Cadenza nicht nur sichtbar, sondern auch für weitere Analysen und Berichte nutzbar!
Mit Analyseerweiterungen und disy Cadenza haben Data Science-Teams die Möglichkeit, ihre Analyseverfahren und -Ergebnisse innerhalb der Organisation zur Verfügung zu stellen. Und das Beste: Dabei müssen Sie sich um die oft komplexe Data Governance nicht kümmern, da diese bereits durch disy Cadenza abgedeckt wird. Und alle anderen Anwendenden profitieren von diesen Analysen, ohne entsprechende Kenntnisse haben zu müssen.
Advanced Analytics mithilfe von Analyseerweiterungen
Durch das Hinzukommen der Analyseerweiterungen werden die beiden Analysekomponenten Business Intelligence- und Geo-Analytics, welche sich durch ihre visuellen Ausprägungen auszeichnen, erweitert. Die Analyseerweiterungen sowie BI- und Geo-Funktionalitäten ergänzen sich dabei gegenseitig nahtlos.
Während in disy Cadenza bisher die beschreibende Statistik, bzw. deskriptive Analyse eine große Rolle spielten, sind durch die Analyseerweiterungen jetzt auch fortgeschrittene statistische und mathematische Methoden nutzbar. In einem integrierten Ansatz können Data Mining und Predictive Analytics-Techniken wie Künstliche Intelligenz (KI) und Machine Learning (ML) genutzt werden, um aus Daten zu lernen, Muster zu identifizieren und Vorhersagen zu treffen.
Analyseerweiterungen kommunizieren mit disy Cadenza über eine Schnittstelle (REST). Für R und Python stellt disy Cadenza Bibliotheken bereit, die die Erstellung einer Analyseerweiterung einfacher machen und die Kommunikation mit disy Cadenza übernehmen.
Innerhalb von Organisationen können durch die Analyseerweiterungen eigene Analyseverfahren zur Verfügung gestellt werden. Data-Science-Teams haben so die Möglichkeit, ihre Analyseverfahren und Ergebnisse innerhalb der Organisation zu teilen. Um oftmals komplexe Data Governance müssen sie sich aber nicht kümmern, da das durch disy Cadenza mit seinem umfassenden Rechte- und Rollenkonzept gesteuert wird. Jegliche Zielgruppen und Anwendende profitieren aus den resultierenden Analysen. Und das ohne entsprechende Kenntnisse dafür haben zu müssen.
Neue Anwendungsfälle für die Datenanalyse
Die Analyseerweiterung bietet viele neue Möglichkeiten in der Datenanalyse, wie
- Die Einbettung von wissenschaftlichen Diagrammen bis hin zu durch KI aufbereitete Visualisierungen in Dashboards.
So können Diagramme erzeugt werden, die sonst nicht in disy Cadenza zur Verfügung stehen.
- Datenanreicherungen
Das beinhaltet das Anreichern eines Datensatzes durch die Ergänzung von Attributen, die den Ursprungsdatensatz um zusätzliche Spalten erweitern. Die Datenanreicherung kann sowohl horizontal (neue Zeile im Datensatz) als auch vertikal (neue Spalte im Datensatz) erfolgen. Die Datenanreicherung im Kontext der Analyseerweiterung lässt sich in verschiedene Kategorien unterteilen:- Anreicherung mittels statistischer Verfahren
Beispiel: Die Anreicherung von Daten durch Cluster-Verfahren, also die Gruppierung von Elementen auf Grundlage von Ähnlichkeiten, wie die Identifizierung ähnlicher Kundensegmente. - Anreicherung der Daten durch Services
Beispiel: Die Anreicherung eines Datensatzes durch aktuelle Informationen, wie Wetterdaten durch Gefahrenmeldungen. - Anbinden von generativer KI, wie Large Language Models (bspw. GPT-4, Llama 2, Mixtral)
Beispiel: Das Durchsuchen großer Mengen an Textdaten um Muster, Trends oder spezifische Informationen zu identifizieren oder die semantische Verknüpfung zwischen verschiedenen Informationen, wie die Zusammenfassung einzelner Kategorien in einem Datensatz.
- Anreicherung mittels statistischer Verfahren
- Vorhersagen auf Basis von vorhandenen Daten
Diese beruhen meist auf statistischen Modellen wie Entscheidungsbäumen, Regressionsmodellen, KI o. Ä. Dabei sind alle Sichtweisen möglich: statistisch, geografisch, geotemporal etc. - Das Ansteuern und Anbinden von Simulationsmodellen. Dies wird über Berechnungen erreicht, wo aus vorliegenden Daten ein neuer vom Ursprungsdatensatz unabhängiger Datensatz berechnet wird.
Im Prozess steckt die Magie
Beim Nutzen von Analyseerweiterungen gibt es gewisse Rollen innerhalb eines Gesamtprozesses. Zunächst ist es wichtig, diese Rollen genauer zu kennen:
- Analysten erarbeiten vertiefende Analysen und binden eigene Daten über Self-Service-Prozesse in disy Cadenza an. Die Arbeitsmappen, die erstellt werden, teilen Sie mit Ihrer Fachgruppe für einen agilen und produktiven Austausch im Team.
- Data Scientists analysieren große unstrukturierte und strukturierte Datenmengen. Sie entwickeln auf Basis von mathematischen und statistischen Modellen bzw. Algorithmen, wie Machine-Learning oder KI, spezifische Module für konkrete fachliche Fragestellungen und Datensätze. Daraus resultieren Prognosen und Entscheidungsgrundlagen.
Die Nutzung einer Analyseerweiterung in disy Cadenza kann folgendermaßen ablaufen:
Eine Analystin arbeitet in ihrer gewohnten Umgebung, beispielsweise einer Arbeitsmappe in disy Cadenza. Sie hat einen Datensatz und möchte darin mit der Analyseerweiterung „Clusterung“ Muster identifizieren.
Daneben gibt es eine Data Scientistin. Sie erstellt für die Analystin eine Analyseerweiterung mit Clusterung, ebenfalls in ihrer gewohnten Arbeitsumgebung, wie beispielsweise RStudio, Python o. Ä.
Der Clou an diesem Prozess: Analysten und auch alle anderen Anwendenden können von Analyseerweiterungen in disy Cadenza profitieren, ohne entsprechende Kenntnisse über deren Umsetzung haben zu müssen. So werden diese befähigt, das Verfahren der Clusterung zu nutzen, ohne es selbst implementieren zu müssen. Da sie sich in ihrer gewohnten Arbeitsumgebung befinden, müssen sie die Komplexität der Umsetzung einer Analyse gar nicht verstehen. Aus ihrer Perspektive wird der Datensatz analysiert, worauf sie das Ergebnis in disy Cadenza zurückbekommen und fachlich bewerten können.
Diesen Clustering-Algorithmus entwickelt sie in RStudio. Dabei modelliert sie dort zuerst die Analysefunktion und erweitert dann den R-Code um die Schnittstellenbeschreibung einer Analyseerweiterung. Das Ergebnis ist eine grafische Visualisierung der Klasse, die gefunden wurden und grafische Möglichkeiten, um Informationen über diese Cluster herauslesen zu können.
Diese Analyseerweiterung wird danach in disy Cadenza eingebunden. Das geht ganz einfach über das Management Center. Dort wird die Analyseerweiterung hinzugefügt. Wichtig ist dabei die passende Rechtevergabe, damit nur bestimmte Personen auf diese Analyseerweiterung zugreifen können. In diesem Fall würde eine Vergabe entsprechender Rechte an die oben genannte Analystin erfolgen. Angezeigt wird es in unserem Beispiel als Visualisierung. Aber auch eine Datenanreicherung oder Berechnung sind dabei denkbar.
Die Analystin verwendet die Analyseerweiterung während ihrer Analysen in disy Cadenza: Sie möchte einen Datensatz gerne clustern. Dafür startet sie mit den Ausgangsdaten in einer Tabelle und arbeitet dabei in ihrer üblichen Umgebung.
Da ihr die Funktion der Clusterung in Form einer Visualisierung zur Verfügung gestellt wurde, wird der Visualisierungstyp der Datensicht zu „Clusterung“ umgeschaltet.
Die Auswertung der Clusterung in der Arbeitsmappe passiert ganz unkompliziert. Daten, die sie eben noch in ihrer Tabelle gesehen hat, werden an die Analyseerweiterung übertragen. Die Analyse wird daraufhin mit dem statistischen Modell durchgeführt, das Ergebnis wird in disy Cadenza visuell aufbereitet. Solche Diagramme sind nahtlos in disy Cadenza integriert und können wie jedes weitere Element eines Dashboards behandelt werden. So ist es auch möglich, die Daten zum Beispiel per Filterungen einzuschränken, um diese aus verschiedenen Perspektiven, wie einen gewissen Zeitraum, zu beleuchten. Und das Beste: Es kann eine Wechselwirkung zwischen den verschiedenen Analyseansätzen entstehen. So könnte diese Clusterung für weitere Analysen genutzt werden, beispielsweise in einer OLAP-Tabelle.
Außerdem können auch noch weitere darauf aufbauende Analyseschritte vorgenommen werden. Die Visualisierung des Clusters im Dashboard ist hierbei eine Möglichkeit. Denkbar wäre aber auch eine Anreicherung um die Cluster als Dimension, um darauf aufbauend weitere Analysen durchzuführen.
Alle Ergebnisse aus einer Analyseerweiterung können zudem problemlos in das Berichtswesen eingebunden werden.
Kurz gesagt: Advanced Analytics in disy Cadenza nutzen
Die Analyseerweiterung werden als Beta-Version in disy Cadenza schon seit 2023 Autumn unterstützt. Damit betritt disy Cadenza die Welt von Advanced Analytics und KI. Sie nutzen fortgeschrittene statistische und mathematische Methoden, um beispielsweise Vorhersagen aus Daten zu treffen, Informationen in unstrukturierten Daten sichtbar und nutzbar zu machen oder über generative KI Fachwissen in Bezug zu den Daten zu setzen. Das bedeutet, dass die KI in der Lage ist, neue, sinnvolle Inhalte zu erstellen, die auf den Mustern und Informationen basieren, die sie während des Trainings „gelernt“ hat.
Die Analyseerweiterungen sowie BI- und Geo-Funktionalitäten ergänzen sich dabei in der Datenanalyse-Software gegenseitig. Neue Informationen und Erkenntnisse werden so in disy Cadenza nicht nur sichtbar, sondern auch für weitere Analysen und Berichte nutzbar. Erhaltene Informationen können anschließend vielfältig dargestellt und geteilt werden.
Data Science-Teams haben außerdem die Möglichkeit, ihre Analyseverfahren und Ergebnisse durch die Plattform disy Cadenza innerhalb der Organisation für Anwendende zur Verfügung zu stellen. Und das Beste dabei ist: Sie müssen sich um die oft komplexe Data Governance nicht kümmern, da das durch disy Cadenza mit seinem umfassenden Rechte- und Rollenkonzept gesteuert wird. Alle anderen Anwendenden profitieren von solchen Analysen, ohne entsprechende Kenntnisse dafür haben zu müssen. Auch eine Einbindung fachspezifischer Analyseverfahren in disy Cadenza ist möglich.
Wie Sie sehen, eröffnen die Möglichkeiten zu Advanced Analytics unendlich viele neue Analysemöglichkeiten in disy Cadenza. Wir stehen Ihnen mit unserer Beratungs- und Lösungsexpertise in allen Bereichen gerne zur Seite und erarbeiten gemeinsam mit Ihnen spezifische Lösungen, die auf Ihre Bedürfnisse zugeschnitten sind. Kontaktieren Sie uns dazu gerne.
Live und in Farbe: Advanced Analytics in disy Cadenza
Sie möchten sehen, wie die neue Analyseerweiterung effektiv genutzt werden kann, um Muster, Trends und Erkenntnisse in komplexen Datenmengen zu erkennen? Dann folgen Sie uns in die Welt von Advanced Analytics mit disy Cadenza. Denn jetzt kann jeder Nutzer seine Entscheidungsfindung durch erweiterte statistische Analysen bis hin zu Künstlicher Intelligenz und Machine Learning optimieren. Unser integriertes Konzept unterstützt Benutzer von Data Scientists bis hin zu Fachanwendern und ist jetzt für Analyse-Workflows verfügbar – ganz ohne Programmierung.