Wie KI-Verfahren zukünftig Advanced Analytics in disy Cadenza unterstützen könnten

Wie könnten KI-Verfahren die erweiterten Methoden der Advanced Analytics in disy Cadenza unterstützen? Der Antwort sind wir mit dem FZI im BMBF-Forschungsprojekt AIDA-Vis einen Schritt nähergekommen.

Machine Learning soll visuelle Analysen mit disy Cadenza erleichtern

Künstliche Intelligenz (KI) ist die Zukunft. Da sind sich alle Experten einig. In einer Welt, die von Daten dominiert wird, eröffnet die rasante Entwicklung der KI-Verfahren faszinierende Möglichkeiten. Mit ihrer Fähigkeit, Muster zu erkennen, Vorhersagen zu treffen und komplexe Analysen durchzuführen, verändert KI grundlegend die Art und Weise, Daten zu verstehen, zu nutzen und auch sie zu visualisieren. Wie sich dieses Potenzial in disy Cadenza integrieren lässt, haben wir zusammen mit dem FZI Forschungszentrum Informatik im kürzlich abgeschlossenen Projekt „AI-basiertes interaktives Empfehlungssystem für komplexe Datenvisualisierungen“ (AIDA-Vis) untersucht. Es wurde vom Bundesministerium für Bildung und Forschung (BMBF) unter dem Kennzeichen 01IS20097 gefördert.

Mit KI-Verfahren intelligentes Empfehlungssystem für disy Cadenza entwerfen

Die Datenvisualisierung ist eine komplexe Aufgabe, die viel Fachwissen erfordern kann. Bestehende Ansätze von KI-Verfahren für die automatische Generierung von Visualisierungen stützen sich auf das Lernen aus Visualisierungsbeispielen. Sie empfehlen Visualisierungen allein auf Grundlage der Merkmale des Datensatzes und sind damit recht statisch. Um Benutzerpräferenzen und -ziele besser berücksichtigen zu können, sollte im Projekt zum einen mit KI-Verfahren ein intelligentes Empfehlungssystem für disy Cadenza entworfen werden, das iterativ mit den individuellen Präferenzen des Nutzers aktualisiert wird und eine Rangliste von Visualisierungen für einen bestimmten Datensatz ausgibt. Zum anderen sollte die Frage beantwortet werden, ob und wie sich dieses Empfehlungssystem ohne umfangreiche Umbauten von disy Cadenza prototypisch integrieren lässt. Bei der Self-Service Business Intelligence (SSBI), mit der nicht-technische Benutzer Tools zur eigenständigen Datenanalyse verwenden, können Anwendende von automatisierten Datenanalyse- oder Visualisierungsmethoden besonders profitieren.

Visualisierungswissen mit KI-Verfahren Machine Learning generieren

Exemplarisch wurde daher untersucht, wie sich durch das KI-Verfahren Machine Learning (ML) automatisch ableiten lässt, welche Visualisierung im gegebenen Nutzungskontext am besten zu den ausgewählten Daten passt. Dazu wurde eine minimal-invasive Trainingssituation geschaffen. So konnte durch die Beobachtung der Nutzerinteraktion nebenbei der Trainingsinput gesammelt werden, der für das maschinelle Lernen erforderlich ist. Ein so lernendes KI-Verfahren kann die bereits in disy Cadenza verfügbaren Visualisierungsempfehlungen auf Basis heuristischer Regeln ergänzen oder ersetzen. Dabei kann sich das lernende KI-Verfahren einfacher an spezifische Gegebenheiten anpassen oder bei Veränderungen auch die erzeugten Vorschläge adaptieren.

Vielversprechende Ergebnisse dank Machine Learning

In AIDA-Vis wurden verschiedene Machine Learning-Algorithmen zum Aufbau von Visualisierungswissen getestet. Die besten Ergebnisse wurden mit dem sogenannten LightGMBRanker-Verfahren erzielt, dass eine Art Bewertungsregel für Visualisierungen berechnet. LightGMBRanker ist ein spezielles KI-Verfahren, das auf einer Technik namens „Gradienten-Boosting“ basiert und mit Entscheidungsbäumen arbeitet. Diese erstellte Bewertungsregel wurde dann in einem evolutionären Algorithmus verwendet, um die besten Diagramme auszuwählen.

Durch systematische Experimente wurden auf Basis der Visualisierungsvorlieben von über 250 Studierenden Trainingsdaten erstellt, die in Teilen zum Lernen und zur Ergebnisbewertung verwendet wurden. Anschließend wurden auch Überlegungen angestellt, wie sich die entwickelten KI-Verfahren möglichst nahtlos in die User Experience einer kommerziellen Anwendung einpassen lassen. Längerfristig könnte man mit solchen adaptiven Verfahren wie in AIDA-Vis auch weitere Prozessschritte bei der Datenanalyse unterstützen, zum Beispiel um nächste Schritte, wie z. B. einen Drill-Through, beim genauen Betrachten bestimmter Informationen zu empfehlen. Insgesamt können lernende Assistenzfunktionen dabei helfen, auch technisch anspruchsvollere Funktionen zur Datenanalyse zu vereinfachen, wie zum Beispiel die gängigen Algorithmen des maschinellen Lernens, die ebenfalls als Analyseerweiterungen aus disy Cadenza heraus genutzt werden können.

Die Abbildung zeigt, wie Analyse-Erweiterungen mit disy Cadenza gekoppelt werden können

Konzept Analyse-Erweiterung

Advanced Analytics in disy Cadenza anbinden

Wie lassen sich nun Analyseverfahren im Bereich Advanced Analytics in disy Cadenza anbinden? Von der Systemkonzeption her wurde der Ansatz einer leichtgewichtigen Kopplung der erweiterten Analyseverfahren per Programmierschnittstelle (API) getestet, der keine starre Verankerung der Interaktionen in Produktcode und -logik von disy Cadenza erfordert. Auf diese Art und Weise kann die Analyse-Erweiterung einfach durch Konfiguration eingebunden werden. So können im Sinne von Webdiensten definierte Funktionsaufrufe abgesetzt werden, die - ohne Umweg über komplexe Interaktionen mit disy Cadenza - den Zugriff auf die mächtige Analysefunktionen ermöglichen. Auch die Eingabe- und Ergebnisdaten werden explizit übertragen. Die einzelnen Analyserverfahren greifen nicht direkt auf die Datenbank von disy Cadenza zu. Abbildung 2 konkretisiert das Prinzip am Beispiel einer Visualisierung.

Vereinfachte Darstellung für den möglichen technischen Ablauf einer Visual Analytics-Anfrage im Zusammenspiel

Ablauf Analyseanfrage

Forschung liefert Erkenntnisse für Integration erweiterter Analyseverfahren

Die Abbildung zeigt die üblichen Analyseverfahren im Bereich Advanced Analytics

Advanced Analytics-Verfahren

Damit ist es in diesem anwendungsnahen Forschungsprojekt gelungen, einen Prototyp für die Analyse-Erweiterung von disy Cadenza zu entwickeln und zu testen. Durch die KI-Forschung hat Disy nicht nur wichtige Erkenntnisse zu selbstlernenden KI-Verfahren gewonnen, sondern auch verschiedene Ideen entwickelt, wie sich erweiterte Analyseverfahren in die bestehende komplexe Architektur von disy Cadenza nutzungsfreundlich integrieren lassen. Die Erweiterung um KI-basierte Empfehlungssysteme wird auch vor dem Hintergrund der Self-Service-Möglichkeiten von disy Cadenza immer wichtiger, da alle Nutzenden i.S.v. Self-Service Business Intelligence eigene Daten in die Analysen einbringen können. Ebenso zeigte der Projektverlauf, dass sich Business und Location Intelligence sowie KI-Methoden sehr gut ergänzen.

Perspektiven für Weiterentwicklung von disy Cadenza

Ob es uns gelungen ist, auf Grundlage der Projektergebnisse von AIDA-Vis und den Erkenntnissen aus weiteren KI-Projekten wie zum Beispiel NiMo eine praxistaugliche Lösung für die Integration erweiterter Analyseverfahren in disy Cadenza zu implementieren, davon können Sie sich übrigens demnächst ein eigenes Bild machen: Im nächsten disy Cadenza Release 9.3 wird die Analyse-Erweiterung als Beta-Version verfügbar sein. Das finale Release erfolgt in der Spring-Version 2024. Doch das ist erst der Anfang. Wir experimentieren weiter, im Rahmen der kontinuierlichen Produktweiterentwicklung und zusammen mit exzellenten akademischen Partnern in geförderten FuE-Projekten.

Perspektivisch planen wir weitere fortgeschrittene externe Algorithmen an disy Cadenza einzubinden, KI-Verfahren für Umweltfragestellungen anwendbar zu machen und die User Experience nicht nur durch lernende Adaptivität weiter zu steigern, sondern auch durch Ansätze wie den natürlichsprachigen Zugang mit Chatbots oder umgangssprachliche Anfragen à la ChatGPT. Wenn Sie Fragen rund um KI-Verfahren haben oder gemeinsam mit Disy zu spannenden Fragen der intelligenten Datenanalyse forschen möchten, dann kontaktieren Sie gerne unsere Forschenden im KI-Umfeld.