BMVI-Projekt: Wertschöpfung aus Open Data

Innerhalb der BMVI-Forschungsinitiative mFUND entwickeln Disy und das FZI Karlsruhe im Projekt WEKOVI gemeinsam Methoden und Software-Werkzeuge, um aus offenen Geodaten der öffentlichen Verwaltung mit Big-Data-Technologien neue Mehrwerte zu erzeugen.

Wie gut ist eine Wohngegend für Familien mit schulpflichtigen Kindern? Oder für ältere Menschen mit Mobilitätseinschränkungen? Welcher der Standorte bietet die besseren Bedingungen für ein neues Industriegebiet? Welche Metropolregion macht den besten Job bei der Schaffung moderner Infrastrukturangebote? Was haben diese zunächst ganz unterschiedlichen Fragestellungen gemeinsam? Würde man sie vielleicht durch intelligente Auswertung von Open Data und insbesondere von offenen Geodaten der öffentlichen Verwaltung beantworten können?

Das Forschungsprojekt „WEKOVI - Werkzeuge für die einfache Berechnung komplexer Vergleichsindizes“ untersucht, wie man einen oder mehrere Orte bzw. Gebiete (Stadtviertel, Stadt, Metropolregion …) bezüglich einer komplexeren abstrakten Eigenschaft (Eignung für Familien, Vorhandensein moderner Infrastruktur …) bewerten kann. Diese Bewertung soll möglichst objektiv, explizit dokumentiert und quantitativ bestimmbar sein, so dass sich die betrachteten Objekte bezüglich dieser Eigenschaft gut vergleichen lassen, idealerweise mithilfe automatisch berechenbarer Indexwerte.

Um eine solche Aufgabe zu lösen, bricht man die betrachtete komplexe Eigenschaft solange auf konkretere Teilaspekte herunter, bis man zu entscheidbaren, messbaren oder berechenbaren Merkmalen kommt. Für das Beispiel „Eignung für Familien mit Kindern“ könnten solche Teilaspekte beispielweise sein: Nähe zum Kinderarzt, Nähe zu Schulen und Freizeitmöglichkeiten, Vorhandensein von Einkaufsmöglichkeiten, geringer Durchgangsverkehr, geringe Umweltbelastung, akzeptabler durchschnittlicher Mietpreis, ausgeglichene Altersstruktur bei den Bewohnern usw. Hat man die Bewertungen für die Einzelaspekte bestimmt, werden diese Einzelbewertungen zu einem Gesamtindexwert aggregiert, z. B. durch Bildung eines gewichteten Mittelwerts. Vorher müssen die Einzelbewertungen ggf. noch geeignet normiert werdeb, so dass sie auch sinnvoll zusammen verrechnet werden können. Die entstehende Gesamtbewertung wird als komplexer Vergleichsindex (KVI) bezeichnet.

Die Basishypothese im WEKOVI-Projekt ist es nun, dass solche Berechnungen heutzutage für viele Einzelaspekte auf Geodatenauswertungen öffentlich verfügbarer Daten (Open Data der Verwaltung, von Firmen, Vereinen usw.) zurückgeführt werden können, wie z. B. Adressen von Ärzten, Schulen, Verwaltungseinrichtungen, Geschäften, Fahrpläne des ÖPNV, Umweltdaten der Landesämter, Statistikdaten der Verwaltung.

Das wissenschaftlich-technische Projektziel von WEKOVI ist es daher, einen experimentellen Prototyp für eine offene Software-Plattform zu realisieren, die es einem Anwender ermöglicht, auf der Basis von Open-Data-Angeboten mithilfe seiner Anwendungsexpertise, aber ohne spezifische IT-Fachkenntnisse

  • komplexe Vergleichsindizes (KVI) und ihre Berechnung zu definieren,
  • die für die Berechnung erforderlichen Datenquellen zu identifizieren und anzusprechen,
  • automatisiert die Bewertung der Einzelaspekte und Werteaggregation durchzuführen,
  • die Ergebnisse in geeigneter Weise darzustellen und zu analysieren und
  • Ergebnisse in einer Community zu teilen und kollaborativ weiter zu entwickeln.


Eine solche Werkzeugunterstützung für die vereinfachte, dokumentierte und wiederholbare Berechnung komplexer Vergleichsindizes wäre sehr allgemein anwendbar und könnte Nutzungsmöglichkeiten z. B. in Wissenschaft, Politik, Journalismus und Privatwirtschaft finden. Für manche Aufgaben könnten auch öffentliche Daten mit privaten Datenquellen kombiniert werden.

Diese Zielsetzung beinhaltet vielfältige Aspekte verschiedenster Art, wie z. B.: methodische Vorgehensweise zur Erstellung von Bewertungsworkflows, Metadaten zum Finden und Nutzen von Datenquellen, semantische und räumliche Integration von Geodaten, effiziente Verwaltung historisierter Daten für die Betrachtung von Trends, Community-Mechanismen für die gemeinsame Indexdefinition, Verfügbarkeit und Qualität öffentlicher Daten u. v. m.

Die Projektarbeiten setzen auf gängigen Open-Data-Plattformen auf, insbesondere auf der Datenplattform mCLOUD für die Open-Data-Angebote der Behörden im Geschäftsbereich des BMVI und anderer Anbieter von Daten zu Mobilitätsthemen. Die Daten werden in einem mehrstufigen Prozess (syntaktische und semantische Harmonisierung, Historisierung, Metadatenanreicherung) ins WEKOVI Spatial Data Warehouse übernommen und können dort zur Definition und Berechnung von komplexen Vergleichsindizes verwendet werden (vgl. Abb. 1). Ein intelligenter Software-Assistent unterstützt die Anwender bei diesen Aufgaben. Die KVI-Definitionen können innerhalb der Anwender-Community ausgetauscht und kollaborativ weiterentwickelt werden.

Zur technischen Umsetzung des WEKOVI-Prototypen kommen moderne Technologien für Big Data, Smart Data und Geodatenverarbeitung zum Einsatz, wie z. B. die Disy GeoSpatial Integration für Talend zur Umsetzung einer Geo-ETL-Pipeline für das Integrieren und Harmonisieren von Geodaten, Elasticsearch für verteilte Datenhaltung und Suche, Apache Flink für die verteilte Datenstromverarbeitung, Apache Kafka als Message-Broker, RDF4J zur Verwaltung semantischer Metadaten und das FZI-Werkzeug StreamPipes zur intelligenten Anbindung heterogener Datenströme und für die KVI-Berechnung. Die Architektur basiert auf dem Prinzip der Microservices (vgl. Abb. 2). Microservices setzen sich in den letzten Jahren zunehmend als Software-Architekturmuster durch, um gut wartbare und automatisch skalierbare Softwarelösungen aus vielen überschaubaren, unabhängigen Prozessen zusammenzusetzen.

Das Projekt WEKOVI hat eine Laufzeit von Mai 2017 bis Juli 2019 und wird von Disy koordiniert. Disy kümmert sich primär um die Realisierung aller geodatenbezogenen Projektanteile. Dr. Johannes Kutterer und Sophia Baron aus dem Disy-Team bringen ihre Forschungs- und Praxiserfahrungen in das Projektmanagement ein. Für die methodischen Fragestellungen und für die Themen Datensemantik, Datenstromverarbeitung und intelligente Anwenderunterstützung sind zwei Arbeitsgruppen des FZI Forschungszentrum Informatik am Karlsruher Institut für Technologie mit an Bord:

  • Abteilung Wissensmanagement (WIM, Prof. Dr. York Sure-Vetter, Dr.-Ing. Dominik Riemer)
  • Abteilung Information Management & Analytics (Prof. Dr. Christof Weinhardt, Dr.-Ing. Nico Rödder)


WEKOVI wird vom Bundesministerium für Verkehr und digitale Infrastruktur (BMVI) im Rahmen der Forschungsinitiative mFUND finanziell unterstützt. Der mFUND fördert Forschungs- und Entwicklungsvorhaben, die mit den Daten des BMVI und weiteren öffentlichen Datenquellen digitale Nutzungs- und Vernetzungsmöglichkeiten wie z. B. neue Navigationsdienste, intelligente Reiseplaner oder hochpräzise Wetter-Apps entwickeln. Die Projektleiter innerhalb des mFUND stellten ihre Projekte bereits bei der mFUND-Konferenz im August 2017 einem breiteren Publikum vor, und beim Auftaktworkshop zur mFUND-Begleitforschung im Dezember 2017 wurden Ansatzpunkte diskutiert zum Schaffen projektübergreifender Synergien und Kooperationen.