KI-gestützte Analysen: Welche Umweltfaktoren die Bienenaktivität beeinflussen
Im BMEL-Projekt OCELI wurde mit KI-gestützten Analysen erforscht, welche Umweltfaktoren die Bienenaktivität beeinflussen. Eine zentrale Rolle spielte dabei die Analyseerweiterung von disy Cadenza.

Obst, Gemüse, Heilpflanzen und Honig – Bienen sind als Bestäuber unverzichtbar für unsere Nahrungsmittelproduktion. Ein weiterer Rückgang der Bienenpopulationen hätte daher direkte Auswirkungen auf die Nahrungsmittelsicherheit. Obwohl viele Ursachen des Bienensterbens bekannt sind, ist das komplexe Zusammenspiel dieser Faktoren noch nicht vollständig erforscht. Mit dem Ziel, den Einfluss von Umweltfaktoren auf die Aktivität von Honigbienen mithilfe KI-gestützter Analysen besser zu verstehen, startete 2021 das dreijährige Forschungsprojekt OCELI. Gefördert wurde das inzwischen abgeschlossene Projekt vom Bundesministerium für Ernährung und Landwirtschaft (BMEL) unter dem Titel „Bienenbasiertes Biomonitoring zur Erschließung der synergetischen Wirkmechanismen von Landwirtschaft und Bestäuberinsekten“ (Kennzeichen 281C307D19).
Forschungsteam vereint Expertise für KI-gestützte Analysen der Bienenaktivität
Das interdisziplinäre Projektkonsortium unter Leitung des FZI Forschungszentrum Informatik und mit Beteiligung von Disy, apic.ai, Helmholtz-Zentrum für Umweltforschung und Eurofins Agroscience Services Ecotox hat OCELI als innovatives technologisches Gesamtsystem konzipiert. Es umfasst Hardware, Software sowie Workflows zur Erfassung von Umgebungsdaten und deren Interpretation mittels Simulationsmodellen. Ziel war es, einzelne Gefahren für Bestäuberinsekten und ihre Wechselwirkungen messbar zu machen und zu bewerten. Dazu kombinierten die Projektpartner ihre Expertise in den Bereichen Künstliche Intelligenz (KI), vernetzte Sensorik, Entomologie, Geointelligenz, Ökotoxikologie und ökologische Modellierung.

Projektkonsortium OCELI
Skizze der Gesamtlösung für KI-gestützte Analysen der Bienenaktivität
Dazu wurde im Projekt das Potenzial von Bienen als Biosensoren mithilfe visueller Monitoring-Technologie erforscht. Das hierfür entwickelte energieautarke Monitoringsystem von apic.ai wurde am Eingang der untersuchten Bienenstöcke installiert. So konnten alle ein- und ausfliegenden Bienen über lange Zeiträume zuverlässig gefilmt werden. Als Voraussetzung für die qualitative und quantitative Analyse der Bienenaktivität, beispielsweise mit disy Cadenza, kamen zunächst neuronale Netze als KI-Methode für die Bilderkennung zum Einsatz. Ferner wurde die Möglichkeit der automatischen Klassifikation von multispektralen Pollenbildern zu Pflanzenarten untersucht. Außerdem wurden Marker verwendet, um die Aktivität und den Polleineintrag von Kohorten markierter Individuen zu erfassen.
Die gewonnenen Daten wurden mit räumlichen Umgebungsdaten aus unterschiedlichen Quellen angereichert und unter anderem mit disy Cadenza analysiert. Über die Analyseerweiterung von disy Cadenza wurden KI-gestützte Analysen angestoßen. Durch die Auswertung von Geodaten im Flugradius der Bienen konnten Zusammenhänge zwischen Veränderungen im Umfeld und der Entwicklung der Bienenvölker hergestellt werden. Von besonderem Interesse waren dabei:
- die quantitative Erfassung von Sammelflügen,
- die Anzahl der Bienen, die aufgrund von Mortalität oder Orientierungsproblemen nicht zurückkehren,
- der Eintrag von Blütenpollen als Indikator für Nahrungsverfügbarkeit und Bestäubungsaktivität.
Zudem wurde untersucht, ob sich die farbliche Differenzierung des gesammelten Pollens als Indikator für die Vielfalt der Blühpflanzen in der Umgebung nutzen lässt. Dazu wurden die Geo-, Wetter-, Landnutzungs- und Flugmonitoring-Daten mit dem etablierten Simulationsmodell BEEHAVE verknüpft. Das Projekt OCELI wurde durch begleitende Feldstudien ergänzt, die sich auf die Lebensraumbewertung und die Bewertung von Risikofaktoren konzentrierten.

KI-Analyse der Bienenaktivität
Hierbei wurden relevante Merkmale definiert, um Hypothesen zu den Ursachen von Bienenverlusten zu überprüfen. Auf dieser Grundlage wurden für einen Modellstandort Empfehlungen entwickelt, um Maßnahmen für eine bestäuberfreundliche Landschaft abzuleiten. Dabei wurden auch die Bodenbeschaffenheit, Niederschlagsmengen, Grundwasserspiegel, erwartete klimatische Veränderungen und die bestehenden Blühpflanzen vor Ort berücksichtigt.
disy Cadenza im Einsatz: KI-gestützte Analysen und Explainable AI
Die Arbeiten von Disy konzentrierten sich auf den Einsatz von Methoden aus Business & Location Intelligence zur Beantwortung zentraler Fragestellungen des Projekts. Ein besonderer Fokus lag dabei auf der Integration von Algorithmen des räumlichen maschinellen Lernens (Spatial Machine Learning) in Analysen von disy Cadenza. Für diese Analyse wurden über 70 Merkmale aus verschiedenen Quellen berücksichtigt. Dazu gehörten unter anderem: Tageszeit, Tageslänge, Temperatur, relative Feuchte, Luftdruck, Windgeschwindigkeit und -richtung, Niederschlagsmenge, Sonnenscheindauer sowie Landnutzungsdaten (CORINE). Zudem flossen Treibhausgasmessungen wie CO₂ (ICOS) und Biodiversitätswerte (Simpsons-Index aus der Laboranalyse eigener Pollenfallen) mit ein. Dennoch blieben Datenlücken, wie beispielsweise bei den Merkmalen Bodenoberflächenfeuchtigkeit (SSM), der zeitlich hochaufgelösten Landnutzung und der Phänologie.
Um die KI-gestützten Analysen in disy Cadenza über die Analyseerweiterung steuern zu können, wurden spezielle Softwarepakete entwickelt. Dafür kam Julia zum Einsatz – eine Hochleistungsprogrammiersprache für wissenschaftliches Rechnen, Datenanalyse und maschinelles Lernen. Zur Bewertung der Ergebnisgüte und Berechnungszeit wurden verschiedene Machine Learning-Ansätze genutzt und miteinander verglichen. Dazu gehörten Entscheidungsbäume, Random Forests, neuronale Netzwerke, Support Vector Machines (SVM), verallgemeinerte lineare Modelle (GLM) sowie LASSO-LARS – eine regulierte Regressionsmethode, die Statistik und maschinelles Lernen kombiniert.
Da Verständlichkeit, Nachvollziehbarkeit und Zuverlässigkeit von KI- und ML-Methoden in der praktischen Anwendung eine zentrale Rolle spielen, wurden auch diese Aspekte vertieft untersucht. Ein besonderer Fokus lag auf „Explainable AI“ – also Methoden zur besseren Interpretierbarkeit von ML-Ergebnissen. Dazu wurde unter anderem die SHAP-Methode eingesetzt, eines der bekanntesten Verfahren in diesem Bereich. SHAP-Werte messen, wie stark verschiedene Eingabeattribute die Gesamtvorhersage eines trainierten ML-Modells beeinflussen. Abb. 6 zeigt die Integration dieses Verfahrens in das Gesamtszenario.
In disy Cadenza kann die Berechnung der SHAP-Werte über die Analyseerweiterung ausgewählt werden. Bei der Parametrierung werden die relevanten Attribute festgelegt. Das Ergebnis der Berechnung wird anschließend als Data Enrichment zurück in disy Cadenza überführt. Konkret bedeutet das: Eine neue Datenbankspalte wird angelegt, in der für jedes Eingangsattribut der zugehörige SHAP-Wert gespeichert wird. Diese Spalte wird über die Analyseerweiterung automatisch mit den Ergebnissen des in Julia implementierten SHAP-Algorithmus befüllt. Die Ergebnisse werden schließlich als Balkengrafik visualisiert. Die Balkenlänge zeigt die Stärke des Einflusses eines Attributs auf die vorhergesagte Bienenaktivität. Die Farbe gibt an, ob der Einfluss positiv (fördernd) oder negativ (hemmend) ist.
Die Experimente hatten sowohl einen technischen als auch einen methodischen Charakter. Zur Durchführung wurde exemplarisch die weitverbreitete CRISP-DM Methode als Prozessmodell für die Durchführung von Data Mining-Projekten herangezogen. Da Disy im Rahmen des Forschungsprojekts auch die eigene Expertise im Umgang mit fortgeschrittenen Machine Learning-Technologien und disy Cadenza weiterentwickeln wollte, wurde zusätzlich bewertet, wie gut disy Cadenza bereits als unterstützendes Werkzeug für solche Aufgaben geeignet ist.
disy Cadenza bietet viele Funktionalitäten für die Prozessschritte „Data Understanding“ und „Data Preparation“. In den Schritten „Modeling“ und „Evaluation“, bei denen externe ML-Algorithmen angesteuert werden, gibt es jedoch noch Ausbaubedarf für die disy Cadenza-Analyseerweiterung. Insbesondere bei der asynchronen Verarbeitung langlaufender Lernalgorithmen oder der Übergabe ganzer Attributgruppen als Lernparameter bestehen noch Entwicklungsmöglichkeiten. Auch im Bereich „Deployment“ gibt es Verbesserungspotenzial. Dieses Thema – die Nutzung von AutoML- und MLOps-Verfahren zur effizienten Integration von ML-Algorithmen in betriebliche oder behördliche Softwarelandschaften – wird derzeit im BMBF-geförderten Forschungsprojekt Simplex4Learning weiter vorangetrieben.
Erkenntnisse aus den KI-gestützten Analysen zur Bienenaktivität
Mit dem für OCELI entwickelten Gesamtsystem konnte die Bienenaktivität erfolgreich KI-gestützt überwacht werden. Die gewonnenen Erkenntnisse ermöglichen ein besseres Verständnis der Dynamik von Bienenvölkern und ihrer ökologischen Abhängigkeiten. Es zeigte sich, dass Faktoren wie Tageszeit, Jahreszeit, Temperatur, Sonnenscheindauer, relative Luftfeuchtigkeit und Biodiversität die Bienenaktivität maßgeblich beeinflussen. Diese erklärten 70 bis 80 Prozent der beobachteten Variabilität.
Zudem konnte nachgewiesen werden, dass sich Lebensräume anhand der Bienenaktivität, des Polleneintrags und des Anteils an Pollensammlerinnen vergleichen lassen. So waren die Bienenvölker im großflächig strukturierten Königslutter über weite Teile des Jahres aktiver bei der Nahrungssuche als im kleinstrukturierten Stutensee.
Die Analyseergebnisse fanden großes Interesse bei Bienenforscher*innen. Dennoch sind weitere Forschungsarbeiten erforderlich, um aus den gewonnenen Daten praxisnahe Verfahren zu entwickeln – beispielsweise für die Landschaftsbewertung. Für Disy und seine Kunden hatten die OCELI-Experimente einen unmittelbaren Nutzen: Sie vertieften die Erfahrungen mit fortgeschrittenen Methoden und Algorithmen des Maschinellen Lernens für geo- und umweltwissenschaftliche Fragestellungen. Zudem zeigten sie neue Entwicklungsansätze für die Analyseerweiterung von disy Cadenza auf.