Datenanalyse zu Wein: Fakten und Trends

Wie Sie Daten zum Weinanbau in Deutschland in disy Cadenza importieren, auswerten und im Dashboard übersichtlich darstellen

Es ist Herbst. Die Bäume beginnen sich von ihren Blättern zu trennen, die Tage werden kürzer und kälter und: Hier im Südwesten Deutschlands hat vor Kurzem die Weinlese begonnen.

In unserer heutigen Datenstory gehen wir Fragen zum Weinbau nach. Welche Rebsorten werden in Deutschland häufig angebaut? Gab es hierbei in den letzten Jahren Veränderungen? Diese und weitere Fragen möchten wir mithilfe von disy Cadenza in folgendem Beitrag beantworten.

Die verwendeten statistischen Daten stammen von Destatis. Folgende Themenbereiche werden im Beitrag beleuchtet:

  • Mit Keltertrauben bestockte Rebflächen 2020 in Hektar nach Bundesländern und Weinanbaugebieten
  • Rebflächen in Hektar nach wichtigsten Rebsorten im Zeitvergleich
  • Weinerzeugung in Hektoliter im Zeitvergleich

Sehen Sie, wie Sie

  • Excel-Sheets und Shapefiles in disy Cadenza ad hoc importieren,
  • die Daten zum Weinbau mit Hilfe verschiedener Funktionalitäten auswerten und
  • sie auf unterschiedlichste Weise in einer Arbeitsmappe visualisieren.

Verschiedene Dateien zu Wein in Deutschland importieren und direkt nutzen

Die Datenanalyse-Software disy Cadenza bietet uns die Möglichkeit, flexibel und ad hoc Daten verschiedener Formate, wie zum Beispiel Excel-, CSV- oder KML-Dateien, zu importieren und direkt zu analysieren. In unserem Fall liegen uns mehrere Excel-Sheets und ein Shapefile mit unterschiedlichsten Informationen zu Wein bzw. Weinanbaugebieten in Deutschland vor. Mit nur wenigen Klicks ist der Import abgeschlossen.

Die einzelnen Dateien werden als Objekttypen abgespeichert und stehen im Datenmanager dauerhaft für die Analyse bereit. In Abbildung 1 sehen Sie den Importdialog des Excel-Imports. Rechts davon, in Abbildung 2, ist der Shapefile-Import dargestellt.

Daten zu Wein in Deutschland ad hoc in die Datenanalyse-Software disy Cadenza importieren und analysieren
Abb 1.: Weindaten: Excel-Import
Geodaten in Form von Shapefiles direkt in die Datenanalyse-Software disy Cadenza importieren und in einer Karte anzeigen lassen
Abb 2.: Weindaten mit Raumbezug: Shapefile-Import

Aus importierten Weindaten eine Arbeitsmappe bauen

Nach erfolgreichem Datenimport können wir unsere Arbeitsmappe füllen. Eine Arbeitsmappe besteht aus verschiedenen Arbeitsblättern bzw. Dashboards. Unsere Arbeitsmappe soll aus zwei Arbeitsblättern bestehen.

Legen wir los und schauen uns unsere Daten einmal Stück für Stück genauer an: Zuerst verschaffen wir uns einen Überblick über Rebflächen in Deutschland. Per Drag-and-drop können wir mit wenigen Klicks die wichtigsten Attribute in unser erstes Arbeitsblatt ziehen. Die entstandene Tabelle wird durch eine Pivotierung, also ein Drehen der Tabelle, viel übersichtlicher, da so die Jahresverläufe klarer werden. In Abbildung 3 ist dies zu sehen. Durch die Einfärbung nach Größe der gesamten Rebfläche erkennen wir schnell Entwicklungen und Trends: Riesling beansprucht viel Rebfläche; 1999 wurde Müller-Thurgau sehr häufig angebaut. Dies hat sich in den Folgejahren geändert. Eine weitere Erkenntnis aus unserer Tabelle ist die Rebfläche für den gesamten Weinanbau in Deutschland. 2020 betrug diese 103.180 ha.

Vergleich zwischen klassischer und Pivottabellen in der Datenanalyse-Software Cadenza

Abb. 3: Vergleich zwischen klassischer Tabelle (links) und Pivottabelle (rechts)

Verhältnisse im Kreisdiagramm in der Datenanalyse-Software Cadenza darstellen

Abb. 4: Weinanbau in Deutschland 2020: Vergleich von Weiß- und Rotweinrebflächen in Hektar

Teilinhalte dieser Tabelle wollen wir uns nun genauer anschauen. Dazu nutzen wir weitere Visualisierungstypen, wie verschiedene Diagramme und Karten. Jeder einzelne Visualisierungstyp hat dabei gewisse Vorteile.

Im Kreisdiagramm lassen sich Verhältnisse gut vergleichen: Wurde dem Weißwein oder dem Rotwein in Deutschland 2020 mehr Rebfläche gewidmet? Abbildung 4 zeigt uns ein deutliches Ergebnis: Auf mehr als zwei Dritteln der Rebfläche wurde Weißwein angebaut. Da fragen wir uns direkt: „War das denn schon immer so?“ Ein Zeitvergleich kann darüber Aufschluss geben.

Zeitvergleiche lassen sich sehr gut in Multiliniendiagrammen darstellen. Uns liegen Daten von 1999 bis 2020 vor. Was wir aus dem in Abbildung 5 dargestellten Multiliniendiagramm herauslesen können:

  •  Während der gesamten Zeitspanne wurden mehr Rebflächen mit Weißwein bewirtschaftet.
  • 2009 gab es einen kurzzeitigen „Trendwechsel“ im Vergleich zu 1999: Weißweinrebflächen wurden um ca. 15.000 ha reduziert, für Rotwein kamen mehr als 10.000 ha dazu.
  • Nach 2009 hat sich die Verteilung der Rebflächen nicht mehr dramatisch verändert. In mehr als 10 Jahren hat der Weißwein ca. 5.000 ha gewonnen und der Rotwein ebenso viel verloren.
Zeitverläufe im Multiliniendiagramm in der Datenanalyse-Software Cadenza darstellen

Abb. 5: 1999-2020: Mehr Rebflächen für Weiß- als für Rotwein

Gehen wir gedanklich noch einmal zu unserer ersten Tabelle, also Abbildung 1. Dort werden auch die Rebsorten aufgelistet. Nehmen wir diese in unser Multiliniendiagramm auf, können wir Entwicklungen expliziter Sorten nachverfolgen. Das entsprechende Diagramm ist links in Abbildung 6 dargestellt.

Auf den ersten Blick sind keine starken Ausreißer in der Entwicklung zu sehen. Wir erkennen auch, welche Rebsorten besonders beliebt sind. Übersichtlicher wird das aber, wenn wir auf die Top 4 reduzieren, wie es rechts in Abbildung 6 zu sehen ist.

„Sonstige“ führen die Liste überraschenderweise an, dicht gefolgt vom Riesling, welcher ein richtiger Dauerbrenner zu sein scheint. Die Rebfläche steigt stetig an. 2015 konnte der Riesling zwischenzeitlich sogar die meisten Rebflächen vorweisen. Um 1999 war Müller-Thurgau zeitweise sehr beliebt. Die Relevanz nahm aber zwischen 1999 und 2009 ab: Die Rebfläche sank von knapp 21.000 ha auf ca. 13.000 ha.

Abb. 6: Vergleich der zeitlichen Entwicklung von Rebflächen verschiedener Rebsorten; links: alle Rebsorten, rechts: Top-4-Rebsorten
Abb. 6: Vergleich der zeitlichen Entwicklung von Rebflächen verschiedener Rebsorten; links: alle Rebsorten, rechts: Top-4-Rebsorten

Die Verteilung der Rebflächen gibt ein eindeutiges Bild: Weißwein hat die Nase vorne. Bei Betrachtung der Weinerzeugung im Zeitvergleich (2011-2020) wird diese Vermutung nochmals bestätigt. Mit dem Säulendiagramm aus Abbildung 7 können wir die Ergebnisse gut vergleichen. Allein 2020 wurden ca. 5.800.000 Hektoliter Weißwein und ca. 3.800.000 Hektoliter Rotwein erzeugt. 2018 war die Weißweinerzeugung dabei besonders hoch: Fast 7.000.000 Hektoliter wurden erzeugt.

 

Inhalte mit Säulendiagrammen in der Datenanalyse-Software Cadenza vergleichen

Abb. 7: Rot- und Weißweinerzeugung im Zeitvergleich (2011-2020)

Weinanbaugebiete in Deutschland räumlich analysieren

Daten in der Karte in der Datenanalyse-Software Cadenza auswerten

Abb. 8: Bestockte Rebflächen in Deutschland in der Karte

Wir wollen nun für die räumliche Auswertung ein zweites Arbeitsblatt nutzen. Das benötigte Shapefile haben wir bereits, wie in Abbildung 1 dargestellt, importiert. Karten geben Auswertenden oder Betrachtenden einen ganz neuen Blick auf die Datenlage. Die Karte in Abbildung 8 zeigt uns die bestockten Rebflächen der deutschen Bundesländer 2020, wobei die Bundesländer nach der Rebfläche eingefärbt sind: Je dunkler das Bundesland eingefärbt sind, desto mehr Rebfläche kann dieses vorweisen.

Was deutlich wird: Weintrauben werden vor allem im Süden und Südwesten angebaut. Rheinland-Pfalz gehört zu den kleineren Bundesländern, ist aber Spitzenreiter, gefolgt von Baden-Württemberg. Im Norden ist Weinanbau eher schwach ausgeprägt.

Gehen wir nochmal eine Ebene tiefer, nämlich auf die Ebene der Weinanbaugebiete (Abbildung 8). Färben wir die Tabelle ebenfalls nach Rebfläche ein und sortieren diese anschließend danach, so wird deutlich, dass die mit Abstand größten vier Weinanbaugebiete in Rheinland-Pfalz und Baden-Württemberg liegen.

Rebflächen der Weinanbaugebiete in Deutschland in der Datenanalyse-Software Cadenza vergleichen

Abb. 9: Mit Keltertrauben bestockte Rebflächen nach Weinanbaugebieten 2020

Dashboards aufpeppen

Unsere Arbeitsmappe ist nun so gut wie fertig. Beide Arbeitsblätter geben uns spannende Informationen zum Weinanbau in Deutschland. Und das haben wir innerhalb weniger Minuten und ohne Vorbereitung der Daten geschafft.

Die verschiedenen Visualisierungen als Diagramm und Karte helfen dabei, Informationen schneller zu verarbeiten und besser zu begreifen.

Weitere Designelemente können die Gestaltung der Arbeitsblätter abrunden:

  • Textelemente für Informationen und Strukturierung
  • Bildelemente

Unsere finalen Arbeitsblätter sehen also folgendermaßen aus:

Fertige Arbeitsmappe mit zwei Arbeitsblättern in der Datenanalyse-Software Cadenza
Abb. 10: Finale Arbeitsblätter zum Thema Weinanbaugebiete in Deutschland