Modellierung landwirtschaftlicher Daten
- Fakultät
Fakultät Agrarwissenschaften und Landschaftsarchitektur (AuL)
- Version
Version 1 vom 12.09.2025.
- Modulkennung
44B0768
- Niveaustufe
Bachelor
- Unterrichtssprache
Deutsch
- ECTS-Leistungspunkte und Benotung
5.0
- Häufigkeit des Angebots des Moduls
nur Sommersemester
- Dauer des Moduls
1 Semester
- Kurzbeschreibung
Die Modellierung von komplexen Daten spielt eine zentrale Rolle in verschiedenen wissenschaftlichen Disziplinen der Agrarwissenschaften. Dabei ermöglicht die Modellierung nicht nur den Gewinn von neuen Erkenntnissen über biologische Prozesse, sondern auch die Vorhersage zukünftiger Ereignisse weit über die gängigen Gruppenvergleiche aus Feldexperimenten hinaus. Oftmals sind biologische Abhängigkeiten nicht linear, sondern folgen nicht-linearen Trends. Die Modellierung solcher nicht-linearen Abhängigkeiten erfordert spezielle Kompetenzen in der statistischen Analyse, insbesondere von Zeitreihen (eng. “time series”), räumlichen Daten (eng. “spatial data”) oder genetischen Daten und Sequenzen. In dem Modul “Modellierung landwirtschaftlicher Daten” werden die gängigen statistische Verfahren zur Auswertung dieser und weiterer Datenquellen vorgestellt und diskutiert. Im Weiteren spielt die Vorhersage von Ereignissen eine entscheidende Rolle in den Agrarwissenschaften, sei es für die Früherkennung von Risiken oder die Steuerung landwirtschaftlicher Prozesse. Im Modul werden die Grundlagen des maschinellen Lernens präsentiert und anhand von Fallbeispielen erläutert. Das Modul “Modellierung landwirtschaftlicher Daten” vermittelt den Studierenden fortgeschrittene Kenntnisse und Fähigkeiten im Bereich der Datenmodellierung und -analyse im Kontext der landwirtschaftlichen Anwendung. Der Fokus liegt in dem Modul auf der Darstellung, Verarbeitung und statistischer Modellierung komplexer landwirtschaftlicher Daten. Fallstudien aus verschiedenen Bereichen der Agrarwissenschaften werden verwendet, um die erworbenen theoretischen Kenntnisse in die Praxis umzusetzen. In der Anwendung wird R/Bioconductor für die Datenanalyse genutzt. Das Modul “Modellierung landwirtschaftlicher Daten” erweitert die bisherigen Kenntnisse der Studierenden in der Auswertung agrarwissenschaftlicher Daten und bereitet auf anspruchsvolle Aufgaben in diesem Bereich vor.
- Lehr-Lerninhalte
- Einführung in die statistische Modellierung sowie deren Interpretation am Beispiel der multiplen linearen Regression.
- Besonderheiten der statistischen Modellierung von Zeitreihen und räumlichen Daten.
- Die explorative Datenanalyse und deren statistischen Maßzahlen sowie die Visualisierung von räumlichen und zeitlichen Daten.
- Multivariate statistische Analysen zur Erkennung von Gruppenzugehörigkeiten anhand von Clusteranalysen.
- Einführung in die klassischen experimentellen Designs in den Agrarwissenschaften.
- Grundlagen der Analyse von genetischen Daten anhand ausgewählter, beispielhafter Omics-Ebenen.
- Genetische Distanzen und polygenetische Bäume zur Darstellung evolutionärer Beziehungen.
- Grundlagen des maschinellen Lernens und der Klassifikation von Ereignissen sowie Maßzahlen der Bewertung eines maschinellen Lernalgorithmus.
- Anwendung der grundlegenden maschinellen Lernverfahren beispielhaft durch k-NN, Random Forest und Neuronale Netze.
- Modellierungen an aktuellen Fallbeispielen aus der Anwendung.
- Automatisierte Erstellung von Berichten in R Quatro.
- Einführung in die Erstellung von interaktiven R Shiny Apps.
- Gesamtarbeitsaufwand
Der Arbeitsaufwand für das Modul umfasst insgesamt 150 Stunden (siehe auch "ECTS-Leistungspunkte und Benotung").
- Lehr- und Lernformen
Dozentengebundenes Lernen Std. Workload Lehrtyp Mediale Umsetzung Konkretisierung 40 Vorlesung Präsenz oder Online - 20 Übung Präsenz oder Online - Dozentenungebundenes Lernen Std. Workload Lehrtyp Mediale Umsetzung Konkretisierung 35 Veranstaltungsvor- und -nachbereitung - 20 Literaturstudium - 20 Sonstiges - 15 Prüfungsvorbereitung -
- Benotete Prüfungsleistung
- Hausarbeit oder
- Klausur
- Bemerkung zur Prüfungsart
Standardprüfungsleistung: Hausarbeit, max. 20 Seiten. Alternative Prüfungsleistung: 2-stündige Klausur
- Prüfungsdauer und Prüfungsumfang
Klausur, 2-stündig oder Hausarbeit max. 20 Seiten
- Empfohlene Vorkenntnisse
Keine.
Für dieses Modul sind Kenntnisse der deskriptiven Statistik sowie Grundkenntnisse der Statistik hilfreich, aber nicht notwendig, wie sie unter anderem in den Modulen “Mathematik und Statistik (44B0266)” oder “Angewandte Statistik und Versuchswesen (44B0400)” vermittelt werden.
Studierenden, die ihre Kenntnisse und Fertigkeiten vor Beginn des Moduls auffrischen oder erweitern möchten, wird folgende Grundlagenliteratur mit dem “Skript Bio Data Science” unter jkruppa.github.io empfohlen.
In dem Modul wird mit der Software R gearbeitet. Um sich im Vorfeld mit den Basisfunktionen vertraut zu machen, eignen sich beispielsweise die folgenden Video-Tutorials unter www.youtube.com/c/JochenKruppa.
- Wissensverbreiterung
- Die Studierenden kennen die gängigen experimentellen Designs in den Agrarwissenschaften.
- Die Studierenden kennen die entsprechenden Repräsentationen der experimentellen Designs als Datensatz.
- Die Studierenden kennen die gängigen Datenformate für räumliche und zeitliche Daten.
- Die Studierenden sind in der Lage verschiedene Daten und Datenstrukturen in der Genetik zu erkennen und zu benennen.
- Die Studierenden können die gängigen, vorgestellten statistischen Modellierungen benennen und unterscheiden.
- Die Studierenden kennen die gängigen Funktionen für die Modellierungen und Datenaufbereitung in R.
- Wissensvertiefung
- Die Studierenden können explorative Abbildungen erstellen und interpretieren.
- Die Studierenden können räumliche und zeitliche Daten visualisieren und interpretieren.
- Die Studierenden können das Ergebnis eines statistischen Modells im Kontext einer wissenschaftlichen Fragestellung interpretieren.
- Die Studierenden sind in der Lage anhand eines statistischen Modells eine Entscheidung zu treffen.
- Die Studierenden sind in der Lage Modellierungen mit den notwendigen Funktionen und Paketen in R durchzuführen.
- Die Studierenden können einen automatischen Bericht in R Quatro erstellen.
- Wissensverständnis
- Die Studierenden können ein statistisches Modell mit einer explorativen Datenanalyse oder Visualisierung in einen Kontext bringen.
- Die Studierenden können verschiedene statistisches Modelle anhand verschiedener Maßzahlen miteinander vergleichen und eine informierte Modellauswahl treffen.
- Nutzung und Transfer
Die Studierenden sind in der Lage einfache Kosten- und Nutzenabschätzungen anhand von statistischen Modellen durchzuführen. Diese einfachen Abschätzungen umfassen die Planung von technischen und biologischen Prozessen in der Landwirtschaft. Sie können Modelle für landwirtschaftliche Prozesse unter Verwendung von räumlichen Daten entwickeln und validieren. Die Studierenden können dabei externe Literaturquellen und deren statistischen Maßzahlen in den Kontext des eigenen Berufsfeld setzen und aus verschiedenen, wissenschaftlichen Quellen erste informierte Vorentscheidungen treffen.
- Wissenschaftliche Innovation
Die Studierende können statistische Maßzahlen aus wissenschaftlichen Publikationen in andere wissenschaftliche Kontexte einordnen. Die Studierenden kennen die Grundlagen des wissenschaftlichen Arbeitens anhand von Fallbeispielen. Die Studierenden sind in der Lage bei der Erstellung von Daten aus Experimenten die Verwertbarkeit in R zu berücksichtigen. Die Studierenden können explorative Abbildungen aus Veröffentlichungen verstehen und erste informierte Forschungsideen entwickeln.
- Kommunikation und Kooperation
Die Studierenden sind in der Lage die Ergebnisse der Datenanalyse klar und verständlich zu kommunizieren, sowohl schriftlich als auch mündlich. Ebenfalls sind die Studierenden in der Lage gängige statistische Maßzahlen zu erkennen und zu berichten. Die Studierenden können R Code lesen, erstellen und demonstrieren. Die Studierenden sind in der Lage mit einer automatisierten Berichterstattung in R Quatro oder R Shiny eine Datenanalyse zu kommunizieren.
- Wissenschaftliches Selbstverständnis / Professionalität
Die Studierenden können wissenschaftliche Publikationen und deren Modellierungen räumlicher und zeitlicher Fragestellungen in den Kontext des eigenen Berufsfeldes setzen. Unter der Hilfe der Modellierung sind die Studierenden in der Lage informierte Entscheidungen treffen. Die Studierende sind sich der inhärenten Unsicherheit statistischer Modellierungen bewusst und können die eigenen Forschungsergebnisse kritisch hinterfragen. Den Studierenden sind die algorithmischen Grenzen von Modellen bewusst.
- Literatur
- Das Skript des Statistik- und Programmierteil des Moduls unter https://jkruppa.github.io/
- Das Skript zur Genetik und Bioinformatik unter https://jkruppa.github.io/bioinformatic/
- Verwendbarkeit nach Studiengängen
- Landwirtschaft
- Landwirtschaft B.Sc. (01.09.2025)
- Agrarsystemtechnologien
- Agrarsystemtechnologien B.Sc. (01.09.2025)
- Modulpromotor*in
- Kruppa-Scheetz, Jochen
- Lehrende
- Kruppa-Scheetz, Jochen