Data Engineering und Big Data

Fakultät

Wirtschafts- und Sozialwissenschaften

Version

Version 10.0 vom 08.02.2019

Modulkennung

22M0989

Modulname (englisch)

Data Engineering and Big Data

Studiengänge mit diesem Modul

Wirtschaftsinformatik (Master) (M.Sc.)

Niveaustufe

4

Kurzbeschreibung

Das Modul vermittelt den Umgang mit strukturierten, semi-strukturierten, polystrukturierten und unstrukturierten Daten durch eine nachhaltige Datenbewirtung sowohl für klassische Anwendungsgebiete als auch für Big Data-Anwendungen, bei denen Volume, Variety und Velocity besondere Relevanz haben.

Lehrinhalte
  • Notwendigkeit und Herausforderungen klassischer Datenbewirtschaftung und Big DataDatenhaltung (Objektrelational und NoSQL)Datenhaltungsarchitekturen (einschl. Replica, Sharding, Scale-out , Scale-up Konzepte)
  • Cluster-Datenbanken
  • Föderierte Datenbanken
  • Parallele und verteilte DatenbankenDatenbewirtschaftungsarchitekturen
  • Data Warehousing (einschl. ETL-Prozesse)
  • Data Lakes (einschl. ELT-Prozesse)
  • Datenbewirtschaftung und Internet of Things / Industrie 4.0
  • Datenbewirtschaftung für WearablesDatenintegrationsansätzeAusgewählte Aspekte der Big Data LandscapeAktuelle, etablierte Big Data FrameworksDatenstrommanagementsystemeDatenvorverarbeitung in Datenanalyseprozessen
Lernergebnisse / Kompetenzziele

Wissensverbreiterung
Studierende, die dieses Modul erfolgreich studiert haben, kennen grundlegende Konzepte und Verfahren zur Datenhaltung, -bewirtschaftung, -integration und -vorverarbeitung, auch unter Berücksichtigung von Big Data. Sie sind in der Lage, Datenbewirtschaftungsarchitekturkonzepte hinsichtlich ihrer Eignung zu bewerten und ausgewählte Aufgabenstellungen zu bearbeiten.
Wissensvertiefung
Die Studierenden, die dieses Modul erfolgreich studiert haben, verfügen über detailliertes Wissen zu Aufgaben und Möglichkeiten moderner Datenbewirtschaftungsansätze. Darüber hinaus verfügen Sie über Spezialwissen hinsichtlich der Verarbeitung von Daten aus verschiedenen Quellen.
Können - instrumentale Kompetenz
Die Studierenden können die Einführung und den Betrieb (datengetriebener), zeitgemäßer und nachhaltiger Datenhaltung begleiten. Sie sind in der Lage, Daten aus vielfältigen Quellen zu integrieren und die Daten nachgelagerten Systemen, z.B. der Datenanalyse, integriert, transformiert und ggf. aufgabengerecht bereitzustellen.
Können - kommunikative Kompetenz
Die Studierenden sind in der Lage, gemeinsam mit Domänenexperten Lösungsansätze zu diskutieren. Ihre sozio-kommunikative Kompetenz befähigt sie, ihre Standpunkte und Erkenntnisse sprachadäquat gegenüber Fach- und Domänenexperten zu vertreten und zu begründen.
Können - systemische Kompetenz
Die Studierenden sind in befähigt, Datenhaltung, -integration und -bereitstellung ganzheitlich zu betrachten, um eine konsistente, effiziente Datenbewirtschaftung zu ermöglichen. Sie sind in der Lage, sich in neue Datenverarbeitungsframeworks selbständig einzuarbeiten, diese auf der Basis der vermittelten Konzepte zu bewerten und ggf. in eine Datenhaltungslandschaft zu integrieren

Lehr-/Lernmethoden

In seminaristischen Vorlesungen werden die theoretischen Grundlagen vermittelt und in zunehmend komplexeren Übungen anhand von Fallbeispielen behandelt.

Empfohlene Vorkenntnisse

(relationale) Datenbanken, Programmierkenntnisse sind von Vorteil

Modulpromotor

Tapken, Heiko

Lehrende

Tapken, Heiko

Leistungspunkte

5

Lehr-/Lernkonzept
Workload Dozentengebunden
Std. WorkloadLehrtyp
24Vorlesungen
7Teletutorien
Workload Dozentenungebunden
Std. WorkloadLehrtyp
50Veranstaltungsvor-/-nachbereitung
69Übungen
Literatur

Big Data in der Praxis: Lösungen mit Hadoop, Spark, HBase und Hive. Daten speichern, aufbereiten, visualisieren, Jonas Freiknecht, 2018

NoSQL: Einstieg in die Welt nichtrelationaler Web 2.0 Datenbanken, Stefan Edlich und Achim Friedland, 2011

Data Mining: Concepts and Techniques, 3rd Edition, Jiawei Han, Micheline Kamber, Jian Pei, 2011

Big Data: Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur, Nathan Marz und James Warren, 2016

Verteiltes und Paralleles Datenmanagement: Von verteilten Datenbanken zu Big Data und Cloud, Erhard Rahm und Gunter Saake, 2015

Prüfungsleistung
  • Hausarbeit
  • Portfolio Prüfung
  • Projektbericht, schriftlich
Bemerkung zur Prüfungsform

Die Portfolio Prüfung umfasst insgesamt 100 Punkte. Sie setzt sich zusammen aus einem Referat (40 Punkte) und einer Hausarbeit (60 Punkte).

Dauer

1 Semester

Angebotsfrequenz

Nur Sommersemester

Lehrsprache

Deutsch