Computer Vision

Fakultät

Ingenieurwissenschaften und Informatik

Version

Version 8.0 vom 23.02.2023

Modulkennung

11B1121

Modulname (englisch)

Computer Vision

Studiengänge mit diesem Modul
  • Informatik - Medieninformatik (B.Sc.)
  • Informatik - Technische Informatik (B.Sc.)
  • Elektrotechnik (B.Sc.)
  • Mechatronik (B.Sc.)
  • Elektrotechnik im Praxisverbund (B.Sc.)
  • Lehramt an berufsbildenden Schulen - Teilstudiengang Informationstechnik (M.Ed.)
Niveaustufe

2

Kurzbeschreibung

Das Sehen und Verstehen einer realen Szene fällt unserem menschlichen visuellen System sehr einfach, doch wie erlernt ein Computer dieses? Der Fachbegriff für das künstliche Sehen heißt Computer Vision und beinhaltet mehr als die Aufnahme der realen Welt mittels Foto- und Videokamera. Vielmehr ist das Verstehen des aufgenommenen Bildes die größte und rechenintensivste Herausforderung von Computer Vision. Ohne künstliches Sehen und Verstehen wären Anwendungen wie Mensch-Roboter-Kooperationen, Gesichtserkennung, bildbasierte 3D Rekonstruktion und automatisiertes Fahren nicht zu realisieren.

Im Rahmen des Kurses lernen Sie Verfahren kennen, die Computern das Verstehen von bildpunktbasierten Aufnahmen erlauben. Ausgehend von den Pixeln des Aufnahmechips werden Sie zunächst klassische Verfahren wie Template Matching, SIFT, SURF und HOG anwenden. Künstliche Intelligenz (KI) gepaart mit den im Internet verfügbaren Bilddaten ermöglichen der modernen Computer Vision die klassischen Verfahren in den Schatten zu stellen. Deshalb erlernen Sie ergänzend die grundlegenden Konzepte der KI-basierten Computer Vision wie Convolutional Neural Networks, die Handschriften erkennen können, oder Generative Adversarial Networks, die Gesichter verändern können. Mit dem Wissen aus der Vorlesung und den Erfahrungen aus dem Praktikum können Sie jeden Computer bzw. jedes Smartphone mit einer Kamera zu einem visuellen System machen, das sieht und versteht.

Lehrinhalte
  1. Von Pixeln zu semantischen Symbolen
  2. Objekterkennung und -wiedererkennung
  3. Echtzeitfähige Computer Vision – vektorisierte Algorithmen & GPU-Anwendungen
  4. Bildklassifizierung
  5. Bildsegmentierung
Lernergebnisse / Kompetenzziele

Wissensverbreiterung
Die Studierenden, die dieses Modul erfolgreich studiert haben, kennen und verstehen aktuelle Verfahren der Computer Vision und können diese mittels existierender Frameworks umsetzen. Sie kennen die wesentlichen Verfahren, um neuronale Netze auf Bilddaten anzuwenden.
Wissensvertiefung
Kenntnisse auf dem Gebiet der Algorithmenentwicklung werden vertieft und Wissen im Bereich der Videotechnik wird erweitert.
Können - instrumentale Kompetenz
Die Studierenden sind in der Lage, Objekterkennungen und Bildklassifizierung in C++ mittels Frameworks wie OpenCV zu implementieren. Ferner können die Studierenden Convolutional Neural Networks mittels Frameworks wie Keras designen und basierend auf eigenen Bilddatensätzen trainieren.
Können - kommunikative Kompetenz
Die Studierenden können die Komplexität und Anwendbarkeit von Verfahren der Computer Vision abschätzen und sich fachlich über diese austauschen. Ferner können Sie fachfremden Personen einen Überblick über die Verfahren geben.
Können - systemische Kompetenz
Die Studierenden können Datensätze für aktuelle neue KI-basierte Verfahren aufbauen und den Trainingsaufwand abschätzen. Sie können für vorgegebene Anwendungsszenarien passende Verfahren der klassischen und KI-basierten Computer Vision identifizieren und mit vorhandenen Verfahren kombinieren.

Lehr-/Lernmethoden

Die Veranstaltung gliedert sich in einen Vorlesungs- und einen Praktikumsteil. Die Studierenden erarbeiten unter Anleitung Computer Vision Systeme und analysieren deren Schwachstellen. Ab dem zweiten Drittel des Semesters implementieren die Studierenden einen vorgegebenen Algorithmus eines Forschungspapiers und reproduzieren dessen Ergebnisse.

Empfohlene Vorkenntnisse

Mathematik 1, 2 und ggf. Mathematik 3 (I), Programmierung 1 und 2

Modulpromotor

Schöning, Julius

Lehrende

Schöning, Julius

Leistungspunkte

5

Lehr-/Lernkonzept
Workload Dozentengebunden
Std. WorkloadLehrtyp
30Vorlesungen
30Labore
Workload Dozentenungebunden
Std. WorkloadLehrtyp
20Veranstaltungsvor-/-nachbereitung
25Literaturstudium
20Prüfungsvorbereitung
25Vorbereitung Labore
Literatur

Dawson-Howe, Kenneth. A practical introduction to computer vision with opencv. John Wiley & Sons, 2014.Kaehler, Adrian, and Gary Bradski. Learning OpenCV 3: computer vision in C++ with the OpenCV library. " O'Reilly Media, Inc.", 2016.Dadhich, Abhinav. Practical Computer Vision: Extract Insightful Information from Images Using TensorFlow, Keras, and OpenCV. Packt Publishing Ltd, 2018.Géron, Aurélien. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media, 2019.

Prüfungsleistung
  • Mündliche Prüfung
  • Praxisbericht, schriftlich
Unbenotete Prüfungsleistung

Experimentelle Arbeit

Dauer

1 Semester

Angebotsfrequenz

Unregelmäßig

Lehrsprache

Deutsch und Englisch