Computer Vision
- Fakultät
Ingenieurwissenschaften und Informatik
- Version
Version 8.0 vom 23.02.2023
- Modulkennung
11B1121
- Modulname (englisch)
Computer Vision
- Studiengänge mit diesem Modul
- Informatik - Medieninformatik (B.Sc.)
- Informatik - Technische Informatik (B.Sc.)
- Elektrotechnik (B.Sc.)
- Mechatronik (B.Sc.)
- Elektrotechnik im Praxisverbund (B.Sc.)
- Lehramt an berufsbildenden Schulen - Teilstudiengang Informationstechnik (M.Ed.)
- Niveaustufe
2
- Kurzbeschreibung
Das Sehen und Verstehen einer realen Szene fällt unserem menschlichen visuellen System sehr einfach, doch wie erlernt ein Computer dieses? Der Fachbegriff für das künstliche Sehen heißt Computer Vision und beinhaltet mehr als die Aufnahme der realen Welt mittels Foto- und Videokamera. Vielmehr ist das Verstehen des aufgenommenen Bildes die größte und rechenintensivste Herausforderung von Computer Vision. Ohne künstliches Sehen und Verstehen wären Anwendungen wie Mensch-Roboter-Kooperationen, Gesichtserkennung, bildbasierte 3D Rekonstruktion und automatisiertes Fahren nicht zu realisieren.
Im Rahmen des Kurses lernen Sie Verfahren kennen, die Computern das Verstehen von bildpunktbasierten Aufnahmen erlauben. Ausgehend von den Pixeln des Aufnahmechips werden Sie zunächst klassische Verfahren wie Template Matching, SIFT, SURF und HOG anwenden. Künstliche Intelligenz (KI) gepaart mit den im Internet verfügbaren Bilddaten ermöglichen der modernen Computer Vision die klassischen Verfahren in den Schatten zu stellen. Deshalb erlernen Sie ergänzend die grundlegenden Konzepte der KI-basierten Computer Vision wie Convolutional Neural Networks, die Handschriften erkennen können, oder Generative Adversarial Networks, die Gesichter verändern können. Mit dem Wissen aus der Vorlesung und den Erfahrungen aus dem Praktikum können Sie jeden Computer bzw. jedes Smartphone mit einer Kamera zu einem visuellen System machen, das sieht und versteht.
- Lehrinhalte
- Von Pixeln zu semantischen Symbolen
- Objekterkennung und -wiedererkennung
- Echtzeitfähige Computer Vision – vektorisierte Algorithmen & GPU-Anwendungen
- Bildklassifizierung
- Bildsegmentierung
- Lernergebnisse / Kompetenzziele
Wissensverbreiterung
Die Studierenden, die dieses Modul erfolgreich studiert haben, kennen und verstehen aktuelle Verfahren der Computer Vision und können diese mittels existierender Frameworks umsetzen. Sie kennen die wesentlichen Verfahren, um neuronale Netze auf Bilddaten anzuwenden.
Wissensvertiefung
Kenntnisse auf dem Gebiet der Algorithmenentwicklung werden vertieft und Wissen im Bereich der Videotechnik wird erweitert.
Können - instrumentale Kompetenz
Die Studierenden sind in der Lage, Objekterkennungen und Bildklassifizierung in C++ mittels Frameworks wie OpenCV zu implementieren. Ferner können die Studierenden Convolutional Neural Networks mittels Frameworks wie Keras designen und basierend auf eigenen Bilddatensätzen trainieren.
Können - kommunikative Kompetenz
Die Studierenden können die Komplexität und Anwendbarkeit von Verfahren der Computer Vision abschätzen und sich fachlich über diese austauschen. Ferner können Sie fachfremden Personen einen Überblick über die Verfahren geben.
Können - systemische Kompetenz
Die Studierenden können Datensätze für aktuelle neue KI-basierte Verfahren aufbauen und den Trainingsaufwand abschätzen. Sie können für vorgegebene Anwendungsszenarien passende Verfahren der klassischen und KI-basierten Computer Vision identifizieren und mit vorhandenen Verfahren kombinieren.
- Lehr-/Lernmethoden
Die Veranstaltung gliedert sich in einen Vorlesungs- und einen Praktikumsteil. Die Studierenden erarbeiten unter Anleitung Computer Vision Systeme und analysieren deren Schwachstellen. Ab dem zweiten Drittel des Semesters implementieren die Studierenden einen vorgegebenen Algorithmus eines Forschungspapiers und reproduzieren dessen Ergebnisse.
- Empfohlene Vorkenntnisse
Mathematik 1, 2 und ggf. Mathematik 3 (I), Programmierung 1 und 2
- Modulpromotor
Schöning, Julius
- Lehrende
Schöning, Julius
- Leistungspunkte
5
- Lehr-/Lernkonzept
Workload Dozentengebunden Std. Workload Lehrtyp 30 Vorlesungen 30 Labore Workload Dozentenungebunden Std. Workload Lehrtyp 20 Veranstaltungsvor-/-nachbereitung 25 Literaturstudium 20 Prüfungsvorbereitung 25 Vorbereitung Labore
- Literatur
Dawson-Howe, Kenneth. A practical introduction to computer vision with opencv. John Wiley & Sons, 2014.Kaehler, Adrian, and Gary Bradski. Learning OpenCV 3: computer vision in C++ with the OpenCV library. " O'Reilly Media, Inc.", 2016.Dadhich, Abhinav. Practical Computer Vision: Extract Insightful Information from Images Using TensorFlow, Keras, and OpenCV. Packt Publishing Ltd, 2018.Géron, Aurélien. Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow: Concepts, Tools, and Techniques to Build Intelligent Systems. O'Reilly Media, 2019.
- Prüfungsleistung
- Mündliche Prüfung
- Praxisbericht, schriftlich
- Unbenotete Prüfungsleistung
Experimentelle Arbeit
- Dauer
1 Semester
- Angebotsfrequenz
Unregelmäßig
- Lehrsprache
Deutsch und Englisch