Die Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Verwaltung des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Mathematik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Universität Bremen
Zeige Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon

Informatik-Ansicht

Kern (VMC)


Core (VMC)
Modulnummer
IMK-VMC
Master
Pflicht/Wahl
Wahl Basis Ergänzung
Sonderfall
Zugeordnet zu Masterprofil
Basis Ergänzung
Sicherheit und Qualität
KI, Kognition, Robotik
Digitale Medien und Interaktion
Modulbereich : (keine Angabe)
Modulteilbereich : (keine Angabe)
Anzahl der SWS
V UE K S Prak. Proj.
2 2 0 0 0 0 4
Kreditpunkte : 6 Turnus

i. d. R. angeboten alle 2 Semester

Formale Voraussetzungen : -
Inhaltliche Voraussetzungen : -
Vorgesehenes Semester : ab 1. Semester
Sprache : Deutsch
Ziele :

Die wichtigsten Methoden moderner Bildverarbeitung verstehen

  • Bildverarbeitung mit Deep Learning (Convolutional Neural Networks)
  • 3D Bildverarbeitung („von Pixeln zu Metern“)

Anwendungsprobleme mit diesen Methoden lösen können

  • Passende Verarbeitungsketten für Anwendungsprobleme entwerfen
  • Anwendungsprobleme als Deep Learning Aufgabe formulieren
  • Trainingsdaten beschaffen und aufbereiten
  • Dreidimensionale geometrische Zusammenhänge in Bildern modellieren
  • Deep Learning und 3D Bildverarbeitungssysteme systematisch entwickeln
  • Implementierung mit TensorFlow / Keras und OpenCV
Inhalte :

.

Bildverarbeitung mit Deep Learning.

All die folgenden Inhalte werden in ihrer formalen Definition, aber auch in einem intuitiven Verständnis für die Idee dahinter, die Bedeutung im Gesamtthema und die Interaktion mit anderen Inhalten vermittelt.

  • Paradigmen „analytisch entwickelt“ vs. „maschinell gelernt“
  • Die Architektur von künstlichen neuronalen Netzen die Bilder verarbeiten („Big Picture“ - Überblick noch ohne die Details, die später folgen)
  • Formen der Ausgabe: Klassifizierung, Semantic Segmentation, Heatmap, Boundingboxes, Objekt-Id pro Pixel, applikationsabhängige Werte
  • Schichten: Convolution, Aktivierung, Pooling, Unpooling, Fully Connected
  • Losses: Absoluter, quadratischer, relativer Fehler, Maximum-Likelihood, Crossentropy, Gewichtungen, Kombination mehrerer Losses
  • Optimierung durch Gradientenabstieg, Sicht eines Netzes mit Loss als Graph von Tensoroperationen, Tensorformate, Backpropagation auf solch einem Graphen
  • Rezeptives Feld als Architekturkenngröße
  • Typische CNN-Backbonearchitekturen und ihre Nutzung im „pretrained“-Ansatz
  • Decoder-Encoder Architektur für Bilder als Ausgabe, Bedeutung der Querverbindungen
  • Objekterkennung: Ausgabeform für Boundingboxen, one-shot vs. two-shot Ansatz
  • Vorgehen bei der Datenbeschaffung und Aufbereitung
  • Vorgehen bei der Entwicklung und Evaluation von Deep Learning Bildverarbeitungssystemen
  • Mediale Anwendungen von Deep Learning, besonders zur Bildgenerierung
  • Generative Adversarial Networks (die Grundidee)

3D – Bildverarbeitung

  • Paradigma von „Pixeln zu Metern durch Gleichungslösen“
  • Punktfeatures
  • Kameragleichung
  • Geometrische Rekonstruktion (welche 3D Eigenschaften lassen sich aus wie vielen 2D Punktpaaren rekonstruieren)
  • Quadratische Ausgleichsrechnung als generischer algorithmischer Ansatz dafür geometrische Rekonstruktion
  • Partikelfilter für zeitliche Abläufe, Rolle der Bildverarbeitung als Messmodell darin

Lehrveranstaltung(en):

  • 03-IMAP-D3BV Deep-Learning- und 3D-Bildverarbeitung
Unterlagen (Skripte, Literatur, Programme usw.) :
  • MIT 6.S191, Introduction to Deep Learning, http://introtodeeplearning.com
  • Ian Goodfellow, Yoshua Bengio, Aaron Courville, Deep Learning, MIT Press, 2016 (http://www.deeplearningbook.org)
  • Richard Hartley, Andrew Zisserman, Multiple View Geometry in Computer Vision (https://www.robots.ox.ac.uk/~vgg/hzbook/)
  • Richard Szeliski, Computer Vision and Applications, Springer 2010 (http://szeliski.org/Book/, Computer Vision vor der Deep Learning Revolution)
Form der Prüfung : MP, mündliche Prüfung, ggf. Bonusprüfung
Arbeitsaufwand
Präsenz 56
Übungsbetrieb/Prüfungsvorbereitung 124
Summe 180 h
Lehrende: Prof. Dr. U. Frese Verantwortlich Prof. Dr. U. Frese
Zurück

Zeige Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon