Die Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Verwaltung des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Mathematik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Universität Bremen
Zeige Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon

System Engineering-Ansicht

Modultyp
Vertiefung
Pflichtmodul Wahlbereich
Spezialisierungsbereich Anzahl Semesterwochenstunden CP Angeboten in jedem
V Ü S P Proj. Anzahl
Bestärkendes Lernen
2 2 0 0 0 4 6 jährlich
Reinforcement Learning         Berechnung des Workloads
Vorgesehenes Semester ab 1. Semester
Lernziele

  • Grundlegende Kenntnisse des Bestärkenden Lernens (engl.: RL)
  • Kenntnisse der Anwendung und Anwendbarkeit von Lernverfahren für autonome Roboter
  • Kenntnis der Problemklasse „Markovsches Entscheidungsproblem“ (MDP) und des Konzepts der Wertfunktionen
  • Verständnis von Modell-bidenden (Dynamic Programming, Dyna-Architekturen) und Modell-freien (Monte-Carlo, Temporal Difference) Lernverfahren
  • Kenntnisse der wichtigsten Methoden und Verfahren zur Explorationskontrolle beim RL
  • Erlernen der Durchführung, Auswertung und Präsentation von empirischen Untersuchungen von Lernverfahren
  • Einarbeitung in die Literatur des aktuellen Stands der Technik

Lerninhalte

  • Grundlagen des Bestärkenden Lernens (engl.: RL)
  • Problemklassen und Anwendungen für das Bestärkende Lernen
  • Grundlegende Probleme und Verfahren der Explorationskontrolle beim RL
  • Fortgeschrittene und aktuelle Themen des Bestärkenden Lernens (bspw. Direct Policy Search, Hierachisches RL, Deep RL, Multi-Agenten RL …)

Insbesondere werden folgende theoretisch/methodische Grundlagen im Zusammenhang dieser Inhalte behandelt:

  • Theorie Markovscher Entscheidungsprozesse
  • Theorie des Dynamic Programming (Policy Iteration, Value Iteration)
  • Theorie der Monte Carlo Methoden
  • Theorie des Temporal Difference Lernens
  • Theorie von Modell-bildenden Verfahren
  • Einarbeitung und Verständnis von wissenschaftlichen Veröffentlichungen
  • Auswertung und Präsentation von Analysen / Algorithmen
  • Anfertigung von Diagrammen auf wissenschaftlichem Niveau
  • Anwendung von RL auf echten Systemen

Prüfungsformen

i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung

Dokumente (Skripte, Programme, Literatur, usw.)

Sutton, R., Barto, A. ‘Reinforcement Learning: An Introduction’, MIT-Press (1998)

Lehrende: Prof. Dr. F. Kirchner u.a. Verantwortlich: Prof. Dr. F. Kirchner
Zurück

Zeige Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon