Die Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Verwaltung des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Mathematik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Universität Bremen
Zeige Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon

Digitale Medien-Ansicht

Modulnummer
Modulbezeichnung
Bestärkendes Lernen
Titel (englisch)
Reinforcement Learning
Pflicht/Wahl
Pflicht
Erklärung
CP
6
Berechnung des Workloads
Turnus
jährlich
Dauer
ein Semester
Form
2 SWS L, 2 SWS T
Prüfung
i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung
Anforderungen
Robot Design Lab oder Verhaltensbasierte Robotik
Lernziele
  • Grundlegende Kenntnisse des Bestärkenden Lernens (engl.: RL)
  • Kenntnisse der Anwendung und Anwendbarkeit von Lernverfahren für autonome Roboter
  • Kenntnis der Problemklasse „Markovsches Entscheidungsproblem“ (MDP) und des Konzepts der Wertfunktionen
  • Verständnis von Modell-bidenden (Dynamic Programming, Dyna-Architekturen) und Modell-freien (Monte-Carlo, Temporal Difference) Lernverfahren
  • Kenntnisse der wichtigsten Methoden und Verfahren zur Explorationskontrolle beim RL
  • Erlernen der Durchführung, Auswertung und Präsentation von empirischen Untersuchungen von Lernverfahren
  • Einarbeitung in die Literatur des aktuellen Stands der Technik
Lerninhalte
  • Grundlagen des Bestärkenden Lernens (engl.: RL)
  • Problemklassen und Anwendungen für das Bestärkende Lernen
  • Grundlegende Probleme und Verfahren der Explorationskontrolle beim RL
  • Fortgeschrittene und aktuelle Themen des Bestärkenden Lernens (bspw. Direct Policy Search, Hierachisches RL, Deep RL, Multi-Agenten RL …)

Insbesondere werden folgende theoretisch/methodische Grundlagen im Zusammenhang dieser Inhalte behandelt:

  • Theorie Markovscher Entscheidungsprozesse
  • Theorie des Dynamic Programming (Policy Iteration, Value Iteration)
  • Theorie der Monte Carlo Methoden
  • Theorie des Temporal Difference Lernens
  • Theorie von Modell-bildenden Verfahren
  • Einarbeitung und Verständnis von wissenschaftlichen Veröffentlichungen
  • Auswertung und Präsentation von Analysen / Algorithmen
  • Anfertigung von Diagrammen auf wissenschaftlichem Niveau
  • Anwendung von RL auf echten Systemen
Quellen

Sutton, R., Barto, A. ‘Reinforcement Learning: An Introduction’, MIT-Press (1998)

Sprache
Englisch
Bemerkung
Zuletzt geändert
2019-03-15 13:25:44 UTC
Zurück

Zeige Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon