Die Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Verwaltung des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Mathematik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Universität Bremen
Zeige Wirtschaftsinformatik-Format Pdf_icon Informatik-Format Pdf_icon Digitale Medien-Format Pdf_icon Systems Engineering-Format Pdf_icon

Informatik-Ansicht

Bestärkendes Lernen


Reinforcement Learning
Modulnummer
ME-712.03
Master
Pflicht/Wahl
Wahl Basis Ergänzung
Sonderfall
Zugeordnet zu Masterprofil
Basis Ergänzung
Sicherheit und Qualität
KI, Kognition, Robotik
Digitale Medien und Interaktion
Modulbereich : Praktische und Technische Informatik
Modulteilbereich : 712 Robotik
Anzahl der SWS
V UE K S Prak. Proj.
2 2 0 0 0 0 4
Kreditpunkte : 6 Turnus

jährlich

Formale Voraussetzungen : -
Inhaltliche Voraussetzungen : Robot Design Lab oder Verhaltensbasierte Robotik
Vorgesehenes Semester : ab 1. Semester
Sprache : Englisch
Ziele :
  • Grundlegende Kenntnisse des Bestärkenden Lernens (engl.: RL)
  • Kenntnisse der Anwendung und Anwendbarkeit von Lernverfahren für autonome Roboter
  • Kenntnis der Problemklasse „Markovsches Entscheidungsproblem“ (MDP) und des Konzepts der Wertfunktionen
  • Verständnis von Modell-bidenden (Dynamic Programming, Dyna-Architekturen) und Modell-freien (Monte-Carlo, Temporal Difference) Lernverfahren
  • Kenntnisse der wichtigsten Methoden und Verfahren zur Explorationskontrolle beim RL
  • Erlernen der Durchführung, Auswertung und Präsentation von empirischen Untersuchungen von Lernverfahren
  • Einarbeitung in die Literatur des aktuellen Stands der Technik
Inhalte :
  • Grundlagen des Bestärkenden Lernens (engl.: RL)
  • Problemklassen und Anwendungen für das Bestärkende Lernen
  • Grundlegende Probleme und Verfahren der Explorationskontrolle beim RL
  • Fortgeschrittene und aktuelle Themen des Bestärkenden Lernens (bspw. Direct Policy Search, Hierachisches RL, Deep RL, Multi-Agenten RL …)

Insbesondere werden folgende theoretisch/methodische Grundlagen im Zusammenhang dieser Inhalte behandelt:

  • Theorie Markovscher Entscheidungsprozesse
  • Theorie des Dynamic Programming (Policy Iteration, Value Iteration)
  • Theorie der Monte Carlo Methoden
  • Theorie des Temporal Difference Lernens
  • Theorie von Modell-bildenden Verfahren
  • Einarbeitung und Verständnis von wissenschaftlichen Veröffentlichungen
  • Auswertung und Präsentation von Analysen / Algorithmen
  • Anfertigung von Diagrammen auf wissenschaftlichem Niveau
  • Anwendung von RL auf echten Systemen
Unterlagen (Skripte, Literatur, Programme usw.) :

Sutton, R., Barto, A. ‘Reinforcement Learning: An Introduction’, MIT-Press (1998)

Form der Prüfung : i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung
Arbeitsaufwand
Präsenz 56
Übungsbetrieb/Prüfungsvorbereitung 124
Summe 180 h
Lehrende: Prof. Dr. F. Kirchner u.a. Verantwortlich Prof. Dr. F. Kirchner
Zurück

Zeige Wirtschaftsinformatik-Format Pdf_icon Informatik-Format Pdf_icon Digitale Medien-Format Pdf_icon Systems Engineering-Format Pdf_icon