Die Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Verwaltung des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Informatik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Mathematik des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage des Fachbereiches 3 der Universität Bremen Hier geht es zur Homepage der Universität Bremen
Zeige Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon

System Engineering-Ansicht

Modultyp
Pflichtmodul Wahlbereich
Spezialisierungsbereich Anzahl Semesterwochenstunden CP Angeboten in jedem
V Ü S P Proj. Anzahl
Automatische Spracherkennung
3 1 0 0 0 4 6 i. d. R. angeboten in jedem WiSe
Automatic Speech Recognition         Berechnung des Workloads
Vorgesehenes Semester ab 1. Semester
Lernziele

  • In der Terminologie der automatischen Sprachverarbeitung kommunizieren können
  • Die menschliche Sprachproduktion und -perzeption überblicken können
  • Die theoretischen Grundlagen der Verarbeitung von Sprachsignalen kennen
  • Die theoretischen Grundlagen der Modellierung von Sprache kennen und auf vorgegebene Einzelsituationen transferieren können.
  • Den Aufbau eines automatischen Spracherkennungssystems kennen, die einzelnen Komponenten identifizieren und die Rolle der einzelnen Komponenten beschreiben können
  • Die grundlegenden Algorithmen und Methoden der statistischen Modellierung kennen und anwenden können
  • Aus gegebenen Daten und Werkzeugen ein Spracherkennungssystem praktisch entwickeln können
  • Das Potenzial sowie die Grenzen moderner Spracherkennungstechnologien einschätzen können

Lerninhalte

  • Sprachproduktion und -perzeption
  • Signalverarbeitung und Merkmalsextraktion für Spracherkennung
  • Komponenten eines Spracherkennungssystems: Akustisches Modell, Sprachmodell, Aussprachewörterbuch, Suche
  • Akustisches Modell: statistische Modellierungsverfahren für Spracherkennung, Hidden-Markov-Modelle, Gauß-Mixtur-Modelle, Neuronale Netze
  • Sprachmodell: N-Gram, Rekurrente Neuronale Netze
  • Aussprachewörterbuch: Vokabularselektion, Generierung von Aussprachen
  • Suche: Suchgraph, effiziente Suche
  • Anwendung in multilingualen Kontexten
  • Training und Adaption der Komponenten auf neue Situationen und neue Sprecher
  • Evaluation eines Spracherkennungssystems und Identifikation von Fehlern

Prüfungsformen

i.d.R. Bearbeitung von Übungsaufgaben und Fachgespräch oder mündliche Prüfung

Dokumente (Skripte, Programme, Literatur, usw.)

  • Folien (Englisch),
  • Spracherkennungssoftware und exemplarische Sprachdaten,
  • Xuedong Huang, Alex Acero and Hsiao-Wuen Hon, Spoken Language Processing, Prentice Hall PTR, NJ, 2001

Lehrende: Prof. Dr.-Ing. Tanja Schultz, Jochen Weiner Verantwortlich: Prof. Dr.-Ing. Tanja Schultz
Zurück

Zeige Systems Engineering-Format Pdf_icon Informatik-Format Pdf_icon Wirtschaftsinformatik-Format Pdf_icon Digitale Medien-Format Pdf_icon