Sprungmarken

Service navigation

Hauptnavigation

You are here:

Bereichsnavigation

Hauptinhalt

Vorlesung Spracherkennung im SS 2016


Erste Vorlesung: 19.4.2016

Ziel der automatischen Spracherkennung ist es, gesprochene Äußerungen unter Zuhilfenahme eines geeigneten Inventars von Wortformen auf eine möglichst exakte orthographische Repräsentation der Äußerung abzubilden. Diktiersysteme sind daher typische Beispiele für Spracherkennungssysteme. In der Veranstaltung werden grundlegende Aspekte und fortgeschrittene Techniken der Spracherkennung behandelt. Die Ausgangspunkt bilden dabei speziell in der Spracherkennung eingesetzte Verfahren zur Signalverarbeitung sowie Erkenntnisse aus der artikulatorischen und akustische Phonetik. Schwerpunktmäßig wird dann das nach dem gegenwärtigen Stand der Forschung vorherrschende Paradigma zur automatischen Spracherkennung behandelt - die sogenannten Hidden-Markov-Modelle (HMM). Die mathematischen Grundlagen dieser statistischen Sequenzmodelle werden eingeführt und Algorithmen zur Parameterschätzung sowie zum Einsatz für die Analyse von gesprochener Sprache behandelt. Anhand existierender Erkennungssysteme werden in der Praxis erfolgreiche Konfigurationen und Realisierungsmöglichkeiten der behandelten Themenkomplexe vorgestellt. Zum Abschluss wird die Übertragung der HMM-Methodik auf verwandte Anwendungsgebiete, wie z.B. der Handschrifterkennung, behandelt.

Übungen:

Schwerpunktgebiete: 2 (..., Eingebettete Systeme, ...), 7 (Intelligente Systeme)

Vertiefungsmodul (INF-MSc-508), Forschungsbereich Intelligente Systeme im Master Informatik / Angewandte Informatik

Literatur:

  • Fink, Gernot A.: Markov Models for Pattern Recognition, From Theory to Applications, Advances in Computer Vision and Pattern Recognition, 2. Auflage, Springer, London, 2014.
  • Fink, Gernot A.: Mustererkennung mit Markov-Modellen, Leitfäden der Informatik, B. G. Teubner, Stuttgart - Leipzig - Wiesbaden, 2003.
  • Schukat-Talamazzini, E.-G.: Automatische Spracherkennung, Vieweg, Wiesbaden, 1995.
  • Huang, X., Acero, A., Hon, H-W.: Spoken Language Processing: A Guide to Theory, Algorithm, and System Development, Prentice Hall, Upper Saddle River, NJ, 2001.
  • Kohler, Klaus J.: Einführung in die Phonetik des Deutschen, Erich Schmidt Verlag, Berlin, 1977
  • Zwicker, E.: Psychoakustik, Springer, Berlin - Heidelberg - New York, 1982

Materialien zur Vorlesung: