Sprungmarken

Service navigation

Hauptnavigation

You are here:

Bereichsnavigation

Hauptinhalt

Vorlesung Spracherkennung im SS 2011


Ziel der automatischen Spracherkennung ist es, gesprochene Äußerungen - d.h. das akustische Sprachsignal - unter Zuhilfenahme eines geeigneten Inventars von Wortformen auf eine möglichst exakte orthographische Repräsentation der Äußerung abzubilden. Diktiersysteme sind daher typische Beispiele für Spracherkennungssysteme. In der Veranstaltung werden ausschließlich Aspekte der Spracherkennung behandelt. Die Grundlagen bilden dabei speziell in der Spracherkennung eingesetzte Verfahren zur Signalverarbeitung sowie Erkenntnisse aus der artikulatorischen und akustische Phonetik. Schwerpunktmäßig wird dann das nach dem gegenwärtigen Stand der Forschung vorherrschende Paradigma zur automatischen Spracherkennung behandelt - die sogenannten Hidden-Markov-Modelle (HMM). Die mathematischen Grundlagen dieser statistischen Modellierungstechnik für gesprochene Sprache werden eingeführt und Algorithmen zur Parameterschätzung sowie zum Einsatz für die Analyse von Sprachsignalen behandelt. Anhand existierender Spracherkennungssysteme werden mögliche Varianten der HMM-Technologie vorgestellt und diskutiert.

Schwerpunktgebiete: 2 (..., Eingebettete Systeme, ...), 7 (Intelligente Systeme)

Vertiefungsmodul (INF-MA-508), Forschungsbereich Intelligente Systeme im Master Informatik / Angewandte Informatik

Literatur:

  • Fink, Gernot A.: Mustererkennung mit Markov-Modellen, Leitfäden der Informatik, B. G. Teubner, Stuttgart - Leipzig - Wiesbaden, 2003.
  • Schukat-Talamazzini, E.-G.: Automatische Spracherkennung, Vieweg, Wiesbaden, 1995.
  • Huang, X., Acero, A., Hon, H-W.: Spoken Language Processing: A Guide to Theory, Algorithm, and System Development, Prentice Hall, Upper Saddle River, NJ, 2001.
  • Kohler, Klaus J.: Einführung in die Phonetik des Deutschen, Erich Schmidt Verlag, Berlin, 1977
  • Zwicker, E.: Psychoakustik, Springer, Berlin - Heidelberg - New York, 1982

Materialien zur Vorlesung:

Weitere Hilfmittel:
  • Bearbeitungs- und Annotationssoftware für Sprachsignale PRAAT (Universität Amsterdam)