Sprungmarken

Service navigation

Hauptnavigation

You are here:

Bereichsnavigation

Hauptinhalt

Vorlesung Schrifterkennung im SS 2018


Ziel der Schrifterkennung ist es, automatische Verfahren zum Lesen von Dokumenten zu entwickeln, d.h., zur Erzeugung einer textuellen Repräsentation für Abbilder von Dokumenten oder für während des Schreibprozesses "online" erfasster Stifttrajektorien. Typische Beispiele für Schrifterkennungssysteme sind daher sog. OCR-Systeme (Optical Character Recognition), wie sie zur Erkennung maschinell gedruckter Dokumente heute in vielen Bereichen regulär zum Einsatz kommen.

In diesem Modul werden grundlegende Aspekte und fortgeschrittene Techniken der Schrifterkennung behandelt. Der Schwerpunkt liegt dabei auf der Analyse handschriftlicher Dokumente, deren Erkennung gegenüber maschinell erstellten Texten auch heute noch ein aktuelles Forschungsproblem darstellt. Zur Transkription handschriftlicher Dokumente wurden aus dem Bereich der Spracherkennung die sog. Hidden-Markov-Modelle (HMM) übernommen. Für die Erkennung komplexerer Texte sind darüberhinaus sog. Sprachmodelle unabdingbar, die I.d.R. als Markov-Ketten-Modelle realisiert werden. Die mathematischen Grundlagen dieser beiden statistischen Modellierungstechniken werden eingeführt und Algorithmen zur Parameterschätzung sowie zum Einsatz für die Analyse von Textdokumenten behandelt. Neben der Transkription von handschriftlichen Dokumenten wächst in jüngerer Zeit das Interesse an Verfahren zur Suche in digitalisierten Dokumentbestdnden. Mit dem sog. Word Spotting (dt. Schlüsselwortsuche) lassen sich auch besonders schwierige Dokumente durchsuchen, wie z.B. historische Handschriften, für die aktuelle Transkriptionssysteme an Ihre Grenzen stoßen. Besonders erfolgreich sind hierfür Methoden auf der Basis tiefer neuronaler Netze, die bzgl. der verwendeten Modellierung und der für die Suche in digitalisierten Dokumentbestdnden wichtige Algorithmen vorgestellt werden.

Übungen: wird angekündigt (1-wöchige Blockveranstaltung nach Ende der Vorlesungszeit)

Schwerpunktgebiete: 2 (..., Eingebettete Systeme, ...), 7 (Intelligente Systeme)

Vertiefungsmodul (INF-MSc-508), Forschungsbereich Intelligente Systeme im Master Informatik / Angewandte Informatik

(ersetzt ab dem WS 17/18 das ausserkraftgesetzte Modul "Spracherkennung")

Literatur:

Materialien zur Vorlesung: