Der Traum: Ein Computerprogramm, das auch die unlesbarste Handschrift entziffern kann. An diesem Ziel forschen Mathematiker der Universität Rostock um Roger Labahn gemeinsam mit dem Schweriner Unternehmen Planet is GmbH. „Die Leistung ist heute nicht mehr das Lesen maschinengeschriebener Texte, das kann jeder Scanner, sondern die Entzifferung von Handschriften“. Und diesem Ziel wollen die Rostocker Mathematiker möglichst ganz nah kommen.
Bei so genannten „Schönschreibern“ haben die Schrifterkennungsprogramme, die es heute bereits gibt, noch erhebliche Probleme. „Nicht jede Handschrift kann aussehen wie ein Kulturdenkmal. Es ist auch eine liebenswerte Spur der Persönlichkeit“, konstatiert Dr. Labahn. Während es für einen Menschen meist keine große Schwierigkeit darstellt, die persönlichen Schnörkel verschiedener Schreiber zu entziffern, beherrschen Maschinen diese Kunst noch nicht wirklich befriedigend.
Die große Herausforderung für die Rostocker Forscher: Das auf zwei Säulen stehende Verbundprojekt zur Erkennung von Handschriften, an dem auf der einen Seite die mittelständische Firma, auf der anderen Seite die Universität knobelt, soll eine Lösung bringen. Planet entwickelt das Softwaremodule TextRecoPlus, mit der dann schließlich das wirkliche Lesen ganzer Adressen von Briefen möglich werden soll. Und die Firma stellt der Uni für das Verbundprojekt Daten und Software zur Verfügung.
„Wir sind überzeugt, dass die Mathematiker in Rostock brauchbare Lösungen entwickeln werden“, sagt Planet-Mitarbeiter Jesper Kleinjohann. Bislang kapituliert die Software noch oft, wenn sie mit schwer leserlicher Schrift konfrontiert wird, besonders wenn einzelne Buchstaben auf unübliche Weise miteinander verbunden sind oder ineinander übergehen.
Die hohe Kunst der Schrifterkennungsprogramme bleibt vorerst die Entzifferung gebundener Schrift. „Wenn man nicht weiß, was die Handschrift bedeuten soll, dann ist es schwer, sie zu lesen“, sagt Labahn. Die Rostocker Forscher arbeiten deshalb mit so genannten Hierarchischen und Rekurrenten Künstlichen Neuronalen Netzen. „Das sind mathematische Strukturen, die dem menschlichen Hirn nachempfunden sind und es vermögen, aus großen Datenmengen zu erlernen, neue Bilder zu lesen“, erklärt Labahn.
Wo hört der Buchstabe auf?
Das Problem besteht jedoch darin, aus einem Bild mit Handschrift die Bedeutung zu rekonstruieren. Es gibt zu viele mögliche Antworten auf die Frage, wo ein Buchstabe aufhört und der andere anfängt. Die Zahl der Kombinationsmöglichkeiten ist eben groß, auch wenn man nur sinnvolle Wörter als Lösung zulässt. Deshalb werden an der Universität Rostock Algorithmen entwickelt und in akademischen Testszenarien implementiert und getestet.
„Die Ergebnisse werden dann von unserem Praxispartner für die wirklichen Anwendungen erneut getestet und schließlich verwendet“, beschreibt Labahn das Szenario. Sein Team hat inzwischen Kernalgorithmen entwickelt zum Erkennen von handgeschriebenen Worten. „Wir haben nichts von Grund auf Neues erfunden“, gibt sich Dr. Labahn bescheiden. Doch seinem Team gelang es inzwischen, bisher instabilen Algorithmen Zuverlässigkeit einzuhauchen.
Bei der Schriftanalyse gehen moderne Zeichenerkennungsprogramme nicht von einer Idealform der Buchstaben aus. Vielmehr ist ein Ansatz eben die Verwendung von Neuronalen Netzen, die im Laufe der Zeit lernen, wie das ihnen vorgelegte Material richtig zu entziffern ist. Wenn man ihnen also oft genug sagt, was alles ein A ist, dann wird die „Vorstellung“ des Programms vom abstrakten A immer differenzierter, ohne dass zusätzliche Informationen von außen eingegeben werden müssen. „Optimierung des Abgleichs von Lesedaten mit dem Wörterbuch“, nennt es Dr. Labahn, wenn dann schließlich aus einem längeren Muster aus mehr oder weniger zutreffend erkannten Buchstaben seine wahrscheinlichste Bedeutung in Form eines Wortes unserer Sprache abgeleitet wird.
(Universität Rostock, 19.03.2013 – NPO)