Neue intelligente Software erkennt fast alles

Fraunhofer-Forscher haben hochkomplexe Engine für Optical Character Recognition trainiert. [...]

Zeichenerkennung: Neues System erkennt alles. (c) IAIS,animaflora/fotolia.de

Forscher des Fraunhofer-Instituts für Intelligente Analyse- und Informationssysteme (IAIS) haben zusammen mit der CIB software GmbH eine Künstliche Intelligenz entwickelt, die Zeichen mit menschenähnlicher Genauigkeit erkennt. Herzstück ist eine Engine für Optical Character Recognition (OCR).

Mit mehr als 2.000 Fonts sowie eigens erzeugten, schwer erkennbaren Zeichen haben die Forscher die künstlichen neuronalen Netze trainiert. So gelingt es der Technologie, neben gut lesbaren Materialien auch alte Schriften, Fotos mit mangelhafter Belichtung und schlecht erhaltene Dokumente zu entziffern.

Schwer Erkennbares deuten

Selbst Hinweisschilder auf Baustellen oder Plakattexte erkennt die Software laut den Experten problemlos, was ihren Einsatz über die klassische Dokumentenanalyse hinaus in anderen Bereichen ermöglicht, etwa dem Autonomen Fahren oder der Hilfe Sehbehinderter, denen künftig zum Beispiel Texte in ihrer Umgebung vorgelesen werden könnten.

„Eine Vielzahl der kommerziellen Engines ist offenbar primär auf gute Materialien ausgelegt. Hier liegt die Trefferquote bei nahezu perfekten 99 Prozent. Sobald die Qualität des Dokuments abnimmt, verringert sich die Erkennungsrate jedoch dramatisch. Deshalb haben wir uns insbesondere auf schwer erkennbare Dokumente konzentriert und so auf unserer Fraunhofer-Expertise im Maschinellen Lernen aufbauend eine schnelle und robuste Allzweck-OCR-Engine mit menschenähnlicher Genauigkeit geschaffen – auch bei schwierigen Scans“, so IAIS-Projektleiter Iuliu Konya.

Ein Zeichen, 5.000 Variationen

In 27 Monaten haben die Forscher die OCR-Engine trainiert – jedes Zeichen wurde mindestens 5.000 Mal in verschiedenen Variationen zum Training verwendet. Historische und neue Texte, verschiedene Graustufen – dort, wo es an Trainingsdaten mangelte, erzeugten die Forscher zudem selbst synthetische Texte. Nachdem die Software zunächst anhand einzelner annotierter Zeichen trainiert wurde, erkennt sie jetzt innerhalb ganzer Zeilen selbstständig die jeweiligen Buchstaben und Satzzeichen. Binnen kürzester Zeit werden Zeitungsseiten, juristische Dokumente oder medizinische Akten erfasst.


Mehr Artikel

News

Bad Bots werden immer menschenähnlicher

Bei Bad Bots handelt es sich um automatisierte Softwareprogramme, die für die Durchführung von Online-Aktivitäten im großen Maßstab entwickelt werden. Bad Bots sind für entsprechend schädliche Online-Aktivitäten konzipiert und können gegen viele verschiedene Ziele eingesetzt werden, darunter Websites, Server, APIs und andere Endpunkte. […]

Frauen berichten vielfach, dass ihre Schmerzen manchmal jahrelang nicht ernst genommen oder belächelt wurden. Künftig sollen Schmerzen gendersensibel in 3D visualisiert werden (c) mit KI generiert/DALL-E
News

Schmerzforschung und Gendermedizin

Im Projekt „Embodied Perceptions“ unter Leitung des AIT Center for Technology Experience wird das Thema Schmerzen ganzheitlich und gendersensibel betrachtet: Das Projektteam forscht zu Möglichkeiten, subjektives Schmerzempfinden über 3D-Avatare zu visualisieren. […]

Be the first to comment

Leave a Reply

Your email address will not be published.


*