Welches ist die beste OCR-Software, um Texte innerhalb von Bildern zu erkennen, und passend dazu ein Textdokument zu erstellen, die ihr kennt?

2 Antworten

Von Experte Kenshin663 bestätigt

Hi,

Google kennt die Antwort.

https://www.klippa.com/de/blog/informativ/beste-ocr-software/

Das wirst du ausprobieren müssen, welche Software die besten Ergebnisse liefert.


KBM2307 
Beitragsersteller
 03.06.2024, 07:44

Ich habe jetzte Abbyy Fine Reader 16 Standard käuflich erworben und bin mit den Ergebnissen überaus zufrieden.

KBM2307 
Beitragsersteller
 30.05.2024, 09:59

Ok, Danke.

Das kommt drauf an was man da genau machen will.

Das ist wie "Was ist das allerbeste Auto?"

Ferrari Testarossa? Super zum Anhänger ziehen oder eine Waschmaschine zu transportieren!

Ein MAN 8x8 LKW ist bestimmt Super für Stadtverkehr und einfach zu parken.

Wenn es "das allerbeste" geben würde, dann würde niemand mehr was anderes verwenden, also ist das das einzige was gebräuchlich ist.

Ich verwende als OCR hauptsächlich Tesseract. Das kann keine Seitenaufteilung erkennen und braucht Trainingsdaten. Dafür kann man - wenn man die richtigen Trainingsdaten einstellt - auch besondere Schriftarten ohne viele Fehler umwandeln. Gerade das ist bei sehr alten Büchern sehr wichtig. Damit lassen sich auch Handschriften umwandeln, allerdings auch hier braucht man die passenden Trainingsdaten. Gerade bei altdeutschen Schriften gibt es einige besondere Zeichen, z.B. das doppel-f und doppel-s so dass diese Zeichenkombinationen anders gedruckt werden als einzelne Zeichen. Da haben normale OCR richtig Probleme mit.

Mit Seitenlayout ist Ocropus der Uni Kaiserslautern recht gut.

Sprechblasen in Comics und Schilder in Fotos kann man mit OCR nur sehr schlecht übersetzen. Hier nimmt man dann besser Google Lens, da kann man die Stellen mit den Texten die man übersetzen will markieren.

Das wichtigste ist die Quellbilder erst mal gründlich vorzubereiten. Ideal sind S/W 1-bit mit guter Auflösung und je weniger die Zeilen verzerrt sind, desto weniger Fehler macht das OCR. Hier funktioniert der "Scantailor" sehr gut und macht die meisten Korrekturen automatisch. Das Programm ist gedacht um Bücher mit einer Kamera ab zu fotografieren, behebt aber auch viele Fehler und verbessert den Kontrast deutlich auch bei Flachbettscanner Dokumenten. Auch kann man damit gegenüberliegende Seiten beim Scannen von Büchern voneinander trennen und als Einzelseiten behandeln. Man kann auch "Mixed Mode" machen, also Bilder bleiben in Graustufen oder Farbe während die Texte in S/W-bit verarbeitet werden.

Auch ohne OCR lohnt sich Scantailor da man viel besser aussehende Dokumente erhält die dann auch noch viel weniger Speicherplatz verbrauchen. So braucht man meistens nur noch 10% der Datenmenge obwohl die Dokumente viel schärfer und klarer dargestellt werden.

Und dann gibt es diverse KI Tools die man auf das einlesen von Formularen trainieren kann so dass die ausgefüllten Felder in eine Datenbank übernommen werden können. Hier kann man auch Plausibilitätsprüfungen machen, z.B. bestimmen in welchem Format und welchen Zahlenbereich numerische Werte (oder Telefonnummern) sind so dass potentielle Fehler erkannt und gemeldet werden.

Woher ich das weiß:Berufserfahrung

KBM2307 
Beitragsersteller
 30.05.2024, 12:15

Danke für deine Antwort!