Texterkennung bei Frakturschrift nach dem Scannen als PDF-Dokument

Dieser Thread ist Teil einer Diskussion zu einem Artikel:  Zum News-Artikel gehen

grgartner

Neues Mitglied
Guten Abend in die Runde.
Habe alte Frakturschrift-Dokumente vor dem Zerfall gerettet und als PDF-Dokumente scannen lassen.
Nun würde ich gerne die Textsuchfunktion in den PDF-Dokumenten nutzen.
Welche Software eignet sich dafür?
Kann mir da jemand einen Tipp geben?
Danke!
 

Billmar

Stammgast
Hallo grgartner

Das kann mit Acrobat, Kofax Power PDF und ähnlichen Tools gemacht werden - allerdings sind diese nicht ganz billig.
Als Alternative würde ich PDF24 nehmen. Die Programme werden unter https://www.pdf24.org/de/ als Onlinetool oder/und als Programmdownload zur lokalen Installation angeboten. Ich verwende die Tools für verschiedenste PDF-Aktionen (teilen, zusammenfügen, konvertieren....).

Gruss Mario
 

Klaus Zellweger

Redaktion PCtipp
Teammitglied
Das kann mit Acrobat, Kofax Power PDF und ähnlichen Tools gemacht werden - allerdings sind diese nicht ganz billig.
Der Punkt von @grgartner ist, dass es sich um eine Frakturschrift handelt. Ich habe es rasch mit der kostenpflichtigen Version von Acrobat versucht. Selbst mit einer knackscharfen Qualität wie dieser hier kommt nichts Brauchbares raus, in diesem Fall:

1Cufflärung ift ber 1f ut,gang bet, ~enf d,,en
aut, f dner f dbft tlerf d,,ulbeten Unmünbig~
f d t.


Fraktur.jpg

Das wird wohl mit den meisten anderen OCR-Programmen dasselbe sein. Ich würde die Scans beiseitelegen und in zwei bis drei Jahren nachsehen, was sich im Bereich K.I. getan hat, um die Erkennung zu verbessern.
 
Zuletzt bearbeitet:

Billmar

Stammgast
Das wird wohl mit den meisten anderen OCR-Programmen dasselbe sein.
Ob es bei anderen Tools so ist, kann ich nicht beurteilen.
Aber mit PDF24 ist es m.E. jedenfalls kein Problem. Anbei das gepostete Fraktur.jpg, zuerst in PDF-Umgewandelt und dann in ein lesbares PDF umgewandelt. Im Anhang das Resultat.
PDF24-Fraktur.jpg
Ein Versuch ist es allemal wert ;-)
Gruss Mario
 

Anhänge

  • Fraktur_ocred.pdf
    213,5 KB · Aufrufe: 9

Gaby Salvisberg

Super-Moderator
Beeindruckend, Billmar! Das ist zwar nicht perfekt, bekommt aber deutlich mehr gebacken als gedacht.

@grgartner Und sonst gibts mancherorts Institutionen, die sich ums Archivieren historischer Schriftstücke kümmern. Etwa im Kanton Zürich ist hierfür das Staatsarchiv zuständig: https://www.zh.ch/de/direktion-der-justiz-und-des-innern/staatsarchiv.html#1471609460. Könnte mir vorstellen, dass die Auskunft geben können, mit welcher OCR-Software dies erfahrungsgemäss am besten klappt.

Vielleicht gibt es so etwas auch in deinem Kanton oder Land.
 

Billmar

Stammgast
Ja, bei f, s und c gibt es noch Luft nach oben.

Ich habe mir noch kurz "ABBYY FineReader PDF" angesehen (https://pdf.abbyy.com/de/, kostenlos zum Testen). Preis 99 €/Jahr.

Aus dem Text von #3 wurde folgendes erstellt:

"Beantwortung der Frage: Was ist Aufklärung?
Immanuel Kant
Aufklärung ist der Ausgang des Menschen aus seiner selbst verschuldeten Unmündigkeit. Unmündigkeit ist das Unvermögen, sich seines Verstandes ohne Leitung eines andern zu bedienen. Selbst verschuldet ist diese Unmündigkeit, wenn die Ursache derselben nicht am Mangel des Verstandes sondern der Entschließung und des Muthes liegt, sich seiner ohne Leitung eines andern zu bedienen. 8apere aude! Habe Muth, dich deines eigenen Verstandes zu bedienen! ist also der Wahlspruch der Aufklärung."

Aus meiner Sicht liefert das schon sehr gute Resultate. Zu 100% wird es wohl nicht gehen.
Gruss Mario
 

soundnet

Stammgast
Es gibt daneben auch diverse Online-OCR für Fraktur. Ich hab di zwar nicht getestet, hatte aber mal eine Sütterlin, für welche es ebenfalls Online-OCR gibt. Das Ergebnis war absolut beeindruckend

Gruss aus dem Süden
Fido
 
Oben