Tanelorn.net
Pen & Paper - Rollenspiel => Pen & Paper - Allgemein => Thema gestartet von: King Grayskull am 14.10.2021 | 10:52
-
Hi, ich bin gerade dabei meine alte MERS Sammlung zu digitalisieren. Ich habe schon einige meiner deutschen Bände gescannt und als PDFs umgewandelt. Trotz Optimierung sind die PDFs natürlich sehr groß. Hat von euch jemand Erfahrung mit OCR Texterkennungsprogrammen? Gibts einen einfachen Weg wie ich meine PDFs in Texte umwandeln kann um die Dateigrößen noch kleiner zu bekommen oder ist das ein riesen Aufwand und geht gar nicht so einfach wie ich mir das vorstelle?
Wer hat damit Erfahrung?
-
Selbst noch nicht ausprobiert, aber Bekannte schwören auf
https://sourceforge.net/projects/gimagereader/
-
Probier mal Mircosoft Lens. Allgemein ist es aber mit OCR nicht so einfach, komplexe Layouts befriedigend zu übertragen.
-
Ich mache so eine Übung gerade mit alten Shadowrun-Büchern - als Scanner kommt ein CZUR Shine Ultra (https://www.czur.com/product/shineultra) zum Einsatz, was zwar in der Praxis doch recht aufwendig ist, aber den Vorteil hat, dass die Software einigermaßen gut darin ist, die Buchseiten zu entzerren (klappt aber auch nicht immer gut und auch sonst gibt es da ein paar Macken).
Anschließend dann Zusammenfüge und OCR mit Acrobat Pro (bedauerlicherweise nur für Schüler und Studenten halbwegs bezahlbar). Ich lasse selber dann die meisten PDFs mit den Bildern wie sie aus dem Scanner fallen stehen. Testweise habe ich mal für ein PDF nachträglich runterkomprimiert (auch mit dem Acrobat) - das sorgt dann für akzeptable Größen im Bereich von 20-30MB.