Ich mache so eine Übung gerade mit alten Shadowrun-Büchern - als Scanner kommt ein
CZUR Shine Ultra zum Einsatz, was zwar in der Praxis doch recht aufwendig ist, aber den Vorteil hat, dass die Software einigermaßen gut darin ist, die Buchseiten zu entzerren (klappt aber auch nicht immer gut und auch sonst gibt es da ein paar Macken).
Anschließend dann Zusammenfüge und OCR mit Acrobat Pro (bedauerlicherweise nur für Schüler und Studenten halbwegs bezahlbar). Ich lasse selber dann die meisten PDFs mit den Bildern wie sie aus dem Scanner fallen stehen. Testweise habe ich mal für ein PDF nachträglich runterkomprimiert (auch mit dem Acrobat) - das sorgt dann für akzeptable Größen im Bereich von 20-30MB.