Bücher digitalisieren für EBook Reader
Hi Leute, ich hab eine Menge Bücher die es leider nicht als EBook zu kaufen gibt und wohl auch nie zu kaufen geben wird. Außerdem nutze ich lieber meinen Kindle anstatt die Bücher mitzuschleppen. Ich habe mir überlegt, die Bücher einzuscannen und halt ins EBook Format zu konvertieren. Und hier beginnt das Problem, es klappt nicht so recht. Könnte mir wer ne gute Guide linken wie man sowas macht? Ich hab Probleme mit der Texterkennung - sehr viele Rechtschreibfehler und auch mit dem Umwandeln ins EBook Format - taugt nix... Need help!
2 Antworten
Was erstmal wichtig wäre ist die Frage nach der Einstellung deines Scanners. Ich nutze meist 300dpi. 600dpi machen keinen großen Unterschied, aber die gescannten Dateien sind um einiges größer.
Und dann solltest du dir mal ein richtiges OCR Programm besorgen, wie z. B. Finereader. Wenn man das Programm richtig einstellt kann man damit sogar Bücher in Frakturschrift einlesen. Das Programm hat auch ein Wörterbuch dabei und zeigt viele Rechtschreibfehler direkt an. Und es zeigt einem Wörter an, wenn das Programm nicht sicher ist ob es richtig erkannt wurde.
Wenn dann alle Seiten komplett eingelesen wurden, noch bevor ich es in ein ebook-Format umwandle lasse ich den Text noch mal durch die Fehlerkorrektur von Microsoft Word durchlaufen. Das erkennt immer noch einige Fehler.
Anschließend suche ich mit einem Texteditor noch nach Fehlern, die immer wieder mal auftauchen, beim scannen. Beispielsweise kommt es immer wieder vor, daß ein getrenntes Wort nicht zusammengeschrieben wurde. Das sieht dann bei-spielsweise so aus ... durch den Texteditor kann man mit einer intelligen Suche gezielt nach so was suchen. Worte bei denen der Trennstrich gewollt ist (wie z. B. "Hans-Jürgen") werden bei der richtigen Einstellung ignoriert.
Auf jeden Fall ist die ebook-Bearbeitung eine langwierige Arbeit. Wichtig ist, finde ich, daß ein ebook auch gut aussieht wenn es fertig ist. Ich hab schon selbstgescannte ebooks gesehen, bei denen mitten im Wort oder im Satz ein neuer Absatz anfängt. Oder es wird mitten im Satz die Schriftgröße geändert. Oder bei französichen Anführungszeichen (diese hier: »Anführungszeichen«). Da benutzen viele Leute leider fälschlicherweise die Größer/Kleiner Zeichen >> bzw. <<. So was stört mich immer beim lesen.
Um dir wirklich helfen zu können müsstest du mindestens mal dazu schreiben welche Programme du benutzt und welche Arbeitsschritte du damit genau durchführst. Aber schonmal vorweg OCR ist ein sehr aufwendiger Prozess das kann man nicht mal so schnell perfekt durchführen.
Da hast du die Fehler aber schon nach dem Einscannen drin. Das heißt schon da beginnen deine Probleme und nicht erst beim Konvertieren.
Kann dein E-Book-Reader pdfs anzeigen?
Hi, danke für deine Antwort! Also ich mach da grad meine ersten Versuche - ich hab einen Einzugscanner, deswegen hab ich ein Buch das "mir nicht soviel wert ist" zerschnitten. Als nächstes dann in max Qualität eingescannt in pdf Format. Weiterbearbeitet dann mit Acrobat - Funktion "Text erkennen". Aber ich hab trotzdem massig Rechtschreibfehler im Text und das Umwandeln ins EBook Format (mobi, epub usw) haut auch mehr schlecht als recht hin....