Warum kann man den Text aus manchen pdfs nicht kopieren?
Gibt es da einen Kopierschutz? Brauche das im Word - ich will nicht 10 Seiten abtippen.
4 Antworten
Hallo,
die Ursache kann verschiedenartig sein. Es könnte ein Kopierschutz sein, es kann sein, dass es als Bild eingefügt wurde, kann sein, dass es ein Scan ist... und so weiter.
Wenn du Adobe nutzt, findest du in den Werkzeugen die Texterkennung. Das funktioniert nicht immer, aber zumindest meiner Erfahrung nach recht oft. Ich vermute, dass das Tool nur in der Vollversion vorhanden ist. Andere PDF-Programmen können das aber womöglich auch.
LG, Chris
Ein Beispiel wäre hilfreich gewesen!
Viele PDFs bestehen nur aus einer Grafik mit dem Text. Das ist dann für den PC nur ein Bild ohne Textinformationen.
Du brauchst zur Umwandlung eine Texterkennung (OCR)
Das kann man online machen - z.B. kostenlos hier: https://www.onlineocr.net/
Geht aber auch lokal mit dem Computer mit z.B. NAPS2:
Einfach das PDF hineinziehen und dann wieder speichern.
Derzeit können aber nur Windows-Insider-Tester aus den Kanälen Canary und Dev die neue OCR-Funktion testen.
Kann also nicht jeder ;-)
Ich werde mal nachsehen, ob das nächste Win-update das kann...
Achso, ja, ich bin im Insider, vergesse ich manchmal. ^^'
Richtig. Es genügt auch schon, eine PDF in eine andere PDF zu drucken und dann sind die Texte integriert und können nicht mehr einzeln identifiziert werden.
Die PDF24 Tools können dir da evtl weiter helfen, unter anderem gibt es da einen integrierten OCR, mit dessen Hilfe man den Text meist extrahieren kann. Außerdem gibt es auch noch diverse Format Umwandler. Wer mit PDFs arbeitet, der braucht auch PDF24.
Ja es gibt eine Möglichkeit in PDFs, Text als "nicht kopierbar" zu deklarieren. In den meisten Fälle aber wurde der Text als Bild eingesetzt.
Kann mittlerweile tatsächlich das ganz normale Snipping Tool! :-)