Kann ich mittels Powershell eine PDF in eine schön formatierte Excel umwandeln?
Hallo,
ich bekomme einen Stundenplan als PDF Datei. Wenn ich diesen als txt exportiere ist das ganze natürlich vollkommen unsortiert. Also alles untereinandergeschrieben. Jetzt würde ich diese txt gerne wieder in eine ordentliche Form bringen (Eventuell was rausschneiden, Datumsformatierung txt Dateien der einzelnen Tage, Facher, Dozenten etc.), um es dann möglicherweise in Excel zu importieren.
Ist das grundsätzlich mit der Powershell möglich und wie aufwändig?
Habt Dank!
Grüße
5 Antworten
Es gibt da keine Schnell & Einfach-Lösung.
Du könntest aber mit regulären Ausdrücken arbeiten, um den "Kauderwelsch"-Output aus der TXT-Datei z.B. mit Notepad++ zu ordnen - Das Escape-Zeichen \t steht hierbei für einen Tab, das immer dann nutzen, wenn die Spalte gewechselt werden soll, dann alles markieren und in Excel kopieren, sollte funktionieren.
Zum Thema Notepad++ und reguläre Ausdrücke gibt es z.B.
Auf Basis meiner Erfahrung sage ich mal nein.
Das Problem ist, dass in Abhängigkeit wie die PDF erstellt wurde Du davon ausgehen musst, dass eine Textebene über einem Hintergrundbild angeordnet ist.
Das bedeutet, dass Du zwingenderweise auf ein OCR-Programm mit entsprechender Intelligenz zurückgreifen musst, welches aus dem Hintergrundbild die Tabelle ableitet und in Excel nachbauen kann.
Ich kenne zwei Programme für diesen Zweck:
- ABBYY FineReader
- Nuance Omnipage
Beide eignen sich dafür.
Alternativ kannst Du auch mal nach Online-Convertern googlen.
Vorausgesetzt, der Plan enthält keine personenbezogenen Daten.
Google ist dein Freund.
Kurz gesagt, es geht doch, auch wenn andere es hier nicht so richtig glauben.
Im übrigen ist PS weit mehr als ein Tool um Programme aufzurufen.
Das ist ein sehr spezieller anwendungsfall für den du ein extra dafür entworfenes Programm brauchst. Entweder du programmierst dir selber eins oder du gteifst zu einem bestehenden, sofern vorhanden. Aber mal eben so wirst du das sortieren nicht hinbekommen....
Powershell ist letztendlich nur dafür da Applikationen aufzurufen, wenn bestimme Vorgaben erfüllt sind und deren Ausgabe zu steuern. Du benötigst also ein Programm, welches deine Anforderung erfüllt und sich "fernsteuern" lässt.
Also zumindest geht es aus der PDF mittels Foxit Reader eine .txt zu erstellen, die, soweit ich das sehe, auch alle Infos der PDF enthält. Nur halt unsortiert. Mir geht es darum, dass ich aus dieser .txt dann mittel Sortierung etwas brauchbares mache