Große CSV-Datei splitten
Ich habe eine ziemlich große CSV-Datei (Trennzeichen Semikolon) von beinahe 1GB Größe und ungefähr 3,5 Millionen Zeilen. Aufgrund der Größe der Datei kann ich Sie mit keinem Editor öffnen.
Ich würde diese Datei gerne in ca. 100.000 Zeilen große Happen splitten. Wie stelle ich das am besten an? Wichtig ist, dass dabei Umlaute etc. nicht verloren gehen. FXFisherman's CSV Splitter habe ich bereits ausprobiert aber der kann leider keine Umlaute.
Vielen Dank für eure Hilfe...
2 Antworten
Ganz nebenbei: Ein GB für eine Datei ist noch keine extreme Größe. Wieviele Editore hast schon ausprobiert? Es gibt sehr viele auch kostenlose im Internet zum Herunterladen mit unterschiedlichen und auch ausgefallenen Eigenschaften. Da könnte durchaus einer dabei sein, der so große Dateien öffnen kann.
Zum Thema große Dateien: Ich selbst arbeite mit virtuellen Rechnern und habe sehr große Dateien. Zum Sichern muss ich diese packen, damit sie auf eine DVD passen. Dabei habe ich festgestellt, dass viele Packprogramme diese Dateien zwar packen, aber nicht entpacken können (ist eine Katastrofe für den Ernstfall). Gut zu wissen: Der kostenlose 7-zip kann das.
Außerdem gibt es Probleme mit USB-Sticks und Speicherkarten, da deren File-System keine großen Dateien speichern kann, auch wenn die Kapazität vorhanden ist.
Wenn Du gar nicht klar kommst, könnte ich Dir ein einfaches Programm schreiben, das Dateien in beliebige kleine aufteilt oder einzelne Bereiche zum Anschauen im Editor herauskopiert. Schwieriger würde es werden, wenn Du auch Änderungen machen möchtest. Dann müsste man das ganze nochmals umgekehrt machen. Melde Dich wenn Du daran interessiert bist.
Ich hatte mehrere Programme zum splitten der Datei ausprobiert - leider alles Programme die mit Umlauten nicht umgehen können. Bin jetzt auf reCSVeditor gestoßen ... der kann die Datei öffnen und Umlaute ersetzen. Dauert aber eine halbe Ewigkeit.
Auf jeden Fall Danke für dein Hilfsangebot.
PS: Ich finde 1GB für eine CSV-Datei schon beachtlich wenn man bedenkt, dass das nur Text ist.
Kannst du etwas programmieren?
In C sind das nur in paar Zeilen...
Leider nur etwas und leider kein C ... hab' auch keinen Compiler hier.