Wie kann man nur (!) den Text einer Website speichern bzw. filtern?
Ich möchte gern den Text einer Website einer linguistischen Analyse unterziehen (bin aber leider nicht aus dem Fach). Als Analyse-Programm habe ich Gephi gewählt. Jetzt stehe ich vor dem Problem, dass ich lediglich den Website Text herausfiltern möchte. Ich möchte auf gar keinen Fall die gesamte Website abspeichern müssen... die ist nämlich schon fast unverschämt groß und nicht in sich konsistent. Funktioniert das irgendwie oder muss ich alles einzeln kopieren?
Ich habe es bereits mit dem HTTrack Website Copier versucht, das funktioniert aber leider auch nur mäßig.
2 Antworten
Surfe die betreffenden Websites doch gleich mti einem Textbrwoser an. Dann hast du nur den Text.
Hier mal ein Link, über den du eine fertig eingerichtete Version des sehr guten Textbrwoseres "Lynx" downloaden kannst:
Probiers mal hier mit Tags entfernen