Kann ich eine Webseite im Textmodus einlesen?

2 Antworten

Vom Fragesteller als hilfreich ausgezeichnet

Du kannst dir da die DeveloperTools zu Nutze machen, die im Chrome, aber auch Edge verfügbar sind - Firefox vielleicht auch, nutze ich nicht.

Auf der Seite klickst du rechte Maustaste und gehst auf "untersuchen" - oder du drückst einfach die Taste F12. Dann öffnet sich ein Fenster, das dir links oben das HTML anzeigt, rechts oben die CSS und (wenn du es so eingestellt hast) unten die Konsole (sonst oben im Menü auf "Konsole" gehen).

In der Konsole kannst du mittels Javascript die Webseite analysieren und auch Texte auslesen.

Du schreibst

document.body.innerText

und schon hast du nur den Text der Webseite, den ganzen Text. Zeilenumbrüche werden als \n im Text geschrieben.

Wenn du nun auf dem Ergebnis wieder die rechte Maustaste klickst, kannst du den Text in die Zwischenablage kopieren, von dort dann zum Beispiel in einen Texteditor deiner Wahl.

Willst du nur aus einem bestimmten Bereich den Text haben, gibt es ganz links oben im DevTools-Fenster so ein Icon "Quadrat mit einem Mauszeiger drin". Wähle das aus und klicke dann im Browserfenster auf den Text, den du willst.

Jetzt schreibst du in der Konsole nur

$0.innerText

und bekommst, was du willst.

Vielleicht geht es ein wenig an deiner Frage vorbei, aber so hab ich es verstanden.

Woher ich das weiß:eigene Erfahrung

Früher gab es in Firefox

Menü Ansicht, Styles entfernen

o.s.ä.

Lange nicht mehr genutzt und weiß nicht, ob und wie andere Browser das heute anbieten. Sitze gerade leider auch nicht am PC .