Wie kann man Sonderbuchstaben (ü --> Ü) wieder in normale Buchstaben konvertieren?
Ich habe eine .txt Datei, wo mehrere Wörter zu finden sind. Aber wenn ich es mit with open(".txt","r") as f: öffne werden alle Sonderbuchstaben in kryptische Buchstaben umgewandelt ( Ü --> ü). Jetzt möchte ich die Buchstaben wieder in normale Buchstaben umwandeln (oder von Ü --> UE). Ich weiß auch, dass es in Pyhton .replace() gibt, aber ich weiß nicht wie ich es machen kann. Oder kann man vielleicht auch es direkt formatiert importieren?
2 Stimmen
Technische Fragen erfordern in der Regel eine technische Antwort und keinen multiple choice Fragebogen.🙄
Ich wollte nur kurz alle Möglichkeiten aufzählen, sodass man schnell antworten kann und nicht alles lesen/verstehen muss
2 Antworten
Du musst nur die richtige Kodierung angeben:
open(".txt","r", encoding='utf-8')
Siehe Doku.
öffne die zu lesende Textdatei einfach als UTF8 codiert.
import io
with io.open(filename,'r',encoding='utf8') as f:
text = f.read()
wenn du die Datei ohne Angabe zur Codierung öffnest, werden UTF8-Zeichen als zwei 8Bit ASCII Zeichen interpretiert 16Bit 'Ü' ergibt dann die beiden ASCII-Zeichen 'Ã' und '¼'.