Java String auf UTF-8 Überprüfen?

MrAmazing2  18.04.2021, 18:09

Meinst du vielleicht ASCII?

UnknownRebell 
Beitragsersteller
 18.04.2021, 18:19

gut möglich... (ja, ich bin dumm)

3 Antworten

Ich weiß absolut nicht, was du hier genau willst. Dass UTF-8 eine Umsetzung von Codepoints auf Bytes ist, wurde ja schon erklärt.

Du kannst mit der Klasse Character diverse Dinge über die Zeichen eines Strings herausfinden.

Du kannst aber auch ganz trivial mit einem numerischen Vergleich herausfinden, ob die Zeichen (genauer: Codepoints) noch im ASCII-Block (Basis-Lateinisch, also bis 127 und ohne Umlaute etc.) oder im Bereich der in Westeuropa gängigen Zeichen (Latin-1) liegen. Es scheint, dass du eher letzteres willst...?

Etwas wirr.

Die Zeichen in einem String haben 16 Bit in Java. Jedes Zeichen hat einen Zahlenwert in Unicode. Das 'A' hat die 65, das 'a' die 97. Das ist international genormt. Da sind Alphabete aus verschiedenen Sprachen drin.

UTF-8 ist was anderes. Da geht es darum, Zeichen in Bytes zu kodieren. Beispielsweise zum Abspeichern. Unsere Zeichen in 1 Byte, Umlaute in 2 Bytes und spezielle in 3 oder 4 Bytes. Dann brauchst du keine char oder Character mit 16 Bit in Java mehr sondern byte oder Byte mit 8 Bit.

Frage: was willst du wirklich?

Mit UTF-8 können alle Unicode-Zeichen codiert werden. Das hat nichts mit der Tastatur zu tun.

Woher ich das weiß:Studium / Ausbildung – Datenverarbeitungs-Kfm, Hobby- und Profi-Programmierer

UnknownRebell 
Beitragsersteller
 18.04.2021, 17:48

und Mal wieder was gelernt...

1