Welche Textkodierung wird bei Android meist verwendet?

2 Antworten

Vom Fragesteller als hilfreich ausgezeichnet

Android basiert auf Linux, und Linux verwendet standardmäßig UTF-8. Das gilt sowohl für Textein- und -ausgabe, als auch für Dateipfade. Dateien können zwar jede beliebige Textkodierung haben, das dürfte aber selten der Fall sein, da UTF-8 aus guten Gründen de facto die Standard-Textkodierung ist.


Mobiletester 
Fragesteller
 02.01.2018, 16:33

wo wird denn gespeichert, welche Datei mit welcher Textkodierung gelesen werden soll?

0
VeryBestAnswers  03.01.2018, 01:56
@Mobiletester

Es wird nirgendwo gespeichert. Jedes Dateiformat hat seine eigene, individuelle Methode, um Dateien zu kodieren.

Manche Dateiformate sind so definiert, dass nur eine einzige, bestimmte Zeichenkodierung verwendet werden darf. Andere Dateiformate (z.B. PDF) können am Anfang einen Kommentar mit Nicht-ASCII-Zeichen enthalten, um das Erraten der Zeichenkodierung zu erleichtern. Bei manchen Dateiformaten, wie z.B. HTML oder XML, kann die Zeichenkodierung gespeichert werden.

Beispiel für ein HTML5-Dokument, das als UTF-8 interpretiert werden soll:

<!DOCTYPE html>
<html>
<head>
  <meta charset="utf-8">
...

Binäre PDF-Dateien sollten gleich nach der PDF-Version einen Kommentar mit mindestens vier Nicht-ASCII-Zeichen enthalten. Beispiel:

%PDF-1.7
%éééé

1 0 obj
...

Reine Textdateien (z.B. TXT) können jede beliebige Zeichenkodierung annehmen. Ein Texteditor muss also entweder hoffen, dass es sich um UTF-8 handelt, oder versuchen, die richtige Zeichenkodierung zu erraten. Texteditoren haben außerdem meist die Möglichkeit, die Zeichenkodierung manuell zu ändern.

Rein binäre Dateien, wie z.B. MP3, MP4, JPG, PNG, etc. müssen die Zeichenkodierung nicht speichern, weil sie keine Zeichenkodierung haben. Binäre Dateien verwenden binäre Codes, um Bits auf Farben/Koordinaten/Tonfrequenzen/etc. abzubilden. Das heißt, wenn man sie in einem Texteditor öffnet, sieht man aber bloß sinnlosen Symbol-Salat.

0

UTF-8 wenn ich mich nicht irre