Zeichenkodierung


Zuordnungsvorschrift von Zeichen innerhalb eines Zeichensatzes. Die wichtigsten Standards sind aufsteigend nach Umfang sortiert: ASCII, die ISO-8859-Familie und Unicode/UTF. US-ASCII verfügt über 128 Zeichen (7 Bit), bildet die Grundlage des E-Mail-Transfers, kennt aber beispielsweise keine deutschen Umlaute. ISO-8859-1 beinhaltet zwar Umlaute, kennt aber kein Eurozeichen. ISO-8859-15 beseitigt dieses Manko. Unicode schließlich verfügt über unzählige Zeichen und Symbole und sollte entsprechend der IMC-Empfehlung per UTF-8 durch alle E-Mail-Programme unterstützt werden. Kodierungsfehler, also nicht darstellbare Zeichen, markieren Browser und E-Mail Clients ein Ersetzungszeichen - oft eine schwarze Raute mit weißem Fragezeichen darin. Eine E-Mail-Spezialität ist die Quoted-printable-Kodierung, die Zeichen außerhalb des ASCII-Zeichensatzes ASCII-gerecht macht: Aus "Möglichkeit" wird "M=F6glichkeit". Base64 beschreibt ein weiteres Kodierungsverfahren, das die Umwandlung von Binärdateien in ASCII-Zeichenfolgen ermöglicht; damit ist es möglich, z.B. ausführbare Programme als Anhang mitzusenden. Die Zeichenkodierung lässt sich für die E-Mail, für deren MIME-Teile und auch für den HTML-Quelltext jeweils im Header spezifizieren.