unicode
Definiert einen Zeichensatz der möglichst alle Zeichen existierender (aktiver) Sprachen enthält
Definiert nicht die graphische Darstellung der Zeichen
nur das das Zeichen existiert, seinen Namen und seinen Code
die Darstellung muss durch entsprechende Fonts definiert werden
Jedes Zeichen hat einen Code-Point (eine (in der Regel) Hex-Zahl die für dieses Zeichen steht
Zeichenkodierung
die Darstellung von Unicode-Codepoints als 1 und 0
üblich ist UTF und am weitesten verbreitet sind UTF-8 und UTF-16, spezifiziert ist noch UTF-32
UTF (Unicode Transformation Format)
UTF-8 ist in Europa gebräuchlich
UTF-16 ist in Asien gebräuchlich
UTF-32 ist nicht gebräuchlich
bei UTF-32 entspricht der Unicode-Codepoint exakt dem wie es auch kodiert wird
bei UTF-8 und UTF-16 müssen weitere Informationen (z.B. das ein weiteres Byte folgt) kodiert werden, weshalb die Unicode-Zeichenkodes nicht 1:1 kodiert werden
unicode.txt · Zuletzt geändert: 2022/07/15 09:50 von root