Wobei die Zeichenkodierung im Grunde genommen ja auch nur eine Typisierung ist, was UTF-32 abstrahiert bzw. andeutet:
Um in einer Datei ein bestimmte Zeichen zu finden, würde es, wenn sichergestellt ist daß jedes Zeichen mit genau 4 Byte kodiert ist, genügen die Datei in Schritten von genau 4 Byte zu lesen. Ansonsten müsste man, da es ja auch Zeichen mit 1 Byte Länge gibt, die Datei in Schritten von 1 Byte lesen.
Somit ist abstrakt gesehen die Zeichenkodierung im Gunde genommen eine Typisierung und wenn es Letztere nicht geben würde, wäre ist nicht möglich eine CSV-Datei am Trennzeichen zu splitten oder eine XML-Datei zu parsen.
MfG