Hello,
Nee, den "Buchstaben" gibts dann ja auch bald nicht mehr, sondern nur noch den Codepoint in der UNI-Code-Tabelle. Und der benötigt dann 1 bis 4mal soviel Speicherplatz und, was viel schlimmer ist, bis zu 100mal soviel Rechenzeit (Ticks) um erkannt zu werden.
Auch bei ASCII ist ein "Buchstabe" nichts anderes als ein Codepoint. Was meinst Du mit "erkennen"? Den passenden Glyphen in einer Schriftart finden?
Bei ASCII (oder anderen In-Byte-Codes) wird die Codetabelle vorher geladen und dann kann die Darstellung des Zeichens einfach per Dereferenzierung adressiert werden.
Bei UTF muss leider der gesamte Text gestreamt werden, bevor die Zeichnauflösung stattfinden kann. Da ist also nix mehr mit Wahlfreiem Zugriff. Je länger nun so eine Textsequenz ist, desto mehr Ticks verschluckt sie, bevor sie in "Zeichen" zerlegt worden ist.
Liebe Grüße aus dem schönen Oberharz
Tom vom Berg