@@Alexander (HH):
nuqneH
Man arbeitet zu einem Zeitpunkt nur mit einer Sprache.
Nein. Was, wenn in einem Text mal ein Wort aus einer anderen Sprache vorkommt, bspw. ein Eigenname (Stadt, Person)?
In den Sonderfällen, in denen man mehrere Sprachen in einem String/in einer Datei hat, muß man den String/die Datei nach Sprachen trennen und dann jeweils auf die passende Locale umschalten.
Nicht wirklich praktikabel.
Es wäre natürlich einfacher, wenn man einem Scalar einen Satz Locale-Daten mitgeben könnte, der dann z.B. bei RegExps automatisch benutzt wird.
Nein. RegExps sollten alle Zeichen, die in Unicode als "Ll Letter, lowercase", "Lu Letter, uppercase" oder "Lo Letter, other" gekennzeichnet sind, auch als Buchstaben = Wortzeichen akzeptieren. (Richard Ishidas UniView zeigt die "General category" mit an.)
Locale ist aber nicht nur für die Anpassung der CTYPEs da (LC_CTYPE), sondern macht mehr: Datumsformate (LC_TIME, d/m/y, m/d/y oder y/m/d?), Zahlenformate (LC_NUMERIC, 10.000.000 oder 10,000,000 oder 1,00,00,00?), Währungsformate (LC_MONETARY, $-100,00 oder -100,00$ oder 100,00$-?) und Sortierung bzw. Case-Umwandlung (LC_COLLATE, ä als a oder ä als ae oder ä nach z?
Eben. Locales sind gut für alles mögliche, aber nicht dafür, welche Zeichen Buchstaben sind. Das regelt Unicode.
Qapla'
Bildung lässt sich nicht downloaden. (Günther Jauch)