(Hallo|Hi(ho)|Tag) niehztog,
Ich muss irgendwie einen Zeichenbereich ähnlich wie [a-zA-Z0-9_] für sämtliche in UTF8 gültigen Buchstaben bzw. Nicht-Satzzeichen definieren. Das standartmäßige \w reicht in diesem Fall nicht, da z.B. keine Asiatischen/Kyrillischen usw. Buchstaben mit drin sind.
Ich bin dann auf diesen äußerst Hilfreichen Ausdruck gestoßen, der in PHP aber leider wegen der fehlenden Implementierung von \u nicht funktioniert: \u00A1-\uFFFF
In PCRE hättest du das so formulieren müssen '/\x{0a1}-\x{fff}/u', damit es funktioniert. Und der Modifikator /u (Klein-u) signalisiert dir, dass das auch nur im UTF-8-Modus funktioniert. Der entsprechende Hinweis ist tief im PHP-Handbuch vergraben (suche nach "\x{").
Wie kann ich da vorgehen? Oder bin ich da tatsächlich an eine Grenze der PHP4 Implementierung gestoßen?
Nein, zumindest nicht, wenn es sich um PHP-Versionen handelt, die größer oder gleich 4.3 sind.
MffG
EisFuX