EisFuX: Range of Characters im UTF-8-Modus (PCRE)

Beitrag lesen

(Hallo|Hi(ho)|Tag) niehztog,

Ich muss irgendwie einen Zeichenbereich ähnlich wie [a-zA-Z0-9_] für sämtliche in UTF8 gültigen Buchstaben bzw. Nicht-Satzzeichen definieren. Das standartmäßige \w reicht in diesem Fall nicht, da z.B. keine Asiatischen/Kyrillischen usw. Buchstaben mit drin sind.

Ich bin dann auf diesen äußerst Hilfreichen Ausdruck gestoßen, der in PHP aber leider wegen der fehlenden Implementierung von \u nicht funktioniert: \u00A1-\uFFFF

In PCRE hättest du das so formulieren müssen '/\x{0a1}-\x{fff}/u', damit es funktioniert. Und der Modifikator /u (Klein-u) signalisiert dir, dass das auch nur im UTF-8-Modus funktioniert. Der entsprechende Hinweis ist tief im PHP-Handbuch vergraben (suche nach "\x{").

Wie kann ich da vorgehen? Oder bin ich da tatsächlich an eine Grenze der PHP4 Implementierung gestoßen?

Nein, zumindest nicht, wenn es sich um PHP-Versionen handelt, die größer oder gleich 4.3 sind.

MffG
EisFuX