pl: Regulärer Ausdruck mit [[:cntrl:]] erfasst chinesische Zeichen

Beitrag lesen

Tach!

Ich würde hier nicht mit Reg.Ausdrücken arbeiten sondern mit Codepoints bzw. Codepoint-Bereichen.

Warum würdest du das tun?

Weil es einfacher ist mit Zahlen zu operieren als mit Reg.Ausdrücken.

Ich dachte mir schon, dass du an so etwas denkst. Aber ich kann mir noch nicht vorstellen, wie das aussehen soll. Deswegen habe ich ja noch zwei weitere Fragen gestellt, die du geflissentlich ignoriert hast. Wie also soll die einfachere Lösung aussehen, also einfacher als ein einzeiliger preg_match()-Aufruf mit Unicode character properties als Suchmuster?

Deine Fragen hab ich alle beantwortet. Wie ich das machen würde, zeigt mein Tool und hier ist eine entsprechende Library, die Du auch gerne erweitern kannst. Somit kann dem Benutzer ganz konkret hingewiesen werden, an welcher Stelle er ein unerwünschtes Zeichen eingegeben hat und welches Zeichen das ist. Im Übrigen legt das Unicode-Konsortium auch Namen für Zeichen fest, bei einer Fehlermeldung würde ich auch den Namen ausgeben.

Mit einer Zeile preg_match() kriegst Du solch Komfort nicht hin.

MfG