Gunnar Bittersmann: RegEx in JavaScript

Beitrag lesen

@@Camping_RIDER

Nach wie vor ist außerdem RegEx vor allem ein Programmierwerkzeug - und Programmierung erfolgt nun mal (das kann man gutfinden oder auch nicht - ich finds gut) vordergründig auf Grundlage der englischen Sprache und dem dieser zugrundeliegenden Basiszeichensatz ASCII.

Reguläre Ausdrücke (besser gesagt: Suchmuster) sind ein Werkzeug der Stringverarbeitung, um Muster in Zeichenketten zu finden. Und Inhalte von Zeichenketten können aus beliebigen Sprachen kommen.

Außerdem ist der ASCII-Zeichensatz zur Notation der englischen Sprache auch nicht ausreichend.

Jede andere Lösung wäre - gerade vor dem Hintergrund unterschiedlicher Zeichenkodierungen - sehr komplex umzusetzen und wird wohl auch nicht sehr oft gebraucht.

Die Zeichencodierung sollte da nicht reinspielen – die spielt eine Rolle, wenn ein Dokument gespeichert, übertragen und eingelesen wird. Wenn das Script läuft, ist das längst gegessen.

So sollte es sein. Bei Astral-Zeichen sieht das anders aus. JavaScript has a Unicode problem.

LLAP 🖖

--
„Wir haben deinen numidischen Schreiber aufgegriffen, o Syndicus.“
„Hat auf dem Forum herumgelungert …“
(Wachen in Asterix 36: Der Papyrus des Cäsar)