seth: Wortzeichen in regulären Ausdrücken

Beitrag lesen

gudn tach!

Zitat:
\w Word character Ein Buchstabe, eine Ziffer oder der Unterstrich, also [a-zA-Z_0-9] (und evtl. weitere Buchstaben, z. B. Umlaute)

Wie stellt man ein, dass \w Umlaute beinhaltet oder noch allgemeiner, dass auch é, è, ê, also französische Buchstaben, dazugehören?

das liegt an den "locale"-einstellungen.[1] und weil die je nach umgebung mal so und mal so eingestellt sind oder man vergisst, sie einzustellen, empfehle ich, auf \w einfach komplett zu verzichten und stattdessen (entweder striktes [a-z] oder eben) gleich richtiges unicode-gedoens zu verwenden, z.b. \p{L}.[2,3]

[1] vgl. perllocale
[2] vgl. perluniprops
[3] vgl. perlunicode

prost
seth