Gunnar Bittersmann: Zeichen zählen - Problem mit Umlauten

Beitrag lesen

@@molily:

nuqneH

Strings in JavaScript sind echte Ketten von Unicode-Zeichen, sie stellen deutsche Umlaute problemlos in einem Zeichen da.

"ö".length → 1

"ö".length → 2

Problematisch wird das erst mit Zeichen außerhalb des Basic Multilingual Plane von Unicode

Nö, das schon in der BMP problematisch.

Dann ist der Wert von length ggf. inkorrekt.

Was er ggf. schon für Zeichen der BMP ist. Wobei man erstmal definieren müsste, was für "ö" (o U+0308 COMBINING DIAERESIS) denn nun korrekt wäre: 1 oder 2. (Normalisierung)

Qapla'

--
„Talente finden Lösungen, Genies entdecken Probleme.“ (Hans Krailsheimer)