Reguläre Ausdrücke und HTML Unicode-Darstellung von ChrisB, 25.07.2008 00:37

Reguläre Ausdrücke und HTML Unicode-Darstellung

Marc T. 24.07.2008 09:51

javascript

Hallo!

Ich habe einige Strings der aus normalen Buchstaben, aber auch aus Unicode-Characters in der HTML Notation besten kann (z.B. 动).

Gibt es eine Möglichkeit mit Hilfe von regulären Audrücken in Javascript herauszufinden ob dieser HTML-Unicode einen bestimmten Bereich liegt?

Zum Beispiel zwischen 一 und 鿃, was alle Chinesischen Zeichen sind.

Vielen Dank schon einmal im voraus!

Beitrag melden

– Informationen zu den Bewertungsregeln

Reguläre Ausdrücke und HTML Unicode-Darstellung
Fabian 24.07.2008 10:02

javascript
– Informationen zu den Bewertungsregeln
Hallo,

Warum möchtest Du das mit regulären Audrücken machen? Mit Sicherheit geht es, das größte Problem dürfte sein, dass die Stellen ja unterschiedliche Zeichen beinhalten dürfen, je nach vorrangegangen. So darf die letzte Stelle beispielsweise ein F sein, aber nur, wenn die vorherigen nicht 9FC sind.

Mein Vorschlag wäre es eher, Zahl zu parsen: Du schneidest mit String.substr oder slice die Zahl raus und parst sie dann mit ParseInt. Diese Zahl kannst Du dann ja ganz einfach vergleichen:

var strVal = String("一").substr(3, 4);
var num = parseInt(strVal, 16);

Ob es ein benanntes Entity ist oder so eine Darstellung, kannst Du nun wieder relativ einfach prüfen.
Beitrag melden

–
Informationen zu den Bewertungsregeln
1. Reguläre Ausdrücke und HTML Unicode-Darstellung
  
  Marc T. 24.07.2008 10:46
  
  javascript
  – Informationen zu den Bewertungsregeln
  Danke für den Tip!
  Das wäre bestimmt auch eine Möglichkeit.
  
  Der Grund warum ich an reguläre Ausdrücke gedacht habe, ist aus wegen der Performance-Geschwindingkeit. Das Ganze soll nämlich auf sehr langsamen Maschinen laufen (Einen Prozessor mit 200MHz bzw 800MHz). Und da es ein paar mehr Strings sind, könnte parseInt die Sache etwas verlangsamen.
  
  Aber ich schau mal wie das klappt :)
  Besten Dank nochmal!
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
2. Reguläre Ausdrücke und HTML Unicode-Darstellung
  
  Gunnar Bittersmann Homepage des Autors 24.07.2008 12:55
  
  javascript
  – Informationen zu den Bewertungsregeln
  @@Fabian:
  
  Mit Sicherheit geht es, das größte Problem dürfte sein, dass die Stellen ja unterschiedliche Zeichen beinhalten dürfen, je nach vorrangegangen. So darf die letzte Stelle beispielsweise ein F sein, aber nur, wenn die vorherigen nicht 9FC sind.
  
  Nein, Denkfehlter. Der reguläre Ausdruck beackert nicht den String wie er im HTML-Quelltext steht, sondern den mit den aufgelösten Zeichenreferenzen, s.a. https://forum.selfhtml.org/?t=174265&m=1144848
  
  Live long and prosper,
  Gunnar
  
  --
  Erwebsregel 208: Manchmal ist das einzige, was gefährlicher als eine Frage ist, eine Antwort.
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum
  1. Reguläre Ausdrücke und HTML Unicode-Darstellung
    
    Fabian 24.07.2008 13:22
    
    javascript
    
    – Informationen zu den Bewertungsregeln
    Stimmt, da hatte ich wirklich einen dicken Denkfehler. Danke für die Korrektur.
    Beitrag melden
    
    –
    Informationen zu den Bewertungsregeln
    
    Übersicht
    
    alle Foren
    
    SELFHTML-Forum
    
    anmelden
    
    Benutzerkonto erstellen
    
    Beitrag im Thread-Baum
3. Reguläre Ausdrücke und HTML Unicode-Darstellung
  
  ChrisB 25.07.2008 00:37
  
  javascript
  – Informationen zu den Bewertungsregeln
  Hi,
  
  Mein Vorschlag wäre es eher, Zahl zu parsen: Du schneidest mit String.substr oder slice die Zahl raus und parst sie dann mit ParseInt.
  
  Auch umstaendlich. String.charCodeAt() "liefert die Nummer eines Zeichens in der Unicode-Codetabelle zurück, das in einer Zeichenkette an einer bestimmten Position steht."
  
  MfG ChrisB
  
  --
  "The Internet: Technological marvel of marvels - but if you don't know *what* you're lookin' for on the Internet, it is nothing but a time-sucking vortex from hell."
  Beitrag melden
  
  –
  Informationen zu den Bewertungsregeln
  Übersicht
  
  alle Foren
  
  SELFHTML-Forum
  
  anmelden
  
  Benutzerkonto erstellen
  
  Beitrag im Thread-Baum

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Marc T.: Reguläre Ausdrücke und HTML Unicode-Darstellung

Reguläre Ausdrücke und HTML Unicode-Darstellung

Reguläre Ausdrücke und HTML Unicode-Darstellung

Reguläre Ausdrücke und HTML Unicode-Darstellung

Reguläre Ausdrücke und HTML Unicode-Darstellung

Reguläre Ausdrücke und HTML Unicode-Darstellung

Reguläre Ausdrücke und HTML Unicode-Darstellung

Reguläre Ausdrücke und HTML Unicode-Darstellung