seth: regex problem

Beitrag lesen

gudn tach!

iow: gib das korrekte encoding im head an.
ähm, encoding?

na utf8-, latin-I und so, siehe http://de.selfhtml.org/html/kopfdaten/meta.htm#zeichenkodierung.

naja, er soll in der nachricht:

Betreff   Das ist der Betreff
Gesprächspartner  YYYYY
»1« [2] [3]
Tonda  am 15.01.09 um 15:24 Uhr
das ist die zweite antwortx
YYYYY  am 15.01.09 um 15:16 Uhr
das ist die erste antworty

den betreff und den gesprächspartner raussuchen (das klappt schon)
dann soll er alles von tonda (also im match, dem wort, das vor dem datum steht) bis antwortx (also dem wort, das vor dem wort vor dem datum kommt) im array unter einem namen speichern, dann alles von YYYYY bist antworty unternem andren namen.

ah, ok. da ist aber schon ein grundsaetzliches problem vorhanden, wenn jemand in einer nachricht sowas schreibt wie "foo am 01.01.01 um 00:00". denn wie erkennst du dann, ob es zur nachricht gehoert oder eine meta-information ist?

angenommen, du wuerdest das noch in den griff bekommen, schlage ich die nutzung von "split" vor:

  
 var nachrichten_re = /(.*\s+(?:am\s\d\d\.\d\d\.\d\d|heute)\sum\s\d\d:\d\d\sUhr\n)/i;  
 var nachrichten = feld.split(nachrichten_re);

"nachrichten" waere dann ein array mit allen nachrichten und deren urhebern.

prost
seth