Jörk Behrends: Text in Wörter aufteilen

Beitrag lesen

Hallo Ihr zwei!

Ich würde folgende Parameter verwenden:
split(/[.:,;?!]*\s+/,$text);

Es wird dann davon ausgegangen, dass niemand ein Satzzeichen ohne Leerzeichen schreibt.   Evtl. kannst du noch alle Anführungszeichen, Gedankenstriche usw. löschen. Falls das nicht genügen sollte, musst du ein Regexp schreiben, der dir alle URL's herausfiltert.

Das mit dem Leerzeichen - bzw. Whitspace, da ja auch Returns dazu gehören - ist bestimmt nicht verkehrt. Bevor man sich aber alle möglichen Sonderzeichen überlegt, kann man wohl auch was mit den Wortgrenzen anfangen: \b. Zwischen den Wortgrenzen dürfen dann nicht-Wortzeichen vorkommen: \W Leerzeichen sind erforderlich: \s

split (/\b\W*\s+\W*\b/, $text);

Viel Spaß,
   Jörk