simon: Lange Wörter rausfiltern

Beitrag lesen

Hallo,

ich würde gerne aus einem HTML-Quellcode lange Wörter rausfiltern. Bisher mache ich das so:

$maxwortlaenge = 30;
$string =~ s/(\S{$maxwortlaenge})\S*/$1<b>...</b>/g;

So ersetze ich alle Wörter die länger als 30 Zeichen sind gegen "<b>...</b>". Mein Problem ist nun das ich auch lange HTML-Tags mitersetze.

Beispiel:
"<a href="laaange30zeichen"> link </a>" wird zu "<a <b>...</b> link </a>" weil "href="laaange30zeichen">" als ein Wort angesehen wird.

Wie kann ich denn Lange Wörter finden, und keine HTML-Befehle?

Vielen Dank im Voraus

  • simon