Tom: Zeichnsatz, RegExp

Beitrag lesen

Hello,

Du willst also alles nach HREF=" weghaben bis zum Leerzeichen nach OLDREF="

==>
/HREF=".*?OLDREF=" /
durch href=" ersetzen.

Oder soll das lexikon/a auch noch weg? Dann halt noch in den match mitreinnehmen.

Das Problem ist, dass der einzig abgesicherte Link in HREF=" ... " drinsteht, aber eben leider oft mit der falschen Codierung. Ich müsste also feststellen, ob dort gültige HTML-Entities drinstehen, die rückkodieren und gegen RawUrlEndode() ersetzen.

Den OLDREF kann ich dann vollständig entfernen.

Was mir noch Schwierigkeiten bereitet, ist festzustellen, ob in der HREF eine HTML-Entität drinsteht oder nicht.

Harzliche Grüße aus http://www.annerschbarrich.de

Tom

--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau