Gunnar Bittersmann: HTML mit REGEXP bereinigen

Beitrag lesen

@@Michael_K

Mit JavaScript kannst du einfach diesen Ausdruck verwenden:

/<td [^"\v]*?>/

Kannst du nicht. Der Ausdruck matcht nicht auf <td foo="bar">. Was soll das " in dem Ausdruck überhaupt?

Außerdem matcht er weder auf

<td
foo='bar'>

noch auf <td foo='bar'> (mit Tab); das Leerzeichen nach td ist falsch.

Und was soll an <td[^\v]*?> einfacher sein als an <td[^>]+>?

🖖 Живіть довго і процвітайте

PS: Übrigens versagt das alles, wenn > in einem Attributwert vorkommt.

--
„Im Vergleich mit Elon Musk bei Twitter ist ein Elefant im Porzellanladen eine Ballerina.“
— @Grantscheam auf Twitter