Joerg: HTML Code bereinigen mittels regulärem Ausdruck

Beitrag lesen

Hi,

zurzeit kämpfe ich mit dem Problem, HTML Code zu bereinigen. Speziell von Word 2000 erzeugten überflüssigen Attributen.

Beispiel:
<TD style="PADDING-RIGHT: 5.4pt; BACKGROUND-POSITION: 0% 0%; PADDING-LEFT: 5.4pt; BACKGROUND-ATTACHMENT: scroll; BACKGROUND-IMAGE: none; PADDING-BOTTOM: 0cm; WIDTH: 85.2pt; PADDING-TOP: 0cm; BACKGROUND-REPEAT: repeat; mso-shading: white; mso-pattern: solid navy" vAlign=top width=114>

Es dürfen hierbei nur die 'mso-' Attribute entfenrt werden.

Für einen regulären Ausdruck, der das schafft, wäre ich sehr dankbar.

Gruß
Jörg