depp: Text einer Seite validieren

Beitrag lesen

hi
wie schaff ich es, ohne in <a>, <img> <input> oder anderen elementen einer seite herumzupfuschen, alle umlaute und fehlerhaft-darstellbaren (sonder)zeichen valide zu machen? da das problem sicher schon andere vor mir hatten, hoffte ich, etwas zu finden; aber scheinbar suchte ich nach dem falschen.
könnt ihr mir evt. nen guten regexp für solche zwecke oder ne passende funktion nennen?
thx