Patrick: Umbrüche, Tabs und multiple Leerzeichen löschen

Beitrag lesen

Moin,

ich lese eine Datei mit HTML-Inhalt aus, lösche mit strip_tags die Tags und ersetze mit ereg_replace Textausschnitte für bessere Lesbarkeit. Der so erhaltene Plaintext wird dann mit entsprechender vordefinierter Syntax in eine wml-Datei (WAP-Seite) geschrieben.

Zwar wird alles korrekt angezeigt, jedoch ist die erhaltene Datei extrem aufgeblasen - Zeilumbrüche (nicht <br>, z.B. /n im Quelltext) und Tabspaces werden im String gespeichert. Wie lautet die Regular Expression oder Funktion, mit welcher ich alles außer dem Text und einzelnen Leerzeichen eliminiere?

Gruß
Patrick