EisFuX: Umbrüche, Tabs und multiple Leerzeichen löschen

Beitrag lesen

Nabend Patrick,

ich lese eine Datei mit HTML-Inhalt aus, lösche mit strip_tags die Tags und ersetze mit ereg_replace Textausschnitte für bessere Lesbarkeit. Der so erhaltene Plaintext wird dann mit entsprechender vordefinierter Syntax in eine wml-Datei (WAP-Seite) geschrieben.

Zwar wird alles korrekt angezeigt, jedoch ist die erhaltene Datei extrem aufgeblasen - Zeilumbrüche (nicht <br>, z.B. /n im Quelltext) und Tabspaces werden im String gespeichert. Wie lautet die Regular Expression oder Funktion, mit welcher ich alles außer dem Text und einzelnen Leerzeichen eliminiere?

Wenn du dich dazu durchringen könntest, statt ereg_replace() preg_replace() zu verwenden, dann wäre der  Platzhalter  \s für alle üblichen Whitespace-Zeichen eine Lösung für dich:

$neu = preg_replace('/\s+/', ' ', $alt)

MffG
EisFuX

--
Auch meine Hosenträger sind intelligent, in dem Sinne, dass man sie regulieren kann. Sie besitzen ein adaptives Verhalten.
Stanisław Lem