hi Rolf,
wenn Silbentrennung nicht erforderlich ist, reicht es doch, den Text am Leerzeichen zu splitten (explode). Das Ergebnis ist ein Array mit Wörtern und da geht auch bei einer UTF-8-Kodierung nichts kaputt.
$satz = "Ein Bär, im Wald lebend, verfügt über ein Vermögen von 2.5 €.";
$words = explode(" ", $satz);
Für die Ausgabe kann dann beliebig gruppiert werden. MfG