Wowbagger: XML vs. proprietärer parser

Beitrag lesen

Hi leute,

für ein content-management-system auf PHP/MySQL basis stellt sich mir das problem, daß benutzer zwar in der lage sein müssen,  formatierten text hochzuladen, allerdings HTML nicht zulässig ist.
Also habe ich mir überlegt, den upload zu filtern (schmeiße alle HTML-tags 'raus), einen proprietären parser zu schreiben (PHP-basis) und eigene formatierungsbefehle im dokument zu interpretieren (was weis ich, die üblichen dinge wie schriftart- u. größe, hyperlinks, wo sollen bilder hin, allg. einfache textformatierungen...), also sowas wie z.b. {befehl:parameter}text, was im grunde sehr gut funkt (der parser ist schon 90%ig fertig).

Nun las ich durch zufall 'mal wieder etwas über das thema XML und dachte mir: wenn du XML dateien zum upload akzeptierst, welche einer von dir festgelegten DTD genügen, kannst du doch auch sicherlich daraus mit hilfe von XLS und CSS ganz gewöhnlichen, formatierten HTML-code erzeugen, nicht wahr?!
Nun ist es aber so, daß ich von der kette XML-->DTD-->XLS-->HTML keinen allzu guten überblick habe, also bestimmte fragen gar nicht beurteilen kann. Z.B.:

* welcher vorteil entsteht mir gegenüber meinem PHP-parser, gerade auch in bezug auf zeit- und arbeitsaufwand sowie erweiterbarkeit und wartungsaufwand bei änderungen oder ergänzungen?

* ich möchte nur bestimmte HTML-tags zulassen, deren syntax sich nicht einmal ändern muß (z.b. <b>), wenn ich nun eine DTD schreibe, in der ich die gewünschten tags aufnehme und andere zusätzliche proprietäre und wieder andere HTML-tags eben weglasse, erfüllt das meine erwartungen? Werden auch wirklich nur die tags interpretiert, die auch definiert wurden? Wie fange ich z.b. dann fehler ab, wenn im XML dokument tags benutzt werden, die meine DTD nicht kennt?

Wo kann man sich evtl. einmal ein tutorial ziehen, in dem etwas ähnliches wie das, was ich vor habe behandelt wird?

euer (etwas ratloser) Wowbagger
/*,*/