Mir macht nur diese "Rohdaten speichern" Propaganda Kopfschmerzen.
Ich pflege Daten zu validieren, bevor ich sie speichere. Ich determiniere Kontext und Sprachoptionen in Input.
rohdaten speichern ist auch nicht unbedingt nötig, man sollte nur ausgabemedienneutral speichern
alles in html zu speichern macht es später nötig bei bedarf in xhtml zu konvertieren
weitestgehend ausgabemedienneutral ist zb die wikisyntax von mediawiki, ob der parser html, xhtml oder latex ausgeben muss, ist ihm ansich egal
leider wird das in der wikipedia nicht konsequent praktiziert und viele infoboxen und vorlagen nutzen hardcodiertes html und arbeiten am parser vorbei - es gibt auch viele artikel in denen hardcodiert "<br />" drinnensteht
jemand der die inhalte weiternutzen möchte (um zb ein buch damit zu drucken, wurde ja bereits gemacht) muss dann erstmal allen html-kram konvertieren, weil eine ggf. vorhandene schnittstelle, die wikisyntax zb in postscript konvertiert, nicht ausreicht um alle für sein medium nicht relevatenten markup-elemente zu entfernen