hi Kathrin,
ich weiß, allein die Überschrift ist für viele ein Grund, die Hände über dem Kopf zusammenzuschlagen ;)
Ist nur Beifall ;-)
[...]
Meine 'Lösungen' bzw. Fragen:
1.) Kennt jmd. ein Konvertierungsprogramm, welches akzeptable Ergebnisse hervorbringt ? (Ich denke an rel. einfache Word-Dokumente mit einfachen Tabellen, ein paar Grafiken, Aufzählungen, viel formatierter Text). Das Programm muss natürlich auf einem Linux-System laufen und per Kommandozeile bedienbar sein.
http://www.w3.org/People/Raggett/tidy/ bietet eine Option (Strip Word 2000 Surplus Tags, oder so ähnlich), die den ganzen Schrott aus Word-HTML entfernt. Es gibt unter anderem auch eine Linux-Version. http://perso.club-internet.fr/dpo/rpm/ dürfte auch interessant für Dich sein.
2.) Word speichert die HTML- bzw. Grafikdateien nach einer bestimmten Nomenklatur ab. Es ist einfach nur die Menge, die das ganze unhandlich werden lässt. Könnte man ein Java-Applet schreiben, das den Anwender auffordert, nur die eigentlich HTML-Datei auszuwählen. Die restlichen notwendigen Dateien sucht sich das Applet selbstständig zusammen und lädt sie auf den Server hoch. Das wäre quasi eine kleine 'Upload-Hilfe' nach dem Motto "Zeige mir eine Datei und ich kümmere mich dann um den Rest"
Ich spreche leider nicht Java...
zu Hilfe ! ;)
Tatütata!
Orlando