Sabine: Konvertierung Word nach HTML

Ich hoffe, die Frage ist nicht zu banal, aber ich habe im Archiv keine zufriedenstellende Antwort gefunden...

Ich soll herausfinden, welche (möglichst kostenlosen) Tools eine gute Konvertierung von v.a. Word-Dokumenten nach HTML ermöglichen? Word2000 einfach "speichern unter HTML" kann doch nicht alles sein?

  1. Ich hoffe, die Frage ist nicht zu banal, aber ich habe im Archiv keine zufriedenstellende Antwort gefunden...

    Ich soll herausfinden, welche (möglichst kostenlosen) Tools eine gute Konvertierung von v.a. Word-Dokumenten nach HTML ermöglichen? Word2000 einfach "speichern unter HTML" kann doch nicht alles sein?

    http://www.xwebware.com/products/rtf2html/

    habs mal probiert - ist ganz gut!
    du musst zuerst die Word-Datei als RTF abspeichern

    gruss,
    J.R.

  2. tach Sabine,

    Ich hoffe, die Frage ist nicht zu banal, aber ich habe im Archiv keine zufriedenstellende Antwort gefunden...

    http://www.teamone.de/selfhtml/sfarchiv/1999_4/t08048.htm#a40450 wäre sicherlich ein lesenswerter älterer Beitrag, und wenn du das Archiv mal nach dem Stichwort "Winword" durchforstest, bekommst du immerhin für 1999/2000 17 Suchergebnisse.

    Ich soll herausfinden, welche (möglichst kostenlosen) Tools eine gute Konvertierung von v.a. Word-Dokumenten nach HTML ermöglichen

    ähm  -  darf man fragen, für wen du das "sollst"?

    Word2000 einfach "speichern unter HTML" kann doch nicht alles sein?

    Das ist tatsächlich keine besonders glückliche Idee. Das einfachste ist, erstmal "alles markieren", dann "kopieren", damits in die Zwischenablage kommt, dann den Texteditor (Notepad) öffnen und neues leeres Dokument anlegen, dann in dieses neue leere Dokument den Inhalt der Zwischenablage einfügen. Das neue Dokument erstmal unter irgendeinem Namen wie "ehemaligeworddatei.txt" abspeichern.
    Sinn dieser Übung: alle "winwordspezifischen" Formatierungen sind dadurch erstmal raus und du hast einigermaßen "sauberen" Text. Den kannst du nun leicht in ein leeres HTML-Dokument einfügen.

    Du siehst: du brauchst kein "Tool" zum Konvertieren. Du brauchst lediglich ein paar Mausklicks, das ist alles.

    Christoph S.

    1. Das ist tatsächlich keine besonders glückliche Idee. Das einfachste ist, erstmal "alles markieren", dann "kopieren", damits in die Zwischenablage kommt, dann den Texteditor (Notepad) öffnen und neues leeres Dokument anlegen, dann in dieses neue leere Dokument den Inhalt der Zwischenablage einfügen. Das neue Dokument erstmal unter irgendeinem Namen wie "ehemaligeworddatei.txt" abspeichern.
      Sinn dieser Übung: alle "winwordspezifischen" Formatierungen sind dadurch erstmal raus und du hast einigermaßen "sauberen" Text. Den kannst du nun leicht in ein leeres HTML-Dokument einfügen.

      Du siehst: du brauchst kein "Tool" zum Konvertieren. Du brauchst lediglich ein paar Mausklicks, das ist alles.

      copy & paste ist etwas mühsam bei Dokumenten von hundert oder mehr Seiten. Die Methode kann ja nun nicht der Stand der Technik sein. Und auch das speichern unter HTML und dann den Quellcode bereinigen ist viel zu zeitaufwändig...genau das ist ja das Problem!

      1. Das ist tatsächlich keine besonders glückliche Idee. Das einfachste ist, erstmal "alles markieren", dann "kopieren", damits in die Zwischenablage kommt, dann den Texteditor (Notepad) öffnen und neues leeres Dokument anlegen, dann in dieses neue leere Dokument den Inhalt der Zwischenablage einfügen. Das neue Dokument erstmal unter irgendeinem Namen wie "ehemaligeworddatei.txt" abspeichern.
        Sinn dieser Übung: alle "winwordspezifischen" Formatierungen sind dadurch erstmal raus und du hast einigermaßen "sauberen" Text. Den kannst du nun leicht in ein leeres HTML-Dokument einfügen.

        Du siehst: du brauchst kein "Tool" zum Konvertieren. Du brauchst lediglich ein paar Mausklicks, das ist alles.

        copy & paste ist etwas mühsam bei Dokumenten von hundert oder mehr Seiten. Die Methode kann ja nun nicht der Stand der Technik sein. Und auch das speichern unter HTML und dann den Quellcode bereinigen ist viel zu zeitaufwändig...genau das ist ja das Problem!

        Hi,

        es gibt noch eine "quick & dirty" - Methode. Im Word als HTML speichern und über Dreamweaver den Word-HTML Code optimieren.
        Schnell, unsauber aber brauchbar..

        grüsse,

        Via

        1. Hi,

          es gibt noch eine "quick & dirty" - Methode. Im Word als HTML speichern und über Dreamweaver den Word-HTML Code optimieren.
          Schnell, unsauber aber brauchbar..

          Es gibt das auch noch schneller ;), erst in word abspeichern und dann den Tidy drauf loslassen. Die einstellungen sind fingerspitzengefühl, aber meistens klappts.

          Bye Ed X

      2. hi nochmals,

        copy & paste ist etwas mühsam bei Dokumenten von hundert oder mehr Seiten.

        Wieso ? Wenn du "alles markieren" vorgibst, brauchst du nicht jede einzelne Seite von Hand anzuklicken. Ein Klick genügt

        Die Methode kann ja nun nicht der Stand der Technik sein.

        In diesem Fall doch, wenn du "saubere" Arbeit machen möchtest.

        Und auch das speichern unter HTML und dann den Quellcode bereinigen ist viel zu zeitaufwändig...genau das ist ja das Problem!

        Nö, das Problem ist allenfalls, daß du deine Dokumente nicht gleich in HTML geschrieben hast. Und "bereinigen" müßtest du, wenn du meinem Vorschlag folgen willst, nichts mehr.

        Christoph S.

        1. ich würde sagen, unter HTML speichern und danach dreamweaver
          html-code breinigen lassen... der hat einen word-filter

  3. Hallole,

    also ich mach' das so (wenn's wirklich sein muss):
    1. Speichern als HTML (ja nicht anschauen - würg)
    2. HTML-Tidy (gibt's bei <www.w3c.org>) drüberlaufen lassen mit der speziellen Clean-Funktion für Word-Dokumente.
    Ist eigentlich dann recht vernünftig. Alle Formatierungen sind dann natürlich wech. Aber für die Konvertierung von Tabellen ist das gar nicht so übel. Besser ist natürlich gleich in HTML...

  4. Hallo,

    Ich soll herausfinden, welche (möglichst kostenlosen) Tools eine gute Konvertierung von v.a. Word-Dokumenten nach HTML ermöglichen? Word2000 einfach "speichern unter HTML" kann doch nicht alles sein?

    word zu html ist echt mühsam vor allem wenn du was kostenloses willst.
    ganz kostenlos geht es nicht (vernünftig)

    entweder mit dem MarUpkit
    http://www.schema.de/sitehtml/site-d/htmlexpo.htm

    oder aureleon
    http://www.aureliasystems.com/

    rft zu xml ist schon viel einfacher, da gibt es mittlerweile zahlreichen programme:
    upcast ist sehr gut
    http://www.infinity-loop.de/

    grüße
    Thomas