Hanna: Interessehalber: Word erzeugt seltsamen Tag...

Guten Tag, alle zusammen!

Ich habe da mal 'ne ?dumme? Frage: Ich bekomme jede Woche eine MS Word Datei für eine Aktualisierung...wenn ich jetzt alle Fromatierungen entferne und "cutte und paste" bekomme ich immernoch jede Menge seltsamster <span>'s mit dubiosen Inhalten, aber, und jetzt kommt meine Frage, ich erhalte auch immer einen Tag

<o:p></o:p>

Es ist ja kein Problem diese zu entfernen, aber kann mir mal einer sagen, ob dieser Tag eine HTML-Relevanz hat oder ist das einfach nur Word-Stoffwechselendprodukt? Ich habe nirgends etwas ähnliches gefunden.

Tät mich mal interessieren tun.

Danke für die Aufklärung, Hanna

  1. <o:p></o:p>

    Es ist ja kein Problem diese zu entfernen, aber kann mir mal einer sagen, ob dieser Tag eine HTML-Relevanz hat oder ist das einfach nur Word-Stoffwechselendprodukt? Ich habe nirgends etwas ähnliches gefunden.

    Noe, das ist bloss ein Test Deines Auftraggerbers, ob Du in den HTML- Quelltext reinschaust- ist doch ein super Smiley! Aber eine Relevanz uerfte der nicht haben (wobei- bewirkt der irgendwas in Word? Ich meine- woanders wird er nichtds bewirken, aber was passiert mit dem in Word?).

    1. »(wobei- bewirkt der irgendwas in Word? Ich meine- woanders wird er nichtds bewirken, aber was passiert mit dem in Word?).

      Das ist ja genau die Frage die ich mir immer gestellt habe...

    2. Hallo

      Das ist die Word-eigene Art, seinen Text "auszuzeichnen". Word ist im Grunde ja auch bloss eine Mark-Up language, wie HTML.

      Wenn man z.b. ein stinknormales Wort in Word schreibt und es in den HTML-Editor deiner Wahl einfügst wird es mit

      <span style="font-size:12.0pt;font-family:"Times New Roman";
      mso-fareast-font-family:"Times New Roman";mso-ansi-language:DE;mso-fareast-language:
      DE;mso-bidi-language:AR-SA">Wort</span>

      formatiert. Ist ja ganz witzig, aber wenn man lange/viele Texte von Word in html transformieren soll, dann kriegt man da schnell einen Auszucker, denn da steht dann vor jedem verd...ten strich oder Punkt diese elendslange Wurst von unnützen Informationen. Stören tuts jedenfalls nicht, kommt aber blöd, wenn sich jemand deinen Quelltext ansieht, und du hast die ganzen Word-Tags drinnen.

      Ich bin zwar kein XML-Profi, aber für mich schreit das geradezu nach XML-Einsatz und zwar der hirnkrankesten Sorte!

      Schöne Grüsse
      Bernhard

      1. formatiert. Ist ja ganz witzig, aber wenn man lange/viele Texte von Word in html transformieren soll, dann kriegt man da schnell einen Auszucker, denn da steht dann vor jedem verd...ten strich oder Punkt diese elendslange Wurst von unnützen Informationen. Stören tuts jedenfalls nicht, kommt aber blöd, wenn sich jemand deinen Quelltext ansieht, und du hast die ganzen Word-Tags drinnen.

        Ja und ausserdem bläht sich die Datei unglaublich auf und wird total unübersichtlich.

        Danke

        1. Hallo Hanna,

          formatiert. Ist ja ganz witzig, aber wenn man lange/viele Texte von Word in html transformieren soll, dann kriegt man da schnell einen Auszucker, denn da steht dann vor jedem verd...ten strich oder Punkt diese elendslange Wurst von unnützen Informationen. Stören tuts jedenfalls nicht, kommt aber blöd, wenn sich jemand deinen Quelltext ansieht, und du hast die ganzen Word-Tags drinnen.

          Ja und ausserdem bläht sich die Datei unglaublich auf und wird total unübersichtlich.

          Versuch's mal mit HTML-Tidy hat mich schon manchmal sehr v i e l weiter gebracht. Aus einer Excel-Tabelle mit 75k, nach HTML Export. Wurde ein wunderbar schlankes 10k Modell, mit verwendung dieses Tools http://www.w3.org/People/Raggett/tidy/.

          jens müller

  2. Moin

    <o:p></o:p>

    Das ist IMHO der Namensraum, den MS-Anwendungen für sich deklarieren. "o" für officeweit mögliche Tags "w" für wordeigene Tags. Tags ohne eigenen Namensraum (also ohne o: oder w:) sollen IMHO HTML 4.0 benutzen.

    Viele Grüße

    Swen