ello: Portable HTML

ich bin in den unendlichen weiten des internets zufällig über folgenden link gestoßen:
http://www.fabiankeil.de/pdf-sucks.html

ich habe schon oft mit pdf arbeiten müssen, weil es einfach gang und gebe ist. die seite hat recht wenn sie sagt das pdf ein "Datengrab" ist. ebenso wie Word oder Excel obwohl bei letzten schon bei der eingabe minderwertige (nicht semantisch, sondern visuell) daten einegeben werden müssen.

was spricht dagegen solche formate nicht auf html bzw. xml basieren zu lassen?

Excel seine tabellen in html form speichern würde, könnte man sie schonmal mit jedem beliebigen browser ansehen.

habt ihr schonmal eine pdf in HTML konvertiert? für jede zeile eines fließtextes wird ein extra DIV angelegt, welches absolut ausgerichtet wird.
das selbe passiert auch wenn man ein pdf mit illustrator öffnet, und einen text verändern will. sämtliche texte, sind teilweise sogar einzelne worte, sind zerhackt, und gelten fortan nichtmehr als einheitlicher text.

html ist ein etablierter logisch augebauter standart. warum kann man soetwas nicht auf html basis machen?

natürlich kann man mit html einige formatierungen nicht machen die man für printlayouts braucht.

der große hacken an html ist für portable dokumente, liegt darin, das jedes benutzte bild, jede benutzte font usw irgentwo in der nähe der html mitgespeichert werden muss.

was haltet ihr von einem format, das nichts weiter als eine art .raw-archiv ist, von mir aus mit dem kürzel .phtml. darin befindet sich das selbe wie eine statische html seite. also, bilder, fonts, unterseiten. im haubtverzeichniss des archivs liegt ebenfalls eine index.html. diese wird vom browser automatisch aufgerufen, wenn dieser die .phtml öffnen will. man kann innerhalb der datei sämtliche unterseiten verlinken, die sich ebenfalls im archiv befinden.

so ein format könnte man das pdf format, als datengrab aus dem netz verdrängen.

was haltet ihr davon?

  1. Hallo,

    natürlich kann man mit html einige formatierungen nicht machen die man für printlayouts braucht.

    Das ist das Hauptproblem, ist das doch oft wichtig. Plus: Teilmengen von PDF sind international normierte Standards, HTML ist zu viel im flux. Soweit ich weiß kann auch PDF eine innere Logik haben. Dass diese nicht hervorscheint, wenn das PDF automatisch in ein anderes Datenformat transformiert wird, dürfte klar sein.

    was haltet ihr von einem format, das nichts weiter als eine art .raw-archiv ist, von mir aus mit dem kürzel .phtml. darin befindet sich das selbe wie eine statische html seite. also, bilder, fonts, unterseiten.

    Im schon länger existierenden MHTML sind alle Dateien in einer Datei vereint. Firefox - so lernte ich gestern - beherrscht auch Web-Ressourcen in JAR-Archiven.

    Tim

    1. Im schon länger existierenden MHTML sind alle Dateien in einer Datei vereint. Firefox - so lernte ich gestern - beherrscht auch Web-Ressourcen in JAR-Archiven.

      interessant, wie erstellt man so eine Datei?

      1. habe die antword selbst gefunden, sie lautet "Unmht"

        http://www.unmht.org/en_index.html