Andreas: Komplette Webseite auf Festplatte speichern

Hallo,

ich suche ein Tool mit dessen Hilfe ich eine komplette Webseite auf meiner Festplatte speichern kann, um diese dann anschließend offline anzuschauen.

Hierzu eine paar Fragen:

1.)
Wie läuft das eigentlich mit Webseiten die Passwortgeschützte Bereiche besitzen? Muß ich mich wenn ich die Webseite offline benutze genauso einlogggen?

2.)
Wie schaut das mit serverseitigen Elementen wie z.B. PHP, Servlets oder JSP's aus? Können diese auch irgendwie heruntergeladen werden, so das ich die Webseite komplett offline nutzen kann?

3.)
Welche Tool könnt ihr mir empfehlen?

  1. Hi,

    ich suche ein Tool mit dessen Hilfe ich eine komplette Webseite auf meiner Festplatte speichern kann, um diese dann anschließend offline anzuschauen.

    das ist je nachdem wie weit deine Anforderungen gehen, einfach bis unmöglich.
    Einzelne Seiten kannst du ja schon im Browser mit all ihren Inhalten speichern. Aber du meintest wahrscheinlich nicht "Seite", sondern "Site". Es gibt Tools wie HTTrack, die das können - naja, mehr oder weniger gut jedenfalls.

    Wie läuft das eigentlich mit Webseiten die Passwortgeschützte Bereiche besitzen? Muß ich mich wenn ich die Webseite offline benutze genauso einlogggen?

    Nein, diese Bereiche kann das verwendete Tool dann auch nicht lesen, die fehlen dir dann in der Kopie einfach. Oder das Programm bietet die Möglichkeit, die Zugangsdaten für HTTP-AUTH beim Aufruf anzugeben, so dass es diese Zugangsdaten beim Download selbständig mitsendet.
    Keinesfalls hat die lokale Kopie nachher noch ein Login, denn das erfordert immer eine Kommunikation zwischen Client und Server, und den Server hast du ja nun ausgeklammert.

    Wie schaut das mit serverseitigen Elementen wie z.B. PHP, Servlets oder JSP's aus? Können diese auch irgendwie heruntergeladen werden, so das ich die Webseite komplett offline nutzen kann?

    Nein. Du kriegst nur den HTML-Output dieser Elemente, so wie es ein gewöhnlicher Browser auch sieht. Auch hier: Das ist Programmcode, der auf dem Server ausgeführt wird. Kein Server, kein PHP (oder ähnliches).

    So long,
     Martin

    --
    Zwei Mäuse treiben's miteinander. Sagt der Mäuserich: "Hoffentlich ist nicht wieder alles für die Katz."
    1. Konkret geht es um eine Seite zu der ich die Zugangsdaten besitze. Nun ist es so, dass ich die Zugangsdaten nurnoch diesen Monat besitzen werden. Ich würde mir also gerne die Passwortgeschützten Bereiche lokal auf meinem Rechner speichern. Geht das mit httrack oder muss ich dazu ein andere Tool verwenden?

      Es wäre nett, wenn ihr mir ein kleines Beispiel geben könntet.

      1. Hi,

        Ich würde mir also gerne die Passwortgeschützten Bereiche lokal auf meinem Rechner speichern. Geht das mit httrack oder muss ich dazu ein andere Tool verwenden?

        das kommt darauf an, wie der Passwortschutz realisiert ist.

        Wenn es -wie ich im ersten Posting schon angedeutet habe- tatsächlich HTTP-Authentication ist, dann ist das mit HTTrack möglich. Die Doku zum Programm gibt an, dass man für diesen Fall die Notation
         http://user:passwd@example.org/
        verwenden kann. Diese Notation wird, obwohl ausdrücklich in HTTP nicht standardisiert, auch von einigen Browsern akzeptiert.

        Wenn es aber ein richtiges Login ist, wirst du mit HTTrack wahrscheinlich Pech haben, da das Programm dann ein korrekt ausgefülltes Formular senden müsste. Ich wüsste nicht, wie das geht.

        Es wäre nett, wenn ihr mir ein kleines Beispiel geben könntet.

        Lesen bildet.

        So long,
         Martin

        --
        Kleine Geschenke erhalten die Freundschaft.
        Große verderben sie aber meist auch nicht.
        1. Hallo Martin,

          Wenn es aber ein richtiges Login ist, wirst du mit HTTrack wahrscheinlich Pech haben, da das Programm dann ein korrekt ausgefülltes Formular senden müsste. Ich wüsste nicht, wie das geht.

          Das Formular kann man ja selbst im Browser ausfüllen, man muss ja nicht alle Requests mit dem selben Client ausführen. Man muss dann nur noch dafür sorgen, dass irgendwelche Session-Information verwendet wird.
          Session-Information steht üblicherweise entweder in URL-Parametern oder in Cookies. Ersteres ist der einfachere Fall, dann kann man direkt diese URL für HTTrack verwenden. Mit Cookies ist es etwas schwieriger, erstmal würde ich versuchen, Cookies im Browser abzuschalten und auszuprobieren, ob ein Login auch ohne Cookies möglich ist. Wenn nicht, muss man eben das entsprechende Cookie mitschicken. Ich kenne HTTrack nicht aber das unter Linux übliche wget kann sowas z.B.

          Grüße

          Daniel