Deus Figendi: Daten aus fremden Seiten auslesen

Beitrag lesen

ich möchte von einer seite alle daten auslesen die sich zb zwischen <h1><strong> und </strong></h1> befinden. Wie bekomme ich das hin?
Als erstes holst du dir die Erlaubnis des Betreibers dieser Seite.

Entschuldige ChrisB, aber wozu? Seit wann ist eine explizite Erlaubnis nötig um öffentlich zugängliche Daten zu _lesen_?
Um mal zwei simple Beispiele zu nennen:
Ich vermute du fragst den Autor einer Internetpräsenz auch nicht ob du diese ansurfen darfst bevor du dies tust.
Und um automatische Systeme zu berücksichtigen:
Suchmaschinen fragen auch nicht ob sie Seiten indizieren dürfen, es muss ihnen explizit verboten werden. (okay, das kann man auch unter "fragen" verstehen).

Wenn es um Re-Publikation geht, dann hast du wahrscheinlich recht, da sollte man nachfragen und wenn es nur der Höflichkeit halber ist (darum gibt es ja Streit in welchem Rahmen man das darf). Aber beim reinen Auslesen (z.B. zu statistischen Zwecken) sehe ich da eigentlich kein Hindernis.

--
sh:( fo:| ch:? rl:( br:& n4:& ie:{ mo:} va:) de:µ_de:] zu:) fl:( ss:| ls:[ js:(