trosk: Scraping mit Python und Ruby

Hallo ihr,

ich interessiere mich dafür, Web-Inhalte zwecks Datengewinnung zu scrapen, also vom Einlesen einfacher HTML-Tabellen in eine Datenbank bis hin zu größeren Abfragen wie z.B. Flugdaten auf Flughafen-Websites.

Am besten geht das offenbar mit Python bzw. Ruby. Warum ist das so und warum kann ich nicht irgendeine andere Programmiersprache nehmen?

Welche Tools und Literatur kennt ihr darüber? (z.B. ScraperWiki etc.)

Würde mich sehr freuen, wenn sich schon jemand in dem Thema besser auskennt.

Viele Grüße
trosk

  1. Hi,

    ich interessiere mich dafür, Web-Inhalte zwecks Datengewinnung zu scrapen, also vom Einlesen einfacher HTML-Tabellen in eine Datenbank bis hin zu größeren Abfragen wie z.B. Flugdaten auf Flughafen-Websites.

    Beachte dabei bitte den rechtlichen Rahmen.
    „Frei abrufbar“ heißt nicht automatisch auch beliebig durch Bots/Crawler abgras- und dann womöglich auch noch wiederverwendbar.

    Am besten geht das offenbar mit Python bzw. Ruby.

    Sagt wer?

    Warum ist das so

    Musst du den Aufsteller obiger Unsinns-These fragen, nicht uns.

    und warum kann ich nicht irgendeine andere Programmiersprache nehmen?

    Immer noch unklar, wer das überhaupt behauptet hat/haben soll.

    MfG ChrisB

    --
    RGB is totally confusing - I mean, at least #C0FFEE should be brown, right?
  2. Hi!

    ich interessiere mich dafür, Web-Inhalte zwecks Datengewinnung zu scrapen, also vom Einlesen einfacher HTML-Tabellen in eine Datenbank bis hin zu größeren Abfragen wie z.B. Flugdaten auf Flughafen-Websites.
    Am besten geht das offenbar mit Python bzw. Ruby. Warum ist das so und warum kann ich nicht irgendeine andere Programmiersprache nehmen?

    Du kannst nahezu jede Programmiersprache nehmen. Das Scraperwiki sagt lediglich, dass es selbst Python, Ruby und PHP ausführen kann.

    Lo!