Scraping mit Python und Ruby
trosk
- sonstiges
Hallo ihr,
ich interessiere mich dafür, Web-Inhalte zwecks Datengewinnung zu scrapen, also vom Einlesen einfacher HTML-Tabellen in eine Datenbank bis hin zu größeren Abfragen wie z.B. Flugdaten auf Flughafen-Websites.
Am besten geht das offenbar mit Python bzw. Ruby. Warum ist das so und warum kann ich nicht irgendeine andere Programmiersprache nehmen?
Welche Tools und Literatur kennt ihr darüber? (z.B. ScraperWiki etc.)
Würde mich sehr freuen, wenn sich schon jemand in dem Thema besser auskennt.
Viele Grüße
trosk
Hi,
ich interessiere mich dafür, Web-Inhalte zwecks Datengewinnung zu scrapen, also vom Einlesen einfacher HTML-Tabellen in eine Datenbank bis hin zu größeren Abfragen wie z.B. Flugdaten auf Flughafen-Websites.
Beachte dabei bitte den rechtlichen Rahmen.
„Frei abrufbar“ heißt nicht automatisch auch beliebig durch Bots/Crawler abgras- und dann womöglich auch noch wiederverwendbar.
Am besten geht das offenbar mit Python bzw. Ruby.
Sagt wer?
Warum ist das so
Musst du den Aufsteller obiger Unsinns-These fragen, nicht uns.
und warum kann ich nicht irgendeine andere Programmiersprache nehmen?
Immer noch unklar, wer das überhaupt behauptet hat/haben soll.
MfG ChrisB
Hi!
ich interessiere mich dafür, Web-Inhalte zwecks Datengewinnung zu scrapen, also vom Einlesen einfacher HTML-Tabellen in eine Datenbank bis hin zu größeren Abfragen wie z.B. Flugdaten auf Flughafen-Websites.
Am besten geht das offenbar mit Python bzw. Ruby. Warum ist das so und warum kann ich nicht irgendeine andere Programmiersprache nehmen?
Du kannst nahezu jede Programmiersprache nehmen. Das Scraperwiki sagt lediglich, dass es selbst Python, Ruby und PHP ausführen kann.
Lo!