Jörg Reinholz: Wie speichern grosse Internetseiten ihre Bilder

Beitrag lesen

Habe mir als ersten Schritt überlegt, wie ich die Bilder am besten Abspeichere und habe mich
deswegen online auf die Suche gemacht, wie das grössere Seiten wie F`book und co handhaben,
bin aber nicht auf sinnvolle antworten gestossen...

Falls Du abertausende Bilder hast:

Das Bild wird mit Daten (z.B. Deiner Beschreibung) hochgeladen. Vom Origialbild wird ein Hash (.z.B.) mit md5 erzeugt, es wird z.B. im Ordner "/pics/original/" mit dem Name $HASH gespeichert, in weiteren Ordnern als "/pics/$SIZE_XXXX/$HASH" - Für Vorschauen, verschiedene Größen und so weiter. Das bis hierher nur, wenn es das Bild noch nicht gibt. In einer Datenbank landen auf jeden Fall der Hash, der originale Dateiname, die dazu übermittelten Daten, wem das Bild wohl gehört und (in einer Extra-Tabelle) ein "Linkzähler".  Das alles soll verhindern, dass gleiche Bilder mehrfach gespeichert werden. Gelöscht wird, wenn der "Linkzähler" auf Null steht.  Gibts das Bild schon werden nur der Hash, die Daten und der weitere Eigentümer gespeichert und der Linkzähler hochgesetzt.

So kommt es, dass Bilder auf Blogspot.com URLs haben wie:

http://4.bp.blogspot.com/-EIUwocL3nKI/UYztediTkGI/AAAAAAAAGvM/M_qQHqUND7g/s1600/Bildschirmfoto+vom+2013-05-10+14:51:15.png

In der URL finden sich der Hash (wohl nicht MD5...), Angaben zum Eigentümer, die gewünschte Größe und der Original-Dateiname. Weil Google abermillionen Bilder (wenn nicht Milliarden) wohl sogar Angaben zum Datenbankserver der die "Metadaten" hat. "4.bp.blogspot.com" ist eher nur der ausliefernde Webserver.

Was davon Du jetzt nachbaust ist Dir überlassen.

Jörg Reinholz