Alexander (HH): [REGEX (schon wieder)] BilD url erkennen

Beitrag lesen

Moin Moin!

Mal so am Rande: Eine URL, die auf .gif, .jpg oder .png endet, muß nicht notwendigerweise ein Bild liefern. Umgekehrt können auch URLs, die .gif/.jpg/.png gar nicht enthalten, durchaus Bilder liefern. Darüber hinaus kann es einen deutlichen Unterschied machen, ob eine .gif/.jpg/.png-URL mit oder ohne Query-String aufgerufen wird.

Dieser Ansatz ist also generell kaputt, für "passend" konfigurierte Webserver kann er "zufällig" funktionieren.

Und um HTML zu parsen, sind Regular Expressions absolut nicht geeignet. Der saubere Ansatz wäre also, einen HTML-Parser zu benutzen, die IMG-Tags herauszufischen und die Werte ihrer src-Attribute zu ermitteln. Je nach weiterer Verwendung müßtest Du dann ggf. noch überprüfen, ob der Attributwert eine gültige URL ist und die URL ggf. in eine absolute URL umwandeln.

Alexander

--
Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so".