Hallo Alexander,
Dieser Ansatz ist also generell kaputt, für "passend" konfigurierte Webserver kann er "zufällig" funktionieren.
offensichtlich hast du nicht erkannnt, daß der Fragesteller ein spezielles Problem hat. Er möchte keine Suchmaschine programmieren.
Und um HTML zu parsen, sind Regular Expressions absolut nicht geeignet.
Er will wohl auch kein HTML parsen, sondern ein paar Bilder, die einem speziellen Muster entsprechen herausfiltern. Der zu parsende Code dürfte aus einer überschaubaren Quelle stammen.
Natürlich sind reguläre Ausdrücke hier durchaus effizient.
Schöne Grüße,
Jonny 5
Moin Moin!
Mal so am Rande: Eine URL, die auf .gif, .jpg oder .png endet, muß nicht notwendigerweise ein Bild liefern. Umgekehrt können auch URLs, die .gif/.jpg/.png gar nicht enthalten, durchaus Bilder liefern. Darüber hinaus kann es einen deutlichen Unterschied machen, ob eine .gif/.jpg/.png-URL mit oder ohne Query-String aufgerufen wird.
Dieser Ansatz ist also generell kaputt, für "passend" konfigurierte Webserver kann er "zufällig" funktionieren.
Und um HTML zu parsen, sind Regular Expressions absolut nicht geeignet. Der saubere Ansatz wäre also, einen HTML-Parser zu benutzen, die IMG-Tags herauszufischen und die Werte ihrer src-Attribute zu ermitteln. Je nach weiterer Verwendung müßtest Du dann ggf. noch überprüfen, ob der Attributwert eine gültige URL ist und die URL ggf. in eine absolute URL umwandeln.
Alexander