pl: iso8859-1 -> utf-8

Beitrag lesen

Sicher. Der OP hat aber zu verstehen gegeben, dass aus einer heterogenen Masse aus Fremdseiten crawlen und normalisieren möchte. In dem Kontext ist "Das steht im Response-Header Content-Type." falsch.

Ja und was machen wir denn da wenn es der Header nicht hergibt? Genau: Wir treffen eine bestimmte Annahme und prüfen ob die richtig ist! Das heißt für die Praxis, dass das was der Header hergibt so oder so eine Annahme ist die wir zunächst und grundsätzlich immer treffen müssen wenn wir überhaupt weiterkommen wollen.

Das hat was damit zu tun, dass Informationen von Drittanbietern als nicht vertraulich einzustufen sind. Von daher ist es unsinnig, vor dem Speichern solcher Daten eine Umkodierung vorzunehmen.

Aber wahrscheinlich musst Du solche Erfahrungen ersteinmal selber machen.

MfG