hi,
Das Ganze dreht sich darum, dass mittels PHP preg_match() diverse Header von diversen Webseiten ausgelesen werden. Leider weiß man am Anfang nie, in welcher Kodierung die Seiten vorgehalten werden.
Das steht im Response-Header Content-Type.
Und dann weiß man als nächstes leider auch nicht, ob die Angaben des Servers (http-Header) zu denen des Inhaltes ("meta http-equiv" und weitere) und dann auch zur tatsächlichen Kodierung des Inhaltes passen.
Ich würde die Daten betreff Kodierung so verarbeiten und ggf. auch Speichern, wie es im gesendeten Content-Type deklariert ist. Wie ich hier schon vor ein paar Jahren mal gezeigt habe, ist es problemlos möglich, in eine Seite, die UTF-8-kodiert ausgeliefert wurde, per Ajax ISO-8859-1 kodierte Texte einzubauen. Beispiel ist der Golem-Feed auf meiner Site. MfG