OKOK ich bin schon fast am Ziel..
Ich habe nun nur noch das Problem, dass die HTML dateien die durchsucht werden sollen keine klare Zeichenkodierung gesetzt bekommen haben (<meta HTTP-EQUIV="content-type" CONTENT="text/html; charset=UTF-8">
), da Sie im Projekt selbst immer nur Inkludiert werden.
Ich habe folgendes probiert:
Variante A)
$content = utf8_encode(htmlspecialchars(strip_tags(file_get_contents($file))));
Das führt aber dazu, dass Exclusive Sonderzeichen wie zB das "•"-Zeichen wieder verkorkzt werden zu [Kann ich nicht Posten („discouraged character“), ein Viereck mit zwei nullen oben und einer 95 unten]. öäü Funktioniert - Warum ist das so?
Variante B)
$content = htmlspecialchars(strip_tags(file_get_contents($file)));
So bekomme ich gar keine Sonderzeichen angezeigt (also weder noch)
Versuch)
$charset = '<meta HTTP-EQUIV="content-type" CONTENT="text/html; charset=UTF-8">';
$content = $charset.htmlspecialchars(strip_tags(file_get_contents($file)));
Ich dachte: Da Variante B funktioniert wenn die Zeichenkodierung im Dokument gesetzt wurde, dann könnte das vll auch klappen :-) Aber das ergebnis ist das selbe wie bei Variante B
Frage)
Warum zickt file-get-contents() in meinem Fall eigentlich so rum?
Ich nutze EasyEclipse for PHP und habe alles auf UTF-8 gesetzt sowohl im Projekt selbst als auch im Dokument via
<?php header("Content-Type: text/html; charset=UTF-8"); ?>
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<meta HTTP-EQUIV="content-type" CONTENT="text/html; charset=UTF-8">
Also wie kann ich das noch lösen?
Danke
Ölapalöma