Hallo,
habe diesen Thread aufmerksam verfolgt, bin aber jetzt etwas durcheinander ob der verschiedenen Aussagen
so verschieden sind die gar nicht. ;-)
Sollte man nun grundsätzlich alles Websiten in UTF-8 abspeichern?
Wenn alle Komponenten, die man verwendet, damit umgehen können, ist das keine schlechte Idee. Dann hat man zumindest dafür gesorgt, dass alle Zeichen eindeutig sind, und man hat eine einheitliche, durchgängige Festlegung, die einem manche Stolperfalle erspart.
Was bedeutet, den charset in den HTTP-Header zu schreiben, könnte ich hierzu bitte ein Beispiel haben?
HTTP verschickt immer Datenblöcke bestehend aus Header und Nutzdaten (wobei in einigen Fällen die Länge der Nutzdaten 0 sein kann). Der Header enthält dabei sowohl technische Angaben über den Datentransfer, wie etwa den Statuscode vom Server, als auch Metainformationen über die folgenden Nutzdaten:
* Art der Daten (Content-Type)
* Zeichencodierung bei textbasierten Formaten
* Länge des Datenblocks (Anzahl der Bytes)
* Transfer-Codierung (z.B. gzip)
* Caching-Informationen
Diese Informationen kann man teilweise durch die Serverkonfiguration beeinflussen; wenn man eine serverseitige Scriptsprache wie z.B. PHP oder Perl verwendet, kann man diese Headerdaten auch komplett selbst erzeugen - wenn man weiß, was man tut.
Unter anderem ist es eben empfehlenswert, bei textbasierten Dokumenten (HTML, Plaintext, CSS, Javascript) auch die verwendete Textcodierung anzugeben. In manchen Fällen ist das sogar die einzige Stelle, an der man diese Information unterbringen kann, denn beispielsweise reine Textdateien haben sonst keine Möglichkeit.
Un d was ist ein BOM?
So long,
Martin
Wenn man keine Ahnung hat - einfach mal Fresse halten.
(Dieter Nuhr, deutscher Kabarettist)
Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(