Unicode, benannte Zeichen
Johannes Weißl
- html
Hallo,
ich frage mich, warum auf einer Seite, die xhtml1.1-konform und im
unicode-zeichensatz ist, nur bestimmte zeichen maskiert werden müssen.
Konkret: Warum muss das "ä", aber nicht das "a" maskiert werden ?!
(Im Validator erzeugen Sonderzeichen in einer UTF-8 Seite eine Fehlermeldung)
Und nochwas:
Sollte das Anführungszeichen (") wirklich auch maskiert werden ?!
Der Validator bemängelt das nämlich nicht ...
Danke im Vorraus,
Johannes Weißl
Hallo Johannes,
ich frage mich, warum auf einer Seite, die xhtml1.1-konform und im
unicode-zeichensatz ist, nur bestimmte zeichen maskiert werden müssen.
Konkret: Warum muss das "ä", aber nicht das "a" maskiert werden ?!
Das 'ä' muss nicht maskiert werden, wenn Du die Datei korrekt als
Unicode-Datei abspeicherst. Dazu benötigst Du einen Editor mit der
entsprechenden Funktionalität. Unter Windows werden die Dateien meist
als windows-1252 und unter UNIX oft als iso-8859-1 abgespeichert.
Du kannst aber auch problemlos XHTML1.1-konforme Dateien schreiben,
die nicht in Unicode verfasst sind:
<?xml version="1.0" encoding="windows-1252"?>
http://selfhtml.teamone.de/xml/regeln/xmldeklaration.htm#zusatzangaben
Sollte das Anführungszeichen (") wirklich auch maskiert werden ?!
AFAIK nur in Attributwerten. Aber es ist sinnvoll, es immer zu
maskieren, da muss man nicht immer daran denken.
Grüße,
Christian
Hallo Christian,
Das 'ä' muss nicht maskiert werden, wenn Du die Datei korrekt als
Unicode-Datei abspeicherst. Dazu benötigst Du einen Editor mit der
entsprechenden Funktionalität. Unter Windows werden die Dateien meist
als windows-1252 und unter UNIX oft als iso-8859-1 abgespeichert.
Danke ... ich hab mein System (Debian) auf UTF-8 umgestellt, und
jetzt funktioniert es auch ohne Maskierung.
Du kannst aber auch problemlos XHTML1.1-konforme Dateien schreiben,
die nicht in Unicode verfasst sind:<?xml version="1.0" encoding="windows-1252"?>
Ich weiß, aber ich bin von der Unicode-Idee irgendwie begeistert
und bin der Ansicht, dass im Internet nur noch dieser
Zeichensatz verwendet werden sollte.
Sollte das Anführungszeichen (") wirklich auch maskiert werden ?!
AFAIK nur in Attributwerten. Aber es ist sinnvoll, es immer zu
maskieren, da muss man nicht immer daran denken.
Werd ich machen.
Danke für die schnelle Antwort,
Johannes Weißl
Hallo Johannes,
Tut mir leid, dass deine Antwort auf Christian
Seiler verschwunden ist. Ich habe gerade ein
Update der Software gemacht :)
ich frage mich, warum auf einer Seite, die
xhtml1.1-konform und im unicode-zeichensatz
ist, nur bestimmte zeichen maskiert werden
müssen.
Was heisst fuer dich 'maskiert'?
(Im Validator erzeugen Sonderzeichen in einer
UTF-8 Seite eine Fehlermeldung)
Dann ist die aller vorraussicht nach doch nicht
im UTF-8-Zeichensatz gespeichert :)
Und nochwas:
Sollte das Anführungszeichen (") wirklich auch
maskiert werden ?! Der Validator bemängelt das
nämlich nicht ...
Es *muss* nur in Attribut-Werten mit "
maskiert werden.
Gruesse,
CK
Hallo Christian,
Tut mir leid, dass deine Antwort auf Christian
Seiler verschwunden ist. Ich habe gerade ein
Update der Software gemacht :)
Macht nichts ... mittlerweile hab ich eh schon auf UTF-8 umgestellt,
was ich in der neuen Fassung meiner Antwort unterbringen konnte.
Was heisst fuer dich 'maskiert'?
hmm ... vielleicht ist "maskieren" das falsche Wort. Ich meine das
ersetzen von Zeichen durch benannte Zeichen oder numerische
Unicode-Notationen.
Dann ist die aller vorraussicht nach doch nicht
im UTF-8-Zeichensatz gespeichert :)
Stimmt ... irgendwie war das mein Denkfehler.
Es *muss* nur in Attribut-Werten mit "
maskiert werden.
Ok ... naja, es bereitet auch nicht soo viel Mühe, es überall zu
maskieren ... dann werd ich das in Zukunft tun.
cu,
Johannes Weißl
Hi,
Und nochwas:
Sollte das Anführungszeichen (") wirklich auch
maskiert werden ?! Der Validator bemängelt das
nämlich nicht ...
Es *muss* nur in Attribut-Werten mit "
maskiert werden.
Und das nur dann, wenn " als Begrenzer des Attribut-Werts benutzt wird.
alt='Ein "netter" Text'
ist zulässig, aber
alt="ein "netter" Text"
muß als
alt="ein "netter" Text"
geschrieben werden.
cu,
Andreas