Werden Umlaute korrekt dargestellt
Michael
- html
Hallo zusammen
Ich habe auf Anraten eines Bekannten bei meiner Homepage das charset=ISO-8859-1 eingestellt, da dadurch die Umlaute nicht umcodiert werden müssen.
Ich bin mir jedoch sehr unsicher, wie sich das dann in den Staaten verhält? Wird dort die Seite korrekt dargestellt, ober bekommen amerikanische Surfer beim Betrachten der Seite Probleme, wenn ich die Umlaute ganz normal (ä, ö, ü) reinschreibe?
Vielen Dank für Eure Hilfe
Liebe Grüsse
Michael
echo $begrüßung;
Ich habe auf Anraten eines Bekannten bei meiner Homepage das charset=ISO-8859-1 eingestellt, da dadurch die Umlaute nicht umcodiert werden müssen.
Ich bin mir jedoch sehr unsicher, wie sich das dann in den Staaten verhält? Wird dort die Seite korrekt dargestellt, ober bekommen amerikanische Surfer beim Betrachten der Seite Probleme, wenn ich die Umlaute ganz normal (ä, ö, ü) reinschreibe?
Voraussetzungen für eine korrekte Darstellung der Umlaute ist, dass
1. der Empfänger die verwendete Zeichenkodierung interpretieren kann,
2. die Zeichen tatsächlich gemäß der angegebenen Kodierung kodiert wurden,
3. der Emfänger einen Font hat, der für die darzustellenden Zeichen Glyphen enthält.
Die Staaten sind in der Hinsicht quasi nichts anderes als Westeuropa. 1. sollte bei ISO-8859-1 kein Problem darstellen. Für 2. bist du bzw. dein Editor verantwortlich. Und 3. kannst du nicht beeinflussen, sollte jedoch im Falle ISO-8859-1 kein Problem darstellen.
echo "$verabschiedung $name";
Hello out there!
- der Emfänger einen Font hat, der für die darzustellenden Zeichen Glyphen enthält.
[…] Und 3. kannst du nicht beeinflussen, sollte jedoch im Falle ISO-8859-1 kein Problem darstellen.
3. hat rein gar nichts mit ISO 8859-1 zu tun.
Du verwechselst Zeichensatz und Zeichencodierung.
See ya up the road,
Gunnar
echo $begrüßung;
- der Emfänger einen Font hat, der für die darzustellenden Zeichen Glyphen enthält.
[…] Und 3. kannst du nicht beeinflussen, sollte jedoch im Falle ISO-8859-1 kein Problem darstellen.
- hat rein gar nichts mit ISO 8859-1 zu tun.
Ich meine, dass mit hoher Wahrscheinlichkeit für alle in ISO-8859-1 enthaltenen Zeichen entsprechende Glyphen in den Font-Dateien enthalten sein werden.
Du verwechselst Zeichensatz und Zeichencodierung.
Klär mich doch bitte auf, wo an dieser Stelle mein Irrtum liegt, und inwiefern der Unterschied zwischen Zeichensatz und Zeichenkodierung bei der Darstellung bzw. beim Vorhandensein von Glyphen in Fonts eine Rolle spielt.
echo "$verabschiedung $name";
Hello out there!
Ich meine, dass mit hoher Wahrscheinlichkeit für alle in ISO-8859-1 enthaltenen Zeichen entsprechende Glyphen in den Font-Dateien enthalten sein werden.
Ja, die Zeichen aus dem Bereich Latin-1 Supplement (U+00A0 bis U+00FF) dürften inzwischen den Sprung über den Teich geschafft haben. Ob sie’s auch bis nach Fernost geschafft haben, da wär ich mir nicht so sicher.
Du verwechselst Zeichensatz und Zeichencodierung.
Klär mich doch bitte auf, wo an dieser Stelle mein Irrtum liegt
Du hast den falschen Begriff verwandt.
"Latin-1" statt "ISO-8859-1"* und alles ist gut:
Und 3. kannst du nicht beeinflussen, sollte jedoch im Falle Latin-1 kein Problem darstellen.
See ya up the road,
Gunnar
* wobei dort der erste Bindestrich falsch ist; die Codierung heißt "ISO 8859-1"
Hey,
Ja, die Zeichen aus dem Bereich Latin-1 Supplement (U+00A0 bis U+00FF) dürften inzwischen den Sprung über den Teich geschafft haben. Ob sie’s auch bis nach Fernost geschafft haben, da wär ich mir nicht so sicher.
selbstverständlich. Jedes Betriebssystem/Fontrendering/grafisches Webgedöns hat Unterstützung dafür, wenn nicht sogar Windows-1252. Englisch ist, gerade auch wegen der CJK-Problematik, aus der Computerei als parallel installierte Sprachunterstützung nicht wegzudenken. Und nein, ASCII reicht für Englisch nicht aus.
Hello out there!
Und nein, ASCII reicht für Englisch nicht aus.
?? Warum waren dann jahr(zehnt)elang ausschließlich die Zeichen (U+0020 bis U+007E) auf Computersystemen? Wenn ASCII nicht für Englisch gereicht hätte, hätte es nie diese 7-Bit-Codierung gegeben.
Welche Zeichen aus Latin-1 Supplement vermisst du fürs Englische?
See ya up the road,
Gunnar
Hey,
Warum waren dann jahr(zehnt)elang ausschließlich die Zeichen (U+0020 bis U+007E) auf Computersystemen?
vermutlich: zu wenig Pferdestärke für was anständiges? Schonungsloses Verharren an der Tradition, weil Kompatibilität in der Frühzeit noch viel drastischer eingehalten werden musste als heute?
Wäre mal interessant, einen Historiker an das Thema zu setzen.
Wenn ASCII nicht für Englisch gereicht hätte, hätte es nie diese 7-Bit-Codierung gegeben.
Ich glaube, eher anders herum, 7 Bit waren architekturbedingt vorgegeben und da hat man eben die paar Dutzend nützlichsten reingezwängt, 1 Zeichen pro Byte der Bequemlichkeit für Rechner, Programmierer und Nutzer halber.
Erschöpfend ist es jedenfalls nicht, sondern ein Kompromiss, bei dem akkurate Wiedergabe, Zeichensetzung, Rechtschreibung, sonstige Konventionen und der gute Geschmack leiden.
Welche Zeichen aus Latin-1 Supplement vermisst du fürs Englische?
£ zum Beispiel, oder ï. Ob Lehn-, Fremdwörter, Symbole und Transkriptionen Teil der Sprache sind oder nicht, mögen sich die Experten drüber streiten. Experiment: Ruf mal ein paar Hand voll Seiten aus der englischen Ausgabe von Wikipedia auf, entferne alles, was nicht ISO-646-konform ist, und vergleiche.
Hello out there!
Welche Zeichen aus Latin-1 Supplement vermisst du fürs Englische?
£ zum Beispiel,
Ich hätte sagen sollen: fürs Amerikanische. ;-)
oder ï.
Naïve Frage: Gibt’s noch mehr Wörter außer “naïve” und Ableitungen, wo 'ï' benutzt wird?
See ya up the road,
Gunnar
echo $begrüßung;
Du verwechselst Zeichensatz und Zeichencodierung.
Du hast den falschen Begriff verwandt.
"Latin-1" statt "ISO-8859-1"* und alles ist gut:
Du meinst also, Latin-1 beinhaltet a..z, A..Z, 0..9 usw. usf. Was beinhaltet dann ISO 8859-1? nur die Werte von 0 bis 255?
echo "$verabschiedung $name";
Hello out there!
Du meinst also, Latin-1 beinhaltet a..z, A..Z, 0..9 usw. usf. Was beinhaltet dann ISO 8859-1?
Ich meine, „beinhaltet“ ist das falsche Wort. ISO 8859-1 _codiert_ die Zeichen U+0000 bis U+00FF.
See ya up the road,
Gunnar
Hey,
Ich habe auf Anraten eines Bekannten bei meiner Homepage das charset=ISO-8859-1 eingestellt, da dadurch die Umlaute nicht umcodiert werden müssen.
hast du schon gewusst, dass...
• wenn keine Zeichenkodierung mitgegeben wird, automatisch eine angenommen wird? Bei HTML ist das ISO-8859-1, bei XHTML UTF-8.
• ISO-8859-1 kein Eurosymbol € enthält, und du es wieder maskieren musst?
• ISO-8859-1 durch ISO-8859-15 abgelöst wurde? Dort gibt es das Eurosymbol.
• wegen der Beschränkung auf 8 Bit zu wenig Platz in einem ISO-8859-Zeichensatz für jeweils mehr als nur eine Handvoll Sprachen, geschweige denn Schriftsysteme, ist? Sobald du mehrere Sprachen, die nicht durch genau einen Zeichensatz abgedeckt werden, in einem Dokument vermischen möchtest, musst du wieder anfangen, zu maskieren.
• UTF-8 dank Unicode alle möglichen Zeichen in sich vereinigt, und du dich praktisch nie wieder mit Maskierung herumärgern brauchst, wenn du es benutzt?