Thomas: Unicode oder sprachspezifisches Meta?

Hallo!

Ich kenne vom PC folgendes Phänomen: wenn ich z.B. auf eine chinesische Seite surfe und das zum erstenmal tue, wird mir angeboten ein Sprachpaket mit den entsprechenden Zeichensätzen auf den Rechner downzuloaden und zu installieren.

Muss man dazu in den Metaangaben explizit die verwendete Sprache angeben oder kann man bei allen Unicode UTF-8 schreiben und der Browser weiss dann von selber, welches Paket er laden muss (vielleicht anhand des verwendeten HTML Textes? Und was tun, wenn z.B. auf einer Seite Arabisch und Chinesisch gleichzeitig auftreten?

mfg, Thomas

  1. Hallo,

    wenn ich z.B. auf eine chinesische Seite surfe und das zum erstenmal tue, wird mir angeboten ein Sprachpaket mit den entsprechenden Zeichensätzen auf den Rechner downzuloaden und zu installieren.

    Muss man dazu in den Metaangaben explizit die verwendete Sprache angeben oder kann man bei allen Unicode UTF-8 schreiben und der Browser weiss dann von selber, welches Paket er laden muss (vielleicht anhand des verwendeten HTML Textes? Und was tun, wenn z.B. auf einer Seite Arabisch und Chinesisch gleichzeitig auftreten?

    Soweit ich das beobachtet habe:
    Das Sprachpaket wird installiert, wenn der Browser (MSIE) trifft auf ein Zeichen, das in keiner installierten Schriftart vorkommt. Das Sprachpaket besteht m.W. nur aus Schriftarten mit den fremden Zeichen.

    Die Kodierung des Dokumentes und die Notierweise des Zeichens (Direktkodierung, Entity-Referenz, Zeichenreferenz) ist nicht ausschlaggebend. Ebenso spielen Sprachangaben keine Rolle.

    Wenn gleichzeitig mehrere Zeichen ohne entsprechende Schriftarten auftauchen, wird meiner Erfahrung nach angeboten, alle nötigen Sprachpakete zu installieren.

    Mathias

  2. Hi Thomas,

    Muss man dazu in den Metaangaben explizit die verwendete Sprache angeben

    Die Sprache muss nicht angegeben werden, SOLLTE aber: Die primary language(s) mit der Content-Language-HTTP-EQUIV-Meta-Angabe, die jeweilige text processing language mit dem lang-Attribut (in XHTML 1.0 zusätzlich xml:lang). [HTML-TECH-LANG]

    oder kann man bei allen Unicode UTF-8 schreiben

    Die angegebene Zeichencodierung muss der tatsächlich verwendeten entsprechen, also nicht UTF-8 draufschreiben, wo kein UTF-8 drin ist. (Und Unicode ist ein Zeichensatz, UTF-8 eine Codierung.)

    und der Browser weiss dann von selber, welches Paket er laden muss

    Welchen meinst du: einen Browser[tm] oder den IE? Ich bin mir nicht sicher, ob nicht der IE evtl. benötigte Fonts anhand der Codierung errät.

    Welches Betriebssystem nutzt du? Unter XP dürften schon so ziemlich alle Zeichen vorhanden sein und die Frage der Nachinstallation gar nicht auftreten.

    Live long and prosper,
    Gunnar

    --
    „Weisheit ist nicht das Ergebnis der Schulbildung, sondern des lebenslangen Versuchs, sie zu erwerben.“ (Albert Einstein)