Stefan Muenz: chinesische WebSite

Beitrag lesen

Hallo Thomas

Können die übersetzten Textpassagen aus einem chinesischen Word-Dokument übernommen werden?
Was ist auf den HTML-Seiten zu beachten?

Mal frisch kopiert aus dem Quelltext einer chinesischen Seite - um mal nicht nur von Unicode zu reden, sondern direkt ein Beispiel aus der Praxis zu nehmen:

<p>
ííííÎ‗═Ýú¼╔¤║ú╣·╝╩╗ßÊÚÍðð─Á─©Þ╔¨ËÙ╗Âðª╗Ò│╔┴╦Ê╗ã¼╗Â└ÍÁ─║úоíú└·╩▒úÂ╠ýíó▓╬╝Ë╚╦╩²ÎßÂÓíó╣µ─ú╬¬└·¢ýÍ«ÎßÁ─Á┌░╦¢ý╔¤║úÁþ╩Ë¢┌È┌ıÔ└´¥┘ðð┴╦╩ó┤¾Á─í░░Î˱└╝¢▒í▒╣·╝╩Áþ╩Ë¢┌─┐░õ¢▒¶▀▒ı─╗╩¢íú└┤ÎÈú╣©÷╣·╝ÊÁ─ú▒ú░╬╗╣·╝╩ã└╬»ÂÈú▒úÁ▓┐Áþ╩Ë¥þ║═ú▓ú┤▓┐╝Ã┬╝ã¼¢°ðð┴╦ÎßÍıã└╔¾ú¼ú▒úÁ▓┐Áþ╩Ë¢┌─┐╗±Á├┴╦í░░Î˱└╝¢▒í▒Á─ú▒ú┤©÷¢▒¤ßíú
</p>

Aha. Und in den Meta-Daten der entsprechenden Seite:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">

Genaueres zum Zeichensatz GB_2312 kann ich dir nicht sagen. Ich vermute aber, es handelt sich, wie bei Zeichensaetzen der fernoestlichen Sprachen ueblich, um einen Zweibyte-Zeichensatz. Jeweils zwei im Nutztext notierte Zeichen bilden von ihrem Zeichenwert her ein chinesisches Zeichen. Natuerlich ist der Zeichensalat, der da oben zu sehen ist, nur die Entsprechung dieser Zeichenwerte in der hier verwendeten Schriftart. Wenn man einen Editor verwendet, der den entsprechenden Zeichensatz unterstuetzt, kann man auch direkt die entsprechenden Zeichen eingeben (kennen muss man sie natuerlich *g*, und wissen, wie man sie eingibt, ebenfalls).

Der Browser braucht dann natuerlich noch die Moeglichkeit, das alles anzuzeigen.

Wie sieht es mit JavaScript aus?
alert()-Meldungen und tw. Seitenaufbau mit document.write()

document.write() schreibt ja HTML-Text, und es gelten die gleichen Regeln wie zuvor, also wie bei HTML. alert() ist allerdings uebel. Es gibt meines Wissens in JavaScript keine Konvention, um bei Funktionen, die Dialogboxen aufrufen, anzugeben, welchen Zeichensatz man verwenden moechte. Das liegt wohl daran, dass Dialogboxen eine Ressource des Betriebssystems sind. Wenn der User also z.B. ein deutsches Windows installiert hat und die uebliche Sans-Serif- oder Tahoma-Schrift fuer "3D-Elemente" eingestellt hat, dann sehe ich da schwarz. Da muesste man mal gucken, welchen Default-Zeichensatz z.B. die Standardschrift, die beim chinesischen Windows fuer solche Elemente eingestellt ist, verwendet. Und dann koennte man versuchen, diesen Zeichensatz mit einem aehnlichen Zeichensalat wie oben gezeigt zu bedienen.

Ein Teil der Site wird über ein Redaktionssystem aus einer Access Datenbank erstellt. Lassen sich in einer MS Access DB auch chinesische Begriffe speichern??

Weiss ich zwar nicht. Aber Office 2000 unterstützt Unicode und kommt ja auch mit Schriftarten daher, die das ganze Unicode-System abdecken, also sollte auch Access das koennen.

viele Gruesse
  Stefan Muenz