kyrillische buchstaben als fragezeichen??
robertosh
- html
Hallo,
<br><br>
LINK: <a href="http://www.robertdrews.com/russ/practice.html" target="_blank">http://www.robertdrews.com/russ/practice.html</a><br><br>
hier sollten eigentlich anstatt der Fragezeichen kyrillische Buchstaben erscheinen?!? warum geht das nicht?! Dreamweaver empfiehlt mir ständig beim abspeichern auf UTF-8 umzustellen, aber dabei wird nur mein Eingabe-Code angezeigt, aber nicht in kyrillisch umgewandelt. Was mache ich falsch??<br><br>
Danke
Hallo,
LINK: http://www.robertdrews.com/russ/practice.html
hier sollten eigentlich anstatt der Fragezeichen kyrillische Buchstaben erscheinen?!? warum geht das nicht?!
Dann hast du den Text offensichtlich aus einem anderen Programm kopiert, denn z.B. die Meta-Angaben und der Titel erschienen richtig mit den russischen Buchstaben.
Grüße
Thomas
und wie kann ich den Fehler dann korrigieren?? vielen dank!
Hallo,
und wie kann ich den Fehler dann korrigieren?? vielen dank!
Keine Ahnung. Ich weiss ja nicht woher du deine Texte hast.
Grüße
Thomas
Auch aus einem HTML-Dokument. Aber wenn ich den Text aus den Quellcode des Dokuments in den Code meines Dokuments reinkopiere, schreit Dreamweaver, ich solle man UTF-8 ausprobieren, was nichts bringt.. und egal was ich mache, es sieht so aus?!
Auch aus einem HTML-Dokument.
robertosh,
In welcher Zeichencodierung ist dieses Dokument?
Vielleicht hat Dreamweaver Probleme, Text aus einer anders codiertern Datei einzufügen.
(Ich kenne mich aus guten Gründen mit diesem „Hilfsmittel“ nicht aus.)
schreit Dreamweaver, ich solle man UTF-8 ausprobieren, was nichts bringt..
Was heißt „nichts bringt“?
Was passiert, wenn du dein Dokument in UTF-8 codierst und das natürlich auch angibst:
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
(Mit etwas Glück macht dein Server nicht noch eine andere Angabe.)
Live long and prosper,
Gunnar
Dann hast du den Text offensichtlich aus einem anderen Programm kopiert, denn z.B. die Meta-Angaben und der Titel erschienen richtig mit den russischen Buchstaben.
Nö, Thomas, nicht ganz ;-)
<meta name="author" content="Кристины Мартенс">
^
muss heißen:
<meta name="author" content="Кристина Мартенс">
^
Der Genitiv ist an der Stelle unpassend.
Ebenso in den keywords; wobei die Frage im Raum steht, wozu die gut sein sollen.
Und wenn alles russisch, warum dann nicht Любек?
Live long and prosper,
Gunnar
robertosh,
Die Seite ist übrigens für Nutzer und nichtmenschliche Clients ohne Bildanzeige unbrauchbar.
Das alt-Attribut der image-Elemente dient nicht dazu, "image" hineinzuschreiben, sondern sinnvollen Text, der angezeigt wird, wenn das Bild nicht angezeigt wird. Alternativtext eben.
Live long and prosper,
Gunnar
Hi,
Ich dachte immer, Clients waeren generell nichtmenschlich, und die Menschen säßen - wenn sie nicht grade Kaffepause machen - davor?
;-)
Gruesse, Joachim
Hi,
warum geht das nicht?!
Was genau machst Du denn?
Was passiert wenn Du russischen Text bei Google etc. kopierst und in Dein Dokument einfuegst? Fragezeichen oder russisch? In welchem Format speicherst Du anschliessend Dein Dokument? Nutzt Du ein extra FTP-Programm, um die Dateien auf den Server zu schieben? Stelle auch hier sicher, dass das Format erhalten bleibt.
Deine Datei wird vom Server als KOI8-R ausgeliefert. Kann Dein Rechner diesen Zeichensatz ueberhaupt? Kann dieser Zeichensatz auch deutsche Umlaute, wie sie in "Lübeck" (Keywords) vorkommen?
Gruesse, Joachim
Nutzt Du ein extra FTP-Programm, um die Dateien auf den Server zu schieben? Stelle auch hier sicher, dass das Format erhalten bleibt.
Joachim,
Ein FTP-Programm ändert AFAIK nur die Zeilenumbruchzeichen, sonst nichts.
Deine Datei wird vom Server als KOI8-R ausgeliefert. Kann Dein Rechner diesen Zeichensatz ueberhaupt?
Was hat _sein_ _Rechner_ damit zu tun? Der _Browser_ muss die Codierung können. Und ob _seiner_ das kann, ist für mich völlig irrelevant.
Mein Browser kann KOI8-R und zeigt haufenweise '?' an, ganz einfach deshalb, weil im Quelltext haufenweise '?' (3F) drinstehen.
Kann dieser Zeichensatz auch deutsche Umlaute, wie sie in "Lübeck" (Keywords) vorkommen?
Nein, im Quelltext kommt kein 'ü' vor, sondern '&', 'u', 'u', 'm', 'l', ';'. Diese Zeichen lassen sich wohl mit KOI8-R codieren.
Live long and prosper,
Gunnar
Hi,
Joachim,
Ein FTP-Programm ändert AFAIK nur die Zeilenumbruchzeichen, sonst nichts.
Das ist definitiv _falsch_. Wie kuerzlich berichtet bin ich vor kurzem im FTP-Programm Fetch (Mac) ueber eine Option "Translate ISO-characters" gestolpert, die meine Unix-formatierten, UTF-8-kodierten Files als ISO-Latin Files auf dem Server abgelegt hat. Deaktivieren brachte sofortige Abhilfe.
Was hat _sein_ _Rechner_ damit zu tun? Der _Browser_ muss die Codierung können. Und ob _seiner_ das kann, ist für mich völlig irrelevant.
Wie kann man denn z.B. UTF-8 kodierte Dateien herstellen, wenn der Rechner keinen entsprechenden Zeichensatz hat oder das Programm gar nicht Unicode-faehig ist (wie afaik z.B. Homesite 4.5)?
Mein Browser kann KOI8-R und zeigt haufenweise '?' an, ganz einfach deshalb, weil im Quelltext haufenweise '?' (3F) drinstehen.
Aber warum stehen die drinne? Ich denke, weil er die Datei eben nicht in dieser Kodierung abspeichern konnte. Nebenbei bemerkt: BBEdit am Mac bietet unter anderem auch KOI8-R beim Abspeichern an.
Nein, im Quelltext kommt kein 'ü' vor,
In den Keywords stand Lübeck mit "ü"...
Gruesse, Joachim
Hi Joachim,
ich [bin] vor kurzem im FTP-Programm Fetch (Mac) ueber eine Option "Translate ISO-characters" gestolpert,
Hm, was „FTP-Programme“ so alles machen, was mit FTP überhaupt nichts zu tun hat …
Wie kann man denn z.B. UTF-8 kodierte Dateien herstellen, wenn der Rechner keinen entsprechenden Zeichensatz hat oder das Programm gar nicht Unicode-faehig ist (wie afaik z.B. Homesite 4.5)?
Die Codierung hat mit Zeichensatz oder in einer Schriftart enthaltenen Zeichen gar nichts zu tun. _Rechner_ kennen keinen Zeichensatz, die kennen Folgen von Oktetts (Bytewerte). Diese werden von _Programmen_ (da zähl ich jetzt mal das Betriebssystem auch dazu) bei Bedarf als Zeichen interprätiert.
Welche Oktettfolge dabei für welches Zeichen steht, bestimmt die Zeichencodierung. Das Oktett C3 steht in ISO 8859-1 für das Zeichen 'Ã', BC für '¼'; die Oktettfolge C3 BC steht also für 'ü'. Dieselbe Oktettfolge steht in UTF-8 für 'ü'.
Wenn ich also 'ü' in ein Dokument schreibe und das in ISO 8859-1 codiert speichere, aber später einem Programm mitteile, das Dokument wäre in UTF-8 codiert, zeigt dieses 'ü' an. Bequem ist das freilich nicht; ist schon besser, man verwendet für ein Dokument beim Speichern und Laden dieselbe Codierung, um wieder dieselben Zeichen zu erhalten.
Mit Unicode-Fähigkeiten hat die Codierung wiederum nichts zu tun. Der Editor Textpad z.B. ist nicht Unicode-fähig, sondern beherrscht nur 256 Zeichen; welche das sind, kann man ihm sagen: alle in ISO 8859-1 codierbaren oder alle in ISO 8859-2 codierbaren oder … (Analog zum GIF-Format mit seinen max. 256 Farben umfassenden Paletten, wobei jedes Bild eine andere Palette haben kann.) Dennoch kann ich mit Textpad problemlos Dateien in UTF-8 codiert speichern.
Aber warum stehen die ['?'] drinne?
Genau das ist die Frage, die es zu klären gilt.
Ich denke, weil er die Datei eben nicht in dieser Kodierung abspeichern konnte.
Aber das konnte er doch. Sonst wären ja die kyrillischen Zeichen in title und den Meta-Angaben auch nicht da.
Nein, im Quelltext kommt kein 'ü' vor,
In den Keywords stand Lübeck mit "ü"...
Wann? 2006-02-02T14:20+01:00 stand da
<meta name="keywords" content="Зубоврачебный кабинет,врач-стоматолог,Lübeck,Кристины Мартенс, […]">
(Und Кристина (Christina) immer noch im Genitiv.)
Live long and prosper,
Gunnar
Hi Gunnar,
Hm, was „FTP-Programme“ so alles machen, was mit FTP überhaupt nichts zu tun hat …
in diesem Falle ein wirklich eher fragwuerdiges Feature, vor allem ohne Warnung...
Wenn ich also 'ü' in ein Dokument schreibe und das in ISO 8859-1 codiert speichere, aber später einem Programm mitteile, das Dokument wäre in UTF-8 codiert, zeigt dieses 'ü' an.
Hmm, wenn ich russischen Text im Homesite 4.5 in eine Datei kopiere sehe ich nur Fragezeichen. Textedit stellt mir den einkopierten Text korrekt dar. Oeffne ich hingegen mit Textedit die zuvor mit Homesite abgespeicherte ????-Datei sehe ich nur Müll. Von daher gehen doch hier anscheinend auch die "Oktettfolge" verloren...?
Aber das konnte er doch. Sonst wären ja die kyrillischen Zeichen in title und den Meta-Angaben auch nicht da.
Wohl wahr...
Nein, im Quelltext kommt kein 'ü' vor,
auch wahr, ich habeversehendlich unter Seiteninfo geschaut...
Live long and prosper,
geb mir Mühe, Du auch...
Gruesse, Joachim
Hmm, wenn ich russischen Text im Homesite 4.5 in eine Datei kopiere sehe ich nur Fragezeichen.
Ginge mir auch so, wenn ich solchen Text in Textpad einfügen wollte. Homesite ist anscheinend nicht Unicode-fähig und wandelt ihm unbekannte Zeichen in '?' um.
So ein Problem könnte auch der OP haben, wenn Dreamweaver mit dem Text aus der anderen HTML-Datei nichts anfangen kann (evtl. wegen anderer Codierung).
Nein, im Quelltext kommt kein 'ü' vor,
auch wahr, ich habeversehendlich unter Seiteninfo geschaut...
:-)
Es _konnte_ ja gar kein 'ü' sein, da sich das in KOI8-R gar nicht codieren lässt. Der Oktettwert FC, der in ISO 8859-1 für 'ü' steht, steht in KOI8-R für 'Э'. Э wie Это правда.
Live long and prosper,
Gunnar