Anita: ASP + HTML in Russisch??

hallo!!
hab eine Frage und zwar, was muss ich machen um mir russische buchstaben in html ausgeben zu lassen.

gibt es keine andere möglichkeit als den zahlencode (z.b.&#1076)
und wie sieht das ganze in der datenbank(acess) aus?

Bitte bitte antwortet mir!!
Danke im voraus

  1. Hi,

    gibt es keine andere möglichkeit als den zahlencode (z.b.&#1076)

    Doch, natürlich. Benutze eine Codierung, die die von Dir benötigten Zeichen direkt enthält.
    Also z.B. iso-8859-5 (IIRC) oder UTF-8

    cu,
    Andreas

    --
    MudGuard? Siehe http://www.Mud-Guard.de/
    Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
    1. Doch, natürlich. Benutze eine Codierung, die die von Dir benötigten Zeichen direkt enthält.
      Also z.B. iso-8859-5 (IIRC) oder UTF-8

      Erst mal Danke für die Antwort!!
      aber, ich kenn mich leider auf dem Gebiet nicht besonders gut aus!

      muss ich das in den meta-tag in charset schreiben oder ....

      mfg Anita

      1. Moin!

        Doch, natürlich. Benutze eine Codierung, die die von Dir benötigten Zeichen direkt enthält.
        Also z.B. iso-8859-5 (IIRC) oder UTF-8

        Erst mal Danke für die Antwort!!
        aber, ich kenn mich leider auf dem Gebiet nicht besonders gut aus!

        muss ich das in den meta-tag in charset schreiben oder ....

        Dort sollte es auch erscheinen. Es hat aber dort nur untergeordnete Bedeutung, entscheidend ist, was der Server im HTTP-Header sendet. Beide Angaben sollten identisch sein und natürlich der verwendeten Zeichencodierung entsprechen.

        Was UTF-8 angeht: Diese Codierung von Unicode verwendet ein bis vier Byte je Unicode-Zeichen, wobei darauf geachtet wurde, dass auch Sortiermaßnahmen ohne UTF-8-Kodierung damit erfolgreich sind. Du kannst einen UTF-8-String also im Prinzip wie einen ganz normalen String behandeln. Wenn du UTF-8 aus einem Formular kriegst, das in die Datenbank speicherst, es dort wieder abrufst und erneut als HTML-Seite ausgibst (mit Zeichensatzangabe UTF-8), ohne irgendwo was dran zu ändern, dann funktioniert das prima.

        Problematisch wird es dann, wenn du in der Datenbank was suchen willst. Variable Begriffe des Besuchers schickt das Formular natürlich auch als UTF-8, also werden die auch in der DB gefunden. Feste Begriffe in deinem Code hingegen wirst du selbst in UTF-8 wandeln müssen, ansonsten findest du nichts.

        Einen Unicode- und UTF-8-fähigen Editor zu verwenden erleichtert die Sache hierbei erheblich. Such mal nach "UniRed", der ist kostenlos. Damit kriegst du im Zweifel alle Strings in UTF-8 gewandelt.

        - Sven Rautenberg

      2. Hi,

        muss ich das in den meta-tag in charset schreiben oder ....

        Nicht nur. Entscheidend ist natürlich, daß auch die im http-header und/oder meta-Element genannte Kodierung tatsächlich verwendet wird.

        cu,
        Andreas

        --
        MudGuard? Siehe http://www.Mud-Guard.de/
        Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
    2. Doch, natürlich. Benutze eine Codierung, die die von Dir benötigten Zeichen direkt enthält.
      Also z.B. iso-8859-5 (IIRC) oder UTF-8

      Hallo noch mal!!
      DANKE!!!
      aber wie funktioniert das ganze mit asp??
      --> bitte um antwort

    3. hallö ins forum,

      Doch, natürlich. Benutze eine Codierung, die die von Dir benötigten Zeichen direkt enthält.
      Also z.B. iso-8859-5 (IIRC) oder UTF-8

      ich brauche kyrillische zeichen oft nur zeilenweise. gibt es dafür ne elegante lösung?

      danke für unterstützung!
      grüße aus Leipzig
      willie

      --
      Wer einen großen Stein aufhebt, zeigt damit an, dass er damit nicht werfen will.
      ss:| zu:} ls:# fo:| de:] va:} ch:? sh:( n4:( rl:° br:> js:| ie:% fl:( mo:}
      http://emmanuel.dammerer.at/selfcode.html
      1. Moin!

        Doch, natürlich. Benutze eine Codierung, die die von Dir benötigten Zeichen direkt enthält.
        Also z.B. iso-8859-5 (IIRC) oder UTF-8
        ich brauche kyrillische zeichen oft nur zeilenweise. gibt es dafür ne elegante lösung?

        Unicode-Entities sind eine tolle Lösung für sowas.

        Ӓ (was auch immer das für ein Zeichen ist - aber so gehts zumindest).

        Aber weil das je Zeichen mindestens 6 Byte (dreistellige Dezimalzahl plus &, # und ;) sind, ist es uneffektiv, wenn man längere Texte hat.

        UTF-8 hat den Vorteil, dass man ALLE Zeichen dieser Welt (naja, zumindest die, die in Unicode drin sind) gleichzeitig verwenden kann.

        ISO-8859-5 bietet, dafür immer als 1-Byte-Zeichen, nur einen Ausschnitt an Zeichen an, und man muß für die Ausgabe anderer Zeichen wieder auf Unicode-Entities zurückgreifen. Besonders problematisch ist es mit Formularen, denn ein eingegebenes Zeichen, was sich nicht mit dem gewünschten Zeichensatz codieren läßt, kann nicht übermittelt werden. Der "gewünschte Zeichensatz" eines Formulars ist dabei von Browser zu Browser auch noch unterschiedlich. Man kann "accept-charset" angeben. Läßt man es weg, gilt oft (hängt vom Browser ab) der Charset des Dokuments. Manche Browser wandeln uncodierbare Zeichen einfach in Unicode-Entities, wobei man diese dann nicht mehr von manuell eingegebenen Unicode-Entities unterscheiden kann. Andere Browser senden ein Fragezeichen. Alle Browser außer Opera senden keinerlei Information über den benutzten Zeichensatz. Aber alle wenden sie zum Glück UTF-8 an, wenn es gewünscht ist - und damit kann man ja alle Zeichen codieren.

        - Sven Rautenberg

        1. hallö,

          Also z.B. iso-8859-5 (IIRC) oder UTF-8
          Unicode-Entities sind eine tolle Lösung für sowas.
          Ӓ (was auch immer das für ein Zeichen ist - aber so gehts zumindest).

          ich vermute dass ich das dann im charset angeben muss. könnt ich ja jetzt schnell mal probieren. geht hier leider nicht. deswegen noch ne frage:
          kann ich dann trotzdem normal - deutsch - schreiben und muss nur die wenigen kyrillischen zeichen codieren?

          ISO-8859-5 bietet, dafür immer als 1-Byte-Zeichen, nur einen Ausschnitt an Zeichen an, und man muß für die Ausgabe anderer Zeichen wieder auf Unicode-Entities zurückgreifen. Besonders problematisch ist es mit Formularen, denn ein eingegebenes Zeichen, was sich nicht mit dem gewünschten Zeichensatz codieren läßt, kann nicht übermittelt werden. Der "gewünschte Zeichensatz" eines Formulars ist dabei von Browser zu Browser auch noch unterschiedlich. Man kann "accept-charset" angeben. Läßt man es weg, gilt oft (hängt vom Browser ab) der Charset des Dokuments. Manche Browser wandeln uncodierbare Zeichen einfach in Unicode-Entities, wobei man diese dann nicht mehr von manuell eingegebenen Unicode-Entities unterscheiden kann. Andere Browser senden ein Fragezeichen. Alle Browser außer Opera senden keinerlei Information über den benutzten Zeichensatz. Aber alle wenden sie zum Glück UTF-8 an, wenn es gewünscht ist - und damit kann man ja alle Zeichen codieren.

          das klingt ja dann doch nach selbst probieren ;-)

          danke für unterstüzung!
          grüße aus Leipzig
          willie

          --
          Die Lage eines Menschen ändern, bessern wollen, heißt, ihm für Schwierigkeiten, in denen er geübt und erfahren ist, andere Schwierigkeiten anbieten, die ihn vielleicht noch ratloser finden. - Rainer Maria Rilke
          ss:| zu:} ls:# fo:| de:] va:} ch:? sh:( n4:( rl:° br:> js:| ie:% fl:( mo:}
          http://emmanuel.dammerer.at/selfcode.html