guido: named entities+unicode in html notation nach utf8

hallo,

habe folgendes zeichnenkonvertierungsproblem und hoffe, dass mir jemand von euch weiter helfen kann:
ich möchte named entities (zb © ü) und numerische character references (dezimal/hexadezimal) (zb α α) nach utf8 umwandeln.

habe schon mehere möglichkeiten ausprobiert, die nicht geklappt haben, und zwar:

- mit xslt: named entities werden nicht umgesetzt

- mit perl: decode_entities($a); perl 5.8. sollte automatisch nach utf8 umsetzen, macht es aber nur nach latin1

- mit php: html_entity_decode; konvertiert auch nicht nach utf8, obwohl explizit angegeben

kann mir einer weiter helfen? wäre sehr dankbar.

viele grüße
guido

  1. Hallo,

    habe folgendes zeichnenkonvertierungsproblem und hoffe, dass mir jemand von euch weiter helfen kann:
    ich möchte named entities (zb © ü) und numerische character references (dezimal/hexadezimal) (zb α α) nach utf8 umwandeln.

    habe schon mehere möglichkeiten ausprobiert, die nicht geklappt haben, und zwar:

    • mit xslt: named entities werden nicht umgesetzt

    XSL kennt wie XML von Haus aus nur vier "named entities" < > " '.
    Die anderen sind wie du schon gesagt hast HTML-Entities.
    Für XML und Co. gibt es für diese aber schon fertige Ersetzungstabellen bzw. DTd's (oder *.ent als Entitireferencen).
    Du kannst sie dann in der DOCTPYE angabe in deinem XML angeben. Dann verstehen sie auch die (validierenden!) XML-Parser.

    Bei den beiden anderen Sachen kann ich dir nicht weiterhelfen.

    Grüße
    Thomas

    1. vielen dank thomas, das hört sich interessant an. kannst du einen tipp geben, wo man solche fertigen dtd's findet, die neben den named entities auch die numerischen (dezimal/hexa..) nach utf8 umsetzen können?

      viele grüße
      guido

      1. http://www.w3.org/2003/entities/