Thomas J.S.: Suchbegriff gesucht

Beitrag lesen

Hallo,

suchst du http://de.selfhtml.org/html/referenz/zeichen.htm?
Die offiziellen Dokumente sind
Eigentlich ist dies: http://www.iso.org/iso/en/CatalogueDetailPage.CatalogueDetail?CSNUMBER=16387&ICS1=35&ICS2=240&ICS3=30 das offizielle Dokument. ;-)

Hm. Wirklich?

Wenn es um die Character-Entities geht, ist doch der SGML-Standard irrelevant - die können ja für jede SGML-basierte Sprache unterschiedlich festgelegt sein (der SGML-Standard definiert doch nur, wie Entities definiert werden können, aber nicht welche).

Im Annex D "Public Text" sind bereits viele entities "vordefiniert".
Es ist richtig, dass dies keine Vorschrift ist, wie anderen Teiles des Standards, aber eine überaus gute "Empfehlung" (die auch das W3C befolgt *g*).

XML kennt nur ne Handvoll (< > ' " & IIRC), HTML und XHTML kennen wesentlich mehr, weil wesentlich mehr in deren DTDs definiert werden,

Jain. HTML und XHTML nützen ja zum größten Teil diese Entities (ISO 8897) oder wenn es neuere sind dann die ISO 10646 Namen dafür.
Wenn man z.B. die HTMLlat1.ent Datei von HTML 4.01 öffnet, kann man sehr gut sehen aus welche ISO 8879 Entityset eine Entity übernommen wurde.
z.B.
<!ENTITY Auml   CDATA "&#196;" -- latin capital letter A with diaeresis,
                                  U+00C4 ISOlat1 -->

Es gibt eine gute Mapping Übersicht dazu: ftp://ftp.unicode.org/Public/MAPPINGS/VENDORS/MISC/SGML.TXT

und wenn ich selber eine SGML-basierte Sprache erfinde, hab ich es doch in der Hand, wieviele und welche Character Entities ich in meiner eigenen DTD definiere.

Gewiss. Aber es geht ja nicht darum, dass man für "Ä" etwas anderes als &Auml; oder &#196 bzw. &#xC4; definiert ;-)

Grüße
Thomas

--
Surftip: kennen Sie schon Pipolino's Clowntheater?
http://www.clowntheater-pipolino.net/