Sinnvolle Auszeichnung "literrarischer" Texte
stefan
- html
Hallo,
ich beschäftige mich momentan mit HTML-Elementen wie <dfn>, <kbd>, <q>, <cite> und wie sie nicht alle heissen. Damit will ich meine Texte sinnvoll auszeichnen und dann mittels CSS einheitlich gestalten. Nun stehe ich jedoch vor einem generellen Problem: HTML scheint vor allem zur Formulierung (programmier-)technischer Texte konstruiert worden zu sein, meine Texte sind jedoch eher privat, berichterstattend oder (im weitesten Sinne) literarisch: Ich schreibe an einem kleinen Online-Tagebuch, Online-Magazin oder auch Weblog.
In Zeitschriften und auch Büchern werden oft bestimmte Texte-Teile optisch ausgezeichnet. Dadurch werden längere Texte schlüssiger und lassen sich einfacher lesen. Speziell drei Darstellungen sind mir aufgefallen: (Die Beispiele sind etwas merkwürdig, verdeutlichen aber vielleicht, worum es mir geht.)
1. Produkt- und Markennamen
Beispiel:
Auf dem diesjährigen HURRICANE FESTIVAL spielten
neben TOCOTRONIC, COLDPLAY und MASSIVE ATTACK auch
RADIOHEAD. Die netten Menschen an den HOLSTEN-Ständen
versorgten das Publikum mit Bier.
Ich habe die Namen zur Hervorhebung grossgeschrieben, aber auch eine Darstellung mit Kapitälchen, einfachen Anführungszeichen, in kursiv oder in fett sehe ich öfters.
2. distanzierende, oft ironisch angehauchte, umgangssprachliche also "sogenannte" Formulierungen
Beispiel:
Die Charaktere in Seifenopern sind entweder »voll gut
drauf« oder - zur Abwechslung - auch mal »total
down«. In diesem Fall kommt dann aber immer ganz
schnell ihre »Clique« vorbei um sie »da rauszuholen«.
Noch ein Beispiel:
Die »Party« entpuppte sich dann als ein dröges
Beieinandersitzen von acht Leuten.
Es handelt sich um ein potentielles Zitat. Man zitert niemanden bestimmtes, aber trotzdem will man die Worte auch nicht selbst verbrochen haben. Gekennzeichnet habe ich die Formulierungen durch Anführungszeichen, aber auch kursive Schrift wäre denkbar.
3. Beschriftungen
Beispiel:
Eins meiner geheimen Laster ist es, FRISCH
GESTRICHEN-Schilder von Zäunen und Parkbänken zu
entwenden.
Wieder eine Art Zitat, wobei hier der Faktor, dass es geschieben steht eine Rolle spielt. Wieder wären auch andere Darstellungen denkbar.
So weit, so gut. Nun habe ich mir mal die HTML-Elemente daraufhin angeschaut:
Das Element <dfn> wird in Selfhtml als "Definition" benannt, das W3C sagt, mit <dfn> ausgezeichneter Text sei "the defining instance of the enclosed term". Ich habe mir überlegt es zum, Auszeichnen von Produkt-und Markennamen zu verwenden. Richtig?
Das Element <q> wird in Selfhtml als "Zitat mit Quellenangabe" bezeichnet, das W3C spricht von "short inline quotation". Wäre es als Auszeichnung für "sogenannte" Formulierungen zu verwenden?
Das Element <cite>: Über die Bedeutung dieses Elements bin ich mir ein bisschen unsicher. Selfhtml spricht von einem "Zitat" oder auch "Zitat von einer anderen Quelle", wärend das W3C <cite> als "a citation or a reference to other sources", also als Referenz oder Quellenangabe zu einem Zitat bezeichnet. Ich vermute, dass das W3C recht hat und Selfhtml an dieser Stelle schwammig formuliert. Weiss jemand genaueres?
Dei Elemente <em> und <strong> dienen ja eigentlich zur Betonung bzw. Hervorhebung von Formulierungen. Kann man etwas durch Betonung auch zurücknehmen, sich also davon distanzieren?
Das Element <kbd> wird in Selfhtml als "Tastatureingabe" definiert, das W3C spricht von "text to be entered by the user". Wäre es zur Auszeichnung von Beschriftetem allgemein denkbar oder wäre das eine Zweckentfremdung?
Das Element <tt> ist eigentlich zur optischen Gestaltung gedacht, in Selfhtml steht "dicktengleich (Tele-Typer)"beim W3C "renders as teletype or monospaced text". Hat <tt> wirklich keinerlei inhaltliche Bedeutung oder verschwimmt hier Form und Sinn, so dass man es zum Auszeichnen von Beschriftungen benutzen könnte?
Das Element <span>: Falls sich keine HTML-Elemente für meine Austzeichnungen anbieten, könnte ich noch mit verschiedenen <span>-Klassen arbeiten. Nur wäre dann die semantische Bedeutung natürlich verloren und ich könnte ebensogut <i>, <tt>, <bold> usw. nehmen. Oder?
So weit meine Überlegungen. Ich freue mich über Tipps und Ideen und alle, die sich das Posting schonmal bis hierhin durchgelesen haben.
schö
stefan
Hallo Stefan,
wenn ich Dein Anliegen richtig verstanden habe, wäre die sauberste Lösung, Du definierst Dir ein eigenes XML Format, dass die gewünschten Elemente enthält, und verwendest XSL statt CSS zur Formatierung. Mit der Methode bist Du flexibel in der Definition Deiner "inhaltlich logischen Formate" und deren Darstellung.
HTML war zwar ursprünglich wohl so gedacht, wie Du es verwenden willst, aber ist eigentlich dafür unbrauchbar, weil zu unflexibel, und weil Semantik und Darstellung untrennbar verknüpft sind, mit XSL umgehst Du das.
Gruss
Marko
Hallo Marko,
wenn ich Dein Anliegen richtig verstanden habe, wäre die sauberste Lösung, Du definierst Dir ein eigenes XML Format, dass die gewünschten Elemente enthält, und verwendest XSL statt CSS zur Formatierung. Mit der Methode bist Du flexibel in der Definition Deiner "inhaltlich logischen Formate" und deren Darstellung.
Das habe ich mir auch schon überlegt, habe mich jedoch noch nicht tiefgehender mit XML beschäftigt. Haben nicht viele Browser (z.B. NS4 und IE) Probleme bei der Darstellung von XML?
schö
stefan
Hi!
Das habe ich mir auch schon überlegt, habe mich jedoch noch nicht tiefgehender mit XML beschäftigt. Haben nicht viele Browser (z.B. NS4 und IE) Probleme bei der Darstellung von XML?
XML kann man per se nicht darstellen. Für eigene XML-Anwendungen ist es sinnvoll, die in XML gespeicherten Daten in ein anderes Format umzuwandeln, für Onlinesachen ist sicherlich XHTML oder SVG sinnvoll, für Print ist PDF angebracht. Solche Transformationen sind aber meist nicht in einem Browser zu erledigen, sondern vor der eigentlichen Publikation auf dem Server oder durch den Server.
Nach dieser Transformation stehst du vielleicht wieder vor dem selben Problem welches du jetztr hast.
Gruß Herbalizer
Hallo Herbalizer,
Nach dieser Transformation stehst du vielleicht wieder vor dem selben Problem welches du jetzt hast.
Wenn das Endprodukt (X)HTML ist, habe ich definitiv das selbe Problem. Hast Du vielleicht andere Ideen?
schö
stefan
Hallo Stefan,
stimmt, Browserseitig geht es nur mit ganz neuen Browsern. Was ich meinte, Du schreibst die Texte in XML mit den logischen Auszeichnungen. Danach führst du die Transformation durch, das geht ganz einfach mit einem kleinen Programm, dem XSL Prozessor.
Am Ende kommt dann z.B. HTML raus, der Vorteil ist, Du hast den Inhalt mit seiner Bedeutung (im XML) vom Aussehen (im XSL definiert) getrennt.
Der Vorteil, du kannst eine Menge Seiten einfach umformatieren, ähnlich wie bei CSS, aber Du bist noch viel flexibler als mit CSS.
Am Frontend hast Du dann halt irgendeine Formatierung z.B. für Zitate. Das erzeugte HTML editierst Du nicht mehr, das ist nur zum "anschauen" und wenn Du was änderst schmießt Du es weg, und generierst alles aus XML neu.
Gruss
Marko
Hallo Marko,
[XML]
Klingt (unabhängig von meiner Frage) nach ner guten Methode. Ich muss mich da mal reinlesen um die Vorteile genauer zu verstehen. Danke.
schö
stefan
hallo marko
[...] Mit der Methode bist Du flexibel in der Definition Deiner "inhaltlich logischen Formate" und deren Darstellung.
naja ... aber auch nur so flexibel, wie es das benutzte darstellungsprogramm zu lässt. will meinen: wenn er einen browser nimmt, dann steht er vor genau dem gleichen problem.
HTML war zwar ursprünglich wohl so gedacht, wie Du es verwenden willst, aber ist eigentlich dafür unbrauchbar, weil zu unflexibel, und weil Semantik und Darstellung untrennbar verknüpft sind, mit XSL umgehst Du das.
?o.o?
Gruss
Marko
cu
ulli
Hi!
Das W3C definiert die generischen Elemente div und span in Verbindung als Mechanismus zusätzliche Struktur in ein Dokument zu bringen http://www.w3.org/TR/html4/struct/global.html#h-7.5.4
Somit beiten sich für deine Zwecke inbesondere span-Elemente mit entsprechenden Klassen an:
- Produkt- und Markennamen
[..]<span class="marke">hurricane</span>[..]
- distanzierende, oft ironisch angehauchte, umgangssprachliche also "sogenannte" Formulierungen
[..]<span class="umgangssprache">voll gut drauf</span>[..]
Es sind eben keine Zitate, denn diese haben immer eine Quelle!
- Beschriftungen
dito. Auch hier gibt es kein Zitat!
Das Element <dfn> wird in Selfhtml als "Definition" benannt, das W3C sagt, mit <dfn> ausgezeichneter Text sei "the defining instance of the enclosed term". Ich habe mir überlegt es zum, Auszeichnen von Produkt-und Markennamen zu verwenden. Richtig?
Ich würde ihn zumindest nicht für Markennamen benutzen, eher für definierte Terme wie Bruttoinlandsprodukt, welche man vielleicht später irgendwo definiert.
Das Element <q> wird in Selfhtml als "Zitat mit Quellenangabe" bezeichnet, das W3C spricht von "short inline quotation". Wäre es als Auszeichnung für "sogenannte" Formulierungen zu verwenden?
Nein. q und blockquote kennzeichnen tatsächliche Zitate.
Das Element <cite>: Über die Bedeutung dieses Elements bin ich mir ein bisschen unsicher. Selfhtml spricht von einem "Zitat" oder auch "Zitat von einer anderen Quelle", wärend das W3C <cite> als "a citation or a reference to other sources", also als Referenz oder Quellenangabe zu einem Zitat bezeichnet. Ich vermute, dass das W3C recht hat und Selfhtml an dieser Stelle schwammig formuliert. Weiss jemand genaueres?
Wenn man sich das Beispiel in http://www.w3.org/TR/html4/struct/text.html#h-9.2.1 ansieht, so soll cite wohl für die Quelle eines Zitates oder auf dieser Quelle beruhender Informationen dienen. Für die eigentliche Auszeichnung eines Zitates sind die Elemente q und blockquote vorgesehen:
<q>Du gehst zu Frauen? Vergiß die Peitsche nicht!<q><cite>[Friedrich Nietzsche, Alao sprach Zarathustra]</cite>
Wie der <cite>HTML4-Spezifikation</cite> zu entnehmen ist, sind die Elemente q und blockquote für die Auszeichnung von Zitaten vorgesehen.
Dei Elemente <em> und <strong> dienen ja eigentlich zur Betonung bzw. Hervorhebung von Formulierungen. Kann man etwas durch Betonung auch zurücknehmen, sich also davon distanzieren?
Keine Ahnung. Im allgemeinen nimmt man sich einer Sache durch betonte Sprache eher an, bzw. versucht das Augenmerk des geneigten Konsumenten oder Dialogpartners auf etwas bestimmtes zu lenken.
Das Element <kbd> wird in Selfhtml als "Tastatureingabe" definiert, das W3C spricht von "text to be entered by the user". Wäre es zur Auszeichnung von Beschriftetem allgemein denkbar oder wäre das eine Zweckentfremdung?
Hier würde ich die Finger von lassen, wenn es sich nicht gerade um Softwaredokumentation handelt:
Geben Sie bitte <kbd>cd c:\foo</kbd> ein um in das Verzeichnis zu wechseln.
Das Element <span>: Falls sich keine HTML-Elemente für meine Austzeichnungen anbieten, könnte ich noch mit verschiedenen <span>-Klassen arbeiten. Nur wäre dann die semantische Bedeutung natürlich verloren und ich könnte ebensogut <i>, <tt>, <bold> usw. nehmen. Oder?
Siehe oben, das span_element kann ein Mechanismus sein, die Struktur eines Dokumenten auszudifferenzieren, und hat mit den anderen von dir genannten Elementen nichts zu tun.
Gruß Herbalizer
Hallo,
Danke für die aufschlussreiche Antwort. Jetzt ist mir vieles klarer :)
schö
stefan
Hallo,
Das W3C definiert die generischen Elemente div und span in Verbindung als
Mechanismus zusätzliche Struktur in ein Dokument zu bringen
Dem würde ich mich auch anschließen. In einer idealen Welt könnte man
sich natürlich wunderbar eigene Elemente definieren und diese über
Namensräume in XHTML einhängen, aber leider müssen wir mit dieser
Realität leben.
Ich würde aber an einigen Stellen das Element <em> benutzen, schließlich
werden die Textstellen hervorgehoben.
- distanzierende, oft ironisch angehauchte, umgangssprachliche also
"sogenannte" Formulierungen
<em class="umgangssprache">voll gut drauf</em>
Denn:
Kann man etwas durch Betonung auch zurücknehmen, sich also davon
distanzieren?
Keine Ahnung. Im allgemeinen nimmt man sich einer Sache durch betonte
Sprache eher an, bzw. versucht das Augenmerk des geneigten Konsumenten
oder Dialogpartners auf etwas bestimmtes zu lenken.
Man betont hier ja die eigene Distanzierung von dem entsprechenden
Begriff.
Hallo Tim,
Ich würde aber an einigen Stellen das Element <em> benutzen,
<em class="umgangssprache">voll gut drauf</em>
Denn:
Man betont hier ja die eigene Distanzierung von dem entsprechenden Begriff.
Stimmt. Ich könnte ja im CSS einfach ".umgangssprache" definieren, also den Element-typ offen lassen um dann im Text von Fall zu Fall flexibel wählen zu können.
schö
stefan