Moin!
Wie kommst du darauf, dass der Leser den Textanfang nicht findet? Vielleicht interessiert er sich nur für einen Abschnitt oder gar nur einen Satz?
Mag sein. Dann aber muß ihn irgendetwas drauf gebracht haben, dass nur ein Abschnitt oder ein Satz interessant war. Wenn dann darin eine nicht erklärte Abkürzung auftaucht, die weiter oben im linearen Textablauf des Dokuments erklärt wurde, dann wird der Leser das mit Sicherheit finden. Gerade deshalb spricht nichts gegen die Vorgehensweise, Abkürzungen nach ihrem ersten Auftauchen im Text (und zwar so, wie der Autor in geschrieben hat, ohne Absätze oder Sätze herauszunehmen und in einem anderen Kontext zu verwenden) nicht mehr neu zu erklären.
Woher will man wissen, dass jemand die Figur "Harry Potter" kennt, wenn er nur das letzte Kapitel der aktuellen Bücher liest?
Und an dieser Stelle stellst du dir selbst eine Falle ;-) Man darf HTML-Dokumente, die ein Labyrinth bilden, nicht mit Büchern vergleichen, die linear zu lesen sind.
Oh doch, vergleichen darf man diese zwei Textformen sehr wohl. Denn Hypertext ist in erster Linie auch erstmal nur ein Text, für den alle Forderungen an Texte gelten, die auch in anderen Medien gestellt werden. Wenigstens, was Inhalt, sprachliche Formulierung und optisches Erscheinungsbild angeht. Denn Texte schreibt man ja genau deshalb, damit sie gelesen werden.
Beim Hypertext kommt dann noch das "Hyper" dazu - und macht die Lesefreudigkeit nicht unbedingt besser. Der schlimmste Text ist mit Sicherheit einer, bei dem in jedem Absatz zwei oder drei Links eingefügt sind, die jeweils zwar (im Sinne der Hypertextfunktion) auf vernünftige, weiterführende und wertvolle Texte verweisen - aber der Leser hat bei solchen Texten eindeutig das Problem, dass er nicht alle Dokumente, die verlinkt sind, genauso schnell lesen kann, wie den auf sie verweisenden Link. Einen Link nur anzugucken und dadurch zu wissen, was im verlinkten Dokument steht - das ist leider derzeit noch unmöglich.
Deshalb behaupte ich: Nicht jedes Buch ist linear zu lesen, genauso wenig wie jeder Hypertext zwingend nonlinear zu lesen ist. Genauso wie auf einen Hypertext nur ausschnitthaft verwiesen werden kann, kann auf einen Buchtext verwiesen werden. Genauso linear, wie ein Buch gelesen wird, werden Hypertexte gelesen - komplett, am Stück und ohne Unterbrechung.
Bestes Beispiel für nonlineare Literatur: Lexika und Nachschlagewerke. Oder auch Kochbücher - deren Einzeltexte man sehr wohl am Stück durchlesen dürfte, aber eher selten das ganze Buch. :)
Das sind nun aber wieder zwei Paar Schuhe :-) Genauso, wie man Inhalt von der Gestaltungsform trennen soll (oder Content vom Layout ;-)), sollte sich das Prinzip eigentlich auch in deiner Argumentation wiederfinden. Leider ist es nicht so. Du kritisierst scheinbar nicht die Auszeichnung an sich.
...anscheinend...
Vielmehr übst du Kritik an der Fromatierung dieser Auszeichnung. Solltest du lediglich die Erscheinungsform kritisieren, könnte ich dir unter Umständen Recht geben. Beharrst du allerdings weiterhin darauf, dass man semantisch nicht alles auszeichnen soll, was semantisch auszuzeichnen wäre, muss ich heftigst protestieren ;-) Schließlich ist bzw. eine Abkürzung im semantischen Sinne. Also werde ich es weiterhin als eine Abkürzung auszeichnen. Was man gegebenfalls unterlassen könnte, ist die verwendung des title Attributs.
Würde man tatsächlich alles, was irgendwie als HTML-Element existiert, tatsächlich verwenden, ergäbe sich ein ziemlich aufwendig zu schreibender Tag-Mix.
Wenn man sich die Inline-Elemente mal ansieht:
a | abbr | acronym | applet | b | basefont | bdo | big | br | button | cite | code | dfn | em | font | i | img | input | iframe | kbd | label | map | object | q | samp | script | select | small | span | strong | sub | sup | textarea | tt | var
Streichen wir mal alle mit physikalischen Auswirkungen raus:
abbr | acronym | big | cite | code | dfn | em | kbd | label | q | samp | small | span | strong | sub | sup | tt | var
Dann hast du in der Summe 18 verschiedene Typen von Textbedeutung allein bei Inline-Elementen. Darunter so delikate Elemente wie <dfn> (kennzeichnet eine Definition) oder <samp> (kennzeichnet ein Beispiel).
Problem Nummer 1: Wer zum Teufel soll sich diese 18 sehr ungebräuchlichen Elemente merken können?
Problem Nummer 2: Wie soll man die korrekte Anwendung dieser Elemente einem Redakteur begreiflich machen, wenn unter dem Strich für ihn und seine Leser sichtbar doch nur jeweils "fetter Text" rauskommt, weil man dem Leser unmöglich 18 verschiedene Arten von Textkenntlichmachung zumuten kann.
Problem Nummer 3: Finde mal ein praxisnahes Layout, in dem sich (wie z.B. in SELFHTML) Beispiele finden, die man aber tatsächlich ausschließlich mit einem einzigen <samp>-Element auszeichnen und formatieren könnte. Meist sind - auch wegen Browserunzulänglichkeiten, aber durchaus auch wegen der grafischen Anforderung - mehrere Elemente notwendig.
Problem Nummer 4: Wenn die Textauszeichnung sich in keiner Weise durch anderes Aussehen, andere Aussprache oder andere Braille-Zeilen von normalem Text unterscheidet - warum dann diesen Aufwand? Klar, man wird einem Redakteur vermitteln können: "Wir möchten, dass alle Beispiele im Text gleich 'anders' aussehen, also verwende bitte <samp>." Und Beispiele (nach Lesart des W3C von Ausgaben durch Code und Skripte) sind sicherlich auch ein größerer Textblock, und somit gegenüber übermäßiger Kleindetailliertheit immun - aber bei absehbarer Nichtnutzung dieser Extraauszeichnung stellt man sich doch die Sinnfrage!
Noch mal: Es geht nicht um die visuellen Hervorhebungen, sondern um die semantische Auszeichnung!
Eine semantische Auszeichnung ist wertlos, wenn man sie nicht wahrnehmen kann - würdest du mir da zustimmen? Das primäre Ausgabemedium im Web ist nun mal der Bildschirm.
12 als <strong>
Ich sehe dort nur fünf:
Ich zähle Worte, nicht HTML-Elemente.
Ändert sich dann aber auch. Ist aber schlußendlich auch egal. Denn auch wenn es so wäre -- wenn es semantisch/logisch richtig ist, wäre es kein Verbrechen.
Ok, dann erklärst du mir jetzt bitte mal, warum "strukturierten Dokumenten" eine weniger wichtige semantische Hervorhebung erfahren hat, wie z.B. "valide" im gleichen Satz.
HTML-Auszeichnungen sind auch Informationen.
Es sind Metainformationen, die zunächst einmal überhaupt keinen Einfluß auf die sie einschließende Information hat.
Metainformationen nur zum Selbstzweck sind aber reichlich sinnlos, irgendwas muß man mit diesem Extra-Aufwand ja anstellen können. Und die Idee war eben, das zu Formatierungszwecken zu nutzen - auch schon bei HTML 1.0. Dort war die Formatierung dann eben hartcodiert im Browser enthalten, ohne von Autor oder Benutzer verändert werden zu können.
Und man soll eher froh sein, dass man 74% von Metainformationen, die man in einem ASCII Text hätte im Fließtext schreiben müssen, in entsprechenden HTML-Tags unterbringen kann!
Ich bezweifle, dass es überhaupt notwendig wäre, irgendeine Hervorhebung in diesem Text einbauen zu müssen. "Wer alles unterstreicht, unterstreicht nichts." Ein Viertel der Worte des Absatzes sind in einer von drei Methoden "hervorgehoben".
Beide Techniken -- sei es WYSIWYG (What you see is what you get) oder sei es WYSIWYM (What you see is what you mean) erlauben es dem Laien, ein Web-Dokument ohne jegliche Kenntnisse von (X)HTML-Syntax zu erstellen.
In beiden Fällen aber muss von dem Anwender verlangt werden, dass er sich mit der Materie auseinander gesetzt und die Bedeutung von strukturierten Dokumenten verstanden hat, will er valide, sowohl semantisch wie auch logisch schlüssige und somit zugängliche Dokumente erstellen.
Ohne jegliche Hervorhebung (hier im Forum natürlich beeinträchtigt durch die andersartige Schriftart) halte ich den Absatz für deutlich augenfreundlicher.
Ich glaube nicht, dass die Klammerung für besseren Lesefluß sorgt.
Das Weglassen der multiplen Hervorhebungsebenen ist es, was ich erreichen will. Ich behaupte: In einem Text kommt es wirklich nur ganz ganz selten vor, dass überhaupt ein Abschnitt nochmal gesondert hervorgehoben werden muß. Mitnichten ist es notwendig, innerhalb eines Absatzes mit zwei Sätzen gleich 6 Abschnitte und Worte hervorzuheben, davon einen nochmal weniger stark als die anderen 5.
Das geht einfach viel zu weit über alles hinaus, was Semantik sein will. Man muß es aushalten können, einen Text auch einfach mal nur schlichten Text sein zu lassen, ohne an jedem vierten Wort mit irgendwelcher Semantik Meta-Informationen zu verankern, die dann wiederum dazu verleitet, auch optisch dargestellt zu werden.
Natürlich könnte man es mit Fußnoten regelen, aber stören diese den Lesefluß nicht viel mehr? Vor allem dann, wenn man wirklich die Bedeutung nachschlagen will?
Wenn ich eine Abkürzung nicht kenne, und auch nicht den durch sie abgekürzten Begriff - dann hilft mir weder die (ja nicht verläßlich in allen Texten auftauchende) Information "dies ist eine Abkürzung" (wobei die Differenzierung in <abbr> und <acronym> keine auch nur irgendwie verbesserte Hilfe ist), noch die im Title-Attribut untergebrachte Langform.
Ein Beispiel (willkürlich aus dem Netz gefischt und auf HTML-Format gebracht):
<abbr title="Heißläufer-Ortungsanlage">HOA</abbr>
Weiß ich, was ein HOA ist? Nein.
Hilft es mir, wenn ich mitgeteilt bekomme, dass das für "Heißläufer-Ortungsanlage" steht? Genauso wenig.
Erst wenn ich das Lexikon bemühe, wird mir erklärt, was das ist.
Es ist daher ein Irrglaube, man könne mit HTML-Auszeichnung das Aufsuchen und Heranschaffen von weiterführenden Informationen ersetzen. Ich möchte auch ausdrücklich davor warnen, einfach ein Glossar anzulegen und jedes im Text auftauchende Glossarwort direkt zu verlinken. Das erklärt den Leser für blöde, man muß einem wissenden Fachmann nicht alle zehn Sekunden die Bedeutung des für ihn alltäglichen Vokabulars mitteilen - und es stört ihn auch wieder beim Lesen des Textes.
Außerdem die erste Zeile noch gesperrt gesetzt.
Hat nichts mit der Auszeichnung zu tun.
Ist aber optisch wahrnehmbar, und ihm wird eine Bedeutung beigemessen, insbesondere weil gesperrte Worte auch eine Form der Hervorhebung sind.
Ein Viertel deines Textes hier ist also wichtiger, als der Rest des Textes. Wobei es dabei auch noch drei (vier mit der Sperrzeile) unterschiedliche Wichtigkeitsebenen zu geben scheint.
Hier beziehst du dich auch nur auf die Formatierung.
Nein. Meine Zählung basiert auf dem angegebenen HTML-Quelltext. Natürlich: Ausschlaggebend war die sehr bunte Formatierungsvielfalt in diesem Absatz, aber für das optische Erscheinungsbild gibt es ja schließlich einen (angeblich semantischen) Grund - sonst hättest du ja wohl kaum <acronym>, <abbr>, <em> und <strong> in solcher Häufigkeit hier eingesetzt, oder?
Wenn du also an dieser Stelle Semantik einbaust, kannst du das ja eventuell auch begründen.
Auch wenn der Anteil nicht stimmt, man schafft 76% von Meta-Informationen so geschickt unterzubringen, dass sie einerseits so wenig wie möglich den Lesefluß stören, andererseits sich jedoch bei Bedarf abrufen lassen.
Weder stören sie "so wenig wie möglich den Lesefluß" - das Gegenteil ist der Fall, der Lesefluß wird ganz erheblich gestört. Noch kann man sie "bei Bedarf abrufen lassen" - die gewählte Formatierung oder auch eine Standardformatierung im Browser sind zunächst mal da, der Leser muß viel Aufwand treiben, sie loszuwerden.
- Sven Rautenberg
--
My sssignature, my preciousssss!