Heiner: ­ verwenden?

Hallo,

Sehr lange Wörter kann man ja mit dem "soft hyphen" trennen, damit der Browser weiß, dass er das Wort nicht in eine Zeile schreiben muss, sondern an der markierten Stelle trennen darf.

Statt

Beispiel

wird durch Bei­spiel daraus

Bei-
spiel

sobald, "Bei" am rechten Rand eines Absatzes steht.

Ich habe festgestellt, dass einige Browser mit dem Zeichen falsch, manche gar nicht umgehen können. Bei einigen wird statt der Trennung ein Kasten angezeigt (offenbar kennen sie ­ also gar nicht), bei anderen ein Bindestrich auch dann, wenn das Wort gar nicht getrennt wird (laut Definition des Zeichens falsch!).

Bei google werden solche Wörter falsch abgespeichert (sinnigerweise müsste der google-Roboter das Zeichen nur rauslöschen). Obiges Wort würde man also wohl nicht unter dem Suchbegriff "Beispiel" finden.

Sollte man wegen dieser Schwächen in der Unterstützung von ­ trotz seines hohen praktischen Nutzens ganz darauf verzichten? Welche Erfahrungen habt Ihr?

Heiner

  1. Hallo Heiner,

    Sollte man wegen dieser Schwächen in der Unterstützung von ­ trotz
    seines hohen praktischen Nutzens ganz darauf verzichten?

    Ja.

    Interessant dazu finde ich diesen Artikel: http://www.cs.tut.fi/~jkorpela/shy.html

    Zudem wird es im CSS3-Standard Befehle zur Silbentrennung geben, was
    darauf hinweist, daß es die Browser sind, die in einem HTML-Dokument
    die Silbentrennung vornehmen werden. Vergleiche dazu mein etwas
    naives Posting vor einiger Zeit: </archiv/2003/5/46512/#m253866>

    • Tim
    --
    »Solche Kompetenzen kauft man sich zu.«
    http://forum.de.selfhtml.org/archiv/2003/5/46020/#m251248
    1. Nabend,

      Die Frage muss auch lauten: Wer ist für Silbentrennung zuständig?

      Möglich wäre sicher eine Lösung, die benutzerseitig das Problem mit Wörterbüchern etc. löst. Das vorauszusetzen wäre andererseits doch etwas arrogant. Problematisch ist eine solche Lösung auch, weil sie nicht unfehlbar ist, was Fehlinterpretationen angeht. So könnte es zwei Wörter geben, die sich gleich schreiben, aber unterschiedliche Silbentrennungen haben. Wie sollte eine Software das erkennen?

      Gerade bei sehr langen Wörtern, übrigens gerade bei deutschen Wörtern, ist aber eine "serverseitige" Lösung wünschenswert.

      Hierbei muss man natürlich fragen, ob es nicht eher ein gestalterischer Bedarf nach Kontrolle der Silbentrennung besteht (CSS) oder ob es nicht in die Idee des Textauszeichnens hineingeht (html). Wenn man die Silben eines Wortes angibt, sind sie dann für die Textsemantik oder die Optik der Seite relevant?

      Unabhängig von dieser doch eher theoretischen Auseinandersetzung gibt es einen praktischen Bedarf nach der Möglichkeit die Silbentrennung anzugeben.

      Heiner

      1. Hallo Heiner,

        Hierbei muss man natürlich fragen, ob es nicht eher ein gestalterischer
        Bedarf nach Kontrolle der Silbentrennung besteht (CSS) oder ob es nicht in
        die Idee des Textauszeichnens hineingeht (html). Wenn man die Silben eines
        Wortes angibt, sind sie dann für die Textsemantik oder die Optik der Seite
        relevant?

        Nach W3C-Gedankengut ist Silbentrennung wohl eher ein optisches Merkmal.

        Wenn man für die Textsemantik, aus welchem Grund auch immer, im Quelltext
        angibt, was für Silben ein Wort hat, sollte man das konsequenterweise
        auch für jedes Wort machen. Allerdings kann ich mir keinerlei semantischen
        Mehrwert durch die seperate Auszeichnung von Silben vorstellen.

        Silbentrennung hat jedoch im optischen Bereich seine Vorzüge. Dies ist der
        Fall, wenn man einen begrenzten Platz für eine Zeile zur Verfügung hat. Ein
        Fall, der nur bei der optischen Repräsentation eines HTML-Dokumentes
        auftritt und auch nur dann, wenn die Zeilenlänge begrenzt, beispielsweise
        durch ein umgebendes Element mit fester Breite.

        Der W3C-Idealismus besagt jedoch, daß HTML-Dokumente nicht für ein
        bestimmtes Ausgabemedium geschrieben werden sollten, sondern für
        eine universelle Menge von Ausgabemedien, von optisch bis zu akustisch
        (und theoretisch noch haptisch). Noch dazu soll die grafische Repräsentation
        des HTML-Dokumentes möglichst fluide gestaltet sein sollte, wegen
        verschiedener Anzeigegrößen.

        Der Bedarf nach Silbentrennung ist also ein eindeutig grafisch bedingt.
        Deswegen ist es konsequent, daß sich sowas nur im grafischen Teil von
        CSS definiert ist. Da es halbwegs fest definierte Silbentrennungsregeln
        in der Zusammenarbeit mit Wörterbüchern gibt, sehe ich kein Problem
        darin.

        Noch dazu wird von CSS nichts vorrausgesetzt; Befehle die der Benutzeragent
        nicht kennt, übergehter.

        • Tim
        --
        »Solche Kompetenzen kauft man sich zu.«
        http://forum.de.selfhtml.org/archiv/2003/5/46020/#m251248
        1. Noch dazu wird von CSS nichts vorrausgesetzt; Befehle die der Benutzeragent
          nicht kennt, übergehter.

          Gibt es eigentlich eine Silbenauszeichnungmöglichkeit mit CSS? Bzw. wird eine angedacht?

          1. Hallo Heiner,

            Gibt es eigentlich eine Silbenauszeichnungmöglichkeit mit CSS? Bzw. wird
            eine angedacht?

            Nein. Es gibt eine Möglichkeit zur Kontrolle der Silbentrennung (Auf englisch
            hyphenation) in CSS 3.

            http://www.w3.org/TR/css3-text/#word-break-inside

            Genauer steht da...

            »It requires that the user agent have an hyphenation dictionary for the
              language of the text being broken.«

            ... was heißt, daß der Benutzeragent derjenige ist, der für die Silbentrennung
            verantwortlich ist und daß, wenn er es kann, man mit CSS das Verhalten etwas
            beeinflussen kann.

            ... irgendwann in Zukunft.

            • Tim
            --
            »Solche Kompetenzen kauft man sich zu.«
            http://forum.de.selfhtml.org/archiv/2003/5/46020/#m251248
        2. Hallo!

          Nach W3C-Gedankengut ist Silbentrennung wohl eher ein optisches Merkmal.

          Wenn man für die Textsemantik, aus welchem Grund auch immer, im Quelltext
          angibt, was für Silben ein Wort hat, sollte man das konsequenterweise
          auch für jedes Wort machen.

          Warum? wenn ich das nur in bestimmten Fällen brauche...

          Silbentrennung hat jedoch im optischen Bereich seine Vorzüge. Dies ist der
          Fall, wenn man einen begrenzten Platz für eine Zeile zur Verfügung hat. Ein
          Fall, der nur bei der optischen Repräsentation eines HTML-Dokumentes
          auftritt und auch nur dann, wenn die Zeilenlänge begrenzt, beispielsweise
          durch ein umgebendes Element mit fester Breite.

          ...z.B. in diesem Fall.

          CSS definiert ist. Da es halbwegs fest definierte Silbentrennungsregeln
          in der Zusammenarbeit mit Wörterbüchern gibt, sehe ich kein Problem
          darin.

          Natürlich sind da die Probleme programmiert:
          Nicht jedes "Wort" gehöhrt zu eine bestimmten Sprache. Beispiel:
          Ich habe einen 28-stelligen Code, den ich an bestimmten Stellen trennen kann, an andern nicht. Da hilft das beste Wörterbuch nix.
          Oder ich verwende Slang, Dialekt, Mundart, Ausländisch oder bin Wortsprachkunstschaffenderweise unterwegs.

          Die optimale, weil praktikabelste Lösung wäre (bei Bedarf) ­ - Alles andere ist plumper Dogmatismus.
          Welches nicht optisch Ausgabemedium sollte sich daran stören?
          Muß alles aus Prinzip kompliziert gemacht werden?

          tschüs, jürgen

          1. Hallo Jürgen,

            angibt, was für Silben ein Wort hat, sollte man das konsequenterweise
            auch für jedes Wort machen.
            Warum? wenn ich das nur in bestimmten Fällen brauche...

            Der einzige Fall, in dem man es dann braucht, ist auf einem optischen
            Ausgabemedium. Dies wiederspricht derangestrebten Universalität von
            (X)HTML in bezug auf Ausgabemedien.

            durch ein umgebendes Element mit fester Breite.
            ...z.B. in diesem Fall.

            Hehe. Wobei ich es mit Zeilenumbrüchen künstlich begrenze, da ich
            schmalere Spalten lieber mag.

            Natürlich sind da die Probleme programmiert:
            Nicht jedes "Wort" gehöhrt zu eine bestimmten Sprache. Beispiel:
            Ich habe einen 28-stelligen Code, den ich an bestimmten Stellen trennen
            kann, an andern nicht. Da hilft das beste Wörterbuch nix.

            Tja ... allen kann man es nicht recht machen. Würde ich unter der
            Wortsprachkunst einstufen, die unten angesprochen wird.

            Oder ich verwende Slang, Dialekt, Mundart, Ausländisch

            In der Theorie haben auf Dialekte und nicht-deutsche Sprachen ihre
            Trennungsregeln.

            oder bin Wortsprachkunstschaffenderweise unterwegs.

            Jandl-artig? Das würde ich unter künstlerischer Freiheit wie Gedichte
            einstufen, bei denen sich eh der manuelle Zeilenumbruch mittels <br />
            anbietet (Wenn man nicht diese extreme Variante der Auszeichnung mit
            Listen bzw. eigentlich XML-Anwendungen vorzieht, die in diesem Forum
            mal angedacht wurde).

            Die optimale, weil praktikabelste Lösung wäre (bei Bedarf) ­ - Alles
            andere ist plumper Dogmatismus.

            Och ... ­ ist auch eine Art von Dogmatismus.

            • Tim
            --
            »Solche Kompetenzen kauft man sich zu.«
            http://forum.de.selfhtml.org/archiv/2003/5/46020/#m251248
            1. Hallo Tim,

              In der Theorie haben auf Dialekte und nicht-deutsche Sprachen ihre
              Trennungsregeln.

              Klar, aber das wäre sehr aufwendig (neudeutsch: aufwändig) und hätte trotzdem eine hohes Fehlerrate. Man müsste  jedem Wort eine Sprache oder Silbendatenbank zuorden, wenn man innerhalb eines Textes Sprache, Slang, Dialekt wechselt.

              oder bin Wortsprachkunstschaffenderweise unterwegs.
              Jandl-artig? Das würde ich unter künstlerischer Freiheit wie Gedichte

              Kannst Du machen, das Problem besteht aber trotzdem. Einfache Lösung:
              Wort­sprach­kunst­schaffender­weise
              (wenn das Wort in einer kleinen Box steht)

              einstufen, bei denen sich eh der manuelle Zeilenumbruch mittels <br />

              ^^^^  will aber kein <br>, sondern Umbruch bei Bedarf.

              anbietet (Wenn man nicht diese extreme Variante der Auszeichnung mit
              Listen bzw. eigentlich XML-Anwendungen vorzieht, die in diesem Forum
              mal angedacht wurde).

              Och ... ­ ist auch eine Art von Dogmatismus.

              Mag sein, wäre dann aber von allen dogmatischen Lösungen diejenige, die ein sehr komplexes Problem auf denkbar einfache Weise löst.

              tschüs, jürgen

      2. hi,

        Gerade bei sehr langen Wörtern, übrigens gerade bei deutschen Wörtern, ist aber eine "serverseitige" Lösung wünschenswert.

        woher soll der server denn wissen, wie viel platz der client zum anzeigen braucht, und wo daher getrennt werden müsste?
        so etwas kann m.e. nicht funktionieren.

        gruss,
        wahsaga