Juve: Semantic Web

Glück auf!

Eben gefunden auf den Internetseiten zum Forschungsprojekt SmartWeb:

Den Kern der Technologie des Semantischen Web bilden Markierungssprachen, die eine formale Syntax und Semantik haben und in Form einer Ontologie eine standardisierte Begrifflichkeit zur Beschreibung digitaler Inhalte bereitstellen.
Semantische Markierungssprachen wie OWL erlauben die weltweite Verbreitung und gemeinsame Nutzung von Ontologien im WWW. Die semantische Markierung durch Metadaten stellt neben der Markierung für das Layout (HTML) und die Struktur (XML) eines Dokuments die dritte Ebene einer Dokumentbeschreibung dar.

Besonders der zweite Absatz ist doch eigentlich Humbug oder zumindest konträr zu dem, was man eigentlich über HTML auch und vor allem durch SelfHTML und das Forum weiß, oder?
Grundsätzlich klingt ja der Forschungsansatz ganz sinnvoll, Informationen wirklich maschinen_verstehbar_ zu machen, aber so wirklich sinnvoll ist das alles nicht, was da von sich gegeben wird, oder? Zumal auch bei bester Technik ein Suchergebnis zur so gut sein kann wie das Denkvermögen des Users, der sucht...
Würde mich sehr über ein paar Meinungen freuen! :)

Dank und Gruß,
der Juve

  1. Hi,

    Besonders der zweite Absatz ist doch eigentlich Humbug oder zumindest konträr zu dem, was man eigentlich über HTML auch und vor allem durch SelfHTML und das Forum weiß, oder?

    nö. Es gibt unendlich viele semantische Ebenen, und HTML vermittelt davon eine oder vielleicht zwei.

    Grundsätzlich klingt ja der Forschungsansatz ganz sinnvoll, Informationen wirklich maschinen_verstehbar_ zu machen, aber so wirklich sinnvoll ist das alles nicht, was da von sich gegeben wird, oder?

    Doch - aber utopisch. Ob diese Utopie erreichbar ist, wird die Zeit zeigen. Captain Picard hat sie jedenfalls zur Verfügung ;-)

    Zumal auch bei bester Technik ein Suchergebnis zur so gut sein kann wie das Denkvermögen des Users, der sucht...

    AI?

    Cheatah

    --
    X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: No
    X-Please-Search-Archive-First: Absolutely Yes
    1. Glück auf!

      Hi,

      Besonders der zweite Absatz ist doch eigentlich Humbug oder zumindest konträr zu dem, was man eigentlich über HTML auch und vor allem durch SelfHTML und das Forum weiß, oder?

      nö. Es gibt unendlich viele semantische Ebenen, und HTML vermittelt davon eine oder vielleicht zwei.

      Na ja, mir stieß vor allem diese Formulierung etwas übel auf: "[...]Markierung für das Layout (HTML)[...]". Ich dachte immer, HTML hat nix mit Layout zu tun, ist ein unumstößliches Gesetz.

      Zumal auch bei bester Technik ein Suchergebnis zur so gut sein kann wie das Denkvermögen des Users, der sucht...

      AI?

      Ich verstehe nicht ganz, worauf du damit hinaus willst... Ich denke nicht, dass dumme (a.k.a. ungünstige) Suchanfragen die gewünschten Ergebnisse bringen kann.

      Gruß,
      der Juve

      1. Hi Juve!

        Ich dachte immer, HTML hat nix mit Layout zu tun, ist ein unumstößliches Gesetz.

        Das ist nur in begrenztem Umfang richtig. Indem du eine Überschrift mit <h1> auszeichnest, erwartest du, dass diese auch als Überschrift dargestellt wird.

        Vielleicht kennst du Platons Ideenlehre. Wenn du also ein Urbild eines Objektes in deine Seite einbaust, dann hast du davon schon eine gewisse, aber noch abstrakte, Vorstellung.
        Mit CSS kannst du dem Element dann seine Seele geben. So wie _du_ dir dieses Element eben vorstellst. [1]

        Ich denke nicht, dass dumme (a.k.a. ungünstige) Suchanfragen die gewünschten Ergebnisse bringen kann.

        Aber genau das sollte doch das Ziel sein. Wenn jemand Hunger auf Bratwurst eingibt, dann möchte er wahrscheinlich bei dem Bratwurstonlineversandhandel seiner Wahl eine Bratwurst bestellen und nicht die Geschichte, die Herstellung oder Zusammensetzung einer Bratwurst kennenlernen.

        [1] Da ich mit Platons Philosophie nicht ganz übereinstimme, hab ich mir erlaubt, den Gedanken ein wenig zu verändern.

        MfG H☼psel

        --
        "It's amazing I won. I was running against peace, prosperity, and incumbency."
        George W. Bush speaking to Swedish Prime Minister unaware a live television camera was still rolling, June 14, 2001
        Selfcode: ie:% fl:( br:> va:) ls:& fo:) rl:? n4:& ss:| de:] js:| ch:? sh:( mo:) zu:)
        1. Hallo,

          Ich dachte immer, HTML hat nix mit Layout zu tun, ist ein unumstößliches Gesetz.

          Das ist nur in begrenztem Umfang richtig. Indem du eine Überschrift mit <h1> auszeichnest, erwartest du, dass diese auch als Überschrift dargestellt wird.

          Ja, HTML hat viele Strukturierungen, die aus dem Print-Bereich bzw. der Schriftkultur stammen. Überschriften-Hierarchien sind etwa eine gewachsene Tradition bei wissenschaftlichen Abhandlungen. Listen hingegen transzendieren schon zur reinen Semantik. Natürlich erwartet man standardmäßig eine klassische Darstellung, wie sie schon vor dem Webs üblich war, aber es ist ja mittlerweile hip, alles als Liste auszuzeichnen, nur weil es rein logisch einen Listencharakter hat. Man denke an rdf:Bag und rdf:Alt, was rein semantische Strukturen sind. Allerdings sind sie genauso inhaltslos - sie dienen lediglich zur Gruppierung von Objekten einer Aussage, zu der es noch eines Subjekts und Prädikats bedarf.

          Semantik, die gänzlich vom Layout gelöst ist, gibt es in HTML tatsächlich wenig. Textauszeichnung hat eben nicht den Zweck, sinnreiche Aussagen über Textteile zu machen, die über die konkrete Funktion im direkten Textzusammenhang hinausgehen. Ausnahmen wären vielleicht dfn, cite, code, abbr usw. Aus der Sicht des Semantischen Webs bleibt das aber Pipifax, denn konkrete maschinenlesbare und -verwertbare Metainformationen sind das nicht. Vielleicht ist a noch das semantischste Elemente in HTML.

          Mathias

          1. Moin!

            Ich dachte immer, HTML hat nix mit Layout zu tun, ist ein unumstößliches Gesetz.

            Das ist nur in begrenztem Umfang richtig. Indem du eine Überschrift mit <h1> auszeichnest, erwartest du, dass diese auch als Überschrift dargestellt wird.

            Ja, HTML hat viele Strukturierungen, die aus dem Print-Bereich bzw. der Schriftkultur stammen. Überschriften-Hierarchien sind etwa eine gewachsene Tradition bei wissenschaftlichen Abhandlungen. Listen hingegen transzendieren schon zur reinen Semantik.

            Man merkt jedenfalls deutlich, woher HTML ursprünglich kommt: Es ist eine Beschreibungssprache für wissenschaftliche Texte. Alle hochtrabend "semantisch" genannten Elemente wie Überschriften, Textabsätze, Listen, Hervorhebungen etc. sind im Grunde Definitionen für die Print-Ausgabe, also z.B. als gedrucktes Buch. Sie beschreiben zwar nicht explizit das Aussehen, orientieren sich aber extrem stark an der beabsichtigten (und schon damals ja sehr einheitlichen) Verwendung, nämlich dem Ausdruck.

            Dass es zusätzlich noch ein interaktives Element namens "Link" gibt (die Inkarnationen wie Imagemap oder <link> rechne ich da mal direkt mit hinein), mit dem einzelne Dokumente hypertextartig miteinander verbunden werden, ist aber doch genau betrachtet ziemlich arm. Es gibt mit den vorhandenen Elementen beispielsweise ja keinerlei Möglichkeit, ein Navigationsmenü wirklich als solches auszuzeichnen und somit kenntlich zu machen. Wobei: Man kann natürlich <link> für derartige Zwecke einsetzen, aber die klassischen Linkziele orientieren sich auch wiederum sehr stark an der Texterscheinungsform "Buch" - und abgesehen davon liegen diese Elemente im <head> und damit außerhalb des (normalerweise) darstellbaren Bereichs (zumindest was den IE angeht, Opera und Firefox erlauben auch die Darstellung des <head> sowie der darin enthaltenen Elemente - sicherlich ein spannendes Experimentierfeld, wenn man die Seitennavigation komplett in <link> unterbringen und mit CSS entsprechend formatieren könnte).

            Textauszeichnung hat eben nicht den Zweck, sinnreiche Aussagen über Textteile zu machen, die über die konkrete Funktion im direkten Textzusammenhang hinausgehen.

            Nur mal als Beispiel: Eine semantische Ebene wäre beispielsweise die Auszeichnung von Wortbedeutungen. Ist "Schneider" beispielsweise der Beruf, oder der Name einer Person. Oder "Schuster" - das könnte sogar noch ein Insekt sein. Und in einer Fabel sogar Insekt, Beruf und Name gleichzeitig. Und will man in Google nach "Schuster - Personenname" suchen, so wird man auch Insekten und Berufe finden.

            - Sven Rautenberg

            --
            My sssignature, my preciousssss!
            1. Hallo.

              Nur mal als Beispiel: Eine semantische Ebene wäre beispielsweise die Auszeichnung von Wortbedeutungen. Ist "Schneider" beispielsweise der Beruf, oder der Name einer Person. Oder "Schuster" - das könnte sogar noch ein Insekt sein. Und in einer Fabel sogar Insekt, Beruf und Name gleichzeitig. Und will man in Google nach "Schuster - Personenname" suchen, so wird man auch Insekten und Berufe finden.

              Man muss ja nicht auf <dfn title="Beruf">Schneider</dfn> verzichten, wenn man sich davon Hilfe erwartet. An die eigenen Seiten angepasste Suchfunktionen sollte das leisten können und moderne Browser könnten die Erläuterung auch beispielsweise in Klammern hinter den Begriff setzen. Die Schwierigkeit liegt wie so oft darin, dass sich der Autor die Mühe machen muss, diese Metadaten hinzuzufügen, und zwar für jeden einzelnen Begriff, dessen Bedeutung er nicht eindeutig hält. Das Programmieren der Suchmaschine und das CSS sind da verhältnismäßig wenig aufwendig.
              MfG, at

              1. Moin!

                Nur mal als Beispiel: Eine semantische Ebene wäre beispielsweise die Auszeichnung von Wortbedeutungen. Ist "Schneider" beispielsweise der Beruf, oder der Name einer Person. Oder "Schuster" - das könnte sogar noch ein Insekt sein. Und in einer Fabel sogar Insekt, Beruf und Name gleichzeitig. Und will man in Google nach "Schuster - Personenname" suchen, so wird man auch Insekten und Berufe finden.

                Man muss ja nicht auf <dfn title="Beruf">Schneider</dfn> verzichten, wenn man sich davon Hilfe erwartet.

                Das W3C sagt: "DFN: Indicates that this is the defining instance of the enclosed term."

                Dürfte also nur ein einziges Mal pro Term angewandt werden, und erscheint mir außerdem ein Element zu sein, mit dem man für Druckwerke schöne Index-Auflistungen erzeugen kann.

                Die Nutzung des Universal-Attributs title ist obendrein nicht hilfreich. Angenommen man wolle sowohl Wortbedeutungen als auch Syntaxbedeutungen auszeichnen wollen, also zweierlei parallele Dinge, so würde dein Versuch schon scheitern - es kann nicht angegeben werden, für welche der zwei bis unendlich vielen Bedeutungen der Attributwert gilt. Und ich halte CDATA auch nicht unbedingt für ein geeignetes Inhaltsmodell für derartige Belange.

                An die eigenen Seiten angepasste Suchfunktionen sollte das leisten können und moderne Browser könnten die Erläuterung auch beispielsweise in Klammern hinter den Begriff setzen.

                Natürlich gilt immer: Wenn man selbst was individuell festlegt und sich dann danach richtet, kann man selbst damit tolle Dinge anfangen.

                Das gilt aber nicht für die Allgemeinheit. Die muß zuerst Kenntnis davon haben, die Idee als sinnvoll ansehen, sie selbst übernehmen - und wenn eine kritische Masse erreicht ist, erscheint es wie von selbst sinnvoll, dass auch der Rest der Welt es mitmacht.

                Die Schwierigkeit liegt wie so oft darin, dass sich der Autor die Mühe machen muss, diese Metadaten hinzuzufügen, und zwar für jeden einzelnen Begriff, dessen Bedeutung er nicht eindeutig hält.

                Deswegen halte ich Schlagworte wie "semantisches Web" auch für überbewertet. Man _kann_ ganz viel auszeichnen - aber wenn man zu jeden geschrieben Wort noch zwei oder drei Metaebenen mitschleifen und ausfüllen _muss_, und man sich nicht mehr auf das Schreiben konzentrieren kann, dann schreckt das eher ab.

                - Sven Rautenberg

                --
                My sssignature, my preciousssss!
                1. Hallo.

                  Das W3C sagt: "DFN: Indicates that this is the defining instance of the enclosed term."

                  Dürfte also nur ein einziges Mal pro Term angewandt werden, und erscheint mir außerdem ein Element zu sein, mit dem man für Druckwerke schöne Index-Auflistungen erzeugen kann.

                  Dürfte ein Begriff nur einmal definiert werden, stünde das sicher ebenfalls dort -- oder in einer anderen seriösen Quelle. Da sich die Autoren aber offenbar nicht der Lächerlichkeit preisgeben wollten, haben sie wohlweißlich darauf verzichtet. Und die mutmaßliche Verwendung in Druckerzeugnissen ist ja weder maßgeblich noch unterstützt sie die Ansicht, ein Begriff dürfe nur ein einziges Mal definiert werden.

                  Die Nutzung des Universal-Attributs title ist obendrein nicht hilfreich.

                  Nicht nur hilfreich, sondern auch sinnvoll und praktisch.

                  Angenommen man wolle sowohl Wortbedeutungen als auch Syntaxbedeutungen auszeichnen wollen, also zweierlei parallele Dinge, so würde dein Versuch schon scheitern - es kann nicht angegeben werden, für welche der zwei bis unendlich vielen Bedeutungen der Attributwert gilt.

                  Die Bedeutung der Syntax ist anderswo definiert. -- Vielleicht erinnerst du dich ja noch, wo du dein obiges Zitat gefunden hast.
                  Man könnte natürlich auch ein <span class="Nachname">Schuster</span> verwenden, aber wozu, wenn <dfn title="Nachname">Schuster</dfn> semantisch das Mittel der Wahl ist?

                  Und ich halte CDATA auch nicht unbedingt für ein geeignetes Inhaltsmodell für derartige Belange.

                  Es funktioniert, weshalb ich es für geeignet halte.

                  Natürlich gilt immer: Wenn man selbst was individuell festlegt und sich dann danach richtet, kann man selbst damit tolle Dinge anfangen.

                  Eben.

                  Das gilt aber nicht für die Allgemeinheit. Die muß zuerst Kenntnis davon haben, die Idee als sinnvoll ansehen, sie selbst übernehmen - und wenn eine kritische Masse erreicht ist, erscheint es wie von selbst sinnvoll, dass auch der Rest der Welt es mitmacht.

                  Für eine in die eigene Präsentation integrierte Suchfunktion ist das nicht einmal notwendig. Und bevor ich irgendwelche anderen proprietären Tagging-Mechanismen übernehme, nutze ich eben die, die HTML mitliefert.

                  Deswegen halte ich Schlagworte wie "semantisches Web" auch für überbewertet. Man _kann_ ganz viel auszeichnen - aber wenn man zu jeden geschrieben Wort noch zwei oder drei Metaebenen mitschleifen und ausfüllen _muss_, und man sich nicht mehr auf das Schreiben konzentrieren kann, dann schreckt das eher ab.

                  Nun, es bleibt dem Autoren ja überlassen. Gar nicht oder nur im falschen Zusammenhang gefunden und gelesen zu werden, schreckt ja auch häufig ab.
                  MfG, at

                  1. Hallo,

                    Man könnte natürlich auch ein <span class="Nachname">Schuster</span> verwenden, aber wozu, wenn <dfn title="Nachname">Schuster</dfn> semantisch das Mittel der Wahl ist?

                    Nichts davon ist annähernd »semantisch das Mittel der Wahl«. Mit HTML kann man qua HTML-Vokabular Namen nicht als Namen auszeichnen und Berufe nicht als Berufe. Andere verbreitete und öffentlich dokumentierte Sprachen können das von Haus aus und sind also überhaupt in diesem Sinne als semantisch zu bezeichnen. HTML kann lediglich mehr schlecht als recht semantisch aufgebohrt werden. Warum überhaupt? Du führst als Beispiel eine serverseitige Suche an:

                    Für eine in die eigene Präsentation integrierte Suchfunktion ist das [Übernehmen der Idee] nicht einmal notwendig. Und bevor ich irgendwelche anderen proprietären Tagging-Mechanismen übernehme, nutze ich eben die, die HTML mitliefert.

                    Es existieren tausende Fertiglösungen dafür, die ohne eine pseudosemantische Erweiterung von HTML auskommen, sondern auf etablierte Formate des Semantic Web wie RDF etwa zusammen mit FOAF, vCard und Dublin Core setzen. Sie garantieren maximale Weiterverwendbarkeit der Metainformationen. Keine davon sind proprietär. Und selbst wenn: Jede selbst definierte (X)HTML-Erweiterung wäre eindeutiger als ein Zweckentfremden von generischem HTML-Markup.

                    Natürlich will man dem Browser letztlich einfaches (X)HTML ausliefern - zumindest, solange Markup aus anderen Namensräumen noch nicht problemlos eingebettet werden kann -, sodass man diese Informationen in HTML-Markup übersetzen muss. Dazu eignen sich Klassen hervorragend. Sie sind aber nur ein Abklatsch der tatsächlichen Semantik, eine Übersetzung in eine Sprache, in der höchstens Umschreibungen möglich sind.

                    Mathias

                    1. Hallo.

                      Nichts davon ist annähernd »semantisch das Mittel der Wahl«.

                      Im Rahmen von HTML ist es das sogar ziemlich sicher.

                      Du führst als Beispiel eine serverseitige Suche an:

                      Für eine in die eigene Präsentation integrierte Suchfunktion ist das [Übernehmen der Idee] nicht einmal notwendig. Und bevor ich irgendwelche anderen proprietären Tagging-Mechanismen übernehme, nutze ich eben die, die HTML mitliefert.

                      Hilfst du mir kurz auf die Sprünge, an welcher Stelle ich server-seitige Mechanismen erwähnt hätte?

                      Es existieren tausende Fertiglösungen dafür, die ohne eine pseudosemantische Erweiterung von HTML auskommen, sondern auf etablierte Formate des Semantic Web wie RDF etwa zusammen mit FOAF, vCard und Dublin Core setzen. Sie garantieren maximale Weiterverwendbarkeit der Metainformationen. Keine davon sind proprietär. Und selbst wenn: Jede selbst definierte (X)HTML-Erweiterung wäre eindeutiger als ein Zweckentfremden von generischem HTML-Markup.

                      Die Aufgabenstellung, einem im Text befindlichen Begriff Metainformationen hinzuzufügen, erfüllt der erwähnte Mechanismus unter Mithilfe eines dafür geeigneten HTML-Elementes, und Universalattribute kann man schon in Hinsicht auf den Begriff nicht zweckentfremden.
                      Und wenn tatsächlich tausende solcher Lösungen existierten, wäre das jedenfalls eine Erklärung für die mangelnde flächendeckende Unterstützung von gut 99 Prozent von ihnen.

                      Natürlich will man dem Browser letztlich einfaches (X)HTML ausliefern - zumindest, solange Markup aus anderen Namensräumen noch nicht problemlos eingebettet werden kann -, sodass man diese Informationen in HTML-Markup übersetzen muss. Dazu eignen sich Klassen hervorragend. Sie sind aber nur ein Abklatsch der tatsächlichen Semantik, eine Übersetzung in eine Sprache, in der höchstens Umschreibungen möglich sind.

                      Du kannst natürlich auch für jeden Einzelfall deine eigene Auszeichnungssprache entwickeln. Dass dies weder für Autoren noch für Nutzer einen gangbaren Weg darstellen kann, wissen wir aber beide. Und weil es daher immer darauf hinausläuft, sich auf einige wenige Sprachen zu beschränken, wenn man weitgehend universelle Suchmaschinen, Nachschlagewerke etc., aber vor allem auch Ausgabeprogramme nutzen möchte, führt eben dazu, dass solche Standards ein Format nur recht grob umreißen können und der Rest einmal mehr der Interpretation des Autoren obliegt. Und das ist eben auch ein gutes Stück weit innerhalb von HTML möglich. Mehr wollte ich gar nicht aufzeigen.
                      MfG, at

                  2. Hello out there!

                    Hallo.

                    Man könnte natürlich auch ein <span class="Nachname">Schuster</span> verwenden, aber wozu, wenn <dfn title="Nachname">Schuster</dfn> semantisch das Mittel der Wahl ist?

                    Beides ist gleichbedeutend, da die Semantik von 'Schuster' weder in span oder class noch in dfn oder title steckt, sondern in "Nachname". Du hättest auch <foo bar="Nachname">Schuster</foo> schreiben können.

                    Semantisches Markup wäre <foaf:Person><foaf:family_name>Schuster</foaf:family_name></foaf:Person>.

                    See ya up the road,
                    Gunnar

                    --
                    “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
                    1. Hallo.

                      Semantisches Markup wäre <foaf:Person><foaf:family_name>Schuster</foaf:family_name></foaf:Person>.

                      Wenn du für jeden Einsatzzweck deine eigene Auszeichnungssprache entwickeln möchtest, die dann zunächst von den entsprechenden Anzeigeprogrammen oder Nachschlagewerken und Suchmaschinen verstanden werden müssen, wünsche ich dir viel Spaß dabei. Ich halte mich derweil an die bescheidenen, aber vorhandenen Möglichkeiten, die mir HTML bietet.
                      MfG, at

                      1. Hello out there!

                        Wenn du für jeden Einsatzzweck deine eigene Auszeichnungssprache entwickeln möchtest,

                        Dass dies möglich ist, ist einer der Vorzüge von XML-Namensräumen und RDF.

                        die dann zunächst von den entsprechenden Anzeigeprogrammen oder Nachschlagewerken und Suchmaschinen verstanden werden müssen,

                        Zur Beschreibung eigener Auszeichnungssprachen – besser gesagt: des eigenen Vokabulars – dienen RDF Schema und OWL, die von verarbeitender Software verstanden werden, weil sie auch in RDF geschrieben sind.

                        wünsche ich dir viel Spaß dabei.

                        Danke.

                        Ich halte mich derweil an die bescheidenen, aber vorhandenen Möglichkeiten, die mir HTML bietet.

                        Dir ist aber schon bewusst, dass HTML mit dem Thema Semantic Web rein gar nichts zu tun hat?

                        See ya up the road,
                        Gunnar

                        --
                        “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
                        1. Hallo.

                          Zur Beschreibung eigener Auszeichnungssprachen – besser gesagt: des eigenen Vokabulars – dienen RDF Schema und OWL, die von verarbeitender Software verstanden werden, weil sie auch in RDF geschrieben sind.

                          Das Problem bleibt bestehen.

                          Dir ist aber schon bewusst, dass HTML mit dem Thema Semantic Web rein gar nichts zu tun hat?

                          Dir ist aber schon bewusst, dass diese Aussage in ihrer Absolutheit größten Unsinn darstellt?
                          MfG, at

                          1. Hello out there!

                            Dir ist aber schon bewusst, dass HTML mit dem Thema Semantic Web rein gar nichts zu tun hat?

                            Dir ist aber schon bewusst, dass diese Aussage in ihrer Absolutheit größten Unsinn darstellt?

                            Nein. Und das ist wohl auch gut so.[tm]

                            See ya up the road,
                            Gunnar

                            --
                            “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
                            1. Hallo.

                              Dir ist aber schon bewusst, dass diese Aussage in ihrer Absolutheit größten Unsinn darstellt?

                              Nein.

                              Schade.
                              MfG, at

                        2. Hallo Gunnar,

                          Zur Beschreibung eigener Auszeichnungssprachen – besser gesagt: des eigenen Vokabulars – dienen RDF Schema und OWL, die von verarbeitender Software verstanden werden, weil sie auch in RDF geschrieben sind.

                          Das halte ich noch lange für ein Hirngespinst. Ehrlich.

                          Wahrscheinlich hab ich das in der Vergangenheit noch mal hier geschrieben, aber ich wiederhole es gerne noch einmal. Nehmen wir mal das Beispiel FOAF. Kennt die Software nur RDF und OWL und kann dieses verarbeiten, weiss sie nicht, dass das Element foaf:Person eine Person beschreibt. Es weiss nur, dass dieses Element, eine Klasse im Sinne von OWL ist. Das ist es auch schon, was sich in RDF Schema und OWL ausdrücken lässt, grundsätzliche Verbindungen zwischen abstrakten Konzepten.

                          Ok, es weiss noch, dass es im OWL-Sinne eine Subklasse von http://xmlns.com/wordnet/1.6/Person ist (und anderen Klassen ist). Was macht nun unsere findige Software? Sie dereferenziert diese URI und sucht nach weiteren in RDF notierten Informationen über das Konzept. Bis sie auf atomares Wissen stößt, dass sie kennt und mit dem sie etwas anfangen kann. Deswegen habe ich Person von wordnet genommen:

                          http://xmlns.com/wordnet/1.6/Person
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Organism
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Being
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Living\_thing
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Animate\_thing
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Object
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Physical\_object
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Entity
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Causal\_agent
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Cause
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Causal\_agency
                          ... ist eine Subklasse von ...
                          http://xmlns.com/wordnet/1.6/Entity

                          Man beachte den Kreis im Graphen. Und ja, dieses Beispiel stammt direkt aus dem RDF Schema von wordnet:Person. Nur gibt es da nicht weiter viel, guck es Dir selber an, alle URIs sind dereferenzierbar. Alles, was Wordnet tut, ist es die Klassifizierung von Konzepten untereinander abzubilden. Unsere fiktive RDF könnende Software weiss immer noch nicht, was foaf:Person ist, ausser dass es letztendlich eine Subklasse von wordnet:Entity ist. Genauso gut könnte foaf:Person foo:bar heissen und eine Subklasse von baz:qux sein. Der nur RDF könnenden Software ist das wurst. Semantik entsteht nicht dadurch, dass man RDF und OWL kann.

                          Im Falle von Wordnet ist die Semantik der Elemente im Wordnet Namensraum woanders definiert. Im für Maschinen eher unsinnigeren rdfs:description-Element, das nur eine Übername einer für Menschen lesbaren Definition ist. Und diese steht letztendlich in der Wordnet Lexical Database. Und jetzt sind wir am Punkt angekommen, wo Semantik wichtig ist: Der Autor der Software, die FOAF und andere auf Wordnet/RDF basierende Formate konsumieren will, muss die Semantik der Wordnet Konzepte kennen und diese in die eigene Übersetzen. Semantik entsteht also letztendlich immer noch bei der Rezeption von Informationen.

                          Dann kann man das Semantic Web auch sein lassen, höre ich da murmeln. Nicht unbedingt. Nein. Das Semantic Web ist ja nicht unbedingt derselbe axiomatisch basierte, universelle Aufbau von Wissen, der die AI die letzten Jahrzehnte beschäftigt hat. Sonst verstrickt man sich wieder im Aufbau von universellen Ontologien, die dann eh nicht funktionieren. Nein, RDF hat seine etwaige Stärke in einem normierten Beschreibungsmodell von Statements für Ad-Hoc-Ontologien. Und dass man eventuell lase Verbindungen zwischen diesen Ontologien basteln kann. Das ist die vage Hoffnung hinter dem Semantik Web – und das ist immer noch ein verdammt großes Ziel. Vielleicht klappt, vielleicht auch nicht. Ich finde es zumindest interessant.

                          Meine eigentliche Kernaussage sollte eigentlich sein: nur beliebige Daten in einem gedanklich passenden XML-Dialekt auszuzeichnen, der zufällig ein RDF Schema besitzt, bringt nix, schon gar keine Semantik. Es gibt keine RDF kapierende Software, die prinzipiell etwas damit anfangen kann, die sich sagt: Aha: Person. Es wird sie noch lange nicht geben. Ich vermute sogar: nie. Trotzdem gibt es Anwendungen, die FOAF verarbeiten. Nur: diese kümmern sich eher weniger um den RDF-Aspekt. Die behandeln FOAF genau das als es ist: als einen XML-Dialekt, den sie zufällig kennen, weil ihre Programmierer die mediokre FOAF-Spezifikation gelesen haben und die dort aufgeschriebene Bedeutung (Semantik) der Elemente in ihre Software importieren oder in eigene Konzepte übersetzen. Sie behandeln FOAF nur als XML, als strukturierte Daten, deren Bedeutung sie „kennen“. Nicht weil sie deren Bedeutung irgendwo nachforschen können – denn dort existiert wenig bis nichts.

                          (Mal ganz abgesehen davon, dass Foreign Markup in XHTML eh nicht erlaubt ist, ein XHTML-Dokument mit FOAF-Elementen also automatisch invalide ist.)

                          Tim

                          1. Zur Beschreibung eigener Auszeichnungssprachen – besser gesagt: des eigenen Vokabulars – dienen RDF Schema und OWL, die von verarbeitender Software verstanden werden

                            Das halte ich noch lange für ein Hirngespinst. Ehrlich.

                            nur beliebige Daten in einem gedanklich passenden XML-Dialekt auszuzeichnen, der zufällig ein RDF Schema besitzt, bringt nix, schon gar keine Semantik. Es gibt keine RDF kapierende Software, die prinzipiell etwas damit anfangen kann, die sich sagt: Aha: Person. Es wird sie noch lange nicht geben. Ich vermute sogar: nie.

                            Natürlich, Sprache verweist immer nur auf Sprache. Man kann einem Computer die Bedeutung von Wörtern durch andere Wörter erklären, das wird nie ein Ende haben oder eben einige Begriffe sind dermaßen elementar, dass sie nicht analysiert werden können. Das ist nicht sooo verwundlich. Außersprachliche Referenten gibt es für Computer nicht. Es gibt nichts Bezeichnetes, nur Bezeichnungen und logische Beziehungen dazwischen.

                            Was also heißt: eine Software »versteht« die Beschreibung einer Sprache? Nicht mehr als dass sie die Zusammenhänge der Begriffe dieser Sprache kennt. Ja, das leistet RDF/OWL. Von »Verstehen«, »Wissen« und »Kennen« im menschlichen Sinne kann man natürlich nicht sprechen.

                            Trotzdem gibt es Anwendungen, die FOAF verarbeiten. Nur: diese kümmern sich eher weniger um den RDF-Aspekt. Die behandeln FOAF genau das als es ist: als einen XML-Dialekt, den sie zufällig kennen, weil ihre Programmierer die mediokre FOAF-Spezifikation gelesen haben und die dort aufgeschriebene Bedeutung (Semantik) der Elemente in ihre Software importieren oder in eigene Konzepte übersetzen. Sie behandeln FOAF nur als XML, als strukturierte Daten, deren Bedeutung sie „kennen“. Nicht weil sie deren Bedeutung irgendwo nachforschen können – denn dort existiert wenig bis nichts.

                            Ich verstehe deine Kritik nicht, irgendwie ist das doch selbstverständlich. ;)
                            Natürlich könnte sich eine RDF-Software durch die Schemata und Ontologien wühlen. Irgendwann ist auch die letzte URI dereferenziert. Dann wird sie auch darauf kommen, dass foaf:Person eine wordnet:Person im Sinne einer totalen Ontologie ist. Dann »weiß« die Software alles und gleichzeitig nichts, ein weiteres Nachforschen ist unmöglich. Trotzdem reicht diese Repräsentierbarkeit des Wissens aus, um dem Rechner auf Basis dessen viele nützliche Anwendungen beizubringen.

                            Mathias

                2. Hello out there!

                  Man muss ja nicht auf <dfn title="Beruf">Schneider</dfn> verzichten, wenn man sich davon Hilfe erwartet.
                  Das W3C sagt: "DFN: Indicates that this is the defining instance of the enclosed term."
                  [snip]
                  Deswegen halte ich Schlagworte wie "semantisches Web" auch für überbewertet. Man _kann_ ganz viel auszeichnen - aber wenn man zu jeden geschrieben Wort noch zwei oder drei Metaebenen mitschleifen und ausfüllen _muss_, und man sich nicht mehr auf das Schreiben konzentrieren kann, dann schreckt das eher ab.

                  Du vermengst hier zwie völlig verschiedene Dinge: Auszeichnung in HTML und das Semantic Web. Das eine hat mit dem anderen nichts zu tun.

                  See ya up the road,
                  Gunnar

                  --
                  “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
              2. Hallo at,

                Man muss ja nicht auf <dfn title="Beruf">Schneider</dfn> verzichten, wenn man sich davon Hilfe erwartet.

                Wäre da <dfn class="Beruf">Schneider</dfn> nicht eher angebracht?

                Schöne Grüße,

                Johannes

                --
                ie:% fl:( br:< va:| ls:[ fo:) rl:) n4:? ss:| de:] js:| ch:} sh:) mo:| zu:)
                1. Hallo.

                  Wäre da <dfn class="Beruf">Schneider</dfn> nicht eher angebracht?

                  Wenn man den Umstand, den aus mehreren Wörtern bestehende Begriffe wie etwa "kleines Tier" gegebenfalls ergeben können, vernünftig handhaben kann und man darüber hinaus keine anderweitigen Klassen verwenden möchte oder einen Mechanismus dafür entwickelt, könnte man sicher auch Klassen verwenden. Einen Vorteil kann ich allerdings weder auf syntaktischer noch auf semantischer Ebene erkennen.
                  MfG, at

          2. Hallo.

            aber es ist ja mittlerweile hip, alles als Liste auszuzeichnen, nur weil es rein logisch einen Listencharakter hat.

            Ja, das nennt sich Semantik.
            MfG, at

            1. aber es ist ja mittlerweile hip, alles als Liste auszuzeichnen, nur weil es rein logisch einen Listencharakter hat.

              Ja, das nennt sich Semantik.

              Aha, und der Zusammenhang zum Semantic Web ist genau welcher? Inwiefern hilft diese Auszeichnung bei der Auswertbarkeit durch Maschinen?

              Wie gesagt kann man mit solchen Informationen im Sinne des Semantic Web nichts anfangen. Dafür gibt es andere Techniken, die die tatsächliche Bedeutung maschinenlesbar ausdrücken können, nicht nur »Sequenz irgendwelcher Informationen« oder »irgendwelche gleichwertige/alternative Informationen«.

              Mathias

              1. Moin!

                aber es ist ja mittlerweile hip, alles als Liste auszuzeichnen, nur weil es rein logisch einen Listencharakter hat.

                Ja, das nennt sich Semantik.

                Aha, und der Zusammenhang zum Semantic Web ist genau welcher? Inwiefern hilft diese Auszeichnung bei der Auswertbarkeit durch Maschinen?

                Wie gesagt kann man mit solchen Informationen im Sinne des Semantic Web nichts anfangen. Dafür gibt es andere Techniken, die die tatsächliche Bedeutung maschinenlesbar ausdrücken können, nicht nur »Sequenz irgendwelcher Informationen« oder »irgendwelche gleichwertige/alternative Informationen«.

                Die Information "Sequenz irgendwelcher Informationen" wird ja schon durch die Anordnung im Bytestream deutlich: Wäre etwas weiter vorn einzuordnen, stünde es weiter vorn.

                "Alles ist Liste?" Nein! <ul> bedeutet "Aufzählungspunkte". Man kann Schlagworte aufzählen. Man kann vielleicht auch Navigationspunkte aufzählen. Man kann aber nicht "Bildergaleriebilder mit Erklärtext" aufzählen. Würde man in normalen Texten als Autor jedenfalls nicht tun, und sollte man auch in HTML nicht wollen.

                - Sven Rautenberg

                --
                My sssignature, my preciousssss!
                1. Hallo.

                  Man kann Schlagworte aufzählen. Man kann vielleicht auch Navigationspunkte aufzählen. Man kann aber nicht "Bildergaleriebilder mit Erklärtext" aufzählen.

                  Es tut mir aufrichtig leid, dass du das nicht kannst. Vielleicht lernst du es ja noch.
                  MfG, at

                2. Hallo Sven,

                  ... <ul> bedeutet "Aufzählungspunkte".

                  <ul> bedeutet unordered lists
                  "Aufzählungspunkte" halte da für eine etwas seltsame Übersetzung.

                  Auf Wiederlesen
                  Detlef

                  --
                  - Wissen ist gut
                  - Können ist besser
                  - aber das Beste und Interessanteste ist der Weg dahin!
                  1. Hallo.

                    ... <ul> bedeutet "Aufzählungspunkte".

                    <ul> bedeutet unordered lists
                    "Aufzählungspunkte" halte da für eine etwas seltsame Übersetzung.

                    Zumindest für <li> könnte sie passen.
                    MfG, at

                    1. Hallo at

                      Zumindest für <li> könnte sie passen.

                      Wäre dann nicht <ld> (list dot) oder <lp> (list point) passender. ;-)

                      Auf Wiederlesen
                      Detlef

                      --
                      - Wissen ist gut
                      - Können ist besser
                      - aber das Beste und Interessanteste ist der Weg dahin!
                      1. Hallo.

                        Wäre dann nicht <ld> (list dot) oder <lp> (list point) passender. ;-)

                        HTML for Runnaways? Oder im Sinne des Objektbaumes: Why knot?
                        MfG, at

                3. Hello out there!

                  Man kann aber nicht "Bildergaleriebilder mit Erklärtext" aufzählen.

                  Man kann.

                  Würde man in normalen Texten als Autor jedenfalls nicht tun,

                  Ich würde.

                  und sollte man auch in HTML nicht wollen.

                  Warum sollte ich nicht?

                  See ya up the road,
                  Gunnar

                  PS: Na wenigstens hst du nicht geschieben „Würde man in Texten als normaler Autor jedenfalls nicht tun“. ;-)

                  --
                  “Remember, in the end, nobody wins unless everybody wins.” (Bruce Springsteen)
              2. Hallo.

                aber es ist ja mittlerweile hip, alles als Liste auszuzeichnen, nur weil es rein logisch einen Listencharakter hat.

                Ja, das nennt sich Semantik.

                Aha, und der Zusammenhang zum Semantic Web ist genau welcher?

                Wo du dort einen Zusammenhang siehst, ist mir schleierhaft.

                Inwiefern hilft diese Auszeichnung bei der Auswertbarkeit durch Maschinen?

                Sie ist semantisch korrekt; nicht mehr und nicht weniger habe ich gesagt.

                Wie gesagt kann man mit solchen Informationen im Sinne des Semantic Web nichts anfangen.

                Und deswegen sind sie "hip", also in deinem Sinne falsch?

                Dafür gibt es andere Techniken, die die tatsächliche Bedeutung maschinenlesbar ausdrücken können, nicht nur »Sequenz irgendwelcher Informationen« oder »irgendwelche gleichwertige/alternative Informationen«.

                Und deswegen soll man nicht als Liste auszeichnen, was "nur [...] rein logisch einen Listencharakter" hat?
                MfG, at

                1. Hallo at,

                  (Listen)
                  Sie ist semantisch korrekt; nicht mehr und nicht weniger habe ich gesagt.

                  Also wenn ich Dich recht verstehe: Für Dich ist es schon Semantik, mitzuteilen, dass Daten die Form einer Liste haben, auch wenn das eher weniger über die Daten selbst aussagt?

                  Tim

                  1. Hallo.

                    Hallo at,

                    (Listen)
                    Sie ist semantisch korrekt; nicht mehr und nicht weniger habe ich gesagt.

                    Also wenn ich Dich recht verstehe: Für Dich ist es schon Semantik, mitzuteilen, dass Daten die Form einer Liste haben, auch wenn das eher weniger über die Daten selbst aussagt?

                    Es ist die Form von Sematik, die HTML in erster Linie umsetzen kann. Das hat aber mit meiner Einschätzung in Bezug auf anderweitig integrierte Metadaten zunächst einmal wenig zu tun.
                    MfG, at

                2. Hallo,

                  Aha, und der Zusammenhang zum Semantic Web ist genau welcher?

                  Wo du dort einen Zusammenhang siehst, ist mir schleierhaft.

                  Das Topic lautete »Semantic Web«.

                  Inwiefern hilft diese Auszeichnung bei der Auswertbarkeit durch Maschinen?

                  Sie ist semantisch korrekt; nicht mehr und nicht weniger habe ich gesagt.

                  OK.

                  Wie gesagt kann man mit solchen Informationen im Sinne des Semantic Web nichts anfangen.

                  Und deswegen sind sie "hip", also in deinem Sinne falsch?

                  Nein. Natürlich sind sie korrekt in dem Sinne, dass sie eine bestimmte Struktur entsprechend auszeichnen.

                  Dafür gibt es andere Techniken, die die tatsächliche Bedeutung maschinenlesbar ausdrücken können, nicht nur »Sequenz irgendwelcher Informationen« oder »irgendwelche gleichwertige/alternative Informationen«.

                  Und deswegen soll man nicht als Liste auszeichnen, was "nur [...] rein logisch einen Listencharakter" hat?

                  Das kann man tun oder auch lassen, es hat einige positive Auswirkungen und deshalb »sollte« man es, aber vor allem »sollte« man sich um das Semantic Web kümmern, wenn einem soviel an der Semantik liegt.

                  Mathias

                  1. Hallo.
                    Wir sind uns einig. Mir ging es nur um das wiederholte Herumhacken auf der massenhaften Verwendung von Listen.
                    Wenn ein Autor etwas eher als Liste als etwa als Aneinanderreihung von Absätzen betrachtet, wird er eben eine Liste einsetzen, worüber sich im Einzelfall sicher auch streiten lässt.
                    MfG, at

      2. Hi,

        Na ja, mir stieß vor allem diese Formulierung etwas übel auf: "[...]Markierung für das Layout (HTML)[...]". Ich dachte immer, HTML hat nix mit Layout zu tun, ist ein unumstößliches Gesetz.

        ach so, das habe ich hier glatt überlesen. Das ist IMHO eine ganz "normale" Fehlformulierung, die den Zusammenhang, in dem sie steht, nicht beeinflusst.

        Zumal auch bei bester Technik ein Suchergebnis zur so gut sein kann wie das Denkvermögen des Users, der sucht...
        AI?
        Ich verstehe nicht ganz, worauf du damit hinaus willst...

        Eine Artificial Intelligence hat das Ziel, das Denken des Users nachzubilden. Dies ist beispielsweise Google schon recht gut gelungen, und zwar mit - diese Behauptung wage ich trotz Unkenntnis der Details - nichts, was wir auch nur annähernd als intelligent bezeichnen würden. Ein neuronales Netz o.ä. wird die Ergebnisse noch verbessern können.

        Ich denke nicht, dass dumme (a.k.a. ungünstige) Suchanfragen die gewünschten Ergebnisse bringen kann.

        Nimm den Kontext dazu, beispielsweise vorherige Anfragen dieses Users. Google ist bereits dabei, derlei Dinge zu implementieren. Unabhängig davon: Das Semantic Web verfolgt die Vision, eben diese Form der Einordnung effektiv zu ermöglichen, indem den Inhalten eine maschinenerkennbare Bedeutung zogeordnet wird. Auf den Berliner XML-Tagen 2004 wurde z.B. eine Suchmaschine vorgestellt, die "dem Suchbegriff ähnliche" Begriffe der Seiten ausgewertet und zweidimensional zueinander eingeordnet hat. Das Ergebnis war faszinierend: In unterschiedlichen Bereichen der so erzeugten "Landkarte" waren thematisch ähnliche Seiten, auch wenn sich die Bandbreite aller gefundenen Seiten über viele Themen erstreckte. Wenn es der Technik nun noch gelingt, den richtigen Bereich auszuwählen, sind wir wieder einen Schritt weiter.

        Cheatah

        --
        X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
        X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
        X-Will-Answer-Email: No
        X-Please-Search-Archive-First: Absolutely Yes
        1. Hi,

          eine Suchmaschine die z.B. diese grafischen Verbindungen und das Clustering einsetzt ist z.B. http://www.kartoo.com/, nur so als Beispiel das mir mal irgendwann über den Weg lief...

          MfG
          Rouven

          --
          -------------------
          ss:) zu:) ls:& fo:) de:< va:{ ch:? sh:) n4:( rl:? br:$ js:| ie:) fl:(
        2. Glück auf!

          Hi,

          "[...]Markierung für das Layout (HTML)[...]".
          ach so, das habe ich hier glatt überlesen. Das ist IMHO eine ganz "normale" Fehlformulierung, die den Zusammenhang, in dem sie steht, nicht beeinflusst.

          Das sehe ich etwas anders. Ich finde es unglaubwürdig, wenn jemand, der sich letztendlich mit genau dieser Problematik auseinandersetzt, den Fachterminus nicht richtig anzuwenden weiß. Dass die Fehlformulierung "normal" ist, ist m.E. genauso traurig wie in diesem Falle unnötig.

          Eine Artificial Intelligence hat das Ziel, das Denken des Users nachzubilden. Dies ist beispielsweise Google schon recht gut gelungen, und zwar mit - diese Behauptung wage ich trotz Unkenntnis der Details - nichts, was wir auch nur annähernd als intelligent bezeichnen würden. Ein neuronales Netz o.ä. wird die Ergebnisse noch verbessern können.

          Danke für die Erläuterung. Das kann ich in gewisser Weiese sogar nachvollziehen. Zum Thema neuronale Netze lasst mich bitte diesen Artikel meiner Uni empfehlen - allerdings muss ich zugeben, dass ich bisher nicht die Zeit hatte, mir das notwendige Wissen zum Verständnis selbstständig anzueignen, insofern enthalte ich mich einer Bewertung des Artikels an sich oder der Zugehörigkeit zu diesem Thema. Würde mich aber auch hier über Resonanz freuen, danke :)

          Ich denke nicht, dass dumme (a.k.a. ungünstige) Suchanfragen die gewünschten Ergebnisse bringen kann.
          Nimm den Kontext dazu, [...]
          Auf den Berliner XML-Tagen 2004 [...]

          Auch hier danke für die Detailinfos - die ich leider nicht weiter kommentieren kann, da ich gerade erst anfange, mich für dieses Thema zu interessieren und daher mein Wissen noch längst nicht groß genug ist, als dass ich mich kompetent zu diesem Thema äußern könnte oder wollte.

          Gruß,
          der Juve