Tim Tepaße: RDF und XHTML

Beitrag lesen

Hallo Flock,

Ich möchte meine Webseite für das Semantic Web aufbereiten. RDF schreiben scheint kein Problem zu sein

Ich habe die Erfahrung gemacht, dass ein anständiges RDF zu schreiben durchaus mit einigem Gehirnschmalz verbunden ist. Es geht ja weniger um die Serialisierung in XML, schließlich kann man RDF auch in N3 schreiben, sondern um die Dinge, die man ausdrücken will. Und dort die richtige Kombination von Ausdrucksmöglichkeiten zu finden, die RDF (und OWL) einem bieten ist schwer. Vor allem, weil man sich da sehr schnell in Architekturastronautik verlieren kann, Stichwort Reification und ad hoc haufenweise neu erfundene Schemata. Irgendeine der unzähligen möglichen Serialisierungen in XML dieser gedanklichen Aussagen über abstrakte Dinge zu basteln ist dagegen leicht.

Mir scheint – aber vielleicht unterstelle ich Dir das nur – das Dir das noch nicht so ganz klar ist, weswegen ich Dir noch mal ans Herz legen möchte, die RDF Spezifikationen zu studieren, nicht nur den RDF Primer, auch wenn dieser der beste Eingang in den Themenkomplex ist.

Wie genau binde ich RDF in ein (X)HTML-Dokument ein?

Der mögliche RDF-Client – ausser Proof of Concepts die Malprogramme des RDF-Graphens kenne ich kaum etwas sinnvolles – muss schon RDF/XML (bevorzugt) oder RDF/N3 erhalten, um die Metadaten überhaupt parsen zu können. Dafür ist es da. Es gibt nun die Möglichkeit, RDF mittels komischer Kommentar-Strukturen in HTML einzubinden, die Verweise auf die Ideen dazu hat Dir Thomas gegeben. Es gibt natürlich keine Software, die damit etwas anfangen kann, aber wenn man erst mal in den Tiefen der Illusion „Semantic Web“ versinkt, kümmert man sich eh nicht um solch schnöde Dinge wie Praxis. XHTML 2 soll mehr Möglichkeiten bieten, die gedanklichen RDF-Tripel in HTML ausdrücken zu können, ist aber auch ein Luftschloss.

Aber im Prinzip ist das auch nur eine dieser dämlichen Umwege des real existierenden Webs, eine Verhunzung des Konzeptes World Wide Web. Weil – ich muss mal etwas ausholen:

http://domain.example/bla

Was ist das für Dich? Eine URI. Und was verbirgst sich hinter dieser URI? Nein, es ist kein HTML-Datei im Dateisystem. Im real existierenden Web ist das so. Im tatsächlichen Web aber nicht. Dort bezeichnet eine URI eine Ressource, ein gedankliches Konstukt. Das kann eine Person sein, ein Dokument, einen Zigarettenstummel. Manche URIs kann man aufrufen, oft werden die dann URL genannt, eine der vielen Verwirrungen rund ums Netz. In W3C-Lingo wird das dann dereferenzieren genannt. Man erhält dann eine Repräsentation dieser Ressource, ein tatsächliches von Computern interpretierbares Dokument. Das kann ein HTML-Dokument sein. Das kann aber auch ein Bild sein. Oder ein PDF. Oder eine Audiodatei, in der der „Besitzer“ der Ressource den Inhalt auf klingonisch im Sopran trällert. Whatever. Eine Ressource hat also soviele Repräsentationen, wie  der dahinterstehende Autor Nerv für Implementierungen hat. Also im real existierenden Web eher weniger. ;)

Eine Repräsentation einer Ressource kann dann ein HTML-Dokument mit dem MIME Media Typ text/html sein. Eine andere kann ein RDF-Dokument mit dem MIME Media Typ application/rdf+xml sein. Das Metadaten über diese Ressource enthält. Oder über eine ganz andere Ressource. Wenn man erst mal anfängt nur noch in Ressourcen zu denken, ist die erstere Version natürlich sinniger. Der Knackpunkt ist: Im Semantic Web denkt man eigentlich nur noch in Ressourcen. Und weniger in konkreten Repräsentationen. Wer jetzt hier laut Luftschloss brüllen möchte, darf.

Tim