Quellcode und Suchmaschinen-Lesbarkeit
Kerstin Bischoff
- xml
0 Rouven0 Thomas J.S.
Hallo,
ich habe eine technisch recht einfache Site erstellt. Daten werden in *.xml Datein gehalten. Dargestellt wird das Ganze mit *.xsl.
2 Fragen bekomme ich nicht so recht gelöst.
Wenn ich meine XML-Datein im Browser aufrufe, wird alles sauber dargestellt. Gehe ich auf 'Quellcode anzeigen', sollte ich nicht wie jetzt das xml-Dokument sehen, sondern eine HTML Seite. Welche Einstellungen sind da erforderlich?
Wahrscheinlich hängt dieses Problem auch damit zusammen, dass Google die Seiten im Cache nicht richtig speichern kann. Hat jemand Erfahrung, was man bei XML beachten muss, damit man die Seiten von den Suchmaschinen ordentlich indiziert bekommt?
Danke sehr.
Kerstin Bischoff
Hi,
wer ist denn bei dir für die Transformation zuständig? Wenn du im Browser noch Zugriff auf den XML-Quelltext hast scheint das ja der Browser zu sein?! Das ist eine ganz heiße Sache, weil das meines Wissens nicht viele Browser mitspielen.
Was du eigentlich machen müsstest wäre die Transformation vom Server durchführen zu lassen. Dann würde für den Browser oder für Google oder ... alles so aussehen wie immmer, nämlich reiner HTML-Code.
MfG
Rouven
Hallo,
ja, das klingt nach einer Lösung. Nun bin ich schon noch ein Anfänger. Wie sag ich denn dem Server, dass er die Transformation durchführt? Oder muss ich das in den jeweiligen xml bzw. xsl Datein definieren?
Gruß Kerstin
Hi,
wer ist denn bei dir für die Transformation zuständig? Wenn du im Browser noch Zugriff auf den XML-Quelltext hast scheint das ja der Browser zu sein?! Das ist eine ganz heiße Sache, weil das meines Wissens nicht viele Browser mitspielen.
Was du eigentlich machen müsstest wäre die Transformation vom Server durchführen zu lassen. Dann würde für den Browser oder für Google oder ... alles so aussehen wie immmer, nämlich reiner HTML-Code.MfG
Rouven
Hi,
ich nehme an in deiner XML-Datei steht im Moment irgendwo sowas wie
<?xml-stylesheet type="text/xsl" href="test.xsl"?>
also irgendwie sagst du der Datei welches Stylesheet zu ihr gehört.
Nun, im Moment geht der Browser hin und liest das. Was du eigentlich brauchst ist eine serverseitige Technik, sei es in PHP/JSP/ASP-Skript oder ein Transformator für CGI. Hast du in deinem Webspace irgendwas davon zur Verfügung?
Eine einfache ASP-Datei könnte z.B. so aussehen:
<%
'Load the XML
set xml = Server.CreateObject("Microsoft.XMLDOM")
xml.async = false
xml.load(Server.MapPath("cd_catalog.xml"))
'Load the XSL
set xsl = Server.CreateObject("Microsoft.XMLDOM")
xsl.async = false
xsl.load(Server.MapPath("cd_catalog.xsl"))
Response.Write(xml.transformNode(xsl))
%>
MfG
Rouven
Hallo Rouven,
vielen Dank für das Beispiel. Ja genau, sowas wie <?xml-stylesheet type="text/xsl" href="test.xsl"?> habe ich in den XML's verwendet.
Ich habe auf dem Webserver PHP und CGI zur Verfügung. Gibt es da nicht schon kleine Tools aus dem Open Source Bereich, die genau diese Transformation tun? Das wäre doch sicher praktisch.
Es würde wahrscheinlich noch ein anderes Problem lösen. Wir möchten eine Suche einbauen, die die eigenen Seiten aktuell durchsucht (incl. PDFs). Da habe ich für XML auch noch nichts gefunden, jede Menge allerdings für HTML.
Viele Grüße,
Kerstin
Hi,
aber das ist ja alles überhaupt kein Problem (wobei etwas googlen geht nächstes Mal auch selber, gell :-) )
http://php.linux.pt/manual/en/function.xslt-process.php
MfG
Rouven
Na klar, aber so ein Tipp ist doch immer noch Gold wert und hilft sich zu orientieren ;-))
Danke,
Kerstin
Hi,
aber das ist ja alles überhaupt kein Problem (wobei etwas googlen geht nächstes Mal auch selber, gell :-) )
http://php.linux.pt/manual/en/function.xslt-process.phpMfG
Rouven
Hallo,
ich habe eine technisch recht einfache Site erstellt. Daten werden in *.xml Datein gehalten. Dargestellt wird das Ganze mit *.xsl.
2 Fragen bekomme ich nicht so recht gelöst.
Wenn ich meine XML-Datein im Browser aufrufe, wird alles sauber dargestellt. Gehe ich auf 'Quellcode anzeigen', sollte ich nicht wie jetzt das xml-Dokument sehen, sondern eine HTML Seite. Welche Einstellungen sind da erforderlich?
Da du deine XML/XSLT-Tranformation dem Browser überläßt, ist es normal, dass beim "Quelltext anzeigen" der XML-Code angezeigt wird (schließlich ist der die Quelle).
Wahrscheinlich hängt dieses Problem auch damit zusammen, dass Google die Seiten im Cache nicht richtig speichern kann.
Das hatdamit überhaupt nichts zu tun.
»»Hat jemand Erfahrung, was man bei XML beachten muss, damit man die Seiten von den Suchmaschinen ordentlich indiziert bekommt?
Eine Tranformation die am Server (und nicht im Browser) ausgeführt wird (siehe auch die Seite http://de.selfhtml.org/xml/intro.htm#parser) denn dann bekommen alle 'user agents' (Browser, Suchmaschinen, etc.) nur noch das HTML zu sehen.
Grüße
Thomas