Der Martin: Hashwertberechnung - Sonderzeichen -> doch noch ne Frage

Beitrag lesen

Hallo,

Das liegt glaube ich daran, dass wir "Text" unterschiedlich meinen. Für Dich ist es offenbar das, was Du im Text-Editor öffnest, also die XML-Datei; diese ist für mich XML. Text ist das, was mit XML-kompatiblen Methoden in dieses Dokument hineingebracht und aus ihm herausgelesen wird - also etwas, das (eventuell) nicht die Spur von XML enthält, auch kein "&".

da würde ich mit der Interpretation des Wortes "Text" aber auch eher zu Romys Ansicht tendieren. "Text" ist für mich in diesem Zusammenhang nichts Gegenständliches, kein Daten- oder Dateiformat, sondern eine Sichtweise, eine Betrachtungsvariante eines beliebigen Datenstroms. Wenn ich also beispielsweise ein HTML-Dokument "als Text öffne", dann verstehe ich darunter, den HTML-Quellcode so wie er ist als uninterpretierte Zeichenfolge in einem Texteditor zu betrachten. Also gerade mal eine Abstraktionsebene höher, als den Datenwust mit einem Hex-Editor zu betrachten.
Was du mit "Text" bezeichnest, verstehe ich dann eher unter dem Begriff Nutzdaten oder Nutzinhalt.

Die Frage ist dabei, ob Du das XML-Dokument an sich überprüfen möchtest, oder nur seine (bzw. einen Teil seiner) Inhalte?

Falls die Überprüfung nur der Sicherstellung der Datenintegrität dient (etwa um Übermittlungsfehler oder Manipulationen zu erkennen), ist das eigentlich egal. Es muss nur auf beiden Seiten dasselbe Verfahren verwendet werden.

Dann müssten, wie dedlfix schon sagt, auch XML-Tags, SGML-Kommentare, alle Whitespaces et cetera mit in den Hash-Algorithmus einfließen.

Das wäre für mich intuitiv selbstverständlich.

So long,
 Martin

--
Kleine Geschenke erhalten die Freundschaft.
Große verderben sie aber meist auch nicht.