Hallo Anton,
Würden sich utf-8 Dokumente überhaupt validieren lassen ?
Sicher, wieso sollten sie nicht.
Bei XHTML wird sogar standardmäßig utf-8 als Kodierung verwendet, da dass die XML Spezifikation vorschreibt.
Nochmal zur Begriffsklärung:
Zeichensatz: Der gesammte Zeichenvorrat, den man im Dokument verwenden kann. Direkt oder indirekt über Zeichenreferenzen.
Kodierung: Die Abbildung von Zeichen auf Bytes und umgekehrt
So sind diese Begriffe jedenfalls in der HTML-Spezifikation festgelegt.
In einem anderen Kontext kann man schon auf eine andere Verwendung stoßen.
Schriftart: Zuordnung von Zeichen zu Symbol.
Ob ein Zeichen dargestellt wird, hat also nichts mit dem Zeichensatz oder gar der Kodierung zu tun, sondern allein mit den installierten Schrifftarten. Ob Du ein deutsches Dokument in iso-... oder utf-8 codierst, ist also gleichgültig.
Unicode zu verwenden, wird eigentlich erst dann interessant, wenn man mehrere Sprachen in einem Dokument verwenden will oder wenn Seiten dynamisch erzeugt und sich nicht auf einen bestimmten Zeichensatz festlegen will.
Speicherst Du Deine Inhalte z.B. in utf-8 in einer Datenbank ab, bekommst Du keine Schwierigkeiten, wenn Du doch mal irgend ein ungewöhnliches Zeichen benötigst.
Anzumerken wäre vielleicht noch, dass es sich bei Unicode um einen Zeichensatz handelt, und es verschiedene Kodierungen utf-7/8/16(/32) gibt, um Unicodezeichen zu speichern.
Grüße
Daniel