Was du meinst ist eher, dass nicht sämtliche Programmiersprachen einfach nutzbare Schnittstellen zu diesen haben, wie es bei XML-Parsern wie libxml2 der Fall ist.
Richtig, das meinte ich.
Prinzipiell ist der Sinn von HTML5-Parsern gerade, sämtliche (X)HTML-Dokumente einheitlich verarbeiten zu können.
Ja, das ist bei HTML5 ein Vorteil da bei "Fehlern" exakt definiert ist, wie sich der Parser zu verhalten hat.
Dennoch ist eine HTML-Suppe schwieriger zu lesen (für einen Menschen) als ein XML-kompatibles Dokument.
Die Verarbeitungsregeln sind einfacher da die Fehlerbehandlung einfach sehr drakonisch ist - das hat imho. den essentiellen Vorteil, dass parser weniger komplex sein müssen und dadurch Fehler einfacher zu vermeiden sind.