Zu einer optimalen Lösung gehören also mindestens diese drei Schritte:
- Entitys weglassen, weil sie wegen UTF-8 nicht benötigt werden (Ausnahmen: HTML-eigene Zeichen und besondere Whitespace-Zeichen (z.B. , ­))
Und auch Zeichen die schwer unterscheiden kann - z.B. das Minus-Zeichen, den Gedankenstrich oder einen Bindestich.