(<h.+>|<div>)(.*?)(<\/h.+|<\/div>)
Mir fehlt jedoch eine Idee wie ich zu jedem Match nun das übergeordnete Kapitel dazu finden und zum Beispiel in der ersten Capturing-Gruppe festhalten kann
Verwende XPath. Reguläre Ausdrücke sind für die Verarbeitung von HTML und dergleichen so geeignet wie eine Axt zum Schnitzen.