n'abend,
Klar ist | nicht das richtige, aber wo mit sollte man das denn trennen?
Gar nicht. Es gibt keine Vorschrift, dass zwischen HTML-Tags Trennzeichen sein müssen.
Behandle die gesamte Datei als einen fortlaufenden String.
"gar nicht." und das trifft es wirklich auf den punkt.
ein paragraph <p> ... </p> wird in den seltensten fällen in nur einer einzigen zeile stehen... wenn du die html-datei in zeilen splittest (dir also ein array aufbaust) machst du dir nur unnötig arbeit.
du willst wahrscheinlich mit RegEx rumspielen... die php funktion preg_match() wird dir dabei unweigerlich über den weg laufen. (vergiss nicht, dass dein dein string über mehrere zeilen verteilt sein kann, also den multiline parameter setzen...)
weiterhin schönen abend...
wer braucht schon großbuchstaben?