snitch: PDF als Text auslesen - Quellcode?

Beitrag lesen

Morgen zusammen,

ich muss in nächster Zeit eine Menge PDF-Dateien auslesen bzw. den Text herausfiltern und mit HTML auszeichnen.
Ich habe vollen Zugriff auf die Dokumente.

Gibt es eine Möglichkeit an den Quellcode der Datei zu kommen - evtl. mit irgendwelchen speziellen Tools?
Dann könnte man vllt. mit suchen/ersetzen das Ganze halbautomatisch machen ...

Grüße,
snitch