Felix Riesterer: pdf zu text... und vorher dekomprimieren?

Beitrag lesen

Liebe Forumler,

ich suche schon die halbe Nacht erfolglos nach einer Möglichkeit, mittels eines PHP-Skriptes eine komprimierte (und mit OpenOffice2 erstellte) PDF-Datei auszulesen (Text-Inhalte). Ich finde nichts, was mir weiterhilft.

fpdf und fpdi habe ich schon gesehen (Dank ans Archiv!), auch die pdf2string() eines Usercomments auf den PHP.net-Seiten habe ich ausprobiert...

Wenn ich mir meine mit OO2 erzeugte PDF ansehe, dann steht da mächtig kryptisches Zeichen-Wirrwarr drin, immer wieder mit Abschnitten, in denen etwas in dieser Art steht:

5 0 obj
<< /Length 6 0 R
   /Filter /FlateDecode

stream

|(hier steht wieder irrer Zeichenwirrwarr)

Wenn ich meine gefundene pdf2string() (aus den User Comments von PHP.net) nutzen möchte, bräuchte ich (anscheinend, bin mir nicht sicher) eine unkomprimierte Version meiner PDF. Wie kann ich sie mit PHP vorher entkomprimieren?

Kennt jemand eine pdf-zu-text-oder-was-anderes-auswertbares-Klasse?

Liebe Grüße aus Ellwangen,

Felix Riesterer.