pdf zu text... und vorher dekomprimieren? von Felix Riesterer, 02.12.2005 02:12

pdf zu text... und vorher dekomprimieren?

Felix Riesterer Homepage des Autors 02.12.2005 02:12

Liebe Forumler,

ich suche schon die halbe Nacht erfolglos nach einer Möglichkeit, mittels eines PHP-Skriptes eine komprimierte (und mit OpenOffice2 erstellte) PDF-Datei auszulesen (Text-Inhalte). Ich finde nichts, was mir weiterhilft.

fpdf und fpdi habe ich schon gesehen (Dank ans Archiv!), auch die pdf2string() eines Usercomments auf den PHP.net-Seiten habe ich ausprobiert...

Wenn ich mir meine mit OO2 erzeugte PDF ansehe, dann steht da mächtig kryptisches Zeichen-Wirrwarr drin, immer wieder mit Abschnitten, in denen etwas in dieser Art steht:

5 0 obj
<< /Length 6 0 R
/Filter /FlateDecode

stream

|(hier steht wieder irrer Zeichenwirrwarr)

Wenn ich meine gefundene pdf2string() (aus den User Comments von PHP.net) nutzen möchte, bräuchte ich (anscheinend, bin mir nicht sicher) eine unkomprimierte Version meiner PDF. Wie kann ich sie mit PHP vorher entkomprimieren?

Kennt jemand eine pdf-zu-text-oder-was-anderes-auswertbares-Klasse?

Liebe Grüße aus Ellwangen,

Felix Riesterer.

Beitrag melden

– Informationen zu den Bewertungsregeln

SELFHTML Forum - Ergänzung zur Dokumentation Übersicht

Felix Riesterer: pdf zu text... und vorher dekomprimieren?

Beitrag lesen

pdf zu text... und vorher dekomprimieren?

pdf zu text... und vorher dekomprimieren?