Patrick: Batch Tool oder PHP Lösung zum PDF öffnen und Text auslesen?

Hi,

es wimmelt ja nur so von Bibliotheken und per Shell ausführbaren Programmen, die es erlauben, aus einem PHP-Skript heraus PDF Dateien zu erzeugen.

Umgekehrt allerdings habe ich da noch nicht das richtige gefunden. Gibt es/kennt wer etwas ähnliches - am allerallerliebsten ebenfalls als PHP Klasse realisiertes Tool, das es erlaubt, vorhandene PDF Dateien zu lesen und den - sofern enthalten - Text zurückliefert?

Ich kenne nur das PDF2HTML Tool, welches mit PDF995 in Windows-Umgebungen funktioniert. Genau so etwas bräuchte ich aber für eine Linux/Apache/PHP Umgebung.

Viele Grüße

Patrick

  1. Hello,

    es wimmelt ja nur so von Bibliotheken und per Shell ausführbaren Programmen, die es erlauben, aus einem PHP-Skript heraus PDF Dateien zu erzeugen.

    Das fand ich eben auf die Schnelle:

    http://www.transcom.de/transcom/de/tipps-tricks/acrobat/2001_pdf-in-text-konvertieren.htm

    Harzliche Grüße vom Berg
    http://www.annerschbarrich.de

    Tom

    --
    Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
    Nur selber lernen macht schlau

  2. Hello,

    und noch ein Treffer, der sich gut anliest:

    http://www.pdflib.com/products/tet/

    Du hättest vielleicht auch mal bei Google schauen sollen

    http://www.google.de/search?hl=de&q=PHP+Texte+aus+PDF+extrahieren&btnG=Suche&meta=

    Harzliche Grüße vom Berg
    http://www.annerschbarrich.de

    Tom

    --
    Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
    Nur selber lernen macht schlau

    1. Hello,

      und noch ein Treffer, der sich gut anliest:

      http://www.pdflib.com/products/tet/

      Das sieht top aus! Werde das mal testen, morgen!

      Du hättest vielleicht auch mal bei Google schauen sollen

      Hehe, ja - habe ich allerdings gemacht. Manchmal scheint's an der Wortwahl zu liegen, ich bin bei meiner Suche nicht auf viel brauchbares gestossen. Extrahieren ist der Clou ;-)

      Danke Dir.

      Grüße vom flachen Land,
      Patrick