Rolf B: PDF über PHP/... auslesen

Beitrag lesen

Hallo Rudolf,

ich habe mir vorhin mal ein Mini-Exceldokument zusammengetippt ("Hallo Welt" war auch drin, dann die Zahlen 1 bis 5 und eine Summe über diese Zellen).

Das PDF enthielt eine Masse Binärkram, da war nämlich ein Font eingebettet, aber meine Zahlen und das Hallo Welt habe ich nicht gefunden.

PDF kann die Originaltexte enthalten, es kann aber auch irgendwas verqueres sein, das lediglich so dargestellt wird wie der Originaltext. Es ist ein Druckformat, kein Datenformat.

Die zuverlässigste Methode ist vermutlich ein OCR-Programm.

Rolf

--
sumpsi - posui - obstruxi