Rainer S.: PS oder PDF zu HTML konvertieren

Beitrag lesen

hi,

Das dürfte problematisch werden. PDFs sind, je nach Input, wohl nicht mehr unbedingt in der Lage, den enthaltenen Text freizugeben, weil er in dieser Form garnicht mehr existiert (?), und für PS-Dateien dürfte unter Umständen das gleiche gelten (ich hab' mal in ein paar Dateien reingeschaut - etwas zu finden ist da mit bloßem Auge sehr schwierig).

ich denke aber doch, daß, zumindest, wenn der Input in Textform war und nicht,
wie bei uns hier in der Firma z.T. üblich, Schreiben in Word erstellt, dann ausgedruckt, eingescannt und
durch den Distiller gejagt werden, sich der ursprüngliche Text irgendwie
"rekonstruieren" läßt, da ja z.B. Google auch PDF-Dokumente im Web durchsucht
und als Text darstellt. Und genau das, was die da verwenden, dürfte das gesuchte sein.

Gruß aus Bilk

Rainer