Jochen: Textsuche in PDF-Dateien

Hallo,
ich habe das Programm Textcrawler, das in allen Dateien eines Verzeichnisses sucht, allerdings findet das Programm nichts in PDF-Dateien. Kennt jemand ein Programm, mit dem man auch in PDF-Dateien suchen kann?
Gruß
Jochen

  1. Hallo

    ich habe das Programm Textcrawler, das in allen Dateien eines Verzeichnisses sucht, allerdings findet das Programm nichts in PDF-Dateien. Kennt jemand ein Programm, mit dem man auch in PDF-Dateien suchen kann?

    Ich kann dir leider kein Programm zur Textsuche in PDF-Dateien nennen. Allerdings möchte ich auf folgendes hinweisen.

    In PDF-Dateien kann Text enthalten sein, muss es aber nicht. Speziell bei eingescannten Dokumenten kommt es auf das verwendete Programm und/oder auf den Workflow an, ob das Dokument nur als Bild gescannt und genau so in die PDF-Datei eingefügt wird, oder ob eine Texterkennung stattfindet (Stichwort „OCR“) und der erkannte Text als Text in der PDF-Datei landet. Ob das bei dir überhaupt zutrifft, kannst allerdings nur du einschätzen.

    Tschö, Auge

    --
    „Habe ich mir das nur eingebildet, oder kann der kleine Hund wirklich sprechen?“ fragte Schnapper. „Er behauptet, nicht dazu imstande zu sein“ erwiderte Victor. Schnapper zögerte (…) „Nun …“ sagte er schließlich, „ich schätze, er muss es am besten wissen.“ Terry Prattchett, Voll im Bilde
    1. Hallo,

      In PDF-Dateien kann Text enthalten sein, muss es aber nicht.

      Und wenn Text enthalten ist, dann kann jedes PDF-Anzeigeprogramm diesen Text auch durchsuchen. Ausnahmen mögen existieren, dürften dann aber keine weite Verbreitung erlangt haben…

      Gruß
      Kalk

    2. Hi,

      In PDF-Dateien kann Text enthalten sein, muss es aber nicht. Speziell bei eingescannten Dokumenten kommt es auf das verwendete Programm und/oder auf den Workflow an, ob das Dokument nur als Bild gescannt und genau so in die PDF-Datei eingefügt wird, oder ob eine Texterkennung stattfindet (Stichwort „OCR“) und der erkannte Text als Text in der PDF-Datei landet.

      Ergänzung: Erkennbar ist's im PDF-Betrachter daran, ob sich Text zeichen-/wortweise im PDF selektieren läßt …

      cu,
      Andreas a/k/a MudGuard