Bio-logisch: PDF durchsuchen

Hallo,
ich habe ein PDF-Dokument (Inhaltsverzeichnis, kein Bild). Auf meiner HP soll ein User ein Stichwort eingeben können und ein Skript soll prüfen, ob das eingegebene Stichwort im PDF-Dokument vorkommt. Der Haken: Der User darf/soll das PDF-Dokument nicht sehen/öffnen können, sondern nur prüfen ob das Keyword enthalten ist. Muss ich das PDF-Dokument umkonvertieren (wenn ja, wie mache ich das schnell, denn das Dokument hat 500 Seiten) bzw. wie lässt sich das realisieren?

Viele Grüße
Bio-logisch

  1. Hallo,

    da würde ich vorschlagen:

    • das PDF zurück in Text (Plaintext) umwandeln (da gibt es viele Tools für)
    • den Text entweder in eine Datenbank oder ein Text-File* (txt, ohne Formatierung) speichern
    • PHP-Skript schreiben, das die Textdatei bzw. Datenbank durchsucht und das gewünschte Resultat (enthalten / nicht enthalten) liefert

    Soweit klar?

    Grüße, luti

    * Das Textfile dann in ein Verzeichnis legen, auf das von Außen nicht zugegriffen werden kann.

      • den Text entweder in eine Datenbank oder ein Text-File* (txt, ohne Formatierung) speichern

      Gibt es Tool für die Datenbankerstellung (SQL, etc)?

      Bio-logsich

      1. Hallo,

        Gibt es Tool für die Datenbankerstellung (SQL, etc)?

        In Deinem Fall würde ich wohl eher zu einer Textdatei tendieren, da Deine Datenbank mit genau 1 Eintrag in 1 Tabelle mit 1 Spalte etwas over-sized anmuten würde ...

        Wie meinst Du das mit einem Tool zur Erstellung? SQL ist schon ganz richtig, das ist die Abfragesprache, mit der Du Tabellen, etc. erstellen kannst. Aber wenn Du wirklich Null Ahnung von Datenbanken hast, dann siehe noch mal oben.

        Der für Dich schwierigere Part dürfte wohl das PHP-Skript sein ...

        Grüße, luti

        1. Gibt es eine Möglichkeit mit den Berechtigungen zu regeln, dass nur das PHP-Skript auf die TXT-Datei zugreifen kann?

          Bio-logisch

          1. Gibt es eine Möglichkeit mit den Berechtigungen zu regeln, dass nur das PHP-Skript auf die TXT-Datei zugreifen kann?

            Ja genau. Einfach das Verzeichnis per .htaccess auf "deny from all" setzen. Dann kann die Datei niemand mehr direkt öffnen, aber das Skript noch drauf zugreifen. Das PHP-Skript muss dann natürlich in einem anderen Verzeichnis liegen, sonst kann es vom Nutzer nicht mehr aufgerufen werden ...

            Grüße, luti

            1. Auf meinem Server (T-Online) darf ich keine htaccess-Dateien hochladen, kann nur die Berechtigungen per FTP ändern.

              Bio-logsich

              1. Hallo,

                Das ist schlecht. ;) Dann wird es so wohl nicht gehen.

                Grüße, luti