Linuchs: Können Daten aus einem PDF-Dokument maschinell gelesen werden?

Beitrag lesen

Moin,

nun habe ich die Daten mit einem HTML-Formular eingesammelt.

Die Daten des Mitglieds werden aus der Datenbank übernommen, ebenso Liedtitel, die beim Tippen als Vorschläge erscheinen und angeklickt werden können.

Damit „frickel“ ich nun wieder ein PDF-Formular zurecht, das so aussieht wie das ursprüngliche. Drei Seiten sind als Bild unterlegt und die Datenfelder werden darauf absolut positioniert. Können - wie verlangt - auch geändert werden.

Die ganze Geschichte behagt mir nicht, da ich von PDFs keine Ahnung habe und - wie wir schon festgestellt haben - der Quellcode mit einem Texteditor nicht lesbar ist.

Die PDFs gehen über den Fachverband (gleichgestellt mit Landesverbänden) zum Deutschen Chorverband DCV und eventuell wieder zurück, damit der Chor eine Rechnung bekommt.

Können Daten aus einem PDF-Dokument maschinell gelesen werden?

Da stecken doch vermutlich Feldnamen drin, die ich nicht kenne. Habe heute beim DCV angerufen, der Fachmann ist in Urlaub.

In meiner PDF erstelle ich die Felder mit TCPDF so:

  // b1 Felder auf Blatt 1
  // name, width, height, align (R)ight. left; top 
$b1 = [
 ['mitglied_nr',             25, 6, '', 155,   62   ]
,['veranstalter',           105, 6, '',  23,  109   ]
...
  for ( $i=0; $i < count($b1); $i++ ) {
    if ( $arr_form[ $b1[$i][3] ] == 'R' ) {
      // Daten rechtsbuendig im Feld
      $pdf->TextField( $b1[$i][0],  $b1[$i][1]."mm",  $b1[$i][2]."mm",  ['alignment' => 'right'], ['v' => $arr_form[ $b1[$i][0] ]], $b1[$i][4]."mm",  $b1[$i][5]."mm", FALSE );
    } else {
      // Daten linksbündig im Feld
      $pdf->TextField( $b1[$i][0],  $b1[$i][1]."mm",  $b1[$i][2]."mm",  [], ['v' => $arr_form[ $b1[$i][0] ]], $b1[$i][4]."mm",  $b1[$i][5]."mm", FALSE );
    }
  }

(rechtsbündig klappt nicht)

Angenommen, ich würde die (geheimen) echten Feldnamen angeben, können die Daten dann maschinell ausgelesen werden?

Gruß Linuchs

Edit:

Die drei Hintergrund-Bilder (Seiten) richte ich so ein:

  $pdf->AddPage();
  // set background image
  $pdf->Image('gema_anmeldung_1_1.jpg', 0, 0, 210, 297, '', '', '', false, 300, '', false, false, 0);

Wobei die Bilder auf den Millimeter genau gleich groß sind. Aber die absolute mm-Angabe im Browser-Formular und für das PDF ist unterschiedlich.

0 98

ausfüllbare PDF-Datei im Browser nicht ausfüllbar

Linuchs
  • sonstiges
  1. 0
    Der Martin
    • formulare
    • pdf
    1. 0
      Linuchs
      1. 2
        Der Martin
        1. -1
          Linuchs
        2. 2
          seth
  2. 2
    Felix Riesterer
    1. 0
      Der Martin
    2. 1
      JürgenB
    3. 1
      Auge
      • html
      • sonstiges
      • usability
      1. 0
        Matthias Apsel
        1. 0
          Auge
          1. 0
            Matthias Apsel
    4. 0
      encoder
      1. 1
        Auge
        1. 0
          Felix Riesterer
        2. 0
          encoder
      2. 0
        Matthias Apsel
        1. 0
          encoder
          1. 0
            Der Martin
            • formulare
            • sonstiges
            1. 0
              Matthias Apsel
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
                2. 0
                  Julius
                  • formulare
                  • pdf
                  • sonstiges
                  1. 0
                    Camping_RIDER
                  2. 0
                    Matthias Apsel
                    1. 0
                      Julius
            2. 0
              Camping_RIDER
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
    5. 0
      Camping_RIDER
      1. 0
        Felix Riesterer
        1. 0
          Camping_RIDER
          1. 0
            Der Martin
            1. 0
              Camping_RIDER
          2. 0
            Felix Riesterer
            1. 0
              Felix Riesterer
              1. 1
                Camping_RIDER
            2. 0
              Camping_RIDER
    6. 0
      klawischnigg
  3. 0
    Raketenpsychopharmakologe
  4. 0
    Raketenbildschirmbetrachter
  5. 1
    Camping_RIDER
    1. 0
      Tabellenkalk
      1. 0
        Camping_RIDER
  6. 0

    Können Daten aus einem PDF-Dokument maschinell gelesen werden?

    Linuchs
    • pdf
    • php
    1. 0
      Matthias Apsel
      • sonstiges
      1. 0
        Autor
        • datenmodell
        • pdf
        • software
        1. 0
          Matthias Apsel
          1. 0
            Autor
            1. 0
              Matthias Apsel
              1. 0
                Autor
                1. 3
                  Camping_RIDER
                  1. 0
                    Autor
                2. 0
                  Matthias Apsel
        2. 0
          Der Martin
    2. 0
      Rolf B
      1. 0
        Julius
        1. 0
          Linuchs
          1. 0
            Matthias Apsel
            • zu diesem forum
          2. 0
            Julius
            1. 0
              Linuchs
              1. 0
                Julius
                1. 1
                  Matthias Apsel
                  1. 0
                    Linuchs
                    • menschelei
                    1. 0
                      Der Martin
                  2. 0
                    Julius
    3. 0
      Autor
      • pdf
      • php
      • software
      1. 0
        Raktendatenextraktor
        1. 0
          Raketendatenextraktor
          1. 0
            Raketendatenextraktor
            1. 3
              Camping_RIDER
              1. 0
                Raketendatenextraktor
                1. 0
                  Matthias Apsel
                  1. 0
                    Raketendatenextraktor
                    1. 0
                      Camping_RIDER
                      1. 0
                        Raketenwilli
                        • sonstiges
                        1. 0
                          Camping_RIDER
                          1. 0
                            Julius
                            1. 0
                              Der Martin
                              • pdf
                              • sonstiges
                          2. 0

                            Frühkybernetische Erfahrung ...

                            Raketenhistoriker
                            1. 0
                              Der Martin
              2. -1
                Raketendatenextraktor
                • humor
                • meinung
                1. 0
                  Der Martin
                  • meinung
                  1. -1
                    Raketendatenextraktor
                2. 3
                  Camping_RIDER
                  1. 2

                    Frickeln

                    Der Martin
                    • meinung
                    • sprache
                    1. 0
                      Matthias Apsel
                    2. 0
                      klawischnigg
                      1. 0
                        Der Martin
                  2. 0
                    Raketendatenextraktor
    4. 1
      encoder
  7. 0

    TCPDF: Seitenrand muss weg!

    Linuchs
    • php
    • sonstiges
    1. 0
      Matthias Apsel
      1. 0
        Linuchs
        1. 0
          Matthias Apsel
          1. 0
            Linuchs
    2. 0

      TCPDF: Seitenrand - Problem gelöst

      Linuchs