Linuchs: ausfüllbare PDF-Datei im Browser nicht ausfüllbar

0 98

ausfüllbare PDF-Datei im Browser nicht ausfüllbar

Linuchs
  • sonstiges
  1. 0
    Der Martin
    • formulare
    • pdf
    1. 0
      Linuchs
      1. 2
        Der Martin
        1. -1
          Linuchs
        2. 2
          seth
  2. 2
    Felix Riesterer
    1. 0
      Der Martin
    2. 1
      JürgenB
    3. 1
      Auge
      • html
      • sonstiges
      • usability
      1. 0
        Matthias Apsel
        1. 0
          Auge
          1. 0
            Matthias Apsel
    4. 0
      encoder
      1. 1
        Auge
        1. 0
          Felix Riesterer
        2. 0
          encoder
      2. 0
        Matthias Apsel
        1. 0
          encoder
          1. 0
            Der Martin
            • formulare
            • sonstiges
            1. 0
              Matthias Apsel
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
                2. 0
                  Julius
                  • formulare
                  • pdf
                  • sonstiges
                  1. 0
                    Camping_RIDER
                  2. 0
                    Matthias Apsel
                    1. 0
                      Julius
            2. 0
              Camping_RIDER
              1. 0
                Der Martin
                1. 0
                  Camping_RIDER
    5. 0
      Camping_RIDER
      1. 0
        Felix Riesterer
        1. 0
          Camping_RIDER
          1. 0
            Der Martin
            1. 0
              Camping_RIDER
          2. 0
            Felix Riesterer
            1. 0
              Felix Riesterer
              1. 1
                Camping_RIDER
            2. 0
              Camping_RIDER
    6. 0
      klawischnigg
  3. 0
    Raketenpsychopharmakologe
  4. 0
    Raketenbildschirmbetrachter
  5. 1
    Camping_RIDER
    1. 0
      Tabellenkalk
      1. 0
        Camping_RIDER
  6. 0

    Können Daten aus einem PDF-Dokument maschinell gelesen werden?

    Linuchs
    • pdf
    • php
    1. 0
      Matthias Apsel
      • sonstiges
      1. 0
        Autor
        • datenmodell
        • pdf
        • software
        1. 0
          Matthias Apsel
          1. 0
            Autor
            1. 0
              Matthias Apsel
              1. 0
                Autor
                1. 3
                  Camping_RIDER
                  1. 0
                    Autor
                2. 0
                  Matthias Apsel
        2. 0
          Der Martin
    2. 0
      Rolf B
      1. 0
        Julius
        1. 0
          Linuchs
          1. 0
            Matthias Apsel
            • zu diesem forum
          2. 0
            Julius
            1. 0
              Linuchs
              1. 0
                Julius
                1. 1
                  Matthias Apsel
                  1. 0
                    Linuchs
                    • menschelei
                    1. 0
                      Der Martin
                  2. 0
                    Julius
    3. 0
      Autor
      • pdf
      • php
      • software
      1. 0
        Raktendatenextraktor
        1. 0
          Raketendatenextraktor
          1. 0
            Raketendatenextraktor
            1. 3
              Camping_RIDER
              1. 0
                Raketendatenextraktor
                1. 0
                  Matthias Apsel
                  1. 0
                    Raketendatenextraktor
                    1. 0
                      Camping_RIDER
                      1. 0
                        Raketenwilli
                        • sonstiges
                        1. 0
                          Camping_RIDER
                          1. 0
                            Julius
                            1. 0
                              Der Martin
                              • pdf
                              • sonstiges
                          2. 0

                            Frühkybernetische Erfahrung ...

                            Raketenhistoriker
                            1. 0
                              Der Martin
              2. -1
                Raketendatenextraktor
                • humor
                • meinung
                1. 0
                  Der Martin
                  • meinung
                  1. -1
                    Raketendatenextraktor
                2. 3
                  Camping_RIDER
                  1. 2

                    Frickeln

                    Der Martin
                    • meinung
                    • sprache
                    1. 0
                      Matthias Apsel
                    2. 0
                      klawischnigg
                      1. 0
                        Der Martin
                  2. 0
                    Raketendatenextraktor
    4. 1
      encoder
  7. 0

    TCPDF: Seitenrand muss weg!

    Linuchs
    • php
    • sonstiges
    1. 0
      Matthias Apsel
      1. 0
        Linuchs
        1. 0
          Matthias Apsel
          1. 0
            Linuchs
    2. 0

      TCPDF: Seitenrand - Problem gelöst

      Linuchs

Moin,

Kunde stellt mir eine ausfüllbare PDF-Datei zur Verfügung, die ich korrekt auf seiner Seite verlinke:

PDF

Nun meldet er, dass er nichts in die Felder eingeben kann.

Er hat wenig Ahnung, kennt nichtmal seinen Browser und ich muss die Glaskugel bemühen:

Offenbar hat er diese PDF-Datei - wie beim Klick auf den Link vorgeschlagen - in seinem Browser geöffnet.

Das kann ich nachvollziehen. Wenn ich diese PDF in meinem Firefox unter Ubuntu öffne, sind die Eingabefelder tot, nicht zu beschriften.

Wenn ich den Link aber mit dem - bei mir - alternativ angebotenen Dokumentenbetrachter öffne, kann ich Eingaben vornehmen und das Dokument nach (mühsamer) Suche auf eine Schaltfläche, die das Speichern ermöglicht, auch speichern.

Dann im Mailprogramm wiederfinden und anhängen, da sind DAUs vollkommen überfordert.

Kennt ihr diese Problematik, habt ihr eine Lösung?

Linuchs

Edit: Ich bin von 19 - 71 Lebensjahren in der EDV tätig und wollte das eigentlich als Freiberufler bis 75 durchziehen. Draußen scheint die Sonne, lockt der Garten. Wegen dieser Scheiß-Technik, die im Sonnenlicht unlesbare Displays bietet, muss ich in die dunkle Höhle des Büros statt frei auf der Terasse zu arbeiten. Es kotzt mich an. Vier Jahre vor dem Ziel verlässt mich die Motivation.

  1. Hallo,

    Kunde stellt mir eine ausfüllbare PDF-Datei zur Verfügung, die ich korrekt auf seiner Seite verlinke:

    PDF

    Nun meldet er, dass er nichts in die Felder eingeben kann.

    Er hat wenig Ahnung, kennt nichtmal seinen Browser und ich muss die Glaskugel bemühen:

    Offenbar hat er diese PDF-Datei - wie beim Klick auf den Link vorgeschlagen - in seinem Browser geöffnet.

    wenn sein Browser überhaupt irgendwas gefragt hat. Die Defaultkonfiguration ist doch eher, dass Browser, die PDF inzwischen selbst anzeigen können (z.B. Firefox), das auch ohne Rückfrage tun, die anderen das PDF-Dokument mit Hilfe eines Plugins darstellen.
    Wenn man etwas anderes will, muss man selbst in die Konfiguration eingreifen.

    Ich habe meine Browser so eingerichtet, dass sie mich fragen, ob ich das PDF-Dokument speichern oder im Default-PDF-Viewer anzeigen möchte.

    Das kann ich nachvollziehen. Wenn ich diese PDF in meinem Firefox unter Ubuntu öffne, sind die Eingabefelder tot, nicht zu beschriften.

    Glaube ich gern. Die native PDF-Unterstützung in Firefox lässt zu wünschen übrig.

    Wenn ich den Link aber mit dem - bei mir - alternativ angebotenen Dokumentenbetrachter öffne, kann ich Eingaben vornehmen und das Dokument nach (mühsamer) Suche auf eine Schaltfläche, die das Speichern ermöglicht, auch speichern.

    Schaltfläche? Ich empfehle Ctrl-S oder File/Save As in der Menüleiste.

    Dann im Mailprogramm wiederfinden und anhängen, da sind DAUs vollkommen überfordert.

    Ja, das kann ich mir vorstellen.

    Kennt ihr diese Problematik, habt ihr eine Lösung?

    Ein visuell und inhaltlich ähnliches HTML-Formular.

    Live long and pros healthy,
     Martin

    --
    Home is where my beer is.
    1. Hallo Martin,

      Ein visuell und inhaltlich ähnliches HTML-Formular.

      Ja klar, ist in Arbeit. Kunde ist ungeduldig, stellt sich eine Fall-back Lösung vor. Das PDF ist doch perfekt, wieso verhindere ich, dass es ausgefüllt werden kann?

      Und hier bei SelfHTML werde ich vermutlich geprügelt, das PDF-Formular als Hintergrund-Bild zu zeigen mit dem millimeter-genau darübergelegten HTML-Formular. Es ist absolut, nicht relativ.

      Tatsächlich messe ich X Y und width der Eingabe-Felder am Bildschirm mit dem Lineal aus.

      Und dann passen die drei A4-Seiten der GEMA nicht in das Briefmarken-Format eines Smartphones. Blinde und taube Nutzer könnten verwirrt sein.

      So laufen hier doch die Diskussionen und ich bin müde, sie zu begleiten.

      Die Bedenkenträger hier mit ihren „wertvollen“ Absichten und den Hinweisen auf nicht vorhandene Bananenschalen zum Ausrutschen machen mir keinen Spaß mehr.

      Ich glaube, ich nable mich so langsam ab.

      Linuchs

      1. n'Abend Karl-Heinz,

        Ein visuell und inhaltlich ähnliches HTML-Formular.

        Ja klar, ist in Arbeit. Kunde ist ungeduldig, stellt sich eine Fall-back Lösung vor. Das PDF ist doch perfekt, wieso verhindere ich, dass es ausgefüllt werden kann?

        ich verstehe den Vorwurf, aber das ist doch Quatsch. Nicht du bist derjenige, der da Steine in den Weg schmeißt, sondern die Herausgeber der Mainstream-Browser.

        Abgesehen davon: Das PDF-Format war noch nie eine gute Wahl, wenn es um Integration im Web geht. Webseiten sollen dynamisch, responsiv sein; PDF ist genau das Gegenteil davon, ein in Stein gemeißeltes Druckbild eines Dokuments.

        Und hier bei SelfHTML werde ich vermutlich geprügelt, das PDF-Formular als Hintergrund-Bild zu zeigen mit dem millimeter-genau darübergelegten HTML-Formular. Es ist absolut, nicht relativ.

        Angesichts der Voraussetzungen glaube ich nicht, dass irgendwer dich dafür prügeln wird. Nicht einmal virtuell. Aber der Ansatz wäre nur eine Zwischenlösung.

        Tatsächlich messe ich X Y und width der Eingabe-Felder am Bildschirm mit dem Lineal aus.

        Ja. Aber besser wäre IMO, das Formular mit einer gewissen Flexibilität nachzubauen.

        Und dann passen die drei A4-Seiten der GEMA nicht in das Briefmarken-Format eines Smartphones. Blinde und taube Nutzer könnten verwirrt sein.

        Auch das könnte man deutlich verbessern, wenn man das Formular HTML-basiert nachbaut.

        Ich glaube, ich nable mich so langsam ab.

        Das wäre sehr schade. Bitte schlaf noch zwei- bis dreimal darüber, bevor du dich endgültig entschiedest.

        Live long and pros healthy,
         Martin

        --
        Home is where my beer is.
        1. Hallo Martin,

          Ja. Aber besser wäre IMO, das Formular mit einer gewissen Flexibilität nachzubauen.

          Mit dem Auftraggeber (Chorverband) komme ich menschlich gut zurecht, wir nehmen gemeinsam an Festivals teil. Aber seine statische Vorstellung von Webseiten ist sehr engstirnig.

          Und ich fürchte, die meisten Anwender (Verbandsmitglieder) im fortgeschrittenen Alter haben Probleme, wenn das alte GEMA-Formular anders daherkommt.

          Ich habe keinen Kontakt zu den Anwendern, muss meine (trübe) Glaskugel befragen, wie die damit klarkommen.

          Eigentlich ein unangenehmer Auftrag, macht nicht wirklich Spaß und ich ziehe ihn in die Länge mit Hoffnung auf himmlische Eingebungen. Doch ich bin der Webmaster, muss da durch.

          Das wäre sehr schade. Bitte schlaf noch zwei- bis dreimal darüber, bevor du dich endgültig entschiedest.

          Ja, die virtuellen Kollegen bei SelfHTML würden mir sehr fehlen. Mir sind alle sympathisch, auch wenn sie mal am Thema vorbeischreiben. Gerade die Pausengespräche waren erfrischend. Und genau die werden nun mehr und mehr beschnitten.

          Ich hatte schon mal so eine Erfahrung.

          Vor Jahren gab es bei med1.de (Forum Café "Chez Gautier“) befruchtende Diskussionen zu Philosophie und Weltanschauung. Ich wurde sensibilisiert mit den Hintergründen des Syrien-Krieges. Die Beiträge wurden immer dünner und man entschied sich, auf der Startseite „Neueste Beiträge“ dieses Forum zu verschweigen. Mehr und mehr Kontrolle und Löschung von Beiträgen in vorauseilendem Gehorsam gegen links, rechts, vermuteten Antisemiten und Rassisten. Kurzum: Meinungen außerhalb des Mainstreams wurden zensiert. Auch da musste ich einige wertvolle Diskussionspartner abschreiben, bin längst nicht mehr dabei, lasse mich doch nicht zensieren.

          Linuchs

        2. gudn tach!

          Nicht du bist derjenige, der da Steine in den Weg schmeißt, sondern die Herausgeber der Mainstream-Browser.

          naja, das wiederum koennte auch daran liegen, dass PDF insg. ein kaum vernuenftig implementierbares format ist. dass es standardisiert ist, heisst nicht, dass man es auch als developer einfach benutzen kann. pdf ist quasi-proprietaer und adobe hat das quasi-monopol darauf. meines wissens hat es noch niemand sonst geschafft, das format (eigentlich: die vielzahl der darunter fallenden formate) vollstaendig zu implementieren. zumindest unter linux kenne ich kein freies tool, dass mit pdf-formularen vollstaendig zurechtkommt. ich bekomme immer wieder mal pdf-files, bei denen nur die haelfte der formularfelder ausfuellbar ist oder automatische berechnungen nicht funktionieren. klar, man kann die schuld den viewer-entwicklern geben. ich gebe sie aber adobe und dem pdf-konsortium.

          Abgesehen davon: Das PDF-Format war noch nie eine gute Wahl, wenn es um Integration im Web geht.

          meiner ansicht nach auch in vielen anderen faellen nicht, z.b. formulare, protokolle, bilder(sammlungen), ...

          Webseiten sollen dynamisch, responsiv sein; PDF ist genau das Gegenteil davon, ein in Stein gemeißeltes Druckbild eines Dokuments.

          ja, fuer den druck eignen sich einige pdf-unterformate sehr gut.

          ich denke ebenfalls (wie Der Martin), dass html sich fuer formulare besser eignet -- und zwar sowohl aus ersteller-sicht als auch aus anwender-sicht.

          denkbar waere auch, dass (falls das ergebnis eine pdf-datei sein muss) du die eingabe per html abfragst, dann aber serverseitig ein pdf daraus baust und dieses als ergebnis auslieferst.

          gruss seth

  2. Lieber Linuchs,

    ich bin nach wie vor der Meinung, dass die Idee eines ausfüllbaren PDF eine verfehlte Idee ist. In meinen Augen ist PDF digitales Papier, also ein fertiger Ausdruck, der als digitale Kopie vorliegt. Daran etwas verändern zu wollen passt nicht in diese Idee.

    Natürlich kann ich mir vorstellen, dass man einen Mechanismus haben will, an dessen Ende ein durch eine Benutzereingabe vervollständigtes PDF steht. Aber meiner Meinung nach ist dafür ein PDF als Arbeitsdokument der falsche Weg. In meinen Augen ist da eine Anwendung sinnvoller, die das PDF am Ende erzeugt, aber für den Prozess der Verarbeitung andere Quellen benutzt. Das kann durchaus ein geschütztes Office-Dokument sein, das man am Ende in eine PDF "ausdruckt", oder alternativ eine Webanwendung, die eine PDF zum Download versendet.

    Aber mit dieser Denkweise bin ich relativ allein.

    Liebe Grüße

    Felix Riesterer

    1. Hallo Felix,

      Aber mit dieser Denkweise bin ich relativ allein.

      aber nicht ganz. 😀

      Live long and pros healthy,
       Martin

      --
      Home is where my beer is.
    2. Hallo Felix,

      ich bin nach wie vor der Meinung, dass die Idee eines ausfüllbaren PDF eine verfehlte Idee ist.

      wenn man den Adobe-Kosmos nicht verlässt, funktioniert das sehr gut. Wir haben eine Campuslizenz für die Acrobat-Vollversion.

      Leider haben unsere Studierenden nicht alle einen Acrobat zu Hause, daher erhalte ich etwa 1/4 der Prüfungsanmeldungen „teilelektrisch“: drucken - ausfüllen - scannen - mailen.

      Aber mit dieser Denkweise bin ich relativ allein.

      wegen der Lizenzbedingunbgen von Adobe ist das bei uns auch immer wieder ein Thema. Ziel sollte eigentlich sein, Formulare online z.B. im Browser auszufüllen, und die „Unterschrift“ ist durch den Login oder ein persönliches Zertifikat gegeben. Aber so etwas geht nur firmenintern.

      Gruß
      Jürgen

    3. Hallo

      +1 von mir für deine Ausführungen und …

      Aber mit dieser Denkweise bin ich relativ allein.

      … ein virtuelles -1 dafür.

      Gereade in Linuchs' gefühlt im einmonatlichen Rhythmus erstellten Threads zum Thema Formulare in PDF im Web wird typischerweise von mehreren Seiten immer wieder darauf hingewiesen, dass das Format nicht dazu geeignet ist, Linuchs' Aufgabenstellungen zu erfüllen (egal, ob selbstgewählte oder fremdbestimmte Aufgaben) (du bist also keineswegs allein).

      Jürgens Ausführungen nebenan stützen das. Selbst mit einer Firmen- oder Uni-Lizenz für Acrobat ist man am Arsch, weil doch nicht alle Beteiligten überall die selben Voraussetzungen erfüllen können. Das Problem tritt bei Linuchs' Auftraggeber ja nicht aus Jux und Dallerei auf. Verschiedene Programme (und Plugins) implementieren den PDF-Standard nun einmal in unterschiedlichem Umfang und in unterschiedlicher Qualität.

      HTML mit einem Serverbackend (PHP?), welches aus den Eingaben die PDF generiert, würde die Bedingungen für die Nutzer herabsetzen. Ein HTML-Formular bleibt eben in jedem Browser ein HTML-Formular und es gibt wohl nur wenige Features, die nicht überall funktionieren. Dass man sich damit die Tür für eine flexible Anzeige im Browser offenhält, ist eine erwünschte Nebenwirkung.

      Das von Linuchs befürchtete Unverständnis bei den/einigen Nutzern kann ich allerdings grundsätzlich nachvollziehen. Mancher (nicht nur ältere Semester) kommt eben nicht damit klar, wenn etwas nicht so daherkommt, wie es sonst immer™️ war. Das sollte sich aber mit einem zum GEMA-Original vergleichbaren Formularaufbau minimieren lassen (Bereiche und Felder in der gleichen Reihenfolge, identische Beschriftungen). Das Formular sollte sich wiedererkennen lassen, auch, wenn es im Browser anders aussieht, als auf dem Papier.

      Bei einem engstirnigen Auftraggeber ist allerdings viel Überzeugungsarbeit nötig oder im schlimmsten Fall Hopfen und Malz verloren. Wobei man manchmal auch nur mit einer anderen, funktionierenden Lösung um die Ecke kommen muss, um Bedenken auszuräumen oder gar Widerstand zu brechen.

      Tschö, Auge

      --
      Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
      Hohle Köpfe von Terry Pratchett
      1. Hallo Auge,

        Aber mit dieser Denkweise bin ich relativ allein.

        … ein virtuelles -1 dafür.

        Auch ich stimme in diesem Fall mit Felix’ Ansicht überein.

        Das sollte sich aber mit einem zum GEMA-Original vergleichbaren Formularaufbau minimieren lassen (Bereiche und Felder in der gleichen Reihenfolge, identische Beschriftungen). Das Formular sollte sich wiedererkennen lassen, auch, wenn es im Browser anders aussieht, als auf dem Papier.

        Ich könnte mir auch vorstellen, dass das HTML-Formular nur relativ ungestylte label-input-Paare enthält und daneben eine Miniaturansicht des Formulars zu sehen ist, in der das Pendant zum fokussierten input-Feld hervorgehoben ist.

        Bis demnächst
        Matthias

        --
        Du kannst das Projekt SELFHTML unterstützen,
        indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
        1. Hallo

          Aber mit dieser Denkweise bin ich relativ allein.

          … ein virtuelles -1 dafür.

          Auch ich stimme in diesem Fall mit Felix’ Ansicht überein.

          Wahrscheinlich lest ihr andere Threads als ich. Linuchs hingegen scheint die selben Threads wie ich zu lesen. Anders kann ich mir seine Abwehrhaltung gegenüber den hiesigen „Bedenkenträgern“ nicht erklären. Nein, ich erkenne icht, dass Felix in dieser Hinsicht mit seiner Meinung alleine steht.

          Das sollte sich aber mit einem zum GEMA-Original vergleichbaren Formularaufbau minimieren lassen (Bereiche und Felder in der gleichen Reihenfolge, identische Beschriftungen). Das Formular sollte sich wiedererkennen lassen, auch, wenn es im Browser anders aussieht, als auf dem Papier.

          Ich könnte mir auch vorstellen, dass das HTML-Formular nur relativ ungestylte label-input-Paare enthält und daneben eine Miniaturansicht des Formulars zu sehen ist, in der das Pendant zum fokussierten input-Feld hervorgehoben ist.

          Das ist auch eine Möglichkeit, Zutrauen zur anderen Darstellung zu schaffen.

          Tschö, Auge

          --
          Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
          Hohle Köpfe von Terry Pratchett
          1. Hallo Auge,

            Aber mit dieser Denkweise bin ich relativ allein.

            … ein virtuelles -1 dafür.

            Auch ich stimme in diesem Fall mit Felix’ Ansicht überein.

            Wahrscheinlich lest ihr andere Threads als ich. Linuchs hingegen scheint die selben Threads wie ich zu lesen. Anders kann ich mir seine Abwehrhaltung gegenüber den hiesigen „Bedenkenträgern“ nicht erklären. Nein, ich erkenne icht, dass Felix in dieser Hinsicht mit seiner Meinung alleine steht.

            Zumindest ich stimme mit Felix’ Meinung überein.

            Bis demnächst
            Matthias

            --
            Du kannst das Projekt SELFHTML unterstützen,
            indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
    4. ein fertiger Ausdruck, der als digitale Kopie vorliegt. Daran etwas verändern zu wollen passt nicht in diese Idee.

      Man denke an Formulare die man in ausgedruckter Form irgendwo abgeben muss, etwa bei einer Behörde.
      Das Formular wird von der Behörde so erstellt wie es aussehen muss. Da ist pdf das sinnvollste, denn das kann so gut wie jeder öffnen ohne ein Officeprogramm zu haben.
      Individuell ausgefüllte Felder kann man dann gleich am Bildschirm ausfüllen bevor man das ganze ausdruckt, was in der Regel schöner aussieht als wenn jeder in seiner eigenen Handschrift ausfüllt.

      1. Hallo

        ein fertiger Ausdruck, der als digitale Kopie vorliegt. Daran etwas verändern zu wollen passt nicht in diese Idee.

        Man denke an Formulare die man in ausgedruckter Form irgendwo abgeben muss, etwa bei einer Behörde.
        Das Formular wird von der Behörde so erstellt wie es aussehen muss. Da ist pdf das sinnvollste, denn das kann so gut wie jeder öffnen ohne ein Officeprogramm zu haben.

        Das Öffnen der Datei ist ja offensichtlich nicht das Problem. Es ist die Möglichkeit, das in der Datei befindliche Formular auszufüllen, die mal besteht und ein anderes Mal eben nicht. Benutzern stehen unterschiedliche PDF-Clients zur Verfügung. Aufgrund der konkreten Browserkonfiguration wird eine PDF-Datei bei einem an ein Programm, bei einem anderen an ein Plugin weitergereicht, in dem das benötigte Feature eventuell nicht implementiert ist. Die Berichte in diesem Thread beweisen es ja, dass das PDF-Formular in einem Programm ausfüllbar ist, und in einem anderen nicht. Darum dreht sich ja hier alles.

        Tschö, Auge

        --
        Ein echtes Alchimistenlabor musste voll mit Glasgefäßen sein, die so aussahen, als wären sie beim öffentlichen Schluckaufwettbewerb der Glasbläsergilde entstanden.
        Hohle Köpfe von Terry Pratchett
        1. Liebes Auge,

          Das Öffnen der Datei ist ja offensichtlich nicht das Problem. Es ist die Möglichkeit, das in der Datei befindliche Formular auszufüllen, die mal besteht und ein anderes Mal eben nicht.

          für solche Fälle würde ich mir für mich wünschen, dass ich auf einer Website von einem Assistenten geführt werde, der die von mir gewünschten Daten abfragt, um am Ende des Prozesses ein PDF zu erzeugen, welches ich dann speichern kann und in dem meine Daten in ihrem gewünschten Drucklayout angeordnet sind.

          Benutzern stehen unterschiedliche PDF-Clients zur Verfügung. [...] Die Berichte in diesem Thread beweisen es ja, dass das PDF-Formular in einem Programm ausfüllbar ist, und in einem anderen nicht. Darum dreht sich ja hier alles.

          Bei meiner Wunschvorstellung interagiert der Benutzer mit einer Webapplikation, die er auf übliche Weise im Browser mit Tastatur/Maus/Touchgerät bedienen kann und die am Ende ein fertiges Druckdokument (PDF) erzeugt. Das klappt zuverlässiger, als beim Benutzer darauf zu spekulieren, dass er einen PDF-Client verwendet, der die Features x, y und z beherrscht. Vor allem dann, wenn die eingegebenen Daten später weiterverarbeitet werden sollen, ist dieser Weg ohnehin sinnvoller, da die Datenerhebung neben der PDF-Erzeugung gleich noch ein optimales Speicherformat (DB?) nutzen kann, als dass man die ausgefüllte PDF (halbautomatisch) wieder auswerten muss.

          Liebe Grüße

          Felix Riesterer

        2. Die Berichte in diesem Thread beweisen es ja, dass das PDF-Formular in einem Programm ausfüllbar ist, und in einem anderen nicht. Darum dreht sich ja hier alles.

          Nicht alles 😉
          Das worauf ich mich bezog war der Sinn eines ausfüllbaren pdf an sich. unabhängig davon wo das funktioniert und wo nicht.

      2. Hallo encoder,

        Man denke an Formulare die man in ausgedruckter Form irgendwo abgeben muss, etwa bei einer Behörde.
        Das Formular wird von der Behörde so erstellt wie es aussehen muss. Da ist pdf das sinnvollste, denn das kann so gut wie jeder öffnen ohne ein Officeprogramm zu haben.
        Individuell ausgefüllte Felder kann man dann gleich am Bildschirm ausfüllen

        Genau das ist ja der Punkt. Dies funktioniert eben nicht zuverlässig. Und schon gar nicht für nicht web-affine Menschen.

        Bis demnächst
        Matthias

        --
        Du kannst das Projekt SELFHTML unterstützen,
        indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
        1. Individuell ausgefüllte Felder kann man dann gleich am Bildschirm ausfüllen

          Genau das ist ja der Punkt. Dies funktioniert eben nicht zuverlässig.

          Ich verstehe die Gedanken schon.
          Aber wenn ich aufgrund meiner Systemausstattung ein solches Formular nicht direkt ausfüllen kann, kann ich es ja immer noch unausgefüllt ausdrucken und per Hand ausfüllen. Wer es ausfüllen kann hat einen Vorteil, ohne dass andere einen Nachteil haben.

          Dass sowas nicht für alle Anwendungsfälle geeignet ist, ist mir schon klar. Ich wollte nur darstellen dass ich ein ausfüllbares Formular nicht grundsätzlich widersinnig finde.

          1. Hallo,

            Ich verstehe die Gedanken schon.
            Aber wenn ich aufgrund meiner Systemausstattung ein solches Formular nicht direkt ausfüllen kann, kann ich es ja immer noch unausgefüllt ausdrucken und per Hand ausfüllen. Wer es ausfüllen kann hat einen Vorteil, ohne dass andere einen Nachteil haben.

            ja, soweit stimme ich zu. Aber mein Standpunkt war die Gegenüberstellung von PDF-Formular vs. "handelsübliches" HTML-Formular.

            Welchen Vorteil hat der Nutzer, der das PDF gleich am Rechner ausfüllen kann? Er muss es danach immer noch speichern und dann wieder irgendwohin hochladen oder per e-Mail schicken.
            Oder gibt es PDF-Viewer, die ein ausgefülltes Formular gleich online wieder versenden können? Falls ja, wäre meine Kritik hinfällig und das PDF-Formular wäre für die, die es nutzen können, wirklich eine runde Sache. Falls nein, ist es nur eine halbgare Lösung, eine Krücke.

            Dass sowas nicht für alle Anwendungsfälle geeignet ist, ist mir schon klar. Ich wollte nur darstellen dass ich ein ausfüllbares Formular nicht grundsätzlich widersinnig finde.

            Ich auch nicht, aber es ist eben nur eine halbfertige Lösung.

            Live long and pros healthy,
             Martin

            --
            Home is where my beer is.
            1. Hallo Der Martin,

              Oder gibt es PDF-Viewer, die ein ausgefülltes Formular gleich online wieder versenden können?

              Free-PDF und Flexi-PDF können zumindest gleich per Mail versenden.

              Screenshot "PDF an E-Mail anhängen"

              Online wie ein HTML-Formular wird wohl nicht gehen.

              Bis demnächst
              Matthias

              --
              Du kannst das Projekt SELFHTML unterstützen,
              indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
              1. Hallo Matthias,

                Oder gibt es PDF-Viewer, die ein ausgefülltes Formular gleich online wieder versenden können?

                Free-PDF und Flexi-PDF können zumindest gleich per Mail versenden.

                Screenshot "PDF an E-Mail anhängen"

                ah ja, daran hatte ich gar nicht mehr gedacht. Diese Funktion bieten tatsächlich viele Programme (nicht nur PDF-Viewer). Damit wäre zwar nach Browser und PDF-Viewer noch ein drittes Programm involviert, nämlich der Mailclient. Aber immerhin wäre es eine geschlossene Verarbeitungskette.

                Online wie ein HTML-Formular wird wohl nicht gehen.

                Technisch wäre das gar kein Problem. In den Metadaten des PDF-Formulars müsste irgendwo die Ziel-URL hinterlegt sein, an die das Formular dann gesendet werden soll, und der PDF-Viewer würde dann einfach einen HTTP-Request beim Betriebssystem "bestellen".

                Live long and pros healthy,
                 Martin

                --
                Home is where my beer is.
                1. Aloha ;)

                  Technisch wäre das gar kein Problem. In den Metadaten des PDF-Formulars müsste irgendwo die Ziel-URL hinterlegt sein, an die das Formular dann gesendet werden soll, und der PDF-Viewer würde dann einfach einen HTTP-Request beim Betriebssystem "bestellen".

                  Du stellst dir das zu einfach vor. Dafür müssten die Felder im PDF-Formular auch entsprechend beschriftet sein, es müssten eventuell doch wieder Formatprüfungen her, der Reader, der das verschickt, darf keine Fehler bei der Interpretation machen (was eh der Flaschenhals ist) und so weiter und so fort.

                  Nein: PDF-Formulare sind kein gleichwertiger Ersatz für HTML-Formulare und werden das auch niemals sein.

                  Das Einsatzgebiet ist ein völlig anderes.

                  Grüße,

                  RIDER

                  --
                  Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                  # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
                2. Hallo Martin,

                  Online wie ein HTML-Formular wird wohl nicht gehen.

                  Technisch wäre das gar kein Problem. In den Metadaten des PDF-Formulars müsste irgendwo die Ziel-URL hinterlegt sein, an die das Formular dann gesendet werden soll, und der PDF-Viewer würde dann einfach einen HTTP-Request beim Betriebssystem "bestellen".

                  In Scribus kann ich einen Button anlegen, dem man als Aktion das Versenden des Formulars an eine zu definierende URL mitgeben kann. Für mich sieht es genau nach dem aus, was du da beschreibst.

                  Als Formate stehen im Dropdown zur Auswahl:

                  • FDF
                  • HTML
                  • XPDF
                  • PDF

                  Vermutlich funktioniert das eh nur mit Acrobat-Produkten[1], sodass wir wieder beim schlichten Formular mit Webtechnologien wären...

                  Gruß
                  Julius


                  1. Vor Jahren habe ich mal spaßeshalber mit den interaktiven Funktionen von PDFs herumgespielt, war ernüchtert und habe diese Technik deshalb und wegen der schlechten Dokumentation als den Webtechnologien unterlegen eingestuft. ↩︎

                  1. Aloha ;)

                    Vermutlich funktioniert das eh nur mit Acrobat-Produkten[^1]

                    Genau! Mein LO Writer bietet auch vielfältige Möglichkeiten für PDF-Formulare. Wirklich stabil in möglichst vielen verschiedenen Readern (sofern sie eben überhaupt PDF-Formulare verstehen) funktioniert aber nur das einfache Textfeld ohne weiteren Schnickschnack und die Checkbox.

                    Deshalb mache ich bewusst mit allem Anderen keine Experimente, weil ich es für noch problematischer halte, wenn ein Formular im Reader der Wahl nur halb ausfüllbar ist, als wenn es gar nicht direkt ausfüllbar ist.

                    Grüße,

                    RIDER

                    --
                    Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                    # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
                  2. Hallo Julius,

                    In Scribus kann ich einen Button anlegen, dem man als Aktion das Versenden des Formulars an eine zu definierende URL mitgeben kann. Für mich sieht es genau nach dem aus, was du da beschreibst.

                    Als Formate stehen im Dropdown zur Auswahl:

                    • FDF
                    • HTML
                    • XPDF
                    • PDF

                    Flexi-PDF kann das auch so. Allerdings XFDF statt XPDF, vielleicht war es auch nur eiun Tipfelherr.

                    Bis demnächst
                    Matthias

                    --
                    Du kannst das Projekt SELFHTML unterstützen,
                    indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
                    1. Hallo Matthias,

                      Als Formate stehen im Dropdown zur Auswahl:

                      • FDF
                      • HTML
                      • XPDF
                      • PDF

                      Flexi-PDF kann das auch so. Allerdings XFDF statt XPDF, vielleicht war es auch nur eiun Tipfelherr.

                      Oh ja, es ist tatsächlich XFDF.

                      Gruß
                      Julius

            2. Aloha ;)

              Oder gibt es PDF-Viewer, die ein ausgefülltes Formular gleich online wieder versenden können?

              Nein, nicht so direkt wie du dir das vorstellst.

              Falls ja, wäre meine Kritik hinfällig und das PDF-Formular wäre für die, die es nutzen können, wirklich eine runde Sache. Falls nein, ist es nur eine halbgare Lösung, eine Krücke.

              Nein, keine halbgare Lösung. Eine Lösung für ein anderes Problem!

              Ja, PDF-Formulare sind keine Lösung, wenn man die eingegebenen Daten automatisiert weiterverarbeiten will bzw. das Formular in selber Form wieder ausgefüllt bekommen will. Dafür ist in der Tat ein HTML-Formular mit entsprechendem Server-Backend die Lösung.

              PDF-Formulare sind aber sehr wohl dann eine Lösung, wenn man ein Formular, das ausgedruckt (in analoger Form, oder gleichwertig, z.B. eingescannt in digitaler Form) irgendwo abgegeben werden soll, für Benutzer möglichst komfortabel gestalten will.

              Ich z.B. fülle Formulare, die irgendwo handschriftlich unterschrieben eingereicht werden sollen, gerne überall außer bei der Unterschrift mit dem PC aus. Hat den zusätzlichen Vorteil, dass man das PDF mit den Angaben gleich speichern kann und damit eine digitale Kopie für die eigenen Unterlagen gleich fertig hat, außerdem halt ich's für besser lesbar; es macht für mich einen besseren Eindruck.

              Die Unterschrift hingegen leiste ich gerne von Hand. Es gibt nur ganz wenige Fälle, in denen ich meine Unterschrift digital in ein PDF einfüge. Dafür besitze ich eine, die zumindest ich direkt wiedererkenne. Weil ich das nur selten tu und einen Überblick darüber habe, steigt für mich die (mindestens gefühlte) Fälschungssicherheit meiner Unterschrift - denn Fälschungssicherheit ist meiner Meinung nach bei digital eingefügten Unterschriften ein Problem.

              Grüße,

              RIDER

              --
              Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
              # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
              1. Moin,

                Oder gibt es PDF-Viewer, die ein ausgefülltes Formular gleich online wieder versenden können?

                Nein, nicht so direkt wie du dir das vorstellst.

                das ist auch mein Kenntnisstand, aber ich wusste es nicht sicher.

                Falls nein, ist es nur eine halbgare Lösung, eine Krücke.

                Nein, keine halbgare Lösung. Eine Lösung für ein anderes Problem!

                Ja, PDF-Formulare sind keine Lösung, wenn man die eingegebenen Daten automatisiert weiterverarbeiten will bzw. das Formular in selber Form wieder ausgefüllt bekommen will. Dafür ist in der Tat ein HTML-Formular mit entsprechendem Server-Backend die Lösung.

                Von dieser Zielsetzung bin ich ausgegangen.

                Die Unterschrift hingegen leiste ich gerne von Hand. Es gibt nur ganz wenige Fälle, in denen ich meine Unterschrift digital in ein PDF einfüge. Dafür besitze ich eine, die zumindest ich direkt wiedererkenne. Weil ich das nur selten tu und einen Überblick darüber habe, steigt für mich die (mindestens gefühlte) Fälschungssicherheit meiner Unterschrift - denn Fälschungssicherheit ist meiner Meinung nach bei digital eingefügten Unterschriften ein Problem.

                In der Firma ist das digitale "Unterschreiben" von Dokumenten eigentlich die Regel. Also was heißt Unterschreiben - genaugenommen ist es nur das Einfügen einer Grafik ins PDF-Dokument. Um Missbrauch und/oder Fälschung zumindest zu erschweren, gilt allerdings, dass die zu diesem Zweck eingescannte Unterschrift quer über den Firmenstempel geschrieben wurde. Das nachträglich wieder herauszupixeln, um die Unterschrift woanders einsetzen zu können, ist relativ aufwendig und dürfte im Ergebnis wohl nicht mehr überzeugend aussehen.

                Live long and pros healthy,
                 Martin

                --
                Home is where my beer is.
                1. Aloha ;)

                  In der Firma ist das digitale "Unterschreiben" von Dokumenten eigentlich die Regel. Also was heißt Unterschreiben - genaugenommen ist es nur das Einfügen einer Grafik ins PDF-Dokument. Um Missbrauch und/oder Fälschung zumindest zu erschweren, gilt allerdings, dass die zu diesem Zweck eingescannte Unterschrift quer über den Firmenstempel geschrieben wurde. Das nachträglich wieder herauszupixeln, um die Unterschrift woanders einsetzen zu können, ist relativ aufwendig und dürfte im Ergebnis wohl nicht mehr überzeugend aussehen.

                  Das ist richtig, aber das Gesamtpaket aus Firmenstempel und Unterschrift, das ja eine Grafik ist (wenn ich's richtig verstanden habe?) ist dann immer noch entführbar und missbrauchbar.

                  Aber egal wie: Ohne geeignete weitere echt sichere Methode (z.B. signierten PDFs) sind digitale Unterschriften immer prinzipiell missbrauchbar. Analoge Unterschriften allerdings auch, also ist die Relevanz meines Arguments an dieser Stelle relativ.

                  Grüße,

                  RIDER

                  --
                  Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                  # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
    5. Aloha ;)

      Aber mit dieser Denkweise bin ich relativ allein.

      Du beziehst dich vermutlich damit u.a. auf eine unserer Diskussionen zu dem Thema. Vielleicht kann ich an der Stelle ein Missverständnis ausräumen: Wir sind von den Denkweisen her gar nicht so weit voneinander entfernt. Ich versuch mal, das runterzubrechen:

      Du sagst: Dieses Feature sollte es in PDF nicht geben.

      Ich sage: Dieses Feature sollte es in PDF geben, man sollte sich aber nicht darauf verlassen, dass es eingesetzt wird.

      Auch ein PDF ohne Formularfelder lässt sich am PC unproblematisch manipulieren. Am einfachsten mit Programmen, die PDF direkt bearbeiten können - z.B. LibreOffice Draw, oder eben via Umweg indem man das PDF als Hintergrund in ein Writer-Dokument einbindet. Daraus wird dann am Ende nach Bearbeitung wieder eine PDF.

      Das heißt: PDF war nie so gedacht, dass man es nicht verändern kann. Der Gedanke für PDF ist eher, dass ein Ausdruck in einer genau vorher definierten Art und Weise möglich ist. Insofern: Ja, virtuelles Papier, Nein, durchaus veränderbar.

      Und eben dieses "veränderbar", das in PDF schon immer auf die eine oder andere Art gegeben war, kann durch PDF-Formulare via progressive enhancement für einige Nutzer eine deutliche Verbesserung der UI zufolge haben, da sie einen Teil der Daten am PC vorausfüllen können, wenn sie das wollen.

      Es muss aber eben progressive enhancement sein und man darf sich nicht auf ein Ausfüllen der PDF-Formularfelder via PC verlassen.

      Grüße,

      RIDER

      --
      Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
      # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
      1. Lieber Camping_RIDER,

        Du sagst: Dieses Feature sollte es in PDF nicht geben.

        habe ich das gesagt?

        Ich sage: Dieses Feature sollte es in PDF geben, man sollte sich aber nicht darauf verlassen, dass es eingesetzt wird.

        Wenn man sich nicht darauf verlassen sollte (Deine Formulierung), wozu will man das Feature dann überhaupt einsetzen? Es geht ja schließlich auch anders!

        Auch ein PDF ohne Formularfelder lässt sich am PC unproblematisch manipulieren.

        Digitale Dokumente ohne kryptographische Mechanismen, welche beweisen könnten, ob ihr Inhalt verändert wurde, lassen sich immer und grundsätzlich ändern. Das ist in meinen Augen eine Binsenweisheit.

        Das heißt: PDF war nie so gedacht, dass man es nicht verändern kann.

        Interessante Schlussfolgerung... ;-)

        Der Gedanke für PDF ist eher, dass ein Ausdruck in einer genau vorher definierten Art und Weise möglich ist. Insofern: Ja, virtuelles Papier,

        Daher ja auch der Name portable document format. Es soll auf jedem System gleich aussehen.

        Und eben dieses "veränderbar", das in PDF schon immer auf die eine oder andere Art gegeben war, kann durch PDF-Formulare via progressive enhancement für einige Nutzer eine deutliche Verbesserung der UI zufolge haben, da sie einen Teil der Daten am PC vorausfüllen können, wenn sie das wollen.

        Und der Fallback?

        Es muss aber eben progressive enhancement sein und man darf sich nicht auf ein Ausfüllen der PDF-Formularfelder via PC verlassen.

        Jetzt sag doch schon, wie der passende Fallback dazu aussieht! Und wenn ich den ohnehin benötige, wozu dann das Feature überhaupt? Rest siehe weiter unten.

        Liebe Grüße

        Felix Riesterer

        1. Aloha ;)

          Wenn man sich nicht darauf verlassen sollte (Deine Formulierung), wozu will man das Feature dann überhaupt einsetzen? Es geht ja schließlich auch anders!

          Ja. Mit mehr Aufwand. Der ist manchmal nicht gerechtfertigt, wenn es nur darum geht, Usern, die das benutzen können, ein wenig mehr Komfort zu geben.

          Die Antwort ist etwa die selbe, wie wenn du fragen würdest, warum man bei nicht-vitalen JavaScript-Features lieber auf progressive enhancement setzt, als sich seine Seite mit Polyfills vollzuladen.

          Auch ein PDF ohne Formularfelder lässt sich am PC unproblematisch manipulieren.

          Digitale Dokumente ohne kryptographische Mechanismen, welche beweisen könnten, ob ihr Inhalt verändert wurde, lassen sich immer und grundsätzlich ändern. Das ist in meinen Augen eine Binsenweisheit.

          Ja eben! Wie kommst du denn darauf, dass PDF nicht veränderbar sein soll, wenn es keine Mechanismen gibt, die genau diese Unveränderbarkeit erreichen sollen?!?

          Der Gedanke für PDF ist eher, dass ein Ausdruck in einer genau vorher definierten Art und Weise möglich ist. Insofern: Ja, virtuelles Papier,

          Daher ja auch der Name portable document format. Es soll auf jedem System gleich aussehen.

          Exakt.

          Und eben dieses "veränderbar", das in PDF schon immer auf die eine oder andere Art gegeben war, kann durch PDF-Formulare via progressive enhancement für einige Nutzer eine deutliche Verbesserung der UI zufolge haben, da sie einen Teil der Daten am PC vorausfüllen können, wenn sie das wollen.

          Und der Fallback?

          Besteht in Drucker, Stift und eventuell Scanner. Solange die eingegebenen Daten nachher nicht automatisiert verarbeitet werden müssen, sondern nur abgelegt oder von einer Person verarbeitet werden, ist das völlig ausreichend.

          Und wenn das nicht ausreichend ist, nun, dann ist ein PDF-Formular eben keine geeignete Lösung für das Problem.

          Dann, wenn man das automatisiert verarbeiten will, besteht ja auch noch die Möglichkeit, das so zu lösen, wie du zu Recht vorgeschlagen hast - mit mehr Aufwand an Infrastruktur, Programmierung und ähnlichem und einer dann aber auch potenteren Lösung.

          Wenn man's nicht braucht ist die potentere Lösung allerdings, gemessen am Aufwand im Vergleich dazu, eine ausfüllbare PDF zu erfüllen, mit Kanonen auf Spatzen geschossen.

          Grüße,

          RIDER

          --
          Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
          # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
          1. Hallo,

            Digitale Dokumente ohne kryptographische Mechanismen, welche beweisen könnten, ob ihr Inhalt verändert wurde, lassen sich immer und grundsätzlich ändern. Das ist in meinen Augen eine Binsenweisheit.

            Ja eben! Wie kommst du denn darauf, dass PDF nicht veränderbar sein soll, wenn es keine Mechanismen gibt, die genau diese Unveränderbarkeit erreichen sollen?!?

            die Frage ist: Wie kommst du darauf? Ich kann nicht erkennen, dass Felix das gesagt hätte. Er schrieb nur etwas über "die Idee" von PDF. Das ist in meinen Augen eine Anspielung auf die übliche Nutzung, ohne dabei jedoch etwas anderes auszuschließen.

            Daher ja auch der Name portable document format. Es soll auf jedem System gleich aussehen.

            Daher auch die immer wiederkehrende alternative Deutung der Abkürzung als "Printed Document File".

            Live long and pros healthy,
             Martin

            --
            Home is where my beer is.
            1. Aloha ;)

              Digitale Dokumente ohne kryptographische Mechanismen, welche beweisen könnten, ob ihr Inhalt verändert wurde, lassen sich immer und grundsätzlich ändern. Das ist in meinen Augen eine Binsenweisheit.

              Ja eben! Wie kommst du denn darauf, dass PDF nicht veränderbar sein soll, wenn es keine Mechanismen gibt, die genau diese Unveränderbarkeit erreichen sollen?!?

              die Frage ist: Wie kommst du darauf? Ich kann nicht erkennen, dass Felix das gesagt hätte. Er schrieb nur etwas über "die Idee" von PDF. Das ist in meinen Augen eine Anspielung auf die übliche Nutzung, ohne dabei jedoch etwas anderes auszuschließen.

              Darüber kann man jetzt vermutlich streiten. Wenn andere Nutzungen nicht durch die postulierte "übliche Nutzung" ausgeschlossen würden, wäre die Diskussion wohl nicht das diskutieren wert.

              Ich habe die Aussage so verstanden, dass es "die übliche Nutzung" gibt, und, dass jede andere Nutzung deshalb keine gute Idee sei. Dem kann ich nicht zustimmen. Wenns anders gemeint war ist das ja kein Problem.

              Grüße,

              RIDER

              --
              Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
              # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
          2. Lieber Camping_RIDER,

            Mit mehr Aufwand. Der ist manchmal nicht gerechtfertigt, wenn es nur darum geht, Usern, die das benutzen können, ein wenig mehr Komfort zu geben.

            das kann ich sogar nachvollziehen. Wenn ein Antrag mit Unterschrift als PDF vorbereitet wird, dessen Felder man wahlweise mit Stift oder (wenn der PDF-Client das unterstützt) mittels Tastatur ausfüllen kann, dann mag mir das einleuchten. Schlussendlich wird man einen solchen Antrag immer ausdrucken und mit einem Stift unterschreiben müssen, um ihn in Papierform weiter zu reichen. Da ist es dann nur eine Frage der eventuell besseren Leserlichkeit, wenn die Felder nicht handschriftlich, sondern mit der Tastatur ausgefüllt wurden.

            Mir leuchtet jetzt aber nicht ein, ob das genau Linuchs' Anliegen abdeckt, oder ob da noch etwas anderes gefordert wird. Ich meine mich zu erinnern, dass wir dieses Jahr schon einmal mit ihm über serverseitig erzeugte PDF-Dokumente diskutiert haben.

            Wenn man's nicht braucht ist die potentere Lösung allerdings, gemessen am Aufwand im Vergleich dazu, eine ausfüllbare PDF zu erfüllen, mit Kanonen auf Spatzen geschossen.

            Das mag natürlich sein. Auch handelt man sich mit den verwendeten Bibliotheken in seinem CMS (oder was auch immer das für eine Applikation ist) Abhängigkeiten und zusätzliche Komplexität ein, die man vielleicht nicht (oder doch) haben will.

            Liebe Grüße

            Felix Riesterer

            1. Nachtrag

              Ich hatte einmal für die Abrechnung bei der Krankenkasse eine PDF-Datei, in der ich die Rechnungen und ihre Beträge eintragen sollte. Visuell war das eine große Tabelle. Die Rechnungsbeträge sollten von der PDF-Datei in der Ergebniszelle automatisch aufaddiert werden. Das hat mein PDF-Client damals nicht getan. Zwar konnte ich die Felder alle mit der Tastatur befüllen, auch das Ergebnis-Summe-Feld, aber die Bequemlichkeit der automatischen Addition fiel weg. Da wäre mir eine Excel-Datei wesentlich lieber gewesen, denn da hätte alles (auch in LO) wesentlich zuverlässiger funktioniert. Der Ausdruck wäre dann zwar noch immer Papier gewesen, aber mit LO hätte ich auch eine PDF als Vorabversion mailen können.

              Aus dieser Erfahrung gründet sich im Wesentlichen meine Haltung zu PDF als digitalem Papier.

              Liebe Grüße

              Felix Riesterer

              1. Aloha ;)

                Zum Nachtrag: Ja, das kann ich gut verstehen. Das ist tatsächlich ziemlicher Humbug.

                Da gehts mir ähnlich: Die Textfelder in pdf-Formularen werden ja noch von einigen Readern verstanden, damit gibt es keine großen Probleme. Aber wehe man will da noch mehr - zum Beispiel Textfelder mit bestimmtem Format, irgendwelche nummerischen Felder, oder was auch immer. Da stößt man dann wirklich an die Grenzen, denn das können die wenigsten Reader ordentlich darstellen, und dann hat man nachher ein Formular, von dem manche Felder per Reader befüllbar sind und andere nicht. Das ist dann einfach nur noch ziemlicher Quatsch.

                Sobald man anfängt, von einem PDF zu wollen, dass man es nicht nur relativ stumpf mit Text beschriften kann, sondern auch noch eine Interaktion erwartet, kann man sich ziemlich sicher sein, dass man die falsche Technoligie gewählt hat.

                Insofern ist der Vergleich von PDF mit "digitalem Papier" wirklich gut:

                Ein Papier-Formular kann ich mit einem Stift mit beliebigem Text befüllen. Für PDF gilt das gleiche: mit einem geeigneten Programm kann ich das PDF-Formular mit Text füllen - entweder an speziellen vorgesehenen Stellen, oder eben mit dem richtigen Werkzeug auch überall.

                Ich kann aber von einem Papier nicht erwarten, dass es mir eine Summe ausrechnet oder mich daran hindert, falsch formatierte Werte einzutragen. Für PDF gilt mit gutem Recht das gleiche.

                Grüße,

                RIDER

                --
                Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
            2. Aloha ;)

              Wenn ein Antrag mit Unterschrift als PDF vorbereitet wird, dessen Felder man wahlweise mit Stift oder (wenn der PDF-Client das unterstützt) mittels Tastatur ausfüllen kann, dann mag mir das einleuchten. Schlussendlich wird man einen solchen Antrag immer ausdrucken und mit einem Stift unterschreiben müssen, um ihn in Papierform weiter zu reichen. Da ist es dann nur eine Frage der eventuell besseren Leserlichkeit, wenn die Felder nicht handschriftlich, sondern mit der Tastatur ausgefüllt wurden.

              Genau das!

              Mir leuchtet jetzt aber nicht ein, ob das genau Linuchs' Anliegen abdeckt, oder ob da noch etwas anderes gefordert wird.

              Nein, ich fürchte nicht. Oder zumindest sind die formulierten Erwartungen an ausfüllbare PDF-Formulare nicht deckungsgleich mit dem, was das Feature liefern kann.

              Da sind wir ja durchaus auf einer Linie.

              Ich meine mich zu erinnern, dass wir dieses Jahr schon einmal mit ihm über serverseitig erzeugte PDF-Dokumente diskutiert haben.

              Ja. Lang und breit. Ich verstehe auch nicht, warum man immer wieder das selbe Thema aus der Mottenkiste holt. Spätestens nach dem dritten Mal drüber-ärgern wär's mir dann auch zu blöd und ich würde stattdessen eine Technologie nutzen, die das kann, was ich brauche.

              Das mag natürlich sein. Auch handelt man sich mit den verwendeten Bibliotheken in seinem CMS (oder was auch immer das für eine Applikation ist) Abhängigkeiten und zusätzliche Komplexität ein, die man vielleicht nicht (oder doch) haben will.

              Genau. Es geht immer darum, individuell zu schauen, welche Anforderungen es sonst noch so drumrum gibt, um zu beurteilen, welche Lösung möglichst passgenau ist.

              Auch in dieser Hinsicht sind die mehrfachen Nachfragen wegen pdf-Formularen mit unklaren Randbedingungen für mich eher zweifelhaft.

              Grüße,

              RIDER

              --
              Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
              # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
    6. Hi there,

      Aber mit dieser Denkweise bin ich relativ allein.

      Ich denke, es hängt davon ab, wo und wie man das PDF verwendet. Gegen das Ausfüllen von Formularen in einem Reader spricht einmal grundsätzlich nichts, wenn man das allerdings in einem Browser macht, dann führt man das Browserkonzept ad absurdum. Für Formularausfüllen in einem Browser gibts bereits eine Lösung, und die heisst HTML und nichts sonst sollte dafür zuständig sein...

  3. Ich bin von 19 - 71 Lebensjahren in der EDV tätig und wollte das eigentlich als Freiberufler bis 75 durchziehen … verlässt mich die Motivation.

    Jammern hilft nicht. Stimmungsaufheller schon…

  4. Tach!

    Kunde stellt mir eine ausfüllbare PDF-Datei zur Verfügung,

    PDF

    Nun meldet er, dass er nichts in die Felder eingeben kann.

    Er hat wenig Ahnung, kennt nichtmal seinen Browser und ich muss die Glaskugel bemühen:

    PDF-Betrachter im Browser (Firefox) unterstützt keine PDF-Formulare

    Womöglich hat der keinen Firefox oder eine gelb-schwarz-Schwäche…

  5. Aloha ;)

    Das kann ich nachvollziehen. Wenn ich diese PDF in meinem Firefox unter Ubuntu öffne, sind die Eingabefelder tot, nicht zu beschriften.

    Mein Firefox (78.0.1 @ Ubuntu 18.04) blendet oben in gelb einen deutlichen Hinweis ein mit "Das PDF-Dokument wird eventuell nicht korrekt dargestellt" und Button "Mit anderem Programm ansehen". In anderen Programmen sind die Felder dann auch ausfüllbar.

    Mein Chromium ermöglicht sogar direkt, die PDF-Felder auszufüllen.

    Kennt ihr diese Problematik, habt ihr eine Lösung?

    Selbstverständlich (ersteres). Nicht jedes Anzeigeprogramm für PDF unterstützt alle Features von PDF. So ist es halt.

    Die Lösung? Wer es technisch nicht hinbekommt, das ausfüllbare PDF auszufüllen, muss es halt ausdrucken und eingescannt einschicken. PDF-Formulare sind typisches progressive enhancement: Wer's am PC ausfüllen kann, der kann das tun, und wenn nicht bleibt wie bei unausfüllbaren PDF-Formularen (die man übrigens mit einfachen Mitteln wie LibreOffice Draw auch bearbeiten kann) das ausdrucken und von-Hand-ausfüllen.

    Ein ganz anderes Thema ist es, wenn du darauf angewiesen bist, ein maschinell ausgefülltes Formular zu bekommen. In dem Fall ist vermutlich PDF einfach die falsche Wahl.

    Grüße,

    RIDER

    --
    Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
    # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
    1. Hallo,

      die man übrigens mit einfachen Mitteln wie LibreOffice Draw auch bearbeiten kann

      das hast du ja jetzt mehrfach behauptet und es mag in einigen Fällen auch funktionieren. Aber ich war neugierig und hab es mit ein paar Spezial-PDFs versucht, da kam natürlich Murx raus.

      Die Original-PDFs werden vermutlich über den Umweg PostScript erzeugt und manipulieren irgendwie die verwendeten Schriftarten oder nutzen Spezialzeichen. Jedenfalls ist LO Draw damit völlig überfordert.

      Gruß
      Kalk

      1. Aloha ;)

        die man übrigens mit einfachen Mitteln wie LibreOffice Draw auch bearbeiten kann

        das hast du ja jetzt mehrfach behauptet und es mag in einigen Fällen auch funktionieren. Aber ich war neugierig und hab es mit ein paar Spezial-PDFs versucht, da kam natürlich Murx raus.

        Klar. Wenn das Programm, das die PDF erstellt, die Rohdaten (z.B. Textfelder etc.) erstmal in Bilddaten umwandelt, oder wie von dir beschrieben exotische Schriftarten und/oder Spezialzeichen verwendet, dann wird das natürlich nix.

        Seit deutlich mehr Office-Programme die PDF-Erzeugung im Standardumfang haben und man sich daher deutlich weniger virtueller PDF-Drucker bedienen muss, hat meiner Beobachtung nach die Menge der PDFs, die tatsächlich bearbeitbare Elemente enthalten und nicht einfach nur statisch erzeugtes Bild-/Postscript-/whatever-material kapseln, deutlich zugenommen - und die kann man dann gewöhnlich auch mit LO Draw bearbeiten.

        Aber auch in all den anderen Fällen (früher mehr als heute) kann man die PDF als statisches Hintergrundbild verwenden und Textfelder draufklatschen. Oder mit einem Bildbearbeitungsprogramm reineditieren.

        Will sagen: Es ist immer irgendwie möglich, Formularfelder eines PDF-Formulars via PC auszufüllen.

        Grüße,

        RIDER

        --
        Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
        # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
  6. Moin,

    nun habe ich die Daten mit einem HTML-Formular eingesammelt.

    Die Daten des Mitglieds werden aus der Datenbank übernommen, ebenso Liedtitel, die beim Tippen als Vorschläge erscheinen und angeklickt werden können.

    Damit „frickel“ ich nun wieder ein PDF-Formular zurecht, das so aussieht wie das ursprüngliche. Drei Seiten sind als Bild unterlegt und die Datenfelder werden darauf absolut positioniert. Können - wie verlangt - auch geändert werden.

    Die ganze Geschichte behagt mir nicht, da ich von PDFs keine Ahnung habe und - wie wir schon festgestellt haben - der Quellcode mit einem Texteditor nicht lesbar ist.

    Die PDFs gehen über den Fachverband (gleichgestellt mit Landesverbänden) zum Deutschen Chorverband DCV und eventuell wieder zurück, damit der Chor eine Rechnung bekommt.

    Können Daten aus einem PDF-Dokument maschinell gelesen werden?

    Da stecken doch vermutlich Feldnamen drin, die ich nicht kenne. Habe heute beim DCV angerufen, der Fachmann ist in Urlaub.

    In meiner PDF erstelle ich die Felder mit TCPDF so:

      // b1 Felder auf Blatt 1
      // name, width, height, align (R)ight. left; top 
    $b1 = [
     ['mitglied_nr',             25, 6, '', 155,   62   ]
    ,['veranstalter',           105, 6, '',  23,  109   ]
    ...
      for ( $i=0; $i < count($b1); $i++ ) {
        if ( $arr_form[ $b1[$i][3] ] == 'R' ) {
          // Daten rechtsbuendig im Feld
          $pdf->TextField( $b1[$i][0],  $b1[$i][1]."mm",  $b1[$i][2]."mm",  ['alignment' => 'right'], ['v' => $arr_form[ $b1[$i][0] ]], $b1[$i][4]."mm",  $b1[$i][5]."mm", FALSE );
        } else {
          // Daten linksbündig im Feld
          $pdf->TextField( $b1[$i][0],  $b1[$i][1]."mm",  $b1[$i][2]."mm",  [], ['v' => $arr_form[ $b1[$i][0] ]], $b1[$i][4]."mm",  $b1[$i][5]."mm", FALSE );
        }
      }
    

    (rechtsbündig klappt nicht)

    Angenommen, ich würde die (geheimen) echten Feldnamen angeben, können die Daten dann maschinell ausgelesen werden?

    Gruß Linuchs

    Edit:

    Die drei Hintergrund-Bilder (Seiten) richte ich so ein:

      $pdf->AddPage();
      // set background image
      $pdf->Image('gema_anmeldung_1_1.jpg', 0, 0, 210, 297, '', '', '', false, 300, '', false, false, 0);
    

    Wobei die Bilder auf den Millimeter genau gleich groß sind. Aber die absolute mm-Angabe im Browser-Formular und für das PDF ist unterschiedlich.

    1. Hallo Linuchs,

      Angenommen, ich würde die (geheimen) echten Feldnamen angeben, können die Daten dann maschinell ausgelesen werden?

      Disclaimer:
      Das folgende stellt lediglich meine Meinung dar.

      Im Prinzip ja. Aber höchstens dann, wenn du das Dokument z.B. mit tcpdf erstellst und es dann auch mit tcpdf wieder ausliest. Ich hab das vor Jahresfrist nicht hinbekommen. Wie schon mehrfach erwähnt, ist das PDF-Format tricky um es vorsichtig zu formulieren. Ich kann mir nicht vorstellen, dass es irgendeine Organisation gibt, die PDF-Formulare maschinell auswertet. Da ist ein HTML-Formular so viel einfacher zu handhaben.

      Es gibt auch die Möglichkeit, ein PDF-Formular an ein Skript zu schicken (siehe weiter oben hier im Thread). Man müsste sich halt mal anschauen, was dort gesendet wird.

      Bis demnächst
      Matthias

      --
      Du kannst das Projekt SELFHTML unterstützen,
      indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
      1. Hallo,

        Google liest PDF aus und verwertet die Informationen für den Suchindex, die Bildersuche, etc.

        Unsere kleine Vereinszeitung stand jahrelang auch immer als PDF im Internet und wurde bei Google repräsentativ gelistet auf passende Suchbegriffe. Das werden die kaum manuell gemacht haben.

        PDF ist ein Containerformat. Dieses enthält also weitere Formate.
        Es gibt auch PDF2HTML und PDF2WORD usw. als nützliche Programme. Wieso sollte es da nicht auch "PDF2DATA" geben?

        LG
        Autor

        1. Hallo Autor,

          Google liest PDF aus und verwertet die Informationen für den Suchindex, die Bildersuche, etc.

          Es geht ja nicht darum, ein PDF zu lesen, sondern eine Zuordnung von Feldnamen und Feldinhalten aus dem PDF zu extrahieren (also mehr als das rein visuelle).

          Bis demnächst
          Matthias

          --
          Du kannst das Projekt SELFHTML unterstützen,
          indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
          1. Hallo Autor,

            Google liest PDF aus und verwertet die Informationen für den Suchindex, die Bildersuche, etc.

            Es geht ja nicht darum, ein PDF zu lesen, sondern eine Zuordnung von Feldnamen und Feldinhalten aus dem PDF zu extrahieren (also mehr als das rein visuelle).

            Ja.
            Dafür benutzt man dann eines der vielen verfügbaren pdf2data!

            Grüße
            Autor

            1. Hallo Autor,

              Dafür benutzt man dann eines der vielen verfügbaren pdf2data!

              Zeig mir zwei.

              Wie ich schon schrieb, bin ich daran gescheitert (was nichts bedeuten muss). Aber ich habe unseren Antrag auf Fördermitgliedschaft heruntergeladen und mit drei verschiedenen Programmen meinen Namen eingetragen und das Dokument gespeichert. Die drei Dokumente sind alle unterschiedlich groß …

              Ich habe dann die PDF-Idee begraben und bin auf Excel gewechselt. Alle Zellen, die nicht bearbeitet werden dürfen, gesperrt und das Dokument geschützt. Auf diese Weise bekomme ich genau die Daten zurück, die auch haben möchte.

              Bis demnächst
              Matthias

              --
              Du kannst das Projekt SELFHTML unterstützen,
              indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
              1. Hallo Matthias Apsel,

                Dafür benutzt man dann eines der vielen verfügbaren pdf2data!

                Zeig mir zwei.

                Let me google that for ypu

                Es gibt dutzende verschiedene Versionen.

                LG
                Autor

                1. Aloha ;)

                  Dafür benutzt man dann eines der vielen verfügbaren pdf2data!

                  Zeig mir zwei.

                  Let me google that for ypu

                  Du bist ja ein Scherzkeks.

                  Erst unhaltbare Aussagen in den Raum stellen, und dann auch noch das für-jemanden-googlen nicht hinbekommen. Hint: „Dies ist keine sichere Verbindung.“

                  Es gibt dutzende verschiedene Versionen.

                  Ich hab nur eine gefunden. Kostenpflichtig, und sie leistet nicht das, was hier nach Problembeschreibung gefordert ist, da man sie zuerst auf alle möglichen verschiedenen PDF-Formatvarianten einlernen muss, bevor das dann "ähnliche" Formatierungen auch richtig erkennt.

                  Newsflash: Das hilft nur dann, wenn du jemanden hast, der dir immer wieder ähnliche PDFs, mit dem selben Programm ausgefüllt, liefert. Dann mag das eine Arbeitserleichterung sein. Aber das ganze macht aus PDF kein Format, mit dem man standardisiert Daten einlesen kann - bei Weitem nicht.

                  Aber klar, die drölfzig Leute, die schon gesagt haben, dass das mit PDF nie zuverlässig funktioniert, waren bestimmt alle nur zu blöd zum googlen.

                  Grüße,

                  RIDER

                  --
                  Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                  # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
                  1. Aloha ;)

                    Dafür benutzt man dann eines der vielen verfügbaren pdf2data!

                    Zeig mir zwei.

                    Let me google that for ypu

                    Du bist ja ein Scherzkeks.

                    Erst unhaltbare Aussagen in den Raum stellen, und dann auch noch das für-jemanden-googlen nicht hinbekommen. Hint: „Dies ist keine sichere Verbindung.“

                    Genau. Nimm mal bitte das s raus aus dem https vom Link. Dann klappt es.

                    Es gibt dutzende verschiedene Versionen.

                    Ich hab nur eine gefunden. Kostenpflichtig, und sie leistet nicht das, was hier nach Problembeschreibung gefordert ist, da man sie zuerst auf alle möglichen verschiedenen PDF-Formatvarianten einlernen muss, bevor das dann "ähnliche" Formatierungen auch richtig erkennt.

                    Newsflash: Das hilft nur dann, wenn du jemanden hast, der dir immer wieder ähnliche PDFs, mit dem selben Programm ausgefüllt, liefert. Dann mag das eine Arbeitserleichterung sein. Aber das ganze macht aus PDF kein Format, mit dem man standardisiert Daten einlesen kann - bei Weitem nicht.

                    Aber klar, die drölfzig Leute, die schon gesagt haben, dass das mit PDF nie zuverlässig funktioniert, waren bestimmt alle nur zu blöd zum googlen.

                    Grüße,

                    RIDER

                2. Hallo Autor,

                  Dafür benutzt man dann eines der vielen verfügbaren pdf2data!

                  Zeig mir zwei.

                  Let me google that for ypu

                  Es gibt dutzende verschiedene Versionen.

                  Du darfst davon ausgehen, dass ich schon mit verschiedenen Suchbegriffen gesucht habe.

                  Stell mir bitte zwei Programme vor.

                  Bis demnächst
                  Matthias

                  --
                  Du kannst das Projekt SELFHTML unterstützen,
                  indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
        2. Moin,

          Google liest PDF aus und verwertet die Informationen für den Suchindex, die Bildersuche, etc.

          ja, das ist selbstverständlich möglich, ein handelsüblicher PDF-Viewer tut ja auch nichts anderes. Aber der Aufwand ist relativ hoch, das macht man nicht mal eben mit 10 Zeilen PHP oder so.

          Google "erkennt" ja auch Bilder, d.h. analysiert den Bildinhalt als solchen und erzeugt dann eine Beschreibung wie etwa "Zwei Menschen stehen vor einem Haus".

          Unsere kleine Vereinszeitung stand jahrelang auch immer als PDF im Internet und wurde bei Google repräsentativ gelistet auf passende Suchbegriffe. Das werden die kaum manuell gemacht haben.

          Nein. Und solange das PDF wirklich direkt aus Text erzeugt wird, ist das IMO immer möglich. Nur bei eingescannten Dokumenten steht man etwas im Regen; da braucht's noch OCR, um wieder etwas damit anfangen zu können.

          Aber auch das ist heute nichts ungewöhnliches mehr. Nimm als Beispiel Microsoft OneNote: Da kannst du Grafiken einfügen, und OneNote macht einen OCR-Durchlauf, bevor du es überhaupt merkst, so dass das Bild mit Suchworten gefunden werden kann, die im Bild vorkommen. Oder Microsoft Exchange: Wenn ich am Arbeitsplatz mal einen Anruf verpasst habe, bekomme ich eine e-Mail mit einem mp3-Anhang und kann mir anhören, was der Anrufer auf die Mailbox gesprochen hat - im Text der Mailnachricht bekomme ich aber auch gleich ein Transscript des Anrufs!

          PDF ist ein Containerformat. Dieses enthält also weitere Formate.

          Ist das so? Bitte mehr Details dazu.

          Es gibt auch PDF2HTML und PDF2WORD usw. als nützliche Programme.

          Ja. Deren Erfolg steht und fällt aber mit der "gutmütigen" Erzeugung des PDF-Dokuments.

          Live long and pros healthy,
           Martin

          --
          Home is where my beer is.
    2. Hallo Linuchs,

      Ich hatte neulich schon die Bandbreite der möglichen Workflows aufgelistet (oder wollte ich das nur? Hmmm...). Eine brauchbare Antwort kann wohl nur von diesem verurlaubten Fachmenschen kommen.

      Daten aus einem irgendwie generierten PDF (aus Sicht des Lesers) heraus zu klauben sollte jedenfalls eine der Herausforderungen im Leben sein, die man meiden möchte…

      Rolf

      --
      sumpsi - posui - obstruxi
      1. Hallo Rolf,

        Daten aus einem irgendwie generierten PDF (aus Sicht des Lesers) heraus zu klauben sollte jedenfalls eine der Herausforderungen im Leben sein, die man meiden möchte…

        Ich kenne Firmen und ähnliche Gebilde, da sind ganze Abteilungen mit so einem Unfug beschäftigt. Da liegt es aber jeweils daran, dass die Datenlieferanten das Format bestimmen und das sind nun mal „irgendwie generierte PDFs“. Die wären die letzten, die so etwas nicht auf ein strukturiertes Format umstellen wollen würden.

        Meiner Meinung nach fehlt es den Stellen, die keine strukturierten Formate annehmen, einfach an der Vision, dass man Dinge auch für alle Beteiligten einfach und effizient lösen könnte und man nicht alles so machen, wie man es gefühlt immer schon gemacht hat.

        @Linuchs Hast du die annehmende Stelle schon mal gefragt, ob die nicht vielleicht eine API, ein XML-Schema oder was mit JSON für genau diesen Zweck hat? Das wäre ja letztlich für alle einfacher.

        Gruß
        Julius

        1. Hallo Julius,

          Hast du die annehmende Stelle schon mal gefragt, ob die nicht vielleicht eine API, ein XML-Schema oder was mit JSON für genau diesen Zweck hat? Das wäre ja letztlich für alle einfacher.

          Wir haben eben telefoniert.

          Das ursprüngliche oder von mir erzeugte Formular wird vom Verband ggf. korrigiert / ergänzt. Deshalb müssen die Daten änderbar sein.

          Dann wird das Formular ausgedruckt, gestempelt, unterschrieben, wieder eingescannt und fortan nur als Bild-PDF weitergegeben und visuell bearbeitet.

          Wenn mich meine Ansprüche nicht so viel Zeit gekostet hätten, hätte ich mich lachend unterm Tisch rollen können.

          Sowas hätte ich nicht für möglich gehalten.

          Das ist so, als ob du dir wochenlang Gedanken machst, wie und wo man ein Elektromobil laden kann. Und dann erfährst du, dass es nur geschoben wird.

          Linuchs

          1. Hallo Linuchs,

            Dann wird das Formular ausgedruckt, gestempelt, unterschrieben, wieder eingescannt und fortan nur als Bild-PDF weitergegeben und visuell bearbeitet.

            Sowas hätte ich nicht für möglich gehalten.

            Ich schon. Und mehrere andere auch haben dich in diversen PDF-Threads auf genau diese Gefahr hingewiesen.

            Auch wenn es dir im Moment so überhaupt nicht weiterhilft, es dennoch ein Ausdruck des Bedauerns und kein sickiges „Siehste“.

            Bis demnächst
            Matthias

            --
            Du kannst das Projekt SELFHTML unterstützen,
            indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
          2. Hallo Linuchs,

            Das ursprüngliche oder von mir erzeugte Formular wird vom Verband ggf. korrigiert / ergänzt. Deshalb müssen die Daten änderbar sein.

            Vielleicht kannst du ihnen ja Zugriff (beispielsweise ein temporärer Login mittels im PDF enthaltenen und für jede Änderung zufällig generiertem Token) auf diese Maske geben und ihnen dann erlauben, das PDF neu zu generieren (→ neuer Token), so wie es ihnen passt?

            Dann wird das Formular ausgedruckt, gestempelt, unterschrieben, wieder eingescannt und fortan nur als Bild-PDF weitergegeben und visuell bearbeitet.

            Wenn mich meine Ansprüche nicht so viel Zeit gekostet hätten, hätte ich mich lachend unterm Tisch rollen können.

            Sowas hätte ich nicht für möglich gehalten.

            Ich ehrlich gesagt schon. Ich kann deinen Frust aber sehr gut verstehen. Ähnliches habe ich auch schon erlebt.

            Das ist so, als ob du dir wochenlang Gedanken machst, wie und wo man ein Elektromobil laden kann. Und dann erfährst du, dass es nur geschoben wird.

            Ja 😂.
            Deshalb betreibt man vorher ausgiebige Anforderungsanalysen, schreibt User Stories und kontrolliert stetig, ob Vorstellung und Produkt noch zusammen passen. Im Studium haben wir uns über User Stories lustig gemacht, aber das ist imho ein sehr gutes Mittel, um mit den Beteiligten auszubaldowern, was sie wirklich brauchen.

            Gruß
            Julius

            1. Hallo Julius,

              Deshalb betreibt man vorher ausgiebige Anforderungsanalysen

              Das weiß ich natürlich als Software-Entwickler. Aber mein lieber Gesprächspartner gab mir zu verstehen, dass ich mich nicht in seine „heiligen“ Angelegenheiten mischen soll.

              Einfach nach Ansage arbeiten.

              Ein manchmal kumpelhafter, aber meistens sehr bestimmender Mensch. Viele Chöre sind seinetwegen nicht in diesem Chor-Verband.

              1. Hallo Linuchs,

                Deshalb betreibt man vorher ausgiebige Anforderungsanalysen

                Das weiß ich natürlich als Software-Entwickler. Aber mein lieber Gesprächspartner gab mir zu verstehen, dass ich mich nicht in seine „heiligen“ Angelegenheiten mischen soll.

                Da hätte ich entgegnet, ob er denn der Software-Entwickler sei oder ich.

                Einfach nach Ansage arbeiten.

                😕

                Gruß
                Julius

                1. Hallo Julius,

                  Da hätte ich entgegnet, ob er denn der Software-Entwickler sei oder ich.

                  Du kannst nicht erwarten, dass du als Software-Entwickler einfach so eingefahrene Arbeitsabläufe ändern kannst. Das ist schon schwierig, wenn du a) Teil des Teams und b) in den Arbeitsablauf involviert bist.

                  Bis demnächst
                  Matthias

                  --
                  Du kannst das Projekt SELFHTML unterstützen,
                  indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
                  1. Hallo Matthias,

                    man hat es nicht nur mit Logik, sondern auch mit den Eigenarten und Gewohnheiten von Menschen zu tun.

                    Ex-Bereichsleiter Versicherung. Da gilt dann - ähnlich wie bei Geldanlagen - „Jeder Mitarbeiter darf nur gerade das wissen, was zu seinen Aufgaben gehört."

                    In meiner Berufslaufbahn hatte ich auch solche Vorgesetzte, peinlich darauf bedacht, die Fäden, an denen seine Marionetten hängen, nicht aus der Hand zu geben.

                    1. n'Abend Linuchs,

                      In meiner Berufslaufbahn hatte ich auch solche Vorgesetzte, peinlich darauf bedacht, die Fäden, an denen seine Marionetten hängen, nicht aus der Hand zu geben.

                      ja, solche Vorgesetzte gibt es, und sie sind wahrscheinlich gar nicht so selten. Deshalb freue ich mich umso mehr, dass ich in meinem derzeitigen Job einen Teamchef habe, der das ganz locker sieht. Er lässt uns, seinen Mitarbeitern, große Freiräume, uns selbst zu organisieren, versucht sich möglichst wenig ins Tagesgeschäft einzumischen, ist aber trotzdem jederzeit da, wenn seine Leute ein Problem haben und ist dann bereit, sie gegenüber anderen Abteilungen zu vertreten.

                      Das habe ich kürzlich wieder erfahren dürfen: Ich habe ihm angekündigt, dass ich plane, mich per e-Mail bei unseren sechs Produktmanagern für die verschiedenen Geschäftsbereiche zu beklagen, weil die in letzter Zeit vermehrt quer schießen und versuchen, Aufgaben mit höchster Dringlichkeit bei uns einzutakten, "weil ein Kunde danach fragt". Das bringt dann aber alle Prioritäten und Pläne durcheinander, und am Ende fragt jemand anders vorwurfsvoll, warum Termine nicht eingehalten werden.

                      Er hat dann kurz darüber nachgedacht und mir dann vorgeschlagen, das noch ein Weilchen zurückzuhalten. Erstens hätte sich ein anderer Kollege aus dem Team schon über dieselbe Situation beklagt, und zweitens habe er das Problem auch schon wahrgenommen und sei bereits mit den PMs und dem Abteilungsleiter im Gespräch, um das zu entschärfen.

                      Solche Vorgesetzte kann man mit der Taschenlampe suchen!

                      Live long and pros healthy,
                       Martin

                      --
                      Home is where my beer is.
                  2. Hallo Matthias,

                    Da hätte ich entgegnet, ob er denn der Software-Entwickler sei oder ich.

                    Du kannst nicht erwarten, dass du als Software-Entwickler einfach so eingefahrene Arbeitsabläufe ändern kannst.

                    Darum ging es mir nicht in erster Linie. Erst einmal brauche ich Kontext, um einen Lösungsvorschlag zu erarbeiten. Wenn es zu einem beteiligten System / Prozess keine sauber definierbare Schnittstelle gibt, muss ich mir dieses ebenfalls erklären lassen. Sonst führt das schlicht zu Fehlkonzeptionierungen und die werden hinterher höchstwahrscheinlich mir angelastet, was ich nicht möchte.

                    Wenn mein oder einer meiner Lösungsvorschläge eingefahrene Arbeitsabläufe ändern würde, aber Vorteile bietet, versuche ich die deutlich zu machen. Vielleicht irre ich mich ja auch, was die Vorteile angeht, aber in dem Fall habe ich entweder das zu lösende Problem nicht vollständig erfasst, es gab zwischenzeitlich Änderungen oder man ist sich in der Bewertung eines „Vorteils“ nicht einig.
                    Beispielsweise sollte ich mal Daten zwischen Datenblättern und Handbüchern abgleichen. Das habe ich (nach Rücksprache) nicht gemacht, sondern die Daten in eine Datenbank eingepflegt und daraus die Dokumente generiert. Letztlich waren alle sehr mit dieser Lösung zufrieden.

                    Wir hatten mal ein Projekt, in dem uns genaue, aber widersprüchliche Anweisungen gegeben wurden. Wir haben uns irgendwann nicht mehr dran gehalten und einfach das gemacht, was wir für logisch und richtig hielten. Letztlich war das Ergebnis genau das, was wir liefern sollten. War aber dennoch ein ziemlicher Stress und kann schief gehen.

                    Aus diesen Gründen möchte ich mir grundsätzlich selbst einen Blick für das Umfeld verschaffen können, falls ich Freiheiten bei der Umsetzung habe (die hatte Linuchs definitiv). Wenn hingegen klipp und klar definiert ist, was ich machen soll, bleibt mir nur übrig, zu bewerten, ob es zufriedenstellend umsetzbar ist – ich persönlich hätte den Ansatz mit Scribus weiter evaluiert, alternativ LaTeX oder Apache FOP. Vielleicht wäre auch die Ausgabe eines Word-Dokuments (o. ä.) praktikabel, einfach umzusetzen und leicht pflegbar gewesen.

                    Zudem hat sich ja offensichtlich herausgestellt, dass die Anforderungen unvollständig waren – mutmaßlich weil Dinge (→ Änderbarkeit der Daten) vorausgesetzt wurden, die mit der gewählten Lösung so nicht realisierbar sind. Das wäre vorab feststellbar, wenn die Prozesse dem Entwickler gegenüber offen gelegt worden wären.

                    Gruß
                    Julius

    3. Hi Linuchs,

      Ja

      Es gibt diverse Programme unter der Bezeichnung pdf2data.
      Musst Du mal eine Suchmaschine oder GitHub befragen.

      LG
      Autor

      1. Moin!

        Besagtes Formular ausfüllen, abspeichern, den angepasssten Befehl in einer Linux-Shell ausführen - staunen:

        grep -a ') Tj' ausgefuellt.pdf
        
        (2001913557) Tj
        (2001913557) Tj
        (2001913557) Tj
        (570   ) Tj
        (570   ) Tj
        (570   ) Tj
        (Meier) Tj
        (Musterstra\337e) Tj
        (Test) Tj
        (0123 456789) Tj
        (Musterstadt) Tj
        (Stadthalle) Tj
        
        1. Habe den Ansatz mittels:

          diff -a ausgefuellt.pdf KonzAnmeldung.pdf
          

          gefunden. Ich frage mich, warum das nicht einfach mal probiert wurde...

          1. Außerdem fand ich weiter oben noch sowas:

            < 1070 0 obj <</DA (/ArialMT 9 Tf 0 g) /F 4 /FT /Tx /Ff 8392704 /MK <<>> /P 946 0 R /Parent 347 0 R /Rect [75.067 334.003 312.5 348.993 ] /Subtype /Widget /T (TextField1[9]) /TU (TextField1) /Type /Annot /V (��Berlin) /M (D:20200717085421) /AP <</N 1290 0 R >> >> endobj
            
            < 1063 0 obj <</DA (/ArialMT 9 Tf 0 g) /F 4 /FT /Tx /Ff 8392704 /MK <<>> /P 946 0 R /Parent 347 0 R /Rect [75.067 463.017 312.5 478.007 ] /Subtype /Widget /T (TextField1[2]) /TU (TextField1) /Type /Annot /V (��Hafenstra�e) /M (D:20200717085357) /AP <</N 1267 0 R >> >> endobj
            

            Daraus sollte sich mit ein wenig Geschick und den üblichen Verdächtigen wie (grep + sed + awk, iconv), der Name des Formularfeldes (eg. TextField1[9] und der eingegebene Wert ermitteln und darstellen lassen.

            Das geht natürlich auch mit PHP und Co.

            1. Aloha ;)

              Das Problem ist doch nicht, dass man nicht an die Daten rankommen würde. Niemand hat behauptet, dass man an die Daten nicht irgendwie rankommt.

              Das Problem ist, dass man nicht zuverlässig immer auf dem gleichen Weg an die Daten kommt, und wenn, dann nur unter weitläufigen Annahmen, die erstmal gegeben sein müssen.

              Das, was du da vorschlägst, ist ein Gefrickel, um doch irgendwie an die Daten zu kommen.

              Das kann man machen. Das Problem ist dadurch trotzdem nicht gelöst.

              Unter diesem Aspekt wär's vermutlich sogar günstiger, gleich auf OCR zu setzen - dann kann man PDFs lesen, die gescannt sind, die mit einem Reader ausgefüllt wurden, die via Bildbearbeitung ausgefüllt wurden - und so weiter und so fort.

              Sogar dieser Ansatz über OCR ist vermutlich vielversprechender, als ernsthaft zu versuchen, Daten aus PDF-Formularen auszulesen, und damit einen Produktivbetrieb anzustreben.

              Grüße,

              RIDER

              --
              Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
              # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
              1. Das, was du da vorschlägst, ist ein Gefrickel, um doch irgendwie an die Daten zu kommen.

                Also, wenn der Benutzer das Formular in der konkreten PDF-Datei ausfüllt und das Resultat per Mail verschickt, dann lässt es sich mit einem konkretem Skript sehr einfach auf die Eingaben untersuchen. Es sei denn, sein PDF-Betrachter macht Mist.

                Wenn das fehlschlägt, kann man den Scan immer noch per OCR machen, dann wurde es aber wahrscheinlich auch noch mit der Hand ausgefüllt und meine Erfahrungen mit OCR sind in dem Fall „sehr unterschiedlich“.

                „Gefrickel“

                Wieso also sollte also mein Vorgehen mit der Untersuchung des Quelltextextes „Gefrickel“ sein? „Gefrickel“ ist es, mit allem Verlaub, hier überhaupt mit PDF-Formularen zu arbeiten. Denn dieser Schritt zieht den ganzen Mist doch bitteschön nach sich. (Hier ist ein Punkt!)

                1. Hallo Raketendatenextraktor,

                  „Gefrickel“ ist es, mit allem Verlaub, hier überhaupt mit PDF-Formularen zu arbeiten. Denn dieser Schritt zieht den ganzen Mist doch bitteschön nach sich. (Hier ist ein Punkt!)

                  Ebent. Und schon mehrfach in diversen Threads angemerkt. Also kein Grund noch weitere Experimente zu unternehmen, von denen du bereits weißt, dass sie sich nicht sinnvoll automatisiert nutzen lassen.

                  Und im OP ging es nicht um die Frage, ob man irgendwie an die Daten kommt ohne sie abschreiben zu müssen, sondern darum, ob es praktikablen Weg gibt ohne die Datei anzuschauen.

                  Bis demnächst
                  Matthias

                  --
                  Du kannst das Projekt SELFHTML unterstützen,
                  indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
                  1. Also kein Grund noch weitere Experimente zu unternehmen, ...

                    Doch. Die pure und mir sehr eigene Neugier ist immer ein guter Grund, sowas zu tun: Ich will wissen ob das geht - also versuche ich das doch einfach mal.

                    ... von denen du bereits weißt, dass sie sich nicht sinnvoll automatisiert nutzen lassen

                    Ich weiß es eben nicht - ich vermute es aus guten Gründen. Hier haben wir es zum Beispiel mit einer überschaubaren Anzahl von Benutzern zu tun und ich weiß gerade Eines nicht - nämlich wie viele davon das PDF in einem ungeeigneten Zustand zurück schicken. Wenn diese Quote sehr klein ist, dann kann man das durchaus machen, weil das erforderliche Skript wohl billig zu erstellen und anzupassen ist.

                    1. Aloha ;)

                      Also kein Grund noch weitere Experimente zu unternehmen, ...

                      Doch. Die pure und mir sehr eigene Neugier ist immer ein guter Grund, sowas zu tun: Ich will wissen ob das geht - also versuche ich das doch einfach mal.

                      Die sei dir gegönnt. Vom akademischen Standpunkt her fand ich es auch interessant, dass die Eingaben genau so ausgelesen werden können und nicht in irgendeiner Form kodiert vorkommen.

                      Trotzdem halte ich es an der konkreten Sachlage hier orientiert nicht für wirklich sinnvoll, sich weiter an der PDF-Frage abzuarbeiten während die einzig wirklich richtige Antwort heißen muss:

                      Mach's gscheit und nimm was anderes.

                      Grüße,

                      RIDER

                      --
                      Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                      # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
                      1. Mark Aurel (übersetzt):

                        „Von jedem Gegenstande, der sich Deinem Nachdenken darbietet, suche Dir stets einen klaren und bestimmten Begriff zu machen, so dass Du weißt, was er er an sich und was er nach allen seinen Beziehungen ist. Damit Du ihn selbst sowohl wie seine einzelnen Momente nennen und bezeichnen kannst.“

                        Die Franzosen machen das kürzer:

                        „Qu'est-ce que c'est ça?“

                        Goethes goldenes Wort:

                        „des Pudels Kern“.

                        Rider:

                        Vom akademischen Standpunkt her fand ich es auch interessant, dass die Eingaben genau so ausgelesen werden können und nicht in irgendeiner Form kodiert vorkommen.

                        Das die Daten nach dem Ausfüllen und Speichern im Dokument drin sein müssen - und zwar in einer dokumentierten und auslesbaren Form - hatte ich vorausgesetzt. Sonst könnte man das PDF nicht ausfüllen, speichern und sich dann ausgefüllt anzeigen lassen. Das geht ja sogar auch dann, wenn das Original verschlüsselt ist.

                        Ich hatte allerdings ganz "akademisch" gehofft, dass Adobe hierfür einen (leicht isolierbaren) Container vorsieht, der dann XML, JSON oder in einer anderen, verbreiteten Form serialisierte Daten beinhaltet. Ich bin nach dem "reingeneering" ziemlich enttäuscht von dem was Adobe da spezifiert hat und vermute mal, dass Adobe das aus pekunärem Interesse so gemacht hat. Aber nachdem ich den Quelltext analysiert habe steht für mich fest:

                        • Ich kann, zumindest mit einem speziellen Skript pro speziellem Formular die Daten per Batch (also ohne unmittelbaren Eingriff eines Operators) auslesen und technisch fehlerhafte oder nicht ausgefüllte Dokumente erkennen und darauf reagieren.
                        • Den Weg, wie ich das genau tun würde, habe ich nun im Kopf.
                        • Meine Neugier ist an der Stelle befriedigt (der Rest ist „einfaches Handwerk“) und ich weiß, dass ich Geld dafür nehmen könnte. Das „Reingeneering“ aka „Frickeln“ hat sich an der Stelle für mich gelohnt.
                        1. Aloha ;)

                          Das die Daten nach dem Ausfüllen und Speichern im Dokument drin sein müssen - und zwar in einer dokumentierten und auslesbaren Form - hatte ich vorausgesetzt. Sonst könnte man das PDF nicht ausfüllen, speichern und sich dann ausgefüllt anzeigen lassen.

                          Ja, richtig. Ich hatte mich allerdings noch nie wirklich mit tatsächlichem Text-Inhalt einer PDF-Datei auseinandergesetzt, da ich PDF immer im Bereich "Binärformat und Ähnliches" verortet hatte.

                          Ich war daher implizit davon ausgegangen, dass wohl auch die Inhalte der Formularfelder zwar nicht verschlüsselt, aber zumindest irgendwie codiert und nicht in Plaintext in der PDF vorkommen würden.

                          Ich hatte allerdings ganz "akademisch" gehofft, dass Adobe hierfür einen (leicht isolierbaren) Container vorsieht, der dann XML, JSON oder in einer anderen, verbreiteten Form serialisierte Daten beinhaltet.

                          Ja! Vor allem dann, wenn der Rest der Datei ja kein Klartext-Format ist.

                          Ich bin nach dem "reingeneering" ziemlich enttäuscht von dem was Adobe da spezifiert hat und vermute mal, dass Adobe das aus pekunärem Interesse so gemacht hat.

                          Möglich. Ich verstehe vieles nicht, was hinter der Idee des PDF-Format steht und kann für mich nur den Kopf schütteln, dass das der quasi-Standard geworden ist und nicht ein Format, das sich leichter analysieren und manipulieren lässt. Vermutlich genau deshalb, weil die Komplexität des Formats eine hohe Hürde für Re-Engineering von Dateien aufbaut und damit uninteressant macht. Oder so. Wirkliches Argument ist das aber keins.

                          Wie auch immer: Danke dir für die Nachforschungen und das Teilen deiner Ergebnisse!

                          Grüße,

                          RIDER

                          --
                          Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                          # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
                          1. Hallo Camping_RIDER,

                            Ich war daher implizit davon ausgegangen, dass wohl auch die Inhalte der Formularfelder zwar nicht verschlüsselt, aber zumindest irgendwie codiert und nicht in Plaintext in der PDF vorkommen würden.

                            Ich würde nicht ausschließen, dass es valide PDF-Dateien geben kann, in denen das der Fall ist – PDFs können schließlich auch komprimiert sein.

                            Ich bin nach dem "reingeneering" ziemlich enttäuscht von dem was Adobe da spezifiert hat und vermute mal, dass Adobe das aus pekunärem Interesse so gemacht hat.

                            Möglich. Ich verstehe vieles nicht, was hinter der Idee des PDF-Format steht und kann für mich nur den Kopf schütteln, dass das der quasi-Standard geworden ist und nicht ein Format, das sich leichter analysieren und manipulieren lässt. Vermutlich genau deshalb, weil die Komplexität des Formats eine hohe Hürde für Re-Engineering von Dateien aufbaut und damit uninteressant macht. Oder so.

                            Vielleicht liegt es auch einfach daran, dass es Postscript bereits gab und etabliert war und dann ganz einfach etwas darauf basierendes wie PDF eingeführt hat?

                            PS kommt aus der Welt des Desktop-Publishing und des Drucks. PDF ebenfalls. Und da scheint es gut zu funktionieren. Und irgendwann hat Adobe halt Formulare und so einen Quatsch da eingebaut.

                            Gruß
                            Julius

                            1. Hallo,

                              Vielleicht liegt es auch einfach daran, dass es Postscript bereits gab und etabliert war und dann ganz einfach etwas darauf basierendes wie PDF eingeführt hat?

                              genau, und PDF war ja zunächst ein proprietäres Format. Adobe hat eine ganze Weile gezögert, bis die endlich die Spezifikation offengelegt haben. Das war AFAIR so Mitte, Ende der 90er Jahre. Erst danach kamen auch PDF-Viewer anderer Anbieter auf den Markt, sowie PDF-Druckertreiber, mit denen man einfach und komfortabel aus jeder Anwendung heraus PDF-Dokumente erzeugen konnte.

                              PS kommt aus der Welt des Desktop-Publishing und des Drucks. PDF ebenfalls. Und da scheint es gut zu funktionieren. Und irgendwann hat Adobe halt Formulare und so einen Quatsch da eingebaut.

                              Ja. Weil sie's konnten. 😉

                              Live long and pros healthy,
                               Martin

                              --
                              Home is where my beer is.
                          2. da ich PDF immer im Bereich "Binärformat und Ähnliches" verortet hatte.

                            Oh. Ich habe sehr früh die Erfahrung gemacht, dass man mit „Suchen und Ersetzen“ in einem Texteditor (Genauer: „mcedit.exe“) aus der „ndos.com“ (Das war eine, auf 4DOS basierende, erweitere DOS-Shell des legendären Peter Norton) eine „jdos.com“ machen konnte, die sich dann brav auch als „jdos“ gemeldet hat.

                            Womöglich habe ich deswegen „nur begrenzt“ Respekt vor Binärformaten.

                            1. Hallo,

                              da ich PDF immer im Bereich "Binärformat und Ähnliches" verortet hatte.

                              Oh. Ich habe sehr früh die Erfahrung gemacht, dass man mit „Suchen und Ersetzen“ in einem Texteditor (Genauer: „mcedit.exe“) aus der „ndos.com“ (Das war eine, auf 4DOS basierende, erweitere DOS-Shell des legendären Peter Norton) eine „jdos.com“ machen konnte, die sich dann brav auch als „jdos“ gemeldet hat.

                              derartige Patches habe ich auch gelegentlich gemacht; sogar an der einen oder anderen Windows-Systemdatei. Bei Dateien, deren Struktur ich kenne, habe ich da auch keine Hemmungen.

                              Womöglich habe ich deswegen „nur begrenzt“ Respekt vor Binärformaten.

                              Wenn ich sie dagegen nicht kenne und damit rechnen muss, dass ich interne Strukturen wie Checksummen oder Zeiger verbiege, dann lass ich es lieber. Oder vielleicht probiere ich es an einer Kopie erstmal aus und achte dann auf eventuell auftretende Nebenwirkungen.

                              Live long and pros healthy,
                               Martin

                              --
                              Home is where my beer is.
                1. Antwort:

                (Sarkasmus)

                Klar. Statt den Quelltext zu untersuchen mach ich aus dem PDF eine der Seiten entsprechende Anzahl von Bitmaps und scanne die mit OCR um aus diesem Ergebnis dann die Daten zu extrahieren.

                (Ende des Sarkasmus)

                Mir, der ich (dem Topic entsprechend) die Formulardaten in einem einfachen und sicherem Verfahren aus dem Quelltext des resultuierendem PDFs auslesen will, aber wird „Gefrickel“ vorgeworfen Ich glaube nun nicht, dass der Vorwurf a) durchdacht b) berechtigt ist und einer sachlichen Prüfung standhalten könnte.

                Ich bin sogar richtig sauer wegen der Leichtfertigkeit des Vorwurfs mir gegenüber.

                1. Hallo,

                  Mir, der ich (dem Topic entsprechend) die Formulardaten in einem einfachen und sicherem Verfahren aus dem Quelltext des resultuierendem PDFs auslesen will, aber wird „Gefrickel“ vorgeworfen Ich glaube nun nicht, dass der Vorwurf a) durchdacht b) berechtigt ist und einer sachlichen Prüfung standhalten könnte.

                  das liegt vermutlich daran, dass dein Ansatz davon abhängig ist, wie "sauber" das PDF-Formular erstellt wurde, und wie gut das Programm arbeitet, mit dem es ausgefüllt wurde. Ein Glücksspiel also.

                  Ich bin sogar richtig sauer wegen der Leichtfertigkeit des Vorwurfs mir gegenüber.

                  Dann schmoll doch.
                  Oh, das tust du ja schon.

                  Live long and pros healthy,
                   Martin

                  --
                  Home is where my beer is.
                  1. wie "sauber" das PDF-Formular erstellt wurde,

                    Das originäre und via Webseite verteilte PDF-Formular ist ja vorliegend (und iin vielen anderen Fällen) ergleichbar statisch, Selbst einen Marker für eine Version kann man haben (Der Erstellungszeitpunkt steht drin!) und anhand dieses Merkmals die Daten zuordnen.

                    Ein universelles Ausleseprogramm habe ich nie als Ziel angegeben. Im Fehlerfall kann man immer noch mit OCR frickeln.

                    Die Frage "Können Daten aus einem PDF-Dokument maschinell gelesen werden?" kann man, wie ich oben gezeigt habe, mit „Ja“ beantworten. Die Frage nach der Sinnhaftigkeit bzw. Stabilität einer solchen Lösung ist auch durchaus erlaubt - aber dass nun mein Lösungsweg „Gefrickel“ sei, ist unrichtig. Das „Gefrickel“ ist die Verwendung eines PDF-Formulars.

                    Dann schmoll doch. Oh, das tust du ja schon.

                    Exakt. Es ist nicht richtig, ungerechtfertigte und beleidigende Vorwürfe einfach hinzunehmen. Nicht ich habe etwas falsch gemacht. Punkt!

                2. Aloha ;)

                  Mir, der ich (dem Topic entsprechend) die Formulardaten in einem einfachen und sicherem Verfahren aus dem Quelltext des resultuierendem PDFs auslesen will, aber wird „Gefrickel“ vorgeworfen Ich glaube nun nicht, dass der Vorwurf a) durchdacht b) berechtigt ist und einer sachlichen Prüfung standhalten könnte.

                  Das war kein Vorwurf, sondern eine Beschreibung, wertungsfrei.

                  Wenn du das als negative Beschreibung aufgefasst hast, tut mir das leid - für mich ist Gefrickel nicht zwangsläufig negativ konnotiert, ich betreibe selbst oft genug Dinge, die ich selbst als Gefrickel beschreiben würde.

                  Für mich ist Gefrickel ein Ansatz, der viel mit Hin- und Herprobieren zu tun hat - und da sah ich deinen Ansatz der PDF-Analyse schon betroffen, weil der eben nicht immer funktioniert, sondern halt in manchen Fällen, und man deshalb trial-and-error-mäßig schauen muss, ob das tut, und falls nicht, dann doch wieder anders ran muss.

                  Ich bin sogar richtig sauer wegen der Leichtfertigkeit des Vorwurfs mir gegenüber.

                  Die Leichtfertigkeit ist offenbar unserer unterschiedlichen Auslegung des Wortes Gefrickel geschuldet, keiner von mir beabsichtigten Herabsetzung deiner Person oder deines Ansatzes.

                  Grüße,

                  RIDER

                  --
                  Camping_RIDER a.k.a. Riders Flame a.k.a. Janosch Zoller
                  # Twitter # Steam # YouTube # Self-Wiki # Selfcode: sh:) fo:) ch:| rl:) br:^ n4:? ie:% mo:| va:) js:) de:> zu:} fl:( ss:) ls:[
                  1. Hallo Janosch,

                    Wenn du das als negative Beschreibung aufgefasst hast, tut mir das leid - für mich ist Gefrickel nicht zwangsläufig negativ konnotiert

                    für mich schon; es impliziert für mich unprofessionelle Arbeit, deren Ergebnis oft nur als Provisorium taugt, bestenfalls als Proof of Concept.

                    ich betreibe selbst oft genug Dinge, die ich selbst als Gefrickel beschreiben würde.

                    Ich auch, aber dann bin ich mir auch über den negativen Beigeschmack im Klaren. Dann meine ich auch, dass das, was ich da geleistet habe, primitiv ist und eigentlich nicht meinen Ansprüchen genügt.

                    Für mich ist Gefrickel ein Ansatz, der viel mit Hin- und Herprobieren zu tun hat

                    Genau. Und das ist für mich minderwertig (im Gegensatz zu einem strukturierten, systematischen Ansatz), auch wenn das Ergebnis vielleicht unter bestimmten Voraussetzungen brauchbar ist. Mit minderwertig meine ich dabei nur die Methode, nicht unbedingt das Ergebnis.

                    Live long and pros healthy,
                     Martin

                    --
                    Home is where my beer is.
                    1. Hallo Der Martin,

                      [Gefrickel] es impliziert für mich unprofessionelle Arbeit

                      bin ich mir auch über den negativen Beigeschmack im Klaren. Dann meine ich auch, dass das, was ich da geleistet habe, primitiv ist und eigentlich nicht meinen Ansprüchen genügt.

                      Und das ist für mich [eine] minderwertig[e] […] Methode

                      Es ist ja nichts neues, dass bestimmte Vokabeln unterschiedlich interpretiert werden. Allerdings steht weder im Duden noch in wiktionary was von einem negativen Hintergrund.

                      • wiktionary: ein technisches/handwerkliches Problem oder eine Aufgabe mühsam, kleinteilig oder zeitaufwändig zu lösen versuchen
                      • duden: sich an einer relativ kleinteiligen Sache, die man verbessern, um- oder ausbauen möchte, handwerklich oder technisch betätigen

                      Laut dwds gehört auch tüfteln in dieselbe Synonymgruppe.

                      Und last but not least heißt unsere Spielwiese im Wiki auch Frickl.

                      Bis demnächst
                      Matthias

                      --
                      Du kannst das Projekt SELFHTML unterstützen,
                      indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
                    2. Hi there,

                      Genau. Und das ist für mich minderwertig (im Gegensatz zu einem strukturierten, systematischen Ansatz), auch wenn das Ergebnis vielleicht unter bestimmten Voraussetzungen brauchbar ist. Mit minderwertig meine ich dabei nur die Methode, nicht unbedingt das Ergebnis.

                      Naja, ich würd' einmal behaupten, beim Programmieren ist nicht der Weg das Ziel, auch gibts keine Haltungsnoten. Dein Ansatz ist für Leute, die davon leben (müssen) ein einigermaßen absurder. Wenn das Ergebnis den Vorstellungen des Kunden soweit entspricht, daß er freiwillig die Rechnung bezahlt, dann ist es ihm unter Garantie völlig egal, welche Methode dazu geführt hat...

                      1. Hallo,

                        Genau. Und das ist für mich minderwertig (im Gegensatz zu einem strukturierten, systematischen Ansatz), auch wenn das Ergebnis vielleicht unter bestimmten Voraussetzungen brauchbar ist. Mit minderwertig meine ich dabei nur die Methode, nicht unbedingt das Ergebnis.

                        Naja, ich würd' einmal behaupten, beim Programmieren ist nicht der Weg das Ziel, auch gibts keine Haltungsnoten.

                        das stimmt natürlich.

                        Dein Ansatz ist für Leute, die davon leben (müssen) ein einigermaßen absurder.

                        Nein. Er beschreibt meine Art, Probleme zu lösen. Mit "einfach mal probieren" kann ich nicht viel anfangen, damit bin ich auch meist nicht erfolgreich. Ich bin eher der Typ, der Probleme logisch-analytisch angeht.

                        Eine Lösung durch Probieren kann auch bei mir mal zum Erfolg führen, das ist aber eher die Ausnahme. Und es ist für mich unbefriedigend, weil ich dann immer noch nicht verstanden habe, warum diese Lösung funktioniert. Deswegen ist eine solche Strategie für mich uninteressant und wenig erfolgversprechend. Frickelei eben.

                        Wenn das Ergebnis den Vorstellungen des Kunden soweit entspricht, daß er freiwillig die Rechnung bezahlt, dann ist es ihm unter Garantie völlig egal, welche Methode dazu geführt hat...

                        Ja. Aber mir nicht. Und dem Kunden vielleicht auch nicht, weil ich dann womöglich viel länger gebraucht hätte.

                        Live long and pros healthy,
                         Martin

                        --
                        Home is where my beer is.
                  2. Die Leichtfertigkeit ist offenbar unserer unterschiedlichen Auslegung des Wortes Gefrickel geschuldet, keiner von mir beabsichtigten Herabsetzung deiner Person oder deines Ansatzes.

                    Danke, dass Du das klarstellst. Meinerseits ist jetzt alles gut.

    4. Drei Seiten sind als Bild unterlegt und die Datenfelder werden darauf absolut positioniert.

      Du baust dir also ein komplett neues pdf zusammen? Es gibt Bibliotheken, die in der Lage sind ein pdf zu editieren. D.h. um neue Felder zu erweitern.
      Damit kannst du das bestehende pdf verwenden und nur die neuen Felder hinzufügen.
      Ist zwar nicht das gewünschte Ergebnis, aber du ersparst dir in der bisherigen Weise die Bilder, die das eigentliche Formular ersetzen.

      Da ich auch schon mal mit pdf Erstellung konfrontiert war, hab ich interessehalber ein bisschen gesucht. Dies hier liest sich als würde es damit gehen.
      https://stackoverflow.com/questions/9139787/how-to-fill-pdf-form-in-php

      Nun musst du nur noch wissen wie die Felder heißen.
      Dazu hab ich dieses gefunden. https://www.pdffiller.com/de/

      Damit kannst du ein pdf online untersuchen. Über "Add Fillable Field" (grün am rechten Rand) kann man Felder hinzufügen, oder bestehende anklicken und wenn du dann "Advanced" aufklappst, siehst du einen "database name". Vielleicht ist das ja der Feldname, den du brauchst.

  7. Habe noch ein Problem, das mich fast fusselig macht.

    Die absolute Positionierung (in mm) der Datenfelder ist unterschiedlich im HTML-Formular und in der erzeugten PDF-Datei.

    Auf beide habe ich waagerechte und senkrechte Linien im 10mm-Abstand gelegt, die die Seite wie erwartet aufteilen.

    Erst nachdem ich auf dem Hintergrund-Bild die Ecken grafisch markiert habe, sehe ich, dass TCPDF das Bild (weiß auf weißem Grund) verkleinert, obwohl ich ausdrücklich 210 x 297mm angebe:

    $pdf->Image('gema_anmeldung_1_1.jpg', 0, 0, 210, 297, '', '', '', false, 300, '', false, false, 0);
    

    Wohlgemerkt: die Linien fuellen A4 korrekt aus, als ob es keinen Rand gäbe.

    // senkrechte Hilfslinien unterteilen A4 Breite
    for ( $i=1; $i<21; $i++ ) {
      $pdf->Line( $i*10, 0, $i*10, 297, ['width' => 0.05, 'cap' => 'butt', 'join' => 'miter', 'dash' => 0, 'color' => array(240, 240, 240)] );
    }
    // waagerechte Hilfslinien unterteilen A4 Hoehe
    for ( $i=1; $i<29; $i++ ) {
      $pdf->Line( 0, $i*10, 210, $i*10, ['width' => 0.05, 'cap' => 'butt', 'join' => 'miter', 'dash' => 0, 'color' => array(240, 240, 240)] );
    }
    

    Was ist falsch an $pdf->Image ?

    1. Hallo Linuchs,

      du musst die Seitenmargins auf Null setzen.

      $pdf -> SetMargins(PDF_MARGIN_LEFT, PDF_MARGIN_TOP, PDF_MARGIN_RIGHT);

      Bis demnächst
      Matthias

      --
      Du kannst das Projekt SELFHTML unterstützen,
      indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
      1. Hallo Matthias,

        du musst die Seitenmargins auf Null setzen.

        Habe ich (vermeintlich) gemacht und dachte, das gilt dann für alle Seiten:

          // Auswahl der MArgins in mm lt. tcpdf_config.php
          //$pdf->SetMargins(PDF_MARGIN_LEFT, PDF_MARGIN_TOP, PDF_MARGIN_RIGHT);
        //$pdf->SetMargins(15, 5, 5);
          $pdf->SetMargins(0, 0, 0);                  // left, top, right
          //$pdf->SetHeaderMargin(PDF_MARGIN_HEADER);
          $pdf->SetHeaderMargin(0);
          //$pdf->SetFooterMargin(PDF_MARGIN_FOOTER);
          $pdf->SetFooterMargin(0);
        

        Habe es nun nochmal pro Seite gemacht:

        $pdf->AddPage();
        $pdf->SetMargins(0, 0, 0);                  // left, top, right
        

        Leider ohne Erfolg.

        1. Hallo Linuchs,

          Habe ich (vermeintlich) gemacht und dachte, das gilt dann für alle Seiten:

          public function SetMargins($left, $top, $right=-1, $keepmargins=false) {
           //
          }
          

          https://tcpdf.org/docs/srcdoc/TCPDF/source-class-TCPDF/#2551-2574

          Bis demnächst
          Matthias

          --
          Du kannst das Projekt SELFHTML unterstützen,
          indem du bei Amazon-Einkäufen Amazon smile (Was ist das?) nutzt.
          1. Hallo Matthias,

            dein Link erklärt mir nicht, wo noch margins herkommen könnten.

            In der tcpdf_config.php habe ich was entdeckt:

            /**
             * Ratio used to adjust the conversion of pixels to user units.
             */
            define ('PDF_IMAGE_SCALE_RATIO', 1.25);
            

            Habe das auf 1.0 gesetzt. Keine Änderung. Rechts und unten hat das Hintergrund-Bild einen Rand von je 20mm. Wo kommt der her?

            Linuchs

    2. Moin,

      danke fürs Mitdenken. Da ich eine Lösung gefunden habe, möchte ich sie auch dokumentieren.

      Das Ränder-Konzept habe ich nicht verstanden (ich dachte, die wären nun alle auf 0), aber man muss (irgendwelche weiteren Bruch- und Automatik-) Ränder wegnehmen, das Hintergrund-Bild einbinden und die Ränder wieder setzen:

        $pdf->AddPage();
      
        // get the current page break margin
        $bMargin = $pdf->getBreakMargin();
        // get current auto-page-break mode
        $auto_page_break = $pdf->getAutoPageBreak();
        // disable auto-page-break
        $pdf->SetAutoPageBreak(false, 0);
      
        // set background image
        $pdf->Image('20200309_DCV_GEMA_Meldeformular-1.jpg', 0, 0, 210, 297, '', '', '', false, 300, '', false, false, 0);
      
        // restore auto-page-break status
        $pdf->SetAutoPageBreak($auto_page_break, $bMargin);
        // set the starting point for the page content
        $pdf->setPageMark();
      

      Gruß, Linuchs