Beim Einscannen sollte man allerdings nur den Scans trauen, die man selbst gefälscht hat.
Sicherlich war Xerox da von einem Anwalt beraten, der behauptet hat, durch die kleinen Veränderungen würde(n):
- neue „Werke“ entstehen
- Urheberechtsverletzungen bezüglich der eingescannten „Werke“ unmöglich
- Xerox könnte selbst Urheberrechte an den neuen Werken geltend machen.
Was tut es da schon, wenn die Zahlen in den Werken nicht stimmen? Ein gewisser GvG soll sich schon 1986 um die Generalrechtevertretung für Deutschland bemüht haben…
Versicherung (txt→print→txt; txt→pdf→txt)
Später wurde das dann modernisiert - wir sollten die Daten nicht mehr als Text, sondern als PDF liefern (Datenformat immer noch gleich). Auch kein Problem - einfach den Text an den Pdf-Generator übergeben. Auch hier wieder die Frage nach dem Warum. Antwort: unsere OCR-Software kann nur PDF - und erzeugt daraus dann eine Textdatei, die dann an den Sachbearbeiter gemailt wird.
Wir machen also aus dem Text ein PDF, das dann per OCR wieder zu Text wird …
Naja.
- (Einfache Antwort:) Sowas kommt raus, wenn man nur großen Firmen vertraut.
- („Schwierige“ Antwort:) Das korrekte Einlesen einer Textdatei wurde ja unter Windows durch die Einführung von verschiedener Kodierungen für Nicht-ASCII-Texte für mehrere Jahrzehnte nahezu unmöglich, mindestens unwahrscheinlich.