annA: RTF-Dokumente vergleichen und "neue" Stellen ausgeben

Hallo zusammen,

ich brauche ein paar Ideen für folgende Problemlösung:
Unser Außendienstmitarbeiter erstellt in einer Datenbank regelmäßig
Notizen zu Kundengesprächen die er dann in das RT-Format (RTF)
exportiert.

Dieses Dokument ist immer gleich aufgebaut:
Überschrift
Kundennummer
Datum Text
Datum Text
Kundenummer
Datum Text

Neue Datensätze werde entsprechend des Datums und der Kundennummer
eingefügt. Ich möchte nun gerne ein Programm schreiben / haben,
dass ein älteres Dokument mit dem neusten vergleicht und mir dann
nur die neuen Beiträge ausgibt. In Word ist sowas ja schon zum Teil
integriert, diese Funktion makiert aber nur den neuen Teil und ist
außerdem zu kompliziert zu bedienen (für unsere Mitarbeiter).

Ich kenne mich mit dem RT-Format nicht aus (den "Quellcode" finde
ich sehr verwirrend), hier wäre mir schonmal mit ein paar Links
geholfen (habe beim googlen nichts gefunden).

Womit würde man sowas am besten machen? Perl? Ich habe bei cpan
zwar ein paar RTF-Module gefunden, leider fehlte dort aber eine
Beschreibung (zumindest habe ich die nicht gefunden), vielleicht
hat ja einer von Euch schon damit gearbeitet und kann ein bisschen
was dazu schreiben.

Freue mich auf Eure Ideen

Vielen Dank
annA

  1. Halihallo annA

    Neue Datensätze werde entsprechend des Datums und der Kundennummer
    eingefügt. Ich möchte nun gerne ein Programm schreiben / haben,
    dass ein älteres Dokument mit dem neusten vergleicht und mir dann
    nur die neuen Beiträge ausgibt. In Word ist sowas ja schon zum Teil
    integriert, diese Funktion makiert aber nur den neuen Teil und ist
    außerdem zu kompliziert zu bedienen (für unsere Mitarbeiter).

    Hm. Folgende grundlegende Schritte:

    1. RFT's parsen und in
    2. eine geeignete Datenstruktur (eg. Hash mit Schlüssel (KundenNr,Datum)) einlesen.
    3. Die zwei Datenstrukturen (altes, neues Dokument) vergleichen, kommt ein Schlüssel
       (KundenNr,Datum) nur im zweiten Dokument (repräsentiert als Datenstruktur) vor,
        handelt es sich um einen neuen Eintrag.

    Ich kenne mich mit dem RT-Format nicht aus (den "Quellcode" finde
    ich sehr verwirrend), hier wäre mir schonmal mit ein paar Links
    geholfen (habe beim googlen nichts gefunden).

    http://search.cpan.org/author/SBURKE/RTF-Writer-1.07/lib/RTF/Cookbook.pod
    hat z.B. eine kleine Einführung.

    Womit würde man sowas am besten machen? Perl? Ich habe bei cpan
    zwar ein paar RTF-Module gefunden, leider fehlte dort aber eine
    Beschreibung (zumindest habe ich die nicht gefunden), vielleicht

    Das glaube ich dir nicht :-)   jedes CPAN-Modul hat eine Beschreibung.
    Und ja, Perl würde sich bestimmt dafür eignen: Practical _Extraction_ and _Reporting_
    language. Aber es geht natürlich auch mit allen anderen Sprachen.

    Viele Grüsse

    Philipp

    --
    RTFM! - Foren steigern das Aufkommen von Redundanz im Internet, danke für das lesen der Manuals.
    Selbstbedienung! - Das SelfForum ist ein Gratis-Restaurant mit Selbstbedienung, Menüangebot steht in den </faq/> und dem </archiv/>.
  2. Hi,

    Ich kenne mich mit dem RTF-Format nicht aus (den "Quellcode" finde
    ich sehr verwirrend), hier wäre mir schonmal mit ein paar Links
    geholfen (habe beim googlen nichts gefunden).

    na komm, in englischer Sprache gibt es Spezifikationen in Mengen

    Womit würde man sowas am besten machen? Perl?

    ich kenne eine rtf-klasse in PHP
    http://josefine.ben.tuwien.ac.at/~mfischer/developing/php/rtf/rtfclass.phps

    fand sie aber nicht ausreichend, da nur html oder xml zurückkommt, habe sie deshalb etwas modifiziert, wenn Du sie brauchst schick ich sie Dir.

    Ansonsten würde ich halt, das was zurückkommt, entweder als plaintext oder xml (ist vielleicht sogar die Idee, um die relevanten Stellen im Dokument zu finden) entsprechend filtern

    ciao
    romy