cr: DokumentenManagementSystem im Eigenbau

Hallo!

ich habe vor, aus dem Papierkrieg mit Rechnungen, Verträgen und co eine einfach zu verwaltende,übersichtliche und durchsuchbare PC Software Version zu basteln.

Folgendes steht zur Verfügung:

Xubuntu 10.04 Rechner, welcher lokal als Webserver fungiert.

Diesen würde ich gern um einen Scanner und Etikettendrucker erweitern.

Damit möchte ich alle per Post kommenden Rechnungen einscannen und unter einer fortlaufenden Nummer chronoligisch ablegen.

Vorteil:

-> Dokumente kann ich ab sofort über den PC suchen, bei Bedarf schnell ausdrucken und theoretisch unendlich viele Dokumente sichern. Zudem unendliche Verfügbarkeit.

Nun möchte ich aber auch keine fertige Softwarelösung nehmen, sondern für den eigenen Anreiz mir eine eigene basteln.

Die Frage ist nun, nach welcher Logik würdet ihr die eingescannten pdf's ablegen?

ich habe mir folgendes überlegt:

ich statte den dateinamen mit allen nötigen informationen aus:

also z.b.:

  • die ersten 4 Buchstaben geben in Zahlen die Firma an (also z.B. 1019 für vodafone usw.
  • die nächsten 20 geben den typ an...hier stehen typen wie rechnung, kündigung, schriftverkehr sonstiges, vertrag, versicherung, etc zur verfügung. z.b. 01010000000000000000 soll z.b. die zweite zahl als 1 angeben dass der vertrag sowohl eine rechnung ist wie auch ein vertrag als vierte zahl. das der vertrag keine versicherung ist steht die 5. zahl als null.
  • hinten dran nun noch den zeitstempel im unixformat vom datum des briefes / der rechnung.

also zusammengefasst z.b.:

1019-01010000000000000000-1281896558.pdf

was haltet ihr davon? ich weiß das das recht sprälich an infos ist, deshalb bin ich für andere ideen oder auch verbesserungsvroschläge sehr gern offen!

grüße cr

  1. Hi there,

    also zusammengefasst z.b.:

    1019-01010000000000000000-1281896558.pdf

    was haltet ihr davon?

    Also durchdacht scheint es auf alle Fälle zu sein, das Problem seh' ich nur in der praktischen Handhabung. Ich meine, ich kenn' Dich ja nicht, aber ich kenne mich und viele andere, denen das unter Garantie zu mühsam wäre, von möglichen Fehlern bei der Eingabe (hast Du die vielen Nullen gesehen;) einmal abgesehen. Ich würde da mit einer OCR-Software d'rüberbügeln und den Text zumindest zum PDF mitabspeichern, damit Du wenigstens eine Volltextsuche machen kannst. Keine Ahnung, was OCR-mäßig bei Ubuntu derzeit aktuell ist, aber irgendetwas wirds schon geben...

  2. moin,

    also zusammengefasst z.b.:

    1019-01010000000000000000-1281896558.pdf

    was haltet ihr davon? ich weiß das das recht sprälich an infos ist, deshalb bin ich für andere ideen oder auch verbesserungsvroschläge sehr gern offen!

    Ich würde nicht allzuviel in den Dateinamen packen. Also ich hab bei meinen Fotos auch mal damit angefangen, vanity-Dateinamen zu vergeben wie 'Daggi_am_Strand', 'Daggi_in_der_Bar', 'Gabi_mit_Daggi', 'Bar_am_Strand', 'Gabi_am_Strand', 'Gabi_unter_Wasser' usw., aber irgendwie hab ich diese Bilder dann nie wieder gefunden, weil ich vergessen hatte, welche Dateinamen das da waren.

    Bewährt hingegen hat sich das Datum im Dateinamen und, sofern es an einem Tag mehrere Dateien gibt, sind die einfach nur durchnumeriert. Urlaub in der Eifel? Kein Problem, da hatten wir Silberhochzeit und so sind die Fotos dann schnell gefunden...

    Schöne Grüße, Hotti Hottspott

  3. Hello,

    Die Frage ist nun, nach welcher Logik würdet ihr die eingescannten pdf's ablegen?

    ich statte den dateinamen mit allen nötigen informationen aus:

    • die ersten 4 Buchstaben geben in Zahlen die Firma an (also z.B. 1019 für vodafone usw.
    • die nächsten 20 geben den typ an...hier stehen typen wie rechnung, kündigung, schriftverkehr sonstiges, vertrag, versicherung, etc zur verfügung. z.b. 01010000000000000000 soll z.b. die zweite zahl als 1 angeben dass der vertrag sowohl eine rechnung ist wie auch ein vertrag als vierte zahl. das der vertrag keine versicherung ist steht die 5. zahl als null.
    • hinten dran nun noch den zeitstempel im unixformat vom datum des briefes / der rechnung.

    also zusammengefasst z.b.:

    1019-01010000000000000000-1281896558.pdf

    was haltet ihr davon? ich weiß das das recht sprälich an infos ist, deshalb bin ich für andere ideen oder auch verbesserungsvroschläge sehr gern offen!

    Warum willst Du die Möglichkeiten des Dateisystems so stark reduzieren?
    Wie Klawischnigg schon schrieb, ist das eher "unmenschlich" was Du da vorhast.

    Ich würde die Parameter als Optionsparameter und nicht als Positionsparameter aufbauen und dann auch mnemonsich vorgeben.

    Vodafone-20100801-1-RV, Kurzinhalt          Partner Vodafone, Datum, erster an dem Tag, Rechnung, Vertrag,

    Vodafone-20100801-2-R             ... Rechnung
    Vodafone-20100802-1-B             ... Brief von denen an mich
    Vodafone-20100802-1-A             ... Brief (Anschreiben) von mir an die

    Das ist kürzer, intuitiv, noch in 100 Jahren ohne Anleitung zu dechiffrieren und somit "sekretärinnenfest", also auch ohne Programm drum herum benutzbar.

    Ich stapele meine Dokumente so, seit es lange Dateinamen gibt und finde sie noch swieder. Am Anfang habe ich mich noch gescheut, eingehende Dokumente zu scannen, weil ja 50GB Festplattenplatz noch ca. 3000 DM gekostet haben und sowieso nur unter Novell zu kontrollieren waren...

    Liebe Grüße aus dem schönen Oberharz

    Tom vom Berg

    --
     ☻_
    /▌
    / \ Nur selber lernen macht schlau
    http://bergpost.annerschbarrich.de