Tim Tepaße: *Intelligentes* Natural Language Processing fuer Termine

Beitrag lesen

Taeglich investiere ich viele Minuten um die ganzen Mails & Info-Schnipsel in denen sich versteckt Ankuendigen, Termine etc. verbergen, in meinen Kalender einzutragen. Bin ich wirklich der einzige und erste den das nervt?

Bei MacOS gibt es seit Jahren die Data Detectors, die diverse Textbestandteile erkennen und oftmals praktische Popups oder andere Möglichkeiten dazu bieten. Hier z.b. ein erkanntes Event samt Popup im Mailprogramm:

Ultimativ wuerde ich daher nach einer Library suchen, die aus Text Termine extrahieren kann. Das Stichwort ist dabei *intelligent*:

Superintelligent ist wie Jörg sagt, halt schwierig. Man muss nicht nur den Text verstehen, sondern auch den Kontext. Wer ist „Wir“ in „Wir treffen uns“? Ist das ein Städtename oder was ganz anderes? Man weiß es nicht.

Allerdings so aus der Praxis: Man kommt mit etwa wie obigen (NSDataDetector scheint sogar nur Regexp-basiert zu sein) sehr weit.

Gibt es wirklich keine Library in diese Richtung oder bin ich zu blind?

Hm. Mir kam das Thema in den letzten Jahren immer wieder durch den Feedreader, ausgelöst u.a. auch durch alternative Eingabemethoden wie Fantastical, die noch mehr als Apple selber parsen. Und ich glaube nicht, dass so etwas auf eine Platform beschränkt ist; schließlich gucken die meisten Softwarehersteller, was sich lohnt, zu raubmordkopieren. GMail z.B. hat das seit letzten Jahr auch eingebaut und ich kann mir schlecht vorstellen, dass etwas kombiniertes wie Outlook das nicht auch haben sollte.

Am besten waer natuerlich JavaScript, aber notfalls nimm' ich alles (C++, Java, ...) und im aeussersten Notfall wuerd ich sogar auf eine Online API zurueckgreifen ...

Ich kenne das unter dem Stichwort natural language (date) parsing und die Suche danach gibt schon auf der ersten Seite Ergebnisse in Ruby, Java, .NET und Diskussionen, in denen man vermutlich sehr viel mehr findet.