Moin,
ich könnte auch sowas gebrauchen. Veranstaltungstermine (Pressetexte) sind oft in Prosa (freie, ungebundene, nicht durch Reim, Rhythmik und Vers gebundene Form der Sprache) geschrieben und müssten auf mehrere Felder wie „Datum”, „Titel“, „Postleitzahl“, „Straße“ ... aufgeteilt werden.
Bei der Straße kann ich mir vorstellen, ein erweiterbares Array zu pflegen mit Begriffen wie „straße“, „strasse“, „str.“, „weg“, „platz“ usw.
Davor und danach dann noch 20 .. 30 Zeichen mitnehmen. Muss dann manuell gekürzt werden. Die Praxis wird zeigen, wie die Treffer gezielter zu finden sind.
Die allerletzte Ausnahme wird nie gefunden, dann ist das Feld „Straße“ leer. Fällt sofort auf und eine „natürliche“ Intelligenz wie du und ich muss den Text interpretieren ;-)
Linuchs