Christopher: Spracherkennung

Beitrag lesen

Hallo Leute,

ich habe mir in JAVA einen eigenen SMTP-Document-Server programmiert
der eingehende EMails filtert und nach einem bestimmten Muster in
der Datenbank speichert. Nun habe ich das Problem, dass ich an einer
Stelle die zugrundeliegende Sprache einer EMail herausbekommen muss.
Die Sprache der EMail kann anfänglich nur Deutsch oder Englisch sein.
Die Information, ob der Titel oder der Content immer wiederkehrende,
sozusagen statische Konstanten beinhaltet, liegt mir leider nicht
vor. Daher würde es also nicht ausreichen zB eben jene Konstanten
sprachabhängig in einer CSV-Datei zu hinterlegen und die eingehenden
Mails anhand dieser Werte zu durchsuchen und davon abhängig dann
schließlich einer Sprache zuzuordnen.

Nun meine Fragen an Euch:
Wie würdet ihr in so einem Fall am performantesten vorgehen?
Bzw. Gibt es _überhaupt_ einen Lösungsansatz für dieses Problem?
Oder gibt es vllt. Web-Services, die einem so etwas anbieten?

Sollte ich Informationen vergessen haben zu erwähnen, so sagt
mir bitte bescheid.

Besten Dank für eure Bemühungen
Christopher