Aloha ;)
Die (deutsche) PLZ kann man relativ einfach finden, dadurch hat man schon einiges gewonnen. Die Hausnummer ist die freistehende Zahlen-Buchstaben-Zeichen-Kombination vor der Postleitzahl, und davor steht der Straßenname.
Straßennamen können freistehende Zahlen enthalten:Kolonie 2 Süd
Aber auch die haben zwischen Straßennamen und Postleitzahl noch eine weitere Zahl - die Hausnummer.
Falls der String nichts außer der Adresse (in Prosa) enthält, wäre damit der Straßenname unabhängig von seiner Komplexität gefunden.
Schonmal ein Gewinn.
Es gibt auch Hausnummern wie
1/2
5 1/2
Tatsächlich? 5 1/2? Das habe ich noch nie gesehen.
Ich war jetzt ausgegangen von 5/1 und 5/2 bzw. 5-1 und 5-2, ggf. auch noch 5A. Deshalb schrub ich "Zahlen-Buchstaben-Zeichen-Kombination" für die Hausnummer.
In Kombination mit Straßenname
Straße 5
Wird es dann schwierig ...
Nur, wenn es 5 1/2 tatsächlich als Hausnummer gibt. Mir kommt das unsinnig vor, das wäre dann für mich nicht 5 und 5 1/2 sondern 5-1 und 5-2, aber ich kann mich natürlich irren und das einfach nur nicht kennen.
Anyway - der Kern meiner Aussage war ja nicht, dass das dann eine sichere Kiste ist, sondern nur, dass die Aufgabe einfacher zu lösen wird und es mehr valide Treffer geben wird, wenn tatsächlich die gesamte Adresse in Prosa gegeben ist, als wenn man nur irgendwo Straßennamen rausfiltern will.
Grüße,
RIDER