Hello,
Bei Ersetzungen kann man eigentlich weder von Whitelisting (alles, was erlaubt ist), noch von Blacklistung (alles, was verboten ist) sprechen.
Ein einfaches str_replace() mit Array hilft schon weiter.
Allerdings ist das noch keine "Normierung".
Dann müssten z.B. solche Dinge, wie
"Dr. Heinrich Jasper Str"
"Dr.-Heinrich-Jasper-Str."
"Dr.-Heinrich-Jasper-Straße"
"Dr.-Heinrich-Jasper-Straße"
"Dr-Heinrich-Jasper-Straße"
usw. nachher alle gleich aussehen.
Und dann kommt das nächste Problem
"Dr.-Heinr.-Jasper-Straße"
Prinzipiell geht das das nur noch über SoundEx() oder ähnliche Funktionen, sowie eine Zerlegung in Sequenzen an den vermeintlichen Trennstellen.
Harzliche Grüße vom Berg
http://www.annerschbarrich.de
Tom
--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau