Tom: SQL-Abfrage Duplikate suchen

Beitrag lesen

Hello,

Gruppiere nach den bestimmten Daten und hänge ein HAVING count(*) > 1 hinter die Gruppierungsklausel.

Das war auch meine erste Idee, aber die ist für eine praxisgerechte Nutzung nicht brauchbar. Da findet man nur die Datensätze mit identischen Einträgen. Bei der Doublettensuche sollte man allerdings auch die Möglichkeit von kleinen Schreibfehlern oder teilweiser Gleichkeit berücksichtigen. Es wird also eigentlich meistens keine Gleichheit, sondern nur Ähnlichkeit gesucht.

Ich hatte da mal ein dBase ein recht ausgefuchstes Progrmm für sowas geschrieben. Das war erst brauchbar, nachdem es Festplatten gab :-)) Aber dann hat es seinen Dienst gut getan und der (damals nagelneue) IBM8086 hat die ganze nacht gebraucht, um aus ca. 20.000 Datensätzen die 350 doppelten oder ähnlichen herauszusuchen.

Harzliche Grüße vom Berg
http://www.annerschbarrich.de

Tom

--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau