David Bruchmann: Wie vergleiche ich am schlauesten Datensaetze?

Beitrag lesen

Hallo Rufus,
Ich schlage eine Subtraktion vor. Dort wo der Wert am meisten gegen Null geht, hast Du die größte Ähnlichkeit.

Gruß David

Hallo,

ich baue gerade eine DB mit 10.000 Artikeln auf, die miteinander verglichen werden sollen.

Die Eigenschaften werden bislang als Zahlen gespeichert, je nach Anzahl der moeglichen Optionen geht das von 0 bis 8.

Beispiel>  Produkt  EigenschaftA  EigenschaftB  EigenschaftC
                 Apfel               1                     4                   3
                 Birne               2                     4                   0
                 Zitrone            1                     4                   2

Mir geht es darum, Aehnlichkeiten zu finden, die schliesslich in Prozentzahlen ausgedrueckt werden sollen. Im Beispiel haetten Apfel und Zitrone die hoechste Ahnlichkeit, da die meisten Werte uebereinstimmen.

Wenn ich fuer jede Eigenschaft nur die Moeglichkeiten JA und NEIN haette,
wuerde ich einen Bitvergleich anstellen, das oben waere also meinetwegen

Apfel    110
Birne    010
Zitrone 110

Ratzfatz haette ich alles verglichen. Nur - wie mach ich das jetzt am schlauesten fuer die Felder, die mehr als 2 Moeglichkeiten haben?  Die Zahlenwerte 0-8 ins binaere zu bringen scheint mir nicht mehr viel zu helfen.

Wer hat ne schlaue Idee fuer mich?

Danke schonmal,
Rufus :)