Hallo,
meine Frage bezieht sich nicht auf eine spezielle Programmiersprache, sondern auf die geeignete "Methode", Technik.
Beispiel:
Es gibt eine Tabelle mit Mitgliedern bestehend aus ID, Vorname, Name, Geburtsdatum. Es werden verschiedene Gruppen erstellt, wie z.B. Hobbies: Fussball, XBox, Laufen, Kochen, Tiere usw. Jedes Mitglied kann in mehreren Gruppen vorkommen.
Mein Ziel ist es, die Ähnlichkeit dieser Gruppen in einem Wert zu erfassen, um zu erkennen wie ähnlich die Gruppen sich anhand ihrer Mitglieder sind.
Wären in jeder Gruppe 1000 Mitglieder und in Gruppe Fussball und Laufen sind jeweils 999 gleiche Mitglieder wäre die Ähnlichkeit bei fast 100%. Wäre nur 1 Mitglied identisch in beiden Gruppen, läge die Ähnlichkeit der Gruppen bei 0,1%.
Die ID kennzeichnet jedes Mitglied mit einer einzigartigen Zahl. Die ID´s jeder Gruppe einfach zu addieren würde aber kein wirklich guten Wert ergeben, der die Ähnlichkeit zeigt. Ein Hashwert z.B. wäre ein eindeutiger Fingerabruck je Mitglied.
Nur kenne ich leider keine "Methode" oder Technik, wie ich aus den einzelnen Hashwerten einer Gruppe einen Wert erzeugen kann und auch die Ähnlichkeit mit den anderen Gruppen anhand dessen berechne.
Weiß jemand, wie man so was umsetzen kann. Ein Fachbegriff oder Stichwort was ich dann weiter recherchieren kann, würde auch schon helfen.
Gruß ebody