Tach,
Als erstes ist es nötig alle Wiederholungen von Buchstabenfolgen (3 oder länger) im Kryptogramm zu finden. Ich habe nun eine Funktion geschrieben, die mir absolut jede Wiederholung in ein Array schreibt. Hier kommt die 1. Frage: gegeben sei der Text 'hausgartenkatzegartenhund'. Meine Funktion würde nun finden: garten , garte , arten , gart , arte , rten , gar , art , rte , ten. Ist es nun wirklich das, was man beim Kasiski-Test wirklich macht? Oder "zählt" nur das längste eines Wortes - hier also nur garten? Wenn ja, wie filtere ich zuverlässig alle anderen Treffer raus?
du interessierst dich ja nicht für den Inhalt der Wiederholungen sondern für die Abstände; kürzere Doppelungen würde ich also nur registrieren, wenn die Abstände unterschiedlich sind.
Nun wollte ich auch eine solche Prozent-Bewertung anbieten. Allerding kann ich nicht nachvollziehen, nach welchem Prinzip ich die Anzahl der gefundenen Teiler in eine Prozentangabe überführen könnte.
Ich sehe auch nicht, was Prozente hier aussagen sollen; ich würde eher ein gewichtetes Scoringverfahren verwenden, um die Teiler nach Güte zu sortieren.
mfg
Woodfighter