Edgar Ehritt: [Regex] wiederhollte sätze entfernen

Beitrag lesen

Hallo erstmal!

beispiele:

"Der Text ist fast gleich wie der andere"
"Dieser Text ist etwa genauso gleich wie der andere oben"

Das ist mit RegEx nicht hinzubekommen. Auch String-Funktionen, etwa levenshtein(), similar_text() oder soundex(), die man für Rechtschreibeaufgaben nutzen könnte, werden das nicht bewältigen können. Beide Herangehensweisen müssten andernfalls den Inhalt verstehen, was aber für ihren simplen Aufbau viel zu komplex ist.

falls das zu kompliziert ist kann man als notlösung auch identische sätze löschen..

Hier böte sich ein Datenfeld an, das mit den entsprechenden Sätzen befüllt ist und mit der Eingabe als Vergleich durchsucht wird.

Gruß aus Berlin!
eddi