Dennis: Spam vermeiden

Beitrag lesen

Hi Mark,

Wortfilter wäre sicher noch eine gute Sache, vor allem sind deren Mails meistens auf Englisch. Vielleicht eine Kombination: weiblich + englisch + Mailadresse eines Freemailers + Link in der Mail = Spam.

Von Wortfiltern halte ich persönlich nicht besonders viel. Ich würde dir eher dazu raten, mal einen Bayesschen Filter auszuprobieren. Die Grundlage eines solchen Filters ist im Prinzip, dass du aufgrund gesammelter statistischer Daten eine Spam-Wahrscheinlichkeit für einen beliebigen Text berechnen kannst.

Gut erklärt und direkt mit Beispiel-Implementierungen in PHP findest du das ganze im SELFHTML-Artikel „Bayesscher Kommentarspam-Filter”. Die Links am Ende des Artikels sind sicherlich auch lesenswert. Wenn du aber so einen Filter baust, dann bedenke, dass du den auch erst mal mit Daten füttern musst und diese jeweils als Spam oder Nicht-Spam kennzeichnen musst, bis der Filter dann nach einiger Zeit zuverlässige Ergebnisse liefert.

Viele Grüße,
  ~ Dennis.