Alexander Brock: Maßnahmen gegen Spammer

Beitrag lesen

Hallo Freunde des gehobenen Forumsgenusses,

Ich habe jetzt einen Bayes-Filter implementiert, ich weiß aber nicht, ob ich das auch wirklich richtig verstanden habe. Hier meine Vorgehensweise:

Ich habe zwei Tabellen in einer Datenbank:

Eine, in der steht wie viele Wörter alle Spam-Mails zusammen haben und wie viele alle erwünschten Mails.

Eine, in der steht welches Wort wie oft in Spam und wie oft in erwünschten Mails auftritt.

Wenn jetzt eine neue Mail getestet werden soll, wird für jedes Wort abgefragt,
wie häufig es in Spam-Mails und wie häufig in erwünschten Mails auftrat.

Dann werden die Summen gebildet und jeweils durch die gesamt-Zahl aller Wörter in den Spam- bzw. erwünschten Mails geteilt. Dann hat man zwei Zahlen,  deren Betrag sehr nahe an null ist (wie nahe liegt an dem Verhältnis Textlänge/Größe der vorhandenen Datenbank), diese werden so umgerechnet, dass sie zusammen eins ergeben (wie sich das für Wahrscheinlichkeiten gehört) und das Verhältnis erhalten bleibt.

Ist das soweit verständlich?

Als Trenner für Wörter habe ich übrigens folgenden regulären Ausdruck: #[\s.:,;(){}\[\]!?´`']+# hat da jemand einen besseren?

Gruß
Alexander Brock

--
[latex]\lim_{3 \to 4}{\sqrt{3}} = 2[/latex]
0 72

Maßnahmen gegen Spammer

Fabienne
  • meinung
  1. -1
    Zeromancer
    1. 0
      Fabienne
      1. 0
        TomIRL
        1. 0
          Fabienne
          1. 0
            Armin
          2. 0
            Sven Rautenberg
            1. 0
              Fabienne
    2. 0
      Chris
      1. 0
        Zeromancer
        1. 0
          Chris
          1. 0
            Fabienne
  2. 0
    Stefano Albrecht
    1. 0
      TomIRL
  3. 0
    Mathias Bigge
    1. 0
      wahsaga
    2. 0
      Der Martin
      1. 0
        wahsaga
        1. 0
          Chris
          1. 0
            Der Martin
      2. 0
        Armin
        1. 0

          Vernünftiger Mail-Client?

          Chris
          • e-mail
          1. 0
            Der Martin
          2. 0
            Armin
            1. 0
              Ashura
            2. 0
              Der Martin
        2. 0
          Alexander Brock
          1. 0
            Armin
            1. 0
              Alexander Brock
              1. 0
                Mathias Bigge
                1. 0
                  Alexander Brock
                  1. 0
                    Mathias Bigge
                    1. 0
                      Alexander Brock
    3. 0
      Sven Rautenberg
      1. 0
        Mathias Bigge
        1. 0
          Christian Seiler
          1. 3
            Christian Kruse
            1. 0
              Christian Seiler
              1. 0
                Tim Tepaße
  4. 0
    Christoph Zurnieden
    1. 0

      Wie funktioniert SMTP?

      Chris
      • e-mail
      1. -1
        Vinzenz Mai
        1. 0
          Henryk Plötz
          1. 0
            Vinzenz Mai
      2. 2
        Sven Rautenberg
        1. 0
          Der Martin
        2. 0

          Wie RICHTIG Mails versenden?

          Chris
          1. 1
            Henryk Plötz
            1. 0
              Chris
              1. 0
                Der Martin
        3. 0
          Henryk Plötz
          1. 0
            Sven Rautenberg
            1. 0
              Christian Kruse
      3. 0
        Christoph Zurnieden
  5. 0
    Alexander Brock
    1. 0
      Sven Rautenberg
      1. 0
        Alexander Brock
  6. 0
    Andreas Lindig
    1. 0
      Alexander Brock
      1. 0
        at
        1. 0
          Alexander Brock
          1. 0
            at
            1. 0

              Formmailer

              Alexander Brock
      2. 0
        Andreas Lindig
        1. 0
          Andreas Lindig
        2. 0
          Alexander Brock
        3. 0
          Detlef G.
    2. 0
      Detlef G.
      1. 0
        Andreas Lindig
    3. 0
      Johannes Zeller
    4. 0
      Christian Seiler
  7. 0

    Software gegen Spammer

    Alexander Brock