Moin Moin !
Die Link-Popularität würde aber inkrementell berechnet, und ein Posting mit mehr als einer pathologischen Obergrenze von Links könnte diesbezüglich problemlos "hinter die Heizung fallen".
Auch trivial: alle identische Links in einem Posting zählen nur als ein Link. In Perl läßt sich das mit einem Dreizeiler erledigen:
%seen=();
map { $seen{$_}++ } @list;
@unique=keys %seen;
(Frei nach dem Perl Cookbook, Kapitel 4, "Extracting Unique Elements from a List")
Für Links auf das Forumsarchiv kann man die Links auch noch ausmisten, sprich: Nur die t- und m-Parameter zählen, zusätzlicher Müll wird abgeschnitten. (Noch eine Troll-Sicherung.)
Um hier zu spammen, braucht der Troll schon ziemlich viele Postings.
Du kennst LWP::Simple und LWP::UserAgent? Ein "Spambot", speziell auf das Forum abgestimmt, sollte recht einfach zu bauen sein.
Weitere Kriterien, die mir spontan einfallen: Verlinkung durch unterschiedliche Poster,
Oh, ja. Sehr schön! Würde umgekehrt auch den Troll behindern.
Ich hasse es, mir selbst zu widersprechen, aber auch unterschiedliche Poster könnte ein Spambot simulieren.
Verlinkung über längere Zeiträume (ein Indiz für eine vollständige Problemdiskussion),
... und für den "zeitlosen Wert" der Aussage.
Nebenbei ist dies ein recht wirksames Mittel gegen einen Spambot, denn ein über längere Zeit spammender Automat fällt auf und kann durch technische Mittel (IP-Adresse blocken, Code-Abfrage à la Yahoo-Anmeldung, ...) blockiert werden.
Verlinkung durch Stammposter (zu erkennen anhand der Vielposter-Statistik).
Auch nett. Ebenso: Verlinkung durch registrierte Poster (macht es dem Troll schwerer?).
Nicht wirklich. Momentan könnte ein Spambot sich wahrscheinlich sehr leicht sehr viele Accounts registrieren.
Wenn die Spambots nicht auftreten oder wirksam unterdrückt werden können, könnten meine Ergänzungen vielleicht das Ranking von Postings verbessern.
Bleibt noch eine Idee: Links innerhalb eines Threads sind nicht so "gut" wie Links über Threadgrenzen hinweg, und Links ins Archiv (explizit /archiv/ im ursprünlichen Posting) sind noch besser. Im Thread sind Links meistens die Kurzform von "hab ich doch schon alles erklärt", über Thread-Grenzen hinweg zeigen sie eine andere Diskussion zum selben oder ähnlichen Thema (auch wenn es nur "DOPPELPOSTING!" ist), naja, und das Archiv ist eben das Archiv.
So, jetzt aber nichts wie weg, bevor jemand das böse I-Wort aus dem SelfLexikon mich trifft. ;-)
Alexander
Nein, ich beantworte keine Fragen per eMail. Dafür ist das Forum da.
Today I will gladly share my knowledge and experience, for there are no sweeter words than "I told you so".