Hi!
Fetz kann das alles mit seiner Datenbank sicherlich viel besser beantworten,
wer oder was ist Fetz?
aber ich konnte grad nicht einschlafen: Zur Zeit hat dieser Thread 303707 Bytes an Nachrichtentext (also ohne Metadaten oder HTML-Tags, aber mit HTML-Entities).
Hast Du in einer Schleife alle Postings ausgelesen? Aber bei 300 KB geht das ja noch ;-)
Bei der Anzahl der individuellen Poster komme ich übrigens auf 48, wenn man Name und email-Addresse kombiniert. Ob das jetzt nur an Fipptehlern liegt, kann ich aber nicht beurteilen.
Jaja, die Fippfehler machen mir auch oft sorgen ;-)
Aber wenn ich mir meine Statistik angucke
entdecke ich alleine da schon 3 doppelte aufgrund von anderer Schreibweise, :
uepselon bei einem dere 38 Postings vertippt ;-)
carla und tom2 mal groß mal klein
Also sind es noch weniger. Wobei ich die email-Adressen nicht beachtet habe, da ich gedacht habe das eher Leute Ihre Email-Adresse mal nicht angeben, als das Leute den gleichen Namen und unterschiedliche Email-Adresse haben. 100%ig kann man das eh nicht hinbekommen.
Aber ich habe nochwas spaßiges versucht, ich hatte ja mitdem Gedanklen gespielt das ganez auifs archiv anwenden zu können, wobei es eion Problem gibt, die Verzeichnisse unterscheiden sich nicht nur nach ThreadID, auch nach Datum. Also habe ich ein Script geschrieben, welches mir immer die erste ThreadID eines Monats ausliest und in eine Datei schreibt, so kann ich bei Eingabe einer ID direkt im richtigen Verzeichnis suchen.
http://www.knet-systems.de/temp/archiv.php Mich wundert übringens in welcher Geschwindigkeit sich alle Archiv-Übersichten hintereinander auslesen lassen ;-)
Problem an der Sache: Ab 11.2001 gab es neue IDs, d.h. die überschneiden sich, aber die alten sind nicht ganz so wichtig, evtl macht man eine Checkbox für "im alten Archiv"
Jedenfalls kann ich mit den ermittelten Nummern jetzt alle Verzeichnisse zusammenbauen und jeden Thread so auswerten wie die in der Forums-Hauptdatei.
Nur wenn ich den längsten Thread eines Monats ermitteln will, dann kann ich es glaube ich vergessen, wenn ich alle Threads(ca. 2-3000 pro Monat!) öffne, dann ist das ja tierisch viel Traffic...
Naja, man wird sehen was das alles bringt ;-)
Grüße
Andreas
PS: Wie hast Du das gemacht? Auch per fsockopen und fget den Inhalt geholt und mit preg_match_all einen großen Array mit allen Daten erzeugt?