Michael Schröpl: Indexdatei für die Archivsuche

Beitrag lesen

Hi Michael,

Und mein Gedanke war es halt anhand des Alten
Archiv-Indexes ein Flatfile zu machen, in dem
alle Posts bis zur Schließung drin sind, welches
dann wiederum von Fetz! und PAF importierbar ist.

dann laß Dir doch einfach die Archiv-Index-Dateien von der Self-Redaktion geben - und zwar diejenigen, die von der Portal-Suchmaschine verarbeitet werden.

Wobei ich natürlich zusätzlich der Meinung bin (Leider
fehlt mir der Beweis), daß die fehlende Periode, in der
die Forumsversion 1 Online war die Zahlen noch "zugunsten"
der Version 1 verschiebt.

Helfen Dir folgende Zahlen weiter?

Forums-Archiv 2002 (31.01 MB)
  Forums-Archiv 2001 (30.28 MB)
  Forums-Archiv 2000 (49.43 MB)
  Forums-Archiv 1999 (31.17 MB)
  Forums-Archiv 1998 ( 4.88 MB)

(Quelle: http://selfsuche.teamone.de/cgi-bin/such.pl)

Threads      Anzahl     Postings       Anzahl
1998 - Q3 (2M) 00001 - 00600     600   000001 - 002340   2340
1998 - Q4      00601 - 01571     971   002341 - 006716   4376
1999 - Q1      01572 - 02721    1150   006717 - 012882   6165
1999 - Q2      02722 - 04635    1914   012883 - 022660   9778
1999 - Q3      04636 - 06946    2311   022661 - 034653  11993
1999 - Q4      06947 - 09640    2694   034654 - 048858  14205
2000 - Q1      09641 - 11860    2220   048859 - 060791  11933
2000 - Q2      11861 - 16159    4299   060792 - 081643  20582
2000 - Q3      16160 - 22000    5841   081644 - 112410  30767
2000 - Q4 (1M) 22001 - 23488    1487   112411 - 121981   9571
2001 - Q1
2001 - Q2 (2M) 23489 - 26241    2753   121982 - 137011  15030
2001 - Q3 (2M) 26242 - 29340    3099   137012 - 152747? 15736?
(die letzte Posting-Nummer habe ich nur ungefähr - das ist die höchste Posting-Nummer des letzten archivierten Threads)

Quelle: http://forum.de.selfhtml.org/archiv/

Danach Umstellung auf neues Archiv-Format, Zahlen deshalb etwas
fehlerbehaftet (ich habe per Archivsuche versucht, über das
Datum die Thread- und Posting-Nummern zu finden - nur als
Richtwerte verwendbar, ein paar Stunden Abweichung möglich):

2001 - Q4 (2M) 00001 - 01780    1780   000001 - 010380  10380
2002 - Q1      01781 - 08474    6694   010381 - 046871  36491
2002 - Q2      08474 -                 046872 -

Das Posting, auf welches ich gerade antworte, ist Nr. 49080 des neuen Formats - insgesamt haben wir also vor ein paar Tagen die 200000er-Grenze überschritten.
(Wenn ich die genaue Zahl der Postings des alten Archivs wüßte, könnte ich die Posting-Nummer des "Jubiläums" berechnen - und die Archivsuche versteht Posting-Nummern als Suchbegriffe, egal ob für das alte oder das neue Forum-Format ...)

Vergleichbare Zahlen für die Postings wären auf dem Server selbst durch "wc -l" auf die Indexdateien möglich gewesen.

Viele Grüße
      Michael