Was mir auch noch sehr am Herzen liegt, ist, dass das Forumsarchiv nicht nur in eine Datenbank wandert, sondern dass nach wie vor auch statische HTML-Dateien als Archivdateien erzeugt werden, so wie jetzt. Denn diese werden auch von Robots grosser Internet-Suchdienste indexiert, und daran ist mir durchaus gelegen.
Im bisherigen Index stehen relative URLs. Daran würde sich nichts ändern, wenn er in einer Datenbank aufbewahrt würde. Das Trefferdokument würde weiterhin Links auf Archivdateien enthalten.
Ferner duerfen wir auch nicht die Schnittstelle zwischen Forum und Archiv vergessen - den Schwanzabschneider. Egal wie die Loesung am Ende aussehen wird - der Schwanzabschneider muss die Daten, die er abschneidet, ins Archiv reinkriegen und ebenso in die Datenbasis fuer die Suche.
Was bisher das Anhängen einer Zeile am Ende der Indexdatei war, das wird dann der Aufruf einer Funktion "forumDBinterface::insert (...)".
(Gekapselte Funktionalitäten und saubere APIs sind unbezahlbar.)
und der Schwanzabschneider wird ebenfalls von dort aus gestartet, kann sich via LWP-Modul und HTTP-get hier die aktuellen Forumsdaten holen, und der Rest passiert dort.
Und wie läuft das dann mit der Synchronisation, wenn gerade jemand postet?
Also wenn schon weiterhin die Bahnschranke heruntergelassen werden muß, damit der Schwanzabschneider auf einer konsistenten Basis arbeiten kann, dann kannst Du auch
1. das Forum-Verzeichnis mit tar und compress zusammenpacken,
2. es via FTP zum dicken Server hinüberschicken,
3. dort wird dann archiviert und
4. zurück (FTP) kommt das Archiv mit dem neuen reduzierten Forums-Zustand,
5. auspacken und die Schranke geht wieder hoch.
Abgesehen davon, daß man das irgendwie synchronisieren muß, werden das ganz kurze, knackige Skripte. (Egal, ob Perl oder Shell.) Du kannst die beiden FTPs natürlich auch manuell machen ...