Die Größe der Forums-Hauptdatei liegt jetzt schon bei 450k, was ganz schön saftig ist.
Das liegt aber nicht an der Zahl der Meldungen, sondern an der Betriebspolitik des Schwanzabschneiders (welche ich ausdrücklich begrüße - sonst hätte ich zu einigen weiter unten stehenden Postings nicht mehr antworten können).
Also wird diese Betriebspolitik durch die große Zahl der Postings notwendig.
Ich denke nicht, daß früher 5 Tage Postings aufgewahrt wurden.
(1) Der Code für das kleine Bild vor jedem Posting macht etwa 1/4 der Datenmenge aus, insgesamt also über 100k. Meiner Ansicht nach zuviel für Schönheit. Es sollte weggelassen werden.
Das glaube ich nicht.
Solltest Du aber. Ich hab mal eine Kopie der Hauptseite (Stand: Freitag morgen, 00:00 Uhr, 407k groß) unter die Lupe genommen. Die Zeichenfolge '<img src="../src/x3.gif" width="15" height="10" border="0" alt="Seite"> ' macht 25,03% der Dateigröße aus.
Okay. Das ist durch die Validierung schlimmer geworden (ALT=""). Auch die Größenangaben könnte man in diesem Sonderfall vielleicht weglassen. Beides ist Stefans "Politik". (Genau wie WRAP= im Eingabefeld, gngngn ...).
(2) Der Titel eines Threads wird bei jeder Antwort wiederholt - viele Daten, keine Information. Wenn der Titel eines Postings vom übergeordneten Posting übernommen wurde, könnte in der Hauptdatei einfach nur 'Antwort' stehen, was i.d.R. viel kürzer ist.
Wahr, aber mengenmäßig insignifikant.
Das wiederum glaube ich nicht. Mal eine kleine Abschätzung: 1400 Threads, davon 3/4 mit übernommenem Titel, durchschnittlich 40 pro übernommenem Titel eingesparte Zeichen = insgesamt 41k.
Nehmen wir an, Du hättest recht, dann wären es 10%. Okay.
(3) Die Schlüssel für das Forums-Script könnten auch kräftig abgespeckt werden, davon würde man nichtmal was merken.
Schlüssel? Du meinst die HIDDEN-Parameter, um Postings zu verknüpfen? Sag mir konkret, was daran redundant sein soll.
Für jedes Posting gibt es ein <!--responses: xxxxx-->, <!--insert: xxxxx-->, <!--top: xxxxx--> und <!--end: xxxxx-->. Würde man daraus <!rxxxxx>, <!ixxxxx>, <!txxxxx>, <!exxxxx> machen (ob und mit welchem Aufwand das geht: keine Ahnung!), wären das 41 Zeichen weniger pro Posting, insgesamt beim Stand von Freitag morgen weitere 56k.
Okay. Das ließe sich wahrscheinlich durch einfaches Suchen&Ersetzen im Forum-Skript anpassen, wenn der Doppelpunkt erhalten bliebe - ansonsten müßte man wohl 2-3 Zeilen anpassen.
An solche technischen Details des Matt-Wright-Skripts hat sich bisher niemand rangewagt - das bedeutet für Stefan Münz, es entweder selbst zu machen (und welche anderen Tasks er gerade laufen hat, ist ja bekannt) oder es zu delegieren, also "loszulassen".
Die Endabrechnung:
407k Forumshauptdatei
-102k Bildchen gekickt
- 41k 'Antwort' statt wiederholter Titel
- 56k kleinere Schlüssel
= 208k
Der Selfbrowser ist nochmal um Faktor 4 (!) besser.
Am signifikantesten erscheinen mir da in der Tat die Bildchen.
Diese aber haben inzwischen eine echte Bedeutung (NI/NA) und sind nicht einfach so entbehrlich.
(Bedenke auch, daß das Moderator-Skript diese Hauptdatei parst und die Bildchen passend einsetzt - und der Schwanzabschneider anhand von NI die Übernahme ins Archiv regelt. Es wäre nicht nur das Forum-Skript anzupassen, sondern so ziemlich alle Skripte der Forum-Software.)
Wenn ich mich jetzt nicht irgendwo verrechnet habe, wäre die Forumshauptdatei damit nur noch halb so groß.
Ich empfehle also folgendes:
Du liest den Analyseteil des SelfBrowser-Quelltextes, welcher das von http://www.teamone.de/cgi-local/haupt.pl komprimierte Dokument überträgt, und baust Dir lokal eine CGI-Anwendung, welche dieses Dokument per LWP::Simple absaugt und wieder in eine Forumshauptdatei zurückverwandelt. Diese Schnittstelle steht Dir zur Verfügung.
Falls Du willst, bekommst Du sicher auch den Quelltext dieses Skripts inklusive Kommentierung, was warum wie komprimiert wird (ggf. e-Mail an mich).
Du wärest übrigens nicht der erste, der sich so etwas baut (siehe Forum-Archiv).