(ZU DIESEM FORUM) Abspecken?
Steffen Gerlach
Hallo zusammen,
Im Moment erscheinen in diesem Forum etwa 70 Threads pro Tag. Das Aufkommen hat sich damit im Laufe des letzten Jahres etwa vervierfacht, und daß diese Entwicklung damit abgeschlossen ist, ist unwahrscheinlich. Die Größe der Forums-Hauptdatei liegt jetzt schon bei 450k, was ganz schön saftig ist. Nicht jeder, der hier ab und zu vorbeischaut, wird sich deshalb den SelfBrowser installieren. Und die Zeitspanne, für die die Threads auf der Hauptseite verbleiben, noch zu verkürzen, ist auch nicht so die tolle Lösung.
Bleiben Einsparungen am HTML-Code selbst. Mir ist dazu folgendes aufgefallen:
(1) Der Code für das kleine Bild vor jedem Posting macht etwa 1/4 der Datenmenge aus, insgesamt also über 100k. Meiner Ansicht nach zuviel für Schönheit. Es sollte weggelassen werden.
(2) Der Titel eines Threads wird bei jeder Antwort wiederholt - viele Daten, keine Information. Wenn der Titel eines Postings vom übergeordneten Posting übernommen wurde, könnte in der Hauptdatei einfach nur 'Antwort' stehen, was i.d.R. viel kürzer ist. Das sähe dann etwa so aus:
Habt ihr was gegen Leute die mit Frontpage, Dreamweaver & Co arbeiten?? von Frank, 13.5.2000, 23:49 Uhr
(ÜBERSCHRIFT) ausdrucksvolle Inhaltsbeschreibung, neugierig machend von Swen, 14.5.2000, 13:07 Uhr
Antwort von Besim Karadeniz, 14.5.2000, 00:49 Uhr
(MEINUNG) du stellst die falschen Fragen von Antje Hofmann , 14.5.2000, 00:21 Uhr
Antwort von Bastian, 14.5.2000, 01:12 Uhr
Antwort von Pat, 14.5.2000, 02:04 Uhr
(3) Die Schlüssel für das Forums-Script könnten auch kräftig abgespeckt werden, davon würde man nichtmal was merken.
Für jede dieser Änderungen könnte ich mir vorstellen, daß sie sich mit relativ geringem Aufwand realisieren läßt. Ob es tatsächlich so ist, weiß ich nicht.
Gegen die Änderungen spricht:
Das soll's gewesen sein.
Gruß
Steffen
(natürlich in dem Wissen, daß dieses Forum schon zahllose "Verbesserungsvorschläge" unbeschadet überstanden hat...)
Die Größe der Forums-Hauptdatei liegt jetzt schon bei 450k, was ganz schön saftig ist.
Das liegt aber nicht an der Zahl der Meldungen, sondern an der Betriebspolitik des Schwanzabschneiders (welche ich ausdrücklich begrüße - sonst hätte ich zu einigen weiter unten stehenden Postings nicht mehr antworten können).
(1) Der Code für das kleine Bild vor jedem Posting macht etwa 1/4 der Datenmenge aus, insgesamt also über 100k. Meiner Ansicht nach zuviel für Schönheit. Es sollte weggelassen werden.
Das glaube ich nicht. Schau Dir den Code noch mal genau an. Die Formular-Parameter sind keine Schönheit, sondern Softwareinfrastruktur des Forums.
(2) Der Titel eines Threads wird bei jeder Antwort wiederholt - viele Daten, keine Information. Wenn der Titel eines Postings vom übergeordneten Posting übernommen wurde, könnte in der Hauptdatei einfach nur 'Antwort' stehen, was i.d.R. viel kürzer ist.
Wahr, aber mengenmäßig insignifikant. (Trotzdem nutzt der SelfBrowser genau diese Erkenntnis für seine Komprimierung: Er sendet eine Tabelle mit Überschriften und in jedem Posting dann nur noch den Tabellenindex. ;-)
Zudem kann man bisher Thread-Drift auf einen Blick erkennen, nach Deiner Änderung müßte man seine Lesegewohnheiten anpassen.
(3) Die Schlüssel für das Forums-Script könnten auch kräftig abgespeckt werden, davon würde man nichtmal was merken.
Schlüssel? Du meinst die HIDDEN-Parameter, um Postings zu verknüpfen? Sag mir konkret, was daran redundant sein soll.
- Aufwand der Änderung
Wenn es wirklich etwas bringen würde, dann würde sich jemand finden, der es macht.
Allerdings steht das Thema "Original-Skripte wegwerfen und alles neu schreiben" schon ziemlich lange auf der Projekteliste - und immer noch nicht weit oben.
- ästhetischer Anspruch
In der Tat. Das SelfHTML-Layout ist nun mal Bestandteil dieses Forums, und das kostet etwas Platz.
- 56k-Modems dürften dank eingebauter Kompression kaum profitieren
Ich habe 33600 und halte es auch aus.
Die Größe der Forums-Hauptdatei liegt jetzt schon bei 450k, was ganz schön saftig ist.
Das liegt aber nicht an der Zahl der Meldungen, sondern an der Betriebspolitik des Schwanzabschneiders (welche ich ausdrücklich begrüße - sonst hätte ich zu einigen weiter unten stehenden Postings nicht mehr antworten können).
Also wird diese Betriebspolitik durch die große Zahl der Postings notwendig.
(1) Der Code für das kleine Bild vor jedem Posting macht etwa 1/4 der Datenmenge aus, insgesamt also über 100k. Meiner Ansicht nach zuviel für Schönheit. Es sollte weggelassen werden.
Das glaube ich nicht.
Solltest Du aber. Ich hab mal eine Kopie der Hauptseite (Stand: Freitag morgen, 00:00 Uhr, 407k groß) unter die Lupe genommen. Die Zeichenfolge '<img src="../src/x3.gif" width="15" height="10" border="0" alt="Seite"> ' macht 25,03% der Dateigröße aus.
Die Formular-Parameter sind keine Schönheit, sondern Softwareinfrastruktur des Forums.
Hier weiß ich nicht genau, was Du meinst. Welche Formular-Parameter? Ich meinte dieses hier: .
(2) Der Titel eines Threads wird bei jeder Antwort wiederholt - viele Daten, keine Information. Wenn der Titel eines Postings vom übergeordneten Posting übernommen wurde, könnte in der Hauptdatei einfach nur 'Antwort' stehen, was i.d.R. viel kürzer ist.
Wahr, aber mengenmäßig insignifikant.
Das wiederum glaube ich nicht. Mal eine kleine Abschätzung: 1400 Threads, davon 3/4 mit übernommenem Titel, durchschnittlich 40 pro übernommenem Titel eingesparte Zeichen = insgesamt 41k.
Zudem kann man bisher Thread-Drift auf einen Blick erkennen, nach Deiner Änderung müßte man seine Lesegewohnheiten anpassen.
Wohl wahr. Aber ich glaube, das Forum würde dadurch letztendlich sogar übersichtlicher.
(3) Die Schlüssel für das Forums-Script könnten auch kräftig abgespeckt werden, davon würde man nichtmal was merken.
Schlüssel? Du meinst die HIDDEN-Parameter, um Postings zu verknüpfen? Sag mir konkret, was daran redundant sein soll.
Für jedes Posting gibt es ein <!--responses: xxxxx-->, <!--insert: xxxxx-->, <!--top: xxxxx--> und <!--end: xxxxx-->. Würde man daraus <!rxxxxx>, <!ixxxxx>, <!txxxxx>, <!exxxxx> machen (ob und mit welchem Aufwand das geht: keine Ahnung!), wären das 41 Zeichen weniger pro Posting, insgesamt beim Stand von Freitag morgen weitere 56k.
Die Endabrechnung:
407k Forumshauptdatei
-102k Bildchen gekickt
- 41k 'Antwort' statt wiederholter Titel
- 56k kleinere Schlüssel
= 208k
Wenn ich mich jetzt nicht irgendwo verrechnet habe, wäre die Forumshauptdatei damit nur noch halb so groß. (Und hätte außerdem keine Bilchen mehr vor den Postings und würde jeden vorkommenden Titel nur noch einmal anführen.)
Gruß
Steffen
Die Größe der Forums-Hauptdatei liegt jetzt schon bei 450k, was ganz schön saftig ist.
Das liegt aber nicht an der Zahl der Meldungen, sondern an der Betriebspolitik des Schwanzabschneiders (welche ich ausdrücklich begrüße - sonst hätte ich zu einigen weiter unten stehenden Postings nicht mehr antworten können).
Also wird diese Betriebspolitik durch die große Zahl der Postings notwendig.
Ich denke nicht, daß früher 5 Tage Postings aufgewahrt wurden.
(1) Der Code für das kleine Bild vor jedem Posting macht etwa 1/4 der Datenmenge aus, insgesamt also über 100k. Meiner Ansicht nach zuviel für Schönheit. Es sollte weggelassen werden.
Das glaube ich nicht.
Solltest Du aber. Ich hab mal eine Kopie der Hauptseite (Stand: Freitag morgen, 00:00 Uhr, 407k groß) unter die Lupe genommen. Die Zeichenfolge '<img src="../src/x3.gif" width="15" height="10" border="0" alt="Seite"> ' macht 25,03% der Dateigröße aus.
Okay. Das ist durch die Validierung schlimmer geworden (ALT=""). Auch die Größenangaben könnte man in diesem Sonderfall vielleicht weglassen. Beides ist Stefans "Politik". (Genau wie WRAP= im Eingabefeld, gngngn ...).
(2) Der Titel eines Threads wird bei jeder Antwort wiederholt - viele Daten, keine Information. Wenn der Titel eines Postings vom übergeordneten Posting übernommen wurde, könnte in der Hauptdatei einfach nur 'Antwort' stehen, was i.d.R. viel kürzer ist.
Wahr, aber mengenmäßig insignifikant.
Das wiederum glaube ich nicht. Mal eine kleine Abschätzung: 1400 Threads, davon 3/4 mit übernommenem Titel, durchschnittlich 40 pro übernommenem Titel eingesparte Zeichen = insgesamt 41k.
Nehmen wir an, Du hättest recht, dann wären es 10%. Okay.
(3) Die Schlüssel für das Forums-Script könnten auch kräftig abgespeckt werden, davon würde man nichtmal was merken.
Schlüssel? Du meinst die HIDDEN-Parameter, um Postings zu verknüpfen? Sag mir konkret, was daran redundant sein soll.
Für jedes Posting gibt es ein <!--responses: xxxxx-->, <!--insert: xxxxx-->, <!--top: xxxxx--> und <!--end: xxxxx-->. Würde man daraus <!rxxxxx>, <!ixxxxx>, <!txxxxx>, <!exxxxx> machen (ob und mit welchem Aufwand das geht: keine Ahnung!), wären das 41 Zeichen weniger pro Posting, insgesamt beim Stand von Freitag morgen weitere 56k.
Okay. Das ließe sich wahrscheinlich durch einfaches Suchen&Ersetzen im Forum-Skript anpassen, wenn der Doppelpunkt erhalten bliebe - ansonsten müßte man wohl 2-3 Zeilen anpassen.
An solche technischen Details des Matt-Wright-Skripts hat sich bisher niemand rangewagt - das bedeutet für Stefan Münz, es entweder selbst zu machen (und welche anderen Tasks er gerade laufen hat, ist ja bekannt) oder es zu delegieren, also "loszulassen".
Die Endabrechnung:
407k Forumshauptdatei
-102k Bildchen gekickt
- 41k 'Antwort' statt wiederholter Titel
- 56k kleinere Schlüssel
= 208k
Der Selfbrowser ist nochmal um Faktor 4 (!) besser.
Am signifikantesten erscheinen mir da in der Tat die Bildchen.
Diese aber haben inzwischen eine echte Bedeutung (NI/NA) und sind nicht einfach so entbehrlich.
(Bedenke auch, daß das Moderator-Skript diese Hauptdatei parst und die Bildchen passend einsetzt - und der Schwanzabschneider anhand von NI die Übernahme ins Archiv regelt. Es wäre nicht nur das Forum-Skript anzupassen, sondern so ziemlich alle Skripte der Forum-Software.)
Wenn ich mich jetzt nicht irgendwo verrechnet habe, wäre die Forumshauptdatei damit nur noch halb so groß.
Ich empfehle also folgendes:
Du liest den Analyseteil des SelfBrowser-Quelltextes, welcher das von http://www.teamone.de/cgi-local/haupt.pl komprimierte Dokument überträgt, und baust Dir lokal eine CGI-Anwendung, welche dieses Dokument per LWP::Simple absaugt und wieder in eine Forumshauptdatei zurückverwandelt. Diese Schnittstelle steht Dir zur Verfügung.
Falls Du willst, bekommst Du sicher auch den Quelltext dieses Skripts inklusive Kommentierung, was warum wie komprimiert wird (ggf. e-Mail an mich).
Du wärest übrigens nicht der erste, der sich so etwas baut (siehe Forum-Archiv).
Ich empfehle also folgendes:
Du liest den Analyseteil des SelfBrowser-Quelltextes, welcher das von http://www.teamone.de/cgi-local/haupt.pl komprimierte Dokument überträgt, und baust Dir lokal eine CGI-Anwendung, welche dieses Dokument per LWP::Simple absaugt und wieder in eine Forumshauptdatei zurückverwandelt. Diese Schnittstelle steht Dir zur Verfügung.
Da haben wir uns wohl falsch verstanden. Es ging nicht um mich selbst. Ich surfe gigantisch schnell und mit 10 DM/Jahr-Flatrate :) über meine Uni, die Größe des Forums ist für mich relativ egal. Außerdem: Bevor ich _das_ nur für mich mache, würde ich mir wirklich lieber den SelfBrowser installieren. Es ging um die vielen Gelegenheitsbesucher ohne SelfBrowser, die ein paar Postings plus Schauen nach Antworten schnell 10 Minuten Wartezeit und mehr kosten - Tendenz steigend.
Eine 450k-Seite bei einer Doku, die selbst - wenn ich mich recht entsinne - eine Größe von 35k empfiehlt, sollte irgendwie Anlaß zum Nachdenken geben. Eine Reduzierung auf die Hälfte, und das ohne echten Informationsverlust, würden bestimmt viele begrüßen. Vielleicht stehen wir in einem Jahr sogar vor der Wahl, ob Threads schon nach einem Tag aus dem Forum verschwinden sollen oder doch lieber die Forumshauptdatei 2 MB groß sein soll. Würde mich nicht wundern, wenn diese drei Vorschläge dann wieder auftauchen.
Eher würde ich mich daran wagen, tatsächlich das Forum selbst umzuprogrammieren. Aber dazu habe ich im Moment (noch?) viel zu wenig Ahnung und auch viel zu wenig Zeit.
Gruß
Steffen
Eher würde ich mich daran wagen, tatsächlich das Forum selbst umzuprogrammieren. Aber dazu habe ich im Moment (noch?) viel zu wenig Ahnung und auch viel zu wenig Zeit.
Tja, jeder hat seine Gründe, weshalb er es nicht macht. Ich habe meine ...
Na schön, dann versuche ich es noch mal mit einer verbesserten Version. Ich fange auch gleich mit der Auflistung der Vorteile an, damit ich bis zum Ende des Postings noch damit fertig werde ;)
Interessiert? Dann bestellen Sie jetzt!
P.S. Meine CGI-Erfahrungen liegen leider bei exakt 0, ich hoffe also, daß ich hier keinen totalen Schwachsinn verbreite...
Hallo Steffen,
Na schön, dann versuche ich es noch mal mit einer verbesserten Version. Ich fange auch gleich mit der Auflistung der Vorteile an, damit ich bis zum Ende des Postings noch damit fertig werde ;)
Ganz ruhig bleiben! ;-)
Das Forum hier wird im Laufe der naechsten Zeit technisch umstrukturiert. Zu den Neuerungen wird auch die Trennung von Daten und Praesentation gehoeren, so aehnlich wie im Self-Browser, nur mit dem Unterschied, dass alles ausschliesslich server-seitig geschieht und daher mit jedem Browser funktioniert. Termin usw. kann ich dir noch keinen nennen. Aber nimm es einfach mal so hin ;-)
viele Gruesse
Stefan Muenz