LX: Huffman-Dateiformat

Hallo, Struppi!

Ich habe es eben selbst noch mal korrigiert (siehe unten). er gibt jetzt den Tree für "test" als Hash aus:


    // Dict=Frequency dictionary, Tree=tree, Branches=Branches, repsort=for first sort after repetition, c1/c2=Character register, l=length counter, mix=mix register, f=recursive function
    var Dict={},
        c1, c2, l, mix, r;
    // build dictionary (D) and key table for sort order
    data.replace(/./g, function(c) {
        if (!Dict[c]) {
        } else {
    // sort order table
    repsort.sort(function(x,y) { return Dict[x]-Dict[y]; });
        // create Tree, 1st step
    while ((c1=repsort.shift()) && (c2=repsort.shift())) {
        Branch[mix=c1+(c2||'')]=[c2.length>1 ? Branch[c2] : c2, c1.length>1 ? Branch[c1] : c1];
        // trick: put elements back until there is only one of them left
    // create Tree recursively, 2nd step
    (r=function(Dict, mix) {
        while (++l < 2) {
            if (Dict[l]) {
                if (typeof Dict[l]=='string') {
                } else {
    })(Branch[mix], '');
    // now Tree contains each character and its binary representation as string.
    // TODO: convert data, put stuff together

Da ich jetzt erst mal auf gzip verzichte, werde ich ein Format wählen, welches zuerst die Länge des Baums (in Byte), dann den Baum, dann die Anzahl der Padding-Bits am Ende und dann die Daten (mit 0er-Bits als Padding) enthält. So ist es am einfachsten und vermutlich auch noch einigermaßen performant.

Gruß, LX

RFC 2324, Satz 7 (Sicherheit): Jeder, der zwischen meinem Kaffee und mir steht, gilt als unsicher.