hotti: Zeilenendezeichen feststellen

Beitrag lesen

hi,

Wie müsste ein Algorithmus aussehen, der Zeilenendezeichen von Textdateien feststellen kann.

So ähnlich wie der Algorithmus für die StringView-Library, erhältlich auf Github als stringview.js

Dieser Algorithmus geht Byte für Byte durch den Buffer, untersucht die Wertigkeit und stellt, aufgrund des kanonischen Aufbaus des Unicode-Sytems fest, ob das entsprechende UTF-8-Zeichen zwei, drei oder vier Bytes enthält. Daraus, entweder aus 2 (1 Folgebyte) oder aus 3 (2 Folgebytes) oder aus 4 (3 Folgebytes) wird dann der Codepoint ermittelt. Der Buffer wird sozusagen vorausschauend gelesen.

Dieser Algorithmus, auf Deine Problemstellung umgesetzt, dürfte etwas weniger kompliziert werden weil weniger Fälle betrachtet werden müssen, wenn Du Intresse hast, können wir das mal weiterhin besprechen, guck Dir mal in stringview.js die Funktion StringView.loadUTF8CharCode = function (aChars, nIdx) zur Einstimmung ;)

Horst Fleischwurst

--
Wie mein Grabstein aussehen wird, weiß nur der Steinmetz.