Tom: NORMIERUNG: Sackgasse oder Lösungsansatz?

Beitrag lesen

Hello,

Bisher hat noch keiner hier den nicht widerlagbaren Beweis angeführt, dass man mit zweifelsfrei erkennen kann, dass ein Text UTF-8-kodiert ist. Momentan kann man nur sagen, dass ein Text den Regeln der UTF-8-Kodierung entspricht. Eine Aussage, ob der Autor wirklich UTF-8 verwendet hat oder eine Kodierung, die nur zufällig UTF-8-kompatibel ist, lässt sich nicht treffen.

Das ist dann der Unterschied zwischen "Unfall", "Totschlag", "Mord" und "vorsätzlichem Mord", stimmts?

Aber tot ist tot.

Ich erinnere nochmals an die Intention von Dieter, der lokal verfügbare Dateien klassifizieren wollte u.a. nach ihrer Codierung. Da gibt es ja nicht nur UTF-8

Die sinnvolle Klassifizierung sollte Aufschluss über den Aufwand bei der weiteren Ver-/Bearbeitung geben können. Ich würde es daher begrüßen, wenn auch Du nicht nur gegenhältst, sondern vielleicht auch ein paar Untersuchungen in Richtung "wie könnte man das zweckmäßig umsetzen" machen würdest. Sven hat bei aller Kritik, die er bisher geübt hat, doch eine Menge Fakten beigetragen, die zu einer (anderen) Lösung führen könnten(, als er vielleicht selber dachte).

Vielleicht kommt am Ende dabei heraus, dass die RFC 3629 eigentlich eine von der Qualität der RFC 1925 ist ;-)  und daher dringend neu gefasst werden müsste.

---- only philosophy ----
Das Vorhaben habe ich als äußerst sinnvoll eingestuft, da unser Babylon schließlich auf vielen getrennten Wegen unaufhaltsam näher rückt, und eines Tages unbarmherzig zuschlagen wird.

Ob es die immer kompliziertere Codierung von Information oder die Zwei-Schritte-vor-einen-zurück-(Un-)Rechtschreibreform ist, oder Gesetze, die durch Ihre Ergänzung vom ... und die Anwendungsbestimmungen von ... usw. zum gegenteil verkehrt werden. Alles zielt darauf ab, dass die Menschheit sich nicht besser, sondern immer schlechter ohne hohen technischen Aufwand zurechtfinden wird.
-------------------------

Harzliche Grüße vom Berg
http://www.annerschbarrich.de

Tom

--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau

0 45

utf-8 detection

Dieter Raber
  • php
  1. 0
    Siechfred
    1. 0
      Tom
      1. 0
        Siechfred
        • menschelei
      2. 0
        Cybaer
        1. 0

          Gibt es eine utf-8 String-Klasse?

          Tom
          1. 0
            dedlfix
            1. 0
              Tom
              1. 0
                dedlfix
                1. 0
                  Tom
                  1. 0
                    Sven Rautenberg
                    1. 0
                      Tom
                  2. 0
                    dedlfix
                    1. 0
                      Tom
                      1. 0
                        dedlfix
                        1. 0
                          Tom
                          1. 0
                            Sven Rautenberg
                            1. 0
                              Tom
            2. 0
              Cybaer
              • meinung
              1. 0
                dedlfix
                1. 0

                  NORMIERUNG: Sackgasse oder Lösungsansatz?

                  Tom
                  • sonstiges
                  1. 0
                    dedlfix
                  2. 1
                    Sven Rautenberg
                    1. 0
                      Cybaer
                    2. 0

                      Wollte nicht kneifen, aber 1&1 hat "Späße" gemacht

                      Tom
                      1. 0
                        Sven Rautenberg
            3. 0
              Cybaer
              • meinung
          2. 0
            Cybaer
      3. 0
        Sven Rautenberg
        1. 0

          utf-8 Byteanzahl und Wahl des Zeichensatzes

          Tom
          1. 0
            Sven Rautenberg
            1. 0
              Tom
              1. 0
                Sven Rautenberg
                1. 0

                  Übersetzung Code -> Glyphe

                  Tom
                  1. 0
                    Sven Rautenberg
                  2. 0
                    Cybaer
                    1. 0
                      dedlfix
                      1. 0
                        Cybaer
                        • menschelei
  2. 0
    Christian Seiler
    1. 0
      Dieter Raber
  3. 0
    Tom
    1. 0
      dedlfix
  4. 0

    utf-8 detection, danke und Zusatzfrage

    Dieter Raber
    1. 0
      Tom
      1. 0
        Dieter Raber