Whitspace
Billy
- html
0 Tom0 Matze0 Sven Rautenberg0 Tom0 Sven Rautenberg0 Tom0 MudGuard0 Sven Rautenberg0 Tom
0 Tom
0 Tim Tepaße0 Tom
0 Billy
Hallo,
ich habe ein kleines Problem. Und zwar versuche ich nun schon seit Stunden, einen HTML-Code, in welchem Whitspaces versteckt sind, so zurückzucodieren, dass der Whitespace sichtbar wird. Wie kann ich das machen? Es sollen also aus Leerzeichen im Quellcode am Ende sichtbare Zeichen herauskommen.
Danke schonmal im vorraus für eure Hilfe!
Gruß
Hello und guten Morgen,
ich habe ein kleines Problem. Und zwar versuche ich nun schon seit Stunden, einen HTML-Code, in welchem Whitspaces versteckt sind, so zurückzucodieren, dass der Whitespace sichtbar wird. Wie kann ich das machen? Es sollen also aus Leerzeichen im Quellcode am Ende sichtbare Zeichen herauskommen.
Wie meinst Du das?
Unter Whitespaces versteht man
Wie sollen die Zeichen sichtbar werden? Als dargestelltes Zeichen, oder sollen sie ihre Steuerwirkung entfalten?
Welche Möglichkeiten stehen Dir zur Verfügung? Texteditor, Programm?
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Hallo,
Wie meinst Du das?
ich glaub er versucht das
- Leerzeichen (#32, #255)
zu zu machen. Dafür gibt es alle möglichen Freeware-Text-Editoren.
Ich bin mir aber nicht sicher ob er das wirklich will.
Er könnte stattdessen auch <pre> verwenden.
Grüße, Matze
Hi,
ich glaube das ist des Rätsels Lösung. Weißt du zufällig ein Programm mit dem man das machen kann? Einfach nur kurz den Namen posten, dann such ich in google. ein Link wäre natürlich auch sehr hilfreich ;)
Danke und Grüße
Billy
Hallo,
Wie meinst Du das?
ich glaub er versucht das
- Leerzeichen (#32, #255)
zu zu machen. Dafür gibt es alle möglichen Freeware-Text-Editoren.
Ich bin mir aber nicht sicher ob er das wirklich will.
Er könnte stattdessen auch <pre> verwenden.Grüße, Matze
Hallo,
ich glaube das ist des Rätsels Lösung. Weißt du zufällig ein Programm mit dem man das machen kann? Einfach nur kurz den Namen posten, dann such ich in google. ein Link wäre natürlich auch sehr hilfreich ;)
z.B. Notepad Pro
Wie aber erwähnt dürfte dein Vorhaben nicht unbedingt sinnvoll sein.
Abstände, also alles ausser 1 Leerzeichen zwischen 2 Wörtern oder nach Satzzeichen, werden bei der Ausgabe über HTML anders definiert.
Und was gefällt dir an <pre> nicht?
Grüße, Matze
Moin!
ich habe ein kleines Problem. Und zwar versuche ich nun schon seit Stunden, einen HTML-Code, in welchem Whitspaces versteckt sind, so zurückzucodieren, dass der Whitespace sichtbar wird. Wie kann ich das machen? Es sollen also aus Leerzeichen im Quellcode am Ende sichtbare Zeichen herauskommen.
Wie meinst Du das?
Unter Whitespaces versteht man
...alle nicht sichtbar druckbaren Zeichen, d.h. alle Zeichen, die keine Farbe aufs Papier bringen.
Das sind deutlich mehr als deine hier vorgenommene und teilweise falsche Auflistung:
- Leerzeichen (#32, #255)
- Zeilenumbrüche (#10, #13#, #13#10)
- Tabulatoren (#09, #11)
- ASCII 0 (#0) die sollte in einem Textfile allerdings nicht mehr vorkommen
Was ist denn bitte #255 für ein Zeichen? Auf jeden Fall kein Leerzeichen. Und die "sonstigen" Leerzeichen aus Unicode sind natürlich auch zu erwähnen: en-space, em-space, 3em-space, 4em-space, 6em-space, thin space, hair space, zero-width space,...
Abgesehen von den sonstigen Steuerzeichen im Bereich 0 bis 31, die allesamt nicht druckbar sind.
- Sven Rautenberg
Hello,
Unter Whitespaces versteht man
...alle nicht sichtbar druckbaren Zeichen, d.h. alle Zeichen, die keine Farbe aufs Papier bringen.
Das sind deutlich mehr als deine hier vorgenommene und teilweise falsche Auflistung:
Und hast Du eine "richtige"?
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Moin!
Das sind deutlich mehr als deine hier vorgenommene und teilweise falsche Auflistung:
Und hast Du eine "richtige"?
In Unicode gibts mehr aus ausreichend nicht-druckbare Zeichen. Es dürfte schwierig werden, ad-hoc eine vollständige Auflistung zu erstellen - zumal Unicode ja beständig den Zeichenumfang erweitert.
Dein "#255" ist halt nach meinem Empfinden falsch.
- Sven Rautenberg
Hello,
In Unicode gibts mehr aus ausreichend nicht-druckbare Zeichen. Es dürfte schwierig werden, ad-hoc eine vollständige Auflistung zu erstellen - zumal Unicode ja beständig den Zeichenumfang erweitert.
Ich dag doch: modernes Babylon!
Dein "#255" ist halt nach meinem Empfinden falsch.
Das kann schon sein, dass das unter Unicode falsch ist.
Unter extended ASCII (Codetabelle 437) ist es ein geschütztes Leerzeichen :-)
Aber ich hatte schon geahnt, dass es um eine "Whitespace-Message" handelt.
Die Seuche grassiert im Moment. Muss ich mich wohl doch mal damit beschäftigen.
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Hi,
Das kann schon sein, dass das unter Unicode falsch ist.
Unter extended ASCII (Codetabelle 437) ist es ein geschütztes Leerzeichen :-)
Themenbereich ist HTML/XHTML.
HTML und XHTML haben als Zeichensatz ISO 10646 (Unicode), nicht extended ASCII.
Zeichen 255 in HTML ist also ein y-Umlaut (das "geschützte" non-breaking-Space ist in HTML/XHTML Zeichen 160).
cu,
Andreas
Moin!
Das kann schon sein, dass das unter Unicode falsch ist.
Unter extended ASCII (Codetabelle 437) ist es ein geschütztes Leerzeichen :-)
"Extended ASCII" ist kein geschützter Begriff für irgendwas, sondern leider eine Allerweltsbezeichnung für alles, was oberhalb (und wie man an CP 437 sieht, auch unterhalb) von Zeichennummer 127 Definitionen vornimmt, die über "undefiniert" hinausgehen (ASCII ist bekanntlich ein 7-Bit-Zeichensatz). Soll heißen: Auch ISO-8859-1 ist eine Erweiterung von ASCII - nur eben "anders".
Themenbereich ist HTML/XHTML.
HTML und XHTML haben als Zeichensatz ISO 10646 (Unicode), nicht extended ASCII.
Es ist ja grundsätzlich kein Problem, Codepage 437 als Zeichencodierungsangabe zu verwenden. Eventuell wird man damit nicht bei sehr vielen Browsern Erfolg haben, aber erlaubt ist es. Die korrekte Angabe wäre eine von diesen vieren:
charset=IBM437
charset=cp437
charset=437
charset=csPC8CodePage437
Vgl. http://www.iana.org/assignments/character-sets
Zeichen 255 in HTML ist also ein y-Umlaut (das "geschützte" non-breaking-Space ist in HTML/XHTML Zeichen 160).
Fehlende Zeichencodierungsangaben provozieren halt Fehlinterpretationen.
- Sven Rautenberg
Hello,
"Extended ASCII" ist kein geschützter Begriff für irgendwas, sondern leider eine Allerweltsbezeichnung für alles, was oberhalb (und wie man an CP 437 sieht, auch unterhalb) von Zeichennummer 127 Definitionen vornimmt, die über "undefiniert" hinausgehen
Welche sind das denn nun wieder?
Ist mir bisher nicht wirklich aufgefallen.
#127 vielleicht?
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Hello,
Themenbereich ist HTML/XHTML.
Das habe ich nur bedingt zugrunde gelegt, weil Billy ja von "zurückcodieren" schrieb, also aus dem HTML-Text etwas anderes machen wollte. Und da dachte ichmir, es wären dann Deutungen der Zeichen nach einer anderen Codetabelle durchaus auch zulässig.
HTML und XHTML haben als Zeichensatz ISO 10646 (Unicode), nicht extended ASCII.
Es soll ja aber nicht HTML-Code bleiben, sondern anders gedeutet werden.
Zeichen 255 in HTML ist also ein y-Umlaut (das "geschützte" non-breaking-Space ist in HTML/XHTML Zeichen 160).
... wogegen ich nichts einwenden kann/will.
Es wäre aber sicher mal ganz fruchtbar, den Begriff "Whitespace" in Bezug auf Zeichensätze / Codierungen mal auf den Punkt zu bringen.
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Hallo Sven
Unter Whitespaces versteht man
...alle nicht sichtbar druckbaren Zeichen, d.h. alle Zeichen, die keine Farbe aufs Papier bringen.
Jein. Es gibt ja auch noch nicht sichtbar druckende Zeichen, die keinen Leerraum erzwingen und auch nicht gedruckt werden sollten. Zum Beispiel WORD JOINER – ein eindeutiges Zeichen mit eigenem Code Point, aber es hat kein dazugehörigen Glyphen.
Für „alle Zeichen, die keine Zeichen haben“, gibt's tatsächlich in Unicode keine Klassifikation.
Was ist denn bitte #255 für ein Zeichen? Auf jeden Fall kein Leerzeichen. Und die "sonstigen" Leerzeichen aus Unicode sind natürlich auch zu erwähnen: en-space, em-space, 3em-space, 4em-space, 6em-space, thin space, hair space, zero-width space,...
Weit kommt man aber schon mit der allgemeinen Kategorie „Zs“ (Seperator, Space), die die hier erwähnten Leerzeichen umfasst. In PCRE benutzenden oder PCRE-kompatiblen Implementationen Regulärer Ausdrücke kann man bequem den Ausdruck \p{Zs} benutzen oder sogar auf \p{Z} aufrunden, um auch die Klassen Zl (Seperator, Line) oder Zp (Seperator, Paragraph) zu integrieren.
Abgesehen von den sonstigen Steuerzeichen im Bereich 0 bis 31, die allesamt nicht druckbar sind.
Kategorie \p{C}. Als Vereinigung mit \p{S} kommt man bestimmt schon sehr weit.
Unicode hat übrigens auch noch eine generellere Eigenschaft Whitespace, allerdings enthält die auch wieder nicht „alle nicht druckbaren Zeichen“.
Tim
Hello Tim, hallo Alle,
Für „alle Zeichen, die keine Zeichen haben“, gibt's tatsächlich in Unicode keine Klassifikation.
Ich habe den Eindruck, dass es für "Whitespace" als Zeichenklasse auch keine Definition gibt bisher. Zumindest konnte ich an 30 Stellen im Web mindestens 15 andere Erklärungen dafür finden.
Gibt es denn eine einheitliche Definition dafür?
Ich habe bisher immer nur diejenigen Zeichen, die zwar direkt der Darstellung dienen, aber denen keine grafische Eigendarstellung zugeordnet ist, dazu gezählt.
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.de
Tom
Hallo!
Danke für eure schnellen Antworten!
Ich sollte vielleicht doch etwas mehr erklären. Ich habe gelesen, dass man über Whitespace Nachrichten verschlüsselt übertragen kann. Ein Freund von mir hat mir nun eine solche Nachricht auf seiner Website hinterlassen und ich soll sie finden. Leider kann ich sie nicht lesen -.- Ich sehe genau, WO er ein paar Whitespace-Befehle hinterlassen hat. Wie ich nun aber daraus wieder lesbaren Text bekomme ist mir schleierhaft. Hab auf Wikipedia schon gesucht, dort haben sie die Nachricht "Hello World" mittels whitespace übertragen.
Ich habe einige Programme wie Frontpage, Expression WEB (benutze ich am häufigsten), Dreamwaver zur Verfügung (wie ihr euch denken könnt abreite ich also mit WIndows XP). Ich hab auch schon einige Websites geschrieben, kenne mich mit html also auch ein wenig aus. Nur eben mit diesem Begriff so gut wie gar nicht.
Danke für eure Hilfestellungen!
Gruß
Billy
Hello und guten Morgen,
ich habe ein kleines Problem. Und zwar versuche ich nun schon seit Stunden, einen HTML-Code, in welchem Whitspaces versteckt sind, so zurückzucodieren, dass der Whitespace sichtbar wird. Wie kann ich das machen? Es sollen also aus Leerzeichen im Quellcode am Ende sichtbare Zeichen herauskommen.
Wie meinst Du das?
Unter Whitespaces versteht man
- Leerzeichen (#32, #255)
- Zeilenumbrüche (#10, #13#, #13#10)
- Tabulatoren (#09, #11)
- ASCII 0 (#0) die sollte in einem Textfile allerdings nicht mehr vorkommen
Wie sollen die Zeichen sichtbar werden? Als dargestelltes Zeichen, oder sollen sie ihre Steuerwirkung entfalten?
Welche Möglichkeiten stehen Dir zur Verfügung? Texteditor, Programm?
Harzliche Grüße vom Berg
http://bergpost.annerschbarrich.deTom
Moin!
Ich sollte vielleicht doch etwas mehr erklären. Ich habe gelesen, dass man über Whitespace Nachrichten verschlüsselt übertragen kann. Ein Freund von mir hat mir nun eine solche Nachricht auf seiner Website hinterlassen und ich soll sie finden. Leider kann ich sie nicht lesen -.- Ich sehe genau, WO er ein paar Whitespace-Befehle hinterlassen hat. Wie ich nun aber daraus wieder lesbaren Text bekomme ist mir schleierhaft. Hab auf Wikipedia schon gesucht, dort haben sie die Nachricht "Hello World" mittels whitespace übertragen.
Eigentlich jeder vernünftige Quelltext-Editor ist in der Lage, auch die nichtdruckbaren Zeichen sichtbar zu machen. Der dafür zuständige Menübutton zeigt sehr häufig ein stilisiertes mathematisches "Pi".
Es kann aber natürlich auch sein, dass mit "Whitespace" die Programmiersprache gemeint ist. Dann bräuchtest du einen entsprechenden Compiler, oder die Fähigkeit, den Whitespace-Quelltext selbst zu verstehen und nachzuvollziehen.
- Sven Rautenberg
Servus,
ich glaube dass er in der Tat die programmiersprache Whitespace meint. Weißt du zufällig aus dem Kopf einen Compiler? War schon auf der Hompage gerade eben, hababer nur Programme für Unix gefunden, nicht aber für Windows.
Danke für deine Hilfe!!!!!
Gruß, Billy
Moin!
Ich sollte vielleicht doch etwas mehr erklären. Ich habe gelesen, dass man über Whitespace Nachrichten verschlüsselt übertragen kann. Ein Freund von mir hat mir nun eine solche Nachricht auf seiner Website hinterlassen und ich soll sie finden. Leider kann ich sie nicht lesen -.- Ich sehe genau, WO er ein paar Whitespace-Befehle hinterlassen hat. Wie ich nun aber daraus wieder lesbaren Text bekomme ist mir schleierhaft. Hab auf Wikipedia schon gesucht, dort haben sie die Nachricht "Hello World" mittels whitespace übertragen.
Eigentlich jeder vernünftige Quelltext-Editor ist in der Lage, auch die nichtdruckbaren Zeichen sichtbar zu machen. Der dafür zuständige Menübutton zeigt sehr häufig ein stilisiertes mathematisches "Pi".
Es kann aber natürlich auch sein, dass mit "Whitespace" die Programmiersprache gemeint ist. Dann bräuchtest du einen entsprechenden Compiler, oder die Fähigkeit, den Whitespace-Quelltext selbst zu verstehen und nachzuvollziehen.
- Sven Rautenberg
Moin!
ich glaube dass er in der Tat die programmiersprache Whitespace meint. Weißt du zufällig aus dem Kopf einen Compiler? War schon auf der Hompage gerade eben, hababer nur Programme für Unix gefunden, nicht aber für Windows.
Tja, leider bedingen esoterische Programmiersprachen, die sich von Geeks und/oder Nerds ausgedacht wurden, wohl den Einsatz "esoterischer" Betriebssysteme, die ebenfalls von Geeks und/oder Nerds erstellt wurden.
Whitespace ist eine absichtlich unzugängliche Programmiersprache - warum sollte der Zugang zu passenden Compilern dann einfach sein. :)
- Sven Rautenberg
Hallo Billy,
ich glaube dass er in der Tat die programmiersprache Whitespace meint. Weißt du zufällig aus dem Kopf einen Compiler? War schon auf der Hompage gerade eben, hababer nur Programme für Unix gefunden, nicht aber für Windows.
Dann hast Du schlecht geschaut. ;-)
Unter http://compsoc.dur.ac.uk/whitespace/download.php gibt's bei "Version 0.3" einen Punkt "Haskell Source". Haskell ist eine funktionale Programmiersprache, für die es auch Windows-Tools gibt.
Ich habe mir den Whitespace-Sourcecode mal angesehen, das Makefile enthält Referenzen auf den Glasgow Haskell Compiler (GHC), also ist es vmtl. sinnvoll, sich den zu besorgen: http://www.haskell.org/ghc/download_ghc_681.html#windows.
Wenn Du den installiert hast, kannst du Dir dann Whitespace kompilieren. Nachdem Du wohl kein GNU Make installiert haben wirst, musst Du das wohl oder übel manuell machen, was ich gerade eben mal auf meiner Windows-Kiste mit dem GHC 6.8.1 und obigem Haskell-Source probiert habe:
(Reihenfolge ist wichtig):
ghc -O -fvia-C -c -o VM.o VM.hs
ghc -O -fvia-C -c -o Tokens.o Tokens.hs
ghc -O -fvia-C -c -o Input.o Input.hs
ghc -O -fvia-C -c -o main.o main.hs
ghc -O -fvia-C -o wspace main.o Input.o Tokens.o VM.o
Dann erhälst Du eine Datei wspace.exe, mit deren Hilfe Du dann Whitespace-Dateien ausführen kann, Aufruf über
wspace dateiname
Viele Grüße,
Christian