mixmastertobsi: Replace Sonderzeichen

Hallo gibt es eine Funktion die folgendes Wort wir folgt umwandelt?

"Desiré" soll zu "Desire" werden.

  1. Hallo gibt es eine Funktion die folgendes Wort wir folgt umwandelt?

    "Desiré" soll zu "Desire" werden.

    Nein, gibt es nicht.

    Deinem Vorhaben ist aber strtr() relativ nahe. Die Character-Map muss du dir aber selbst erstellen (oder von einem Open-Source-Projekt kopieren).

    1. Deinem Vorhaben ist aber strtr() relativ nahe. Die Character-Map muss du dir aber selbst erstellen (oder von einem Open-Source-Projekt kopieren).

      Nachtrag: in TYPO3 (GPLv2) wird das z.B. an dieser Stelle gemacht http://api.typo3.org/typo3v4/current/html/class_8t3lib__cs_8php_source.html#l01620

      1. Deinem Vorhaben ist aber strtr() relativ nahe. Die Character-Map muss du dir aber selbst erstellen (oder von einem Open-Source-Projekt kopieren).

        Nachtrag: in TYPO3 (GPLv2) wird das z.B. an dieser Stelle gemacht http://api.typo3.org/typo3v4/current/html/class_8t3lib__cs_8php_source.html#l01620

        Nachtrag: entsprechende Transliterationstabellen findest du im TYPO3-Sourcecode unter /t3lib/unidata/

  2. Hallo gibt es eine Funktion die folgendes Wort wir folgt umwandelt?
    "Desiré" soll zu "Desire" werden.

    Hoffentlich nur in einer Textsuche und nicht als permanente Datenkonvertierung.
    Ein é ist übrigens kein Sonderzeichen, sondern ist Teil von \p{L} wie auch [a-z]
    Willkommen in einer neuen ewigen Baustelle, wenn du nicht auf eine Bibliothek zurückgreifen kannst, die den Unicode Standard implementiert.

    mfg Beat

    --
    ><o(((°>           ><o(((°>
       <°)))o><                     ><o(((°>o
    Der Valigator leibt diese Fische
    1. Hallo gibt es eine Funktion die folgendes Wort wir folgt umwandelt?
      "Desiré" soll zu "Desire" werden.

      Hoffentlich nur in einer Textsuche und nicht als permanente Datenkonvertierung.
      Ein é ist übrigens kein Sonderzeichen, sondern ist Teil von \p{L} wie auch [a-z]
      Willkommen in einer neuen ewigen Baustelle, wenn du nicht auf eine Bibliothek zurückgreifen kannst, die den Unicode Standard implementiert.

      Es gibt einen Unicode-Standard für Transliteration und Mapping?

      Soweit ich weiß, arbeiten die dort selbst nur mit Tabellen ;)

      1. Es gibt einen Unicode-Standard für Transliteration und Mapping?
        Soweit ich weiß, arbeiten die dort selbst nur mit Tabellen ;)

        Es handelt sich ja nicht um Transliteration aber um ein Mapping von zusammengesetzten Lettern zu einfachen.
        Nimm dieses Beispiel:
        http://www.unicode.org/Public/UNIDATA/CaseFolding.txt

        Ein Algorithmus kann
        "LATIN CAPITAL LETTER G WITH CIRCUMFLEX"
        verkürzen zu
        "LATIN CAPITAL LETTER G"

        Das ist vermutlich, was der Fragesteller sucht.
        In Perl kann ich den Namen von Unicodepunkten abfragen. Perl selbst bietet also die Library.
        Irgendwo gibt es ein Perlmodul, das mir das sogar abnimmt.

        mfg Beat

        --
        ><o(((°>           ><o(((°>
           <°)))o><                     ><o(((°>o
        Der Valigator leibt diese Fische
        1. Nimm dieses Beispiel:
          http://www.unicode.org/Public/UNIDATA/CaseFolding.txt

          Was meinst du wohl, was in dem von mir genannten unidata-Ordner des TYPO3-Source-Pakets drin ist? :)

          Einerseits sind da einfache Mapping-Tabellen enthalten, anderseits gibts aber - bin mir aber nicht sicher, ob das im selben Verzeichnis oder einem Nachbarverzeichnis liegt entsprechende Transliterationstabellen bzw. Transformationstabellen um zwischen Zeichencodierungen zu Transformieren.

          Das ist vermutlich, was der Fragesteller sucht.

          Möglicherweise ist der Sinn aber, suchmaschinenfreundliche URLs ohne escaping zu bauen. Hier ist eine Transliteration möglicherweise sinnvoll.

  3. @@mixmastertobsi:

    nuqneH

    "Desiré" soll zu "Desire" werden.

    Wofür brauchst du das?

    Vielleihct ist der ALA-Artikel Accent Folding for Auto-Complete für dich interessant.

    Qapla'

    --
    Gut sein ist edel. Andere lehren, gut zu sein, ist noch edler. Und einfacher.
    (Mark Twain)