Andre: Bei Suche Accent ignorieren

Hallo,

wir verwenden bisher ein Servlet zur Volltextsuche in xml-Dateien! Nun wurde angefragt, ob es nicht möglich sei, da die Dateien (XML) in denen gesucht wird, auf französisch sind, den Suchbegriff ohne Accent einzugeben und das Wort wird dann trotzdem (obwohl es im Text mit Accent steht) gefunden. Gibt es hierfür irgendwelche Funktionen oder müsste man die Suche auf eine andere Programmiersprache umstellen?

Freue mich über jeden Tipp!

Gruß
Andre

  1. hi,

    wir verwenden bisher ein Servlet zur Volltextsuche in xml-Dateien! Nun wurde angefragt, ob es nicht möglich sei, da die Dateien (XML) in denen gesucht wird, auf französisch sind, den Suchbegriff ohne Accent einzugeben und das Wort wird dann trotzdem (obwohl es im Text mit Accent steht) gefunden. Gibt es hierfür irgendwelche Funktionen oder müsste man die Suche auf eine andere Programmiersprache umstellen?

    Die Frage, wie eine Suche vom Eingabegerät bis zum Dokument hinsichtlich Zeichenkodierung umgesetzt wird, sollte nicht die Frage nach der Programmiersprache sein. Idealerweise wird auf der Strecke Benutzereingabe -> Suchfrontend -> Dokument || Index die Kodierung nicht geändert.

    Hotte

    --
    Wenn der Kommentar nicht zum Code passt, kann auch der Code falsch sein.
    1. Hi,

      Die Frage, wie eine Suche vom Eingabegerät bis zum Dokument hinsichtlich Zeichenkodierung umgesetzt wird, sollte nicht die Frage nach der Programmiersprache sein.

      tja, es sei denn, die Programmiersprache heißt XSLT. Das ist für Stringverarbeitung ungefähr so gut geeignet, wie ein Birkenzweig als einziges Werkzeug für einen Zahnarzt genügt.

      Idealerweise wird auf der Strecke Benutzereingabe -> Suchfrontend -> Dokument || Index die Kodierung nicht geändert.

      Tja. Nur hat ein "é" mit einem "e" ungefähr so viel gemein, wie ein "L" mit einem "e". Ich sehe unter Verwendung von XSLT keine reelle Chance, einen Vergleich dieser Zeichen so zu entwickeln, wie es sich ein Mensch erhoffen möchte. Es sei denn, der Benutzer und der Entwickler haben sehr, sehr viel Zeit.

      Cheatah

      --
      X-Self-Code: sh:( fo:} ch:~ rl:| br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
      X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
      X-Will-Answer-Email: No
      X-Please-Search-Archive-First: Absolutely Yes
      1. hi,

        »» Idealerweise wird auf der Strecke Benutzereingabe -> Suchfrontend -> Dokument || Index die Kodierung nicht geändert.

        Tja. Nur hat ein "é" mit einem "e" ungefähr so viel gemein, wie ein "L" mit einem "e". Ich sehe unter Verwendung von XSLT keine reelle Chance, einen Vergleich dieser Zeichen so zu entwickeln, wie es sich ein Mensch erhoffen möchte. Es sei denn, der Benutzer und der Entwickler haben sehr, sehr viel Zeit.

        Sagichdoch. Wer nach einem 'é' suchen will, sollte auch ein 'é' eingeben. Wenner das nicht kann, hatter die falsche Tastatur.

        Hotte

        --
        Wenn der Kommentar nicht zum Code passt, kann auch der Code falsch sein.
        1. Tja. Nur hat ein "é" mit einem "e" ungefähr so viel gemein, wie ein "L" mit einem "e". Ich sehe unter Verwendung von XSLT keine reelle Chance, einen Vergleich dieser Zeichen so zu entwickeln, wie es sich ein Mensch erhoffen möchte. Es sei denn, der Benutzer und der Entwickler haben sehr, sehr viel Zeit.

          Na es müsste ja nicht uuunbedingt über xsl sein - dachte vielleicht gibts da ja irgendwelche Funktionen - aber wenns die nicht gibt, gehts natürlich nicht. Könnte ja auch javascript oder ein Servlet oder was ganz anderes sein ;-)

          zB bei dem Übersetzungsprogramm Leo gehts ja auch, wenn man da ein Wort ohne Accent eingibt, findet ers trotzdem :) Sehe das ja genauso wie ihr, nur leider sieht unser Kunde das anders :(

          schon mal danke für eure schnelle Antworten :)
          Gruß
          Andre

  2. Hallo,

    wir verwenden bisher ein Servlet zur Volltextsuche in xml-Dateien! Nun wurde angefragt, ob es nicht möglich sei, da die Dateien (XML) in denen gesucht wird, auf französisch sind, den Suchbegriff ohne Accent einzugeben und das Wort wird dann trotzdem (obwohl es im Text mit Accent steht) gefunden. Gibt es hierfür irgendwelche Funktionen oder müsste man die Suche auf eine andere Programmiersprache umstellen?

    XSLT 2.0 - falls Dir das zur Verfügung steht - kann Collations und damit genau das, was Du willst.

    Viele Grüße,
    Christian