Es gibt einen Unicode-Standard für Transliteration und Mapping?
Soweit ich weiß, arbeiten die dort selbst nur mit Tabellen ;)
Es handelt sich ja nicht um Transliteration aber um ein Mapping von zusammengesetzten Lettern zu einfachen.
Nimm dieses Beispiel:
http://www.unicode.org/Public/UNIDATA/CaseFolding.txt
Ein Algorithmus kann
"LATIN CAPITAL LETTER G WITH CIRCUMFLEX"
verkürzen zu
"LATIN CAPITAL LETTER G"
Das ist vermutlich, was der Fragesteller sucht.
In Perl kann ich den Namen von Unicodepunkten abfragen. Perl selbst bietet also die Library.
Irgendwo gibt es ein Perlmodul, das mir das sogar abnimmt.
mfg Beat
--
><o(((°> ><o(((°>
<°)))o>< ><o(((°>o
Der Valigator leibt diese Fische
><o(((°> ><o(((°>
<°)))o>< ><o(((°>o
Der Valigator leibt diese Fische