Ich habe eine Unicode-Zeichenkette in Python, und ich möchte alle Akzente (diakritische Zeichen) entfernen.
Ich habe im Internet eine elegante Möglichkeit gefunden, dies zu tun (in Java):
- konvertiert die Unicode-Zeichenkette in ihre lange normalisierte Form (mit einem separaten Zeichen für Buchstaben und diakritische Zeichen)
- alle Zeichen entfernen, deren Unicode-Typ "diakritisch" ist.
Muss ich eine Bibliothek wie pyICU installieren oder ist dies nur mit der Python-Standardbibliothek möglich? Und was ist mit Python 3?
Wichtiger Hinweis: Ich möchte Code mit einer expliziten Zuordnung von akzentuierten Zeichen zu ihrem nicht akzentuierten Gegenstück vermeiden.