755 Stimmen

Was ist der beste Weg, um Akzente zu entfernen (normalisieren) in einem Python Unicode-String?

Gefragt el 5 de Februar, 2009: Wann wurde die Frage gestellt
403402 Ansichten: Anzahl der Besuche der Frage
0 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich habe eine Unicode-Zeichenkette in Python, und ich möchte alle Akzente (diakritische Zeichen) entfernen.

Ich habe im Internet eine elegante Möglichkeit gefunden, dies zu tun (in Java):

konvertiert die Unicode-Zeichenkette in ihre lange normalisierte Form (mit einem separaten Zeichen für Buchstaben und diakritische Zeichen)
alle Zeichen entfernen, deren Unicode-Typ "diakritisch" ist.

Muss ich eine Bibliothek wie pyICU installieren oder ist dies nur mit der Python-Standardbibliothek möglich? Und was ist mit Python 3?

Wichtiger Hinweis: Ich möchte Code mit einer expliziten Zuordnung von akzentuierten Zeichen zu ihrem nicht akzentuierten Gegenstück vermeiden.

Gefragt el 5 de Februar, 2009 von MiniQuark

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

In Originalsprache ansehen

X