Beste Strategie zum Aufteilen von englischen Namen in Vor- und Nachnamen

Question

Beste Strategie zum Aufteilen von englischen Namen in Vor- und Nachnamen

Gefragt el 3 de November, 2012: Wann wurde die Frage gestellt
2525 Ansichten: Anzahl der Besuche der Frage
4 Antworten: Anzahl der Fragenantworten
Gelöst: Aktueller Status der Frage

Ich habe eine Liste von Namen und muss sie in Vor- und Nachnamen aufteilen. Da einige Namen 2-3 Leerzeichen enthalten, reicht ein einfacher Split für einen Leerzeichen nicht aus.

Welche Art von Heuristiken verwenden die Leute, um die Aufteilung durchzuführen?

Beachten Sie, dass dies keine Duplikate von Fragen sind, die effektiv fragen, wie man an einem Leerzeichen teilt; Ich suche nach Heuristiken und Algorithmen, nicht nach tatsächlicher Code-Hilfe.

Aktualisierung: Ich beschränke das Problemset auf englische Namen. Dies ist alles, was ich lösen muss und wahrscheinlich auch alles, was jeder, der diese (englischsprachige) Frage angeht, benötigen wird.

Gefragt el 3 de November, 2012 von David Pfeffer

Answer 1

4 Antworten

Answer 2

6voto

fan711 Punkte 716

Ich habe einen sehr interessanten und umfassenden Beitrag zu diesem Thema gelesen:

http://www.w3.org/International/questions/qa-personal-names

Es wird sogar vorgeschlagen, sich zu fragen, ob Sie wirklich separate Felder für Vor- und Nachnamen benötigen. Es scheint von den Zielregionen Ihrer Anwendung abzuhängen.

Beantwortet el 3 de November, 2012 von fan711 (716 Punkte )

Answer 3

3voto

SporkInventor Punkte 3120

Zwei Ansätze können helfen, dieses Problem jedoch nicht vollständig lösen.

Programmatisch trennen Sie die einfachen, diejenigen, die nicht einfach sind, werden in eine andere Liste, "verbleibend zu teilen", verschoben. Sortieren Sie diese Liste manuell. Beim manuellen Sortieren können einige Heuristiken entstehen, die codiert werden könnten, was die Größe der verbleibenden Liste weiter reduziert. Wenn dies einmalig ist und die Liste nicht sehr groß ist, wird dies die Arbeit erledigen.
Ein eng verwandtes Problem tritt auf, wenn ein Name aufgeteilt wird, aber Sie nicht wissen, welcher der erste und welcher der letzte ist. Einige Systeme umgehen dieses Problem, indem sie unscharfe Suchen durchführen, sodass, wenn bei einem ersten Versuch keine Übereinstimmung gefunden wird, der Vor- und Nachname vertauscht und erneut versucht wird. Sie haben nicht gesagt, warum Sie die Namen aufteilen müssen. Wenn dies geschieht, um gegen Referenzdaten zu suchen, sollten Sie überlegen, ähnliche unscharfe Suchheuristiken zu verwenden, die das Ausprobieren unterschiedlicher Aufteilungen ermöglichen, anstatt zu versuchen, die Aufteilung sofort korrekt zu erzielen.

Nicht wirklich eine Antwort, aber in diesem Fall gibt es wirklich keine perfekte Antwort.

Beantwortet el 3 de November, 2012 von SporkInventor (3120 Punkte )

Answer 4

1voto

Martin Bean Punkte 36399

Verschiedene Länder und Regionen haben unterschiedliche Formate für Namen. In Asien wird zum Beispiel normalerweise der Familienname zuerst genannt und dann folgen die Vornamen. Im Westen hat man die Konvention, den Vornamen und dann den Nachnamen zu verwenden, aber es wird kompliziert, wenn Leute Doppelnamen haben oder Mittelnamen einschließen. Und in manchen Regionen haben die Leute nur einen Namen.

Persönlich glaube ich nicht, dass es einen einzigen Algorithmus gibt, der Ihnen zu 100% genaue Ergebnisse liefern kann, tut mir leid.

Beantwortet el 3 de November, 2012 von Martin Bean (36399 Punkte )

Answer 5

0voto

j_random_hacker Punkte 49159

Das Folgende setzt englische Nachnamen voraus. Wenn das nicht der Fall ist, aktualisieren Sie bitte Ihre Frage.

Es ist normalerweise sicher anzunehmen, dass das letzte Leerzeichen das Startsignal für den Nachnamen einer Person ist. Da es jedoch Ausnahmen gibt, wäre eine Strategie, eine große Datenbank bekannter mehrteiliger Nachnamen aus einer anderen Quelle zu erstellen. Sie könnten dann diese Nachnamen überprüfen und sie als Ausnahmen behandeln.

Beantwortet el 3 de November, 2012 von j_random_hacker (49159 Punkte )

Beste Strategie zum Aufteilen von englischen Namen in Vor- und Nachnamen

Antworten

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by:

Beste Strategie zum Aufteilen von englischen Namen in Vor- und Nachnamen

Antworten

Verwandte Fragen

Empfohlene Fragen

Top-Tags

CodeJaeger.com

Powered by: