4 Stimmen

Ist NER für die Auflösung von Koreferenz notwendig?

... oder ist die Information über das Geschlecht ausreichend? Genauer gesagt interessiert mich, ob ich die Anzahl der Modelle reduzieren kann, die vom Stanford Core NLP geladen werden, um Koreferenzen zu extrahieren. Ich bin nicht an der tatsächlichen Erkennung von benannten Entitäten interessiert.

Dankeschön

5voto

dmcer Punkte 8066

Laut dem EMNLP-Papier, das das mit Stanford CoreNLP ausgelieferte coref-System beschreibt, werden Named-Entities-Tags nur in den folgenden coref-Annotation-Passes verwendet: präzise Konstruktionen , entspannte Kopfanpassung y Pronomen (Raghunathan et al. 2010) .

Sie können die zu verwendenden Übergänge mit der Option dcoref.sievePasses Konfigurationseigenschaft. Wenn Sie Coreferenz wünschen, aber keine NER durchführen wollen, sollten Sie die Pipeline einfach ohne NER laufen lassen und festlegen können, dass das Coref-System nur die Annotationspässe verwenden soll, die keine NER-Labels erfordern.

Die sich daraus ergebenden coref-Anmerkungen werden jedoch unter der Rückruf . Sie sollten also einige Experimente durchführen, um festzustellen, ob die verminderte Qualität der Anmerkungen ein Problem für die spätere Verwendung darstellt.

1voto

John Lehmann Punkte 7467

Im Allgemeinen, ja. Erstens brauchen Sie benannte Entitäten, weil sie als Kandidaten für die Vorläufer oder Ziele, auf die sich die Pronomen beziehen. Viele (die meisten?) Systeme führen sowohl die Erkennung von Entitäten als auch die Klassifizierung von Typen in einem Schritt durch. Zweitens ist die semantische Kategorie (z. B. Person, Organisation, Ort) der Entitäten wichtig für die Erstellung genauer Koreferenzketten.

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X