Ich probiere gerade OpenNLP für die albanische Sprache aus. Zu diesem Zweck verwende ich OPenNLP und versuche, Modelle für die Erkennung von Personen, Orten und Organisationen in albanischer Sprache zu erstellen. Ich baue mir das Korpus selbst auf, aber ich brauche einen Open NLP Experten, der mir die folgenden Zweifel bestätigt: 1- Sollte ich für jedes Modell einen separaten Korpus erstellen, z.B. für die ner-Person einen Korpus erstellen, in dem nur Tags vorhanden sind? 2- Ist es möglich, Person, Ort und Organisation im selben Korpus zu markieren und damit ein einziges Modell zu trainieren, das alle drei Entitätstypen extrahieren kann? 3- Gibt es eine Quelle, in der ich mehr über den Algorithmus des OpenNLP-Moduls "Name finder" erfahren kann?
Vielen Dank für Ihre Antwort, ich brauche wirklich Ihre Unterstützung für meine These