Ich versuche, die semantische Ähnlichkeit zwischen zwei Wörtern zu berechnen. Ich verwende wordnet-basierte Ähnlichkeitsmaße, d.h. die Resnik-Messung (RES), die Lin-Messung (LIN), die Jiang- und Conrath-Messung (JNC) und die Banerjee- und Pederson-Messung (BNP).
Um das zu tun, verwende ich nltk und Wordnet 3.0. Als nächstes möchte ich die Ähnlichkeitswerte, die aus verschiedenen Maßen erhalten wurden, kombinieren. Dafür muss ich die Ähnlichkeitswerte normalisieren, da einige Maße Werte zwischen 0 und 1 liefern, während andere Werte größer als 1 liefern.
Meine Frage lautet also, wie normalisiere ich die Ähnlichkeitswerte, die aus verschiedenen Maßen erhalten wurden.
Zusätzliche Details darüber, was ich eigentlich versuche zu tun: Ich habe eine Menge von Wörtern. Ich berechne die paarweise Ähnlichkeit zwischen den Wörtern und entferne die Wörter, die nicht stark mit anderen Wörtern in der Menge korreliert sind.