Ich bin dabei, ein Quizsystem zu entwickeln, und wenn Quizmacher Fragen in die Fragebank eingeben, soll ich die DB auf doppelte / sehr ähnliche Fragen überprüfen.
Testen von MySQLs MATCH() ... AGAINST() Die höchste Relevanz, die ich erhalte, ist 30+, wenn ich gegen eine 100% ähnliche Zeichenfolge teste.
Worin genau besteht also die Relevanz? Um die Handbuch :
Relevanzwerte sind nichtnegative Gleitkommazahlen. Relevanz Null bedeutet keine Ähnlichkeit. Die Relevanz wird auf der Grundlage der Anzahl der Wörter in der Zeile, der Anzahl der eindeutigen Wörter in dieser Zeile, der Gesamtzahl der Wörter in der Sammlung und der Anzahl der Dokumente (Zeilen), die ein bestimmtes Wort enthalten, berechnet.
Mein Problem ist, wie man die Relevanz Wert zu testen, wenn eine Zeichenfolge ein Duplikat ist. Wenn sie zu 100% doppelt ist, soll sie nicht in die Question Bank eingefügt werden. Wenn sie aber nur so ähnlich ist, soll der Quizmaker aufgefordert werden, zu überprüfen, ob sie eingefügt werden soll oder nicht. Wie mache ich das also? 30+ für 100% identische Zeichenfolge ist kein Prozentsatz, also bin ich ratlos.
Vielen Dank im Voraus.