Ich führe eine Zeichenfolgenabgleichung mit einer großen Menge von Daten durch.
EDIT: Ich gleiche Wörter ab, die in einer großen Liste mit einigen Ontologie-Textdateien enthalten sind. Ich nehme jede Datei aus der Ontologie und suche nach einer Übereinstimmung zwischen der dritten Zeichenfolge jeder Dateizeile und einem Wort aus der Liste.
Ich habe einen Fehler gemacht, indem ich übersehen habe, dass das, was ich tun muss, kein reiner Abgleich ist (Ergebnisse sind schlecht), sondern ich eine lockerere Abgleichfunktion benötige, die auch Ergebnisse zurückgibt, wenn die Zeichenfolge in einer anderen Zeichenfolge enthalten ist.
Das habe ich mit einem Radix-Trie gemacht; es war sehr schnell und funktioniert gut, aber jetzt glaube ich, dass meine Arbeit nutzlos ist, weil ein Trie nur genaue Übereinstimmungen zurückgibt. :/
- Welche Art von Algorithmen tun dies, sind es Zeichensuchalgorithmen?
- Kann jemand einige Java-Implementierungen vorschlagen, mit denen er Erfahrung hat?
Der Algorithmus sollte schnell sein, aber dies ist nicht oberste Priorität, würde sich mit Geschwindigkeit und Komplexität abfinden.
Ich bin sehr dankbar für alle Ratschläge/Beispiele/Erklärungen/Links!
Vielen Dank!
0 Stimmen
Was ist die Frage "Welche Art von Algorithmen durchsuchen Zeichenfolgen?"