Man sollte auf Präfixe und Suffixe achten.
plötzlich = plötzlich + ly.
Wenn Sie die ly's entfernen, können Sie nur das Wort "Root" speichern.
Ebenso preallocate = pre + allocate.
Und liebevoll = Liebe + ing + ly wird ein wenig komplexer, da die englischen Regeln für ing aufgerufen werden.
Es besteht auch die Möglichkeit, eine Art Hashing-Funktion zu verwenden, um ein Root-Wort zuzuordnen auf ein bestimmtes Bit einer großen Bitmap abzubilden, um in konstanter Zeit festzustellen, ob das Wurzelwort richtig geschrieben ist.
Noch komplexer wird es, wenn Sie versuchen, zu einem falsch geschriebenen Wort eine Liste mit alternativen Schreibweisen zu erstellen. Sie könnten den Soundex-Algorithmus untersuchen, um einige Ideen zu erhalten.
Ich würde empfehlen, mit einer kleinen Anzahl von Wörtern einen Prototyp zu erstellen. Führen Sie viele Tests durch und erweitern Sie dann. Es ist ein wunderbares pädagogisches Problem.
1 Stimmen
Bitte erledigen Sie einen Teil der Arbeit, bevor Sie sie an Stack Overflow weitergeben. Skizzieren Sie ein Design, identifizieren Sie die wichtigsten Blockaden, die Sie daran hindern, Fortschritte zu machen, erzählen Sie uns etwas über den Kontext, in dem dies verwendet werden soll - legen Sie ein paar e
0 Stimmen
Wenn Sie nach Antworten wie "Lesen Sie diesen Link" suchen, sagen Sie es. Sie erhalten vielleicht bessere Antworten.
3 Stimmen
Also, Paul, diese Frage ist keine gute "Stackoverflow"-Frage? Inwiefern genau? Eine Seite im Internet mit dem Titel "Wie funktioniert die Rechtschreibprüfung?" mit durchdachten Antworten wäre eine nützliche Sache für jeden, der gerade erst anfängt zu lernen, wie diese Dinge funktionieren.
0 Stimmen
So wie sie formuliert ist, halte ich sie nicht für eine gute Frage, nein. Ich denke, es wäre mehr Kontext nötig gewesen, warum Sie eine schreiben mussten und was Sie vorher ausgearbeitet hatten. Es kommt so rüber, als würden Sie Stackoverflow bitten, Ihre Arbeit für Sie zu erledigen. Vielleicht liegt es nur an mir.
0 Stimmen
Für das Kernproblem der effizienten Bestimmung, ob ein Wort im Wörterbuch enthalten ist oder nicht, ist eine beliebte Technik die Verwendung eines Bloom-Filter .