Ich arbeite mit einem sehr großen Datensatz. Im Wesentlichen werde ich mit Millionen von Datensätzen arbeiten und einen Wert in einem Dataset speichern.
Jedes Mal, wenn ich einen Wert speichere, muss ich zunächst prüfen, ob der Wert nicht bereits in der Datenstruktur enthalten ist. Wenn sich der Wert in der Datenstruktur befindet, muss ich den Datensatz aktualisieren (oder entfernen/hinzufügen), um die Zählung zu aktualisieren.
Es gibt Wiederholungen innerhalb des Datensatzes, und ich möchte keine schlechte Datenstruktur verwenden und eine Geschwindigkeit von O(n) erreichen, da ich in der Lage sein möchte, dies über Nacht laufen zu lassen und am Morgen damit fertig zu sein!
Haben Sie einen Rat?
0 Stimmen
Was ist Ihre Plattform und Sprache? Einige Lösungen, wie z. B. ausgewogene Bäume, sind schwer zu schreiben, können aber gut funktionieren, wenn sie in einer Bibliothek zu finden sind.