Ich habe den K-Means-Algorithmus implementiert, um Daten zu clustern. Die Daten, mit denen ich arbeite, können größer sein als der verfügbare RAM. Gibt es einen üblichen Weg (in C++), um diese Art von Problemen zu lösen?
Antwort
Zu viele Anzeigen?Es gibt inkrementelle k-Means-Algorithmen da draußen : http://www.eecs.tufts.edu/~dsculley/papers/fastkmeans.pdf
C++ Quellcode : https://code.google.com/p/sofia-ml/