5 Stimmen

Können wir vergleichen, wie schnell CUDA oder OpenCL im Vergleich zur CPU-Leistung ist?

Wie viel schneller kann ein Algorithmus auf CUDA- oder OpenCL-Code im Vergleich zu einem allgemeinen Einzelprozessorkern ausgeführt werden (unter Berücksichtigung der Tatsache, dass der Algorithmus sowohl für das CPU- als auch für das GPU-Ziel geschrieben und optimiert wurde)?

Ich weiß, dass es sowohl von der Grafikkarte als auch von der CPU abhängt, aber sagen wir, eine der schnellsten GPUs von NVIDIA und ein (einzelner Kern eines) Intel i7-Prozessors?

Und ich weiß, dass es auch von der Art des Algorithmus abhängt.

Ich brauche keine strikte Antwort, sondern erfahrene Beispiele wie: für einen Bildmanipulationsalgorithmus mit doppelpräzisem Fließkomma und 10 Operationen pro Pixel dauerte zunächst 5 Minuten und läuft jetzt mit dieser Hardware in x Sekunden.

0voto

jkff Punkte 17193

Ich habe Zahlen gesehen, die von 2x bis 400x reichen. Ich weiß auch, dass die Mittelklasse-GPUs bei doppelpräzisen Berechnungen nicht mit High-Range-CPUs mithalten können - MKL auf einem 8-Core-Xeon ist schneller als CULA oder CUBLAS auf einer 300-Dollar-GPU.

OpenCL ist anekdotisch gesehen viel langsamer als CUDA.

0voto

shoc Punkte 21

Eine neue Benchmark-Suite namens SHOC (Scalable Heterogeneous Computing) von Oak Ridge National Lab und Georgia Tech enthält sowohl OpenCL- als auch CUDA-Implementierungen vieler wichtiger Kernel. Sie können die Suite herunterladen von http://bit.ly/shocmarx . Viel Spaß!

CodeJaeger.com

CodeJaeger ist eine Gemeinschaft für Programmierer, die täglich Hilfe erhalten..
Wir haben viele Inhalte, und Sie können auch Ihre eigenen Fragen stellen oder die Fragen anderer Leute lösen.

Powered by:

X