Ich habe diesen sehr einfachen Code und nvcc braucht Ewigkeiten zum Kompilieren (es lädt zwei meiner CPU-Kerne zu 100 % und hört nie auf). Liegt das an einer Loop-Aufrollung? Gibt es einen einfacheren Weg, um den lokalen Speicher schneller zu initialisieren?
#include "cuda_runtime.h"
#include
#include "cuComplex.h"
__global__ void test()
{
cuComplex myPoints[20][20];
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
myPoints[i][j].x=0.0;
myPoints[i][j].y=0.0;
}
for (int i=0; i<20;i++)
for (int j=0; j<20;j++)
{
printf("%d %d",myPoints[i][j].x,myPoints[i][j].y);
}
}
main()
{
}