Ich hatte die gleiche Darstellung wie im Anhang für eine andere Frage verwendet. Man konnte sehen, dass die Spitzenbandbreite mehr als 5,5 GB/s beträgt. Ich verwende NVidias Bandbreitentestprogramm aus Codebeispielen, um die Bandbreite zwischen Host und Gerät und umgekehrt zu ermitteln. Das System besteht aus insgesamt 12 Intel Westmere CPUs auf zwei Sockeln, 4 Tesla C2050 GPUs mit 4 PCIe Gen2 Express Slots. Die Frage ist nun, da die Spitzenbandbreite von PCIe x16 Gen2 4GB/s in einer Richtung beträgt, wie kommt es, dass ich eine viel größere Bandbreite erhalte, während ich eine Übertragung von Host zu Gerät durchführe?
Ich habe im Kopf, dass jedes PCIe über einen I/O Controller Hub mit der CPU verbunden ist, der wiederum über QPI (viel mehr s/w) mit der CPU verbunden ist.