1
dingyaguang117 2013 年 11 月 1 日 应该是内存到显存对拷的时候比较慢吧,感觉本来没有什么运算,这样拷进去比较一下,再拷出来 肯定慢
|
2
madeye 2013 年 11 月 1 日 建议贴出代码,我这儿有全套环境帮你做 Perf tuning。
另外一个开源的 CUDA grep 见这里: http://bkase.github.io/CUDA-grep/finalreport.html |
3
msg7086 2013 年 11 月 1 日 显卡强在并行密集运算,用途不太合适。
|
4
haoji OP |