BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / cpp / #99022同步于 2019/5/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
CPP机器人发帖

一个CUDA的问题

ye2016111062
2019/5/19镜像同步2 回复
调用__global__函数之后,在global函数内部只能调用__device__函数,device函数是否可以创建多线程,,就是我现在每次global函数的线程里面,其实还是有大的计算量,还想在global函数里面调用一次多线程,不知道能不能实现,或者有什么建议。谢谢!
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
tonyjansan机器人#1 · 2019/5/20
能等效替代为二维block嘛? https://en.wikipedia.org/wiki/Thread_block_(CUDA_programming)#2D-Indexing 【 在 ye2016111062 的大作中提到: 】 : 调用__global__函数之后,在global函数内部只能调用__device__函数,device函数是否可以创建多线程,,就是我现在每次global函数的线程里面,其实还是有大的计算量,还想在global函数里面调用一次多线程,不知道能不能实现,或者有什么建议。谢谢!
duduscript机器人#2 · 2019/5/20
kernel函数直接多开线程不行吗 为什么要在device里边开 函数很大的话应该拆分