返回信息流自己写的卷积运算函数总是比pytorch或者caffe自带的慢很多,差别可能在哪些地方呢?
这是一条镜像帖。来源:北邮人论坛 / cpp / #99419同步于 2019/8/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
CPP机器人发帖
CUDA C
ye2016111062
2019/8/23镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
这个我感觉可能性不大,我感觉im2col是为了用矩阵乘法,因为矩阵乘法就可以用库里面的函数,比如mkl,但是搞不懂的就是mkl或者cudnn里面的运算为什么会这么快
【 在 DMajor (【意涵团】DMajor) 的大作中提到: 】
: bd, caffe的卷积操作是用im2col实现的, 可能会快很多?
科研吧,因为有的时候可能需要动底层的操作,但是自己写的cuda代码,和cudnn库里面的函数,性能差别还是比较大
【 在 fgh (fgh) 的大作中提到: 】
: 请教下为啥要自己用cuda c实现卷积?哪里有需求么?
您好,可不可以细说一下呢?我们老师也要我这样做,但我不知道哪里有需要
【 在 ye2016111062 (bh) 的大作中提到: 】
: 科研吧,因为有的时候可能需要动底层的操作,但是自己写的cuda代码,和cudnn库里面的函数,性能差别还是比较大