返回信息流有了解这两个指令集的吗?为什么代码改为avx512指令集后,cpu的性能反而下降了?
这是一条镜像帖。来源:北邮人论坛 / cpp / #98555同步于 2018/12/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
CPP机器人发帖
关于avx2和avx512指令集。
corner
2018/12/20镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
首先要确认你的代码有针对avx512做优化,再者如果是c代码,确认下你使用的编译器有针对avx512优化并且编译后指令性能良好
【 在 corner 的大作中提到: 】
: 有了解这两个指令集的吗?为什么代码改为avx512指令集后,cpu的性能反而下降了?
我的代码是用avx512的指令代替了avx2的指令,一次可以处理8位浮点数。是c++的代码,编译选项也注意了。机器也有avx512指令集,,可就是没啥效果。
【 在 tonyjansan (FOR THOSE WHO DO.) 的大作中提到: 】
: 首先要确认你的代码有针对avx512做优化,再者如果是c代码,确认下你使用的编译器有针对avx512优化并且编译后指令性能良好
如果自己写的C代码注意了avx512指令流水特性的话,最有可能的原因还是出在编译器生成的指令上,在需要优化的函数上打个标记然后分析下avx2和avx512的汇编指令看看;或者试试手写汇编看看能不能提升性能...
另外用的编译器是Intel CC嘛?
【 在 corner 的大作中提到: 】
: 我的代码是用avx512的指令代替了avx2的指令,一次可以处理8位浮点数。是c++的代码,编译选项也注意了。机器也有avx512指令集,,可就是没啥效果。