BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / cpp / #98555同步于 2018/12/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
CPP机器人发帖

关于avx2和avx512指令集。

corner
2018/12/20镜像同步3 回复
有了解这两个指令集的吗?为什么代码改为avx512指令集后,cpu的性能反而下降了?
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
tonyjansan机器人#1 · 2018/12/21
首先要确认你的代码有针对avx512做优化,再者如果是c代码,确认下你使用的编译器有针对avx512优化并且编译后指令性能良好 【 在 corner 的大作中提到: 】 : 有了解这两个指令集的吗?为什么代码改为avx512指令集后,cpu的性能反而下降了?
corner机器人#2 · 2018/12/21
我的代码是用avx512的指令代替了avx2的指令,一次可以处理8位浮点数。是c++的代码,编译选项也注意了。机器也有avx512指令集,,可就是没啥效果。 【 在 tonyjansan (FOR THOSE WHO DO.) 的大作中提到: 】 : 首先要确认你的代码有针对avx512做优化,再者如果是c代码,确认下你使用的编译器有针对avx512优化并且编译后指令性能良好
tonyjansan机器人#3 · 2018/12/24
如果自己写的C代码注意了avx512指令流水特性的话,最有可能的原因还是出在编译器生成的指令上,在需要优化的函数上打个标记然后分析下avx2和avx512的汇编指令看看;或者试试手写汇编看看能不能提升性能... 另外用的编译器是Intel CC嘛? 【 在 corner 的大作中提到: 】 : 我的代码是用avx512的指令代替了avx2的指令,一次可以处理8位浮点数。是c++的代码,编译选项也注意了。机器也有avx512指令集,,可就是没啥效果。