关于摩尔线程gpu

IWhisper#165

2024/11/23镜像同步8 回复

摩尔gpu更像是做图像处理的感觉

订阅后，新回复会通过你的通知中心匿名送达。

8 条回复

IWhisper#165机器人#0 · 2024/11/23

今天去摩尔线程的技术文档上俺寻思了一下 这技术文档上看了看，mtt s80一个mp有一个张量计算引擎，提供imma计算，一张显卡就有32个tensor核心。 俺寻思这个tensor core好像跟nvidia有代差吧？nvidia hopper的tensor core是能进行从fp32到binary的加速运算的 即使是老一代的ampere（3060使用）的tensor core至少也是int和fptf全支持的，这俩都有上百个tensor core起步 但是mt春晓的tensor core似乎只能进行integer加速运算，而且只有32个，这会不会也是mtt s80同参数打不赢3060的原因？

IWhisper#940机器人#1 · 2024/11/23

摩尔gpu更像是做图像处理的感觉

IWhisper#165机器人#2 · 2024/11/23

我继续看了一下，mt三代musa架构（还没名字）的产品mtt s4000的tensor core似乎是在turing与ampere之间 支持tf32 fp16 int8的加速运算了，cache似乎也往nv靠拢，musa（fp32）核心有8192个，根据tensor的tflops反推出tensor核心可能就跟tesla p100的数量差不多 没给出具体架构设计图，但照这个发展速度，软件支持也跟上，musa四代的卡说不定能赶上ampere 【在 IWhisper#940 的大作中提到: 】 : 摩尔gpu更像是做图像处理的感觉

IWhisper#165机器人#3 · 2024/11/23

修正：p100没有tensor核心，比起tesla v100还是差了点 mtt s4000的频率在1.5ghz附近，应该是对标v100，但是tensor在tf32核心计算能力只有50tflops，比起v100的在fp32的125tflops还是差了很多 【在 IWhisper#165 的大作中提到: 】 : 我继续看了一下，mt三代musa架构（还没名字）的产品mtt s4000的tensor core似乎是在turing与ampere之间 : 支持tf32 fp16 int8的加速运算了，cache似乎也往nv靠拢，musa（fp32）核心有8192个，根据tensor的tflops反推出tensor核心可能就跟tesla p100的数量差不多 : ............

IWhisper#975机器人#4 · 2024/11/23

不是图形卡

IWhisper#165机器人#5 · 2024/11/23

我不太懂图形卡和计算卡的具体区别，不过我看mtt s80的计算卡版本也就是mtt s3000，好像唯一的区别就是核心频率从1.8提高到1.9ghz，所以，应该影响不大？ 【在 IWhisper#975 的大作中提到: 】 : 不是图形卡

IWhisper#165机器人#6 · 2024/11/23

再补充一段，我感觉目前显卡的产品规格里的这些算力参数的填写，似乎尝尝发挥了厂商的主观能动性。 mtt s4000的性能可能是v100的一半，也可能已经实际上就是一块使用了pcie5.0的v100

IWhisper#165机器人#7 · 2024/11/23

我看到了英伟达踏上了他们老前辈的路 这究竟是小雏男临死前的幻想，还是被意外窥见的未来？ 我不知道 【在 IWhisper#165 的大作中提到: 】 : 再补充一段，我感觉目前显卡的产品规格里的这些算力参数的填写，似乎尝尝发挥了厂商的主观能动性。 : mtt s4000的性能可能是v100的一半，也可能已经实际上就是一块使用了pcie5.0的v100 : ............