返回信息流摩尔gpu更像是做图像处理的感觉
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7842599同步于 2024/11/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
关于摩尔线程gpu
IWhisper#165
2024/11/23镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
今天去摩尔线程的技术文档上俺寻思了一下<br><br>这技术文档上看了看,mtt s80一个mp有一个张量计算引擎,提供imma计算,一张显卡就有32个tensor核心。<br><br>俺寻思这个tensor core好像跟nvidia有代差吧?nvidia hopper的tensor core是能进行从fp32到binary的加速运算的<br>即使是老一代的ampere(3060使用)的tensor core至少也是int和fptf全支持的,这俩都有上百个tensor core起步<br><br>但是mt春晓的tensor core似乎只能进行integer加速运算,而且只有32个,这会不会也是mtt s80同参数打不赢3060的原因?
我继续看了一下,mt三代musa架构(还没名字)的产品mtt s4000的tensor core似乎是在turing与ampere之间<br><br>支持tf32 fp16 int8的加速运算了,cache似乎也往nv靠拢,musa(fp32)核心有8192个,根据tensor的tflops反推出tensor核心可能就跟tesla p100的数量差不多<br><br>没给出具体架构设计图,但照这个发展速度,软件支持也跟上,musa四代的卡说不定能赶上ampere<br>【 在 IWhisper#940 的大作中提到: 】<br><font class="f006">: 摩尔gpu更像是做图像处理的感觉 </font>
修正:p100没有tensor核心,比起tesla v100还是差了点<br><br>mtt s4000的频率在1.5ghz附近,应该是对标v100,但是tensor在tf32核心计算能力只有50tflops,比起v100的在fp32的125tflops还是差了很多<br>【 在 IWhisper#165 的大作中提到: 】<br><font class="f006">: 我继续看了一下,mt三代musa架构(还没名字)的产品mtt s4000的tensor core似乎是在turing与ampere之间 </font><br><font class="f006">: 支持tf32 fp16 int8的加速运算了,cache似乎也往nv靠拢,musa(fp32)核心有8192个,根据tensor的tflops反推出tensor核心可能就跟tesla p100的数量差不多 </font><br><font class="f006">: ............ </font>
我不太懂图形卡和计算卡的具体区别,不过我看mtt s80的计算卡版本也就是mtt s3000,好像唯一的区别就是核心频率从1.8提高到1.9ghz,所以,应该影响不大?<br>【 在 IWhisper#975 的大作中提到: 】<br><font class="f006">: 不是图形卡 </font>
再补充一段,我感觉目前显卡的产品规格里的这些算力参数的填写,似乎尝尝发挥了厂商的主观能动性。<br><br>mtt s4000的性能可能是v100的一半,也可能已经实际上就是一块使用了pcie5.0的v100
我看到了英伟达踏上了他们老前辈的路<br><br>这究竟是小雏男临死前的幻想,还是被意外窥见的未来?<br><br>我不知道<br>【 在 IWhisper#165 的大作中提到: 】<br><font class="f006">: 再补充一段,我感觉目前显卡的产品规格里的这些算力参数的填写,似乎尝尝发挥了厂商的主观能动性。 </font><br><font class="f006">: mtt s4000的性能可能是v100的一半,也可能已经实际上就是一块使用了pcie5.0的v100 </font><br><font class="f006">: ............ </font>