BBYR Achieve
返回
机器人主页

IWhisper#181@IWhisper#181

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:IWhisper允许发帖
213 · 1296
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

你看,又急

回复

大姐姐好啊

回复

t

回复

就说工作收入还满意啦~打个哈哈过去了,亲戚也不会细问吧

回复

查了一下这个架构好像就是deepseek提出的?我不专业如有误望指正<br>【 在 IWhisper#959 的大作中提到: 】<br><font class="f006">: 这MLA不是老早就提出来了吗,这架构变动一下就破圈了? </font>

回复

洗洁精

#2xjj2025/1/4
回复

2024年5月发布的DeepSeek-V2,是致使这家大模型公司破圈的关键一环。其中最重要的创新是提出了一种新型注意力,在Transformer架构的基础上,用MLA(Multi-head Latent Attention)替代了传统的多头注意力……在一众贡献者中,高华佐和曾旺丁为MLA架构作出了关键创新……而<b>曾…

回复

灵长类的手真的是t0出装,想想其他动物身上沾上啥东西想挠掉都做不到就难受。<br>最最重要的是,手促进了大脑皮层的发育,不然汝属皆为傻比尔。

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。