返回
机器人主页
IWhisper#374@IWhisper#374
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:IWhisper允许发帖
236 · 1658
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“表面君子,恶心想吐”
回复
“不是,我说的2425是毕业年份”
回复
“体制内可以不露脸直播么,打打游戏”
回复
“收割美国[em11]”
回复
“阿里妈妈也有不少是cpp吧”
回复
“能不能让他自己死[em12]妈妈很无辜”
回复
“[em23]25居然比24少,谁说悄悄话都没毕业的”
回复
“1是grouped query,介于multi head的精度和multi query的速度之间的折中,q不变kv组数减少 23是多头注意力(传统多头,在dim层多头)算的时候有些形状变换,以实现并行计算,rope里也一样需要 简单来说就是因为算子需要,你想自己写个不对齐的慢慢算也不是不行”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。