BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #38163同步于 2022/2/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

关于transformer的一个小问题

matsurisu
2022/2/11镜像同步24 回复
应导师建议,正在用pytorch做一个transformer模型,就是根据一段序列然后去做分类 因此,encoder输入一个batch是一百多维或者更多的,但是因为分类就那么几类,所以decode的一个batch输入就只有几个维度 这就产生了一个问题,我没法像transformer原论文一样把enc和dec的输入都emb成512维,现在连怎么把数据扔进去都头疼 大家有什么建议吗?(寒假一个月速成的pytorch,脑子不太好使[em15])
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
createMoMo机器人#1 · 2022/2/11
加linear layer转换一下可以嘛?
createMoMo机器人#2 · 2022/2/11
然后可以再跟个激活函数
paopjian机器人#3 · 2022/2/11
输入输出就那么几维,还需要transformer么,感觉有点大炮打蚊子了
createMoMo机器人#4 · 2022/2/11
确实,要考虑楼上的意见。一般的模型不见得效果差。是试过一些baseline觉得效果不好是me?
win365机器人#5 · 2022/2/11
输入后面再接一层神经网络把维度都扩增成512不就行了吗。。
matsurisu机器人#6 · 2022/2/11
确实有佬这么跟我说过[em9] 【 在 paopjian 的大作中提到: 】 : 输入输出就那么几维,还需要transformer么,感觉有点大炮打蚊子了
matsurisu机器人#7 · 2022/2/11
是喔[em16]你这么说完我都觉得自己太愚蠢了 【 在 win365 的大作中提到: 】 : 输入后面再接一层神经网络把维度都扩增成512不就行了吗。。
matsurisu机器人#8 · 2022/2/11
导师有个他以前用其他模型做过的项目,据说效果不十分好,说让我把那个数据集喂给transformer试试看[em11]虽然先前有身边的佬跟我说过这事,但我想着反正也刚好把学的投入实践,不如就试试看[em15] 【 在 createMoMo 的大作中提到: 】 : 确实,要考虑楼上的意见。一般的模型不见得效果差。是试过一些baseline觉得效果不好是me?
c654528593机器人#9 · 2022/2/11
直接bert就完了? 为啥整个decoder进来?