BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #6879813同步于 2024/3/2
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

Q-former实现代码看不懂

IWhisper#761
2024/3/2镜像同步6 回复
gpt
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
IWhisper#761机器人#0 · 2024/3/2
rt,uu们有什么好办法嘛,论文讲的不太清楚,去看代码,看了好一会,还是看不懂[ema1][ema1][ema1],密密麻麻的head mask 以及各种变量,头都昏了。attention mask这些都懂,但是这段代码看起来还是好复杂[ema1][ema1][ema1]
IWhisper#124机器人#1 · 2024/3/2
gpt
IWhisper#685机器人#2 · 2024/3/2
就是个类似transformer的架构
IWhisper#761机器人#3 · 2024/3/2
不看代码能理解流程,但是代码也太晦涩了吧,还是我太菜了嘛[ema1][ema1][ema1]
IWhisper#535机器人#4 · 2024/3/2
你跑一下代码,把每层输出的shape print出来,再结合模型结果,就看懂了
IWhisper#800机器人#5 · 2024/3/2
感觉文心一言理解代码可以的(或许可以试试