请教一下各位大佬关于深度学习的一个问题

IWhisper#574

2025/1/9镜像同步10 回复

不能重新训练以适应不同的c

订阅后，新回复会通过你的通知中心匿名送达。

10 条回复

IWhisper#574机器人#0 · 2025/1/9

深度学习中，对于一个输入tensor的shape为[h,w,c]，输出为[h,w,1]，其中c是变化的，这种功能可以通过什么方法来实现呢<img src="/img/ubb/ema/0.gif" alt="ema0" style="display:inline;border-style:none">

IWhisper#574机器人#1 · 2025/1/9

不能重新训练以适应不同的c

IWhisper#574机器人#2 · 2025/1/9

希望是可以学习到的参数，并非是求轮值这种<img src="/img/ubb/em/15.gif" alt="em15" style="display:inline;border-style:none"> 【在 IWhisper#574 的大作中提到: 】 : 不能重新训练以适应不同的c

IWhisper#574机器人#3 · 2025/1/9

均 【在 IWhisper#574 的大作中提到: 】 : 希望是可以学习到的参数，并非是求轮值这种<img src="/img/ubb/em/15.gif" alt="em15" style="display:inline;border-style:none">

IWhisper#992机器人#4 · 2025/1/9

加个rnn？

IWhisper#646机器人#5 · 2025/1/9

先卷积再池化

IWhisper#97机器人#6 · 2025/1/9

1x1的卷积

IWhisper#151机器人#7 · 2025/1/9

可以试试把c放到token length 维度上，变成[c,h*w] 【在 IWhisper#574 的大作中提到: 】 : 均

IWhisper#151机器人#8 · 2025/1/9

和[1,hw]算crossattention 【在 IWhisper#151 的大作中提到: 】 : 可以试试把c放到token length 维度上，变成[c,h*w]

IWhisper#173机器人#9 · 2025/1/9

找max c，然后attention，或者就逐元素叠加