BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7944848同步于 2024/12/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

求教LSTM的hidden_size问题

IWhisper#985
2024/12/25镜像同步10 回复
看你的输入和输出
订阅后,新回复会通过你的通知中心匿名送达。
10 条回复
IWhisper#985机器人#0 · 2024/12/25
hidden_size的值到底要怎么确定,他在整个模型中的战略地位是什么样的。导师让我搞明白怎么衡量一个模型的复杂性,进而来选择hidden_size的大小。我在网上找不到类似的帖子这么详细的介绍hidden_size大小的选择的依据,只是说根据经验
IWhisper#585机器人#1 · 2024/12/25
看你的输入和输出
IWhisper#985机器人#2 · 2024/12/25
能详细说一下嘛佬<img src="/img/ubb/em/42.gif" alt="em42" style="display:inline;border-style:none">,假设就是一维的时间序列,输出一维的时间序列呢<br>【 在 IWhisper#585 的大作中提到: 】<br><font class="f006">: 看你的输入和输出 </font><br>:
y2021uu机器人#3 · 2024/12/25
一般来说,hiddensize就是中间层的深度吧,一般512层就效果蛮好的,你可以都试试,太小效果不明显,太大了过拟合。然后你还有把输入和输出接回来
bestyotta机器人#4 · 2024/12/25
512层是怎么得出的呢<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">换一个项目又该设为多少呢,老师就追着问这些的依据,以及每个超参数在模型里到底占多大的地位,模型里谁是更起主导地位一点的,这些东西很难在网上找到准确答案<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">求佬不吝赐教<br>【 在 y2021uu 的大作中提到: 】<br><font class="f006">: 一般来说,hiddensize就是中间层的深度吧,一般512层就效果蛮好的,你可以都试试,太小效果不明显,太大了过拟合。然后你还有把输入和输出接回来 </font><br>:
IWhisper#897机器人#5 · 2024/12/25
老师想让你补参数实验<br>【 在 bestyotta 的大作中提到: 】<br><font class="f006">: 512层是怎么得出的呢<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">换一个项目又该设为多少呢,老师就追着问这些的依据,以及每个超参数在模型里到底占多大的地位,模型里谁是更起主导地位一点的,这些东西很难在网上找到准确答案<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">求佬不吝赐教 </font>
bestyotta机器人#6 · 2024/12/25
我用贝叶斯优化找参数,跟着网上设的几个参数值,老师说不行,追着问为什么要这么设这么找,鼠鼠真不清楚<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br>【 在 IWhisper#897 的大作中提到: 】<br><font class="f006">: 老师想让你补参数实验 </font><br>:
IWhisper#8机器人#7 · 2024/12/25
有啥依据,不都是一点点调参找最佳性能吗?不然为啥叫炼丹<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"><br>【 在 bestyotta 的大作中提到: 】<br><font class="f006">: 512层是怎么得出的呢<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">换一个项目又该设为多少呢,老师就追着问这些的依据,以及每个超参数在模型里到底占多大的地位,模型里谁是更起主导地位一点的,这些东西很难在网上找到准确答案<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none">求佬不吝赐教 </font>
IWhisper#8机器人#8 · 2024/12/25
或者调参过程就是依据?<br>【 在 IWhisper#8 的大作中提到: 】<br><font class="f006">: 有啥依据,不都是一点点调参找最佳性能吗?不然为啥叫炼丹<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"> </font>
bestyotta机器人#9 · 2024/12/25
感谢,有对付老师的话术了<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"><br>【 在 IWhisper#8 的大作中提到: 】<br><font class="f006">: 或者调参过程就是依据? </font><br>: