返回信息流崩溃 爆炸 花了那么多时间 搞得LSTM时间序列网络流预测,效果和MLP不相上下 而且MLP训练起来更快速,LSTM唯一体现的优势就是 训练的时候 越来越好 可拿到测试集和MLP真不分伯仲。查了一下 感觉理解一点点原因 然后直观想了想这种结果应该是可能的。
所以那些根据时间序列车流量预测的大作各种对比是怎么对比出来的。。。。。。。。
莫非LSTM就应用在语言等各种序列上效果才好 但是开山基础说什么Timesteps的 时间序列 一条街的哈士奇现在都不够日的心情。
想不开,不能死。。。。。。。。。。。。。。。。。。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #34305同步于 2019/6/9
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【问】LSTM和MLP
juniornen
2019/6/9镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
好吧 谢谢了 看样子只能用那个什么ARIMA试试了 mlp和lstm输入同样条数的历史条目 简直么得比
【 在 bdyzhy9527 的大作中提到: 】
: 先找效果好的baseline再改进吧,直接套模型基本等于白给
哇你这问题很深刻啊,我一时都不知道如何回答,抛开RNN能用在不定长序列的优点,RNN还有什么优势。
我觉得我可以说一个,比如一个长度为100的序列,假设网络已经学到了词组ABC的意思,但ABC从来没有出现在过位置0 1 2,RNN只要在其他位置见过ABC也能推断位置在0 1 2的ABC的意思。但对于MLP就不一样了只要ABC没在位置0 1 2出现过,就算ABC在其他位置怎么出现,MLP都不知道ABC在位置0 1 2时该怎么解释。
【 在 wxytalent 的大作中提到: 】
: 哇你这问题很深刻啊,我一时都不知道如何回答,抛开RNN能用在不定长序列的优点,RNN还有什么优势。
: 我觉得我可以说一个,比如一个长度为100的序列,假设网络已经学到了词组ABC的意思,但ABC从来没有出现在过位置0 1 2,RNN只要在其他位置见过ABC也能推断位置在0 1 2的ABC的意思。但对于MLP就不一样了只要ABC没在位置0 1 2出现过,就算ABC在其他位置怎么出现,MLP都不知道ABC在位置0 1 2时该怎么解释。
谢谢 你这个解释让我理解了 RNN只要出现过就有可能理解,而MLP即使出现过 但是只要序列改变 它也不能理解 所以我觉得我那个网络抓包是太规则了,MLP基本上记录了所有可能性而且不抛弃
lstm是针对sequence data的,比如当前时间节点condition于之前的时间状态,所以如果LSTM表现不如MLP,如果代码实现没有问题的情况下,可能是数据没有时序依赖性。不如先了解了解数据
【 在 DerekHu 的大作中提到: 】
: lstm是针对sequence data的,比如当前时间节点condition于之前的时间状态,所以如果LSTM表现不如MLP,如果代码实现没有问题的情况下,可能是数据没有时序依赖性。不如先了解了解数据
非常感谢你 刚好最近我也发现这个问题了 的确是没眼红上时序依赖性问题,mlp在做拟合方面挺好 但是加上时序也就是预测的问题 就根屁了, 我吧这个完成之后 再在帖子里大概总结一些 然后再次感谢你