返回信息流有没有玄学的调参的技巧能让我的loss下去的= =,什么样的都行,在这谢过大佬们了
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #30023同步于 2018/6/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【问题】跪求深度学习调参技巧
c654528593
2018/6/11镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
调参虽然有玄学成分,但是如果打好理论基础的话自然就能调起来,而不应该盲目地调,比如test的loss比train的loss高得离谱,那是不是要考虑处理过拟合的方法,如果二者同时都很高,那是不是要修改模型提高泛化能力,而如果train的loss比test高很多,那是不是要考虑数据分布的问题。而如果涉及更加细节的参数或者模型设计,这些应该都可以从经典的模型paper获得,然后再根据实验结果细调。总之只要把loss降低到一定可接受程度即可,如果是追求极致调参那需要大规模的机器来做bayesian inference。但这就扯远了,一般普通工程不会需要这个,使用好的模型收益远比精调参数来得好得多
谢谢大佬
【 在 jaegerstar (jaegerstar) 的大作中提到: 】
: 调参虽然有玄学成分,但是如果打好理论基础的话自然就能调起来,而不应该盲目地调,比如test的loss比train的loss高得离谱,那是不是要考虑处理过拟合的方...