XZC@XZC
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“算是找到答案了,解了我昨天的心中之惑,哈哈,谢谢你! 延伸一下,既然ReLU是存在硬饱和,理论上讲是和sigmoid一样的问题存在,可是在受欢迎程度上讲,似乎ReLU更好一些,不知道具体是缘何,难道就因为ReLU在右部分比较完美,而sigmoid在两端都不太完美造成的这种迥异? 【 在 coldmoon 的大作中提到:…”
“我知道,前面梯度为1,后面梯度为0,那其实还是有梯度饱和的一部分的。其实我在想,为什么不搞一个函数前面梯度为1,后面梯度为-1? 【 在 jaegerstar 的大作中提到: 】 : 那是失活了,所以后面才会有leaky relu等一系列改进”
“数据质量只要好,用XGBOOST效果就不会太差。”
“简而言之就是,boosting拟合效果更好,梯度提升,高拟合,低泛化;而bagging则是高泛化,低拟合。这里的高与低都是相对的,而往往高拟合更容易带来直观的效果。”
“很详细,谢谢!延伸一下,如何用java编程来实现这种原子操作呢? 【 在 nuanyangyang 的大作中提到: 】 : 信号量可以用来实现锁。它比锁的层次低。 : 原子内存读改写操作是cpu的特殊指令保证读改写整体原子的。”
“谢谢,跟我想的一样! 【 在 liuyehcf 的大作中提到: 】 : 信号量的写操作必须是原子的,否则如何作为信号量呢”
“一个好的模型应该是低偏差、低方差的模型。偏差反映的是模型的精度问题,方差反映模型的泛化能力。正则化其实就是变相降低模型的方差,防止其过拟合。”
“搜搜基于小样本集的分类算法,看看有没有啥可帮助的。”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。