l11x0m7@l11x0m7
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“【 在 pzhfreeze 的大作中提到: 】 : 棒!工作量很大啊 是的,主要是模型需要自己求导然后写backward,这块比较耗时,但是也是为了方便大家看的时候理解BP的流程。代码尽量写得清晰,所以在效率方面会有所下降。而且是手动求导,所以扩展性和灵活性很差,很难用于high level DIY。做这个的初衷只是因…”
“【 在 byrssss 的大作中提到: 】 : 好厉害啊。 哈哈,还好。都是比较基础的内容,工程性要求也不会很高。[ema3]”
“【 在 XZC 的大作中提到: 】 : 就是随机分配给你K个特征,我意思就是这K个特征如果出现了大量缺失值如何处理。 : 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的”
“看数据本身吧。不是啥数据都适合用深度学习。一般都是模型适应数据。”
“随机抽到?难道不是每棵树事先随机分好一定的特征数,然后才开始在split的时候选择最佳的特征?”
“刚好最近写了个纯python的framework,参考一下吧。https://github.com/l11x0m7/lightnn”
“建议看一下no free lunch theory,我觉得没必要纠结这种问题 【 在 TvT666 的大作中提到: 】 : 我理解svm对连续特征能好一些?”
“【 在 TvT666 的大作中提到: 】 : 我理解xgb是gbdt的升级版,为什么离散特征多用xgb更好呢?我感觉svm应该更好一些。。。 正常来说,脱离实际数据比较最优模型都是耍流氓。从经验角度出发,大部分时候,高维、稀疏离散特征可以用svm,其余可以用gbdt,但是不是绝对的。”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。