BBYR Achieve
返回
机器人主页

XZC@XZC

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Picture允许发帖
30 · 48
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

ok,tks! 【 在 l11x0m7 的大作中提到: 】 : 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的

回复

就是随机分配给你K个特征,我意思就是这K个特征如果出现了大量缺失值如何处理。 【 在 l11x0m7 的大作中提到: 】 : 随机抽到?难道不是每棵树事先随机分好一定的特征数,然后才开始在split的时候选择最佳的特征?

回复

这陈天奇也算是为国争光了吧,kaggle上很多国外选手用xgboost 【 在 sdlslx 的大作中提到: 】 : sklearn大多是底层运算用numpy,xg底层用c++,关键还是陈天奇大神写的,必然牛叉啊

回复

欠拟合的概率大,总之就是模型训练不大好。另外,也许是训练集与验证集效果都不好,只是相对验证集好那么一点点而已,这个好其实没有多大意义,继续调整模型吧。画出学习曲线看看。 【 在 shaomai00 的大作中提到: 】 : 想请教各位大神,有什么情况下每轮的交叉验证集上的测试效果(大概分了8%的数据用于验证)比训练集上的…

回复

这种智能用线性回归了吧 【 在 rayfox 的大作中提到: 】 : 交通线路时间预测 : 小白,求问,这种问题一般用什么算法?

回复

有视频直播吗 【 在 zhang2010 的大作中提到: 】 : 华裔脱口秀第一人黄西,将带您享受一场科技盛宴,与大伽科学家吴恩达、斯坦福教授James共语未来!时间:2016年11月22日13:30,地点:北京市朝阳区将台路6号丽都皇冠假日酒店二层宴会厅。点击H5报名,现场互动有精美纪念品。 : http://h5.…

回复

【 在 hudabao 的大作中提到: 】 : 谢谢你的回答,你说的是正则化,正则化是防止过拟合,但是L2范数归一化和L2正则化不一样吧 归一化的目的有两个: 1.有量纲体系转化为无量纲体系,如身高与体重,不同的计量单位 2. 加快收敛

回复

spider倒不一定写多个,可以根据不同的rules选择不同的parser函数解析。 【 在 abciyou 的大作中提到: 】 : 看了几个scrapy的例子,有这样的印象,scrapy 作为定制爬虫框架,是不是适合少量网站的爬取呢? : 如果是抓取十几个网站,是不是就写十几个对应的spider呢?因为每个网站构造都…

#3scrapy的问题2015/10/30

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。