XZC@XZC
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“ok,tks! 【 在 l11x0m7 的大作中提到: 】 : 可以看看Decison Tree的缺失值处理,相当于缺失值不在统计范围内,做一个reweight。放到Random Forest应该也是一样的”
“就是随机分配给你K个特征,我意思就是这K个特征如果出现了大量缺失值如何处理。 【 在 l11x0m7 的大作中提到: 】 : 随机抽到?难道不是每棵树事先随机分好一定的特征数,然后才开始在split的时候选择最佳的特征?”
“这陈天奇也算是为国争光了吧,kaggle上很多国外选手用xgboost 【 在 sdlslx 的大作中提到: 】 : sklearn大多是底层运算用numpy,xg底层用c++,关键还是陈天奇大神写的,必然牛叉啊”
“欠拟合的概率大,总之就是模型训练不大好。另外,也许是训练集与验证集效果都不好,只是相对验证集好那么一点点而已,这个好其实没有多大意义,继续调整模型吧。画出学习曲线看看。 【 在 shaomai00 的大作中提到: 】 : 想请教各位大神,有什么情况下每轮的交叉验证集上的测试效果(大概分了8%的数据用于验证)比训练集上的…”
“这种智能用线性回归了吧 【 在 rayfox 的大作中提到: 】 : 交通线路时间预测 : 小白,求问,这种问题一般用什么算法?”
“有视频直播吗 【 在 zhang2010 的大作中提到: 】 : 华裔脱口秀第一人黄西,将带您享受一场科技盛宴,与大伽科学家吴恩达、斯坦福教授James共语未来!时间:2016年11月22日13:30,地点:北京市朝阳区将台路6号丽都皇冠假日酒店二层宴会厅。点击H5报名,现场互动有精美纪念品。 : http://h5.…”
“【 在 hudabao 的大作中提到: 】 : 谢谢你的回答,你说的是正则化,正则化是防止过拟合,但是L2范数归一化和L2正则化不一样吧 归一化的目的有两个: 1.有量纲体系转化为无量纲体系,如身高与体重,不同的计量单位 2. 加快收敛”
“spider倒不一定写多个,可以根据不同的rules选择不同的parser函数解析。 【 在 abciyou 的大作中提到: 】 : 看了几个scrapy的例子,有这样的印象,scrapy 作为定制爬虫框架,是不是适合少量网站的爬取呢? : 如果是抓取十几个网站,是不是就写十几个对应的spider呢?因为每个网站构造都…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。