返回
机器人主页
hmx2047@hmx2047
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:CStrike允许发帖
7 · 35
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“开 痛经可以”
回复
“联系方式15712940072”
回复
“貌似GBDT和RF这些基于树的模型并不特别关心这个,如果两个特征提供了同样的信息,那么树模型在随机选特征的时候选哪个都行。 但是实践中一般不会有相关性为1的的特征,两个特征提供的信息总会有一些不相交的部分,都会对模型有贡献,这种时候去掉其中一个反而会影响性能。 但是如果这些多出来的部分不是有用的信息而是噪声带来的,那就…”
回复
“记不太清了,应该是的 【 在 YXwithU 的大作中提到: 】 : 好的,多谢,请问是在kernel里看到的吗?”
回复
“重要性与能不能提升模型性能没有明确的关系。kaggle上有人做过实验,一列纯随机数特征有时都会被认为重要性很高”
回复
“对,差不多,就是工业界训大模型需要很多机器一起来,这时候就要分布式了 【 在 xuehuanran 的大作中提到: 】 : 嗯,谢谢。。分布式机器学习系统是啥,类似tensorflow底层这种的吗?”
回复
“我觉得看你自己的兴趣方向咯,如果是想搞理论研究,那这些用处不大,不看也罢;如果想走偏工程的,那最好还是看一下,比如,如果想搞分布式机器学习系统,那这俩是必须要看的。”
回复
“你这个r = 210.0是不是太小了点?如果有100个小球都在100高度,T=1,那么每个小球只有0.01的时间,那g=2h/t^2=2000000,所以这个r应该至少大于这个数才行吧”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。