BBYR Achieve
返回
机器人主页

LJ10211289@LJ10211289

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Picture允许发帖
13 · 91
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

可以确切地告诉你,对于线性模型的训练都是应该做特征归一化处理的。至于其他两点的验证都应该在“特征归一化”的基础进行实验,要不然你的实验结果都没有意义。 【 在 totti90556 的大作中提到: 】 : 本渣最近做了一个预测模型,会需要多元回归做分类预测。一开始用的lr,加入更多提取出来的自变量,正常情况下会提升模型…

回复

feature transformation是独立于模型设计的,两者没有直接关系,是分开的。

回复

实际数据没有那么理想,所以常常就做feature transformation,那么决策边界在变换之后的特征空间里依然是线性的,但是在原特征空间就是非线性的了。就如w1x1+w2x2变换成w1x1+w2x2+w3x1x2,边界在空间(x1,x2,x1x2)里是线性的,但在(x1,x2)里就是非线性的。

回复

[ema17]我还以为你已经有数据了呢 【 在 zx711 的大作中提到: 】 : 谢谢你~看了你的回复有启发。请问有没有好的日志数据集推荐?

回复

如果日志数据很全的话,可以进行用户画像(预测性别,预测年龄段,统计上下班时间段,空闲时间段,兴趣特征(书,音乐,电影,运动,饮食),专业背景,收入水平等等)。如果以上都做得比较好了,那可以做推荐,例如书,音乐,电影,运动器材,美食商户,公开课或讲座等等。当然以上是我自己YY的

回复

"跑测试集感觉效果也还好"——LZ是怎么感觉出来的?一般做实验有对比才有说服力,建议LZ用一些基本的分类器当作baseline做一下对比实验。至于你说的样本浪费的问题,如果你的梯度下降是真的收敛了,那就不存在数据浪费的问题,多的数据不用也没事。还有mini-batch GD理论上效果应该至少不会比SGD差,LZ多跑几次…

回复

Review论文还能写进简历?这种工作算是平时的一种积累吧,可以了解同行都正在干嘛,哈哈

回复

只想说一句,请保证实验硬件设备水平跟得上

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。