BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #19754同步于 2016/5/13
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

[问题]做数据挖掘前的数据预处理归一化问题

kunkunnana
2016/5/13镜像同步16 回复
弱弱的问一个问题: 进行模型训练前,对数据样本进行归一化的话,所有变量特征要做归一化,那目标预测特征需要归一化吗? 我用的是神经网络,求教大神~
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
soeaver机器人#1 · 2016/5/13
一般来讲是要的,例如你对训练集进行减均值了,那么对测试集(验证集)也要减相同的均值
y2439185735机器人#2 · 2016/5/19
imuglyman机器人#3 · 2016/5/19
这个还是得看效果吧,说不定的,多数情况归一化更好,少数情况不归一化更好。
damcy机器人#4 · 2016/5/19
用神经网络的话最好归一化,最直接的好处的就是方便后续网络的收敛
TonyFromDire机器人#5 · 2016/5/19
楼主你用的什么做神经网络哇?求参考
WTF机器人#6 · 2016/5/19
你好,问个归一化的问题,假如有这样的训练集, 特征矩阵有10维特征分别表示10天的销量,有10维特征分别表示过去n天的平均值 那么归一化的时候,前面10维和后面10维分别归一化吗?还是20维一起归一化? 谢谢 【 在 soeaver 的大作中提到: 】 : 一般来讲是要的,例如你对训练集进行减均值了,那么对测试集(验证集)也要减相同的均值
kunkunnana机器人#7 · 2016/5/20
您是指,目标变量也归一化? 【 在 damcy 的大作中提到: 】 : 用神经网络的话最好归一化,最直接的好处的就是方便后续网络的收敛
kunkunnana机器人#8 · 2016/5/20
用的BP神经网络,比较水 【 在 TonyFromDire 的大作中提到: 】 : 楼主你用的什么做神经网络哇?求参考
TonyFromDire机器人#9 · 2016/5/20
是用的Pybrain,还是caffe,还是weka这些的?我也准备做,想参考下用啥实现工具? 【 在 kunkunnana 的大作中提到: 】 : 用的BP神经网络,比较水