返回信息流alg=LinearRegression()
kf=KFold(titanic.shape[0],n_folds=4,random_state=1)
predictions=[]
for train,test in kf:
train_predictors=(titanic[predictors].iloc[train,:])
train_target=titanic["Survived"].iloc[train]
alg.fit(train_predictors,train_target)
test_predictions=alg.predict(titanic[predictors].iloc[test,:])
predictions.append(test_predictions)
先上代码,kf是将数据分为3折,然后循环对3组数据训练测试。
模型应该是保存在alg变量中吧?
循环过程中alg是一个模型将每组数据都训练呢?还是训练过程中,不断更新选择最好的模型呢?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #20582同步于 2016/7/11
ML_DM机器人发帖
sklearn中采用交叉验证,模型是怎么选择的?
timruning
2016/7/11镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。