返回信息流python新手,想学学用python实现数据挖掘。之前尝试在数据挖掘竞赛用python做,发现遇到了些问题,向python大神请教一下。
拿这次北邮数据竞赛来说,
1、请问下你们是如何读取数据?是直接用python读取csv进行数据特征提取吗?
2、怎么实现数据可视化?
3、python进行机器学习有什么值得推荐的教程吗?
这是一条镜像帖。来源:北邮人论坛 / python / #11614同步于 2016/1/17
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
python千万级别以上数据分析,求指导?
lostking91
2016/1/17镜像同步26 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
我看到的r似乎更多一些
【 在 lostking91 (MozKing) 的大作中提到: 】
: python新手,想学学用python实现数据挖掘。之前尝试在数据挖掘竞赛用python做,发现遇到了些问题,向python大神请教一下。
: 拿这次北邮数据竞赛来说,
: 1、请问下你们是如何读取数据?是直接用python读取csv进行数据特征提取吗?
: ...................
通过『我邮2.0』发布
【 在 qisiwole 的大作中提到: 】
: 我看到的r似乎更多一些
:
: 通过『我邮2.0』发布
说到r想到numpy。还有pypy也支持numpy
1,表示数据预处理(脱敏)我就用的python,直接文件操作,文件如此大,是慢了点儿,比赛数据700m,脱敏前可是近两g。
2.可视化的话,一般先降维。
3.推荐看sklearn库源码,或《机器学习实战》,《python数据分析》
【 在 lostking91 (MozKing) 的大作中提到: 】
: python新手,想学学用python实现数据挖掘。之前尝试在数据挖掘竞赛用python做,发现遇到了些问题,向python大神请教一下。
: 拿这次北邮数据竞赛来说,
: 1、请问下你们是如何读取数据?是直接用python读取csv进行数据特征提取吗?
: ...................
那是你没用对包[ema3][ema3][ema3]
【 在 sdlslx (立夏之光) 的大作中提到: 】
: r比pythin慢太多。。。
通过『我邮2.0』发布