BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #11614同步于 2016/1/17
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

python千万级别以上数据分析,求指导?

lostking91
2016/1/17镜像同步26 回复
python新手,想学学用python实现数据挖掘。之前尝试在数据挖掘竞赛用python做,发现遇到了些问题,向python大神请教一下。 拿这次北邮数据竞赛来说, 1、请问下你们是如何读取数据?是直接用python读取csv进行数据特征提取吗? 2、怎么实现数据可视化? 3、python进行机器学习有什么值得推荐的教程吗?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
iamluo机器人#1 · 2016/1/17
教程的话上pypi看看吧
nuanyangyang机器人#2 · 2016/1/17
没参加过数据竞赛的帮顶。
qisiwole机器人#3 · 2016/1/17
我看到的r似乎更多一些 【 在 lostking91 (MozKing) 的大作中提到: 】 : python新手,想学学用python实现数据挖掘。之前尝试在数据挖掘竞赛用python做,发现遇到了些问题,向python大神请教一下。 : 拿这次北邮数据竞赛来说, : 1、请问下你们是如何读取数据?是直接用python读取csv进行数据特征提取吗? : ................... 通过『我邮2.0』发布
nuanyangyang机器人#4 · 2016/1/17
【 在 qisiwole 的大作中提到: 】 : 我看到的r似乎更多一些 : : 通过『我邮2.0』发布 说到r想到numpy。还有pypy也支持numpy
icybee机器人#5 · 2016/1/17
摸摸头,我也母鸡啊,好多大神。。。
sdlslx机器人#6 · 2016/1/17
为何不去群里直接问呢
sdlslx机器人#7 · 2016/1/17
r比pythin慢太多。。。 【 在 qisiwole (bupt007) 的大作中提到: 】 : 我看到的r似乎更多一些
sdlslx机器人#8 · 2016/1/17
1,表示数据预处理(脱敏)我就用的python,直接文件操作,文件如此大,是慢了点儿,比赛数据700m,脱敏前可是近两g。 2.可视化的话,一般先降维。 3.推荐看sklearn库源码,或《机器学习实战》,《python数据分析》 【 在 lostking91 (MozKing) 的大作中提到: 】 : python新手,想学学用python实现数据挖掘。之前尝试在数据挖掘竞赛用python做,发现遇到了些问题,向python大神请教一下。 : 拿这次北邮数据竞赛来说, : 1、请问下你们是如何读取数据?是直接用python读取csv进行数据特征提取吗? : ...................
qisiwole机器人#9 · 2016/1/17
那是你没用对包[ema3][ema3][ema3] 【 在 sdlslx (立夏之光) 的大作中提到: 】 : r比pythin慢太多。。。 通过『我邮2.0』发布