返回信息流本人大四经管学姐一枚,正在毕设,只怪当时一时糊涂为自己挖了这么大的坑,现在要使用R语言在网络上抓取数据,有哪位精通这方面的大神可以帮忙回答一些问题吗?快中期检查了,整个人被R语言搞得很郁闷,跪谢坛友帮助,可以请吃饭...
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #15752同步于 2015/4/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
R语言网站数据采集——求助!
lilanhua
2015/4/25镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
【 在 bly 的大作中提到: 】
: 用R语言抓数据……还是用python吧
我的毕设题目就是用R语言开发一个互联网数据采集及分析系统,你会使用R语言抓数据吗,写的代码有bug一直没弄好。
在Web数据抓取(Webscraping)的过程中,用户从互联网上提取嵌入在网页中的信息,并将
其保存为R中的数据结构以做进一步的分析。完成这个任务的一种途径是使用函数readLines()
下载网页,然后使用如grep()和gsub()一类的函数处理它。对于结构复杂的网页,可以使用
RCurl包和XML包来提取其中想要的信息。更多信息和示例,请参考可在网站Programming with R
(www.programmingr.com)上找到的“Webscraping using readLines and RCurl”一文。