返回信息流管院IT小白一枚,现在导师有一个题目需要用到微博数据,需要采集的数据是某个/某批博主所发布的微博及各条微博所获得的评论、转发和赞。除此之外,还需要这些评论和转发所获得的评论和赞。其中,评论既要有数量,还要有内容。
一头雾水啊??不知道从何下手,比如:用什么软件?有没有符合以上要求的现成的代码?跪求高人出手相助!
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #20585同步于 2016/7/12
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
[问题]微博数据抓取,求高手拔刀相助
sunshinejia
2016/7/12镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
http://open.weibo.com/wiki/%E5%BE%AE%E5%8D%9AAPI
http://open.weibo.com/wiki/Messages_api_start
https://github.com/terry2tan/weiboCrawler
上网随手搜的,感觉微博的列子还是挺多的。
楼主是真小白,需要你手把手教才行,不怂
【 在 jh1 的大作中提到: 】
: http://open.weibo.com/wiki/微博API
: http://open.weibo.com/wiki/M
【 在 jh1 的大作中提到: 】
: http://open.weibo.com/wiki/%E5%BE%AE%E5%8D%9AAPI
: http://open.weibo.com/wiki/Messages_api_start
: https://github.com/terry2tan/weiboCrawler
: ...................
这是虐死人的节奏,随手一搜,还是随手!!!!
容我先看看,不知道完全没有编程概念的人能不能看得懂???
【 在 jh1 的大作中提到: 】
: http://open.weibo.com/wiki/%E5%BE%AE%E5%8D%9AAPI
: http://open.weibo.com/wiki/Messages_api_start
: https://github.com/terry2tan/weiboCrawler
: ...................
想试一下github的方法,然而这一步就装不了?“安装依赖库bs4,具体方法:pip install bs4(Mac:sudo pip install bs4)”
显示如下:
>>> sudo pip install bs4
SyntaxError: invalid syntax