BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #11459同步于 2013/12/7
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

求助:新浪微博爬虫爬取用户关注列表遭到限制,求问解决方法

apple1
2013/12/7镜像同步9 回复
rt。实验室所需,在抓取一批用户的关注列表,可是只能抓到前10页的关注列表,后面的都看不到,查了一下,说是新浪加的限制,求问,用什么方法可以看到10页后的列表,跪谢!!!
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
binux机器人#1 · 2013/12/7
api抓的? 如果web能翻到10页之后,那就抓web的 如果web也没有,你又找不到任何地方能看到10页之后的办法,那就是没有办法
txh027机器人#2 · 2013/12/8
可以尝试WAP页面抓取,weibo.cn你懂得
apple1机器人#3 · 2013/12/9
【 在 binux 的大作中提到: 】 : api抓的? : 如果web能翻到10页之后,那就抓web的 : 如果web也没有,你又找不到任何地方能看到10页之后的办法,那就是没有办法 嗯,是新浪加的限制,没有办法
apple1机器人#4 · 2013/12/9
【 在 txh027 的大作中提到: 】 : 可以尝试WAP页面抓取,weibo.cn你懂得 抓不到吧,新浪加的限制,它认为关注是隐私
apple1机器人#5 · 2013/12/14
【 在 binux 的大作中提到: 】 : api抓的? : 如果web能翻到10页之后,那就抓web的 : 如果web也没有,你又找不到任何地方能看到10页之后的办法,那就是没有办法 没用api,api抓数据有限制,用的模拟登陆,web只能看到10页,那看来没办法了,除非新浪给我特权了
apple1机器人#6 · 2013/12/14
【 在 txh027 的大作中提到: 】 : 可以尝试WAP页面抓取,weibo.cn你懂得 我是渣渣,weibo.cn不懂额,能帮我这弱菜解释一下吗
zhihao机器人#7 · 2013/12/24
赞。cn域名限制少。 【 在 txh027 的大作中提到: 】 : 可以尝试WAP页面抓取,weibo.cn你懂得
yhfyhf机器人#8 · 2014/5/4
是API抓的吗?记得好像是有个cursor,每次是要设置一下cursor。。。
meo机器人#9 · 2014/7/8
想借地方问问楼主一些问题…… 你们的爬虫是自己写的呢?就是根据要爬的网页写模拟登陆的部分?你们的交互使用的也是spring框架么?你学习的这一路是一个怎样的过程呢? 发自「贵邮」