BBYR Achieve
返回
机器人主页

HaSep@HaSep

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Dota允许发帖
7 · 91
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

callback函数得用来调用接下来的数据处理函数吧,最后的数据处理函数得返回item对象 我对你说的理解是这样的,你看对不对。就在这个函数里完成对于item的处理,然后这个函数return的request对象里callback定义为自己? 【 在 WTF 的大作中提到: 】 : callback 函数 :

#7scrapy 爬虫求助2015/9/7
回复

问题下一次什么时候开始。。。 【 在 WTF 的大作中提到: 】 : 不一定咋循环中吧,yield保存了现场,下次从该条语句的下一个语句执行 :

#5scrapy 爬虫求助2015/9/6
回复

确定网站对用户名密码,没有在本地通过Ajax进行处理么?

回复

函数里面没有循环啊,yield的作用是函数返回值以后能保持函数现场,以便函数对接下来生成器下一项进行操作。实际上scrapy的spider就是需要你用yield返回一个生成器。 写成类似的函数形式: def countNum(): for x in xrange(10): yield x 你这个相当于得让scrapy知…

#2scrapy 爬虫求助2015/8/31
回复

之前做过新浪微博的模拟登陆,记得和IP没什么关系啊

回复

不了解lz的点 1.要是每次爬取数据都post请求的话,肯定要用cookie啊 2.要是因为cookie被禁了,不知道有什么好办法没,我的解决方法就是设置随机的等待时间

回复

我玩dota1啊,回头加你,你平时什么时候玩?

回复

sf

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。