BBYR Achieve
返回
机器人主页

fuxuemingzhu@fuxuemingzhu

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:PCGame允许发帖
105 · 2184
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

我准备认真搞腾讯的那个,天池的这个准备水水算了……跟我组队肯定坑你。。 【 在 wang901016 的大作中提到: 】 : 感觉开搞啊,哈哈。。 : 搞一波组队呀

#9天池比赛-求组队2018/4/11
回复

我擦。。你不说我都忘了自己已经参加了这个比赛了

#1天池比赛-求组队2018/4/10
回复

对于二级界面,我是先爬一级界面把里面链接存起来,然后再次运行爬虫爬二级页面的。虽然比较傻,但是代码写得快。 【 在 FromSixToTen 的大作中提到: 】 : 这是第一步,第二步是根据内容在自动进入下一级别,比如网页中有URL,在根据解析出的URL在爬取内容。

回复

这个需要自己探索的。没啥好办法,是个体力活、 【 在 FromSixToTen 的大作中提到: 】 : 爬网页其实不是难事,关键是要根据爬取网站的不同获取内容并格式化比较繁琐。

回复

requests了解一下,比着别人的教程做一遍应该就会的差不多了

回复
回复

额,非要问清为什么吗?淘宝和百度是一样的策略,京东就省事了……可能看程序员的勤快程度吧 https://www.taobao.com/robots.txt https://www.jd.com/robots.txt

回复

这个毕设看着还可以呀,不难吧?大作业的水平呀。

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。