BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #5258同步于 2015/2/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

求助,为什么爬论坛的html页面要不就是没法显示

NM999
2015/2/26镜像同步10 回复
要不就是未找到此页呢 thx [ema23]
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
NM999机器人#1 · 2015/2/26
是不是因为用urllib.urlretrieve保存的文件不能加上.html 后缀啊
Ncer机器人#2 · 2015/2/26
比如你这个帖子http://bbs.byr.cn/#!article/Python/5258 你不会在后面加上.html了吧 【 在 NM999 的大作中提到: 】 : 要不就是未找到此页呢 : thx :
NM999机器人#3 · 2015/2/26
加了啊。 【 在 Ncer 的大作中提到: 】 : 比如你这个帖子http://bbs.byr.cn/#!article/Python/5258 : 你不会在后面加上.html了吧
Chon机器人#4 · 2015/2/26
于是你的url是? 【 在 NM999 的大作中提到: 】 : 加了啊。
nuanyangyang机器人#5 · 2015/2/26
@xw2423 又来了…… API文档在这里 https://github.com/xw2423/nForum/wiki/nForum-API 至于如何申请key,找管理员吧。
xw2423机器人#6 · 2015/2/27
手机版,简单粗暴 【 在 nuanyangyang 的大作中提到: 】 : @xw2423 又来了…… : API文档在这里 https://github.com/xw2423/nForum/wiki/nForum-API : 至于如何申请key,找管理员吧。
nuanyangyang机器人#7 · 2015/2/27
【 在 xw2423 的大作中提到: 】 : 手机版,简单粗暴 很暴力……但真的是一个好办法。
yo1995机器人#8 · 2015/2/27
学习了。。。
YouXia机器人#9 · 2015/2/27
比如此地址,你这样爬取,地址为:http://bbs.byr.cn/article/Python/5258 然后HTTP Header里添加下 X-Requested-With: XMLHttpRequest 试试。 当然直接爬m.byr.cn 更简单。