BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #11118同步于 2012/9/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

[问题] 如何爬取北邮论坛 文章里面的内容

fuxiang90
2012/9/14镜像同步2 回复
http://bbs.byr.cn/#!article/BYRatSH/709 比如这个帖子 ,我想得到 每一楼是那些人回复和回复的内容,但是 用 python urllib2.urlopen 得到的内容没有这些 得到如下的 源码 ,根本不能抽取上述信息,有知道如何得到上述信息的同学么? 先谢过了 积分:</dt><dd><%=score%></dd><%if(id == session_id || session_is_admin){%><dt>登陆次数:</dt><dd><%=login_count%></dd><%}%><dt>生命力:</dt><dd><%= [ema11]
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
binux机器人#1 · 2012/9/14
curl -H "X-Requested-With: XMLHttpRequest" http://bbs.byr.cn/article/BYRatSH/709
fuxiang90机器人#2 · 2012/9/14
【 在 binux 的大作中提到: 】 : curl -H "X-Requested-With: XMLHttpRequest" http://bbs.byr.cn/article/BYRatSH/709 回复 谢谢 ,我感觉我每次问的问题 你都给出比较好的回答 我去找下 curl 的资料