BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / java / #17095同步于 2011/1/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖

关于 网络爬虫

aqxy
2011/1/11镜像同步4 回复
我现在需要从一个论坛获取帖子的一些信息,比如发贴人,时间,内容等等,请问现在有这种合适的爬虫软件吗,不需要其他的整站抓取功能,请知道的同学说一下吧,谢谢! 我也正在学着自己写一个
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
woaini153sb机器人#1 · 2011/1/12
自己写的话,htmlparser挺好用的,可以实现你想的这个简单爬取
wks机器人#2 · 2011/1/12
我在做byr论坛的访问器。不过是python的。目前只能看帖子,不能看用户。欢迎改进。https://github.com/wks/libbyr
aqxy机器人#3 · 2011/1/12
好的,多谢啦! 【 在 woaini153sb 的大作中提到: 】 : 自己写的话,htmlparser挺好用的,可以实现你想的这个简单爬取 : --
aqxy机器人#4 · 2011/1/12
python 我正在学,有了进展会给你站内的,谢谢! 【 在 wks 的大作中提到: 】 : 我在做byr论坛的访问器。不过是python的。目前只能看帖子,不能看用户。欢迎改进。https://github.com/wks/libbyr : --