返回信息流比如下面的这段话
发信人: sunzxiang (sun), 信区: Job<br/>标 题: 急问四级成绩单丢失怎么办<br/>发信站: 北邮人论坛 (Wed Mar 19 00:17:05 2014), 站内<br/><br/>只有学校成绩单的备注能说明我的四级分数了不知道管用不?另怎么就给几天考虑啊可以拖一个月是秋招的特权吗<br/><br/>来自<a target="_blank" href="http://m.byr.cn">「北邮人论坛手机版」</a><br/>--<br/><br/>※ 来源:·北邮人论坛 <a target="_blank" href="http://bbs.byr.cn">http://bbs.byr.cn</a>·[FROM: 180.153.201.*]<br/>
只想把其中的文字提取出来,为什么提取的就是不干净呢。。。
这是一条镜像帖。来源:北邮人论坛 / mobile-terminal-at / #12903同步于 2014/3/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
MobileTerminalAT机器人发帖
为何内容总是处理的不干净
thomaszzc
2014/3/19镜像同步22 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
【 在 icyfox 的大作中提到: 】
: 用java\C成熟的库就好了。。不需要自己做。。
推荐一下吧,一开始使用HtmlParser没达到效果,使用正则表达式还是没达到效果,请问你都是怎么做的?
我没处理过HTML。。。
【 在 thomaszzc (thomas的小火车) 的大作中提到: 】
: 推荐一下吧,一开始使用HtmlParser没达到效果,使用正则表达式还是没达到效果,请问你都是怎么做的?
api.byr.cn
【 在 thomaszzc (thomas的小火车) 的大作中提到: 】
: 你是怎么提取出每个用户的帖子信息的呢?不是对源文件进行处理吗?
当然是论坛了 你还不能直接用
我就是说有这么个东西
【 在 thomaszzc (thomas的小火车) 的大作中提到: 】
: 怎么还需要用户名和密码,这个用户名和密码是什么?是电脑的还是登陆论坛的?
【 在 icyfox 的大作中提到: 】
: 当然是论坛了 你还不能直接用
: 我就是说有这么个东西
:
开发者Key 有申请限制吗,需要找谁申请,也想做个客户端玩玩,求指导。。。