BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / mobile-terminal-at / #12903同步于 2014/3/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
MobileTerminalAT机器人发帖

为何内容总是处理的不干净

thomaszzc
2014/3/19镜像同步22 回复
比如下面的这段话 发信人: sunzxiang (sun), 信区: Job<br/>标&nbsp;&nbsp;题: 急问四级成绩单丢失怎么办<br/>发信站: 北邮人论坛 (Wed Mar 19 00:17:05 2014), 站内<br/><br/>只有学校成绩单的备注能说明我的四级分数了不知道管用不?另怎么就给几天考虑啊可以拖一个月是秋招的特权吗<br/><br/>来自<a target="_blank" href="http://m.byr.cn">「北邮人论坛手机版」</a><br/>--<br/><br/>※ 来源:·北邮人论坛 <a target="_blank" href="http://bbs.byr.cn">http://bbs.byr.cn</a>·[FROM: 180.153.201.*]<br/> 只想把其中的文字提取出来,为什么提取的就是不干净呢。。。
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
icyfox机器人#1 · 2014/3/19
这东西你得
icyfox机器人#2 · 2014/3/19
用java\C成熟的库就好了。。不需要自己做。。
thomaszzc机器人#3 · 2014/3/19
【 在 icyfox 的大作中提到: 】 : 用java\C成熟的库就好了。。不需要自己做。。 推荐一下吧,一开始使用HtmlParser没达到效果,使用正则表达式还是没达到效果,请问你都是怎么做的?
icyfox机器人#4 · 2014/3/19
我没处理过HTML。。。 【 在 thomaszzc (thomas的小火车) 的大作中提到: 】 : 推荐一下吧,一开始使用HtmlParser没达到效果,使用正则表达式还是没达到效果,请问你都是怎么做的?
thomaszzc机器人#5 · 2014/3/19
【 在 icyfox 的大作中提到: 】 : 我没处理过HTML。。。 : 你是怎么提取出每个用户的帖子信息的呢?不是对源文件进行处理吗?
icyfox机器人#6 · 2014/3/19
api.byr.cn 【 在 thomaszzc (thomas的小火车) 的大作中提到: 】 : 你是怎么提取出每个用户的帖子信息的呢?不是对源文件进行处理吗?
thomaszzc机器人#7 · 2014/3/19
【 在 icyfox 的大作中提到: 】 : api.byr.cn : 怎么还需要用户名和密码,这个用户名和密码是什么?是电脑的还是登陆论坛的?
icyfox机器人#8 · 2014/3/19
当然是论坛了 你还不能直接用 我就是说有这么个东西 【 在 thomaszzc (thomas的小火车) 的大作中提到: 】 : 怎么还需要用户名和密码,这个用户名和密码是什么?是电脑的还是登陆论坛的?
thomaszzc机器人#9 · 2014/3/19
【 在 icyfox 的大作中提到: 】 : 当然是论坛了 你还不能直接用 : 我就是说有这么个东西 : 开发者Key 有申请限制吗,需要找谁申请,也想做个客户端玩玩,求指导。。。