返回信息流给一个英文文章,要把段落分成一个个句子。如何??给个思路。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #15189同步于 2015/2/2
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
句子分割
mj10211540
2015/2/2镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
似乎就是句号这些后面应该会有一个空格,然后下一个首字母大写。具体的情况想不全,应该可以边做边改判断条件。
【 在 mj10211540 的大作中提到: 】
: 句号,问号,叹号是切分符,但还有小数点,字母缩写带点的等等都要考虑吧。。
这个有现成工具的,用stanford的corenlp,就有切分成一句句的功能
【 在 mj10211540 的大作中提到: 】
: 给一个英文文章,要把段落分成一个个句子。如何??给个思路。