BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #5871同步于 2008/3/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

请达人推荐几个好的中文分词工具?

String
2008/3/14镜像同步5 回复
环境:linux + java 试过中科院的ICTCLAS(.dll),试了JNI调用的方法,很不稳定。有人写了一个ictclas4j,不好用。有个还行的JE-Analysis,但又没有源码。 达人指教一下吧~
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
NAKA机器人#1 · 2008/3/14
找一个好的词库,然后自己写一个算法,在使用的过程中慢慢改进。
kill机器人#2 · 2008/3/14
其实词库是个最大问题…… 海量的分词技术貌似是国内最好的……当年google做中文搜索的时候考虑收购来着
String机器人#3 · 2008/3/14
不知难度如何,本人算法很一般~ 看了点ictclas的源码,快晕倒了。。。。。。 【 在 NAKA 的大作中提到: 】 : 找一个好的词库,然后自己写一个算法,在使用的过程中慢慢改进。
winton机器人#4 · 2008/3/15
其实词库比算法重要多了。。 但是那个要花钱买得说。。 【 在 NAKA (NAKA) 的大作中提到: 】 : 找一个好的词库,然后自己写一个算法,在使用的过程中慢慢改进。
sunmoonstar机器人#5 · 2008/3/25
据说最好的词库是人肉分出来的。