返回信息流毕设题目就是做个lucene的中文分词。。。。
一头雾水啊
首先从官网下载了lucene-3.5.0.zip
还下载了一个叫“庖丁解牛”的分词工具
本机已经安装了jdk1.7与eclipse,并且小程序编出来已经可以运行了
然后他奶奶的到底应该做啥呀[ema12]
是要编程么?具体的步骤是啥呀!!!
附上这两个zip包解压后里面的截图希望各位牛人指点一下我究竟要做些什么
本人很菜。。。大学四年。。。各位都懂的。。。
鄙人膂力过人~日后搬家送水打架斗殴当保镖必定万死不辞[ema35]
各位牛人尽管放心帮我吧~~
这是一条镜像帖。来源:北邮人论坛 / java / #21844同步于 2012/3/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖
新手求问有关lucene中文分词
qqqleo
2012/3/25镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
可以看看lucene的解析器。
记得最简单的一个解析器是利用空格来分词的 --这个是英文分析。
还有个简单的解析器,可以把中文分析成一个个的字。
你可以继承上面的任意一个,写自己的分词程序。
N年前做过,现在记得不是特别清楚了
【 在 qqqleo 的大作中提到: 】
: 对的,是个分词组建,下了个paodin看一下是怎么做的
庖丁必须和luncene一起用么?我不知道。。。没用过,AKAnalyzer倒是可以去掉那些依赖luncene的东西自己用。