BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #12701同步于 2014/3/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

[问题]有人使过java平台下NLPIR的中文分词么?

t01
2014/3/25镜像同步16 回复
rt,毕设中要用到分词,直接运行目录下java平台的sample一直提示的初始化失败,不知道是哪儿的问题
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
ymbupt机器人#1 · 2014/3/25
是最新版的吗?
phantomlyc机器人#2 · 2014/3/25
用过。。。
vampire24机器人#3 · 2014/3/28
楼主要做中文情感词分析不?
kissyou机器人#4 · 2014/3/29
一直用ICTCLAS 发自「贵邮」
vampire24机器人#5 · 2014/3/30
用过IKANALYZER
hainanlxs机器人#6 · 2014/3/30
nlpir好像就是ictclas中科院分词系统对吧。胡乱贴点代码,以前写的,包是现成的,调用的方法也是网上查来的,他们提供官方的文档的。lz将就看吧。有不明白的欢迎站内交流。。。。 import java.io.*; import org.dom4j.DocumentException; import org.ictclas4j.bean.SegResult; import org.ictclas4j.segment.SegTag; public class Segmentation { private static final String fileName = new Parameter().fileName(); private static final String directory = new Parameter().directory(); public void seg(String inputFilePath, String outputFilePath) throws IOException, DocumentException{ File f = new File(outputFilePath);// FileWriter fw = new FileWriter(f); BufferedWriter bw = new BufferedWriter(fw); File fr = new File (inputFilePath); FileReader fre = new FileReader(fr); BufferedReader br = new BufferedReader(fre); String s; while((s=br.readLine())!=null){ SegTag segTag = new SegTag(1);// 分词 SegResult segResult = segTag.split(s.trim()); String b = segResult.getFinalResult(); //System.out.println(b); bw.write(b+"\r\n"); } br.close(); bw.close(); } public static void main(String s[]) throws IOException, DocumentException{ String inputFilePath = directory+fileName+"Abstract.txt"; String outputFilePath = directory+fileName+"Split.txt"; new Segmentation().seg(inputFilePath, outputFilePath); } } 【 在 t01 的大作中提到: 】 : rt,毕设中要用到分词,直接运行目录下java平台的sample一直提示的初始化失败,不知道是哪儿的问题
t01机器人#7 · 2014/4/16
恩 【 在 ymbupt 的大作中提到: 】 : 是最新版的吗?
t01机器人#8 · 2014/4/16
哦,不过我后来找到问题了,就是路径不对。 请问一下,你一般用都是用java语言处理的么? 【 在 phantomlyc 的大作中提到: 】 : 用过。。。
t01机器人#9 · 2014/4/16
不用,不过分词后续还有要处理 【 在 vampire24 的大作中提到: 】 : 楼主要做中文情感词分析不?