wugh@wugh
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“十大走起”
“BD”
“太好了,视频精彩”
“准确率低是不是你的分类方法选择问题呢? 还有可能是特征选取的问题 测试什么的没用过呢。得自己去看官方文档 【 在 mengqi 的大作中提到: 】 : arff文件已经生成了,只是分类的准确率比别人的低点,我想是不是数据预处理的问题啊;还有我想用生成的分类模型去检测未知的数据,测试方法是选择supplied test …”
“恩,这个人做的就是那个中科院分词,准确率、切分速度都比较牛逼 当然切分还有其他一堆工具 jieba ansj_seg 哈工大ltp工具包 stanford分词工具 fudannlp 等等 【 在 huloohuloo 的大作中提到: 】 : 我之前在网上找到过北京理工大学张华平博士的分词软件,切分结果为:是/v 不/d…”
“得把你的数据整理成weka的数据格式少年 http://weka.wikispaces.com/ARFF+%28stable+version%29 然后训练数据的话,我上次找个一个ppt,你参考一下 http://www.unal.edu.co/diracad/einternacional/Weka.pdf 【 在 m…”
“自己写意义不大,除非你是想学习一下分词的算法。 并且如果你有特殊切词要求,分词程序一般提供用户自定义词表的功能。 【 在 huloohuloo 的大作中提到: 】 : 我自己也可以写写一个切分软件的”
“找个分词软件切一下就知道了呗, 【 在 huloohuloo 的大作中提到: 】 : 有同学研究过中文分词的语法规范吗? : 我请教个问题,"是不是"这个词还需要切分吗? : 如果需要切分,那么是遵从什么规则进行切分的? : ...................”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。