jingang1016@jingang1016
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“类别体系应该是没有问题的,采用KNN算法能获得70%左右的准确率 ,svm算法交叉验证中最好结果是67%,但是在开放测试中结果很差; 同时,问下,scaling时候是逐个特征值的线性映射对吧?”
“websphenix怎么样?有人用过吗”
“哦,这样。有点明白了。。。。。。 【 在 zixu1986 的大作中提到: 】 : 嗯 就是这样 : 所谓grid search”
“恩,谢谢了。 看了这段代码,我感觉它没怎么调整参数的啊,难道需要我对参数每个值做一次交叉验证,然后选结果最好的那个参数? 【 在 zixu1986 的大作中提到: 】 : 看它的那个svm-train.c文件 : 里面有个do_cross_validation函数 : 看着那个实现 基本上就清楚了”
“恩,倒是一个方法。不过这样的话工作量挺大,而且效果感觉不会太好,呵呵 【 在 hunterlee 的大作中提到: 】 : 咳,咳... : 其实我的意思就是用规则的方法去匹配,一般来说特定领域的文章结构会大致相同,找到那些描述地震时间的句子也许能发现一些规律,然后总结出规则就行了。只要你做得细,效果不会太差。 : 土办…”
“对,就是特定领域,并且我已经对文档进行了分类,使一类文档有相同的模式,然后对每一类文档进行信息提取。 但是你说的模板匹配是什么技术?能详细指教下吗? 【 在 hunterlee 的大作中提到: 】 : 我觉得如果是特定的领域的话,用一些模板匹配的方法应该也会有不错的效果。虽然方法土了点...”
“应该是吧,但是感觉也未必一定要用语义分析的技术,也许有其它方法? 【 在 hunterlee 的大作中提到: 】 : 这算语义分析了吧??”
“有人能指教一下吗?thx”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。