寻找用LibSVM做文本分类的同学，共同交流一下！！

zuohongyan

2010/8/2镜像同步14 回复

最近在用LibSVM，在此看一下有没有做过或者正在做这方面的同学，共同探讨一下！

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

gootyking机器人#1 · 2010/8/2

不会热情一顶【在 zuohongyan (北国飞燕) 的大作中提到: 】 : 最近在用LibSVM，在此看一下有没有做过或者正在做这方面的同学，共同探讨一下！

firefox机器人#2 · 2010/8/2

啥问题直接版上发帖讨论呗【在 zuohongyan (北国飞燕) 的大作中提到: 】 : 最近在用LibSVM，在此看一下有没有做过或者正在做这方面的同学，共同探讨一下！

zuohongyan机器人#3 · 2010/8/2

主要是有两方面的疑惑一;该方法是否能够推广到成千上万的样本？二：具体的训练参数，除了g和c之外，还有别的优化的地方吗？

cclive机器人#4 · 2010/8/2

没用过Libsvm，热情帮顶。。。

firefox机器人#5 · 2010/8/2

虽然我不是做文本分类的，但是LibSVM还算用过： 1. LibSVM作者说是可以用于largescale数据集的，而成千上万个样本不算多，LibSVM完全可以胜任； 2. 常用的需要调整的也就这俩了，还有一些其他的参数对训练影响不大，你可以参照下 LibSVM的论文。【在 zuohongyan (北国飞燕) 的大作中提到: 】 : 主要是有两方面的疑惑 : 一;该方法是否能够推广到成千上万的样本？ : 二：具体的训练参数，除了g和c之外，还有别的优化的地方吗？ : ...................

zuohongyan机器人#6 · 2010/8/2

对于多个类别的情况，可以构造多个二分类器，LibSVM完全实现了该功能，但是最后却只有一组g和c参数，以我的理解不应当是有几个分类器就有几组参数吗？

luoye机器人#7 · 2010/8/2

【在 zuohongyan 的大作中提到: 】 : 对于多个类别的情况，可以构造多个二分类器，LibSVM完全实现了该功能，但是最后却只有一组g和c参数，以我的理解不应当是有几个分类器就有几组参数吗？ : -- gamma应该是用一个，demo中的意思是设置一个C,然后根据样本的数量设置weight_C,样本数量越多weight_C越小，和类别样本的数量成反比。

zuohongyan机器人#8 · 2010/8/3

对于weight_C是调解样本数量的不均衡性的，我可以这样理解你的意思吗？gamma参数用一个，对于每一组分类器的参数C是按看待分类的两个类别的数量的大小的！理解不足之处，还请指点一下！！谢谢！

luoye机器人#9 · 2010/8/3

【在 zuohongyan 的大作中提到: 】 : 对于weight_C是调解样本数量的不均衡性的，我可以这样理解你的意思吗？gamma参数用一个，对于每一组分类器的参数C是按看待分类的两个类别的数量的大小的！ : 理解不足之处，还请指点一下！！谢谢！ : -- : ................... 我也就是大致看看了demo没有细节去理解，“对于weight_C是调解样本数量的不均衡性的”可以这样理解，这个可能是随着样本的差异增大，如果使用相同的C可能会产生类别漂移，也就是分类的时候比较倾向那个样本较多的类别。你在做实验的时候如果想倾向某个类别，你可以把它的C增大，也就是说它错一个惩罚更大，这样分类面离这个类别远一点，最后的分类肯定是偏向于这个类别，具体看demo比较好。我看demo中的gamma就是用一个相同的。