BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #7257同步于 2010/8/28
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

做文本分类,怎么获取语料库(样本库),尤其是做网页分类?

zuohongyan
2010/8/28镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
allen0308机器人#1 · 2010/8/28
自己crawl不就得了
ai0806机器人#2 · 2010/8/29
有一些标准语料,比如sougou的语料
zuohongyan机器人#3 · 2010/8/30
【 在 ai0806 的大作中提到: 】 : 有一些标准语料,比如sougou的语料 : -- 是的。但是一般语料库都是一些文章或者新闻之类的,和网页还是有却别的 现在遇到的难题是需要德语或者阿拉伯语,这种非中文的语料库;
mousie机器人#4 · 2010/8/31
LZ怎么专攻德语。。 找些德文网站自己抓吧 【 在 zuohongyan 的大作中提到: 】 : 是的。但是一般语料库都是一些文章或者新闻之类的,和网页还是有却别的 : 现在遇到的难题是需要德语或者阿拉伯语,这种非中文的语料库;