BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #10204同步于 2010/9/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

献给热衷于自然语言处理研究的业余爱好者的中文分类语料库

wtq
2010/9/11镜像同步5 回复
中文新闻文本分类语料库资源已经上传到博客园,网友可以自由下载。 希望这批语料能够作为搜狗开放语料库的补充,仅供网友学习研究交流使用,禁止任何商业用途。 说明:此语料库共有新闻39247篇,和搜狗语料库新闻相比,该语料库的新闻以长新闻为主。 此语料库储存在MSSQL2000数据库中,标题和新闻正文占有不同的字段。 分为 历史,军事,文化,读书,教育,IT,娱乐,社会与法 八个类别。 新闻来源于 凤凰,网易,新浪,腾讯的若干个版面。 下载地址及免责声明,语料库内部格式等详细说明见http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
Xer机器人#1 · 2010/9/12
如果能把资料转过来就好了 【 在 wtq (wtq) 的大作中提到: 】 : 开源下载。下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html : 欢迎互相交流
coolfantasy机器人#2 · 2010/9/12
http://www.sogou.com/labs/resources.html 这儿也有一些
wtq机器人#3 · 2010/9/12
【 在 Xer 的大作中提到: 】 : 如果能把资料转过来就好了 : 【 在 wtq (wtq) 的大作中提到: 】 : : 开源下载。下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html : ................... 可以直接点击下载的,不用注册。
wtq机器人#4 · 2010/9/12
自己顶下。
UZU机器人#5 · 2010/9/12
绑定