返回信息流中文新闻文本分类语料库资源已经上传到博客园,网友可以自由下载。
希望这批语料能够作为搜狗开放语料库的补充,仅供网友学习研究交流使用,禁止任何商业用途。
说明:此语料库共有新闻39247篇,和搜狗语料库新闻相比,该语料库的新闻以长新闻为主。
此语料库储存在MSSQL2000数据库中,标题和新闻正文占有不同的字段。
分为 历史,军事,文化,读书,教育,IT,娱乐,社会与法 八个类别。
新闻来源于 凤凰,网易,新浪,腾讯的若干个版面。
下载地址及免责声明,语料库内部格式等详细说明见http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html
这是一条镜像帖。来源:北邮人论坛 / search-engine / #10204同步于 2010/9/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖
献给热衷于自然语言处理研究的业余爱好者的中文分类语料库
wtq
2010/9/11镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
如果能把资料转过来就好了
【 在 wtq (wtq) 的大作中提到: 】
: 开源下载。下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html
: 欢迎互相交流
【 在 Xer 的大作中提到: 】
: 如果能把资料转过来就好了
: 【 在 wtq (wtq) 的大作中提到: 】
: : 开源下载。下载地址见:http://www.cnblogs.com/finallyliuyu/archive/2010/09/11/1824091.html
: ...................
可以直接点击下载的,不用注册。