返回信息流之前没搞过自然语言理解,现在有这么个需求,比如给一段话分析一下这句话是不是有意义,是不是机器生成的,这个有什么思路,难度怎么样?另一个给出几段话,提取出主题,怎么做?
求高手指导,另北京有哪些实验室在做这方面的工作,谢谢。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #12311同步于 2013/12/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
文本内容分析
bitcindy
2013/12/27镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
第一个问题有paper研究,没有成型survey。
第二个问题参见automatic summarization,有tool,有各种paper和survey。
两个问题要做出突破难度都较大。
北大清华中科院都有很多这种实验室啊,北邮好像也有了吧现在。
【 在 bitcindy 的大作中提到: 】
: 之前没搞过自然语言理解,现在有这么个需求,比如给一段话分析一下这句话是不是有意义,是不是机器生成的,这个有什么思路,难度怎么样?另一个给出几段话,提取出主题,怎么做?
: 求高手指导,另北京有哪些实验室在做这方面的工作,谢谢。
Latent Dirichlet Allocation(LDA)。。。给定一堆文档,根据关键词,得到主题信息。。。
机器生成不清楚有没有类似的。。。似乎没有类似的机器生成的语聊数据库呢?
实验室北京到处都有,北邮应该就有
曾经老师给我们讲过把这个用到系统和网络入侵检测上的论文。。。
【 在 kissyou 的大作中提到: 】
: 基于LDA的Topic Model应该可以。
谢谢,我去调研一下,如果想做出实用性的挺难?
【 在 AmelieLee 的大作中提到: 】
: 第一个问题有paper研究,没有成型survey。
: 第二个问题参见automatic summarization,有tool,有各种paper和survey。
: 两个问题要做出突破难度都较大。
: ...................
第二个问题有工具的,找个好点的可以直接用了。
第一个研究阶段效果离实用还远。
【 在 bitcindy 的大作中提到: 】
: 谢谢,我去调研一下,如果想做出实用性的挺难?