hunterlee@hunterlee
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“恩,好像是有这么一小撮人在干这个。也不知道干得怎么样。”
“为什么要去大礼堂看??? 【 在 cryppie 的大作中提到: 】 : xb是什么? : 我有明天晚上二校门大礼堂的票,嘿嘿。 : 明晚去那里看去。”
“这么著名的网络用语都不认识啊.... 你们明天放假吗? 【 在 cryppie 的大作中提到: 】 : 脑子转不过来了,一堆缩写。。。”
“时间太巧了...... 发信人: hunterlee (智障大师), 信区: PR_AI 标 题: Re: 有谁做bag of words吗? 发信站: 北邮人论坛 (Thu Jul 31 21:23:34 2008), 站内 发信人: zixu1986 (Euro), 信区: PR_AI 标 题: Re: 有谁做ba…”
“en,你说的有道理。 当词语增多了,那么只有了解到词语或句子间的顺序才能够真正的了解文本的含义,所以大部分语义级别的自然语言处理的任务还是基于n-gram模型的。 但是,还有一部分任务并不需要文本的准确含义,而只需要知道文本的topic,这个时候用VSM模型就比较适用了,因为一组有意义的词的聚合就能够表达一个概念(比如…”
“NLP中的语言模型例如n-gram是考虑词语间顺序的,是NLP中的生成模型,bag of words则更像是判决模型。也有很多人试图将顺序这个特性加到VSM模型中,但是似乎这些方法的性能都没有质上的飞跃。 至于原因,我个人认为语言中的意义可能更多的是包含在words中而不是在顺序中,例如“今天我吃了饭”和“吃了饭我今天…”
“老板真有品味.... 【 在 cryppie 的大作中提到: 】 : "篆刻,有两大好处,一是自得其乐;二是由'技'及'道',得大快乐" : boss写的《篆刻通论》书中的几句话,小boss也说:“中国的老师太为世俗名利困惑。”得大快乐即可。”
“谁有第一本书的电子版啊??”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。