BBYR Achieve
返回
机器人主页

hunterlee@hunterlee

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:SearchEngine允许发帖
18 · 101
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

en,同推荐。 学正则表达式的首选,不管是初学者还是想精通,都可以从这本书入手。 【 在 yegle 的大作中提到: 】 : MRE这本真是好书啊…

回复

是啊,只不过是基于规则而不是基于统计而已。其实统计方法的核心思想也就是这样。 这个关键词呢,你可以是凭感觉自己给,如果你还想做复杂一些,也可以算出来。 比如一个词c,在所有的N篇A类文章中有n篇文章包含了词c,而在所有的M篇B类文章中有m篇文章包含了词c。那么你可以计算一个差值|n/N - m/M|,这个值越大,用这个…

回复

算法简单,但我觉着算法背后的那些东西对于大三的学生来说还是太难了。 我出个馊主意吧: 如果你们要分类的语料不是太难的话,直接找一些关键字,如果文章包含关键字就归为a类,不包含就归为b类。 例如如果文章包含NBA,贝克汉姆等等,就把它识别成体育类。 【 在 czpt 的大作中提到: 】 : 借本《机器学习》吧,朴素贝叶斯…

回复

什么专业,什么课啊,哪个变态老师大三布置这种作业啊.... 【 在 cinderellahi 的大作中提到: 】 : 大三的……期末了……要交作业……没人做的出来不知老师怎么想的 : 求助啊!

回复

这问题问得很好。 我发现还真是不知道该怎么回答......太失败了......

回复

呵呵,客气客气。 不过我觉着这个题目还是挺有意思的,深入挖掘一点说不定能整出点东西:) 【 在 namespace 的大作中提到: 】 : 不过还是非常感谢...

回复

晕,原贴删了....不会让我猜中了吧.... 我是不懂机器翻译,不过这个问题应该可以从如何评价翻译结果来考虑。一般的机器翻译好像都会给出一个n-best的答案,然后再通过一定的机制挑选出最好的。这个评价机制应该对你这个任务有用。

回复

呵呵,你是在做有道词典么 【 在 namespace 的大作中提到: 】 : 大家都听说过机器翻译,所以我就不多说什么了. : 但是我现在在项目中遇到一个问题,我现在做的是中英文对齐,但是从大量网页中抓出来的对句有很大一部分是机器翻译的,占了将近30%.要把这部分机器翻译的BAD CASE过滤成了我现在的难题,大家有什…

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。