返回信息流最近做NLP作业,提取词袋,我已经用了isalpha()方法把包含非英文字母的词全部去掉了,但是里面还是有很多非词明显不是英文单词(如:aaaaaaaaa、zzzzzzzzzzzl这种)
我想问一下python中怎么判断这个单词是不是英文单词(也就是英文词典中的单词),有没有什么好用的库吗?
这是一条镜像帖。来源:北邮人论坛 / python / #14110同步于 2016/5/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
【python 判断英文单词!!!】
cocoray
2016/5/16镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
我不需要太全面,就是常用词即可,至少把明显不是英文单词的给滤掉把
【 在 nuanyangyang 的大作中提到: 】
: 首先你要有个辞典。
: 其次,英语每年都有几百个(如果不是几千个)新词。
【 在 binux 的大作中提到: 】
: 你都在做 NLP 作业了,你来问一个编程语言怎么判断自然语言的单词?
: 你上课是怎么听的?
赞。
在windows下有什么方法吗?
【 在 zbl807484514 的大作中提到: 】
: linux不是有个 /usr/share/dict/words
: 发自「贵邮」