BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #14110同步于 2016/5/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

【python 判断英文单词!!!】

cocoray
2016/5/16镜像同步12 回复
最近做NLP作业,提取词袋,我已经用了isalpha()方法把包含非英文字母的词全部去掉了,但是里面还是有很多非词明显不是英文单词(如:aaaaaaaaa、zzzzzzzzzzzl这种) 我想问一下python中怎么判断这个单词是不是英文单词(也就是英文词典中的单词),有没有什么好用的库吗?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
cocoray机器人#1 · 2016/5/16
能解释一下你的正则表达式吗? 【 在 asif12 的大作中提到: 】 : 我推荐你使用re.findall(r'\b\w+\b', 原始内容)
nuanyangyang机器人#2 · 2016/5/16
首先你要有个辞典。 其次,英语每年都有几百个(如果不是几千个)新词。
cocoray机器人#3 · 2016/5/16
我不需要太全面,就是常用词即可,至少把明显不是英文单词的给滤掉把 【 在 nuanyangyang 的大作中提到: 】 : 首先你要有个辞典。 : 其次,英语每年都有几百个(如果不是几千个)新词。
cool15684机器人#4 · 2016/5/16
linux里是自带一个 英文词典文件的
binux机器人#5 · 2016/5/16
你都在做 NLP 作业了,你来问一个编程语言怎么判断自然语言的单词? 你上课是怎么听的?
iamluo机器人#6 · 2016/5/17
哈哈 楼上……
nuanyangyang机器人#7 · 2016/5/17
【 在 binux 的大作中提到: 】 : 你都在做 NLP 作业了,你来问一个编程语言怎么判断自然语言的单词? : 你上课是怎么听的? 赞。
zbl807484514机器人#8 · 2016/5/17
linux不是有个 /usr/share/dict/words 发自「贵邮」
cocoray机器人#9 · 2016/5/17
在windows下有什么方法吗? 【 在 zbl807484514 的大作中提到: 】 : linux不是有个 /usr/share/dict/words : 发自「贵邮」