返回信息流rt
有人用这本书自学吗?
这是一条镜像帖。来源:北邮人论坛 / python / #2412同步于 2014/8/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
有没有人用NLP with python这本书的?一些小问题
ginues109
2014/8/1镜像同步6 回复
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
【 在 ginues109 的大作中提到: 】
: rt
: 有人用这本书自学吗?
遇到一个比较恶心的事
书中开始的部分提到词频统计FreqDist的时候,大概这么说的:
而我运行的时候的结果却是这样的:
观察了一下,发现我这个fdist.keys()似乎并不带sorting功能,于是vocabulary1[:50]出来的结果成了词频最低的50个词……有人碰到过这个问题吗
自己用sorted()方法一样得不到图示的答案。
不过我找到原因了。。
看最新版的书好像这里有改动,
nltk官网http://www.nltk.org/book/ch01.html
这本书这里的代码
>>> [len(w) for w in text1] [1]
[1, 4, 4, 2, 6, 8, 4, 1, 9, 1, 1, 8, 2, 1, 4, 11, 5, 2, 1, 7, 6, 1, 3, 4, 5, 2, ...]
>>> fdist = FreqDist(len(w) for w in text1) [2]
>>> fdist [3]
<FreqDist with 19 samples and 260819 outcomes>
>>> fdist.most_common()
[(3, 50223), (1, 47933), (4, 42345), (2, 38513), (5, 26597), (6, 17111), (7, 14399),
(8, 9966), (9, 6428), (10, 3528), (11, 1873), (12, 1053), (13, 567), (14, 177),
(15, 70), (16, 22), (17, 12), (18, 1), (20, 1)]
>>> fdist.max()
3
>>> fdist[3]
50223
>>> fdist.freq(3)
0.19255882431878046
>>>
发现keys()方法变成了most_common()方法
下面的索引也没再写keys方法了。。
【 在 b78859793 的大作中提到: 】
: 自己排序一下不就好了
: 字典有sort方法的
……翻译说实话挺烂……
不过现在有点原因需要速成,现在中英文结合看
【 在 wai7niu8 的大作中提到: 】
: 楼主强悍,本渣中文版看得都费劲~