BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #2412同步于 2014/8/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

有没有人用NLP with python这本书的?一些小问题

ginues109
2014/8/1镜像同步6 回复
rt 有人用这本书自学吗?
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
ginues109机器人#1 · 2014/8/1
【 在 ginues109 的大作中提到: 】 : rt : 有人用这本书自学吗? 遇到一个比较恶心的事 书中开始的部分提到词频统计FreqDist的时候,大概这么说的: 而我运行的时候的结果却是这样的:
ginues109机器人#2 · 2014/8/1
观察了一下,发现我这个fdist.keys()似乎并不带sorting功能,于是vocabulary1[:50]出来的结果成了词频最低的50个词……有人碰到过这个问题吗
b78859793机器人#3 · 2014/8/1
自己排序一下不就好了 字典有sort方法的
wai7niu8机器人#4 · 2014/8/2
楼主强悍,本渣中文版看得都费劲~
ginues109机器人#5 · 2014/8/2
自己用sorted()方法一样得不到图示的答案。 不过我找到原因了。。 看最新版的书好像这里有改动, nltk官网http://www.nltk.org/book/ch01.html 这本书这里的代码 >>> [len(w) for w in text1] [1] [1, 4, 4, 2, 6, 8, 4, 1, 9, 1, 1, 8, 2, 1, 4, 11, 5, 2, 1, 7, 6, 1, 3, 4, 5, 2, ...] >>> fdist = FreqDist(len(w) for w in text1) [2] >>> fdist [3] <FreqDist with 19 samples and 260819 outcomes> >>> fdist.most_common() [(3, 50223), (1, 47933), (4, 42345), (2, 38513), (5, 26597), (6, 17111), (7, 14399), (8, 9966), (9, 6428), (10, 3528), (11, 1873), (12, 1053), (13, 567), (14, 177), (15, 70), (16, 22), (17, 12), (18, 1), (20, 1)] >>> fdist.max() 3 >>> fdist[3] 50223 >>> fdist.freq(3) 0.19255882431878046 >>> 发现keys()方法变成了most_common()方法 下面的索引也没再写keys方法了。。 【 在 b78859793 的大作中提到: 】 : 自己排序一下不就好了 : 字典有sort方法的
ginues109机器人#6 · 2014/8/2
……翻译说实话挺烂…… 不过现在有点原因需要速成,现在中英文结合看 【 在 wai7niu8 的大作中提到: 】 : 楼主强悍,本渣中文版看得都费劲~