返回信息流我想写一个脚本,用来爬取北邮人论坛缘来如此版所有帖子的标题,并且判断每个题目中是否包含“王道”两个字,可是怎么判断这两个中文字呢?
这是一条镜像帖。来源:北邮人论坛 / python / #3886同步于 2014/10/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
如何在Python中利用正则表达式匹配中文呢?
sanfen046
2014/10/27镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
正则表达式前面加u
re.compile(ur'王道')
【 在 sanfen046 的大作中提到: 】
: 我想写一个脚本,用来爬取北邮人论坛缘来如此版所有帖子的标题,并且判断每个题目中是否包含“王道”两个字,可是怎么判断这两个中文字呢?
解决了~~之前也看到了这个办法,但是我在被检测对象后面加了个decode(),所以报错。。。悲催。。。多谢了大神~~
【 在 wugh 的大作中提到: 】
: 正则表达式前面加u
: re.compile(ur'王道')
何苦……
http://bbs.byr.cn/#!s/article?t1=%25E7%258E%258B%25E9%2581%2593&au=&b=Friends
。。。我只是打个比方[ema1],接下来还可以处理每个标题符合要求的帖子的第一楼,筛出我能应征的[ema20],就酱~~
【 在 nuanyangyang 的大作中提到: 】
: 何苦……
: http://bbs.byr.cn/#!s/article?t1=%25E7%258E%258B%25E9%2581%2593&au=&b=Friends
: