返回信息流## 代码片如下:
### Python 版本2.7.x
```
nextUrl = re.search(r'<li class="next">[下一页:<a href=(.*?)>',unicodePage,re.S)
nextUrl = nextUrl.group(1)
```
***
我想提取出正则表达式中的链接地址爬小说,可是字符串搜索的时候遇到'['就报错,导致没法产生正确的下一页地址。。。我在Python3.5.2中正常运行,但修改成Python2.7.x版本就不行了。。。求大神指点,迷茫了一早上了,并且确认错误由'['造成。有尝试用'\\['转义,但还是不行。。。
[ema1] [ema1] [ema1] [ema1] [ema1]
这是一条镜像帖。来源:北邮人论坛 / python / #15192同步于 2016/7/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
Python 2.7 中关于re.research() 的一个小疑问
isaver23
2016/7/29镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
改为nextUrl = re.search(r'<li class="next">\[下一页:<a href=(.*?)>',unicodePage,re.S),用'\'转义
另外推荐用xpath分析网页,感觉正则不是个好的选择
谢谢分享,我还有待于深入学习,小白看到网上有这样的例程想自己实现一下提升一下辛福感,哈哈。。。做完之后真心觉得:
> Python Rocks!
[ema41]
【 在 solosseason 的大作中提到: 】
: 改为nextUrl = re.search(r'<li class="next">\[下一页:<a href=(.*?)>',unicodePage,re.S),用'\'转义
: 另外推荐用xpath分析网页,感觉正则不是个好的选择
先看看搜索的速度和网络速度哪个才是瓶颈吧,不行再换别的。实在不行了或许还需要换语言。
【 在 hyspe3800 的大作中提到: 】
: bs太慢了的说