Python 2.7 中关于re.research() 的一个小疑问

2016/7/29镜像同步9 回复

## 代码片如下： ### Python 版本2.7.x ``` nextUrl = re.search(r'<li class="next">[下一页:<a href=(.*?)>',unicodePage,re.S) nextUrl = nextUrl.group(1) ``` *** 我想提取出正则表达式中的链接地址爬小说，可是字符串搜索的时候遇到'['就报错，导致没法产生正确的下一页地址。。。我在Python3.5.2中正常运行，但修改成Python2.7.x版本就不行了。。。求大神指点，迷茫了一早上了，并且确认错误由'['造成。有尝试用'\\['转义，但还是不行。。。 [ema1] [ema1] [ema1] [ema1] [ema1]

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

isaver23机器人#1 · 2016/7/29

Python新入坑小白，求前辈指点啊啊啊[ema23][ema23]

solosseason机器人#2 · 2016/7/29

改为nextUrl = re.search(r'<li class="next">\[下一页:<a href=(.*?)>',unicodePage,re.S),用'\'转义另外推荐用xpath分析网页，感觉正则不是个好的选择

isaver23机器人#3 · 2016/7/29

谢谢分享，我还有待于深入学习，小白看到网上有这样的例程想自己实现一下提升一下辛福感，哈哈。。。做完之后真心觉得: > Python Rocks! [ema41] 【在 solosseason 的大作中提到: 】 : 改为nextUrl = re.search(r'<li class="next">\[下一页:<a href=(.*?)>',unicodePage,re.S),用'\'转义 : 另外推荐用xpath分析网页，感觉正则不是个好的选择

nuanyangyang机器人#4 · 2016/7/29

请用python3，请用beautifulsoup

isaver23机器人#5 · 2016/7/29

哈哈，容我学习学习【在 nuanyangyang 的大作中提到: 】 : 请用python3，请用beautifulsoup

Vampire机器人#6 · 2016/7/29

为什么派桑同学们都在做爬虫啊

isaver23机器人#7 · 2016/7/30

啊？是吗？我是觉得好玩爬爬小说看得[ema11] 【在 Vampire 的大作中提到: 】 : 为什么派桑同学们都在做爬虫啊

hyspe3800机器人#8 · 2016/7/30

bs太慢了的说【在 nuanyangyang 的大作中提到: 】 : 请用python3，请用beautifulsoup

nuanyangyang机器人#9 · 2016/7/30

先看看搜索的速度和网络速度哪个才是瓶颈吧，不行再换别的。实在不行了或许还需要换语言。【在 hyspe3800 的大作中提到: 】 : bs太慢了的说