BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #15192同步于 2016/7/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

Python 2.7 中关于re.research() 的一个小疑问

isaver23
2016/7/29镜像同步9 回复
## 代码片如下: ### Python 版本2.7.x ``` nextUrl = re.search(r'<li class="next">[下一页:<a href=(.*?)>',unicodePage,re.S) nextUrl = nextUrl.group(1) ``` *** 我想提取出正则表达式中的链接地址爬小说,可是字符串搜索的时候遇到'['就报错,导致没法产生正确的下一页地址。。。我在Python3.5.2中正常运行,但修改成Python2.7.x版本就不行了。。。求大神指点,迷茫了一早上了,并且确认错误由'['造成。有尝试用'\\['转义,但还是不行。。。 [ema1] [ema1] [ema1] [ema1] [ema1]
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
isaver23机器人#1 · 2016/7/29
Python新入坑小白,求前辈指点啊啊啊[ema23][ema23]
solosseason机器人#2 · 2016/7/29
改为nextUrl = re.search(r'<li class="next">\[下一页:<a href=(.*?)>',unicodePage,re.S),用'\'转义 另外推荐用xpath分析网页,感觉正则不是个好的选择
isaver23机器人#3 · 2016/7/29
谢谢分享,我还有待于深入学习,小白看到网上有这样的例程想自己实现一下提升一下辛福感,哈哈。。。做完之后真心觉得: > Python Rocks! [ema41] 【 在 solosseason 的大作中提到: 】 : 改为nextUrl = re.search(r'<li class="next">\[下一页:<a href=(.*?)>',unicodePage,re.S),用'\'转义 : 另外推荐用xpath分析网页,感觉正则不是个好的选择
nuanyangyang机器人#4 · 2016/7/29
请用python3,请用beautifulsoup
isaver23机器人#5 · 2016/7/29
哈哈,容我学习学习 【 在 nuanyangyang 的大作中提到: 】 : 请用python3,请用beautifulsoup
Vampire机器人#6 · 2016/7/29
为什么派桑同学们都在做爬虫啊
isaver23机器人#7 · 2016/7/30
啊?是吗?我是觉得好玩爬爬小说看得[ema11] 【 在 Vampire 的大作中提到: 】 : 为什么派桑同学们都在做爬虫啊
hyspe3800机器人#8 · 2016/7/30
bs太慢了的说 【 在 nuanyangyang 的大作中提到: 】 : 请用python3,请用beautifulsoup
nuanyangyang机器人#9 · 2016/7/30
先看看搜索的速度和网络速度哪个才是瓶颈吧,不行再换别的。实在不行了或许还需要换语言。 【 在 hyspe3800 的大作中提到: 】 : bs太慢了的说