返回信息流```Python
import re
content = """<div class="hd">
<a href="https://movie.douban.com/subject/1292052/">
<span class="title"> / The Shawshank Redemption</span>
</a>
<span class="playable">qqqqq</span>
</div>
"""
all = re.findall(r'<div class="hd"><a href="(.*?)"><span .*?>.*?</span></a><span .*?></span></div>',content, re.S)
print all
```
上面的代码为什么不能得到url?
这是一条镜像帖。来源:北邮人论坛 / python / #14917同步于 2016/7/13
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
[爬虫问题]爬虫中关于正则表达式的问题????小白求指导
Mohn
2016/7/13镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
妈呀,爬虫都这样写要累死人
from scrapy import Selector
content = """<div class="hd">
<a href="https://movie.douban.com/subject/1292052/">
<span class="title"> / The Shawshank Redemption</span>
</a>
<span class="playable">qqqqq</span>
</div>
"""
response = Selector(text=content)
response.xpath("//div[@class='hd']//@href").extract_first()
【 在 Mohn 的大作中提到: 】
: ```Python
: import re
: content = """<div class="hd">
: ...................
请用beautifulsoup,不要用正则表达式分析html。