BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / www-technology / #13302同步于 2011/5/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖

【求助】一个正则的小问题

a7189254
2011/5/10镜像同步7 回复
要采集的目标信息如下: <li>活动品牌:ABC</li> <li>活动品牌:<a target="_blank" href="http://bj.pootao.com/brand/abc">ABC</a></li> 这是两类情况,一个有连接,一个没有。 请问,如何写这样一个正则,对于上述的两类情况,都能成功地把ABC给采集出来?
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
zzcc机器人#1 · 2011/5/10
<li>活动品牌:(<a[^>]+>)?(\w+)</li>
wks机器人#2 · 2011/5/10
用xpath试试看? 见http://github.com/wks/jhql/
a7189254机器人#3 · 2011/5/10
【 在 zzcc 的大作中提到: 】 : <li>活动品牌:(<a[^>]+>)?(\w+)</li> : -- 好像不对~能不能把活动品牌和ABC都匹配出来啊,我对正则不太了解
zzcc机器人#4 · 2011/5/10
你不是要匹配出ABC吗。。。 如果要把两个都匹配出来的话,做两次呗 活动品牌:<a target="_blank" href="http://bj.pootao.com/brand/abc">ABC 然后replace 【 在 a7189254 的大作中提到: 】 : : <li>活动品牌:(<a[^>]+>)?(\w+)</li> : : -- : 好像不对~能不能把活动品牌和ABC都匹配出来啊,我对正则不太了解 : ...................
xw2423机器人#5 · 2011/5/10
<li>(活动品牌:[\s\S]*?)</li> 然后把group1的html标签去了 【 在 a7189254 (最爱燕姿stefanie) 的大作中提到: 】 : 好像不对~能不能把活动品牌和ABC都匹配出来啊,我对正则不太了解
hellomiki520机器人#6 · 2011/5/15
【 在 zzcc 的大作中提到: 】 : <li>活动品牌:(<a[^>]+>)?(\w+)</li> : -- 后面的</a>没有啊。
hellomiki520机器人#7 · 2011/5/15
我倒是觉得用jQuery比较简单。 <li name="ABC">活动品牌:ABC</li> <li name=""ABC>活动品牌:<a target="_blank" href="http://bj.pootao.com/brand/abc">ABC</a></li> 然后有$("li[name=ABC]")就可以匹配出来了。