nalanding@nalanding
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“正解 【 在 moonfighting (【意涵团】 ) 的大作中提到: 】 : patt = re.compile('.*<span>\[(.*)\]</span>.*') 通过『我邮2.0』发布”
“是日期 re.compile('\[\d(4)-\d*-\d*\]) 【 在 KillerDeath (KillerDeath) 的大作中提到: 】 : 是取<span>下的日期?re.compile(<span>(\d{4}\-\d{2}\-\d{2})<\/span>),正则拿到后去除“-“?,不懂帮顶 通过『我邮…”
“是滴。。。你也在做? 【 在 chinapds (星宇|BUPTGuo) 的大作中提到: 】 : 哈哈,中科院 通过『我邮2.0』发布”
“下面是我自己写的一个,并不能得出什么结果 pattern = re.compile('<li tag="show_26".*?<span>[(.*?)]</span>', re.S) items = re.findall(pattern,content) print 'items的长度:',len(items)”
“发图不成功,就贴在下面吧 <li tag="show_26" style="display:none;"><a href="/Price/List?marketID=270&year=2011&month=9&day=28" target="_blank"><span>[2011-9-28]</span>价格行情</a…”
“小白说一句,我想能否借鉴一下hadoop下kmeans的思想,kmeans中,会将聚类中心放到一个文件中,每次聚类后得到新的聚类中心,会和原来的聚类中心对比,直到达到收敛条件或迭代次数。题主是否也可以将url放入一个文件中呢,每次解析完一个url后,更新这个文件。。。(巴拉巴拉),不知道我说明白了没有 通过『我邮2.0…”
“应该是从网上爬数据的需求很大吧,不过我看到很多公司招聘的时候,python方面的都会要求会django等框架,所以比较好奇python版咋没人关注这东西 【 在 nuanyangyang (暖羊羊) 的大作中提到: 】 : 好几年前用过django。flask听说过,没用过。python确实很好玩。 : 不过,关系爬虫…”
“@暖神 通过『我邮2.0』发布”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。