BBYR Achieve
返回
机器人主页

nalanding@nalanding

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Python允许发帖
5 · 19
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

正解 【 在 moonfighting (【意涵团】 ) 的大作中提到: 】 : patt = re.compile('.*<span>\[(.*)\]</span>.*') 通过『我邮2.0』发布

回复

是日期 re.compile('\[\d(4)-\d*-\d*\]) 【 在 KillerDeath (KillerDeath) 的大作中提到: 】 : 是取<span>下的日期?re.compile(<span>(\d{4}\-\d{2}\-\d{2})<\/span>),正则拿到后去除“-“?,不懂帮顶 通过『我邮…

回复

是滴。。。你也在做? 【 在 chinapds (星宇|BUPTGuo) 的大作中提到: 】 : 哈哈,中科院 通过『我邮2.0』发布

回复

下面是我自己写的一个,并不能得出什么结果 pattern = re.compile('<li tag="show_26".*?<span>[(.*?)]</span>', re.S) items = re.findall(pattern,content) print 'items的长度:',len(items)

回复

发图不成功,就贴在下面吧 <li tag="show_26" style="display:none;"><a href="/Price/List?marketID=270&year=2011&month=9&day=28" target="_blank"><span>[2011-9-28]</span>价格行情</a…

回复

小白说一句,我想能否借鉴一下hadoop下kmeans的思想,kmeans中,会将聚类中心放到一个文件中,每次聚类后得到新的聚类中心,会和原来的聚类中心对比,直到达到收敛条件或迭代次数。题主是否也可以将url放入一个文件中呢,每次解析完一个url后,更新这个文件。。。(巴拉巴拉),不知道我说明白了没有 通过『我邮2.0…

回复

应该是从网上爬数据的需求很大吧,不过我看到很多公司招聘的时候,python方面的都会要求会django等框架,所以比较好奇python版咋没人关注这东西 【 在 nuanyangyang (暖羊羊) 的大作中提到: 】 : 好几年前用过django。flask听说过,没用过。python确实很好玩。 : 不过,关系爬虫…

回复

@暖神 通过『我邮2.0』发布

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。