nuanyangyang@nuanyangyang
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“问题是什么?”
“我只是不爽都这么多年了,论坛上还是到处都是自己拿python写爬虫的,这得重新发明多少轮子?而且爬虫这种东西怎么那么多人搞,难道全民都在搞搜索引擎? 【 在 eee 的大作中提到: 】 : 我是out了吗? :”
“靠,5、6年过去了还tm做爬虫……还tm是python的……”
“真想学就学呗,反正已经不是入门了,学了反正有用。 【 在 FromSixToTen 的大作中提到: 】 : 建议学Go或者Python。 @nuanyangyang”
“这样有个问题,就是所谓的“time of check to time of use (TOCTTOU)”。 https://en.m.wikipedia.org/wiki/Time_of_check_to_time_of_use 当程序刚刚判断文件存在,还没来得及打开的时候,文件就可能已经被删除了,更危险的是恶意的用户…”
“首先用try-with-resources语句。这样不管有没有异常都会保证关闭文件。 然后,一直往上抛,除非有一层能够给出“如果发生异常,做xxx就能恢复”否则就不要catch。”
“嗯,算是一种workaround。他们还加了async关键字,只是内在同样丑。 【 在 specops 的大作中提到: 】 : Python社区也觉得这样太不优雅了于是加了yield from。。。 : [code=py] : def flatten(obj):”
“看你是不是需要保证别的线程“要么看到三个对象都分别放进了三个集合,要么一个对象都没放进去”,而看不见“有两个放进去了,另一个没放进去”。如果有这样的要求,就需要一个大锁。 【 在 coyding 的大作中提到: 】 : 比方说写一个工厂类,里面有三个线程安全的集合类,主要是起缓存作用,每{生产一个对象的时候同时产生另外…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。