asm@asm
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“是的,所以python的yield不是线程安全的吧,但是channel是线程安全的,可以跑在多核多线程上。我猜是因为有锁的资源消耗吧。 【 在 nuanyangyang 的大作中提到: 】 : : 嗯。这是一个问题。如果buffer大小大一些,比如100,就会比python快了。但是,也快不了多少。Python要2.5…”
“1. go程序中channel没有使用buffered channel 2. go的channel是线程安全的,python的yield不是线程安全的吧”
“会有额外的cpu消耗。 https的大致过程是,使用一次非对称加密传输密钥,然后后续的请求内容都是用该密钥进行对称加密。 所以服务器端每处理一个请求,都会有一次对称加密和解密,请求频率高了,cpu占用率自然就上去了。”
“twisted有些重了,不知道你是什么项目,试过gevent吗 【 在 Wizmann 的大作中提到: 】 : : 自己用twisted做的东西,本来twisted就是全新不会的。再上py3就是给自己找麻烦了。。。 : 以后再说吧。”
“```Python func askTheRightPerson(s string) { r := []rune(s) fmt.Println(len(r)) } ``` 【 在 nuanyangyang 的大作中提到: 】 : [md] : 什么都不说了,看代码: : ```go : ................…”
“一般的加密都是先用一种加密算法比如DES、AES进行加密得到密文,然后再对密文做base64编码做存储 所以你这个问题可以先解码加密后的密文,然后多取几个样本观察一下,根据密文的特征推断是用的什么加密算法(一般情况下都会用常见的、主流的加密算法,某些特殊场景会用自研的加密算法,这个也需要你根据对方的实际情况去推断),确…”
“我觉得这种问题要自己多思考,你可以想想爬虫和浏览器发出的请求在服务器端有什么差异,然后再着手修改你的爬虫。 就我知道的:1.ua 2.请求间隔和请求频率 3.访问特征,比如只有动态页面请求,而没有静态资源请求。 4.有些网站会在页面中嵌入js脚本,捕捉用户行为特征,然后发出ajax请求,这类情况就针对性分析吧。”
“你让他试试不就知道了”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。