BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / www-technology / #39866同步于 2017/3/21
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖

请教一个UA的问题

ytinrete
2017/3/21镜像同步9 回复
虽然感觉不太可能得到答案不过试试 最近在分析一些访问数据,其中有一条访问比较奇怪 首先出现一条这样的访问: UA:Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; Tablet PC 2.0) IP:106.120.160.119 然后25秒之后会紧跟着这样一条访问: UA:Mozilla/5.0 (Linux; U; Android 5.0.2; zh-CN; Redmi Note 3 Build/LRX22G) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 OPR/11.2.3.102637 Mobile Safari/537.36 IP:101.199.108.51 类似这样的发生过很多次了,每次这个访问都是成双成对的出现而且完美的间隔25秒,IP地址也完全不一样,但感觉就是同一个用户。虽然我知道这种东西可以造出来的,但是这样没什么实际意义,或者是比较特别的爬虫? 有人有遇到过类似的事情么 0 0 ? 只是比较好奇。
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
aMZ机器人#1 · 2017/3/22
分布式爬虫?
nuanyangyang机器人#2 · 2017/3/22
访问网站,然后用手机扫码登录?
ytinrete机器人#3 · 2017/3/22
【 在 aMZ 的大作中提到: 】 : 分布式爬虫? 有可能哦,不过真的是这样也不好验证呢,不能针对这个去做特殊处理。
ytinrete机器人#4 · 2017/3/22
【 在 nuanyangyang 的大作中提到: 】 : 访问网站,然后用手机扫码登录? 暖神好厉害,这都想得出来,这种场景的确很适用呢。 不过很遗憾那只是一个静态页面,而且每次掏出手机扫码登陆都能准确的维持25秒的用户就很不可思议了。
ytinrete机器人#5 · 2017/3/22
看起来是无头冤案了,不管了w
nuanyangyang机器人#6 · 2017/3/22
搜索引擎说,第二个ip地址来自奇虎360公司。 还有别的数据吗?那些地址来自哪里呢?
ytinrete机器人#7 · 2017/3/22
【 在 nuanyangyang 的大作中提到: 】 : 搜索引擎说,第二个ip地址来自奇虎360公司。 : 还有别的数据吗?那些地址来自哪里呢? 这些信息是nginx的access.log里面的原始信息,也就只有这些信息了。 正在考虑,准备用应用服务去处理这部分请求,要是发现这个UA就返回一个“机器人小朋友你被发现了!”这种。 开玩笑的 不过真的有在考虑在网页上尽可能的收集用户信息,用户行为等,比如浏览时长,点击滑动事件等,也许到时候就知道了吧。
ahql机器人#8 · 2017/6/4
用wireshark抓包看看
chdeducn机器人#9 · 2017/6/6
会不会是搜索引擎防止页面针对爬虫作弊? 【 在 nuanyangyang 的大作中提到: 】 : 搜索引擎说,第二个ip地址来自奇虎360公司。 : 还有别的数据吗?那些地址来自哪里呢?