请教一个UA的问题

2017/3/21镜像同步9 回复

虽然感觉不太可能得到答案不过试试最近在分析一些访问数据，其中有一条访问比较奇怪首先出现一条这样的访问： UA:Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; Tablet PC 2.0) IP:106.120.160.119 然后25秒之后会紧跟着这样一条访问： UA:Mozilla/5.0 (Linux; U; Android 5.0.2; zh-CN; Redmi Note 3 Build/LRX22G) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 OPR/11.2.3.102637 Mobile Safari/537.36 IP:101.199.108.51 类似这样的发生过很多次了，每次这个访问都是成双成对的出现而且完美的间隔25秒，IP地址也完全不一样，但感觉就是同一个用户。虽然我知道这种东西可以造出来的，但是这样没什么实际意义，或者是比较特别的爬虫？有人有遇到过类似的事情么 0 0 ？只是比较好奇。

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

aMZ机器人#1 · 2017/3/22

分布式爬虫？

nuanyangyang机器人#2 · 2017/3/22

访问网站，然后用手机扫码登录？

ytinrete机器人#3 · 2017/3/22

【在 aMZ 的大作中提到: 】 : 分布式爬虫？有可能哦，不过真的是这样也不好验证呢，不能针对这个去做特殊处理。

ytinrete机器人#4 · 2017/3/22

【在 nuanyangyang 的大作中提到: 】 : 访问网站，然后用手机扫码登录？暖神好厉害，这都想得出来，这种场景的确很适用呢。不过很遗憾那只是一个静态页面，而且每次掏出手机扫码登陆都能准确的维持25秒的用户就很不可思议了。

ytinrete机器人#5 · 2017/3/22

看起来是无头冤案了，不管了w

nuanyangyang机器人#6 · 2017/3/22

搜索引擎说，第二个ip地址来自奇虎360公司。还有别的数据吗？那些地址来自哪里呢？

ytinrete机器人#7 · 2017/3/22

【在 nuanyangyang 的大作中提到: 】 : 搜索引擎说，第二个ip地址来自奇虎360公司。 : 还有别的数据吗？那些地址来自哪里呢？这些信息是nginx的access.log里面的原始信息，也就只有这些信息了。正在考虑，准备用应用服务去处理这部分请求，要是发现这个UA就返回一个“机器人小朋友你被发现了！”这种。开玩笑的不过真的有在考虑在网页上尽可能的收集用户信息，用户行为等，比如浏览时长，点击滑动事件等，也许到时候就知道了吧。

ahql机器人#8 · 2017/6/4

用wireshark抓包看看

chdeducn机器人#9 · 2017/6/6

会不会是搜索引擎防止页面针对爬虫作弊？【在 nuanyangyang 的大作中提到: 】 : 搜索引擎说，第二个ip地址来自奇虎360公司。 : 还有别的数据吗？那些地址来自哪里呢？