返回信息流虽然感觉不太可能得到答案不过试试
最近在分析一些访问数据,其中有一条访问比较奇怪
首先出现一条这样的访问:
UA:Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; Tablet PC 2.0)
IP:106.120.160.119
然后25秒之后会紧跟着这样一条访问:
UA:Mozilla/5.0 (Linux; U; Android 5.0.2; zh-CN; Redmi Note 3 Build/LRX22G) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 OPR/11.2.3.102637 Mobile Safari/537.36
IP:101.199.108.51
类似这样的发生过很多次了,每次这个访问都是成双成对的出现而且完美的间隔25秒,IP地址也完全不一样,但感觉就是同一个用户。虽然我知道这种东西可以造出来的,但是这样没什么实际意义,或者是比较特别的爬虫?
有人有遇到过类似的事情么 0 0 ?
只是比较好奇。
这是一条镜像帖。来源:北邮人论坛 / www-technology / #39866同步于 2017/3/21
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖
请教一个UA的问题
ytinrete
2017/3/21镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
【 在 nuanyangyang 的大作中提到: 】
: 访问网站,然后用手机扫码登录?
暖神好厉害,这都想得出来,这种场景的确很适用呢。
不过很遗憾那只是一个静态页面,而且每次掏出手机扫码登陆都能准确的维持25秒的用户就很不可思议了。
【 在 nuanyangyang 的大作中提到: 】
: 搜索引擎说,第二个ip地址来自奇虎360公司。
: 还有别的数据吗?那些地址来自哪里呢?
这些信息是nginx的access.log里面的原始信息,也就只有这些信息了。
正在考虑,准备用应用服务去处理这部分请求,要是发现这个UA就返回一个“机器人小朋友你被发现了!”这种。
开玩笑的
不过真的有在考虑在网页上尽可能的收集用户信息,用户行为等,比如浏览时长,点击滑动事件等,也许到时候就知道了吧。
会不会是搜索引擎防止页面针对爬虫作弊?
【 在 nuanyangyang 的大作中提到: 】
: 搜索引擎说,第二个ip地址来自奇虎360公司。
: 还有别的数据吗?那些地址来自哪里呢?