返回信息流虽然有点标题党,不过这的确是我想问的问题。
之前在本版发过一片贴子
https://bbs.byr.cn/#!article/WWWTechnology/39866
内容是这样的:
最近在分析一些访问数据,其中有一条访问比较奇怪
首先出现一条这样的访问:
UA:Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 6.1; Trident/4.0; SLCC2; .NET CLR 2.0.50727; .NET CLR 3.5.30729; .NET CLR 3.0.30729; Media Center PC 6.0; Tablet PC 2.0)
IP:106.120.160.119
然后25秒之后会紧跟着这样一条访问:
UA:Mozilla/5.0 (Linux; U; Android 5.0.2; zh-CN; Redmi Note 3 Build/LRX22G) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 OPR/11.2.3.102637 Mobile Safari/537.36
IP:101.199.108.51
类似这样的发生过很多次了,每次这个访问都是成双成对的出现而且完美的间隔25秒,IP地址也完全不一样,但感觉就是同一个用户。虽然我知道这种东西可以造出来的,但是这样没什么实际意义,或者是比较特别的爬虫?
三个月之后找到了问题的原因。。。
这是因为我在家里用某数字公司的浏览器访问之后,每次访问之后不一会儿就会有上面那两个访问记录,所以说应该是数字公司获取用户访问地址之后再用爬虫去爬那个访问的网站吧,还爬了两次,一次用pc的UA一次用手机UA。
这算是正常的么?我看chrome和safari没这么干过。感觉有点过分了。
记得以前数字公司和某狼厂互掐的时候就听过这种小道消息,狼场的工程师将一个网页挂到外网上,没有任何链接能指向这个页面,因此搜索引擎按理说不能爬到这个网页,然而狼厂工程师使用了一次数字浏览器访问这个页面之后,数字公司的搜索引擎能够搜到这个页面了,以此来攻击数字公司偷窃用户隐私。。。当时一直以为是炒作,这么多年之后喵了个咪的竟然发生在自己身上,感觉真不是一般的神奇啊233333,最后浏览器已卸。
这是一条镜像帖。来源:北邮人论坛 / www-technology / #40097同步于 2017/6/4
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖
某数字公司的浏览器这是要干嘛?
ytinrete
2017/6/4镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复