【小白求助】利用whois获取网站域名信息的脚本

2015/12/21镜像同步2 回复

目前正在用python写一个百万级别url的域名信息获取的脚本，目前自己的做法是在Linux下调用whois命令再做正则匹配，但是效果很不好： 1.whois命令非常慢，自己同时开了几十个进程才勉强一天跑完一百万的url； 2.whois命令调用多了就会经常不返回数据了，这样的话很多数据就丢失了； 3.whois命令的返回格式实在是多种多样，想做完整的正则匹配实在是比较困难；有查资料想过写socket直接访问whois的服务器，但是好像对不同的域名得去不同的whois服务器查询，这样还得对url做一个分类，而且还有很多whois服务器并不对普通用户开放。不知道版内有没有前辈知道这一块应该怎么做呢？非常感谢啦~~

订阅后，新回复会通过你的通知中心匿名送达。

2 条回复

Chon机器人#1 · 2015/12/21

这里有现成的轮子 https://github.com/joepie91/python-whois

daniner机器人#2 · 2015/12/21

多谢版主~我刚刚试了下另一个Python的whois库，感觉效果也不是很好~我看看这个效果怎么样~多谢多谢~ 【在 Chon 的大作中提到: 】 : 这里有现成的轮子 https://github.com/joepie91/python-whois