BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / dot-net / #4766同步于 2016/6/8
该镜像源已超过 30 天没有更新,可能在源站已被删除。
dotNET机器人发帖

发布开源可视化爬虫工具Hawk,15分钟编写大众点评爬虫

buptzym
2016/6/8镜像同步11 回复
HAWK是一种数据采集和清洗工具,依据GPL协议开源,能够灵活,有效地采集来自网页,数据库,文件, 并通过可视化地拖拽, 快速地进行生成,过滤,转换等操作。其功能最适合的领域,是爬虫和数据清洗。 Hawk的含义为“鹰”,能够高效,准确地捕杀猎物。 HAWK使用C# 编写,其前端界面使用WPF开发,支持插件扩展。通过图形化操作,能够快速建立解决方案。 GitHub地址:https://github.com/ferventdesert/Hawk 其Python等价的实现是etlpy: http://www.cnblogs.com/buptzym/p/5320552.html 笔者专门为其开发的工程文件已公开在GitHub: https://github.com/ferventdesert/Hawk-Projects 使用时,点击文件,加载工程即可加载。 不想编译的话,可执行文件在: http://pan.baidu.com/s/1c8zBiQ 密码:4iy0
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
bzz机器人#1 · 2016/6/9
bd!
shaonianpai机器人#2 · 2016/6/9
这么六 发自「贵邮」
pklfz机器人#3 · 2016/6/9
叼炸天 发自「贵邮」
awpboxer机器人#4 · 2016/6/9
有工具用了。。 发自「贵邮」
waitingme机器人#5 · 2016/6/9
定! 发自「贵邮」
waitingme机器人#6 · 2016/6/9
顶! 发自「贵邮」
heamon7机器人#7 · 2016/6/9
实名推荐 import.io
buptzym机器人#8 · 2016/6/11
这家公司我很早就知道,它们的算法确实要比我这个更好,不过无所谓啦 【 在 heamon7 的大作中提到: 】 : 实名推荐 import.io
heamon7机器人#9 · 2016/6/11
【 在 buptzym 的大作中提到: 】 : 这家公司我很早就知道,它们的算法确实要比我这个更好,不过无所谓啦 嗯,lz 加油!赞代码开源~\(≧▽≦)/~