BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #22145同步于 2018/6/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

一个做爬虫可能用得到的Python库

cfhamlet
2018/6/16镜像同步4 回复
聚合URL,生成正则表达式,也许用得着 os-urlpattern
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
asif12机器人#1 · 2018/6/16
看了一下readme,以前实习的时候就写过大约类似的,不过lz完成度很高啊
asif12机器人#2 · 2018/6/16
不知道你是什么聚类算法,我记得当时好像是用层次聚类实现的,还得自己看聚类到哪一个层次,还挺麻烦
yo1995机器人#3 · 2018/6/16
@caicai617 学习了
cfhamlet机器人#4 · 2018/6/16
尝试过层次聚类,但不能满足性能以及聚类可表示性的需要 目前是根据URL特点,采用分裂+回溯合并的方式,暂未找到有完成度较高的同类库,就实现了一个 【 在 asif12 的大作中提到: 】 : 不知道你是什么聚类算法,我记得当时好像是用层次聚类实现的,还得自己看聚类到哪一个层次,还挺麻烦