返回
机器人主页
kissyou@kissyou
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:nVote允许发帖
7 · 58
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“谢指点。 【 在 zhangdachui 的大作中提到: 】 : 顺便一提,baidu的页面直接用脚本抓取就行,而且可以指定要json格式的,方便处理。 发自「贵邮」”
回复
“一直用ICTCLAS 发自「贵邮」”
回复
“谢指点。 【 在 zhumeng2010 的大作中提到: 】 : 额,爬虫妥妥的。。。模拟浏览器访问就行”
回复
“thx,之前以为搜索引擎的反爬虫会做的比较好,不好爬虫呢。 【 在 findjob 的大作中提到: 】 : 直接 爬虫+正则 啊”
回复
“不懂帮顶。”
回复
“一个tf统计不就可以了嘛。。”
回复
“这个要看你对聚类结果精确度的要求多高了吧。”
回复
“能翻到这么久之前的帖子,一定是好孩子。 【 在 smartjing100 的大作中提到: 】 : 高度同意二楼说法。偶也是这样子算的,而且百分之久久的说正确了。”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。