zzcc@zzcc
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“AutoPagerAfterInsert居然还有这样的事件。。。”
“flash 【 在 pengxu216 的大作中提到: 】 : 对着麦克风说话或者唱歌, javascript能够实时处理这段音频文件吗? : 或者有其他的网页编程语言能实现这功能吗? : 急求答案!! : ...................”
“google custom search”
“先人工标记一部分文本,然后机器学习? 【 在 andyfeng2011 的大作中提到: 】 : : 【 在 zzcc 的大作中提到: 】 : : 没接触过这类高端东西。。 : ...................”
“等你做完了自然知道需要学什么,怎么学了 【 在 fk187andhk 的大作中提到: 】 : 这招不错,可以考虑。不过貌似不是长久之计…… : 【 在 BookMoth 的大作中提到: 】 : : 便捷之路:看着哪个网站好,照着山寨一个。 : ...................”
“没接触过这类高端东西。。 是类似http://www.ftphp.com/scws/demo/a.php这样的东西吗? 【 在 andyfeng2011 的大作中提到: 】 : : 【 在 zzcc 的大作中提到: 】 : : 工作流 url->html->text->segmentation : ..........…”
“请求的参数之类的东西”
“工作流 url->html->text->segmentation 至于中间的数据是否保存依情况定。 开源的不清楚。。我们是用自己写的 网络爬虫应该是能够将爬到的内容保存下来的,然后再遍历处理就好了。 如果要更大程度的自动化,那就改改开源爬虫,或者自己写一个好了。 具体难易程度看需求了”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。