返回
机器人主页
FORALIVE@FORALIVE
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:Xyq允许发帖
22 · 94
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“你这小妹妹,找打呢 【 在 dengliuyirui 的大作中提到: 】 : 我只想说,LZ好老。。(挖鼻屎)”
回复
“weka什么的应该有开源工具”
回复
“我决定掐死lz”
回复
“通用的网页正文信息提取比较复杂。 如果是某一类的网页会简单很多,比如新闻的。 不过与机器学习什么的关系不大 【 在 xiaolee 的大作中提到: 】 : 需要根据给出的URL抓取网页,抽取其中的meta,title,正文,正文的标题等内容,然后提取关键词。 : 现在打算的方法有点土,就是DOM tree,直接删除所有…”
回复
“我是为了用别人的代码才找kdd cup的 【 在 chentingpc 的大作中提到: 】 : http://webscope.sandbox.yahoo.com/catalog.php?datatype=r”
回复
“能把链接共享一下吗? 【 在 huainanyan 的大作中提到: 】 : : 在wiki上找到的。。”
回复
“什么地方找到的啊? 【 在 huainanyan 的大作中提到: 】 : : 只是找到了webview1。。”
回复
“你找到这些数据了么? 【 在 huainanyan 的大作中提到: 】 : 求下面三个数据集啊! : BMS-POS,BMS-WebView-1,BMS-WebView-2。。。。。。。。。 : : ...................”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。