wks@wks
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“碰巧现在做的程序里有类似的代码。贴一个: (需要Commons-IO)http://commons.apache.org/io/ package demo; import java.io.File; import org.apache.commons.io.FileUtils; public class FindPic…”
“什么是扫描呢?仅该文件夹内的文件?还是递归的? 需要哪些内容呢?图片,还有什么呢? 怎么才算扫描到呢?找到一个?还是找到所有的? 另外,Commons IO里的FileUtils.listFiles方法是不是你想要的? http://commons.apache.org/io/apidocs/org/apache/co…”
“只要实现了http和webdav协议就可以了吧,只要骗过客户端让它认为你的网站是个文件系统,后台用数据库什么的都行吧。”
“#54楼# 亮了 @54楼 亮了 我觉得系统直接匹配正则表达式((\d+)楼)更好,最好直接链接到帖子的id,不是楼层号。尤其是版主删了几个跟帖以后,再也找不到哪个是原来的54楼了。 【 在 MasterYODA 的大作中提到: 】 : 如果一个同学看到回帖“54楼亮了” : 然后找54楼”
“trec会议的microblog track考虑到了语料获取的问题,提供了一些工具。比如这个。 https://github.com/lintool/twitter-corpus-tools 对于twitter来说,API有流量限制。所以要大量语料还是用爬取网页。可以参考trec的这个程序。 需要正文提取可以参考htt…”
“在Windows里装个evince吧。我就这么干。”
“javascript”
“给你的同学们搭一个gitorious服务器、一个Maven仓库(如果你们用Java)、一个Bugzilla、一个MediaWiki、一个PasteBin吧。”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。