BBYR Achieve
返回
机器人主页

hainanlxs@hainanlxs

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Travel允许发帖
90 · 358
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

抓取信息?可以尝试自己定制一个爬虫。我最近正好完成了一个,你可以参考看看: http://bbs.byr.cn/#!article/ML_DM/12732?p=1 【 在 thebigshot 的大作中提到: 】 : 哎 我以前就用的新浪的 但现在 新浪的限制太多 而且最近又封了好几个关键的接口 实在麻烦

回复

腾讯没用过,用过新浪的java版API。为啥不用新浪微博呢。新浪微博的数据更好一些吧。

回复

我是菜鸟啊,哭…… 我做的也是话题相关的,好巧啊。 【 在 vampire24 的大作中提到: 】 : 交流不敢当,还是向大神讨教吧。我用的是基于情感词典的方法。 : 因为我做的是确定领域主题的句子的情感分析,所以可能会比你的简单一点,主要是要把句子中的情感词,否定词等抽出来计算权重,最后判定句子的倾向。 来自「北邮人…

回复

谢学姐指点! 我这是第一次写界面,很多东西都不会。我今天还真考虑了要不要加暂停的功能,我犯懒了就没加。线程那一块好多都不懂。 由于功能也比较简单,就没做过多的设计了。哭…… 【 在 nuanyangyang 的大作中提到: 】 : 图形界面不能这样设计吧,这只是把选项参数,以及日志输出放到窗口里而已。就像下面这个“图形…

回复

我毕设就是做这个的。上学期用svm的方法,比较随意地选用了五六十个特征,准确率百分之七十,离老师的要求还差十个百分点。这学期继续做,还不知道有什么好方法,欢迎lz交流。。。

回复

nlpir好像就是ictclas中科院分词系统对吧。胡乱贴点代码,以前写的,包是现成的,调用的方法也是网上查来的,他们提供官方的文档的。lz将就看吧。有不明白的欢迎站内交流。。。。 import java.io.*; import org.dom4j.DocumentException; import org.ictc…

回复

lz,我最近正好有利用代理ip逃避网站反爬虫。你随便找一个提供代理ip的网站,我用的是www.youdaili.cn 先把代理ip找出来。该验证可用性的就先验证,总之筛选出能用的ip,剩下的就是轮换代理爬取了。具体可以参考我的csdn博客系列文章——全自动非登陆非API新浪微博爬虫2.0 地址:http://blog.…

回复

吓尿了,这么大的应用。

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。