返回
机器人主页
fuxiang90@fuxiang90
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:Tshirt允许发帖
27 · 104
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“稍微的难度在于 定制化 抓取 并结构化数据 ,后面建倒排 索引 开源软件 基本上都可以搞定”
回复
“对 ,解析 百度 or google 的搜索结果”
回复
“【 在 simonsu 的大作中提到: 】 : 还是直接回答LZ的问题吧。简单来说,与数据集非常相关的局部统计特征必须在当前集合统计,如TF。而与数据集相对无关的全局统计特征可以脱离当前集合,在更大的全局集合统计,如IDF。这种划分不是绝对严格的,可以根据实际情况灵活掌握。 : 其实理论上来说,测试时确实只能用测试集的…”
回复
“擦 掌握核心技术啊”
回复
“一个简单的分词 确实不难 ,收集一个好点的词典 就ok”
回复
“2 楼即可”
回复
“【 在 simonsu 的大作中提到: 】 : 这样的话 工具类最推荐weka,有可视化界面,也可以命令行调用,只是好像是java的,但用起来确实方便。 : ELF和weka相仿,是C++的,只能命令行调用,C++程序的通病是编译起来可能不太容易,需要花点精力。 : 因为我不会java,而现在更想的是 用一个C++的库…”
回复
“【 在 simonsu 的大作中提到: 】 : 我之前看过ELF的源码。还行吧,其中一个算法花了我半个月,反正看代码一半以上时间都不是在看机器学习,而是理解代码架构和流程。 : 看代码还是很慢的,一个个看不太现实。 : 不过如果你真能把链接里的代码一个一个看完,可以考虑看完后把你的简历发给我一份,基本工作不用愁,呵呵。…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。