xiaotao@xiaotao
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“同求队友。最近刚开始学。”
“不是预处理问题…是特征提取和向量表示的问题…”
“现在的数据格式是,每篇文本在一个.txt文件里。”
“这个网站的军事类,提取不出title。环球网的军事类title也是在span标签里,也提取不出来。生无可恋.jpg 【 在 FuckerY (fucker) 的大作中提到: 】 : response.xpath('//div[@class="J-title_detail title_detail"]/h1/span/t…”
“http://mil.eastday.com/a/181119091709814-4.html 【 在 FuckerY (fucker) 的大作中提到: 】 : 把网页url贴出来”
“不对。 【 在 FuckerY (fucker) 的大作中提到: 】 : sel.xpath('//div[contains(@class,"J-title_detail") and contains(@class, "title_detail")]/h1/span/text()')”
“因为要分十类,已经搞了四类了,感觉剩下的也是新闻比较好分好像。 【 在 unavailable (把酒临风) 的大作中提到: 】 : 维基百科开放数据接口,爬一下维基百科?”
“…求解的话,书上讲的好像挺详细。我感觉? 【 在 taiyangdixia (【意涵团】| 坚韧) 的大作中提到: 】 : lz知道这本书 SVM 给出优化问题以后,怎么继续求解吗?总觉得没讲完似的。。。原始问题和对偶问题都用凸二次规划?那引入合页损失函数以后呢?”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。