chhaapspey@chhaapspey
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“w2v可能暂不考虑~~ 【 在 bdyzhy9527 的大作中提到: 】 : 之前看到有个博士学姐做的类似的工作,思路挺简单的。word2vec,然后用词向量平均代表句子的向量,感觉效果还可以。百万条的短文本word2vec调一下应该是有效果的”
“我现在在试n-gram+bow,序列信息是为了提取关键词信息,主要是文本噪声比较多 ,关键词很难定义 【 在 Blachat 的大作中提到: 】 : 如果你要用聚类方法的话,首先要对短文本表示建模,就是沙发说的句向量,具体如何建模,你可以从简单的方法出发,比如词向量的n-gram+bow,再到复杂的句向量文本表示模型,…”
“我更了一下,暂时不考虑用w2v,你说的句向量是doc2vec吗,不是的话能推荐一下相关文章吗,谢谢~ 【 在 jaegerstar 的大作中提到: 】 : 可以利用词向量或者比较新的句向量方法聚类试试,有点类似于你提到的用lstm的做法。当然也要看你数据。单纯提供思路,最后也要实验说话”
“刚入门就上IDCNN了 【 在 foreverwith 的大作中提到: 】 : 我也刚入门,还是机器学习小白[ema1]真的什么都看不懂... : https://github.com/crownpku/Information-Extraction-Chinese/tree/master/NER_IDCNN_CRF 这…”
“讨论讨论啊”
“那个群进不了了???”
“【 在 hlcjj 的大作中提到: 】 : B站上有,Micheal Collins 和 Dan Jurafsky 也是杠杠的,看Jason Eisner的课件也挺好的。 : Stanford的更偏神经网络,而后面的多是从更基础的层面入手,让你有更全面的了解。 好的,我就去看课件了”
“【 在 binxin 的大作中提到: 】 : 其实,看讲义就可以了哇,上大学不也是旷课一学期,期末看讲义嘛 这句话很中肯啊”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。