想问下像清华那边的news.thuir.org这样的聚类实现没有偏差呢,另外新闻里面的关键词该怎么提取,比如人名之类的.. 目前尝试用APcluster做聚类,但是常常出现偏离啊..比如a和b相似,b和c相似,于是abc就归类成一组新闻了...但其实a和c完全没有关系...