LZ在做文本聚类,用的是VSM模型。我想请问下如何区别关键词有很多相同或者相似但语义不同的文本。例如"小李是警察"和"小李是警察的儿子"。随便举的例子,像这种情况,基于向量相似度的方法可能很容易聚为一类。不知道这种问题怎么解决?