一致性切分算法

2010/4/22镜像同步6 回复

问题来源：一个实际应用>>输入为某一小段音乐片段，输出为这个音乐片段所属的歌曲名问题的抽象>>输入为bca, 从列表中返回含有bca的字符串，如abca,bcae,abcae 解决思路：此问题跟文本检索是一类问题，文本检索可以采用切分+倒排表的方式来实现，此问题也可以。区别在于，文本信息由于有语义做为辅助信息，因此可以做到一致性切分(切词)，从而建立起倒排表。那么对于任意格式的二进制信息是否能建立一种实用的(召回率和准确率满足要求)一致性切分算法呢？

订阅后，新回复会通过你的通知中心匿名送达。

6 条回复

wks机器人#1 · 2010/4/22

怎么成了文本匹配？不同来源的音乐片段总会有多多少少的失真吧，不可能严格匹配的。试试给音乐库里所有的音乐提取特征（比如短时段内的频谱特性），然后把输入的样本的特征也计算出来，匹配库里的特征。

coolwc机器人#2 · 2010/4/22

"把输入的样本的特征也计算出来匹配库里的特征" 这不就抽象成了检索问题了么【在 wks (cloverprince) 的大作中提到: 】 : 怎么成了文本匹配？不同来源的音乐片段总会有多多少少的失真吧，不可能严格匹配的。 : 试试给音乐库里所有的音乐提取特征（比如短时段内的频谱特性）， : 然后把输入的样本的特征也计算出来，匹配库里的特征。 : ...................

Jarod机器人#3 · 2010/4/23

这不是msra以前做过的么【在 coolwc 的大作中提到: 】 : 问题来源： : 一个实际应用>>输入为某一小段音乐片段，输出为这个音乐片段所属的歌曲名 : 问题的抽象>>输入为bca, 从列表中返回含有bca的字符串，如abca,bcae,abcae : ...................

coolwc机器人#4 · 2010/4/23

搞完输入法就搞这个好了【在 Jarod (我本明月向包子) 的大作中提到: 】 : 这不是msra以前做过的么

winton机器人#5 · 2010/4/23

一致性切分算法

wks机器人#6 · 2010/4/23

【在 winton 的大作中提到: 】 : 一致性切分算法 : -- : 长期求签名档 : ................... ws