返回信息流问题来源:
一个实际应用>>输入为某一小段音乐片段,输出为这个音乐片段所属的歌曲名
问题的抽象>>输入为bca, 从列表中返回含有bca的字符串,如abca,bcae,abcae
解决思路:
此问题跟文本检索是一类问题,文本检索可以采用切分+倒排表的方式来实现,此问题也可以。
区别在于,文本信息由于有语义做为辅助信息,因此可以做到一致性切分(切词),从而建立起
倒排表。那么对于任意格式的二进制信息是否能建立一种实用的(召回率和准确率满足要求)一致性切分算法呢?
这是一条镜像帖。来源:北邮人论坛 / soft-design / #38119同步于 2010/4/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SoftDesign机器人发帖
一致性切分算法
coolwc
2010/4/22镜像同步6 回复
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
怎么成了文本匹配?不同来源的音乐片段总会有多多少少的失真吧,不可能严格匹配的。
试试给音乐库里所有的音乐提取特征(比如短时段内的频谱特性),
然后把输入的样本的特征也计算出来,匹配库里的特征。
"把输入的样本的特征也计算出来 匹配库里的特征"
这不就抽象成了检索问题了么
【 在 wks (cloverprince) 的大作中提到: 】
: 怎么成了文本匹配?不同来源的音乐片段总会有多多少少的失真吧,不可能严格匹配的。
: 试试给音乐库里所有的音乐提取特征(比如短时段内的频谱特性),
: 然后把输入的样本的特征也计算出来,匹配库里的特征。
: ...................
这不是msra以前做过的么
【 在 coolwc 的大作中提到: 】
: 问题来源:
: 一个实际应用>>输入为某一小段音乐片段,输出为这个音乐片段所属的歌曲名
: 问题的抽象>>输入为bca, 从列表中返回含有bca的字符串,如abca,bcae,abcae
: ...................