返回信息流RT.
拜各位大牛。
比如从基础书籍开始,基本数学理论,以及实验平台,然后是paper。
或者某牛人的blog也成,给个指引方向。
版上看到的多数是关于视觉方面的。
谢谢了。
期待reading list: ).
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #1130同步于 2008/2/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
[求助]大牛们,有没有介绍关于语音处理方面的学习&研究顺序呀?
Shmily1314
2008/2/10镜像同步11 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
呼唤speaker,呵呵
基础的东西太多了
模式识别与机器学习,bishop的prml绝对没错,基础好点就看看hastie的element of statistical learning。prml值得细细玩味,prml的目录本身就是对现在ml的大局的概括,看了两个月还没看完一遍[em20]。
数学方面,矩阵、泛函、概率论、随机过程这些必备,有微分几何的底子更好,矩阵看mit的open course有了空间的概念之后,看paper练习最好(其实这些都是集合论,可是书本和学校的课堂讲得都太抽象了,mit的很好很强大,斯特朗教授还讲了工程数学,可惜一直没时间认真听)。弄懂空间和矩阵,再看泛函和其他代数分析的书会觉得很轻松,看paper也容易很多。概率的看statistical inference。
实验平台,我听说htk比较流行吧,htk比较针对hmm。hmm只是DAG的一个具体实例,hmm的forward-backward对应于DAG的sum-product算法(跟nnet的backpropagation算法相似),viterbi对应于DAG的max-sum算法。此外,另一大类linear gaussian model(如kalman filter)也可以归为DAG的范畴。DAG可以作为inference的engine,也可以用于learning,DAG的平台很多。版上曾经提过lattice,我认为跟gm是一路的,在语音上称为lattice,在vision中称为mrf,在文本中称为crf,都一样。看了prml就不会被人忽悠。
优化方面,跟前面的数学有点重叠,目标函数一般是二次型的半正定形式,在vision和计算物理中,一般遇到ill-posed(google一下inverse problem),这种情况,需要引入regularization term。确定优化,gradient-based methods,很多;随机优化,主要是monte carlo和各种sampling方法,这种模型比较容易套用bayes的分析框架。凸优化问题都有对应的几何模型,从几何上考虑问题比从代数上分析直观许多。
信号处理,对这块一直迷迷糊糊[em20]。
其他各门各派,数据结构和算法经常翻翻,比如图论的匈牙利算法、最大流、最小割等等,算法导论中喜欢用transport或者job assignment作为实际问题来介绍这些算法,如果细心你会发现算法导论实用性非常强,比如字符识别中两个字符"9"的特征点之间的对齐就和job assignment描述的问题一样,都可以使用匈牙利算法来解决。这些东西在paper中不会提到,但是在coding中却是要用到的。
同呼唤speaker,呵呵
cryppie说的这些普通人怎么可能做到啊
建议问师兄要个reading list,把识别方向的所有经典论文都看看。不懂得且重要的地方在继续找paper或是书研究。
htk book要扫一扫吧,最好结合实验室现有的系统来学习。
另外听说矩阵论很重要
俺外行,说的都是以前实验室搞语言的同学的做法
【 在 cryppie 的大作中提到: 】
: 呼唤speaker,呵呵
: 基础的东西太多了
: 模式识别与机器学习,bishop的prml绝对没错,基础好点就看看hastie的element of statistical learning。prml值得细细玩味,prml的目录本身就是对现在ml的大局的概括,看了两个月还没看完一遍[em20]。
: ...................
恩,呼唤昊哥。。
【 在 cryppie (北邮人) 的大作中提到: 】
: 呼唤speaker,呵呵
: 基础的东西太多了
: 模式识别与机器学习,bishop的prml绝对没错,基础好点就看看hastie的element of statistical learning。prml值得细细玩味,prml的目录本身就是对现在ml的大局的概括,看了两个月还没看完一遍[em20]。
: ...................
cyrppie总是有技术贴出炉,赞!
【 在 Dove (宇宙黑洞) 的大作中提到: 】
: 我受不了了。
: 家乡受灾,但是依然被cryypie的帖子感动……
: 写的太好了。。。
: ...................
Rabiner的
Fundamentals of Speech Recognition
是不错的入门书籍,
然后就是剑桥语音组的paper,从Steve Young的开始
谢谢cryppie...
看来要补的东西太多了。。。
再问一下,发现好多书,比如fundamentals of speech recognition等书都绝版了。
如何买到呢?
不知道各位怎么买的?
谢谢分享:)
【 在 cryppie 的大作中提到: 】
: 呼唤speaker,呵呵
: 基础的东西太多了
: 模式识别与机器学习,bishop的prml绝对没错,基础好点就看看hastie的element of statistical learning。prml值得细细玩味,prml的目录本身就是对现在ml的大局的概括,看了两个月还没看完一遍[em20]。
: ...................
可师兄们都是visual tracking 和 motion planning的。。。
哎。。。
【 在 goldfish 的大作中提到: 】
: 同呼唤speaker,呵呵
: cryppie说的这些普通人怎么可能做到啊
: 建议问师兄要个reading list,把识别方向的所有经典论文都看看。不懂得且重要的地方在继续找paper或是书研究。
: ...................
最好还是不要脱离大部队
【 在 Shmily1314 的大作中提到: 】
: 可师兄们都是visual tracking 和 motion planning的。。。
: 哎。。。