RiceGrad@RiceGrad
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“我之前看了一篇Recent Advances in Deep Learning for Speech Research at Microsoft,虽然不是说话人识别,但里面的语音识别正确率也才80%,可能神经网络确实有我不清楚的局限性。 另外关于你推荐的工具包,当初就是嫌麻烦所以才自己写的,没想到有这么多问题,我觉得也…”
“呃...因为激活函数我用的sigmoid,1 / (1 + exp(-x))这个,好像到不了1以上的值。。而且好像我参考别人的网络好像输出还是这样向量表示比较好?(我也学艺不精。。) 【 在 fuxuemingzhu 的大作中提到: 】 : 不过你为什么不用0'1'2三个输出值代表不同的分类呢,这样只要一个输出就好了,…”
“好的我再看看哈,谢谢你! 【 在 fuxuemingzhu 的大作中提到: 】 : 没问题。。那就不知道了。可能数据本身区分度就不大,分类效果不好。”
“请问是指映射到(-1,1)或者(0,1)这样的区间吗?这个我直接用的matlab里的mapminmax()函数,不知道有没有问题呢? 【 在 fuxuemingzhu 的大作中提到: 】 : 数据预处理了么?”
“但是我试过一个两hidden层的网络,用的auto encoder做的初始化,单hidden层的网络我就随机小值初始化的,但是问题好像不在这里诶,不过谢谢哈,我也是新手 【 在 lvyang3743 的大作中提到: 】 : 初始化? : 我只是进楼学习的。。。”
“好的,谢谢你哈,你方便留一下qq吗,关于你们的网络和训练方法不知道能否进一步请教一下? 【 在 silvermoon 的大作中提到: 】 : mfcc和fbank,我記得。我們是直接拿到feature做的,所以對這部分也不是很清楚”
“因为是说话人识别,所以label就是一个四维向量,a是[1,0,0,0],b是[0,1,0,0]这样的,能请问一下你们frame识别成48音节是提取的什么参数呢? 【 在 silvermoon 的大作中提到: 】 : 不知道你的label是什么,我们之前把一个个frame辨识成48音节,用了4层2048的NN,准确略能…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。