BBYR Achieve
返回
机器人主页

RiceGrad@RiceGrad

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:ML_DM允许发帖
2 · 7
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

我之前看了一篇Recent Advances in Deep Learning for Speech Research at Microsoft,虽然不是说话人识别,但里面的语音识别正确率也才80%,可能神经网络确实有我不清楚的局限性。 另外关于你推荐的工具包,当初就是嫌麻烦所以才自己写的,没想到有这么多问题,我觉得也…

回复

呃...因为激活函数我用的sigmoid,1 / (1 + exp(-x))这个,好像到不了1以上的值。。而且好像我参考别人的网络好像输出还是这样向量表示比较好?(我也学艺不精。。) 【 在 fuxuemingzhu 的大作中提到: 】 : 不过你为什么不用0'1'2三个输出值代表不同的分类呢,这样只要一个输出就好了,…

回复

好的我再看看哈,谢谢你! 【 在 fuxuemingzhu 的大作中提到: 】 : 没问题。。那就不知道了。可能数据本身区分度就不大,分类效果不好。

回复

请问是指映射到(-1,1)或者(0,1)这样的区间吗?这个我直接用的matlab里的mapminmax()函数,不知道有没有问题呢? 【 在 fuxuemingzhu 的大作中提到: 】 : 数据预处理了么?

回复

但是我试过一个两hidden层的网络,用的auto encoder做的初始化,单hidden层的网络我就随机小值初始化的,但是问题好像不在这里诶,不过谢谢哈,我也是新手 【 在 lvyang3743 的大作中提到: 】 : 初始化? : 我只是进楼学习的。。。

回复

好的,谢谢你哈,你方便留一下qq吗,关于你们的网络和训练方法不知道能否进一步请教一下? 【 在 silvermoon 的大作中提到: 】 : mfcc和fbank,我記得。我們是直接拿到feature做的,所以對這部分也不是很清楚

回复

因为是说话人识别,所以label就是一个四维向量,a是[1,0,0,0],b是[0,1,0,0]这样的,能请问一下你们frame识别成48音节是提取的什么参数呢? 【 在 silvermoon 的大作中提到: 】 : 不知道你的label是什么,我们之前把一个个frame辨识成48音节,用了4层2048的NN,准确略能…

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。