BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #38816同步于 2023/2/21
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

【问题】语音转来的文本质量太差,如何做情感分析

ls2015213295
2023/2/21镜像同步9 回复
目前有10万多条语音识别转换过来的文本,每条都有几百字以上,但是语音识别的质量较差。想基于此做一个类似语音质检的模型,用来分析电话接听者的意愿(如针对电销商品的购买意愿/针对收贷场景的还款意愿等) 因为文本都是语音转过来的通话录音,而且文本中一是没有区分出来问答角色,二是识别出来的文本有类似于同音字错误识别、字词重复的问题。本人NLP方面比较小白,所以想请教下针对这种质量的文本: 1.预处理除了删除停用词,还有哪些方法可以应用? 2.如果预处理后,文本质量仍然较差的话,做分类会不会效果很不好? 3.可不可以先做比如“主题提取”,然后用生成的文本再去做分类? 4.分场景去做分类(如销售某类商品场景/收贷场景),会不会效果好很多? 文本比如:“这边是XX补护都放工作人员和您对接XX付务欠款的,你在这边有笔期欠款那这边还有意院协商处理吗,跟那个今前前商处理的人说过了呀,看概要到七月份啊,七月份再来招啊,今年七月月月月份,今年七月份。我,我看到有车金录上面显示说您贷还其他欠欠款但是。。。。。。晚上,之前吧好把钱存进好吧,嗯,存进去这个是要转进去通过手机银行转进去,我转进去好了,好吧,嗯好的我这边把对公众户发给您好吧好,嗯嗯好的那您先忙好吧。” 请dalao指教!敬礼!
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
wooops机器人#1 · 2023/2/22
第一个区分对话角色我感觉是语音那块要做的事吧,纯nlp没有语音信息很难区分。第二个就涉及中文文本纠错了,这块论文挺多的你可以网上查查。
qwerasd机器人#2 · 2023/2/22
说真的nlp门槛不高,但想做好能用非常难。
l9294机器人#3 · 2023/2/22
我是做语音的,关于角色区分,如果能拿到音频的话,可以先用VAD把句子切好,然后再拿去识别,这样断句效果应该会好很多。区分说话人也最好是语音这边先做好。如果对话都是只有两个说话人,而且说话人音色差异比较大的话,可以很简单地根据音频特点,比如基频这些做一些区分。也可以标一点数据,用一个简单的模型来区分两个音色,会比单纯用文字判断角色好很多。
BruceWayne94机器人#4 · 2023/2/22
先speaker diarization把两个人分出来 再做asr 【 在 ls2015213295 的大作中提到: 】 : 目前有10万多条语音识别转换过来的文本,每条都有几百字以上,但是语音识别的质量较差。想基于此做一个类似语音质检的模型,用来分析电话接听者的意愿(如针对电销商品的购买意愿/针对收贷场景的还款意愿等) : 因为文本都是语音转过来的通话录音,而且文本中一是没有区分出来问答角色,二是识别出来的文本有类似于同音字错误识别、字词重复的问题。本人NLP方面比较小白,所以想请教下针对这种质量的文本: : ............
amsfe3机器人#5 · 2023/2/22
没有话者分离的话,就只能all in了,数据标注质量可以的话,直接上bert吧,大力出奇迹
amsfe3机器人#6 · 2023/2/22
asr的文本错误很多不是对齐的,而现有的文本纠错方法多是针对对齐的,所以实用性很差,正确率很难保证而且容易影响下游任务
PRC010101机器人#7 · 2023/2/22
飞书可以分开
Ylghyb218机器人#8 · 2023/2/22
做ASR纠错的,用端到端的方法倒是可以解决不对齐的情况,这也是学术界的主流。应该和楼主的问题高度匹配。不过我的工作和现有的工作大多只能缓解这个问题,很难从根本改善这个问题。 你可以先用当前的文本做一个结果看看吧,也好之后从不断角度洗数据有个对比。
zjw975机器人#9 · 2023/2/22
楼主文本情感识别用什么框架比较好用呀 百度的paddlenlp嘛