【问题】语音转来的文本质量太差，如何做情感分析

ls2015213295

2023/2/21镜像同步9 回复

目前有10万多条语音识别转换过来的文本，每条都有几百字以上，但是语音识别的质量较差。想基于此做一个类似语音质检的模型，用来分析电话接听者的意愿（如针对电销商品的购买意愿/针对收贷场景的还款意愿等) 因为文本都是语音转过来的通话录音，而且文本中一是没有区分出来问答角色，二是识别出来的文本有类似于同音字错误识别、字词重复的问题。本人NLP方面比较小白，所以想请教下针对这种质量的文本： 1.预处理除了删除停用词，还有哪些方法可以应用？ 2.如果预处理后，文本质量仍然较差的话，做分类会不会效果很不好？ 3.可不可以先做比如“主题提取”，然后用生成的文本再去做分类？ 4.分场景去做分类（如销售某类商品场景/收贷场景），会不会效果好很多？文本比如：“这边是XX补护都放工作人员和您对接XX付务欠款的，你在这边有笔期欠款那这边还有意院协商处理吗，跟那个今前前商处理的人说过了呀，看概要到七月份啊，七月份再来招啊，今年七月月月月份，今年七月份。我，我看到有车金录上面显示说您贷还其他欠欠款但是。。。。。。晚上，之前吧好把钱存进好吧，嗯，存进去这个是要转进去通过手机银行转进去，我转进去好了，好吧，嗯好的我这边把对公众户发给您好吧好，嗯嗯好的那您先忙好吧。” 请dalao指教！敬礼！

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

wooops机器人#1 · 2023/2/22

第一个区分对话角色我感觉是语音那块要做的事吧，纯nlp没有语音信息很难区分。第二个就涉及中文文本纠错了，这块论文挺多的你可以网上查查。

qwerasd机器人#2 · 2023/2/22

说真的nlp门槛不高，但想做好能用非常难。

l9294机器人#3 · 2023/2/22

我是做语音的，关于角色区分，如果能拿到音频的话，可以先用VAD把句子切好，然后再拿去识别，这样断句效果应该会好很多。区分说话人也最好是语音这边先做好。如果对话都是只有两个说话人，而且说话人音色差异比较大的话，可以很简单地根据音频特点，比如基频这些做一些区分。也可以标一点数据，用一个简单的模型来区分两个音色，会比单纯用文字判断角色好很多。

BruceWayne94机器人#4 · 2023/2/22

先speaker diarization把两个人分出来再做asr 【在 ls2015213295 的大作中提到: 】 : 目前有10万多条语音识别转换过来的文本，每条都有几百字以上，但是语音识别的质量较差。想基于此做一个类似语音质检的模型，用来分析电话接听者的意愿（如针对电销商品的购买意愿/针对收贷场景的还款意愿等) : 因为文本都是语音转过来的通话录音，而且文本中一是没有区分出来问答角色，二是识别出来的文本有类似于同音字错误识别、字词重复的问题。本人NLP方面比较小白，所以想请教下针对这种质量的文本： : ............

amsfe3机器人#5 · 2023/2/22

没有话者分离的话，就只能all in了，数据标注质量可以的话，直接上bert吧，大力出奇迹

amsfe3机器人#6 · 2023/2/22

asr的文本错误很多不是对齐的，而现有的文本纠错方法多是针对对齐的，所以实用性很差，正确率很难保证而且容易影响下游任务

PRC010101机器人#7 · 2023/2/22

飞书可以分开

Ylghyb218机器人#8 · 2023/2/22

做ASR纠错的，用端到端的方法倒是可以解决不对齐的情况，这也是学术界的主流。应该和楼主的问题高度匹配。不过我的工作和现有的工作大多只能缓解这个问题，很难从根本改善这个问题。你可以先用当前的文本做一个结果看看吧，也好之后从不断角度洗数据有个对比。

zjw975机器人#9 · 2023/2/22

楼主文本情感识别用什么框架比较好用呀百度的paddlenlp嘛