语音质检

语音质检系统是一个专门用于在复杂、嘈杂环境下对语音数据进行质量检查和评估的系统。它结合了先进的语音识别技术、自然语言处理以及特定场景的优化算法,能够针对金融、邮政、保险等行业的实际需求,提供高效、准确的语音转文字及内容分析功能。

640.png

产品原理


问题:

实用场景中,通常语音质检场景的现场情况复杂,无法依赖以逐字匹配为主的传统ASR语音识别技术。

例如:

远场环境

拾音器与讲话人距离较远

环境嘈杂

干扰音源多,多人讲话

讲话随意

临时发挥的脱稿讲话内容

夹杂解释说明、方言


动态话术匹配

高效率语音语义识别

640 (2).png

产品工作流程

针对复杂来源音频优化

质检引擎:ASR+NLP


⭐ASR:

提供基础语音转写文字能力

⭐NLP:

适配复杂场景、提供识别结果与动态话术匹配能力


语义分析引擎

引入word2vec,计算语义相似度

⭐词匹配,对每个短句分词,综合计算

⭐拼音相似度,模糊匹配

⭐引入阈值模型,通过调节阈值避免过度匹配

⭐支持同义异构句型匹配


弹性

占位通配符,表示数量不限的随机文字:

我的身份证号码是___________

动作说明标记,表示不计入匹配结果:

(此处应向客户出示证件)

可选内容,表示存在多种可能:

本产品为(净值型/预期收益型)


方言数据采集

⭐适用于方言数据采集

⭐动态生成话术

⭐灵活分配任务

⭐众包交叉校验

640 (4).png640 (5).png640 (6).png

方言数据采集工具应用界面

产品优势

高性能


⭐无需GPU支持

⭐低成本硬件即可支持50路以上并发,单日处理时长≥900小时

⭐通过场景优化,匹配准确率≥85%


支持复杂环境

⭐支持边缘场景

可在算力不充足的边缘侧、无GPU的服务器上离线运行

支持中远环境

可应用于中远环境中,比如环境嘈杂、多人说话等情形。


自适应评分机制

⭐定制化设定

使用过程中引擎迭代不断优化,提供话术和语音语义识别匹配程度的打分,可以根据客户要求灵活设定阈值。


支持API

支持RestAPI,方便与其他系统相互集成。


迭代优化

⭐针对场景的优化

针对场景定制化训练

⭐针对预期文本(话术)的优化

良好的话术扩展性

掺杂方言的模糊匹配

⭐针对匹配结果的迭代优化



中科海微的智能语音质检系统可以通过语义深度学习机制和语音识别算法,实现对于语音记录的自动处理、自动质检算法。
通过标准化调试和定制化训练,产品可辅助于金融、保险、客服或其他窗口行业涉及到电话、语音服务等交流场景。