新闻动态
十年积累,深受各行各业客户的信赖

“技术为我所用”-论智能语音商业应用的难点和建议

发布日期:
2021-12-12

浏览次数:

随着语音的场景化解决方案愈加丰富,语音交互作为人机交互的重要演进方向,正逐步渗透到人们的日常生活与应用当中。而在产品化过程中,必须与真实使用场景紧密贴合,符合不同目标群体对于语音产品实时性和准确性的需求。

 

“技术为我所用”-论智能语音商业应用的难点和建议 

 

更多的落地场景和经验,意味着可以帮助客户更快更准地定位问题,快速反应,快速上线。大部分客户需要的不仅仅是技术,而是一整套解决方案,帮助优化改造业务流程、指导项目以及总结经验,交流分享。基于“高度重复构件的组合+部分的差异化定制”,才是项目成败的关键。

就现在的实际情况来说,语音识别技术和应用产品如果希望有更好的表现,还是要像过去几年那样持续不断地做数据训练:不同地域口音方言的训练、不同行业专业词汇的训练。可以直白地说,哪家供应商的数据经验积累越多,投入的针对性训练越多,行业纵深越下沉,优化得越多,哪家的应用表现就越好。所以传统上积累越多的厂商优势则越明显,这就是要从应用发展的角度来理解语音识别技术应用的发展。

 

既然数据和训练的投入是持续的,而且硬件及训练的成本也困扰着场景的落地化,那么,基于成本和效率,一味地追求更高的转译准确率是否值得,也是需要深入去思考的。

 

从商业落地的角度来说,供应商的准确率从80%-85%,与85%-90%的训练代价在成本和时间上的投入,与客户相比是无法对等的,后者在训练周期与时间成本上很可能是前者的5-10倍,而过度地追求准确率会严重拖慢项目上线的时间进度,会加大人力投入。那么我们在实际应用中应该如何选择呢?

 

我们的建议是以场景应用为导向,关注实施的执行而不是过程,让“技术为我所用“,而不是”我为技术所累“。不是关注”全文识别率准不准“,而是”我要识别的那部分准不准“,因为绝大部分真实业务场景下的语音应用均是限定在某个特定范围内。

 

以语音质检为例,大部分质检的实际工作真实关注点是所谓的“质检项”是否满足即可,全文的语音转译是否准确在该场景下是一种类似”白噪音“的存在,准确与否在大多数的情况下并不会影响该场景的真实应用,这就是一种“应用为先”的思考考量。

 

“技术为我所用”-论智能语音商业应用的难点和建议 

 

因此,请不妨尝试着以这个思路来分析一下你手中的业务场景:“你想要识别的内容”应该不会太多,所以,语音识别并不一定需要非常高的准确率,它无碍于你去利用该技术实现语音文本分析及探索业务价值。

 

图像识别技术(OCR)就是一个很好的案例来说明这个问题,从普遍的识别准确性来看(类似于语音的全文转译准确率),OCR并不成熟,但其在停车场上的车牌识别上却非常普遍好用,就是利用了这种场景下的针对训练(车牌识别所需的范围是相对可控的),这就是上面所说的“应用为先”的思考思路。

 

“技术为我所用”-论智能语音商业应用的难点和建议 

 

在呼叫中心领域,智能语音问答、智能语音分析以及实时语音监控就是很有意义的应用,不仅为企业与海量用户之间建立了快捷有效的沟通方式,还为企业提供了细粒度知识管理技术以及精细化管理所需的统计分析信息。

具体有以下应用可以考虑:

 

· 简单指令和有限字词识别:其一,关键词辅助指引。在人工和客户通话过程中,系统自动根据预设的关键字词调取相关的知识库内容展示在页面上,大大提高了座席获取知识库知识的效率。其二,辅助录入和自动填写工单。将客户说的话,直接转化成需要录入的文字内容,节省大量的录入时间,或者避免座席录入的随意性和不可控性。

· 智能语音分析:实现全量业务语音数据可视化,通过不同业务场景进行管理,快速验证是否可实现有效的团队管理;通过构建报告体系,挖掘营销与服务过程中的问题,从而能够快速定位影响效率的关键因素,可针对性地增强座席在实际工作中技能薄弱的环节。

· 智能语音问答:用“有限内容”去匹配业务,限定语音识别的字词范围和智能机器人的问答范围,可以使落地更加容易。更简单一些的回访,即使不用任何智能问答的成分,仅去识别客户回答中的某些关键词,通常就可以满足业务需要。

· 实时语音监控分析:实时展现现在来电客户所关注的问题,能够马上发现一些热点的异常变化,这样就不用在来电量发生突然变化的时候,去问座席“有什么异常吗/有什么来电特别多吗”,也不用等不怎么准不怎么细化的来电语音分析, 也不用等事后的语音分析。

· 智能语音要实现真正的商业落地,需要深入剖析场景真实环境,结合行业专业知识体系,将语音技术脱离试验转向务实,才能与产业紧密贴合。结合软件的基础服务和硬件的终端服务,语音的场景化解决方案将更加丰富。关于具体的应用和场景,我们将另文详细讨论。