普强智能机器人全新升级|采用双擎打断技术,超强抗干扰能力,毫秒级响应,反应速度提升200%
浏览次数:
普强近日全新升级“语音打断引擎+语义打断引擎”双擎打断技术,抗干扰能力大幅提升,最快实现500毫秒内即刻响应,反应速度提升200%。助力让人机交互从“能听懂”到“会理解”进一步跨越,智能机器人智能化全新升级。
随着人工智能在数字化转型时代扮演着越来越重要的角色,实时对话式AI日渐全面普及,智能语音机器人产品与智能机器人(智能客服)解决方案在智慧金融、智慧政务、智能车载、智能家居、智能社交等场景中得到广泛应用。
但实际项目案例中发现,当前很多对话交互过程中存在较多不便捷因素。比如传统IVR系统菜单选项列表较长,限于流程,用户普遍等待时间较长;随意打断功能造成当系统检测到任意语音时,会立即中断对话(停止播放当前提示并开始收听用户说话),但机器人在收录外界声音时可能不仅仅是相关主题声音,也可能收录环境干扰音、周边人说话声音、对讲人在通话过程中和其他人说话的声音等等,在多次被误打断后,无论最终是机器人自动转接人工服务,还是客户主动挂机,无疑都影响了智能客服业务办理通过率…
既然我们既需要打断,又要避免误打断,该如何实现智能打断呢?
普强基于ASR、TTS引擎能力与多行业项目与案例经验积累,实现新一代“双擎打断技术”全新技术升级。新一代“双擎打断技术”,将传统语音检测方法与自然语言理解能力相结合,实现“语音打断引擎+语义打断引擎”双擎打断。通过模拟人人对话逻辑,在人声识别的基础上进行意图理解,有效识别外界噪音/无效声音干扰,避免干扰语音不停误打断机器人播报,保障了业务对话的顺畅性,有效提升机器人应答速度和一次性问题解决率。
普强双擎打断技术可实现最快500毫秒内极快响应速度,响应速度超市面主流200%。
01
过滤无效噪声,扫除基础障碍
实现智能打断的第一步,是能够在嘈杂噪音环境下,清楚地识别出人声,普通vad可对任何声音进行无差别打断,既降低效率,又影响了客户体验。
vad人声检测技术可以区别出噪声和人声,普强通过音频降噪和语音识别降噪,共同抑制噪声能量,过滤无效噪音,实现人声能量增强。
02
vad人声检测+语义判别机制
避免无关联话题干扰,实现智能打断
普强双擎技术,采用“vad人声检测+语义判别机制”,将普强自主研发的ASR引擎与NLP引擎相结合。在区别无效噪音与人声基础上,结合普强理解引擎,利用语义规则和深度神经网络相结合的方法,对文本进行字符、词语、句子等不同层次的语义处理,实现有效理解和无效拒识。仅相关话题能够中断TTS播报,并给出新的话术,无关联话题对播报无任何影响(避免无关联人声输入干扰)。
即当你与普强智能机器人对话过程中打断它时,它能准确识别出你的声音、理解你的意图,并对相关话题做出回应。噪音和无效人声通通不识别,不相关话题无干扰,实现有效人声理解并智能打断。
03
“全双工+预合成方案”
最快响应速度<500ms
通过“语音打断引擎+语义打断引擎”策略,实现外界噪音/无效声音精准识别排除,相关主题内容的有效输入并完成打断基础上,普强更采用“全双工+预合成方案”,实现毫秒级响应速度与超200%反应速度提升!
全双工技术灵活利用普强全自研ASR、TTS、NLP等底层引擎能力,使机器人实现语音播报的同时能够实时监听并处理用户的输入,并及时给出识别理解结果,快速提升数据传输效率。
而语音预合成技术,利用普强语音合成优势能力,通过对机器人语音交互过程中涉及到的对话内容,进行快速预先合成,实际交互过程中,直接调用预合成录音,省去了实时合成所消耗的响应时间和资源占用,同时解决了端到端TTS在语音交互场景下响应速度慢的问题。(普强语音预合成技术相较于目前市面主流实时语音合成方式,响应速度提升超10倍)
普强通过“全双工+预合成方案”,真正实现有效打断后,机器人快速500毫秒内响应,响应速度较当前市面主流速度提升 200%。
目前,普强智能语音机器人可提供智能、灵活、完整的人机对话服务,通过融合多种人工智能和语音技术(语音识别、语音合成、语义理解),实现内外部多渠道知识应答,灵活对接第三方业务系统,可快速高效完成包括自动拨打、自动应答、自动分类、智能填单、智能分析等枯燥重复劳动。
普强智能客服解决方案已广泛覆盖金融、政务、酒店、汽车、园区、家居等多个行业场景的头部客户,并积累丰富运营与项目实施经验,复购客户占比超50%。
普强智能机器人正通过不断升级,让人机交互更具备亲和力和逻辑思维能力,让整个对话体验更自然,为企业客户提供更高效率、质量精细的对话式人工智能服务,实现更科学有效的数据管理,以科技优势驱动金融及各行业实现智能与数字化转型发展。