●业界自研ASR能力
拥有自主知识产权的语音识别算法,海量行业数据训练,准确率高
●垂直领域场景的丰富数据积累
拥有200+个项目的落地实施经验,能够高效完成数据标注和模型训练
●支持多语种/方言
支持标准/带口音的普通话,粤语、英语、四川话等多种识别模型
●业界自研TTS能力
基于深度学习和端到端技术,自主研发拥有自主知识产权的语音合成技术,提供“云+端”合成能力
●支持多语种/方言
支持中英粤多语种文本实时、准确地转换为自然、流程的语音,MOS第三方认证可达4.85,多音色可选
●领域知识图谱
解决语义歧义性,支持语义的逻辑推理与验证。
●多轮对话
结合用户的对话历史信息,精准理解当前用户的输入。
●任务驱动的对话自然语言处理
在对话过程中,根据当前状态决定下一步动作,辅助用户完成信息或服务获取的任务。
●长时记忆和短时记忆
根据用户输入历史,不断更新用户画像,区分用户的长时特点和短时需求。
●自主研发的非结构化数据分析技术
●支持对语音、视频等非结构化数据灵活存储和分析。
●拥有自主知识产权的规则分析引擎
●亿级数据秒级分析,准实时反馈分析结果
●高精准唤醒率+误唤醒率
●唤醒率>95%;误唤醒率<2次/100小时
●支持唤醒词定制
●客户可以定制个性化唤醒词
●支持唤醒词和指令连续说
●基于成熟的语义理解引擎
●丰富的上下文处理方式
●丰富的回答生成方式
●动态调整对话流程
●声信号转换成电信号
再用计算机进行识别,主要利用了声音的独有性,对说话人进行辨认和确认
●智能语音质量检测
通过算法智能检测语音,是否存在采集人未报身份信息,情绪不稳定,机械重复内容等问题
●支持多种采集模式
支持对话模式,朗读模式等,可定向采集被采集人员的语音