产品优势
支持普通话/中英混合等多语种及方言海量数据不断更新,语音识别准确率持续提升。
高准确的识别率
版基于先进的深度学习算法,安静环境下近场语音识别,中文普通话字准确率超过96%。
灵活的接入方式
线路质量高,接通率高,保证50%以上接通率
毫秒级低延迟识别速度
识别结果响应时间低于300毫秒。快速的系统响应,提升用户交互体验。
专业的业务领域
针对8K\16K的呼叫、客服场景,进大量的业务场景优化。针对呼叫的VAD及降噪进行定位优化。
声纹识别
基于声纹能力,实现对发音人进行有效区分。
接入方式
多种集成方式
SDK:终端设备集成 API:服务端调用集成
多种输入方式
WAW MP3...
多种采样率
8k 16K
部署方式
公有云调度 本地化部署
功能介绍
一句话识别 对一句话短音频文件进行识别离线版本支持超过1分钟时长的识别。
录音文件识别 实时语音识别
语言支持
暂只支持中文普通话
音频格式
支持wav、pcm等音频格式
音频编码
支持8k、16k的单声道音频流,支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms(建议为20的倍数)
应用场景
智能客服
实时语音识别,实现对业务问题的智能语音理解、智能回答,覆盖业务咨询,业务办理、营销获客等多个业务场景,实际为客服中心增本增效。
智能质检
通过对呼叫中心的录音文件识别得到文本,通过之间规则进行分析。完成人工难以完成的超大规模电话录音质检工作,提升呼叫中心人员的服务质量和服务效率。
会议转写
通过对会议录音文件识别生成文本,智能标点断句,高效辅助业务人员撰写会议纪要,节省大量录音回听时间,提升业务人员的工作效率。