智能语音优势

Intellgent Voice Advantage

核心技术

Core Technologies

语音识别与合成

基于声学模型对未知语音帧序实现识别,可对指定行业建立识别模型进行特别优化,用户只需通过说话(普通话、方言、外语)即可达到识别目的,还可提供多种合成音色供用户选择,可根据喜好随时切换。

语音唤醒与控制

将语音提取声学特征、识别解码,进行置信度判决。唤醒成功后即可获取识别结果。使用者只需要对着话筒说出即定的唤醒词即可。支持5米远场拾音,轻松控制您的智能设备为您执行声音控制、预约定时、音乐播放、讲笑话、天气预报、菜谱查询、英语教学等100多项服务,也可自由交互,聊天对话。

物联网与硬件开发

通过对传统物品的物联网改造,让 “万物开口说话”,实现语音交互、语音播报、语音控制、远程管理、云端上传、自动报警和自动定时等多种智能语音功能,可与门禁系统、家居系统、车载系统、测量工具等实现完美匹配,支持PC机、移动设备(如智能手机、智能腕表、 平板电脑等)等多端管理。

声纹识别与特征提取

通过把声信号转换成电信号,再用算法对声纹特征进行提取,最后结合语音识别进行内容鉴别,通过三步,小漫科技的声纹技术极大提升声纹识别的辨别准确率与使用安全性。在使用范围上,声纹识别是世界上仅次于指纹和掌纹的生物特征识别,并有适用人群不断上升的趋势。

机器画像与大数据

小漫科技为每一台机器或设备建立机器画像系统,自动建立画像标签,如名字、性别、年龄、工作地点、音色、爱好、特长等,让每一台机器都匹配更多的“人性”。同时,小漫科技还拥有百万级用户画像数据,与机器设备共建画像大数据系统。

意图识别与机器决策

利用语音交互后的识别结果,采用自然语言处理及文本挖掘算法,构建各类实体词及其依存关系。通过结合小漫自主研发的海量知识图谱库,推测用户的精准意图。为不同行业客户提供机器决策的智能化服务。

深度学习与多轮对话

机器通过神经网络技术模拟人脑的分析学习能力,建立一种有监督或无监督的深度机器学习模型,来解释声音、文本数据。通过长期的真实数据训练,模拟及实现人类的思考方式,通过不断获取新的知识及技能,从而实现多轮对话的层级快速提升

场景算法与智能推荐

根据业务场景的实际情况,建立可以解决业务场景问题的语音智能算法模型,搭建场景并进行语音相关算法的优化,提升特定业务场景下的语音交互效果。同时,通过对使用者的历史行为数据分析,可自主判别用户群体之间的相似度,进行智能分类,为使用者主动推送最符合需要的操作,或喜爱的内容。