基于 RTL8723DS +A113 开发的智能音箱模块设计的具体方案

- 2024-06-02 - 江南体育意甲尤文图斯官方区域合作伙伴

产品详情

  AI智能音箱是AI与传统音箱结合的产物。其基础原理是用户使用自然语言与机器(即音箱)交流,音箱通过识别用户的语音指令完成相应任务,如点播音乐、收听新闻、设置日程、查询信息等。当今AI智能音箱,已被认为是物联网时代的入口,在去年成为了各大厂商争相投入的风口。因它不单单是一台单纯的音乐播放器,在其背后支撑的 AI 技术才是整个产品的核心,也是各大公司觊觎物联网入口的最最终的原因。经历了2017年的爆发式增长,到现在AI智能音箱慢慢的变成了最热门的硬件产品之一,因此各种客制化的产品如雨后春笋般的喷涌而出。

  鉴于市场的蓬勃发展,我们审时度势,推出基于“RTL8723DS +A113”开发的智能音箱模块设计,更便利工程师的应用需求,注意 Amlogic/A113开发手册目前只面向 Rokid 开发者提供。如未注册成为Rokid 开发者,请先至 Rokid 官网注册成为开发者,具体请访问。

  1.1. Rokid语音整体方案 通过接入Rokid智能语音服务,您可以为配有麦克风和扬声器的联网硬件设备添加语音交互体验,使得您的手机、电视、音箱等智能设备轻松拥有语音交互的能力。

  · Rokid语音整体方案,融合了从前端硬件的远场拾音、降噪、回声消除等技术,到语音识别、语义理解、自然语言合成等AI技术和iot物联网技术,提供硬件到软件全链路解决方案,助力开发者快速实现产品的智能化。

  · Rokid语音整体方案,还针对行业或者特定场景,提供行业和场景解决方案,包括传统制造业,运营商以及互联网行业和智能音箱解决方案、儿童故事机解决方案、智能电视解决方案

  同时,平台还提供了包括内容类、工具类和互动类等不一样的垂直语音技能。您的设备接入Rokid后,就可以使用众多丰富有趣的 Rokid 公有技能,您也可以为自己的设备创建个性化的私有技能。

  · 全链路通用方案:包括前端语音激活/降噪以及 Rokid 语音识别服务和语音合成服务的相关能力。

  · 基础语音模块:基础语语音服务的输出,包括语音识别服务和语音合成服务。

  · 全开源方案:YODAOS系统,可根据厂商或者个人开发者的需求,灵活修改,也欢迎开发者一起建设。

  1,支持实时快速、精确的云端识别和远场拾音, 5米距离识别准确率高达92%。

  2,识别输出支持流式格式,能够实时地得到当前识别的结果,根据字段判断是否返回最终结果。

  3,为保证用户口音和生僻字、方言的识别,针对用户粒度配置误识别较高的纠错指令,通过app端的人工干预,进行识别的纠正。

  4,支持通用领域识别和垂直领域定制识别,定期增加领域数据,快速迭代,持续提升识别率。

上一篇:【48812】2023第十八届南宁(东盟)世界视听展在南宁举办 下一篇:宅家好物推荐怀旧聆听新体验!飞利浦一体式迷你音响M5008评测