当前位置：首页 > 跨境AI语音 > 正文

发布会跨境AI语音-发布会跨境ai语音软件

wasd8456 发布于2024-11-12 11:34:31 跨境AI语音 41 次

具备AI双麦降噪功能的Voitist音旋风612正式发布，怎么看？

具备AI双麦降噪 功能的Voitist音旋风612正式发布，怎么看？

今年2月底，探境科技发布了由低功耗系列、主打系列、旗舰系列组成的三大系列、6颗AI芯片组成的产品矩阵。其中，探境发布了具备AI双麦降噪功能的语音识别方案，即Voitist音旋风612，这也是首个离在线一体的语音识别解决方案。

AI降噪+HONN 无惧家居噪音

信噪比，是衡量需要识别的目标声源与其它干扰声源强度比值的对数。一般将信噪比低于15dB的称为噪声环境。信噪比越低，识别难度越大。

（图片来源网络，侵删）

在语音识别的研发过程中，一个完整的识别链路可以简化为麦克风输入、降噪处理、语音识别、识别结果输入四个环节。想做好识别，首先要在降噪处理上下功夫。

据探境科技副总裁李同治介绍，为了验证探境AI降噪算法的有效性，他曾将一批信噪比在3dB左右的语音数据送到一个知名的云端公开语音识别引擎做了测试，降噪后比降噪前提高30%识别准确率。

在传统的语音识别算法里，用的最多的是全连接的操作，叫DNN/DTNN。相比较于全连接操作，卷积操作能够提供更高的计算强度，且卷积运算与人类大脑负责感知模块的处理方法类似，能够提取满足大脑认知的本质特征。

（图片来源网络，侵删）

探境将其计算机视觉中的一些经验迁移到语音识别中，在语音识别算法上加入了更多的卷积操作，重新设计了一个高计算强度的神经网络，即HONN(High Operation Neural Network)。

正是依托于AI降噪技术+HONN神经网络，探境的Voitist音旋风611，可以覆盖绝大部分的生活场景，无惧各种噪音干扰。

端到端双麦加持攻克0dB环境

（图片来源网络，侵删）

为了提升低这些场景下的识别率，还需要使用麦克风阵列来增强语音信号。探境在双麦算法上有自己的独门绝技—FCSP双麦识别算法。”

“为了克服传统分模块语音增强算法的这些缺点，我们设计出了基于FCSP的端到端AI双麦算法。”李同治对记者表示。FCSP(Frequency Complex Subspace Projection)是探境自研的频域复数子空间投影算法的简称。

这个算法直接输入阵列信号，输出的是最终的识别结果，中间部分全部交给基于深度学习的AI算法来处理，不再使用传统的数字信号处理方法。信号增强与识别模块整体以降低识别错误率为目标进行优化，避免了语音增强与语音识别模块错配的问题。

“端到端”是目前国际上最前沿的处理算法。通过AI语音算法+HONN神经网络模型来提升识别率，再通过FCSP“端到端”的双麦处理算法简化识别流程，降低最终识别错误率，探境的语音算法实现了跨越式的升级。

探境自研的***A架构，以存储驱动计算，具有能效比高、***利用率高、通用性强等特点。在***A架构上实现深度学习时，只需要一个较高层次的神经网络描述。***A的编译器首先将这个神经网络进行全部融合，然后根据具体架构实现的规模产生一个统一的存储流图，再进行存储节点的时空映射，最后根据各个节点之间的计算类型配置计算单元，组合起来形成一个统一的固件供***A控制器使用。

在28nm常规工艺芯片的对比测试中，***A架构在乘法器数目相同情况下，结果如下表。(DRAM为LPDDR4)。

这意味着***A架构所***用的各种微观和宏观调度算法，比较“类CPU架构”***用的基于总线和指令集的映射方法，在近似存储量、近似算力、近似外部存储带宽、近似功耗约束的前提下，可以获得8~12倍的利用率收益。

“***A(存储优先)架构是探境的产品基石，正是借助***A的优势，我们的AI芯片产品才能‘裂变式’的推出，大大加快了探境的商业化落地速度。”探境CEO鲁勇这样评价***A架构的意义。

“探境不仅仅是一个语音芯片公司，而是一家语音、图像整体结合的AI芯片公司。AI芯片这一领域不像手机 APP那样，瞬间可以凭一款应用获得数百万的用户，AI芯片更像马拉松长跑，比的是耐力，而不是冲刺速度，在这场比赛中，不是要看谁跑得快，而是要看谁有潜力到达终点，谁在中途不走岔路。”鲁勇向记者表示。

12月26日，探境科技举办“黑科技发布会”。在会上，探境科技正式公布自己的AI语音识别芯片产品矩阵，介绍其核心架构为***A，同时，正式推出具备AI双麦降噪功能的语音识别方案即Voitist音旋风612。

探境科技是于2017年3月成立，是一家致力于语音、图像AI芯片的AI芯片设计公司，主要提供软硬件一体化的整体方案。

探境科技的产品主要***取***A核心架构，这是一种面对AI芯片里存储墙的问题而设置的架构，主张以存储驱动计算。与“类CPU架构”相比，***A架构数据访问可以降低10至100倍，同时如果在28纳米工艺条件下，***A架构系统能效比将达到较高水平，可达4T OPS/W，计算***利用率高，对DDR宽带的占用也会大大降低。

探境科技CEO鲁勇称：***A架构具有通用性，可以支持目前所有的深度学习神经网络，同时，它对神经网络参数以及数据类型没有限制。就算是没有任何经验和基础的用户也能够轻松驾驭、使用工具链。

自2018年推出***A架构之后，两年内，探境科技首先推出语音芯片，完成语音芯片的量产，量产超过百万，合作伙伴多达30多家，包括海尔等著名企业。而图像芯片已在2019年Q4流片成功，核心能效比可以达800 IPS/w这一高水平，同时图像芯片在一些领域已经处于盈利模式。

2019年9月，音旋风611 开始量产，目前出货量已经超过百万，取得了不错的成绩。此次Voitist音旋风612也正是在前者的基础上，对语音识别算法，尤其是AI降噪算法、端到端算法进行了进一步的升级，为消费者提供更为优质的体验、使用效果。

探境科技副总裁李同治表示：目前在语音研发领域，尤其是智能家居语音研究领域还存在较多问题，其中最为主要的有低音噪比、信号差、接收不及时、多声源、非稳态的噪声等问题，为此，探境科技将会通过高计算强度的神经网络、AI降噪算法以及双麦算法，解决在降噪和语音识别这两个环节的问题。

对于语音识别产品，还有一个十分重要的问题就是如何处理信号问题。目前，传统的解决方案主要是利用麦克风阵列信号增强算法，但这一方案过度依赖声源定位、无法降低降噪比且对元件的要求极高，难以达到较高的语音识别效果和降噪效果。

根据这一情况，探境科技则是把增强和识别进行一体化的处理，从而实现端到端的识别，同时，***用基础于神经网络的AI算法，来增强信号，提高信号的接收速度；推出端到端AI双麦算法，并将其与FCSP相结合，提高准确度。

在这些解决方案的基础上，Voitist音旋风612将呈现更为优质、更加低噪、更为及时的语音识别效果，接下来，让我们一起拭目以待吧！

查看更多有关于 #语音 #识别 #降噪的文章。

转载请注明来源：http://www.gxo-tech.com/post/4099.html

[免责声明]本文来源于网络，不代表本站立场，如转载内容涉及版权等问题，请联系邮箱:83115484@qq.com，我们会予以删除相关文章，保证您的权利。

收缩

业务咨询

飞机号：@hpx639

最新文章

国外跨境AI语音宣传案例-国外跨境ai语音宣传案例分析

谷歌和亚马逊在语音业务的布局上有什么不同之处？世冠杯境外战队语音曝光，EMC心态超乐观：“别怂，输了就输了嘛”，如何评价...
国外跨境AI语音宣传-国外跨境ai语音宣传平台

雨果网是干什么？钉钉国际化了吗？雨果网是干什么？雨果网于2014年7月正式进军跨境电商行业，是跨境电商智能服务平台。雨果...
国外跨境AI语音-国外跨境ai语音网站

邮政银行卡怎么查询境外消费额度？华为天际通开通东南亚包括香港澳门吗？10月有哪些人工智能展览会？邮政银行卡怎么查询境外消...
国外的跨境AI语音-国外的跨境ai语音软件

跟着视频学习英语怎么样？在线班报哪家？国外导航软件哪个比较实用？跟着视频学习英语怎么样？在线班报哪家？这个要看你自己的一...
国庆快乐跨境AI语音,国庆快乐跨境ai语音下载

福建仙游疫情源头入境40天才核酸阳性，这次病毒还是德尔塔吗？听说今年国庆节疫情还要爆发一次，不知道是不是真的？福建仙游疫...

热门文章

15跨境AI语音,跨境电商语言服务

世冠杯表演赛炸麦语音曝光，久诚英文指挥官“goblue”反蓝，猫神全程傻笑,你怎么看？苹果怎么拦截境外来电？西昌话的由...
2022跨境AI语音冰箱推荐,

海尔冰箱哪款好2022？2022年冰箱流行什么颜色？2022建议买的冰箱能效等级怎样选？雪祺电气怎么样？海尔冰箱哪款好2...
阿里跨境AI语音模拟真人直播,阿里跨境ai语音模拟真人直播

阿里巴巴国际站直播效果好吗？网易考拉“卖身”阿里，丁磊打不动了吗？阿里妈妈到底是干什么用的？如何使用阿里跨境宝？阿里跨境...
360跨境AI语音助手引擎,360跨境ai语音助手引擎下载

天籁优享版360使用方法？360tts是什么软件？360借条语音助手怎么关闭？讯飞语音助手安装不了？360相机语音助手怎...
阿里跨境AI语音库-阿里跨境ai语音库官网

如何评价阿里达摩院发布自研语音AI芯片技术，计算效率提升百倍以上？阿里的人工智能叫什么？天猫精灵能远程对讲吗？阿里tv助...

随机图文

此处不必修改，程序自动调用！

最新留言