可信AI年度观察 | 智能语音产业需求不断升级,评测重点由技术转向产品

news2025/6/9 17:39:51

自《新一代人工智能发展规划》发布以来,人工智能发展已上升为国家战略,在“十四五”规划中,更是将人工智能列为科技前沿领域的“最高优先级”,国家政策支持为人工智能产业发展提供良好环境。同时,各行业逐渐重视改善价值链、追求降本增效,企业数智化转型需求为人工智能产业发展提供强劲动力。智能语音作为人工智能最为成熟的技术领域之一,其应用价值及落地成效尤为凸显。

一、行业观察

智能语音作为人机智能交互的关键接口,在各个行业中的普及程度逐渐提高,其应用领域正在呈现多元化的发展趋势,据德勤数据统计,2030年智能语音市场规模将超过千亿,智能客服中心、车载语音及智慧家居助手等产品的市场需求位居前列。

1、智能语音应用规模化落地,产业与实体经济加速融合

在车载领域,智能语音已成为车内车外人机交互关键环节,随着智能车载前装渗透率逐渐走高,消费群体和需求的规模化涌现,车载助手将迎来进一步市场增长点。在文娱领域,随着有声阅读的兴起,用户对听书产品功能的依赖度逐渐提高,有声读物在欧美市场近年来形势一片大好,在中国也面临巨大增值空间,业内人士认为,到 2030 年,全球市场价值可能超过 350 亿美元。在金融领域,智能语音与对话式AI在优化客服与运营业务及精准营销等业务场景发挥重要作用,据艾瑞统计测算,预计到2026年,智能语音与对话式AI核心产品市场规模将达到108亿元。

2、语音单点技术同质化明显,多模融合交互为突破方向

据艾瑞咨询发布的2022年中国智能语音产品成熟度曲线表明,语音识别已进入稳步上升期,单一技术的产品及服务的差异化竞争大多体现在一些细节上,比如区分说话人、专业领域的词库等,但目前复杂场景下的语音识别难题,仍无法通过单一技术解决。多模融合交互是通过融合多种不同的信息,如听觉、视觉、触觉等,去增强感知的能力,通过分析多维数据,提高复杂场景下语音识别可用性。

3、AIGC迎来发展新契机,为智能语音产业注入新活力

2022年被称为AIGC的元年,AIGC成为全球关注的焦点和热议话题,国内外大企业纷纷在AIGC领域进行布局。AIGC在文本、视频、音频、视频等数据生成方面表现出巨大应用潜力,据Gartner测算,预计2025年超10%的数据将由“生成式AI”创造。AIGC与智能语音技术的进一步结合及应用场景的创新落地,有望将智能语音产业市场推向新一轮高点,如AIGC+语音合成,可在媒体、金融、教育、文旅等领域赋能内容生产创作和业务服务。

二、评测观察

语音合成

从多款产品评估结果来看,音频合成质量持续提升,定制化能力基本具备,合成情感拟人度表现有明显突破,但情绪表现层次仍有进一步提升空间,同时多音字、专有名词、中英混读等评测点表现参差不齐。

语音识别

技术发展已相对成熟,通用测试集识别准确率平均高于95%,但在远场识别、噪声环境识别中各家产品性能表现存在差异,针对吞字、拖音等错误类型需加强纠正功能,在对话重叠场景下的识别准确率仍面临挑战。

声纹识别

技术已经有较多应用落地场景,声纹识别准确率依赖内容及音频时长,克服防攻击、抗时变、抗干扰等干扰因素的能力有待进一步提升。

对话式AI平台

建设进程较为快速,平台及工具的工程化水平相对成熟,对话搭建和快速调优部署等能力已基本完备,但复杂语义理解及对话生成等能力仍有进一步提升空间。

 其他智能语音交互类技术产品

全双工交互系统多表现出良好理解能力,但在断句拼接成功率上还有很大提升空间;车载语音助手评测中,参评产品均具备较为完备的交互系统,但唤醒响应时间及环境影响下的识别效果与期待结果仍有较大差距;智慧助手解决方案评测中,位置和信息感知能力、多模融合、情绪识别、多设备协同唤醒等方面体现技术不足,仍需进一步突破。

三、中国信通院智能语音方向标准研制及评测项目总览

截至2022年底,围绕智能语音技术及产品我院牵头研制国内标准9篇,国际标准1篇,并组织展开多轮评测,参评单位及评测结果如下:

标准方面,截至2022年,我院围绕智能语音领域已完成4项团体标准发布,4项行业标准已进入最后报批阶段,2023年预计重点围绕智慧车舱操作系统展开标准研制工作。

评测方面,2023年将持续投入评测工作力度,上半年评测报名时间为2-6月,下半年评测报名时间定在为7-11月,评测内容包括:

技术类产品评测:语音识别、语音合成、声纹识别及全双工语音交互四类技术基础及专项能力评测

应用类产品评测:推动智能语音端侧产品、智慧助手(全场景/语音助手专项)、车载语音交互系统(首轮评估)、智能对话平台产品服务能力(全平台/能力模块-首轮评估)

评测基础设施方面:建设智能语音语义实验室,搭建评测数据集平台。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/334212.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ChatGPT 支持的搜索引擎 Bing 究竟什么样?

微软于2月8日北京时间凌晨在 Redmond 线下举办一场媒体活动,围绕微软的产品以及 AI,公布最新消息。这里我们先回顾一下微软在 AI 上的布局。 2019年,微软向 OpenAI 投资10亿美元,成为了 OpenAI 紧密的合作伙伴,而微软…

Git学习笔记-详细使用教程

一、定义 Git(读音为/gɪt/)是一个开源的分布式版本控制系统,可以有效、高速地处理从很小到非常大的。 二、Git与SVN的最主要的区别? SVN是集中式版本控制系统,版本库是集中放在中央服务器的,而干活的时…

分享:提升你工作幸福感的11个工具软件!

今天给大家分享11个非常好用的资源、工具网站。不论你是做运营、设计,还是个人生活中的应用,甚至只是提升你在线冲浪的快乐感,你都值得拥有它们。 1,在线一键抠图 https://www.remove.bg/ 免费的软件,自动抠图&…

【官方 | 计算机二级Python教程】第八章:Python计算生态

【官方 | 计算机二级Python教程】第八章:Python计算生态参考书目第八章:Python计算生态本章知识导图8.1 计算思维8.2 程序设计方法论8.3 计算生态与生态式编程8.4 基本的Python内置函数习题本文代码编译环境及版本更新日志参考书目 拜读的是计算机等级考…

mysql安装指定版本详细教程mysql 8.0.28示例

之前出过一版安装mysql5.7和安装mysql8.x最新版本的文档今天根据需求出一版指定版本的安装教程以8.0.28为例https://dev.mysql.com/downloads/mysql/ 下载mysql的官网下载好后上传到服务器安装时会报错公钥URL错误rpm --import https://repo.mysql.com/RPM-GPG-KEY-mysql-2022 …

Python中关于@修饰符、yeild关键词、next()函数的基本功能简述

关于修饰符:其实就是将修饰符下面的函数当成参数传给它上面的函数。 def a(x):print(a)adef b():print(b) 其效果等价为: def a(x):print(a)def b():print(b)a(b())有个记忆诀窍,的下面哪个函数最近,谁就是儿子,谁就…

Windows环境下使用MySQL:实现自动定时备份

一、编写备份脚本 1 2 3 4 5 6 7 8 9 rem auther:www.yumi-info.com rem date:20230209 rem ******MySQL backup start******** echo off forfiles /p "E:\mysql\MySQL BackUp" /m backup_*.sql -d -30 /c "cmd /c del /f path" set "Ymd%date:~0,4%…

[SSD固态硬盘技术 7] 固件概述和固件升级

固件英文叫Firmware,就是“固化在硬件中的软件”,不太恰当但是毕竟好理解的就是:固件就是硬盘的操作系统。固件Firmware是安装在硬盘的一个小记忆芯片上的,用于引导硬盘工作。其担任着一个系统最基础最底层的工作。对硬盘固件&…

2023 AIME 答案与解析 - 第一期

这里放广告 原题目 Five men and nine women stand equally spaced around a circle in random order. The probability that every man stands diametrically opposite a woman is where and are relatively prime positive integers. Find 绿树教育中心独家解析 先选取 5 对座…

知道什么是“事件冒泡“和“事件捕获“吗?那该怎么阻止事件冒泡呢

1. 事件冒泡与事件捕获 事件冒泡和事件捕获分别由微软和网景公司提出&#xff0c;这两个概念都是为了解决页面中事件流&#xff08;事件发生顺序&#xff09;的问题。 <div id"outer"><p id"inner">Click me!</p> </div>上面的代码…

【MySQL Shell】8.7 InnoDB ClusterSet 的受控切换

受控切换使选定的副本集群成为 InnoDB ClusterSet 部署的主集群。在受控切换过程中&#xff0c;确保了数据的一致性。该过程验证所选副本集群是否与主集群同步&#xff08;如果存在复制延迟&#xff0c;这可能意味着需要短时间的等待&#xff09;&#xff0c;然后使该集群成为 …

masscan的常用命令记录

目录 masscan介绍 常见参数 常见命令 输出格式 案例测试 masscan介绍 默认情况下&#xff0c;masscan的发包速率是100每秒&#xff0c;可以通过 ‘–rate’ 命令设置发包速率。 常见参数 --top-port 100&#xff1a;扫描100个常⻅端⼝ --adapter-ip&#xff1a;指定发包…

fwknop的安装和使用测试

SAP名为单包授权&#xff0c;是一种认证方法&#xff0c;它是一种端口敲门的方法&#xff0c;是之前早起端口敲门的升级版本。目的是为了隐藏服务端口&#xff0c;防止DOS等其他网络攻击&#xff0c;保证服务端的安全。SPA的具体定义这里不细说&#xff0c;网上有太多的资料&am…

微信小程序常用组件

文章目录微信小程序常用组件buttoniconimagescroll-viewswipercheckboxaudiovideo微信小程序常用组件 button 简单使用 wxml <view class"container"><button type"default">default</button><button type"default" siz…

配置与管理Web服务器

IIS是一个非常重要的Web服务器组件&#xff0c;包括Web服务器、FTP服务器、NNTP服务器和SMTP服务器&#xff0c;分别用于网页浏览、文件传输、新闻服务和邮件发送。 Web服务的工作原理 HTTP是应用级的协议&#xff0c;主要用于分布式、协作的信息系统。HTTP协议是通用的、无状…

第二章:创建虚拟机

创建Windows server&#xff1a;首先第一步就是打开我们的vm&#xff0c;然后找到上一章讲的主页图标创建新的虚拟机。点击这上面类似的&#xff0c;然后转站。博文地址&#xff1a;https://blog.csdn.net/ryduijftgvhj/article/details/127934939?spm1001.2014.3001.5502视频…

工作进入第七年,开始幻想四十岁的生活

2022年度总结&#xff0c;推迟了一些时间&#xff0c;但终究还是来了&#xff0c;忙里偷闲。 突然发现自己很久没有更新文章了&#xff0c;主要是因为自己换了部门&#xff0c;调整了技术方向&#xff0c;对于新技术不知道该怎么写。 2022年&#xff0c;那就依旧从工作、生活…

今天面了一个来华为要求月薪25K,明显感觉他背了很多面试题...

最近有朋友去华为面试&#xff0c;面试前后进行了20天左右&#xff0c;包含4轮电话面试、1轮笔试、1轮主管视频面试、1轮hr视频面试。 据他所说&#xff0c;80%的人都会栽在第一轮面试&#xff0c;要不是他面试前做足准备&#xff0c;估计都坚持不完后面几轮面试。 其实&…

Pywirt:一款基于Python的Windows安全应急响应工具

关于Pywirt Pywirt是一款基于Python开发的网络安全工具&#xff0c;该工具专门针对Windows操作系统设计&#xff0c;可以帮助广大研究人员使用winrm并通过在Windows操作系统上收集各种信息来加快安全事件应急响应的速度。 该工具已在Windows 10操作系统上进行过完整测试。 功…

DVWA—CSRF 跨站请求伪造

注意&#xff1a; 1、这里对XSS(Stored)关卡不熟悉的可以从这里去看http://t.csdn.cn/ggQDK 2、把难度设置成low 一、概述 1、定义 跨站请求伪造&#xff0c;攻击者利用服务器对用户得新人&#xff0c;从而欺骗受害者去服务器上执行受害者不知晓得请求。 2、场景 攻击者会伪…