让AI数字人具有不一样的“灵魂”,未来数字人主战场在垂直场景中

news2025/6/12 22:26:35

从网页到App,再到数字人。人类一直在视图模仿和复制真实的人类的沟通交流方式。但是由于技术、时代的局限,数字人离想象中的形象还有点差距。如今,随着AI技术的发展,数字人正逐步成为我们生活的存在。

在谈到数字人的过去时,很多人认为最初的数字人仅仅是个被炒起来的概念,不接地气,分不清到底数字人的终点是影像还是游戏。并且打造的成本异常高昂,投入大量时间和人力成本。一个3D话的写实数字人,成本可达到数百万,每秒都时候在烧钱,除了用在教育、娱乐、影视、文娱等方向,最后有一些新奇的体验感外也没有什么,让很多人对于数字人的应用望而却步。以抖音美妆达人“柳夜熙”为例,其制作企业创壹科技CEO梁子康曾对媒体表示,“柳夜熙”仅制作投入就在百万元级别,而第一条“柳夜熙”的短视频成本约几十万元。超写实虚拟人视频每秒的成本都在万元区间。而花费了如此巨大的数字人,最后还是只能局限在娱乐、直播、内容IP等领域;

2020年,被誉为元宇宙元年的市场对于数字人生产效率提升和商业化开始有了转机。AIGC给了数字人更多的想象。基本上数字人+AIGC,从文字生成图片,再到文字生成视频,内容驱动数字人、真人驱动数字人等场景,让数字人具有了交互的能力。可以说,之前的局限性被AIGC的崛起打破。

其中几项关键的技术,让数字人极大地提升了交互和降低了成本。例如,人像驱动生成数字人,可以通过4D扫描、智能绑定等AI技术,实现数字人的唇形驱动、肢体驱动、表情驱动、手势感知等,同时减少动作捕捉、CG合成的制作流程,大幅降低了成本。而智能对话引擎,通过自然语言处理技术,为数字人快速定制对话能力、持续提升对话效果。这些技术,让数字人在表现力、智慧度、交互能力上都得到了大幅提升。

国内各大企业,开始在数字人领域八仙过海,各显神通。

例如,百度推出的曦灵数字人平台,通过自然语言处理、语音识别、计算机视觉等技术的提升,让数字人在视觉表现力上有了显著提升。

腾讯在数字人方面,也发布了智能小样本数智人生产平台。只需经过3分钟真人口播视频、100句语音素材的训练,便可在输入音频、文本等多模态数据后,实时建模并生成高清人像,在24小时内制作出与真人近似的“数智人”,其使用成本也将被降至千元级别。

除了百度、腾讯这些大厂外,一些默默耕耘于数字人垂直赛道的企业,也凭借日益精湛的技术,打造出了更逼真和生动的数字人。metamind项目中的轨迹大脑SaaS平台,就是这样一个代表,主打可定制可控知识,知识一键导入。配置化生成低成本高质量数字人的同事,能够赋予每个数字人专属的硅基知识,丰富垂直场景的应用能力。同事通过深度学习技术,不断完善语料、知识的构建。

从目前市面上来看,数字人技术正在不断的针对垂直领域的场景进行落地。AIGC加持的数字人已经由几百万元的制作成本,降低到现在的千元水平。且已经不仅仅只是存在于B端,而是逐步向C端扩散。

纵观每次技术的变革,无一不是一种生产工具,解放者沉重的生产效率。未来,AIGC时代,数字人将有能力理解人类的需求和习惯,同时会帮助人类“读他们没有时间读的书。”先进的大模型,与数字人进行结合的最大意义在于,让数字人能够以普通人无法企及的速度继续进化。决定数字人高下的一定是在垂直场景应用中,谁能利用大模型打磨好数字人,让AI数字人具有不一样的“灵魂”

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/951248.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MPI之MPI_Sendrecv接口以及空进程概念介绍

MPI_Sendrecv函数原型 int MPI_Sendrecv(const void *sendbuf, int sendcount, MPI_Datatype sendtype, int dest, int sendtag,void *recvbuf, int recvcount, MPI_Datatype recvtype, int source, int recvtag, MPI_Comm comm, MPI_Status *status);其中各个参数的含义如下&…

Java 8的重要知识点

一、Lambda 表达式 Lambda 表达式的初衷是,进一步简化匿名类的语法(不过实现上,Lambda 表达式并不是匿名类的语法糖) 1、使用 Stream 简化集合操作; map 方法传入的是一个 Function,可以实现对象转换&…

螺旋矩阵Java

54. 螺旋矩阵 给你一个 m 行 n 列的矩阵 matrix ,请按照 顺时针螺旋顺序 ,返回矩阵中的所有元素。 示例 1: 输入:matrix [[1,2,3],[4,5,6],[7,8,9]] 输出:[1,2,3,6,9,8,7,4,5 示例 2: 输入:ma…

【Jenkins打包服务,Dockerfile报错:manifest for java : 8 not fourd】

1、问题描述 Jenkins打包服务运行dockerfile里的FROM java:8报错manifest for java : 8 not fourd Caused by: com.spotify. docker.client.exceptions.DockerException: manifest for java:8 not found2、解决方法 在网上查找许多方法后得出这是由于Docker官方已经弃用java…

电脑每次开机杀毒软件报iusb3mon.exe病毒已清除,电脑中病毒iusbmon杀毒办法,工具杀毒

不知道什么时候开始,我电脑C盘的系统数据存储文件夹programdata 不知不觉就没了,找不到了 programdata文件夹为存储系统数据文件的,这个文件不见了,而且我打开了显示隐藏文件和文件夹还是没有显示 然后我重启电脑,杀毒…

Ansible-palybook学习

目录 一.playbook介绍二.playbook格式1.书写格式 一.playbook介绍 playbook 是 ansible 用于配置,部署,和管理被控节点的剧本。通过 playbook 的详细描述,执行其中的一系列 tasks ,可以让远端主机达到预期的状态。playbook 就像 …

多项式乘法(FFT)

https://www.luogu.com.cn/problem/P3803 傅里叶变换(FFT)笔记存档FFT代码上的实现细节 主函数 把长度设为2的整数次幂块 初始进行翻转(二进制翻转) 对A,B先化为点值(DFT) 相乘 IDFT FFT函数 进行初始翻转&a…

openGauss学习笔记-55 openGauss 高级特性-全密态数据库

文章目录 openGauss学习笔记-55 openGauss 高级特性-全密态数据库55.1 连接全密态数据库55.2 创建用户密钥55.3 创建加密表55.4 向加密表插入数据并进行查询 openGauss学习笔记-55 openGauss 高级特性-全密态数据库 全密态数据库意在解决数据全生命周期的隐私保护问题&#xf…

Maven - 依赖三大原则

文章目录 概述最短路径优先原则POM 文件中声明顺序优先原则覆盖优先原则 MAVEN 依赖冲突常见报错Maven 依赖加载流程 概述 Maven 是一个流行的构建工具,用于管理和构建Java项目。它遵循一些核心原则,以确保项目的构建和依赖管理能够高效、一致地进行。以…

在CMD脚本中生成空心字

背景 程序启动时,需要通过串口向外打印信息,想在信息最前面打印一个log,如下图所示: win自带的CMD安装pyfiglet 使用pip安装pyfiglet,如下: pip install pyfiglet安装成功后如下图: 运行以…

(数字图像处理MATLAB+Python)第十一章图像描述与分析-第一节、二节:图像描述概述和特征点

文章目录 一:图像描述概述(1)图像描述(2)描述子 二:特征点(1)Moravec角点检测A:原理B:程序 (2)Harris角点检测A:原理B&…

YII项目在Docker中运行缓慢

缓慢问题分析 请求YII的api时间请求原生查询时间win10 上运行docker上的php api异常慢ubuntu 中拉代码git报错 请求YII的api时间 请求原生查询时间 win10 上运行docker上的php api异常慢 链接阿里数据的 入口直接返回的 网上有说是docker的dns解析慢; 也有说是…

方面级别情感分析之四元组预测

情感四元组预测现有方法 阅读本文之前我们默认你对情感分析有基本的认识。 如果没有请阅读文章(https://tech.tcl.com/post/646efb5b4ba0e7a6a2da6476) 情感分析四元组预测涉及四个情感元素: 方面术语a,意见术语(也叫观点术语)o, 方面类别ac&#xff0c…

使用python对光谱数据进行lorentz峰值拟合

1、lorentz峰值拟合 发光光谱是一种用于表征二维半导体材料光学性质的重要技术,它可以反映出材料中的载流子密度、缺陷态、激子束缚能等信息。 由于二维半导体材料的厚度极其薄,其发光信号往往很弱,且受到基底、环境和测量设备等因素的干扰…

访问学者如何办理延期回国

近年来,随着国际交流的不断深入,越来越多的学者选择走出国门,到异国他乡进行访问学习。然而,有时由于研究项目进展或个人原因,访问学者可能需要延期回国。那么,访问学者在延期回国时应该如何办理手续呢&…

[Go版]算法通关村第十五关黄金——继续研究超大规模数据场景的问题

目录 题目:对20GB文件进行排序解决思路:外部排序 两两合并 题目:超大文本中搜索两个单词的最短距离解决思路:双指针法复杂度:时间复杂度 O ( n ) O(n) O(n)、空间复杂度 O ( 1 ) O(1) O(1) 题目:从10亿数字…

ChatGPT AIGC 一个指令总结Python所有知识点

在ChatGPT中,直接输入一个指令就可以生成Python的所有知识点大纲。 非常实用的ChatGPT功能。 AIGC ChatGPT ,BI商业智能, 可视化Tableau, PowerBI, FineReport, 数据库Mysql Oracle, Office, Python ,ETL Excel 2021 实操,函数,图表,大屏可视化 案例实战 http://t.…

优秀产品经理的产品定位策略

产品定位是指在产品设计之初或在市场推广过程中,通过广告宣传等营销手段,使得产品在消费者心中确立具体形象的过程。这样有利于目标用户快速决策选择该产品。 如果没有明确的产品定位或产品定位模糊不清,目标用户对该产品印象不深刻&#xff…

干货丨软件测试行业迎来新时代,AI将成为主流技术?

随着科技日新月异的发展,人工智能正逐渐渗透到我们生活的各方各面,从智能语音助手到自动驾驶汽车、从智能家居到人脸识别技术,AI正以其卓越的智能和学习能力引领着新时代的发展方向。 在这个快速演进的时代中,软件测试领域也受到了…

STM32单片机示例:64位全局时间戳发生器

文章目录 目的基础说明测试代码总结示例链接 目的 STM32H743 / H750 系列的芯片有一个64位的全局时间戳发生器( Global timestamp generator ),这篇文章将对它的使用做个记录。 基础说明 全局时间戳发生器相关的内容可以参考官方参考手册&…