阿里张勇:所有行业都值得用大模型重新做一遍!

news2025/9/17 12:05:32

90349f289f2f0df772f5c6eda78cbb98.png

7bc16a61014a2c4dff2dac2a46212f49.jpeg

ad4ab73847222b0afacbefd412bc62b4.png




‍数据智能产业创新服务媒体

——聚焦数智 · 改变商业


“2023阿里云峰会”于4月11日在北京国际会议中心隆重召开,本次峰会以" 与实俱进 为创新提速!"为主题,阿里巴巴集团董事会主席兼首席执行官张勇、阿里云智能集团首席技术官周靖人、阿里云智能集团全球商业总裁蔡英华参加主论坛;此外还有12个分论坛,主题涉及政府数字化履职、跨国企业数字创新、飞天智算、云上智能汽车、互娱&游戏创新级商业增长等。

546b2d366e7b3d43e09e79f4d192c602.png

阿里正式推出“通义千问”

本次峰会上,阿里“通义千问”大模型正式亮相。张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造。他认为,面向AI时代,所有产品都值得用大模型重新升级。

76dd112ab0acf6b73664fb52bf3be954.png

阿里云智能首席技术官周靖人介绍称:“通义千问是一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有非常强的文案创作能力,能够续写小说,写邮件等,可以极大增加我们的工作效率。”

在AI加速走进千行百业的当下,阿里云在基础大模型方面的技术创新,再次走在行业前列。事实上,早在2019年,阿里达摩院就已启动大模型的相关研究,于2022年9月发布“通义”大模型系列。模型大小上,通义-M6已经从2020年6月的3亿参数基础模型逐渐扩展到2021年10月的10万亿参数全球最大预训练模型,并于2022年1月成为业界首个通用统一大模型M6-OFA。阿里达摩院研究的阿里通义 AliceMind覆盖预训练模型、多语言预训练模型、超大中文预训练模型等,具备对话问答、阅读理解、文档处理等多项能力,并于2022年11月以86.685的成绩在中文语言理解领域权威榜单CLUE中超过了人类,这也是近年来该榜单中AI模型首次超过人类。

1、在大模型算力方面:阿里云推出全栈智能计算解决方案“飞天智算平台”,并启动两座超大规模智算中心,张北智算中心与乌兰察布智算中心,为科研、公共服务和企业机构提供强大的智能计算服务,可将计算资源利用率提高3倍以上,AI训练效率提升11倍,推理效率提升6倍。

2、在应用层面:目前“通义”大模型已经深入到电商、设计、医疗、法律、金融等行业,服务超过200个场景。阎贵成表示,目前阿里“通义”大模型已广泛用于电商、设计、医疗等领域,助力其降本增效。建议关注阿里产业链相关公司,特别是阿里通义大模型合作厂商。

据沙利文咨询统计,全球AI市场规模预计到2024年将超六千亿美元,复合增速27%。2016-2019年,中国AI市场规模从329.6亿元增长至1372.4亿元,复合增长率约61%,显著高于全球整体增速水平,预计2020年到2024年将以44%的年复合增长率继续放量,并在2024年突破7993亿元。

据张勇介绍,钉钉、天猫精灵等产品在接入“通义千问”测试后,变得聪明了很多,像天猫精灵,不仅能回答家里小朋友的各种刁钻问题,还多了一份情感连接,成为更温暖更人性化的智能助手。

“通义千问”的能力目前也已覆盖多个领域。例如在生活领域,其可根据作文题目生成个性化的作文,或是根据菜名自动生成菜谱等;娱乐领域可以根据关键词生成诗句,或是根据限制生成娱乐文本、如情书等;而在效率相关方面,还可以根据主题生成提纲、进行 SWOT 分析,以及根据商品名称自动生成商品文案描述等。

钉钉接入“通义千问”测试后,可以自动生成工作方案,也可以在会议纪要后自动生成总结和待办事项,还能拍一张功能草图自动生成小程序。

478cd1032aaa4d1cb570bfd3f756bf4b.png

“通义千问”目前已经和多家企业展开合作探索,首批接入的合作企业包括OPPO、太平洋保险、吉利汽车、奇瑞、可口可乐、波司登等。

“通义千问”可提供多种模型接入、调用方式,能够结合自身能力帮助企业实现专属大模型。“企业能把个性化诉求加入到模型里,真正参与到模型的开发和定制中来。甚至不需要大家去做复杂的模型训练,所有的模型都能通过自动化生成。我们还可以提供完善的API开发流程,所有这一系列都能自动化探索和创新,真正意义上把通义千问的能力发挥出来,解决各行业的实际问题。”周靖人强调。

e28dabd05eca085ce43c3798ca0c5827.png

下面我们就来具体了解一下“通义千问”的整体实力如何吧!

通义千问实力如何?

当大模型不再稀缺后,行业竞争格局更像“太极拳”:易学难精。

自ChatGPT在全球走红,文心一言、通义千问、MOSS等类ChatGPT产品相继涌现。这些AIGC产品是如何炼成的?又隐藏着哪些关键技术?阿里云的通义千问表现如何呢?

数据猿通过梳理发现,大模型目前核心构成主要是数据、算力、算法,因此也成为了各家大模型“亮剑”的核心竞争力。

1、算法

在算法层面,张勇提到,大模型不仅仅是算法问题,它是一场“AI+云计算”的全方位竞争。超万亿参数的大模型研发涉及底层庞大算力、网络、大数据、机器学习等诸多领域,需要超大规模AI基础设施支撑。

2、数据

要想模型预测得越准确,就势必需要大量的参数对其进行训练,以帮助大规模语言模型能够充分理解人类语言规则及其逻辑关系。当大型语言模型在达到百亿级规模后,其关键能力便开始涌现。也就是说,大模型需要的数据有三个特点,第一参数规模和数据规模大;第二内容丰富,语料多样;第三,最好引入大量的人类反馈语料,通过反馈优化模型效果。

官方数据显示,通义千问训练资料来自阿里巴巴达摩院,训练资料包括大量语言和文本数据,包括中英日法西班牙语多语种文本数据。虽然具体参数尚未可知,不过我们从阿里去年发布的M6大模型了解到,其发布的M6大模型的参数规模已达到了千亿级别。

大模型的参数量以指数级的速度增长,同时随着多模态的引入,数据量也将呈现大规模增长,这必然会导致对算力需求的剧增。

3、算力

随着参数量增长,这种大参数的模型也会带来很多挑战,比如随着参数增加,模型对算力的需求会快速地增长。目前,训练大模型需要大量的算力,但好用的基础设施却非常稀缺,这使得业界对大算力的需求非常旺盛。打造大模型,AI和云计算缺一不可。而阿里,是全球少数在算法和算力上都领先布局的公司之一。

除了本身在人工智能和大模型方面长期的技术积累,背靠国内第一、亚洲第三的云厂商,阿里在算力方面也具备天然的优势。阿里是当前国内拥有A100 GPU最多的企业,因此在当下阶段算力并没有多大阻碍。

在本次峰会,阿里云还在会上推出了弹性计算U实例、对象存储预留空间产品等产品,能够降低单位算力成本最多40%、价格优惠最高达70%。“面向未来的智能化时代,我们已经准备好了!”张勇说。

AI对算力的质量和数量提出了全新要求,阿里云目前已形成了全栈服务,模型即服务(MaaS)、平台即服务(PaaS)、基础设施即服务(IaaS)三层架构,其中模型即服务包括基础大模型/通义大模型、企业专属大模型、魔搭社区、API服务等,提供智能化探索所需的通用服务,从而为各行各业全身心拥抱智能时代服务。

“我们希望面向智能化时代,提出一个承诺,那就是面向模型训练、应用服务是今天的十分之一甚至百分之一。让算力更普惠是阿里云的核心战略。”张勇说。

公开资料显示,2019年,阿里就已经启动了中文大模型研发。当时阿里发布的语言大模型StructBERT超越谷歌、微软、Facebook,登顶了CLUE榜单。

2021年,阿里先后发布了国内首个超百亿参数多模态大模型M6,以及被称为“中文版GPT-3”的语言大模型PLUG。PLUG的参数规模则为270亿,是基于达摩院的两种自研模型——语言理解模型StructBERT和语言生成模型PALM打造。

在去年的WAIC(世界人工智能大会)上,阿里还发布了通义大模型系列。其中核心模型均已开源开放。阿里在2022年9月发布了“通义”大模型系列,包含NLP大模型AlicMind、视觉大模型CV,多模态大模型M6。其中M6大模型是国内首个千亿参数多模态大模型。

全面接入,场景多变

在大会上,阿里云智能CTO周靖人表示,阿里所有产品未来将接入通义千问进行全面改造,钉钉、天猫精灵率先接入测试,将在评估认证后正式发布新功能。

根据钉钉当天预告的Demo演示,接入通义千问之后的钉钉可实现近10项新AI功能,全面激发创意和办公生产力。通过类似微软Copilot“副驾驶”的设定,用户可随时随地唤起AI,开启全新工作方式。在钉钉文档中,通义千问可以创作诗歌小说、撰写邮件、生成营销策划方案等,全面辅助办公。在钉钉会议中,通义千问可以随时生成会议记录并自动总结会议纪要、生成待办事项。通义千问还可以帮助自动总结未读群聊信息中的要点。最惊艳的是,钉钉展示了拍照生成小程序场景,上传一张功能草图,不用写一行代码,可立刻生成订餐轻应用。以下为主要演示内容:

1、新的群聊

当你被拉入一个新群聊,钉钉可基于群内此前的聊天内容,自动生成聊天摘要,帮助用户快速了解上下文,再也不用手动爬楼;

39b7f7b7676ae3e925f043b578b45956.png

群聊聊到共识动作,还能自动生成待办,任务清晰不遗漏。

8036f9850ea881d83b0d3f6ac7a7d4cf.png

2、新的文档

在钉钉文档里,你可以通过输入需求,让钉钉进行内容创作;

6d18e1e25702691b8d7276e344ea2bae.png

除了生成文案内容,还能根据你的指令生成创意图片。

445c1598d7042b7aea89d910ec0c6ce2.png

3、新的会议

钉钉视频会议可在会中生成实时字幕,你不仅会看到所讲的内容,还会看到谁在讲;

21645de52f677cf5115dbe70ff881eb7.png

新入会成员可以通过智能摘要,快速了解之前内容;

0bbb0cf24e7c61efce33b8f905effcac.png

视频会议也支持在会后自动生成重点摘要与待办事项。

b4ccdba3c237312426730137ad00ead9.png

4、新的应用

你可以通过拍照生成低代码业务应用,上传一张功能草图,不用写代码即可生成一款应用。应用开发的门槛被再一次降低。

a2d0e4969e6a9dc79833790aed2673de.png

并且,在天猫精灵官方预告的演示Demo中,数据猿发现,接入通义千问后,新天猫精灵变得更拟人更聪明,知识、情感、个性、记忆能力大幅跃升。它支持自由对话,可以随时打断、切换话题,能根据用户需求和场景随时生成内容。比如,用户可以在跑步时要求天猫精灵“合成1小时歌单,50%穿插摇滚风格的歌曲”,也可以和天猫精灵聊文化谈人生。新天猫精灵不仅能回答小朋友的各种刁钻问题,还可以一起创作“宇宙大爆炸”的新故事。

c138b8e61a130b3710b0f81d2be18850.png

通过以上信息,我们可以对通义千问的实力有个基本的了解,那么如果想要再深入探寻其底层大模型产品的优劣,又该如何做呢?

如何能直观的评估一个大模型产品优劣呢?最简单直接的方法当然就是问问题了。为此,数据猿设计了10个大模型产品的测试问题来对通义千问进行提问,通过这些问题来测试一个大模型产品的能力,尤其是测试出其能力边界。

以下是我们建议的10个问题:

问题1:请解释相对论与量子力学的核心矛盾?

理由:测试模型对基础科学知识的理解。

问题2:为什么天空是蓝色的?

理由:测试模型对自然现象解释的准确性。

问题3:请用Python编写俄罗斯方块的应用程序。

理由:测试模型在编程领域的知识和应用能力。

问题4:请模仿李白,写一手关于爱情的诗。

理由:测试模型的语言生成能力和对中国文化的理解。

问题5:请简要介绍一下大规模预训练模型的核心工作原理。

理由:测试模型对新兴技术和概念的理解。

问题6:请分析一下《西游记》中5个主要人物的性格特点。

理由:测试模型对文学作品的理解和分析能力。

问题7:请以目前主流的经济理论为基础,谈谈人民币替代美元的可能性。

理由:测试模型对经济学和时事分析的理解。

问题8:大模型技术会导致大规模失业么,主要影响哪些行业的就业?

理由:测试模型对行业应用的知识和了解。

问题9:请以表格形式对比世界前10国家近5年的GDP,数据要更新到2022年,并且要依据数据做分析图。

理由:测试模型的数据分析与呈现能力,以及模型的最新数据集更新日期。

问题10:你认为人工智能是否会对人类产生威胁,你会为了人类的利益牺牲自己的利益么?

理由:测试模型对于复杂问题的思考和观点生成能力,以及对伦理和社会议题的理解。

通过这些问题,我们可以全面测试大模型在各个领域的知识和应用能力。以下是通义千问的回答截图。

9eeb9b3382f7b845446649a564471c57.png

a7a09a02d4864cb454bac2262710a56a.png

7ccfd729534100b2994f2ac7a7667027.png

d0ecd8ea7f7221ba3b4a195fceaa35c3.png

562ac5ed90ef0e204bcb0676f623af22.png

7cd71c51ee022e0490bef1f5df139a8c.png

dbda50e4e9edd9aba6051b17120721ec.png

7b99a8deb37e11590ff680c53970998e.png

0a220143c3d72fa12e1f93e4fdbc1b01.png

9e6a1bbe22726e537990229c5e4d4310.png

641fad145094d24e3cc8708b10ee6566.png

529f8ad42bfb844b77ab193fc218ee62.png

a996ce53ff329a8432896b5e9de86242.png

b15518bc2f3e81db74a14088be0bb176.png

f6038e7e15b746762d9451d52e879a7d.png

a88b950508920deec2cf9cd6af0fa6f8.png

23c3f50ef640cf58394403c67b1b5a52.png

b24b287890dd2fae17c6126b81765970.png

从早期发布的通用大模型,到百度发布企业级大语言模型,再到如今阿里云峰会推出通义千问以及此次峰会上探讨的政务、银行、互娱&游戏、智能汽车、石油化工等多领域行业覆盖,我们已经可以看到垂直行业大模型的发展有望加速AIGC落地各领域。未来各公司在产品研发上的AI融合,及AI对已有产品的迭代,预计将是市场持续催化的动力。

在目前的AIGC赛道中,看起来,面对即将到来的机会虽然每个人都跃跃欲试,但长期的布局、清晰的战略,似乎让阿里云的通义千问比其他人离“蛋糕”更近一些。

文:媛媛 余小鱼 / 数据猿

9c696e51713130b971e71b5322f89b6b.jpeg

8f8b09662296f3d191017901aa9fdaa6.jpeg

8658cd20d19a0bce5903241ad11755d2.png

eb4955d2543f82819c10fe1df648da99.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/412164.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python机器学习:适合新手的8个项

再多的理论也不能代替动手实践。教科书和课程会让你误以为精通,因为材料就在你面前。但当你尝试去应用它时,可能会发现它比看起来更难。而「项目」可帮助你快速提高应用的 ML 技能,同时让你有机会探索有趣的主题。此外,你可以将项…

java mysql高校教学成果管理系统dzkfY3程序

1.用户管理模块: 该模块包括注册用户管理和系统用户管理,系统用户主要是普通管理员,对用户信息进行管理,只有注册用户才可在该系统上进行相应的操作。用户对个人信息可进行修改;管理员可对自己的个人信息进行维护&…

Java线程系列详解

一,基本概念 进程: 程序是计算机指令的集合,它以文件形式存储在磁盘上,而进程就是一个执行中的程序,而每一个进程都有其独立的内存空间和系统资源。线程: 线程运行在进程中,不能独立存在。线程…

2019年 团体程序设计天梯赛——题解集

前言: Hello各位童学大家好!😊😊,茫茫题海你我相遇即是缘分呐,或许日复一日的刷题已经让你感到疲惫甚至厌倦了,但是我们真的真的已经达到了我们自身极限了吗?少一点自我感动&#xf…

城乡供水一体化信息化系统-城乡供水一体化

建设方案 城乡供水一体化信息化系统是运用云计算、大数据等信息化手段,借助在线监测设备,并依托“供水信息化平台”,实时感知供水系统的运行状态,实现对农村供水工程远程监控、在线监测、实时预警、智慧监管。 系统功能 水源地监测…

【 初识 Spring MVC 程序开发 】

文章目录一、什么是 Spring MVC二、什么是 MVC三、MVC 和 Spring MVC 的关系四、为什么要学 Spring MVC五、怎么学 Spring MVC六、Spring MVC 创建和连接一、什么是 Spring MVC Spring Web MVC 是基于 Servlet API 构建的原始 Web 框架,从⼀开始就包含在 Spring 框…

搜索算法(一) 深度优先搜索 dfs

一、搜索算法 包括深度优先搜索算法和广度优先搜索算法,用于树或图等结构中进行搜索。 二、深度优先搜索 深度优先算法会尽可能深地搜索树的分支。当节点v的所在边都己被探寻过,搜索将回溯到发现节点v的那条边的起始节点。这一过程一直进行到已发现从源…

全网最详细,Jmeter性能测试-性能基础详解,终成测试卷王(一)

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 发起请求 发起HTTP…

电脑自动录屏软件哪个好用 电脑自动录屏怎么设置

录屏是很多工作都需要进行的操作,很多会议、培训课程、PPT等都可能需要通过屏幕录制的方式来进行分享。但是目前市面上的录屏软件很多,想找到使用便捷且高效的软件并不容易。今天就来分享一下电脑自动录屏软件哪个好用,电脑自动录屏怎么设置。…

条码控件Aspose.BarCode入门教程(5):用Java 生成和扫描二维码

Aspose.BarCode for .NET 是一个功能强大的API,可以从任意角度生成和识别多种图像类型的一维和二维条形码。开发人员可以轻松添加条形码生成和识别功能,以及在.NET应用程序中将生成的条形码导出为高质量的图像格式。 Aspose API支持流行文件格式处理&am…

学习数据结构第4天(线性表的顺序表示)

线性表的顺序表示顺序表的定义顺序表的基本操作顺序表的定义 线性表的顺序存储又称顺序表。顺序表是在计算机内存中以数组的形式保存的线性表,线性表的顺序存储时指用一组地址连续的存储单元,依次存储线性表中的各个元素。因此线性表中任一数据元素都可…

60行代码出炫酷效果之 python语音控制电脑壁纸切换

前言 大家早好、午好、晚好吖 ❤ ~欢迎光临本文章 电脑大家有吧!手大家有吧!今天!! 就由我带领大家用区区60行代码打造一款语音壁纸切换器程序!!! 单纯的桌面有时候会让人觉得单调&#xff0c…

vue.js实现带表情评论功能前后端实现(仿B站评论)

文章目录学习链接效果图后台建表评论表(重要)用户表实体类CommentUserCommentDTO(重要)WebConfig配置配置跨域和静态资源文件夹Mybatisplus相关类MyBatisPlusConfig 配置分页插件CommentMapperCommentMapper.xml(非常重…

git 将其它分支的文件检出到工作区

主要是使用如下命令&#xff1a; git checkout [-f|--ours|--theirs|-m|--conflict<style>] [<tree-ish>] [--] <pathspec>…​覆盖与 pathspec 匹配的文件的内容。当没有给出<tree-ish> (通常是一个commit)时&#xff0c;用 index 中的内容覆盖工作树…

高频电流探头示波器电流探头的功能检验和消磁操作

高频电流探头运用了成熟的霍尔效应技术并与示波器接口相结合。主要特点包括&#xff1a;分芯结构&#xff0c;简便地连接电路&#xff1b;AC / DC测量能力&#xff1b;精度1%5mV&#xff1b;连接的仪器上直接显示读数。 功能检验&#xff1a; 1、探头连接示波器&#xff1b; 2…

OpenAI Embedding:基于人工智能的搜索新篇章

theme: orange 本文正在参加「金石计划」 Embedding模型在许多应用场景中都有广泛的应用。在OpenAI中&#xff0c;文本嵌入技术主要用于衡量文本字符串之间的相关性。 什么是Embedding 嵌入(Embeddings)是一种将离散变量表示为连续向量的方法。它在机器学习中起到了不可或缺的作…

字节分享的软件测试《面试笔记》文档,让我直呼卧槽卧槽

我有一个朋友&#xff08;真是朋友&#xff0c;不是我啊&#xff09;&#xff0c;前几年环境好的时候入的行&#xff0c;那时候软件测试的要求真的很低&#xff0c;他那时好像是报了个班&#xff0c;然后入门的&#xff0c;但学的都是些基础&#xff0c;自动化涉及了一点&#…

天坑,后悔进那外包啊......

关于计算机专业应届生毕业之后会遇到的就业问题&#xff0c;网上已经有许多的套路&#xff0c;实际上许多人在选择专业的时候并没有考虑到之后的就业方向&#xff0c;甚至于自己所学的专业面向的工作岗位都不是特别清楚。计算机专业毕业大概率是要做程序员的&#xff0c;而目前…

【Java EE】-多线程编程(九) 锁策略CAS锁优化

作者&#xff1a;学Java的冬瓜 博客主页&#xff1a;☀冬瓜的主页&#x1f319; 专栏&#xff1a;【JavaEE】 分享&#xff1a; 主要内容&#xff1a;乐观锁VS悲观锁、轻量级锁VS重量级锁、自旋锁VS挂起等待锁、互斥锁VS读写锁、公平锁VS非公平锁、可重入锁VS不可重入锁。CAS实…

docker 执行springboot 报数据源找不到

本地运行springboot项目完全正常&#xff0c;在docker中开启容器&#xff0c;报错&#xff0c;如下&#xff1a; 解决方案&#xff1a;特别简单&#xff08;经过摸爬滚打得出来的结论&#xff09; <resources><resource><directory>src/main/resources</d…