大考在即 百度版ChatGPT会翻车吗?

news2025/7/20 21:06:26

文心一言的发布会定档3月16日,不出意外,百度创始人李彦宏、CTO王海峰将出现在北京总部的发布会现场。这是百度版ChatGPT最新的官方消息,2月7日,文心一言首次官宣,当时称,产品“3月见”。

3月如期而至,距离发布会还剩10天,各种消息烘托出期待:3月16日用户就能用上文心一言了。有心人也在围观,文心一言面世后能否达到ChatGPT的能力。

这个结果恐怕要等到文心一言产品正式向公众开放后才能评估,而《元宇宙日爆》从内部获悉,3月16日当日,公众还无法直接使用文心一言,“内测及可能的公测”之后产品才会直达用户。毕竟,谷歌、微软的同类产品翻车在前,百度有前车之鉴,以多测确保重点产品的稳妥。

文心一言长什么样?百度内部密不透风,些许信号透露,搜索引擎大概率是百度版ChatGPT最主要应用方向,“云输出"文心一言的AI能力也是百度会涉及的业务。

这些信号有文心一言底层“文心大模型”的过往应用方向可印证,而当微软将ChatGPT的模型GPT3.5语言整合进Azure的云服务后,上岗7年多的百度智能云自然会顺势“一言”。

产品封闭开发 测后才示众

一个大概率的事件是,文心一言最终以产品的形态供大众用户使用,要等到测试之后了,测试很可能会在3月16日之后,百度内部人士的说法是,“先内测,可能还有公测”。

公开消息可见,内测用户为百度文心一言的首批生态合作伙伴,主要以企事业单位为主,其中媒体机构最为庞大,包括上海报业集团旗下的澎湃新闻、四川日报报业集团下的封面新闻等超过超过160家媒体将成为百度版ChatGPT最先“尝鲜”的一批用户。

“输入文字、获得回答”的ChatGPT已经展现了文本对话型AI机器人对自然语言理解能力的提升,天天和文字打交道的媒体自然展现出对文心一言的刚需。

内测之后,可能还有公测,测试不断,足见百度对推出“国产ChatGPT”所持的谨慎且重视的态度。毕竟,谷歌和微软在抢占“对话机器人”的先机时都先后翻了车。

2月10日,在巴黎的一场活动上,谷歌展示Bard“如何向9岁小孩介绍詹姆斯·韦伯空间望远镜(JWST)的成果”时,这个机器人将2004年智利的甚大射电望远镜(VLA)的重要成果安在JWST头上,“张冠李戴”的错误结果被网友指摘不说,展示活动当天,谷歌股价下跌超7%,创下去年10月26日以来的最大日跌幅,谷歌市值瞬间蒸发1000亿美元。

“一本正经地胡说八道”也是ChatGPT存在的问题,而微软将该机器人的底层模型引入搜索引擎必应(Bing)后,不只会出现错误知识,甚至还出现了“伦理问题”。有获得体验权限的网友晒出长时间与Bing的机器人聊天称,该搜索引擎弹出了要和提问者“恋爱”甚至“劝离婚”的内容;还有记者反馈,他指出Bing机器人的错误后,遭遇了它的嘲讽,后来被不认错的Bing以“你没有好好使用我”指责了。

这两大互联网巨头的对话机器人亮相后,中国市场自然会将目光投向百度的文心一言,拿来比较、体验是一定会出现的。如此瞩目,百度要“测了再测”也就不难理解了。

至于文心一言到底长什么样,百度的内部人士称,产品一直处于封闭研发中,“估计只有李彦宏和王海峰知道了,但两人会在发布会上说什么,也没人知道。”3月16日,也就再等10天,答案将揭晓。

百度内部对文心一言的产品终态密不透风,倒是这类文本生成式的产品,百度有不少,最值得注意的是2021年年底发布的百亿级“知识增强大模型”文心ERNIE3.0。

飞桨社区成员放出的ERNIE3.0模型功能

有程序员在百度的飞桨社区中放出过ERNIE3.0在“文本理解与创作”上的效果,截图显示,该模型可实现同义改写、写作文、对对联、写小说、补全文本等功能,其中也支持自由问答,输入问题后,点击立即生成,就会获得AI的答案。

《元宇宙日爆》发现,现在在文心大模型官网上,如果你在“开放API”栏目中点击“ERNIE3.0文本理解与创作”选项时,直接弹出的是文心一言的官宣预告。这或许暗示着,ERNIE3.0身上的本事很可能将在文心一言中展现,双方的关系类似GPT-3模型与ChatGPT。

大模型露玄机 “搜索+云”追微软

ERNIE3.0模型的存在至少证明了百度在对话机器人上已有技术积累。

如果类比的话,百度的ERNIE文心大模型类似于Open AI的GPT模型,于2019年推出,从单一的自然语言理解延申到多模态,包括视觉、文档、文图、语音等,不断迭代到了3.0。

文心一言和去年8月推出的AI生图应用“文心一格”一样,名字部分直取于文心大模型,那么基于ERNIE系列,文心一言就可以在这个模型上进行泛化和性能调整。ERNIE 3.0的文本理解与创作能力也说明了这一点。按百度内部人士的说法,文心一言不是什么新鲜物种,是大模型基础上的迭代。

那么,脱胎于文心大模型的文心一言,到底是网页版的ChatGPT还是搜索引擎式的新Bing?

更大的概率会集成进搜索引擎中。

一方面,百度最为人知的产品是国人天天都要“百度一下”的搜素引擎,同类竞品中,谷歌、微软这两大巨额投入AI的公司也最先将对话机器人的模型和技术嵌入到搜索中。

此外,生成式AI和搜索引擎在技术上本身“很搭”。今年1月,百度Create AI开发者大会前夕,李彦宏表态,将基于百度自研的生成式模型升级为“生成式搜索”,“生成式AI和搜索引擎是互补关系而不是替代。”

将文心一言引入搜索引擎,对百度的大模型也有好处。要知道,ChatGPT预训练大模型的语料数据主要来自互联网的文本数据库,包括从网络文本、维基百科、文章中获取的高达570GB的数据。那么,文心一言如果接入百度搜索引擎,与用户的交互和聊天将为文心大模型提供更具数量级的自然语言模型的训练数据,这些大规模结构化、非结构化的数据将为中文版的ChatGPT提供更充分的预训练语料。

文心大模型诸多产品化

综合分析,文心一言接入百度搜索的可行性很高。而除了搜索,这个Bot可嵌入的另外一块百度基建是“云”。

ChatGPT爆火后,微软几乎将全线产品都加上了OpenAI研发的GPT 3.5模型,除了Bing和Office外,Azure云服务是其中的重头戏,微软试图通过Azure+GPT3.5的方式对外输出AI基础设施、模型和工具链,服务于想要构建应用程序的第三方。

如果说“文心一言+搜索”是面向C端的产品,那么“文心一言+云”会直取B端,这意味着商业化。

在云市场上,百度智能云已经上岗7年,在AI高需求的算法、算力上均有布局,比如位于阳泉、定兴、徐水的三个云计算中心,这些基建的存在十分必要,毕竟,国产版ChatGPT上线后,首先得“不崩”。应对有高并发需求的产品,ERNIE大模型将再次验证百度云高并发、高弹性、高精度的能力。

反观AI,百度也极其擅长将大模型的能力产品和场景化,光文心大模型,就整合出适配医疗、金融等各种具体场景的子模型,去年还搞了AI生图的文心一格。

文心一言首批生态合作伙伴已是企业云集,百度要“交朋友”,各家公司也不吝惜友情。百度内部人士透露,每天都会收到“求内测”的企业客户。ChatGPT这口鲜货,无论是主营线上业务的互联网公司,还是主打线下场景的传统企业,都跃跃欲试。海外跨境调用难,百度国产自然成了香饽饽。

C端有搜索引擎,B端有云服务,文心一言能整合的百度产品不少。发布会在即,测试将近,这个“本地媳妇”是丑是俊、能否和“外来媳妇”一拼,3月16日之后将见分晓。

你期待文心一言吗?

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/395312.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C语言再学习 -- __attribute__详解

一、attribute 介绍 __attribute__是一个编译属性,用于向编译器描述特殊的标识、错误检查或高级优化。它是GNU C特色之一,系统中有许多地方使用到。__attribute__可以设置函数属性(Function Attribute)、变量属性(Var…

JavaScript 如何优雅地获取多层级response中的某个深层次字段 ?. 可选链条(Optional chaining)

文章目录一句话场景:从一个多层级对象中拿一个处在深层次位置的字段MDN 可选链搜索引擎使用一句话 var marriedFlag response.data.userList[0].married; // 如果中间某个对象为空,会报Errorvar marriedFlag response?.data?.userList[0]?.married…

外贸新手找客户的开发信修炼之旅(一)

开发信是一种传统的开发海外客户的方式,相信即便是外贸新手也或多或少有所耳闻,甚至已经通过邮件开发到了一些有意向的客户,但有时也会遇到开发信效果不好的情况,收到的回复寥寥无几。其实说白了开发信的本质与派发传单相同&#…

李开复已经对美图公司失去耐心,并在美图公司身上损失惨重

来源:猛兽财经 作者:猛兽财经 猛兽财经经过对美图公司(01357)的投资人回报、产品、业务结构、战略、财务业绩、估值等方面进行了研究,认为美图这家公司不行,非常不看好,以下是理由供你参考。一…

10 Seata配置Nacos注册中心和配置中心

Seata配置Nacos注册中心和配置中心 Seata支持注册服务到Nacos,以及支持Seata所有配置放到Nacos配置中心,在Nacos中统一维护; 高可用(集群)模式下就需要配合Nacos来完成: 具体配置如下 注册中心 Seata-server端配置注册中心,…

【洛谷 P1219】[USACO1.5]八皇后 Checker Challenge 题解(深度优先搜索+回溯法)

[USACO1.5]八皇后 Checker Challenge 题目描述 一个如下的 666 \times 666 的跳棋棋盘,有六个棋子被放置在棋盘上,使得每行、每列有且只有一个,每条对角线(包括两条主对角线的所有平行线)上至多有一个棋子。 上面的布…

13_MySQL中的约束

目录 1. 约束(constraint)概述 1.1 为什么需要约束 1.2 什么是约束 1.3 约束的分类 2. 非空约束 2.1 作用 2.2 关键字 2.3 特点 2.4 添加非空约束 2.5 删除非空约束 3. 唯一性约束 3.1作用 3.2 关键字 3.3 特点 3.5 关于复合唯一约束 4. 主键(PRIMARY KEY)约束 4.1 作用 4.2 关…

【Django】Hello,DJango!

Halo,这里是Ppeua。平时主要更新C语言,C,数据结构算法......感兴趣就关注我吧!你定不会失望。 🌈个人主页:主页链接 🌈算法专栏:专栏链接 我会一直往里填充内容哒! &…

如何实现报表可视化,有没有工具推荐

随着数据量的不断增长,如何更好地进行数据分析和可视化已成为企业和组织面临的重要挑战。实现报表可视化是一个很好的解决方案,它可以帮助用户更好地理解和分析数据,发现趋势和模式,并支持数据驱动的决策。本文将介绍如何实现报表…

现代卷积神经网络(NiN),并使用NIN训练CIFAR10的分类

专栏:神经网络复现目录 本章介绍的是现代神经网络的结构和复现,包括深度卷积神经网络(AlexNet),VGG,NiN,GoogleNet,残差网络(ResNet),稠密连接网络…

【3.7】Redis数据类型、CPU缓存一致性、哈希表

文章目录数据类型篇StringListHashSetZsetBitMapHyperLogLogGEOStreamCPU 缓存一致性CPU是如何执行任务的?什么是软中断?为什么0.1 0.2不等于0.3?哈希表数据类型篇 String String 是最基本的 key-value 结构,key 是唯一标识&…

03 | 授权服务:授权码和访问令牌的颁发流程是怎样的? 笔记

03 | 授权服务:授权码和访问令牌的颁发流程是怎样的? 授权服务的工作过程 小兔软件需要去到京东的平台那里”备案“注册,京东商家开放平台就会给小兔软件 app_id 和 app_secret 等信息,以方便后面授权时的各种身份校验&#xff0…

scratch绘制雷达 电子学会图形化编程scratch等级考试三级真题和答案解析2022年9月

目录 scratch绘制雷达 一、题目要求 1、准备工作 2、功能实现 二、案例分析

阶段二12_面向对象高级_继承1

一.继承的入门介绍 (1)继承的概念理解 让类与类之间产生关系(子父类关系),子类可以直接使用父类中非私有的成员 (2)通过extends关键字实现继承 格式:public class 子类名 extends 父类名 { } 范例:public class Zi e…

Grafana 如何使用本地CSV文件作为数据源

Grafana提供了一个插件,可以把CSV文件作为数据源,关于CSV插件的说明,可以参考:https://grafana.com/grafana/plugins/marcusolsson-csv-datasource/?tabinstallation。我是在本地使用命令行grafana-cli plugins install marcusol…

通过45人!1-2月,誉天红帽RHCE学员再创佳绩!

学习的喜悦在于结果,也在于过程;在于取得成功时的豁然开朗,也在于持之以恒后的层层递进。结果固然重要,但在求知过程中获得的满足感,也同样让人乐在其中。 RHCE的学习过程就充满了这样的喜悦。对每一行命令的理解、对每…

【Linux学习】日积月累——调试器gdb的使用教程

一、背景 gdb是一款强大的命令行调试工具,可以形成执行程序、脚本。只需要几个简单的命令,就能够实现Windows环境下VC等IDE的图形化调式工具的功能。 调试的相关常识: 程序的发布方式有两种,debug模式和release模式;L…

197.Spark(四):Spark 案例实操,MVC方式代码编程

一、Spark 案例实操 1.数据准备 电商网站的用户行为数据,主要包含用户的 4 种行为:搜索,点击,下单,支付 样例类: 2. Top10 热门品类 先按照点击数排名,靠前的就排名高;如果点击数相同,再比较下单数;下单数再相同,就比较支付数。 我们有多种写法,越往后性能越…

【Linux开发笔记】《Linux嵌入式开发从0到1》(一):初探Linux——与Linux的初次相遇

1.什么是Linux Linux就是一个操作系统,就是一个开源、自由的操作系统,就是一个免费使用和自由传播的类UNIX操作系统,就是一个基于POSIX的多用户、多任务、支持多线程和多CPU的操作系统。 简单来讲,Linux就是一个操作系统而已… …

React的Hooks

React Hooks useState useMemo 和usecallback Hooks显示的指明因变量有什么好处 当使用时,y与changeX会被缓存下来,只要x不变,始终读取的是缓存的值, 如果不使用时,每次函数组件执行时,实际会基于x&#xf…