Ai通识与基础-认识人工智能
认识人工智能智能产生的要素影响大模型智能的核心要素有三点模型算法。首先是模型算法现在的AI都是采用神经网络架构你可以把它看做是AI的大脑是决定AI是否”聪明”的基础。海量数据。AI也是一样要想让AI产生智慧就必须用海量的数据来训练它。上个世纪互联网不够发达可以用来训练的数据也比较少。超级算力。大模型训练的数据规模庞大神经网络架构复杂因此训练时的计算量都是天文数字。需要成千上万的顶级GPU一起不间断的工作数周甚至数月才行这背后是巨大的电力消耗和硬件成本。大模型原理前面我们说过AI的神经网络模型就是在模仿人类的神经元神经网络结构深度神经网络分为很多层Layer是神经网络基本的计算单元分为输入层入口接收数据隐藏层信息处理与学习。可以有很多层。输出层出口产生结果。整个神经元的工程流程是可以用一个公式去表达的。括号里面有个wi*xiw是权重x是输入它俩相乘是在对输入参数进行加权从1到n表示从第一个参数到第n个参数进行求和所以先加权在求和-b被成为“偏置量”有的时候我们加权求和完得到这个结果我期望它必须得达到一定的阈值超过这个阈值以后它的作用才会生效。所以在这里-b其实就是减去阈值把得到的结果再去交给激活函数进行处理所以这个括号外边的g其实就是激活函数最终就能得到结果。反向传播教这个复杂神经网络学习的高效方法。基本流程如下前向传播数据逐层加工直到输出层产出结果。计算误差计算产出结果与正确结果的误差。反向追责倒退计算每一层的每个连接对误差的贡献。调整权重根据每个连接的误差贡献比例调整其权重参数使误差变小。大语言模型在2003年图灵奖得主约书亚·本吉奥Yoshua Bengio的一篇名为《A neural probabilistic language model》的论文开创了神经网络语言模型Neural Network Language ModelNNLM的先河。这篇文章中首次提到了词向量Word Embedding的概念雏形这为神经网络训练学习自然语言打下了坚实的基础。词向量就是把词转为多为空间向量的一种技术、首先将人类自然语言文字拆分为一个个片段称为Token词。每个Token都经过模型计算转为一个浮点数数组称为向量坐标、我们现在看到的这个例子它在拆分时把一个个单词拆分成一个的Token但是在真实中它不一定是这个样子真实中拆分的Token可以是单词汉字标点符号还可以是一个很长单词的一部分这里是为了方便理解就当成一个个的单词或汉字了。假如我们有一个数组里面有3个浮点数我们就可以把这3个浮点数分别作为一个三维空间的x,y和z轴上的一个坐标这样就得到了一个三维空间的向量由此可见数组里面有几个数字就能转为几维空间的向量坐标。那么我们的词向量它里面有几个浮点数呢如果它转化成一个向量的话那就是12288维空间的向量在数学中理论上是可以有任意维度的空间的因此这个12288个数组就可以表示12288维空间中的向量。最后我们人类中的所有词汇都可以转成这个一万多维空间的一个向量而且我们最终要通过训练模型就是要不断的去调整这些词在向量空间中的坐标位置最终使这个词向量在多维空间中不同方向能够去表达不同的语义。每个词语都可以经过模型运算转化为一个多维向量也就是一个浮点数数组GPT3采用12288维向量通过训练使模型计算出的多维向量与文字语义产生关联使多维空间中的不同方向表示不同语义自注意力机制使模型能更高效的根据上下文信息处理token理解token含义。比如说我现在有一句话“有一个知名男艺人___”,如果只给你这一句话这个艺人是谁你肯定不知道所以此时模型去处理的话那么它生成出来的向量肯定在向量空间中仅仅表示的是艺人本身现在如果我们进一步的去提供上下文比如说我告诉它“有一个知名男艺人擅长唱歌___”这个时候自注意机制就会根据上下文来对当前的这个向量进行调整在向量的不同方向上表达不同的含义那就看一下这个向量空间中哪个方向表示的是唱歌这个含义然后它就把艺人这个方向朝着唱歌这个方向调整。词向量只是第一步接下来它还有很多步骤需要去做接着我们就需要有一个Attention层负责基于上下文来对这个里面的向量进行进一步的调整接下来MLP层也叫多层感知机它负责基于前面的分析在进一步做深度的推理分析来去进一步调整向量值。再往后就是不断的去重复前面的过程再跟上Attention层MLP层等等...直到得到最终的结果也就是向量坐标值。最终还需要把计算出的向量再转成Token也就是反向量化这个工作是叫做softmax来完成的。大模型应用什么是大模型应用大模型应用是基于大模型的推理分析生成能力结合传统编程精确计算控制能力开发出的各种应用。对话机器人ChatBot是指可以与用户聊天答疑而且具有记忆的大模型应用。例如:ChatGpt通义千问。GPT是大模型而ChatGpt则是基于大模型的一种对话的产品。怎么把一个大模型变成一个对话机器人大模型应用的结构一个对话的机器人由大模型和传统应用去结合的。大模型负责对话思考传统编程负责实现一些传统的图形界面用户登录和身份校验和一些数据的存储记忆这些功能。所以ChatPgt就是一种把传统应用和大模型结合的一种应用也就是大模型应用模型部署大模型API
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2523724.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!