3月18日(进阶9)
进阶9.矩形乘法题目描述给定一个N阶矩阵A输出A的M次幂M是非负整数例如A 1 23 4A的2次幂7 1015 22代码#includeiostream#includevectorusingnamespacestd;// 定义矩阵类型使用 long long 防止多次相乘后溢出typedefvectorvectorlonglongMatrix;// 矩阵乘法函数计算矩阵 A 乘以矩阵 B矩阵大小为 n * nMatrixmultiply(constMatrixA,constMatrixB,intn){MatrixC(n,vectorlonglong(n,0));for(inti0;in;i){for(intj0;jn;j){for(intk0;kn;k){C[i][j]A[i][k]*B[k][j];}}}returnC;}intmain(){intn,m;// 读取矩阵阶数 N 和 幂数 Mif(!(cinnm))return0;MatrixA(n,vectorlonglong(n));for(inti0;in;i){for(intj0;jn;j){cinA[i][j];}}// 初始化结果矩阵 res 为单位矩阵对应 M 0 的情况Matrixres(n,vectorlonglong(n,0));for(inti0;in;i){res[i][i]1;}// 将 res 乘以矩阵 A共乘 M 次for(intstep0;stepm;step){resmultiply(res,A,n);}// 输出结果矩阵for(inti0;in;i){for(intj0;jn;j){coutres[i][j];// 确保行末没有多余的空格if(j!n-1){cout ;}}coutendl;}return0;}总结初始化先构建一个N×NN \times NN×N的单位矩阵作为结果矩阵res。循环相乘利用写好的multiply函数执行MMM次res res * A。如果M0M0M0循环不会执行直接输出单位矩阵符合数学定义。翻译在强化学习框架中智能体agent观察环境的状态并采取相应的行动从而获得奖励或惩罚。智能体的目标是通过不断地探索和学习找到一个能使长期累积奖励最大化的策略policy。与监督学习不同强化学习通常不依赖于大量带标签的数据而是通过试错trial and error来提高决策能力。强化学习在机器人控制、自动驾驶和游戏人工智能等许多复杂任务中取得了成功。在著名的围棋程序AlphaGo中强化学习与深度神经网络相结合使得计算机能够达到甚至超越人类顶尖选手的水平。然而在实际应用中强化学习仍然面临着样本效率低和训练成本高等挑战。reinforcement: n. 强化加强增援。supervised: adj. 有监督的受监督的
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2424281.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!