球机器人研究报告【202600001】
文章目录球机器人研究报告综合分析多智能体推箱子训练第100代/第300代一、意识流分析神经网络脉冲活动1. 热图consciousness_agent2_gen100_ep0_heatmap.png2. PCA主成分分析consciousness_agent2_gen300_ep0_pca.png二、符号活动分析16维符号向量1. 转移概率矩阵symbol_agent0_gen100_ep0_trans.png2. 高频模式symbol_agent0_gen100_ep0_patterns.txt 和 ep1_patterns.txt3. 智能体间互信息未在用户上传中显示但综合分析脚本会生成三、结论与建议球机器人研究报告只所以搞出这样的球机器人出来就是想借对该3个机器人的行为及表现进行认识科学的研究想研究意识的涌现。机器人完全运行在物理模拟的真实环境中使用了物理引擎参与计算。C程序(运行在fedora服务器上)及相应的python程序总算通过调试并正常运行了1.1版从所有类脑神经网络初始化状态到开始训练一段时间训练时间远不够幸亏神经网络结构经过反复优化所以训练时间不是很长~所以机器人只是在那里学习和玩乐程序也有待改进和修正。效果如下有几个问题先说明一下1机器人所有的动作都是它们自动进化出来的包括遇到什么地形采用什么动作全是类脑神经网络自发学习和生成的当然我给了极少数量的随机训练地形样本给多了我的机器受不了训练太慢了没办法所以你会发现每个机器人的招牌动作都不一样。2没有对机器人行走姿势和行走策略进行过任何预设完全是它们自主学会行走的。主要是本人物理不太好很多物理参数都不太懂所以为了搭建适合的物理环境和机器人本身的方面我调试这个程序花了近20天。没办法进行预定只能让机器自己学会从走不了一步到慢慢可以走路。3机器人内建了脑神经网络组和运动神经网络组实现运动和大脑分开另外机器人之间会通过符号交流和沟通。4机器人安装了一个地形环境探索器可以事先知道前面的地形由于机器人还没有人类意识但地形连接到了神经网络它知道从记忆神经网络中调取学到的动作。综合分析多智能体推箱子训练第100代/第300代一、意识流分析神经网络脉冲活动1. 热图consciousness_agent2_gen100_ep0_heatmap.png观察热图显示神经元活动在时间上存在明显的带状结构部分神经元持续高活跃亮黄色大部分神经元保持低活跃暗紫色少数神经元间歇性爆发。解读高活跃神经元可能编码持续的内部状态如运动节律、目标意图。间歇性爆发的神经元对应事件驱动的脉冲如接触箱子、跳跃、符号切换。无明显的大规模同步震荡说明网络未陷入病态周期性活动。2. PCA主成分分析consciousness_agent2_gen300_ep0_pca.png观察PC1 解释了 63% 的方差PC2 仅解释 3%。点云在 PC1 方向上显著分散PC2 方向几乎无差异。解读神经元群体活动主要由一个主成分主导表明网络内部存在一个高度相关的“全局模式”可能与行走‑推箱子的主节奏相关。PC2 方差极低说明次要模式如个体差异、随机噪声贡献很小网络已经收敛到稳定的行为策略。点云没有形成明显分离的簇意味着没有分化出完全独立的功能模块如“行走神经元组”与“推箱子神经元组”可能高度重叠。二、符号活动分析16维符号向量1. 转移概率矩阵symbol_agent0_gen100_ep0_trans.png观察矩阵有明显的对角线主导自转移概率高和少数非对角线高亮方块。解读符号状态倾向于自我维持长时间保持同一符号说明符号具有稳定的含义而非随机游走。非对角线高亮区域表明存在特定的状态跳转例如从符号A跳到B再跳回A可能对应行为切换如“前进”→“推”→“前进”。状态数量较多颜色方块多但活跃状态可能只占少数许多状态从未出现全暗列。2. 高频模式symbol_agent0_gen100_ep0_patterns.txt和ep1_patterns.txt观察最常见模式是5623, 5623出现 10 次ep0和3613, 3613出现 10 次ep1即相同状态的重复。其他高频模式多为二元组如(5623, 3084),(3613, 9550)等且这些状态ID在不同 episode 中不一致ep0 的 5623 在 ep1 中很少出现。解读符号状态ID是哈希值通过hash(tuple(sym)) % 10000得到不同 episode 即使行为相似哈希结果也可能不同因此跨 episode 的模式不可直接比较。每个 episode 内部的频繁二元组反映了符号序列的局部语法。例如(5623, 5623)高频表示该符号经常连续出现可能对应持续执行某个行为如“一直推箱子”。出现次数较少3~10次说明符号变化不频繁每步几乎保持相同符号符合“稳定状态”的观察。3. 智能体间互信息未在用户上传中显示但综合分析脚本会生成预期如果智能体间符号互信息较高说明它们通过符号进行了协调例如一个智能体输出“PUSH”符号另一个智能体接收到后调整动作。从训练日志看适应度中包含了MUTUAL_INFO_WEIGHT因此网络可能已经学会了符号通信。三、结论与建议训练有效意识流显示出有序的活动模式符号表现出稳定的状态转移说明神经网络已经学会了协调的行走和推箱子行为。符号分化不足虽然符号状态稳定但不同 episode 使用的符号ID差异很大表明符号含义没有收敛到通用语义每个 episode 随机初始化不同的符号编码。这可以通过增加ROLE_DIFF_WEIGHT或固定符号解码器来改善。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2466944.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!