AGI Brain II: The Upgraded Version with Increased Versatility Index
  
 
返回论文和资料目录
1.论文简介
论文基于19年提出的第一代AGI Brain I 改进。主要有两点改进,1.提出一个AGI指标,2.用Mamdani模糊推理联想记忆代替原本的神经网络NN表示外显记忆(explicit memory,EM),不懂外显记忆的可看这篇博客。
2.AGI指标
提出的指标定义如下,其是一个综合描述智能的通用性和单个智能任务上表现的指标。
 
 其中VI(Versatility Index)是通用性指标,也可以理解为智能指标,越大越好。
 N是测试的不同场景数目,
    
     
      
       
        
         α
        
        
         i
        
       
      
      
       \alpha_i
      
     
    αi是第i个场景下的表现。
 下面是一个例子
 
3.第一代AGI Brain I简介
第一代AGI Brain I提出的世界原理结构图。
 
 AGI Brain的工作流示意图。
 其中IM是内隐记忆。
 1,2,3路径分别代表 1) Infancy stage, 2) Decision making stage, and 3)
 Expert stage
 
 在第2阶段时,代理智能体根据下面的公式取得最好的行为,其中EM是外显记忆。
 
二代的改进就是将原本用NN实现的Estimation用Mamdani模糊推理替换掉。作者认为这样可以在随机环境下表现更好。
3.第二代AGI Brain II
Mamdani模糊推理也被作者叫做ProMem,替换上述的公式里的EM得到下式。
 
 下图为第二代的大脑结构图,其就是上面世界图的
    
     
      
       
        Γ
       
      
      
       \Gamma
      
     
    Γ部分。
 
 左边的输入从上到下分别是:代理
    
     
      
       
        ω
       
      
      
       \omega
      
     
    ω返回的内部状态向量
    
     
      
       
        
         X
        
        
         ω
        
       
      
      
       X_{\omega}
      
     
    Xω,
    
     
      
       
        a
       
      
      
       a
      
     
    a是行为向量,
    
     
      
       
        
         X
        
        
         Ψ
        
       
      
      
       X_{\Psi}
      
     
    XΨ是实体
    
     
      
       
        Ψ
       
      
      
       \Psi
      
     
    Ψ的反馈状态向量,
    
     
      
       
        r
       
      
      
       r
      
     
    r是实体
    
     
      
       
        Ψ
       
      
      
       \Psi
      
     
    Ψ的反馈向量。
    
     
      
       
        E
       
       
        M
       
      
      
       EM
      
     
    EM是ProMem实现的外显记忆,
    
     
      
       
        I
       
       
        M
       
      
      
       IM
      
     
    IM是内显记忆,
    
     
      
       
        J
       
      
      
       J
      
     
    J是目标值向量,
    
     
      
       
        P
       
      
      
       P
      
     
    P是个人向量。DM是决策单元。
    
     
      
       
        R
       
       
        n
       
       
        d
       
      
      
       Rnd
      
     
    Rnd是随机单元。右上像
    
     
      
       
        X
       
      
      
       X
      
     
    X是所有替换的可能集合。
    
     
      
       
        S
       
       
        t
       
       
        r
       
      
      
       Str
      
     
    Str是压力模拟器。数字1,2,3分别是前面说的3个阶段。
    
     
      
       
        u
       
      
      
       u
      
     
    u是输出的行为。
实验测试
作者先给出一个投资优化问题
 
然后给出了第一代和第二代的结果对比图。
 


















