vnsc3775威尼斯城官网-vnsc3775威尼斯城官网点击

感知决策一体化新型类脑导航技术 来源:科研管理办公室 编辑: 科研管理办公室


本文导读:
l 研究背景
 
l 大脑导航机理研究概述
 
l 类脑导航概念与内涵
 
l 类脑导航研究概述
 
l 总结与展望
 
研究背景
 
近年来,国内外无人飞行器、无人车辆、无人潜航器等无人载体的研究和使用蓬勃发展,在军民用领域有着广阔的应用前景。导航作为无人载体的核心技术之一,经历了惯性导航、组合导航、多源/全源导航时代,其技术创新进一步促进了无人载体的发展,一直是研究的热点。当前,无人载体朝着更深层次自主化、智能化以及大规模集群化方向发展,对导航自主性、智能性、可靠性、实时性、功耗等提出了更高要求。现有这些导航技术,主要是基于预先准确建模的,不具备学习能力,无法自主应对复杂未知环境;缺少认知能力,无法智能应对环境;导航与感知、控制模块分离,无法由感知与导航信息及时生成决策及控制指令而快速响应环境;主要采用冯诺依曼架构的板载计算机,计算和存储分离,通过总线来回调度,大规模计算速度急剧下降,且耗费较多能量,无法较好适应当前及未来无人载体对导航的需求,亟需发展新型自主智能导航技术。
 

 
随着脑与神经科学、人工智能、神经形态计算及硬件技术的持续发展,类脑导航技术得到了快速发展,初步形成了大脑导航机理分析、建模仿真、实验验证以及神经形态设计研究体系,呈现出感知、认知与决策一体化的开放式架构体系,具有提高无人载体导航自主性、智能性、可靠性、实时性以及降低功耗的潜力,为发展新型自主智能导航技术提供了新思路。

 
当前,美国、澳大利亚等众多研究团队也将类脑导航作为下一代新型导航方式来重点规划和发展。2019年10月,美国与澳大利亚军方联合两国多所高校项目“Neuro-Autonomy: Neuroscience-Inspired Perception, Navigation, andSpatial Awareness for Autonomous Robots”,旨在发展神经科学启发的下一代军用无人载体感知/导航/认知一体化技术。2018年10月,美国约翰霍金斯大学医学院与应用物理实验室开展了基于大脑海马体认知机理的机器人集群感知与控制研究,旨在发展下一代基于神经认知的集群感知与控制技术。我国也高度重视发展脑科学、类脑、人工智能及导航交叉学科研究,2016年,国务院正式印发《“十三五”国家科技创新规划》,战略部署脑科学与类脑科学研究;2017年,国务院印发《新一代人工智能发展规划》涉及重点突破复杂动态场景感知与理解、实时精准定位、面向复杂环境的智能导航等关键技术。因此,开展类脑导航技术研究,探索发展新型无人载体导航方式,具有重要科学及工程应用意义。

 
本文结合编辑团队申请并主持的国家自然科学基金项目“类脑感知定位机理的无人机密集集群编队协同导航方法”研究进展,对国内外大脑导航机理、类脑导航概念内涵、类脑导航技术的研究概述和趋势进行了系统先容。

 
大脑导航机理研究概述
 
人与哺乳动物具有高度自主智能的空间认知与导航能力,这些能力与大脑海马体-内嗅皮层脑区密切相关,该脑区中由多种导航细胞网络连通的神经回路不断整合自运动等内源性和视觉/听觉等外源性输入信息,形成表征空间的内部认知地图,进而基于认知地图进行空间认知和面向目标导航,如图2所示。
 

 
(1) 认知地图
 
海马体中的位置细胞被认为是认知地图的物质基础,当人或动物到达环境某个位置区域或遇见某一事物时,特定的位置细胞会激活放电,以此指示所处位置及环境信息,全体位置细胞联合指示所处位置及环境,并生成能够表征位置及事物逻辑关系的认知地图。
 
位置细胞主要接收两类信号,一类是基于自运动信息的路径积分(航迹推算)信号,另一类是信标信号。
 
路径积分。大脑中的头朝向细胞网络(速度细胞网络)对来自前庭系统敏感的角速度(加速度)信息进行神经计算,当头部朝向不同空间方向时(动物以不同的前向速度运动时),特定的头朝向细胞(速度细胞)会放电激活,以此表征方位(速度)信息;条纹细胞网络对方向和速度信息进行整合计算,输出矢量速度信号;网格细胞网络实现对矢量速度的路径积分,在动物到达环境中正六边形网格顶点时激活放电,表征动物行进的方向和距离,进一步投射到位置细胞网络,激发特定位置细胞放电,指示位置信息。
信标。动物在陌生环境中运动时,位置细胞网络对感兴趣的视觉、嗅觉等信标进行记忆,并与路径积分提供的空间坐标系进行关联;当再次遇见这些信标时,特定的位置细胞激活放电指示关联的位置。此外,一些可以感知特定信标的导航细胞也会发生放电,并引起特定位置细胞放电,如感知环境轮廓的边界细胞、感知与物体相对位矢的路标向量细胞、分辨街区级范围位置的临近区域细胞、感受同伴距离的社交位置细胞,等等。
 
(2) 面向目标导航
 
动物使用导航细胞网络构建的认知地图进行快速自定位和对环境认知,在目标位置不可见时,能够借助认知地图进行面向目标位置的导航(如归巢和觅食)。大脑中的海马体和内侧前额叶皮质被认为是处理动物面向目标导航的两个关键脑区。伏隔核一方面接收海马体空间认知信息,另一方面从腹侧被盖区接收由多巴胺神经元产生的奖励预测误差(即当前与目标位置间的误差),然后融合此二种信息并通过伏隔核中的动作细胞网络产生一系列动作指令,内侧前额叶皮质接收动作指令引导动物的运动行为,最终完成面向目标的导航过程。
 
类脑导航概念与内涵
 
类脑导航是一种动物大脑导航机理启发的新型仿生导航技术,目前还未形成统一的概念与框架,本文在参阅国内外研究资料基础上,结合编辑团队类脑导航研究进展,总结归纳类脑导航框架如图3所示,以速度、角速度等内源性自运动信息,视觉、无线电等外源性信标信息为输入,借鉴动物感知、认知和导航脑区结构和信息处理机制,利用AI算法实现从原始感知信息输入到导飞行为决策的输出,形成具有自学习自进化环境感知、空间认知、路径规划与动作决策一体化能力的智能体,并基于神经突触可塑型神经形态芯片实现智能体的类脑芯片化。类脑导航不仅隐含了导航参数解算,更实现对环境信息的学习、推理、探索、记忆等认知过程以及综合任务目标做出的路径规划与动作决策。
 

类脑导航包括类脑环境感知、类脑空间认知、面向目标类脑导航以及神经形态实现等四个过程:
 
(1)类脑环境感知借鉴动物感知环境方式和处理多感官信息的选择性注意、逐级抽象等神经机制,采用卷积神经网络等学习进化型AI算法实现对多模态传感信息的多维度特征提取并解析自运动信息及环境信标信息;
 
(2)类脑空间认知借鉴大脑导航细胞自组织集群放电机制,采用脉冲神经网络等学习进化型AI算法构建空间认知模型,将自运动信息和环境信标信息转化为表征自身与环境、同伴之间的导航信息及环境特征的特异性导航细胞网络放电活动,构建认知地图、生成导航与相对导航神经信息;
 
(3)面向目标类脑导航借鉴动物面向任务目标位置导飞行进时认知地图中特定导航细胞与动作细胞连接激活神经机制,采用强化学习等学习进化型AI算法实现面向目标位置的路径规划与动作决策过程;
 
(4) 神经形态实现模拟生物神经突触可塑性和学习功能,从生理结构和信息处理过程两方面将类脑环境感知、类脑空间认知、面向目标类脑导航运作规则嵌入到神经突触可塑型神经形态芯片,实现类脑导航方法的类脑芯片化。

 
类脑导航研究概述

 
当前,国内外研究人员从生理结构和信息处理过程两方面对大脑导航机理进行了借鉴,从类脑App算法和硬件芯片两个方面进行了模拟,如图4所示,并开展了类脑环境感知、类脑空间认知、面向目标类脑导航、类脑导航系统以及类脑集群导航系统等内容研究。
 

 
(1)类脑环境感知
 
生物导航相关感觉器官及信息处理机制启发的仿生传感器、类脑感知信息处理方法得到了大量研究和应用。光流、事件相机、触觉传感器、声矢量传感器、复眼、嗅觉传感器等新型仿生传感器得到了大量研究,部分在导航与定位工程中得到了广泛应用,具有低成本、多模态鲁棒测量等优势,可以在复杂作业环境下提供准确环境及个体运动信息感知,弥补传统导航传感器不足。大脑全景信息压缩感知机制启发的视觉快照处理方法、视觉选择性注意机制启发的视觉显著性区域检测技术、大脑逐级抽象处理机制启发的卷积神经网络等类脑感知信息处理方法,可以快速准确实现对导航场景感知、目标识别与特征提取,有效解决了传统特征提取等感知信息处理方法方法存在的海量数据计算负担等难题。
 
(2)类脑空间认知
 
导航细胞空间选择特异性放电机制是类脑空间认知的基础,其神经实现和计算机制主要有集群和单个细胞两类计算模型。集群模型主要基于导航细胞自组织涌现形成的具有空间选择特异性放电活动的神经回路进行空间信息表征,主要有连续吸引子神经网络模型、动态神经场模型、脉冲神经网络模型、深度学习模型。单个导航细胞模型,认为空间认知信息的计算在单个导航细胞计算实现,然后通过干涉或加权融合得到全局统一的空间信息,如振荡相干模型,贝叶斯大脑模型。吸引子神经网络模型可说明性强,无需模型训练,较强的处理输入噪声鲁棒性,不依赖高精度传感器输入,恶劣环境(暗光光/粉尘…)适应性强,具有很强的生物意义和工程应用前景。此外,位置细胞-网格细胞回路在编码位置等地理信息的同时,还编码声音频率、物体形状及其他抽象任务特征空间。因此,如何共用位置细胞-网格细胞回路,将类脑空间认知与记忆、推理、常识空间或语义空间等更多智能行为耦合,产生更强大的类脑空间认知能力,具有重要研究价值。
 
(3)面向目标类脑导航
 
面向目标类脑导航主要通过无监督学习、强化学习、深度强化学习等AI算法建立认知地图中表征方位、位置、障碍物等多种导航信息的头朝向细胞、位置细胞、边界细胞等多种导航细胞与表征不同动作行为的多种动作细胞之间的智能神经连接,完成由原始环境感知信息输入到动作决策的直接输出过程,实时耦合感知、认知与决策。其中,无监督学习类方法主要有赫布学习、竞争学习等方法,此类方法实现简单,无需监督训练且可以自主学习,灵活性较强,缺点是学习效率较低效果有限;强化学习、深度强化学习在与环境的实时交互中,通过不断试错练习在最大化策略函数的过程中实现导航细胞与动作细胞的最优连接权值,优点是可以习得复杂的决策信息,缺点是依赖优质样本和需要大量试错学习。
 
(4)类脑导航系统
 
前述类脑导航App算法主要是基于大脑感知、认知及决策脑区相关神经细胞作用机理和模型,通过细胞网络集群计算实现的,对计算平台的实时并行处理能力提出了较高的要求,传统冯·诺依曼计算体系结构已无法较好适应,需要同步发展与类脑导航算法相适应的神经形态芯片,实现类脑导航软硬件一体化,构建类脑导航系统,才能更好发挥类脑导航技术优势。当前,类脑导航算法用神经形态硬件主要有数字、模拟以及数模混合三大类。其中,数字式神经形态硬件相比模拟类具有时钟同步、噪声小、可靠等优势,在类脑导航算法仿真硬件加速(如基于FPGA的RatSLAM)、实测并减小体积和功耗(如基于TrueNorth、SpiNNaker的无人智能车导航与控制)等场景中得到初步应用。生物大脑是一个模拟系统,模拟神经形态芯片更接近生物大脑系统,但现阶段模拟类神经形态芯片存在不同步、噪声大、不可靠等突出问题,因此如何通过借鉴大脑导航脑区大量随机且噪声导航细胞自组织集群呈现稳定、统一、准确导航计算机制,发展模拟神经形态芯片,具有重要研究意义。
 
(5)类脑集群导航系统
 
当前,国内外主要从生物群体外在集群机制和内在神经计算机制两个方面开展生物集群导航机理及类脑集群导航方法研究。其中外在集群机制研究,主要集中在分析它们在实验中的外在集群导飞行为,提出与实验观察相符的导航模型,典型的如鸽群V、J、梯形等多种分层领导机制的编队构型研究,蚁群、蜂群自组织集群感知与控制方法等。内在导航神经机制,主要揭示了蝙蝠与群体空间认知导航相关的敏感空间位置的三维位置细胞,敏感空间角度的三维方向细胞,敏感行进距离的三维网格细胞,以及追踪临近事物运动轨迹和感应同伴位置的社交位置细胞等导航细胞神经机理。如何借鉴生物集群机制、生物感知同伴方式,发展基于内在神经与外在集群耦合机制的类脑集群导航方法,并通过神经形态芯片级联技术,将更多类脑个体导航系统进行连接组群,形成更大的类脑集群导航系统,是实现类脑集群导航系统的可行途径,也是编辑团队重点研究的领域之一。
 
总结与展望
 
本文阐述了大脑导航机理及其启发的感知与决策一体化类脑导航技术内涵,论述了类脑环境感知、类脑空间认知、面向目标类脑导航、类脑导航系统、类脑集群导航系统等类脑导航技术研究概述及趋势。类脑导航,旨在形成多源异类及仿生传感器、类脑计算和面向类脑芯片的,具有自学习自进化环境感知、空间认知、路径规划与动作决策一体化能力的新型导航方法体系,拟解决传统导航方法对模型的依赖、不具备学习进化能力、复杂环境鲁棒性弱、计算效率低、能耗高等突出问题,满足载体对导航鲁棒性强、自主性好、高智能、高实时性、长航时等需求。
如何将新的类脑感知、认知、面向目标导航、群体导航处理方法应用于智能(集群)飞行器,研究发展基于多源异类信息的类脑动态环境感知与建模方法、自学习自进化类脑导航方法、以及类脑集群导航方法是本文编辑团队关注的重要方向。
尽管目前类脑导航技术仅仅是对所发现的少数部分动物大脑导航机理借鉴,未能从系统层面模拟和借鉴动物大脑导航机理,存在着模型适用性、可说明性、导航精确性需进一步提高等问题。随着脑与神经科学、人工智能、神经形态技术以及硬件技术的持续发展,类脑导航技术可以展现出更强大的功能和智能性,有望成为下一代新型智能导航模式。

转载来源:威尼斯城常识杂志社