基于情景记忆的机器人认知行为学习与控制方法

被引：0

作者：

刘冬

机构：

[1] 大连理工大学

关键词：

情景记忆; 移动机器人; 认知行为; 视觉注意; 在线增量学习;

D O I：

暂无

年度学位：

2014

学位类型：

博士

导师：

丛明;

摘要：

论文基于行为主义思想与方法,以认知神经科学中情景记忆的角度研究行为序列学习和行为选择这两个机器人领域关键问题。目前,结构化环境下面向特定任务的机器人研究已经取得了阶段性成果,而越来越多的需要机器人在复杂动态不确定环境下面向非特定任务进行工作,并具有类人一样的智能水平,这也诞生了认知机器人这一新兴领域。本文借鉴生物学和认知神经科学中情景记忆机理相关理论,针对机器人广义环境建模、实时在线学习以及实时优化行为产生等科学问题提出相关模型与方法,对认知机器人这一新兴领域进行初步探索。着重考虑与情景记忆相关的海马体神经元激活的生物学基础,尝试提出一种情景记忆的数学模型以进行机器人环境广义建模。针对不确定环境,构建多维感知到一维状态神经元的映射,提出融合神经元激励机制的情景记忆驱动马尔科夫决策过程(EM-MDP)模型框架。并给出了一种基于情景记忆和视觉注意的认知行为计算模型,分析了实现主动认知行为的过程,以及该模型结构的特点。针对机器人经验知识的实时存储、增量积累和整合问题,提出一种基于情景记忆的广义增量式实时在线学习方法,模拟了情景记忆的组织方式。采用生物学启发的注意机制获得输入场景稳定的自然路标,并消除路标中动态信息,基于局部二元模式(LBP)算子获得路标特征序列。受自适应共振理论(ART)与稀疏分布记忆(SDM)思想启发,通过Hebbian规则进行情景记忆网络的自主在线学习,并对系统中不确定信息进行处理,构建增量式、任务指向型的情景记忆网络。基于EM-MDP框架的机器人环境认知学习实验证明了该方法对不确定性具有一定鲁棒性,实现了记忆积累、整合与更新。针对环境冗余信息下目标整体选择注意及机器人应用问题,提出一种目标驱动的基于物体的视觉注意伺服控制方法。建立任务目标描述模型,基于高斯混合模型(GMM)进行特征聚类获得先验知识。引入原对象和偏向特征模版,提出一种基于物体的偏向注意模型实现对整个任务目标的搜索与选择注意。基于偏向注意获得的显著图,将基于图像的视觉伺服(IBVS)控制算法扩展到机器人认知领域,提出视觉注意伺服控制方法,实现对潜在目标的跟踪与接近控制,以作进一步的识别或操作。实验结果证明了该算法适用于任务目标指向性的机器人应用。面向不确定环境下非特定任务,提出一种基于情景记忆的认知行为规划与控制方法,实现在任务目标、环境、威胁之间的适应性行为规划、预测与推理。首先,引入神经元突触势能,提出求解EM-MDP的机器人全局规划与行为预测算法,机器人能够评估过去的事件序列,预测当前状态并规划期望的行为,避免了部分可观测马尔可夫决策过程(POMDP)的维数灾难和感知混淆问题。其次,采用一种基于危险函数与可行路径的局部规划行为方法,实现记忆不完善条件下的路径优化与行为推理。提出一种认知启发的导航算法实现记忆路径纠正,通过显著路标的尺度不变特征转换(SIFT)特征弥补仅靠LBP特征定位事件的不足,在保证实时性的前提下进一步提高路标特征维数以确保特征的鲁棒性。最后,通过认知行为产生策略实时产生优化行为。实际普遍场景下通过模拟复杂任务验证了方法的有效性和实用性。

引用

页数：142

共 50 条

[1]

智能家居服务机器人记忆库的设计与实现 [D].