多机器人系统协调协作控制技术综述
第23卷 第6期黄 石 理 工 学 院 学 报Vol . 23 No . 6
2007年12月JOURNAL OF HUANGSH I I N STI T UTE OF TECHNOLOGY Dec
2007
文章编号:1008-8245(2007) 06-0001-06
多机器人系统协调协作控制技术综述
姚俊武 黄丛生
(黄石理工学院, 湖北黄石435003)
摘 要:多机器人协调协作控制技术主要研究多机器人系统的体系结构、通信、感知、合作决策、协调控制、
机器人学习等内容。对多机器人协作协调控制技术进行研究, 可为多机器人协作协调控制系统的开发提供指导, 是当前机器人领域研究的热门课题之一。
关键词:多机器人系统; 协调协作; 体系结构; 多智能体系统中图分类号:TP24 文献标识码:A
Revi ew on and
Technology
Yao Jun wu Huang Chongsheng
(Huangshi I nstitute of Technol ogy, Huangshi Hubei 435003)
Abstract:The main researches of multi -r obot coordinati on and cooperati on contr ol technol ogy include syste m con 2structi on, communicati on, appercep ti on, collaborati on in decisi on -making, coordinati on in contr ol and machine learning . The research on multi -r obot coordinati on and cooperati on can p r ovide guidance for devel op ing contr ol sys 2te m of multi -r obot, and it is one popular p r oble m in the research on r obots .
Key words:multi -r obot system; coordinati on and cooperati on; syste m constructi on; multi -agent syste m
0 引言
多机器人的协调协作是指多个机器人在完成一些集体活动时相互合作的性质。多个机器人通过协调协作, 可以完成单机器人难以完成的复杂作业; 可以提高机器人系统在作业过程中的效率; 可以增强机器人系统的环境适应能力; 还可使多机器人系统解决更多的实际问题, 拓宽应用的途径。多机器人的协调协作是机器人技术发展的一种趋势, 也是实际应用迫切要求的结果。随着机器人技术的不断发展, 机器人的协调协作成为机器人领域研究的热门课题之一
[1-2]
1 多机器人协调协作的概念
在多机器人系统中, 协调是指多个机器人在完成一些集体活动时相互作用的性质, 是对环境的适应。由于环境的动态变化性、机器人拥有知识的不完备性、不一致性、不兼容性和不可公度性, 以及系统资源的共享性和有限性, 机器人与环
境之间、机器人与机器人之间可能产生许多冲突, 导致系统不能正常有序地运行
[3]
。因此, 多个机
器人之间需要相互协调, 避免冲突的产生。当单个机器人不能完成某项任务(如大型的搬运作业等) , 就需要多个机器人通过协作来完成该项任务。多机器人的协作主要包括两个方面的内容:机器人之间的“合作(Cooperation ) ”和机器人之间的“协调(Coordination ) ”。机器人的合作解决的主
。
收稿日期:2007-10-30
作者简介:姚俊武(1969— ) , 男, 湖北黄冈人, 副教授, 博士。
黄 石 理 工 学 院 学 报 2007
年2
要问题是如何组织多个机器人共同完成任务, 是高层的组织与决策机制问
题; 机器人的协调解决的主要问题是如何保持或实现多机器人之间在执行任务的过程中动作的协调一致, 是机器人之间合作关系确定后具体的动作控制问题
[4]
的最高层部分(多机器人之间的合作机制就是通过它来体现的) , 它决定了多机器人系统在任务分解、分配、规划、决策及执行等过程中的运行机制及系统各机器人个体所担当的角色(如各机器人个体在系统中的相对地位如何, 是平等自主的互惠互利式协作, 还是有等级差别的统筹规划协调) , 是实现多机器人协作控制的基础, 决定了系统的整体行为和整体能力。一般而言, 多机器人系统的体系结构可分为集中式结构、分布式结构和混合式结构三种
[1]
。
对多机器人之间的协作, 现在还没有一个统一的定义。总体上来讲, 协作反映了多机器人系统在不同的层次上对系统控制与交互提出的不同要求。W. A. Rausch 等在研究中提出多机器人系统不同层次上的协作问题
[5]
, 如图1所示。其中:。
①隐式协作:机器人按照自有的规划模型推测其它机器人的规划而产生的协作; ②异步协作:多个机器人在同一环境, 存在相互间干涉的条件下为完成各自目标而产生的协作; ③同步协作:多个机器人为完成一个共同的目标而产生的协作
。
集中式结构如图2(a ) 所示集中式结构(, 该机器人具动所有息、环境信信息) 用规划算法、优, 可以向各个受控、可以组合多个机器人协作完成任务, 系统中的其它机器人只与主控机器人进行信息交换。集中式结构要求主控机器人具有较强的规划处理能力, 具有控制简单、可能得到全局最优规划的特点。但在实际系统中, 主控机器人不可能具有环境的完全信息, 因此, 无法做出适当的决策, 保证受控机器人快速响应外界环境的变化。同时, 系统中的规划决策都由主控机器人来完成, 当机器人系统中机器人的数量增加时, 主控机器人的负担加重, 存在着严重的瓶颈效应, 而且主控
图1 多机器人系统不同层次的协调协作
机器人一旦失效, 整个系统将陷入瘫痪。系统的可靠性、容错性较差。
分布式结构如图2(b ) 所示。在分布式结构
2 多机器人协调协作控制技术研
中, 没有主控机器人, 所有的机器人之间的关系都是平等的, 每个机器人均能通过通信等手段与其它机器人进行信息交流, 自主地进行决策。在分布式结构中, 每个机器人都具备较高的智能水平, 能够进行自主决策。因此, 系统适应外界环境变化、完成复杂任务的能力较强, 且系统的容错性、可靠性、并行性、可扩展性等均优于集中式结构的多机器人系统。但是, 系统无全局规划能力, 存在局部最优
[6]
究的基本问题
多机器人协调协作要解决的主要问题是如何充分发挥多机器人系统中各个机器人的能力, 以求根据环境与任务的变化, 系统能够灵活、快速、高效地组织多个机器人完成给定的任务。其研究的基本问题主要有:多机器人系统的体系结构、机器人之间的通信、机器人的感知、合作决策机制、协调控制和学习等等。
。
混合式结构如图2(c ) 所示。它是一种融合了集中式结构和分布式结构优点的体系结构。在混合式结构中, 存在一个主控机器人(或主控系统) , 它具有系统的完全信息, 并能够进行全局规划与决策, 系统中的其它机器人既能与主控机器人进行信息交换, 又能与其它的机器人进行信息交换, 虽然不具有系统的完全信息, 却具有进行局部规划和决策的能力
[7]
2. 1 多机器人系统的体系结构
多机器人系统是由多个机器人组成的系统, 它不是多个机器人简单的集合, 而是多个机器人的有机组合。系统中的机器人不仅是一个独立的
个体, 更是系统中的一个成员。多机器人系统的体系结构是指系统中各个机器人之间在逻辑上和物理上的信息关系和控制关系, 是多机器人系统
。一般情况下, 机器人系
统的规划和决策由各个机器人自主来完成, 只有特殊条件下, 才由主控机器人进行全局的规划与决策。因此, 混合式结构融合了集中式结构和分布式结构的优点, 具有更强的活力, 适应于动态的、复杂的环境。但是, 混合式结构的控制系统复
杂, 实现时难度高。
合理的体系结构能够极大地提高系统的运行效率和快速性。因此, 在进行系统设计时, 系统的体系结构要有利于个体能力最大程度地发挥和任务的高效完成
。
图2 多机器人系统的体系结构
2. 2 通信是机器人获取协作信息的主要手段之一。从广义上理解, 通信是指机器人之间的交互
方式, 通过这种交互, 多机器人系统中的每一个机器人可以了解系统中其它机器人的意图、目标、动作以及当前环境的状态信息等, 并依据这些信息, 与其它机器人进行有交互的协商, 协作完成给定任务
[8]
的通信负担急剧增加, 可能导致系统的运行效率降低, 严重时系统工作不正常甚至于系统瘫痪。采用隐式通信, 虽然机器人获取的信息不完全可靠, 但是机器人系统的可靠性、容错性、稳定性等性能均优于采用显式通信的系统。因此, 对于多机器人协作系统的通信问题, 既要研究适合于多机器人系统实时性要求的通信协议、通信方式、网络拓扑结构等, 又要利用智能机器人具有的对周围环境的感知和推理能力, 研究机器人系统能够基于对合作伙伴行为的推理机制, 获取合作伙伴的相关信息的通信控制策略, 使机器人在没有显式通信, 或者显式通信中断时, 仍能完成给定的任务
[11-12]
。
在多机器人协调协作系统中, 机器人之间的通信方式可以分为显式通信和隐式通信两类。机器人之间直接进行信息交流的通信方式称为显式通信, 机器人通过环境来获取系统中其它机器人的信息的通信方式称为隐式通信
[9]
。隐式通信方。
式又可以分为主动隐式通信和被动隐式通信。被动隐式通信是指在无显式通信的多机器人系统中, 机器人使用传感器被动地感知环境的变化, 并依据机器人内部的推理, 理解模型来获取其它机器人的距离、方位等信息, 并根据这些信息进行相应的决策与协作, 是一种基于传感器信息的通信方式。主动隐式通信是指在多机器人系统中, 各个机器人可以通过某种方式在环境中留下某些特定的信息进行信息传递, 机器人通过感知系统获取外界环境信息的同时, 也可能获取其它机器人遗留在环境中的某些特定信息
[10]
2. 3 机器人的感知
感知是机器人获取环境信息的另一种方式,
是机器人与环境的局部的、主动的交互, 通过交互获取环境的局部信息。
一般而言, 智能机器人的感知问题主要包括“感觉”和“知识理解”两个方面的内容。“感觉”是指机器人通过自身配备的多种不同功能的传感器来感觉外部环境, 获取与机器人决策有关的局部环境信息, “感觉”研究的主要方向是如何实现更灵敏、快速、小型的传感器系统。“知识理解”是指机器人通过信息事例、处理、解释等, 理解机器人获取的各种信息的真实意义, 并将其与机器人的决策与控制紧密地结合起来。“知识理解”研
。
采用显式通信, 机器人可以获取其它机器人的准确信息, 但是, 当机器人的数量增加时, 系统
究的主要内容是如何更有效地融合、处理机器人获取的局部环境信息, 得到更加准确的、真实的、全面的环境信息, 为机器人的决策和控制提供可靠的信息基础。在协作多机器人系统中, 各个机器人可以配备不同的传感器系统, 感知不同的环境信息, 系统中的某个机器人可以利用其它机器人的传感器信息来弥补自身感知能力不足, 通过“合作感知”的策略来实现资源共享、优化系统结构、提高系统的运行效率
[13]
间的合作关系, 确定机器人的下一步动作, 实现机器人之间的合作, 这种合作方法称为隐式合作。在这种协作中, 由于机器人之间没有达成合作协议, 也就没有明确的合作关系, 合作任务的完成与机器人所掌握的领域知识、在特定的环境下多机器人能够达成的共识相关, 因此存在着一定的风险。
。
感知与通信一样, 是协作机器人系统动态运行的关键因素, 对协作机器人系统具有重要的作用。通过感知可以实时地获取环境的各种信息, 使机器人系统能够快速响应环境的变化。通过感知可以获取协作机器人的意图、动作效果, 可以降低系统对通信的依赖, 减轻机器人系统的通担, 可实现机器人系统的无显通作过感知可以更新和系统, 2. 5 协调控制
机器人的协调控制是多机器人系统研究的另一个重要的问题, 是多机器人控制中普遍存在的问题, 主要解决以下两个方面题:第一, 在执程中, 如何人相互之间, 如何或死锁发生后如。在多机器人, 以及系统资源
的有限性和共享性, 机器人在完成各自目标的过程中无法避免地产生冲突或死锁, 而且这些冲突和死锁的发生通常是不确定的。因此, 必须采取有效措施加以预防、消除, 从而确保机器人系统有序的运行。对于动态冲突的消除方法主要有
[2, 18]
2. 4 作主要研究在给定一组任务、一组机器人和相关环境的前提下, 如何优化配置系
统资源, 进行任务的分解、分配, 产生一个联合行动规划, 是多机器人系统的高层的组织与决策机制问题
[14]
:
(1) 磋商法:发生冲突的机器人之间通过通
。信进行磋商, 共同研究存在的问题, 提出修改各自的计划, 使各个机器人都能满足目标要求。
(2) 惯例法:系统中的每一个机器人都拥有
协作多机器人基本的合作决策方法主要有三种:全局规划(集中规划) , 自由协商, 隐式合作。
全局规划是一种自顶向下的方法, 在主控机器人(主控系统) 上一次完成任务的分解和规划计算, 将复杂的任务分解成机器人可以执行的动作命令, 产生联合行动规划, 对合作型任务, 则形成一种合作规划。因此, 要求主控机器人具有系统中所有机器人的信息、任务的信息以及环境的信息。
自由协商是指在分布式结构中, 当一个机器人不能独立完成任务时, 就需要请求机器人与之协作。通过与其它机器人进行信息交换, 进行性能评估, 最终形成联合行动规划以实现协作完成任务的合作规划方法。Davis 和S m ith 在上世纪80年代对子问题分配提出了著名的合同网协商模型。它类似于市场上的招标%投标%中标的机制, 通过协商达成协议并签定合同
[15-17]
一些惯例准则, 当冲突发生时, 各个机器人根据惯例来解除冲突。
(3) 熟人模型法:一个机器人拥有系统中其
它机器人的模型, 运行时通过感知了解其它机器人的意图、行为, 基于模型和知识来推测它们的规划和目标, 从而避免各自行为的冲突。
在多机器人协调与协作控制中, 传统的方法主要是采用集中式(Centralized ) 控制方式来控制机器人之间的协调运动, 这种控制的特点是集中规则和集中式数据共享, 适用于机器人数量较少时的协调控制, 当机器人的数量增加时由于计算负担过重将使系统效率降低而很难应用。现在采用的主要方法是基于多智能体概念的多智能体技术, 这种控制方法具有灵活性、适应性、鲁棒性、可靠性以及较高的问题求解效率等特点, 能够更好地满足多机器人协调协作控制的要求。
。
在无通信的多机器人系统中, 机器人可以通过自己掌握的领域知识、多机器人共同的目标以及获取的环境信息, 通过换位推理获取其他机器人的当前意图, 并以此为依据, 单独建立机器人之
2. 6 学习
一般而言, 多机器人系统工作在动态、复杂的外界环境之中, 由于环境的动态性和不确定性、机
器人之间通信的局限性以及机器人决策具有的随机性等原因, 想通过人为设计和优化的方法使机器人具备解决所有问题的能力是不现实的, 如何使机器人系统具有依据实际情况选择适当的决策, 是多机器人控制的一个关键问题。利用机器学习的特征, 使机器人具有学习能力是多机器人系统解决这类问题的一种有效手段。机器人通过学习可以获得更强的适应性、灵活性等智能特性
[19]
特性有自治性、反应性、社会性等
[27-28]
。多智能
体系统是由不同的单个智能体为完成某一特定任务而组成的集合, 单个智能体处在多智能体系统的环境中, 每个智能体可以具有不同的特性功能, 在完成某一共同目标的过程中扮演不同角色, 相互协作。其中智能体的协作关系是通过系统的自组织形成的, 系统功能也不是单个智能体功能的简单和
[29]
。
。在多机器人系统中, 每个机器人可当作一个智能体, 具有一定的自治性、反应性、社会性等, 采。
在多机器人系统中, 对于个体机器人, 学习可以提高个体解决问题的能力, 对于多机器人系统, 学习有助于改善个体之间的一致性和协调性, 提高机器人系统的整体性能。
机器学习主要包括三类重要的学习方法:基于符号的方法, 如变形空间搜索算法
[20]
、I D 3[21]
系统研究的核心问题之一, 主要研究一组机器人的知识、目标与规划的协调, 联合起来采取行动, 完成给定的任务。本文对多机器人协作协调控制技术研究的基本问题进行了深入的阐述, 旨在为多机器人协作协调控制系统的开发提供指导。
duction of Decisi on Trees ) cial )
[接主义的方法, A ; 或化的方法, 遗
[23]
传算法G A A ) 等。这些机器学
习方法来源于不同的科学依据、使用不同的计算方法、依赖于不同的演化模式、使用不同的数据和表示方法, 具有不同的输入输出格式。
参考文献
[1] 王硕. 多机器人系统协调协作理论与应用的研究
[D].北京:中国科学院自动化研究所, 2001
[2] 王超越. 多机器人协作系统研究[D ].哈尔滨:哈
3 多机器人协调协作控制技术的
实现
在传统的多机器人系统中, 通常采用分层和集中的结构, 通过从上至下的一个过程来规划和制定系统决策, 实现多机器人系统的协调协作, 这种集中式控制系统存在许多致命的缺点。上世纪
80年代末, 受到分布式人工智能DA I (D istributed A rtificial I ntelligence )
[24-26]
尔滨工业大学. 1999
[3] J. W ang . Deadl ock Detecti on and Res oluti on in D is 2
tributed Robotic Syste m s [C ].Pr oc . of the Japan /US A Sy mp. On Flxible Aut omati on, 1992:673-677
[4] Rosenchen, J. S . Rati onal I nteracti on:Cooperati on
Among I ntelligent Agent [D ].Ph, D. D issertati on, Stanfort University, 1986
[5] W. A. ausch, p. Levi . Types of cooperati on in the D is 2
tributed Robot Syste m Co MRoS[J ].I ntelligent Robot 2ics:sensing, Modelling and Planning, 1997(2) :340-355
[6] Thomas Laengle, Joerg Seyfried, U lrich Re mbold . D is 2
tributed Contr ol ofM icr or obotics f or D ifferent . App li 2cati ons[J ].I ntelligentive Robotics :Sensing, Model 2ing and Planning, 1997(2) :322-339
[7] R. A la m i, S . Fleury, m. Herrd, et al . M ulti -Robot
Cooperati on in The MART HA Pr oject[J ].I EEE Ro 2botics and Aut omati on, 1998, 15(1) :36-47
[8] Ueya ma, Fukuda, A rai . Communicati on strategy of
D istributed I ntelligent Syste m [J ].
I EEE, 1991
、多智能体系统MAS
(Multi -Agent System ) 研究的启发, 一些学者针对
集中式控制的不足, 提出了分散化和分布式的多机器人系统合作组织策略、方法和协调机制。使多智能体技术在多机器人系统协调协作控制中得到了广泛的应用。
多智能体技术是一种抽象层次较高的普遍理论, 其核心是把一个复杂的大系统分成若干智能、自治的子系统, 它们在物理和地理上分散, 可独立地执行任务, 同时又可通过通信交换信息, 相互协调, 从而共同完成整体任务。
在分布式控制系统中, 智能体(Agent ) 被认为是一个物理或抽象的实体, 它能作用于自身和环境, 并能对环境的变化做出反应。智能体的典型
(11) :1190-1195
[9] Isral a . wagner, M ichael L indenbau m, A lfred M.
B ruckstein . D istributed covering by Ant -Robots U 2sing Evaporating Traces[J ].I EEE Trans . on Robot 2ics and aut omati on, 1999, 15(5) :2896-2903
[10] Ki m berly Shar man Evans, Ce m Unsal, John s . Bey .
A reactive coordinati on sche me f or a M any -r obot Syste m [J ].I EEE Trans . On Syste m s, Man and Cy 2bernetics, 1997, 27(4) :598-610
[11] C . R. Cube, H. Zhang . Collective Robotics:fr om So 2
cial I nsects t o Robots [J ].Adap tive Behavi or, 1994(2) :189-194
[12] R. A. B r ooks . A Robot That W alks:E mergent Be 2
havi or fr om a Carefully Evolved Net w ork [J ].Neural Computati on, 1989(1) :253-262
[13] J. A. Janet, D. S . Schudel, M. W. W et al . Mobile Robots Sharing by w [C I . I nt . . on Robotics and Au 2t Ne w Mexico, 1997
[14] Daisuke bayashi, TakenoriMatsuokat, Akira Ya 2
ji m a . Cooperati on among an intelligence envir on ment and mobile agents by media agents [C ].Pr oceedings of the 2003I EEE /RSJI N T . Conference on I ntelligent Robots and Syste m s Las Vegas, Neveda, 2003, 10:448-453
[15] R. Davis, R. S m ith . Negotiati on as a Metaphor f or
D istributed Pr oblem Solving [J ].A rtificial I ntelli 2gence, 1983, 20:63-109
[16] M. Singhal . Deadl ock Detecti on in D istributed Syste m
[J ].I EEE Computer, 1989(6) :37-48
[17] K . M. Chandy . D istributed deadl ock Detecti on [J ].
AC M Transacti on on Computer Syste m s, 1983, 1(2) :144-156
[18] Shibata, Fukuda . Coordinative Behavi or in Evoluti on 2
ary Multi -Agent_RobotSyste m [C ].Pr oceedings of the 1993I EEE /RSJI N T . Conference on I ntelligent
Robots and Syste m s Yokoha ma, Japan, 1993
[19] M itchell T . M. , Versi on s paces:an app r oach t o con 2
cep t learning [R ].Report No . ST AN -CS -78-711, computer science Dep t Stanford University, Culi 2f or m iu, 1978
[20] M itchell T . M. . Generalizati on as search [J ].A rtifi 2
cial I ntelligence, 2003, 18(2) :203-226
[21] J. R. Quinlan . I nducti on of Decisi on trees [J ].M a 2
chine learning, 1986, 1(1) :81-106
[22] J. L. El m an, E . A. Butes , M. A. Johns on, et al .
Rething I nnateness:A Connecti onist Pers pective on Devel opment [M ].1996
[23J. . . the p r ogra m 2
of N tural Selecti on[M].I T Press, 1992
[]Ti m othy B, Gold Ja mes K, A rchibald R ichard L.
Fr ost . A U tility App r oach t o M ulti -Agent Coordina 2ti on[C ].Pr oceedings of the 2000I EEE I nternati onal Conference on Robotics &Aut omati onSan Francisco, CA
[25] 史忠植. 智能主体及其应用[M].北京:科学出版
Ca M I T Press .
社, 2000
[26] 石纯一, 张伟, 徐晋晖, 等, 译. 多Agent 系统引论
[M].北京:电子工业出版社, 2003
[27] Ilkka Seil on, Pekka Appelqvist, M ika Vaini o, et al . A
Concep t of an Agent_Augmented Pr ocess Aut omati on Syste m [C ].Pr oceeding of the 2002I EEE I nterna 2ti onal Sy mposiu m on I ntelligent Contr ol . Vancouver, Canada, 2002
[28] Wooldridge, M. , N. R. Jennings .
ing , 1995, 10(2) :55-61
[29] O Etzi oni, D S W eld .
1995, 4(1) :44-49
I ntellignet agents on the inter 2
I EEE Expert,
net:Fact, ficti on and forecast [J ].
I ntelligence A 2
gents . Theory and Practice[J ].Knowledge Engineer 2