第5章自适应控制 5.1引言 第4章介绍了非线性系统的反馈线性化方法,这种方法通过在控制器中设计相应的前馈项来补偿系统的非线性特性,从而将系统转化为一个线性系统,并使用线性系统的各种工具来实现期望的性能指标。显然,为了实现这种设计方法,需要对系统的非线性特性具有充分的了解,即得到一个能够完全描述系统动态行为的数学模型,在此基础上,利用这个模型通过反馈线性化等方法来补偿系统中的各种非线性特性。遗憾的是,对于实际过程而言,要得到系统精确的动态特性是极其困难的。实际上,通常建立的模型只是系统动态特性的一种近似,它描述了系统在工作范围内的主要特性,而忽略了其中的一些次要因素。对于这部分特性,我们通常称之为不确定动态特性。当系统中存在不确定动态特性时,显然无法通过反馈线性化方法来对它直接进行补偿。针对这种情形,需要采用其他的控制方法才能实现其高性能控制。通常,系统的模型误差包含结构误差与参数误差两部分。其中,结构误差是指建立的模型与真实的系统特性在函数形式或者阶次上存在差异。例如,在系统建模时,为了简化模型,通常会忽略系统中的一些高频特性,当系统在较低的频率下运行时,这些特性的影响很小; 反之,如果系统工作在高频范围时,这些未建模的高频特性就会被激化,从而使模型与实际系统的行为之间存在较大差异,即产生了显著的模型结构误差。参数误差是指在所建立的模型中,参数值(通常是正的常数)的大小与真实值不一致。参数误差的来源主要有两方面: 一方面,当无法直接测量系统的某些参数,或者测量值具有较大误差时,将导致明显的参数误差; 另一方面,在系统运行过程中,其参数值可能发生变化,因此它们将偏离于原来所确定的数值。 在存在不确定性的情况下,实现系统的高性能控制是自动控制理论界长期关注的问题。迄今为止,研究人员提出了多种控制策略来处理各种不确定动态特性。其中,当系统中的动态特性结构已知,但参数未知且满足线性参数化等条件时,可以采用自适应控制,达到渐近跟踪的控制效果[1]。自适应控制自问世以来,经过几十年的发展,已经在系统的稳定性和动态性能分析等方面取得了不少的理论结果,同时也在石油化工、航空航天、机器人等领域得到了一定程度的应用[2]。最早的自适应控制可以追溯到1950—1960年间,常见于飞行控制系统中的“增益调整”控制方法。在这种控制方案中,系统利用一些辅助信息来判断被控对象中参数的变化,在此基础上,通过对控制增益进行调整来适应这些参数的变化。一般而言,自适应控制希望在对象或者环境特征漂移变化时,系统能够自行调节以跟踪这种变化,从而保持良好的控制品质。为此,自适应控制算法需要在线估计系统的动态性能,以逐步增进对系统行为的理解,在此基础上,算法可以相应地调整自身的控制结构或者控制参数来得到更好的控制效果[3]。 作为一种基于模型的控制方法,自适应控制需要预先获得关于系统动态特性的结构信息。对于系统中的参数,它可以利用过程的输入输出数据以及系统的响应情况来对其进行在线更新,使其不断逼近真实值。因此,在系统的运行过程中,控制器对于系统特性的了解将不断完善,根据系统模型所设计的控制器也能更好地发挥作用,最终达到改善控制性能的结果[4]。从这个意义上说,自适应控制可以看作是通常的控制方法与一种在线递推参数辨识算法的结合。由于自适应控制对于系统参数等方面的变化具有一定的适应能力,因此对于无法测量参数或者参数在运行过程中可能发生缓慢变化的过程而言,采用自适应控制是较好的一种选择。但是,应该看到,由于在控制过程中,需要对模型参数进行在线辨识,因此,控制系统的结构和计算负担都比通常的线性控制方法有所增加。 非线性系统理论(第2版) 第5章自适应控制 5.2线性参数化条件 在自适应控制中,需要对被控对象的未知参数进行在线估计与逐步调整,以不断改善系统的控制性能,直到实现误差渐近收敛的目标。为此,被控对象的未知参数必须以线性的方式进入其动态特性中,即系统的未知参数必须满足“线性参数化”(Linear Parameterization)[5]条件,在这种情况下,与之相对应的参数估计值也将以线性的方式进入到控制算法中,这个条件为设计参数更新规律以及分析控制器对于参数准确度的依赖性带来了很大的方便,同时它也是实现控制误差渐近收敛的一个重要条件。 定义5.1(线性参数化条件)对于结构已知的函数f(·,θ)∈Rn,其中θ∈Rm表示系统包含的未知参数向量,如果能找到与参数向量θ无关的已知矩阵Y(·)∈Rn×m,使得 f(·,θ)=Y(·)·θ(5.1) 则称该函数对于未知参数向量θ满足线性参数化条件。 例5.1试分析下列函数是否满足线性参数化条件。 (1) 函数f1(·,θ)=asin (ωt+)+bx2(t),其中,a,b∈R表示系统包含的未知参数,而频率ω和初始相位都是已知量; (2) 函数f2(·,θ)=asin(ωt+)+bx2(t),其中, a,b,ω,∈R表示未知参数; (3) 函数f3(·,θ)=a2x3(t)+b3sinx(t),其中, a,b∈R表示未知参数; (4) 函数f4(·,θ)=a2x3(t)+(ab)lnx(t)+b3 sinx(t),其中, a,b∈R表示系统包含的未知参数。 解对于各个函数分别分析如下。 (1) 对于函数f1(·,θ)及其未知参数向量 θ=[ab]T,可以找到 Y(·)=sin(ωt+)x2(t) 使得式(5.1)成立,因此满足线性参数化条件。 (2) 对于函数f2(·,θ)及其未知参数向量θ=[abω]T,由于未知参数ω,并非以线性方式进入系统动态特性中,因此无法找到合适的Y(·)使式(5.1)成立,所以不满足线性参数化条件。 (3) 对于函数f3(·,θ)及其未知参数向量 θ=[ab]T,由于未知参数a,b分别以平方和三次方的非线性方式进入系统动态特性中,因此对于未知参数向量θ 不满足线性参数化条件。但是,如果重新定义系统的未知参数向量为 θ1= [a2b3]T,则显然满足线性参数化条件。 (4) 对于函数f4(·,θ) 及其未知参数向量θ=[ab]T,显然不满足线性参数化条件。类似地,重新定义系统的未知参数向量为 θ1= [a2abb3]T,则参数向量θ1满足线性参数化条件。需要指出的是,本来系统只需要两个未知参数a和b,但是,为了使系统满足线性参数化条件,对未知参数向量进行了重新定义,构造了一个新的未知参数向量θ1∈R3,在随后的控制器中,需要设计3个更新规律来在线估计参数向量θ1,显然,这样得到的估计是原来两个未知参数a和b的冗余。这种情况在自适应控制中比较常见,通常称之为过参数化问题。这个问题增加了控制器设计和实现的复杂度,它可以通过对参数进行重新定义而得到一定程度的改善,但是一般无法得到彻底解决。■ 5.3基本自适应控制算法 5.3.1自适应控制算法介绍 如前所述,自适应控制可以通过对被控对象参数的在线估计和不断更新来逐步调整控制效果,直到实现渐近稳定的要求。常见的自适应控制方法主要有两种,即模型参考自适应控制(ModelReference Adaptive Control,MRAC)[6] 和自校正控制(self tuning)[7]。 本书着眼于从李雅普诺夫方法的角度来完成自适应控制器的设计和稳定性分析,因此我们将主要从逆系统方法和稳定性分析的角度出发,介绍模型参考自适应控制方法。对于自校正控制策略,感兴趣的读者可以查阅自适应控制方面的有关教材或者专著[37]。为了介绍自适应控制的基本算法,我们考虑以下简单的非线性系统 x·=-f(x,t,θ)+g(x,t)·u+ρ(x,t) 其中,x∈Rn,u∈Rn分别表示系统的状态与控制输入,而g(x,t)∈R与ρ(x,t)∈Rn则代表已知函数,其中,为了保证系统的可控性,假设存在正的常数g0∈R+,使g(x,t)满足如下不等式 |g(x,t)|≥g0 而f(x,t,θ)∈Rn则是结构已知,但是参数向量θ∈Rm未知的非线性函数,它满足如下的线性参数化条件 f(x,t,θ)=Y(x,t)θ 其中,Y(x,t)∈Rn×m代表已知矩阵,当x(t)∈L∞时,Y(x,t)∈L∞。 控制目标是使系统跟踪期望的轨迹xd∈Rn,其中,xd,x·d∈L∞。为了方便随后的设计,定义跟踪误差e(t)∈Rn如下 e=xd-x 对上式求导并代入系统的动态方程得到 e·= x·d+f(x,t,θ)-g( x,t)·u-ρ(x,t) 为了简化随后的分析,进行如下的输入变换 u1=g(x,t)·u- x·d+ρ(x,t)(5.2) 则系统可以简化为 e·=f(x,t,θ)-u1(5.3) 原来的跟踪问题转化为设计控制器u1(t)∈Rn,使跟踪误差e(t)→0,而系统的真正控制量u(t)则可以利用式(5.2)通过u1(t)计算得到 u=u1+ x·d-ρ(x,t) g(x,t) 根据变换后的系统开环动态方程式(5.3),设计自适应控制器如下 u1=Y(x,t)θ^(t)+ke(t)(5.4) 其中,k∈R+表示正的反馈增益,θ^(t)∈Rm表示对参数向量θ的估计,它由以下自适应机制来在线更新 θ(t)=ΓYT(x,t)e(t)(5.5) 式中,Γ∈Rm×m表示正定、对角的更新增益矩阵。 5.3.2性能分析 为了分析闭环系统的性能,将控制器u1(t)代入误差e(t)的开环动态方程式(5.3),并利用线性参数化条件进行化简得到 e·=Y (x,t) θ~(t)- ke(t)(5.6) 其中,θ~(t)∈ Rm表示参数估计误差。 θ~(t)= θ- θ^(t) 对于上述闭环系统,选择李雅普诺夫候选函数为 V=12 eTe+ 12 θ~T Γ-1 θ~≥0 对其关于时间求导,然后代入闭环动态特性式(5.6)进行整理后得到 V·= eT e·+ θ~T Γ-1 θ~·= eTY (x,t) θ~(t)- keTe- θ~T Γ-1 θ 对V·(t)中的第一项进行转置并和第三项合并后得到 V·=θ~T [YT(x,t) e-Γ-1 θ]- keTe 利用式(5.5)所示的参数更新规律,可以将V·(t)最终改写为 V·=-keTe≤0 所以,V(t)∈L∞,从而e(t)∈L∞, θ~(t)∈L∞,因此,x(t)∈L∞,θ^(t)∈L∞,Y(x,t)∈L∞。基于以上分析,根据系统的闭环方程式(5.6)可知 e·(t)∈L∞。进一步分析可以证明闭环系统中的所有信号都是有界的。为了证明误差信号e(t)的收敛性,定义如下的正定函数 f(t)=keTe≥0 则有 f·(t)=2keTe·∈L∞ 在此基础上,利用芭芭拉定理的推论(定理2.14)可以直接证明 limt→∞e(t)=0(5.7) 因此,系统的跟踪误差渐近收敛于零。 5.3.3自适应控制中的参数辨识问题 对于5.3.1节中所设计的自适应控制器式(5.4),显然,当参数估计值完全收敛于真实值,即参数估计误差为零时,该自适应控制器等价于基于完全模型知识的反馈线性化控制器。实际上,这也是采用如式(5.4)所示的自适应控制规律的主要原因。但是,在进行系统分析时,虽然得到了控制误差渐近收敛的结论,但在参数估计方面却没有得到任何结果。值得指出的是,如果在自适应控制中,真正能使参数估计误差收敛为零,则表明所设计的控制系统同时解决了误差收敛与参数辨识的问题。 对于式(5.6)的误差闭环动态特性,计算其关于时间的导数,并代入式(5.5)进行整理以后得到e¨(t)的表达式如下 e¨(t)= Y·(x,t) θ~(t)+ Y(x,t) θ~· (t)- ke·(t) = Y·(x,t) θ~(t)- Y(x,t) ΓYT (x,t) e(t)- ke·(t) 所以,e¨(t)∈L∞,因此e·(t)一致连续。同时考虑到limt→∞e(t)=0,在这个基础上,利用扩展芭芭拉定理的推论(定理2.15)可以证明 limt→∞e·(t)=0 将这个结果和式(5.7)同时应用到系统的闭环方程式(5.6)得到 limt→∞ Y(x,t) θ~(t)=0(5.8) 此外,由式(5.5)可以直接看出 limt→∞ θ(t)= limt→∞[ΓYT(x,t)e(t)]=0(5.9) 上述两式就是关于参数估计误差所能得到的结论。需要指出的是,根据式(5.9)并不能保证参数估计θ^(t)收敛于某个极限值。例如,对于函数 x(t)=ln(t+1) 尽管 x·(t)=1t+1→0 但是该函数本身并不收敛。而对于式(5.8)而言,显然 limt→∞ θ~(t)=0并非该式成立的必要条件。将式(5.8)左边看作Y(x,t)各个分量关于参数估计误差 θ~(t)的线性组合,则只有当Y(x,t)不收敛于零,且它具有足够复杂的形式,从而使Y(x,t)的分量之间线性无关时,式(5.8)具有唯一的解 limt→∞θ~(t)=0。事实上,这和自适应控制的思路是完全一致的。在自适应控制中,参数更新的原则是要使控制误差逐渐收敛于零,当系统足够复杂且输入信号具有充分的复杂度时,实现误差收敛的唯一途径是使参数逐步更新到真实值,从而使自适应控制器收敛于基于完全模型知识的反馈线性化控制器,以实现设定的控制目标; 反之,当系统特性和输入信号特性相对简单时,可能存在参数的多种选择使得所设计的自适应控制器实现渐近跟踪的效果,因此,当闭环系统中,误差渐近收敛时,并不能保证参数辨识。实际上,要实现参数辨识,Y(x,t)必须要满足持续激励(persistent excitation)的条件。 定义5.2(持续激励条件)对于信号w(t)∈Rn,当存在正的常数α1,α2,δ∈R+,使得对于任意t0∈R+,若满足下列条件 α1In≤∫t0+δt0w(τ)wT(τ)dτ≤α2In 其中,In表示n阶的单位矩阵,则称信号w(t)是持续激励的。 定理5.1(自适应控制的参数辨识定理)对于式(5.4)和式(5.5)所定义的自适应控制算法,当信号Y(x,t)满足持续激励条件时,则该算法在实现误差渐近收敛的基础上,还可以同时实现参数渐近辨识的目标,即 limt→∞θ^(t)=θ。 本书中对于定理5.1不做严格的证明,而只是进行简单的分析。事实上,根据式(5.8)可知 limt→∞ [Y(x,t)θ~(t)]T Y(x,t)θ~(t)=0 上式可以进一步改写为 limt→∞ θ~T(t) [YT(x,t)Y(x,t)] θ~(t)=0 因此 limt0→∞ ∫t0+δt0 θ~T(τ) [YT(x,τ)Y(x,τ)] θ~(τ)dτ=0 (5.10) 另一方面,根据信号Y(x,t)持续激励的条件可以得到 ∫t0+δt0 θ~T(τ) [YT(x,τ)Y(x,τ)] θ~(τ)dτ≥α1 ∫t0+δt0 θ~T(τ) θ~(τ) dτ≥0 (5.11) 根据式(5.10)和式(5.11)容易得知 limt→∞ θ~(t)=0 即系统实现了参数渐近辨识的目标 limt→∞θ^(t)=θ。 例5.2对于如下的非线性系统 x·(t)=ax3(t)+bx2(t)+u(t) 其中,x(t)∈R是系统的状态,u(t)∈R表示控制量,而a,b∈R+则是系统的未知参数,试设计控制器u(t)∈R使系统状态x(t)跟踪设定轨迹xd(t)。 解定义跟踪误差为 e=xd-x 对上式求导,并整理后得到 e·(t)= x·d-x·= x·d-Y(t)θ-u(t) 其中,Y(t)=x3x2∈R1×2是可测向量,而θ=[ab]T∈R2则是系统的未知参数向量。根据上式,可以设计自适应控制器为 u(t)= x·d-Y(t)θ^(t)+ke(t) 上式中,k∈R+表示正的反馈增益,θ^(t)∈R2表示参数向量θ的估计,它由以下自适应机制来在线更新 θ(t)=-ΓYT(x,t)e(t) 其中,Γ∈R2×2表示正定、对角的更新增益矩阵。将控制器代入误差开环动态特性,并进行整理后得到 e·(t)=-Y(t) θ~(t)-ke(t) 选择李雅普诺夫候选函数为 V(t)= 12 e2(t)+12 θ~T(t)Γ-1 θ~(t)≥0 对V(t)求导并整理后得到 V·(t)=-ke2(t) 根据V(t)以及V·(t)的表达式容易证明limt→∞e(t)=0,且闭环系统中的所有信号都是有界的。■ 需要说明的是,自适应控制算法适用于参数未知,但满足线性参数化条件的系统。特别地,对于具有参数不确定性的复杂高阶系统,自适应控制可以和常见的设计方法,例如反向递推法、滤波信号降阶等方法相结合,以解决这类具有参数不确定性复杂系统的自动调节或者跟踪控制问题[8]。 5.4直流无刷电机的自适应控制[9] 直流无刷电机的动态特性包括机械特性与电特性两部分。其中,描述机械特性的微分方程如下 Mq¨+Bq·+Nsinq=I(5.12) 而电特性则可以通过下式描述 L I·=u-RI-KBq·(5.13) 其中,M,B,N,R,L,KB∈R+代表系统的参数,q,q·,q¨∈R则分别表示电机转子的角位移,角速度与角加速度,I(t)∈R是电机的转子电流,而u(t)∈R则是施加在转子上的电压。 系统的设计目标是在状态q(t),q·(t),I(t)全部可以测量,但系统的参数值未知的情况下,选择合适的转子电压u(t),使得电机转子的角位移跟踪设定的轨迹qd(t),其中qd(t),q·d(t),q¨d(t)∈L∞。为此,定义控制误差如下 e(t)=qd(t)-q(t) 考虑到这是一个二阶系统,为了简化控制器的设计,引入如下的滤波器变量 r(t)= e·(t)+αe(t)(5.14) 其中,α∈R+表示正的增益,根据该线性滤波器的性质,控制目标可以转化为设计控制器u(t),使滤波变量r(t)→0。此外,从系统的结构特点出发,本节采用反步方法来完成控制系统的设计。为此,首先假设转子电流I(t)为虚拟控制量,设计期望的电流Id(t)使r(t)→0。然后,为了使转子电流I(t)接近于期望电流Id(t),需要对它们之间的差值进行动态分析,在此基础上,可以设计真实的控制量u(t),实现转子角位移对于设定轨迹的渐近跟踪。具体设计过程介绍如下。 第一步机械特性部分设计。即设计虚拟控制量 Id(t),使r(t)→0。为此,对滤波变量式(5.14)求时间的导数后,再代入系统的机械特性式(5.12)进行整理后得到 Mr·(t)=Mq¨d(t)-Mq¨(t)+αMe·(t)=M[q¨d(t)+αe·(t)]+ Bq·+Nsinq-Id(t)+ηI(t) 其中,Id(t)∈R表示可以自由设计的虚拟控制量,即转子的期望电流,而ηI(t)∈R则是转子的期望电流与实际电流值之间的偏差 ηI(t)=Id(t)-I(t)(5.15) 显然,上式中的未知参数满足线性参数化条件,因此,Mr·(t)的开环动态特性可以进一步改写如下 Mr·(t)=Y1(t)θ1-Id(t)+ηI(t)(5.16) 其中,Y1(t)∈R1×3为可以测量的时变向量 Y1(t)=[q¨d(t)+αe·(t) q·(t)sinq] 而θ1∈R3则是下列未知参数向量 θ1=[MBN]T 根据上述动态方程式(5.16),设计虚拟控制器为 Id(t)=Y1(t)θ^1(t)+k1r(t)(5.17) 其中,k1∈R+是系统的反馈增益,θ^1(t)∈R3则代表θ1的在线估计,它由如下更新规律产生 θ 1(t)=Γ1YT1 (t)r(t)(5.18) 其中,Γ1∈R3×3表示正定、对角的更新增益矩阵。把控制器式(5.17)代入开环方程式(5.16)并进行整理后得到 M r·(t)=Y1 (t) θ~1-k1r(t)+ηI(t) 其中,θ~1(t)∈R3表示参数估计误差 θ~1(t)= θ1-θ^1(t) 对于该闭环系统,根据自适应控制的特点,选择李雅普诺夫候选函数为 V1(t)= 12 Mr2(t)+ 12 θ~T1 Γ-11 θ~1≥0 对V1(t)求导并整理后得到 V·1(t)=-k1r2(t)+r(t)ηI(t) 第二步对于电特性的设计。即需要设计转子电压u(t),使转子电流误差ηI(t)→0。为此,对式(5.15)进行求导,整理后得到ηI(t)的动态特性如下 L η·I(t)=LI·d(t)-LI·(t)=LI·d(t)+RI(t)+KBq·(t)-u(t) 根据所设计的虚拟控制量可以计算得到LI·d(t)的具体表达式,并证明它所包含的未知参数满足线性参数化的条件,因此Lη·I(t)的特性可以改写成线性参数化的形式 Lη·I(t)=Y2(t)θ2-u(t)(5.19) 其中,Y2(t)∈R1×6为可测向量,而θ2∈R6则是未知参数向量。根据上述方程,设计如下所示的自适应控制器 u(t)=Y2(t)θ^2(t)+k2ηI(t)+r(t)(5.20) 其中,k2∈R+是系统的反馈增益,而θ^2(t)∈R6则代表θ2的在线估计,它由如下更新规律产生 θ2(t)=Γ2 YT2(t) ηI(t) 其中,Γ2∈R6×6表示正定、对角的更新增益矩阵。将上述控制器式(5.20)代入开环动态方程式(5.19),并经过整理后得到 Lη·I (t)= Y2(t) θ~2(t)- k2 ηI(t)-r(t) 选择综合的李雅普诺夫候选函数为 V2(t)=V1(t)+ 12 Lη2I(t)+ 12 θ~T2 Γ-12 θ~2≥0 对V2(t)求导并整理后得到 V·2(t)=- k1r2(t)- k2η2I(t) 进一步分析可以证明,闭环系统中所有信号都是有界的,在此基础上,容易证明 limt→∞e(t)=0,limt→∞e·(t)=0 需要指出的是,在上述直流无刷电机系统中,本来只有6个未知参数,但在所设计的控制算法中,却需要一共引入9个更新规律来对这些参数或者其组合进行估计。这种现象在自适应控制系统中较为常见,通常将其称为过参数化问题。显然,这种过参数化问题将提高系统设计的复杂度,占用了过多的计算资源,因此在实际应用中需要尽量避免。一般而言,可以通过状态变换的方法使过参数化问题得以改善,但是通常难以完全解决这个问题。 5.5*非线性参数化系统的自适应控制 作为一种“智能型”的控制方法,自适应控制策略在船舶、机器人、航空航天和工业过程等实际系统中得到了广泛的应用[10,11]。遗憾的是,对于这种控制算法,一般需要系统中的未知参数满足线性参数化条件,这个要求极大地限制了自适应控制的进一步应用。因此,近年来,在国际自动控制领域许多学者致力于对常规的自适应控制进行改进,通过将它与另外的控制方法相结合,来进一步扩展它的性能,使其能适用于非线性参数化系统。例如,美国Case Western Reserve Univ.的Lin W.教授等人研究了一类非线性参数化串级系统,他们通过构造一种连续的部分状态自适应校正器使系统达到了全局稳定[12]。美国Univ.of Central Florida的Qu Z.教授针对一类可分式线性化的不确定非线性系统,提出了一种基于非线性观测器的自适应鲁棒控制算法来实现系统的半全局稳定[13]。新加坡国立大学的Sun M.等针对非线性参数化系统,提出了一种自适应干扰抑制算法[14]。美国麻省理工学院的Annaswamy A.M.教授等人则讨论了非线性参数化系统的参数辨识问题,他们提出了一种多项式自适应估计算法来保证系统参数的渐近辨识[15],为此系统需要满足非线性持续激励条件(nonlinear persistent excitation)。遗憾的是,以上的这些控制方法都需要系统的动态特性满足某些特定的条件,因此只能适用于一些特殊的系统。近些年来,我国自动控制领域也有不少学者进行不确定性非线性系统方面的研究。例如,西北工业大学的戴冠中教授等人研究了一类非线性不确定系统的自适应模糊控制问题,实现了系统状态的一致最终有界[16]。南开大学的方勇纯等人针对非线性参数化不确定系统,分别采用滑模结构与自适应环节相结合的滑模自适应控制器、自适应学习迭代控制策略以及带有开关逻辑调整机制的自适应控制算法等实现了该类系统的高性能控制[1719],并利用李雅普诺夫方法证明了闭环系统的稳定性。综合以上情况可以看出,目前对非线性参数化系统的研究尚处在起步阶段,实际上,对这类系统的控制与参数辨识仍然是国际自动控制领域当前需要解决的重点问题之一。以下将对一类具有特殊形式的非线性参数化控制系统进行介绍[20]。 5.5.1滑模自适应控制器设计 已知一个具有不确定动态特性的非线性系统如下 x·(t)=f0(t)+g(t)(fm(x,v,t)-u(t))(5.21) 其中,f0(t)∈Rn,g(t)∈Rn×n为已知函数; x(t)∈Rn为状态变量; u(t)∈Rn表示控制量; fm(x,v,t)∈Rn表示未知的系统动态特性,它包括建模误差及各种噪声干扰,其中v(t)∈Rz代表系统中的不确定扰动信号,且fm(x,v,t)具有上界函数ρ(x,t)∈R ‖fm(x,v,t)‖≤ρ(x,t)(5.22) 对于该系统,假设其动态特性满足以下的条件。 假设5.1未知函数ρ(x,t)满足参数分式线性化条件[13],即 ρ(x,t)=wT1(x,t)φ1wT2(t)φ2(5.23) 其中,φ1∈Rl,φ2∈Rm是未知的系统参数; w1(x,t)∈Rl,w2(t)∈Rm是已知函数,w2(t)与系统状态x(t)无关,且存在未知常数c∈R+,使得wT2(t)φ2≥c>0。 假设5.2t,g(t)是一阶光滑的正定矩阵,且存在未知常数cg∈R+,使得 det(g(t))≥cg>0 其中,det(g(t))表示g(t)的行列式。 显然,对于上述系统式(5.21),当上界函数ρ(x,t)不可线性参数化时,通常的自适应控制方法无法解决式(5.21)这类系统的控制问题,这实际上是当前非线性控制界亟待解决的一个难题。Qu Z.等率先开始了这方面的研究[13],他们引入了分式线性化条件,并在此基础上构造了一种基于非线性观测器的自适应鲁棒控制算法来实现系统的半全局稳定。本节将介绍一种具有特殊形式的滑模自适应控制器。 对于系统式(5.21),设计如下形式的滑模自适应控制器u(t) u(t)=Sgn(x)wT1(x,t) φ^1(t)wT2(t) φ^2(t)+12 w·T2(t) φ^2(t)wT2(t) φ^2(t)g-1(t) x(t)+ g-1(t)f0(t)+h(t)+kx(t)(5.24) 其中,辅助变量h(t)∈Rn定义为 h(t)=12dg-1(t)dtx(t)=-12g-1(t) g·(t)g-1(t)x(t) k>0是控制增益,Sgn(x)∈Rn定义为 Sgn(x)=[sgn(x1)sgn(x2)…sgn(xn)]T,x=[x1x2…xn]T sgn(xi)=1,xi>0 0,xi=0 -1,xi<0,i=1,2,…,n φ^1(t),φ^2(t)分别是系统参数φ1,φ2的估计值,它们可以通过如下法则来在线更新 φ1(t)=Γ1xT(t)Sgn(x)w1(x,t) φ2(t)=Γ2 proj(μ(t))(5.25) 其中,Γ1∈Rl×l,Γ2∈Rm×m为正定对角更新增益矩阵,μ(t)∈Rm定义为 μ(t)=12xT(t)g-1(t)x(t)w·2(t)-xT(t)g-1(t)x(t)w·T2(t)φ^2(t)2wT2(t)φ^2(t)w2(t)- xT(t)Sgn(x)wT1(x,t)φ^1(t)wT2( t)φ^2(t)w2(t) (5.26) 式(5.25)中,函数proj(μ(t))定义如下 proj(μ(t))=μ(t),φ^2(t)∈int(Λ) μ(t),φ^2(t)∈(Λ),μ(t)Tφ^⊥2(t)≤0 Ptr(μ(t)),φ^2(t)∈(Λ),μ(t)Tφ^⊥2(t)>0 (5.27) 其中,Λ={φ^2(t):wT2(t)φ^2(t)≥ε},ε为任意小于或等于c的正常数。int(Λ)表示点集Λ的内部,(Λ)表示点集Λ的边界; φ^⊥2(t)表示由原点指向φ^2(t)的向量在点φ^2(t)处垂直于(Λ)的分量,正方向规定为由int(Λ)向外。Ptr(μ(t))表示由原点指向μ(t)的向量沿(Λ)在点φ^2(t)处切线方向的分量。 值得指出的是,在φ^2(t)的更新规律式(5.25)中引入proj(·)函数是为了保证wT2(t)φ^2(t)≥ε,从而确保所设计的滑模自适应控制器式(5.24)没有奇异性。 5.5.2控制器稳定性分析 对于以上所设计的滑模自适应控制器式(5.24)及其更新律式(5.25)~式(5.27),通过理论分析可以证明,它可以实现系统的渐近镇定。 定理5.2滑模自适应控制器式(5.24)可以实现系统式(5.21)的渐近镇定,即limt→∞x(t)=0,并且控制器u(t),参数估计φ^1(t),φ^2(t)均为有界信号。 证明将滑模自适应控制器式(5.24)代入非线性系统式(5.21),并进行整理后得到闭环方程如下 x·(t)=g(t) fm(x,v,t)-Sgn(x)wT1(x,t)φ^1(t)wT2(t)φ^2(t)- 12w·T2(t)φ^2(t)wT2(t)φ^2(t)g-1(t)x(t)-h(t)- kx(t) 选取如下所示的正定李雅普诺夫函数 V(t)= 12 xT(t) (wT2(t)φ2) g-1 (t)x(t)+ 12 φ~T1(t) Γ-11 φ~1(t)+ 12 φ~T2(t) Γ-12 φ~2(t) 其中,φ~i(t),i=1,2代表如下定义的参数估计误差 φ~i(t)= φi- φ^i(t),i=1,2 则对V(t)关于时间求导后得到 V·(t)= xT(t) (wT2(t)φ2) g-1 (t) x·(t)+ 12 xT (t) (w·T2(t)φ2) g-1 (t) x(t) + xT (t) (wT2(t)φ2)h(t)+ φ~T1(t) Γ-11 φ~·1(t)+ φ~T2 (t)Γ-12φ~·2(t) 把系统的闭环动态特性代入上式,并进行化简后可得 V·(t)≤μT(t)φ~2(t)-φ~T2(t)proj(μ(t))-xT(t)(wT2(t)φ2)kx(t) 对于式(5.27)所定义的函数proj(μ(t)),可以证明 φ~T2 (t) μ (t)-φ~ T2 (t)proj (μ(t))≤0 因此,V·(t)可以进一步改写为 V·(t)≤-ck‖x(t)‖2(5.28) 由V(t)和V·(t)的表达式,以及假设5.1和假设5.2,可以得知V(t)∈L∞,且x(t), φ~1(t), φ~2(t)∈L∞,因此φ^1(t),φ^2(t)∈L∞; 在此基础上,容易证明 u(t),x·(t)∈L∞。对式(5.28)两边积分可得 ∫+∞0V·(t)dt≤-ck∫+∞0‖x(t)‖2dt 所以∫+∞0‖x(t)‖2dt≤1ck [V(0)-V(+∞)],即x(t)∈L2。于是,由芭芭拉定理(定理2.11)可以得到limt→∞x(t)=0。 值得指出的是,对于本节所设计的滑模自适应控制器,在实际应用时,其中的滑模环节将导致系统状态在零点附近不停地抖动,进而激发系统中的未建模高频动态特征。为了消除或削弱滑模控制中的抖动现象,很多学者进行了相关研究,提出了各种不同的方法。在本文所设计的控制系统中,x(t)的抖动不仅会使系统性能变差,而且在某些特定条件下将可能使参数估计值φ^1(t)持续递增,并进而导致控制量u(t)以及整个控制系统发散,因此对于本节所设计的滑模自适应控制器,需要采用更恰当的方法来解决其抖动问题。对此本节将不再讨论,感兴趣的读者可以查阅本章参考文献[20]。 习题 1. 请比较模型参考自适应控制与自校正控制的主要区别。 2. 对于如下的非线性系统 x·=-ax3-bsint+u 其中,a,b∈R+表示系统的未知常数。为了使系统状态x(t)跟踪参考轨迹xd=sint,设计如下的自适应控制器 u= x·d+ a^x3+ b^sint+ke 其中,k∈R+是控制增益,而a^,b^∈R则表示对相关参数的在线估计 a=Γ1ex3, b=Γ2esint 上式中,Γ1,Γ2∈R为更新增益。试分析闭环系统的稳定性,并对该系统进行仿真。 3. 对于如下所示的非线性系统 x·=ax2+ub+csin2t 其中,a,b,c∈R+为未知的正常数。试设计自适应控制器,使系统状态渐近收敛到原点。 4. 对于如下动态系统 [m2(x,θ)+1]x¨=f(x,x·,θ,t)-u 其中,θ∈Rp表示系统的未知参数,m(x,θ),f(x,x·,θ,t)表示结构已知的系统特性。试设计自适应控制器u(t),使系统的状态x(t)渐近收敛。 5. 对于如下系统 x·1=θ1x2 x·2=θ2x32+u 其中,θ1,θ2∈R为未知的系统常数,试设计自适应控制系统,使 limt→∞(x1x2)=(00) 并分析系统的稳定性。 6. 对于如下系统 x·1=x2+θ1x1 x·2=x3+θ2x2 ︙ x·k=xk+1+θkxk ︙ x·n-1=xn+θn-1xn-1 x·n=u y=x1 其中,θ1,θ2,…,θn∈R为未知参数。试设计自适应控制系统,使系统输出y(t)跟踪给定的轨迹yd(t),其中,yd及其n阶导数有界。 参 考 文 献 1. 韩曾晋. 自适应控制[M]. 北京: 清华大学出版社,1995. 2. 刘兴堂. 应用自适应控制[M]. 西安: 西北工业大学出版社,2003. 3. Sastry S,Bodson M. Adaptive Control: Stability,Convergence and Robustness[M]. New Jersey: Prentice Hall,1989. 4. Spooner J T,Maggiore M,Ordóez R,et al.Stable Adaptive Control and Estimation for Nonlinear Systems: Neural and Fuzzy Approximator Techniques[M]. John Wiley & Sons,2001. 5. Astrom K J,WittenMark B.Adaptive Control[M]. 2nd Edition.Prentice Hall,1994. 6. Goodwin G C. Adaptive Filtering Prediction and Control[M]. Englewood Cliffs: PrenticeHall Inc.,1984. 7. 谢新民,丁锋. 自适应控制系统[M]. 北京: 清华大学出版社,2004. 8. Fang Y,Feemster M,Dawson D,et al. Nonlinear Control Techniques for an Atomic Force Microscope System[J]. 控制理论与应用(英文刊), 2005,3(1): 8592. 9. Dawson D, Hu J, Burg T. Nonlinear Control of Electric Machinery[M]. New York: Marcel Dekker,1998. 10. Fang Y, Dixon W E, Dawson D M, et al. HomographyBased Visual Servo Regulation of Mobile Robots[J]. IEEE Transactions on Systems,Man and CyberneticsPart B: Cybernetics,2005,35(5): 10411050. 11. Fang Y,Zergeroglu E,Queiroz M S,et al. Global Output Feedback Control of Dynamically Positioned Surface Vessels: An Adaptive Control Approach[J]. MechatronicsAn International Journal,2004,14(4): 341356. 12. Lin W and Pongvuthithum R. Nonsmooth Adaptive Stabilization of Cascade Systems with Nonlinear Parameterization via PartialState Feedback[J]. IEEE Transactions on Automatic Control,2003,48(10): 18091816. 13. Qu Z. Adaptive and Robust Controls of Uncertain Systems with Nonlinear Parameterization[J].IEEE Transactions on Automatic Control, 2003,48(10): 18171823. 14. Sun M and Ge S S.Adaptive Rejection of Periodic & Nonperiodic Disturbances for a Class of Nonlinearly Parameterized Systems[C]. Proc. of 2004 American Control Conference,Boston,USA,2004,6: 12291234. 15. Cao C,Annaswamy A M. A Polynomial Adaptive Estimator for Nonlinearly Parameterized Systems[C]. Proc. of 2004 American Control Conference,Boston,USA,2004,584589. 16. 王银河,戴冠中. 一类非线性不确定系统的模糊自适应控制[J]. 控制理论与应用,2004,1(2): 271274. 17. Fang Y,Xiao X, Ma B, et al. Adaptive Learning Control for A Class of Nonlinearly Parameterized Uncertain Systems[C]. Proc. of the 2005 IEEE American Control Conference,Portland,OR,June 2005,196201. 18. Fang Y, Xiao X, Ma B, Lu G.Adaptive Learning Control of Complex Uncertain Systems with Nonlinear Parameterization[C]. Proc. of the 2006 IEEE American Control Conference,Minneapolis,MN,2006,33853390. 19. Ma B, Fang Y, Xiao X. Switching Logic Based Adaptive Robust Control of Nonlinearly Parameterized Uncertain Systems[J]. 自动化学报,2007,33(6): 668672. 20. 马博军,方勇纯,肖潇. 不确定非线性系统的滑模自适应控制器设计[J]. 中南大学学报,2005(专刊): 174178.