第七章最优控制
- 格式:ppt
- 大小:1.60 MB
- 文档页数:116
第7章 最优控制内容提要最优控制是现代控制理论的重要组成部分。
它所研究的对象是控制系统,中心问题是给定一个控制系统,选择控制规律,使系统在某种意义上是最优的。
这一章介绍了最优控制问题及一些基本的求解方法,如变分法、最大值原理和动态规划等。
为最优控制系统的设计,特别是线性二次型性能指标和快速控制提供方法和理论基础。
关于求解最优控制的变分方法,介绍了泛函与变分法基础,欧拉方程,横截条件,含有多个未知函数泛函的极值,条件极值等;关于最大值原理,介绍了古典变分法的局限性,最大值原理基本叙述,变分法与极大值原理的异同等;关于动态规划,介绍了多级决策过程与最优性原理,离散系统动态规划,连续系统动态规划,动态规划与最大值原理的关系等;还介绍了线性二次型性能指标的最优控制问题,包括状态调节器、输出调节器、跟踪问题,以及快速控制问题和综合问题。
这章研究的内容是最优控制中最基本的,也是必需掌握的。
无论将来从事研究还是从事实际工作都是必不可少的。
习题与解答7.1设有一阶系统x x u =-+,3)0(=x 。
试确定最优控制函数()u t ,在2t =时,将 系统控制到零态,并使泛函220(1)d J u t =+⎰,取极小值。
解 作泛函2200[1()]d J u x x u t λ=+++-⎰写出泛函0J 的欧拉方程0 0u u x x F F uF F t ∂⎧-=⎪⎪∂⎨∂⎪-=⎪∂⎩推出20u λλλ-=⎧⎨-=⎩ 与状态方程x x u =-+联立求得111222ttt tc e c u e c x c e e λ-===+代入边界条件()()03, 20x x ==得122212322c c cc e e -+=+=解之得2212222263, e e c c e e e e----==--故212232t tc e u e e e e---==- □7.2 一质点沿曲线()y f x =从点(0,8)运动到(4,0),设质点的运动速度为x ,问曲线取什么形状,质点运动时间最短?解 因为d , d d sx s x t== 所以t x =⎰由欧拉方程d0d d 0d y y F F tt -=⎛⎫= 得0c =做变量代换,令tg ,y θ'= 代入上式,得1sin ,x c θ== 101c c ⎛⎫= ⎪⎝⎭令 ⑴因为1d tg , d cos d d yy x c xθθθ'=== 得11d tg d tg cos d sin d y x c c θθθθθθ===可推出12cos y c c θ=-+ ⑵从(1)和(2)式中消去变量θ,得()22221x y c c +-=代入边界条件,得()2222221218, 4c c c c -=+=推出125, 3c c =±=所以曲线方程为()22325x y +-= □7.3 给定二阶系统010001x x u ⎡⎤⎡⎤=+⎢⎥⎢⎥⎣⎦⎣⎦,2(0)1x ⎡⎤=⎢⎥⎣⎦。
最优控制又叫动态优化工程技术领域里的过程(物理过程或化学过程),通常都是可以控制的过程控制:使过程的发展变化按人们的需要进行动态优化问题的四个要素:1.建立过程的动态模型(动态系统的状态方程)2.指定所需的初始状态和结束状态(状态方程的边界条件)3.确立在可行控制策略4.性能指标动态系统的变化,可以看成对应状态的变化,其中每一个状态对应着n维状态空间中的一个点,系统的运动将在状态空间中画出一条状态曲线动态系统的状态方程:1.是对研究对象的动态数学建模2.体现了系统运动时应遵循的规律,反映了系统的动态特征3.一般是微分方程组描述状态方程f[x(t),u(t),t]的数学性质:1.f[x(t),u(t),t]是向量函数,维数与状态变量维数相同2.f[x(t),u(t),t]是关于x(t)/u(t)/t的连续函数3.f[x(t),u(t),t]是关于x(t)/t的连续可微函数4.u(t)是关于t的分段连续函数,只有有限个第一类间断点系统的初始时刻t0和初始状态x0一般都是已知的系统的结束时刻tf:固定或者不固定系统的结束状态xf:全部固定/全部不固定/部分固定性能指标:1.要根据实际任务确定,例如过程持续的时间最少/过程消耗的能量最少/成本最小/利益最大等等2.种类:终值型/积分型/复合型,它们都是关于x(t)/t的连续可微函数最优控制一定是容许控制,即最优控制策略(最优控制函数)在控制函数空间中的一个子集中选择当最优控制轨迹确定后,通过系统的状态方程,可以确立对应的最优状态轨迹现代控制理论相对于经典控制理论的优点:1.从时不变系统延伸到时变系统2.从单输入单输出系统延伸到多输入多输出系统3.从频域回到时域,采用能够揭示系统内部各状态变化规律的状态空间描述法最优控制理论属于现代控制理论的分支从数学角度来看,最优控制问题本质上是求泛函极值的变分学问题变分法分为古典变分法和现代变分法(最大值原理/动态规划)古典变分法只能解决容许控制集为开集的最优控制问题实际最优控制问题的容许控制集都是闭集,可以用现代变分法解决函数分为两类:普通函数和泛函普通函数随自变量t变化有确定值对应泛函随普通函数(称为泛函的宗量函数)的形式变化有确定值对应,t已确定或不产生影响复合函数也是普通函数,随自变量t变化有确定值对应具有某些相同特征的所有函数组成一个函数类,或称函数空间在函数空间内,每一个函数(形式不同的)成为函数空间的一个点,例如sin(x)和sin(2x)是正弦函数空间的两个点泛函宗量的变分:1.同一函数空间中的两个函数的差(t已确定或不产生影响)2.宗量的变分仍然是一个普通函数3.这里“变分”的意思是改变量宗量的维数为m时,则宗量的变分在m维函数空间中进行,其中每一维函数空间各自是具有某些相同特征的函数类两个普通函数k阶相近的定义,从几何上来看就是曲线的相似程度两个普通函数间的k阶距离定义,从几何上来看就是曲线的差异程度m维函数空间中,与点[x0(t),x1(t),...xm(t)]距离相同的点构成m维空间中的一个球面泛函k阶连续的定义(利用两个普通函数间的k阶距离来定义)线性泛函的定义:满足齐次性与可加性泛函的变分:1.是泛函增量的关于宗量变分的线性主部2.是关于宗量变分的线性连续泛函3.仍然是一个泛函4.泛函的变分是唯一的5.这里变分的意思相当于普通函数的微分泛函变分的计算公式,是关于宗量变分的泛函,也是关于alpha的普通函数,从普通函数极值条件出发推导得到泛函极值条件求普通函数的极值,必要条件是:极值在稳定点获得,稳定点即普通函数导数为0的点求泛函的极值,必要条件是:极值在泛函变分为0的点取得Lagrange/Mayer/Bolza形式指标的相互转换欧拉--拉格朗日方程的推导过程欧拉--拉格朗日方程是一个二阶微分方程欧拉--拉格朗日方程成立的前提:1.宗量函数对自变量的二阶导数存在2.积分函数二阶连续可微欧拉--拉格朗日方程的能积分出最优解的特殊情况含有多个宗量函数的欧拉--拉格朗日方程组形式等式约束条件下的泛函极值问题采用拉格朗日乘子思想等式约束下的多变量普通函数极值问题,拉格朗日乘子是m维常向量等式约束下的泛函极值问题,拉格朗日乘子是m维普通函数,称为协态变量拉格朗日乘子法的步骤:原问题-->辅助泛函-->解等式约束+欧拉方程-->用边界条件确定未知系数-->判断极大/极小/鞍点等式约束下的泛函极值问题中,拉格朗日乘子(本质上是普通函数)的欧拉方程就是原问题的等式约束条件对于最优控制问题,控制函数u(t)和状态函数x(t)都看成是泛函的宗量,系统的动态方程作为等式约束条件Hamilton函数是泛函,其t的范围由x(t)/u(t)中的t范围确定,可以看成是mayer型泛函Hamilton函数的作用:积分型泛函J对u(t)的等式约束条件极值问题,转换成H对u(t)的无约束条件机制问题Hamilton函数方法解决最优控制问题,是基于必要条件,而不是充分条件Hamilton函数沿着最优空之轨迹和最优状态轨迹,对时间t的全导数等于偏导数当Hamilton函数不显含t时,H是不依赖于t的常数基础数理化:数学是理路,物理和化学是实践;工程中的物理和化学变化过程都是可控的;过程:与时间有关,随着时间推荐的变化,又叫动态过程;动态过程的数学模型又称状态方程,为OEDs或者DAEs形式对一个过程实施控制往往可以选择的策略不唯一,为了使得任务完成得最好,需要选择最优控制策略;最优的意义:根据任务确定的技术或者经济指标,可以是时间上最快、能量上最省、成本最低、利润最大等;状态微分方程f[x(t),u(t),t]是关于u(t),x(t),t的连续函数,是关于x(t),t的连续可微函数,u(t)只有有限个第一类间断点;状态、状态空间、动态系统的变化过程对应于状态空间中的点运动轨迹、点运动轨迹的起始点和结束点就是状态方程的边界条件;系统的初始时间t0和初始状态x0通常是给定的;系统的结束状态根据结束时间tf是否固定和结束状态是否固定可分为6种情况;性能指标的类型:终值型(Mayer型)、积分型(Lagrange型)、复合型(Bolza型;)终值型(Mayer型)是x(t),t的连续可微函数;积分型(Lagrange型)是u(t),x(t),t的连续函数,是x(t),t的连续可微函数,u(t)只有有限个第一类间断点;注意终值型(Mayer型)指标中不含u(t);最优控制轨迹往往在m维控制函数空间的一个子集omiga中选择;经典控制论的特点:针对SISO、线性、时不变(定常)、集中参数系统,以laplace变换作为分析工具,频域内;现代控制论的特点:针对MIMO、非线性、时变、分布参数系统,以状态空间分析方法为分析工具,时域内分析;对系统的状态空间描述,最大好处在于能够反映系统内部各状态变量之间的关系;最优控制理论属于现代控制理论的一部分;最优控制问题在数学上来说属于求泛函极值的变分学领域;古典变分法的局限性:只能处理u(t)无约束或者为开集的泛函极值问题;现代变分学的两个代表:最大值原理(苏联,Pontryagin提出)和动态规划(美国,Bellman 提出);现代计算机的发展推动了控制理论和优化理论的发展与应用,增加了基于计算的科研活动方式;函数分为一般函数和泛函两类;一般函数:自变量形式唯一,当自变量确定为某一值时,函数值也随之确定;泛函:自变量形式和取值(范围)已经确定,当宗量函数形式确定时,泛函值也随之确定;复合函数属于一般函数;终值型泛函中,tf能被确定,所以泛函值取决于终值型泛函的宗量形式;积分型泛函中,被积函数往往是u(t),x(t),dx(t)/dt,t的函数,u(t),x(t)都属于积分型泛函的宗量;积分型泛函中,由于宗量的维数大于1:宗量为u(t),x(t),且各自维数也可能大于1,所以积分型泛函属于多维泛函(宗量为多维,在多维函数空间内取值);Hamiltonian属于多维泛函,自变量取值范围为t0~tf,宗量包括控制函数u(t),状态函数x(t),协态函数y(t);函数空间:具有相同性质的函数类(按函数不同形式区分函数类中的单个函数),构成了一维函数空间(一根轴),每个属于该函数类的具体形式函数都是该一维函数空间(轴)上的一个点;宗量函数的变分deltax(t):是同一函数类中两个一般函数的差,或者说是某一维函数空间中两个点之间的距离,本质上仍然是一个一般函数;一般函数相近的几何意义:曲线形态相似;泛函连续性的定义及与宗量函数相近(宗量函数的变分趋于0)的关系;线性泛函的定义:满足针对宗量函数的齐次性和可加性(将宗量看成一般函数的自变量);泛函变分detalJ[x(t)]:是泛函增量关于“宗量函数变分”的线性主部,是关于“宗量函数变分”的线性连续泛函,本质是泛函;泛函的变分具有唯一形式;求一个泛函的变分不直接使用定义,而用偏导数方法获得,这与一般函数的微积分知识相似;泛函达到极值的必要条件:泛函在宗量函数x*(t)处的变分为0,有三种情况:非极值,极大值,极小值;古典变分法中的欧拉方程由积分型泛函变分为0的必要条件推出,所以欧拉方程也是泛函达到极值的必要条件;欧拉方程本质上是一个二阶偏微分方程;欧拉方程成立的前提是:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;注意L[x(t),dx(t)/dt,t]本身不能称为泛函(自变量的值没有给定),也不能称为宗量函数(宗量函数是x(t));欧拉方程可以求解的条件:L[x(t),dx(t)/dt,t]中不显含x(t)、dx(t)/dt、t三者其一或其二;宗量函数为向量函数时,欧拉方程也成为向量二阶偏微分方程(二阶偏微分方程组);phi(tf)这条终端曲线实际靠测试获得,并作为已知曲线;横街条件反应的是:极值曲线终端斜率与给定曲线斜率之间的关系横街条件成立的前提:L[x(t),dx(t)/dt,t]对宗量函数x(t)、宗量函数的导数dx(t)/dt、自变量t存在二阶偏导数;phi(t)对自变量t存在一阶偏导数;终端点可变情况下,泛函极值的必要条件共有两个:欧拉方程、横街条件;Lagrange型泛函的一阶变分和二阶变分的表达式;泛函极值属性的判断需要借助二阶变分表达式,它是一个对称函数矩阵;涉及到最优控制问题时,最优状态轨迹不仅要使目标函数最优,更重要的是满足系统的状态方程;系统的状态方程(等式)可以看成是求泛函极值问题时的微分等式约束;带等式约束的泛函极值问题,处理思想和一般函数的等式约束极值问题思路一样,采用拉格朗日乘子法思想;带等式约束的泛函极值问题,拉格朗日乘子是一般函数(一般函数的等式约束极值问题中,拉格朗日乘子是常数);带等式约束的泛函极值问题,与一般函数的等式约束极值问题相比,梯度为0的必要条件进化成为变分为0(欧拉方程的满足);带等式约束的泛函极值问题,原等式约束可以视为F[x(t),dx(t)/dt,lamda(t),t]对宗量函数lamda(t)的欧拉方程;利用古典变分法求解最优控制问题,是将控制函数u(t)和拉格朗日乘子函数lamda(t)都作为泛函的宗量函数;Hamiltonian的作用是将dx(t)/dt从F[u(t),x(t),dx(t)/dt,lamda(t),t]中分离出去,它们的关系是:H[u(t),x(t),lamda(t),t]=F[u(t),x(t),dx(t)/dt,lamda(t),t]-lamda(t)dx(t)/dt正则方程组的推导既可以从F[u(t),x(t),dx(t)/dt,t]的欧拉方程推导,也可以直接从变分=0的必要条件推导(欧拉方程从变分=0的必要条件中推导出来);推导tf固定、tf自由时的最优控制问题必要条件时,辅助函数的做法:终态约束等式约束放在积分号外面,状态方程等式约束放在积分号里面;tf固定时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf自由时的三种情况:x(tf)固定(仅需要欧拉方程无需横截条件)属于x(tf)自由的特殊情况,x(tf)自由又属于x(tf)受约束的情况;tf固定又属于tf自由时的特殊情况,仅缺少关于最优时间的方程,所以6种情况最终都可以归类为tf自由、x(tf)受约束的情况处理;Hamiltonian沿着最优控制轨迹和最优状态轨迹(即H[u(t),x(t),lamda(t),t]中的u(t),x(t),lamda(t)都在最优轨迹上取值)时,对时间的偏导数等于对时间的全导数;以上性质说明:沿着最优控制轨迹和最优状态轨迹时,若Hamiltonian不显含t,则Hamiltonian为常数;不等式约束泛函极值问题?古典变分法要求u(t)属于一个全函数空间或者一个函数空间中的开集;现代变分法从实际出发,u(t)可以属于一个函数空间中的闭集;现代变分法中的代表:极小值原理(苏联,Pontryagin)和动态规划(美国,Bellman)极小值原理比古典变分法的进步:u(t)可以属于一个函数空间内的闭集,不要求Hamiltonian对u(t)可微;当u(t)属于一个函数空间内的闭集时,H对u(t)的偏导数可能不为0(在闭函数空间内取不到极点)、deltau(t)可以为0,两方面原因造成古典变分法不再适用;与古典变分法对应的是,极小值原理也有6种情况,最普遍的是tf可变、x(tf)受约束的情况;对于tf可变的情况,需要增加一个确定tf的方程(属于横截条件的一部分);Hamiltonian达到极小值的定义?极小值原理仅是最优控制问题的必要条件;如果x(tf)有终端约束,那么两点边值问题的求解难度会增加很多,常用方法为打靶法(扫描法);协态变量就是等式约束泛函极值问题的拉格朗日乘子函数;状态变量终态的自由与固定,对应协态变量终态的固定与自由;状态变量微分方程求解联合协态变量微分方程求解体现了原问题--对偶问题的共同求解思想?目标泛函对u(t)求偏导,实际是泛函对宗量函数求偏导;从理论分析可以得到,目标泛函对u(t)的梯度(偏导数)在最优控制问题中与Hamiltonian 对u(t)的梯度(偏导数)等价;最优控制(动态优化)问题转换成静态优化问题的理论:通过对u(t)的离散化,将函数空间变为向量空间?从而可以直接使用静态优化算法;处理x(tf)受约束的方法除了惩罚函数法还有其他方法没?[文档可能无法思考全面,请浏览后下载,另外祝您生活愉快,工作顺利,万事如意!]。
第七章 最优控制(Optimal Control )最优化(Optimization ):生产过程的控制,企业的生产调度,对资金、材料、设备的分配,经济政策的制定等都与最优化有关。
最优控制:通常是针对控制系统本身而言的,目的是使一个机组、一台设备、或一个生产过程实现局部最优。
7-1概述1.最优分配问题:仓库(水泥) 运费(元/包) 工地(需要水泥)问应怎样发送这些水泥,才能使运费最省?设:从甲仓库运往A 、B 、C 工地的水泥数分别为1x 、2x 、3x ;从乙仓库运往A 、B 、C 工地的水泥数分别为4x 、5x 、6x 目标函数()x f (总运费):()65432195442x x x x x x x f +++++= 最优化的任务:确定[]Tx x x x x x x 654321=的值,使()x f 为最小。
约束条件:⎪⎪⎪⎩⎪⎪⎪⎨⎧=+=+=+≤++≤++1200600900180********241654321x x x x x x x x x x x x该问题称为具有不等式约束条件的线性最优化问题,属于静态最优化问题,变量x 与时间无关2.动态最优化问题动态最优化问题:在最优控制系统中,受控对象是一个动态系统,所有变量都是时间的函数。
目标函数:是时间函数的函数,称为泛函数(简称泛函) 例:目标泛函 ()()[]⎰=ft t dt t t u t x L J 0,,基本约束条件(受控对象的状态方程):()()()[]t t u t x f t x ,,= J----标量L----标量函数()t x ----n 维状态矢量 ()t u ----r 维控制矢量f ----n 维矢量函数最优控制问题:在满足约束条件下,寻求最优控制函数()t u ,使目标泛函J 取极值(最小或最大),即()max min =J 。
3.求解动态最优化问题的方法古典变分法、极小(大)值原理、动态规划法7-2研究最优控制的前提条件1.给出受控系统的动态描述,即状态方程()()()[]t t u t x f t x,,= 2.明确控制作用域控制集:()(){}0,≤=u x j t u U ϕ()()r m m j u x j ≤=≤;,,2,10, ϕ----()t u 满足的约束条件容许控制:()U t u ∈ 3.明确始端条件 固定始端:()0t x 给定 自由始端:()0t x 任意可变始端:()00Ω∈t x 始端集:()()[]{}0000==Ωt x j t x ρ()[]()n m m j t x j ≤==;,2,100 ρ----()0t x 必须满足的约束条件 4. 明确终端条件固定终端:f t 、()f t x 给定 自由终端:f t 给定、()f t x 任意可变终端:()f f t x Ω∈ 目标集:()()[]{}0==Ωf j t x ff t x ϕ()[]()n m m j t x f j ≤==;,2,10 ϕ----()f t x 必须满足的约束条件5. 给出目标泛函(即性能指标) 对于连续时间系统,一般表示为:()[]()()[]⎰+Φ=ft t f dt t t u t x L t x J 0,, (综合型或鲍尔扎型)()[]f t x Φ----终端指标函数,反映对终端性能的要求;()()[]⎰ft t dt t t u t x L 0,,----动态指标函数,L 为状态控制过程中对动态品质及能量或燃料消耗的要求等。
第7章最优控制原理总结第7章的最优控制原理是指在动态系统中,通过分析系统的状态和控制输入,确定最佳的控制策略,以达到系统的最优性能。
这一原理在工程、经济和生态等领域都有广泛的应用。
本文将从最优控制的基本概念、最优控制方法以及最优控制的应用方面进行总结。
最优控制的基本概念包括系统模型、性能指标和约束条件。
系统模型描述了动态系统的行为,可以通过微分方程或差分方程表示。
性能指标用来衡量系统的性能,可以是一些状态的值、系统的能耗等。
约束条件是系统在控制过程中必须满足的限制条件,例如系统的输入上下限、状态的约束等。
最优控制方法主要包括动态规划、变分法和数值优化等。
动态规划是一种通过将问题分解为一系列子问题来求解最优控制策略的方法。
通过选取最优子问题解来确定最优策略,并使用递推算法进行求解。
变分法是一种通过构建泛函,并通过最小化泛函来求解最优控制策略的方法。
通过求解欧拉-拉格朗日方程,得到最优控制策略的微分方程,并通过求解微分方程得到最优策略。
数值优化是一种通过数值计算方法求解最优化问题的方法。
通过建立优化模型,将最优控制问题转化为最优化问题,并应用优化算法进行求解。
最优控制在实际应用中有广泛的应用。
在工程领域,最优控制可以应用于飞行器、机器人和自动控制系统等。
例如,对于无人机飞行控制问题,可以通过最优控制方法来实现自动飞行,提高飞行性能。
在经济领域,最优控制可以应用于经济模型和金融产品的定价等。
例如,在股票市场中,可以通过最优控制方法来确定最佳交易策略,以最大化利润。
在生态领域,最优控制可以应用于生态系统的保护和管理等。
例如,通过最优控制方法来优化捕鱼策略,保护渔业资源。
最优控制原理的研究还面临一些挑战和问题。
首先,最优控制问题的求解往往需要耗费大量的计算资源和时间。
因此,如何提高求解效率是一个重要的问题。
其次,最优控制的求解通常需要对系统进行建模,而模型的准确性对最优控制的效果有重要影响。
因此,如何建立准确的系统模型也是一个关键问题。