最优控制(动态求解)

  • 格式:ppt
  • 大小:2.68 MB
  • 文档页数:173

下载文档原格式

  / 173
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
假定t0与tf 给定,且初态与末态两端固定。 (1) 无约束泛函极值的必要条件 定理 设有如下泛函极值问题:
(t ), t dt min J F x(t ), x
tf x (t ) t0
(1)
已知x(t0)=x0 x(tf)=xf ,则极值曲线 应满足如下欧 * x (t ) 拉方程
(t ) x * (t ) x (t ) x
于是泛函J 的增量 J 可计算如下(以下将*号省去)
J

tf t0
tf t0
x , t F x, x , t dt F x x, x
F F 2 2 x x o ( x ) ,( x ) dt x x
5、泛函的变分: 当自变量函数 X (t ) 有变分X 时, 泛函的增量为
J J X X J X
L X , X r X , X
L X , X 是 X 的线性泛函,r 这里, 的 高阶无穷小,则
X , X 是关于 X
J L X , X
(11.2)
例子: (1) 求平面上给定两点A(0,1),B(1,3)间的最短弧长。 (2) 若B点可沿曲线 c(t)=2-t 移动,求一连接A、B两点且 弧长最短的曲线。 对于最短弧长问题,它是泛函

J [ x(t )]
tf
t0
2 1 x dt
在两端固定条件下的变分问题,欧拉方程
如果t0也自由、x(t0)受约束,即沿着曲线g(t) 则应满足以下横截条件
x(t0 ) g (t0 ) x(t f ) c(t f ) * * T L L ( x , x , t ) ( g x ) 0 t 0 x * * T L L ( x , x , t ) ( c x ) 0 t f x
(5 )
(4)式中第二项即为结论中的式(3).

举例:
利用上面的结论求得
(2) 有等式约束泛函极值的必要条件
定理 设有如下泛函极值问题:
(t ), t )dt min J g ( x(t ), x
x (t ) t0
tf
s.t.
(t ), t ) 0 f ( x(t ), x
(6 )
vdu
t0
tf
J ( )xdt x t t x x dt x
F
d F
F
tf
(4)
0
J取极值的必要条件是 J 等于零。因 x 是 任意的,要使(3-2)中第一项(积分项)为 零,必有
F d F ( )0 x dt x
(8)
将(8)右端的第二项在极值曲线泰勒展开
对上式右端的第二项分部积分
将以上结果代入(8),取增量的线性主部,得泛函的变分
令 J 0 ,得欧拉方程和横截条件:
(9)
(10)
(3)
末端时刻自由、末端状态变动时的横截条件
1) 末端状态自由时的横截条件 当x(tf)自由时,由(7)可知 代入(10)可得到
n ( t ) R 为拉格朗日函数, 是待定拉格朗日乘子。
4.1.3 横截条件
(1)
末端时刻固定时的横截条件
F ( ) t t f x(t f ) 0 x
当tf 固定时,在x(t0)=x0 固定时,横截条件为
x(t0)=x0
如果末端状态也固定x(tf)=xf 时,边界条件退化为x(t0)=x0, x(tf)= xf ;当末端状态自由时,横截条件为
因为 x f , t f 任意,所以
tf自由、x(tf)自由的横截
(11)
条件和边界条件为:
2) 末端状态受约束时的横截条件
设受约束方程为 x(tf)=c(tf) ,由(7)可知 代入(11) ,并考虑 t f 任意,得到tf自由、x(tf)受约束的横 截条件和边界条件为
(11.1)

的解为 x=at+b
d x 0 dt 1 x 2
带入边界条件可得解 x=2t+1。
(2)属于末端受约束的变分问题,其最短弧长满 足与(1)相同的欧拉方程,因此 x=at+b,因为 初始点没有变化,所以由x(0)=1可得b=1. 为了 确定参数a, 运用横截条件(11.1)可得
1 a (1 a)

lim J ( xn ) J ( x)
n
则线性泛函 J ( x) 是连续的,称J[x]为线性连续泛函。
3、线性泛函: 满足下面条件的泛函称为线性泛函
J X J X
J ( X Y ) J ( X ) J (Y )
X 和 Y 是函数空间中的函数。 这里 是实数,
, t ]dt L[ x, x , t ]dt (3) L[ x, x
a a b b
= J [ x0 , x]

dx d (4) x dt dt
举例:
可见,计算泛函的变分如同计算函数的微分一样。
6、泛函的极值:若存在 0 ,对满足的 X X * 一切X,J ( X ) J ( X * ) 具有同一符号,则 称 J ( X ) 在 X X *处有极值(极大值或极小值)。
称为泛函J[x]的变分。 可知泛函变分就是泛函增量 的线性主部。
当一个泛函具有变分时,也称该泛函可微。和函 数的微分一样,泛函的变分可以利用求导的方 法来确定。 定理 设J[x]是线性赋范空间Rn上的连续泛函, 若在x= x0处J[x]可微,则J[x]的变分为
J [ x0 , x] J [ x0 x]
定理(变分预备定理):设 (t ) 是时间区间[t0, t1] 上连续的n维向量函数, (t ) 是任意的连续n维 向量函数,且有 (t0 ) (t1 ) 0 ,若

则必有
t1
t0
(t ) (t )dt 0
T
(t ) 0, t [t0 , t1 ]
4.1.2 欧拉方程
0
,0 1
证明:
由于

的线性连续泛函,
又因为

的高阶无穷小,
J [ x0 x]
0
lim
0 0
J [ x0 x] J [ x0 ]

= lim { L[ x0 , x] r[ x0 , x]}
1
泛函变分的规则 (1) ( L1 L2 ) L1 L2 (2) ( L1 L2 ) L2 L1 L1 L2
J J X (t )
粗略来说,泛函是以函数为自变量的函数。(函数的函数)
2、泛函的连续性: 若对于收敛于点x0点列xn,其中x0,xn R n
lim J ( xn ) J ( x0 )
n
,均有
则称泛函J在x0处连续。对于线性泛函J[x],若
xn x 0 (n ) xn , x Rn
H ( x, u, , t ) L( x, u, t ) T (t ) f ( x, u, t )
(15)
它称为哈密顿(Hamilton)函数,在最优控制中 起着重要的作用。
4.1.1
返回主目录
在动态系统最优控制问题中,性能指标是一个 泛函,性能指标最优即泛函达到极值。解决泛函极 值问题的有力工具是变分法。所以下面就来列出变 分法中的一些主要结果,大部分不加证明,但读者 可对照微分学中的结果来理解。
4.1.1 泛函与变分
先来给出下面的一些定义。 1、泛函: 如果对某一类函数X (t )中的每一个函 数 X (t ),有一个实数值J 与之相对应,则称J 为依赖于 函数 X (t ) 的泛函,记为
第4章 最优控制原理与应用
最优控制的基本概念
最优控制研究的主要问题:根据已建立的被控 对象的数学模型,选择一个容许的控制率,使 得被控对象按照预定的要求运行,并使给定的 某一性能指标达到极小值(或极大值)。 从数学观点来看,最优控制研究的问题是:求 解一类带有约束条件的泛函极值问题。

最优控制问题
2 2 o [( x ) , ( x ) ]是高阶项。 上式中
Байду номын сангаас
根据定义,泛函的变分 J 是 J 的线性
主部,即
J

tf
t0
F F x x dt x x
对上式第二项作分部积分,按公式
可得
tf
0

tf
t0
udv uv
tf t0
F d F ( )0 x dt x
(2 )
及横截条件
F F ( )t t f x(t f ) ( )t t0 x(t0 ) 0 x x
(3 )
(t ) 之间有如下关系 证明:x(t ) 与 x
x(t ) x * (t ) x(t )
系统方程为
性能指标为 末端状态 x(tf) 受约束,要求的目标集为 (14)
(12)
(13)
最优控制问题是:确定最优控制u*(t)和最优曲线x*(t),使 得系统(12)由已知初态 x0 转移到要求的目标集(14),并 使性能指标(13)达到极值。
可以利用拉格朗日乘子法将上述有约束条件的泛函 极值问题化为无约束条件的泛函极值问题。 再引入一个标量函数
F ( )t t f 0 x
x(t0)=x0
(2) 末端时刻自由时的横截条件
末端受约束时,存在如下近似关系:
(7)
如果末端自由,则曲线c(t)不存在。 设性能指标为
容许轨线x(t)与极值曲线x*(t)之间有如下关系
当末端由(xf,tf)移动到 ( x f x f , t f t f ) 时, 产生如下的泛函增量
4、自变量函数的变分: 自变量函数 X (t )的变分 X X 2 (t ) 之差 是指同属于函数类X (t )中两个函数X 1 (t ) 、
X X 1 (t ) X 2 (t )
这里, t 看作为参数。当 X (t ) 为一维函数时, X 可用图4-1来表示。
图4-1 自变量函数的变分

最优控制问题的一般提法:在满足系统方 程的约束条件下,在容许控制域中确定一 个最优控制律,使得系统状态从已知初态 转移到要求的目标集,并使性能指标达到 极值。
最优控制的应用类型
(t ), t dt I. 积分型性能指标 J t F x(t ), x t J dt 1. 最小时间控制; t t T J u t (t )u(t )dt 2. 最少能量控制; m t J u j (t ) dt 3. 最少燃料控制; t
2
a 1 a2
0
解得 a=1,因此 可知极值曲线为 x=t+1 . 由末端约 tf 束条件 x(t f ) 2 ,可知 tf=0.5,带入弧长公式 得到最短弧长
J [ x(t )]
0.5 0
dt 1 x
2
0.5
0
2 1 1dt 2
不同边界情况下的横截条件
4.1.4 变分法解最优控制问题
已知x(t0)=x0, 拉方程和横截条件
* x x(tf)=xf ,则极值曲线 (t ) 应满足如下欧
F d F ( )0 x dt x F F ( )t t f x(t f ) ( )t t0 x(t0 ) 0 x x
其中,
T (t ), t ) L(( x(t ), x(t ), , t )) g ( x(t ), x(t ), t ) f ( x(t ), x
tf
0
f 0
f 0
f 0
j 1
II. 末值型性能指标 J [ x(t f ), t f ] III. 复合型性能指标
(t ), t dt J [ x(t f ), t f ] F x(t ), x
tf t0
4.1 用变分法解最优控制
泛函与变分 4.1.2 欧拉方程 4.1.3 横截条件 4.1.4 变分法解最优控制问题