反问题概述及其数值求解方法阐述
- 格式:pdf
- 大小:145.02 KB
- 文档页数:6
2014科学计算选讲作业
反问题概述及其数值求解方法阐述
姓名:赵天骐 学号:1014203026
学院:电气与自动化工程学院 专业:电气工程
1. 反问题概述
1.1 什么是反问题
近30年来,反问题不仅是学术领域中的一个话题,它已经被广泛的应用到
工程学、医学、地质学、经济学、物理学等领域,无论在理论还是应用方面均取
得了飞速的发展。随着计算科学的发展,人们从计算的角度研究反问题,更加频
繁地被应用于解决实际问题,比如其在石油勘测、医学图像处理、遥感技术、经
济决策等领域。但是,究竟什么是反问题?对此常常仁者见仁,智者见智。它的
严格定义很难给出,有点“只能意会,不能言传”的味道。美国斯坦福大学的
J. B. Keller (1976)提出:“若在两个问题中,一个问题的表述或处理涉及到或包
含了有关另一个问题的全部或部分的知识,我们称其中一个为正问题(Direct
problem),另一个为反问题(Inverse problem)。”C. W. Groetsch则认为:”反问
题是很难定义的,但是几乎每一个数学家都能马上判断出一个问题是正问题还是
反问题。”苏联学者Levrentiev则指出:“偏微分方程的反问题是指从偏微分方
程解的某些泛函去确定偏微分方程的系数或右端项。”T. Robinson的观点是:
“在数学上,通常是有了方程而要求此方程的解。现在的情况是有了方程的解,
必须把对应的方程找出来。我喜欢后者。”事实上,上述对反问题的各种说法虽
然揭示了反问题和正问题类似于对偶的一种关系,但没有直观地反映出反问题的
一个主要特征。通常情况下,反问题在Hadamard意义下是不适定的。其学术性
的描述为:在两个相互为逆的问题中,如果一个问题在Hadamard意义下是不适
定的,特别是若问题的解不连续地依赖于原始数据,则称该不适定问题为反问题。
即通常意义下的反问题一般应该是Hadamard不适定的,这也正是我们研究反问
题的困难所在。
那么,什么是Hadamard意义下不适定呢?1923年,Hadamard给出了相反
的定义,即什么是适定的。我们称同时满足如下三个条件的问题是适定的:
(1)问题解的存在性; 2014科学计算选讲作业
(2)问题解的唯一性;
(3)问题的解连续依赖于定解条件(解连续依赖性或稳定性);
否则,不满足三个条件的任何一个,则称该问题是不适定的;而如果不满足
第三个条件,则称为是Hadanmrd意义下不适定的。 关于反问题更浅显的理解可表述为:对于,若已知给出算子A和f,g未知,
那么求g是正问题;反之,若已知A和g,f未知,求f则是其反问题。此时,
f可能不连续依赖于算子A。对()Afg于此类问题,经典的做法往往是借助于
某种范数意义下*Af与g的差达到极小值的f作为f的近似。最小二乘近似便是人们常常使用的办法,即2argmin()ffgAf。
1.2 线性反问题的例子
依据上节中对反问题的认识,本节给出有关反问题的简单实例在此之前,我
们先说明反问题的分类。
反问题的分类没有严格限制,分类方法也多种多样,一般来说:根据算子A
的线性或非线性特征,我们可以把反问题分为线性反问题和非线性反问题;根据
正问题模型的来源,我们也可把反问题分为反散射问题、反源问题等等;根据反
问题信号的来源,我们也可把其分为辨识问题、设计问题、控制问题等等;除此
之外,还有其他多种分类方法。针对各类不同的反问题,目前国际上均有相关的
专题研究,比如热点的问题有反散射问题、计算机断层成像问题、电阻抗断层成
像问题、图像恢复问题等。
下面给出一个线性反问题的例子
考虑一根2m长的细杆,细杆两端的温度为0,细杆中点有一处热源。假设细杆是一维的,即对细杆上的任意一点有[0,2]x,那么,把稳定状态下该细杆
的热传导方程可简化为: 22
0
20
0x
xTfxT
T
(1-1)
这里,f是热源,显然,由条件,我们可假设()fx仅在1x处不为零,是
热传导系数,并假定它是一个不依赖温度和位置的常数。对于这个简单的热传导
模型,下面我们可以对这个模型定义其有关的正问题和反问题了。通常情况是,对于给定的及f,求细杆的温度分布函数T。如果称该问题为正问题。那么换
一个思路,当达到稳定状态时,在细杆上均匀布置N个观测点,得到了N个点2014科学计算选讲作业
的温度观测值,f按上述假设,要求热传导系数。此时,就可以称该问题为前
面问题的反问题,或者有一个更科学的说法叫参数识别问题。
为更清晰地了解正问题与反问题的求解,我们接下来对上述问题的数值求解进行简述。这里,假设5,热源f在中点值为10。如果利用有限元求解正问
题,易知所得解线性方程组即为*KTb,解此方程即得细杆上分布各点的温
度用此正问题的来模拟反问题中的条件,即加上服从Gauss分布的噪声作为测量误差,以此作为在N个观测点获得的温度测量值,反求的值。我们将使用最小
二乘法来求解。即求优化问题2argmin()Th的解作为的近似值。向
量T是测量值(()TTT),即加入噪声的有限元解,而()h为有限元近似解。
1.3 反问题数值求解的主要方法
从上述算例可以看出,反问题的数值求解最终往往归结为一个优化问题,但
是通常情况下的反问题并非如上述示例易于求解,他们往往表现出高度的病态
性,即不适定性,如果我们仅仅简单地用最小二乘法进行处理,往往和真实结果
有很大的偏差。因此需要寻找一些方法减少由不适定性所带来的困难。本文所介
绍正则化方法就是针对不适定问题的一种重要而普遍使用的方法。
除此之外,针对某些特定的反问题,人们提出了大量有效的方法,如拉东变
换、反散射方法、最优设计方法等,对于非线性或许多大规模问题,往往借助迭
代法求解,如:最速下降法,共轭梯度法,Landweber迭代法,Kaczmarz迭代法
等等,这里不一一阐述。接下来主要计对正则化方法进行概述。
2. Tikhonov正则化方法
Tikhonov正则化方法的思想被很多数学家独立发现过,但是直到上世纪60
年代,数学家A. N. Tikhonov和D. L. Phillips分别独立的提出了解决不适定问题
的正则化方法,即Tikhonov正则化方法,该方法才得到学术界的公认。该方法
最初是在函数空间上考虑的,关于该方法的详尽介绍,几乎可以在任何一本介绍
反问题的专著和教材中找到。这里仅进行简单的介绍。 考虑模型问题Kfg,K是一个条件数很大的病态矩阵,当此线性方程组
没有唯一解时,一般利用最小二乘法求得其最佳的近似解,即: 2minffKfg (2-1)
对上述目标函数关于f求Frechet导数,得
KKfKg (2-2) 2014科学计算选讲作业
K是的共辄矩阵,很显然,是一个非负定的对称矩阵,但由于K是病态的,KK也是病态的,那么得到的近似解必然不满足稳定性的条件。Tikhonov正则
化方法的主要思想是通过增加一个罚函数项来求解一个非病态问题,即: 22minffKfgf (2-3)
上式就是离散形式下的Tikhonov正则化方法的表达式,如果我们把矩阵K看作是函数空间中的紧算子,f和g均看作是某类函数,运用函数空间的有关理
论,我们可以得出一般意义下的Tikhonov正则化方法。由上式,我们立即得到 ()KKIfKg (2-4)
通过调节值的大小,我们可以迅速的求解得到其稳定的近似解,1()fKKIKg,得到的近似解,也被称之为Tikhonov近似解,被称之
为正则化因子或正则化参数,而且该参数的选取对于Tikhonov正则化方法发挥
作用至关重要。
接下来从多个角度对Tikhonov正则化方法进行阐述。
2.1 变分形式的Tikhonov正则化方法
考虑二次泛函, 22()FfKfgf (2-5)
令f是最小化上述泛函的解,利用希尔伯特空间的有关性质,对所有在容
许域内的向量函数和tR,f满足: 220()0tdKftgftdt (2-6)
根据内积的有关性质和运算可得, ,,0(*)*,0KfgKfKKIfKg (2-7)
对所有的在容许域上的向量函数上式均成立,由此,我们得出最优解f满
足:
1(*)*0
()KKIfKg
fKKIKg
(2-8)
可以看到,这和解普通最小二乘得出的结果是一致的。
2.2 广义的Tikhonov正则化
所谓广义的Tikhonov正则化,考虑将惩罚项2f替换为2*()Lff,此
时,我们称替换后的正则化算子 2014科学计算选讲作业 22*()KfgLff (2-9)
为广义的Tikhonov正则化算子。通过变量代换*uff算子可变形为: 22KugLu (2-10)
运用上节的变分技术,我们可得该算子的极小化解为: 1*(**)(**)fKKLLKgLLf (2-11)
2.3 从统计学角度看Tikhonov正则化
考虑有限维情形下的观测数据d和未知数据f,运用贝叶斯理论,可将f和
观测误差向量看作是随机向量,那么,观测数据d也成为了一个随机向量。考
虑最小均方差估计问题: 2minffsolEff (2-12)
E是期望算子,f服从概率密度分布函数()fpf。如果gKf是准确值且观
测误差是可加的,分布函数为()p,那么我们可得到如下一些关系:
dgKfgddKf (2-13)
我们假设f和是相互独立的,根据统计学的有关知识可知,估计值f为条件期望Efd时满足上述极小化等式。即: ()fdfEfdfpfdf (2-14) 这里fdp是f的条件密度分布。由贝叶斯理论,我们有 dffddfpppp (2-15)
由假设f和相互独立,那么有 ()()dfpdpgKf (2-16) 则,1()()dffdpppgKfpf。接下来,考虑当f和是相互独立的服从正
态分布的向量, 1**122
1**12211()exp(()())2(2)
11()exp(()())2(2)TffNf
TfMpfffff
p
(2-17)
其中*f和*分别是f和的期望,f和。分别是他们的协方差矩阵。当
满足上述条件时,有如下结论: