数字图像处理第二版参考解答
- 格式:doc
- 大小:487.50 KB
- 文档页数:21
参考解答
第2章
2.2
一阶矩或平均值; 二阶矩或自相关函数;自协方差;方差
2.5
压缩能力更强,码书控制着量化失真量的大小,计算量大,定长码,容易处理。
2.7
二进制图像,索引图像,灰度图像,多帧图像,RGB 图像。
可以。
2.8
采样间隔是决定图像空间分辨率的主要参数。
2.9
如果1S 中的某些像素与2S 中的某些像素连接,则两个图像子集是相连接的。
在图2.9中,1S p ∈和2S q ∈在V 中取值,且q 在)(8p N 中,因此p 和q 是8连接的,1
S 和2S 也是8连接的。
q 在)(p N D 中,且)()(44q N p N 是空集,即满足m 连接条件,因此p 和q 是m 连接的,p 和q 是8连接的,1S 和2S 也是8连接的。
也是m 连接的。
但是,1S 和2S 中所有像素之间都不存在4连接,因此1S 和2S 不是4连接的。
2.10
当V={0, 1}时,p 与q 之间不可能存在4通路,下图(a)中的红色箭显示是没有办法到达q 的。
最短的8通路可在图中看出(蓝色),它的最短长度是4。
m 通路(黑色)的最短长度是5。
q
p
q
p
当V={1, 2}时,最短的4通路的一种可能显示在图(b)中(红色箭),它的长度是6。
最短的8通路的一种可能显示蓝色箭,它的长度是4。
m通路(黑色)的长度是6。
这些从p到q的同样长度的4、8、m通路不是唯一的。
2.11
p和q之间的D4和D8距离与任何通路无关,仅与点的坐标有关。
对于像素p, q其坐标分别为(x, y),(s,t),
D4(p, q) = | x - s | + | y – t | = 6
D8(p, q) = max ( | x - s | , | y – t | ) = 3
然而,如果选择考虑m邻接,则两点间的Dm距离用点间最短的通路定义。
在这种情况下,两像素间的距离将依赖于沿通路的像素值以及它们的邻点值。
Dm(p, q) = 6。
第3章
3.1
FFT(Fast Fourier Transformation),即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。
它利用DFT 系数的特性,合并DFT 运算中的某些项把长序列DFT 变成短序列DFT ,从而减少运算量。
3.5 (1)
∵N ux j N
vy j N u N v e e v u F N y x f /2/21010
2]),([1),(ππ∑∑-=-==
∴N x x u j N
y y v j N u N v e e v u F N y y x x f /)(2/)-(2101020000]),([1),(--=-=∑∑=--ππ
=N vy ux j N ux j N vy j N u N v e e e v u F N /)(2/2/21010
200.]),([1+--=-=∑∑πππ =>N
vy ux j e v u F /)(200),(+-π
同理,
N vy ux j e v u F /)(200),(+-π=>
N
vy ux j e
y x f /)(200),(+-π=N vy ux j N ux j N vy j N u N v e e e v u F N /)(2/2/21010
200.]),([1+--=-=∑∑πππ =N x x u j N
y y v j N u N v e e
v u F N
/)(2/)-(2101
200]),([1--=-=∑∑ππ=),(00y y x x f --
∴N
vy ux j e v u F y y x x f /)(20000),(),(+-⇔--π
(2) ∵N ux j N
vy j N x N y e e
y x f v u F /2/2101
]),([),(ππ---=-=∑∑=
∴N x u u j N y v v j N x N y e e y x f v v u u F /)(2/)(21010
0000]),([),(-----=-=∑∑=--ππ =N
y v x u j e v u F /)(200),(+π =>N
y v x u j e
y x f /)(200),(+π
同理:
N y v x u j e y x f /)(200),(+π=>
),(]),([),(00/)(2/)(2101
/)(20000v v u u F e e y x f e
v u F N x u u j N y v v j N x N y N
y v x u j --==-----=-=+∑∑πππ
3.6
),(),(f [1),(),(101
2m y m x g n m N y x g y x f N u N v --=*∑∑-=-=
⇔),(),(v u G v u F ⋅
),(),(f [1
),(),(101
2
m y m x g n m N
y x g y x f N u N v ++=⋅∑∑-=-=
⇔),(),(v u G v u F * 3.7 需要N N
N 2log 2
*次乘法
一维沃尔什反变换核∏-=---=1
0)()(1)1(),(N i u b x b i n i u x h 可得:
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢
⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎢⎣⎡=1 1- 1- 1 1- 1 1 1- 1- 1 1 1- 1 1- 1- 1 1- 1 1 1- 1 1- 1- 1 1- 1 1 1- 1 1- 1- 1 1- 1 1 1- 1- 1 1 1- 1 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1- 1 1- 1 1 1- 1 1- 1 1- 1 1- 1- 1 1- 1 1 1- 1 1- 1- 1 1- 1 1 1- 1 1- 1- 1 1- 1 1 1- 1 1- 1 1- 1 1- 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1 1- 1- 1 1 1 1 1- 1- 1 1 1- 1- 1- 1- 1 1 1 1 1- 1- 1- 1- 1 1 1 1 1- 1- 1- 1- 1 1 1 1 1- 1- 1 1 1- 1- 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1 1- 1- 1 1 1 1 1 1 1- 1- 1- 1- 1- 1- 1- 1- 1 1 1 1 1- 1- 1- 1- 1 1 1 1 1- 1- 1- 1- 1 1 1 1 1- 1- 1- 1- 1- 1- 1- 1- 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 161G 16
3.12
由一维哈达玛反变换核)
()(1
)1(),(u b x b i N i i u x h ∑-=-=可得:
⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎥⎦
⎤⎢⎢⎢⎢⎢⎢⎢
⎢⎢⎢⎢⎣⎡=1- 1 1 1- 1 1- 1- 1 1 1 1- 1- 1- 1- 1 1 1 1- 1 1- 1- 1 1- 1 1- 1- 1- 1- 1 1 1 1 1 1- 1- 1 1 1- 1- 1 1- 1- 1 1 1- 1- 1 1 1- 1 1- 1 1- 1 1- 1 1 1 1 1 1 1 1 1 3H
3.14
3.15
(1)E{x}=1/3(x 1+x 2+x 3)=(1/3,1/3,1/3)T
⎪⎪⎪⎭
⎫ ⎝⎛------=-=∑=9/29/19/19/19/29/19/19/19/23131
k T
x
x T k k x m m x x C (2)C x 特征值为:1/3,1/3,0
对应的特征向量:
T T T ),,(,),,(,),,(3/13/13/16/16/26/12/1-02/1321=-==e e e ⎪⎪
⎪⎪
⎭⎫
⎝
⎛-==Φ3/16/12/1-3/16/20
3/16
/12
/1) (321e e e
∴,06/12/1,06/20,06/12/1321⎪⎪⎪⎪⎭
⎫ ⎝⎛=⎪⎪⎪
⎭⎫ ⎝⎛-=⎪⎪⎪⎪⎭⎫ ⎝⎛-=y y y
第4章
4.3
首先,对原始图像的直方图进行均衡化: 用式(4.2.12)
t0=0.19, t1=0.44, t2=0.65, t3=0.81, t4=0.89,t5=0.95, t6=0.98, t7=1.0 变换函数:t0=1, t1=3, t2=5, t3=6, t4=7
8个灰度级合并成5个灰度级,结果如下:
pt(t0)=0.19, pt(t1)=0.25, pt(t2)=0.21, pt(t3)=0.24, pt(t4)=0.11 同样用式(4.2.12),对规定花的图像进行直方图均衡化处理: v0=0, v1=0, v2=0, v3=0.2, v4=0.2, v5=0.8, v6=0.8, v7=1.0
4.9 可以。
巴特沃斯高通滤波器的传递函数是 n
h v u D D v u H 20)],(/[11
),(+=
,
其对应的低通滤波器的传递函数是
n
l D v u D v u H 20]/),([11
),(+=
高通滤波器的传递函数与其对应的低通滤波器的传递函数之间存在如下的关系:
),(1),(v u H v u H h l -=,
即
),(]/),([11
))],(/([11)],(/[)],(/[1)],(/[1)],(/[)],(/[111),(1201201
2020202020v u H D v u D v u D D v u D D v u D D v u D D v u D D v u D D v u H l n
n n n n n
n h =+=+==⎪⎪⎭
⎫ ⎝⎛+=+=+-=---
4.10 式
),1(),(y x f y x f G x +-=的两边进行傅里叶变换,从空域转移到频域,得到如下
)),1(),(()(y x f y x f F G F x +-=
),())/2exp(1()/2exp(),(),(),(v u F N ui N ui v u F v u F v u H ππ-=-=
第5章
5.1
根据退化模型位置(空间)不变性,当该退化系统的输入为),(b y a x --δ时,求系统的响应为:
)
)()
((22
)],([),(b y a x e b y a x H b y a x h -+--=--=--δ
5.2
根据退化模型的齐次性、叠加性、线性和位置(空间)不变性,当该退化系统的输入为
),(3),(5b y a x b y a x ++---δδ时,求系统的响应为:
[])],([3)],([5),(3),(5H b y a x H b y a x H b y a x b y a x ++---=++---δδδδ
)
)()(()
)()((222235b y a x b y a x e
e +++--+---=
5.4
图像在x 方向和y 方向都做匀速直线运动,即
⎩⎨
⎧==bt/T
)(/)(00t y T
at t x 则
)
(0
/][20
)]()([2)](sin[)
( ),(00vb ua j T
T vb ua t j T
t vy t ux j e vb ua vb ua T
dt
e dt
e v u H +-+-+-++===⎰⎰πππππ
5.5
把2/)(2
0at t x =代入dt e v u H T
t vy t ux j ⎰
+-=
)]()([200),(π可得: dt e
dt e
v u H T
uat j T
uat j ⎰⎰--==0
2
/22
2),(ππ
5.6
忽略噪声时,维纳滤波器退化成理想的滤波器,
则),(·)
,(),(),(),(ˆ2222222/)(2/)(v u G e e
v u G v u H v u G v u F v u v u σσ++-===
5.13
三角形有三个顶点,把三个点作为对应点分别代入
⎪⎩⎪⎨⎧+++=+++=8
765'
4
321'k y x k y k x k y k y x k y k x k x j i j i j j i j i i 可解得看k 1k 2k 3k 4k 5k 66个系数,即可得变幻式
第6章
6.1
1. 自然界中可见颜色都可以用三种原色按一定比例混合得到;反之,任意一种颜色都可以分解为三种原色;
2. 作为原色的三种颜色应该互相独立,即其中任何一种都不能用其他两种混合得到;
3. 三原色之间的比例直接决定混合色调的饱和度;
4. 混合色的亮度等于各原色的亮度之和。
6.4
由于在印刷时CMY 模型无法产生真正的黑色,因此在印刷业中实际上使用的是CMYK 彩色模型,K 为第四种颜色,表示黑色。
6.5
⎥⎥⎥⎦
⎤⎢⎢⎢⎣⎡-⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡B G R Y M C 111
6.6 ⎩⎨⎧<-≥=++-=++=B G B G H B G R B G R S B G R I θπθ2)],,[min()
(31)(3
1
6.7
全彩色图像处理中,被处理的图像一般是从全彩色传感器中获得。
伪彩色处理将黑白图像转化为彩色图像,或者是将单色图像变换成给定彩色分布的图像。
6.11
伪彩色增强处理将黑白图像转化为彩色图像,或者是将单色图像变换成给定彩色分布的图像。
由于人眼对彩色的分辨能力远远高于对灰度的分辨能力,所以将灰度图像转化成彩色表示,就可以提高对图像细节的辨别力。
其主要目的是为了提高人眼对图像的细节分辨能力。
第7章
7.1
每幅图像大小:24/8*640*480B=921600B=900KB
每秒钟视频大小:24*900KB=21600KB=21.1MB
不进行压缩存储视频的时间:10GB/21.1MB=485s
压缩后每秒视频大小:21.1MB/40.5=533.3KB
存储视频的时间:10GB/533.3KB=19662s
7.4
如果是2单位的信息,以2为底,则为log22=1b
如果是2单位的信息,以e为底,则为ln2=0.69nat
如果是2单位的信息,以10为底,则为log102=0.30哈特利
则1奈特=1/0.69比特=1.44比特
1哈特利=1/0.3比特=3.3比特
7.5
I(a)= I(c)= I(d)=log28=3, I(b)=log2(8/5)=0.2
H(X)= 1/8*3+5/8*0.2+1/8*3+1/8*3=1.25
7.6
经过直方图均衡化的图形落在每一个灰度值统计区内的概率差不多大,此时使用变长编码方法进行压缩效果将不太理想。
7.7
11100100100000110000001101110000000111000000110110
解码后:
S2S1S1S5S5S1S1S1S3S1S1S1S1S1S3S2S1S1S1S1S1S1S1S2S1S1S1S1S1S1S3S3
7.8
由于0.0624在[0,0.2]区间,所以可知第一个信源符号为a,得到信源符号a后,由于已知信源符号a的上界和下界,利用编码可逆性,减去信源符号a的下界0,得0.0624,再用信源符号a的范围0.2去除,得到0.312,由于已知0.312落在信源符号b的区间,所以得到第二个信源符号为b。
同样再减去信源符号b的下界0.2,除以信源符号b的范围0.2,得到0.56,已知0.56落在信源符号c区间,所以得到第三个信源符号为c……解码操作过程综合如下:(0.0624-0)/1=0.0624 => a
(0.0624-0)/0.2=0.312 => b
(0.312-0.2)/0.2=0.56 => c
(0.56-0.4)/0.4=0.4 => c
(0.4-0.4)/0.4=0 => end
所以解码结果为:abcc
第8章
8.1
双尺度方程如下:
)
12()2()2()(-+=-=∑∈x x n x p x Z n n φφφφ
)
12()2()2()(--=-=∑∈x x n x q x Z
n n φφφψ
8.2
cA = (3-1+6+2)/2= 5
cH = -(-3+1+6+2)/2= -3
cV = -(-3-1-6+2)/2= 4
cD = (3+1-6+2)/2= 0
8.6
正交小波变换是一种能量守恒的变换。
第9章
9.1
Roberts 算子:
当模板覆盖图像以下像素值时
0 0 0
0 0 0
0 1 1
G x =Z 9-Z 5=1-0=1, G y =Z 8-Z 6=0-1=-1
mag(f)=( G x 2+ G y 2)1/2=21/2
α(x,y)=arcta n(G x /G y )=arctan(-1)=135°
Sobel 算子:
当模板覆盖图像以下像素值时
0 0 0
1 1 1
1 1 1
)2()2(321987Z Z Z Z Z Z G x ++-++==4
)2()2(741963Z Z Z Z Z Z G y ++-++==0
mag(f)=( G x 2+ G y 2)1/2=4
α(x,y)=arctan(G x /G y )=arctan(4/0)=90°
Prewitt 算子:
当模板覆盖图像以下像素值时
0 0 0
0 0 0
1 1 1
G x =(Z 7+Z 8+Z 9)-(Z 1+Z 2+Z 3)=3
G y =(Z 3+Z 6+Z 9)-(Z 1+Z 4+Z 7)=0
mag(f)=( G x 2+ G y 2)1/2=3
α(x,y)=arctan(G x /G y )=arctan(3/0)=90°
9.3
Canny 算子并不只是简单的进行梯度运算来决定像素是否为边缘点,在决定一个像素是否为当前边缘点时,需要考虑其他像素的影响;也不是简单的边界跟踪,在寻找边缘点时,需要根据当前像素及前面处理过的像素来进行判断。
由于Canny 算子具有独特的性能,使得其边缘检测和定位的结果要优于其他算子。
9.4
非二值图像可通过设置阈值先转换为二值图像,再应用Roberts 算子、Sobel 算子、Prewitt 算子、Laplacian of Gaussian 算子Canny 边缘检测算子等算法实现边界跟踪。
如果图像有噪
声,经过预处理得到的边缘图像往往会出现原本连接的边界局部断裂的现象,使得边界跟踪算法无法越过这些断点继续向下跟踪。
9.6
背景的像素点的灰度值的分布概率密度:
⎩
⎨⎧≤≤--=其他0644/))5(1(3)(02x x x p 物体的像素点的灰度值的分布概率密度:
⎩
⎨⎧≤≤--=其他09532/))7(4(3)(12x x x p 背景和物体在图像中占的像素点比例为2:4,
由9.4.6式可得,1/3p0(T)=(1-2/3)p1(T)时,T 是的是使总的错误概率最小的阈值
即p0(T)= p1(T) => 4/))5T (1(32--=32/))7T (4(32-- => T=5.8(T=3.6时会误判所有背景为物体)
9.8
(1)分成四部分R1,R2,R3,R4, P(Ri)=FALSE, (i=1,2,3,4), 继续分裂
R->R1,R2,R3,R4
(2) R1,R2,R3,R4各自继续分裂
R1->R11,R12,R13,R14
R2->R21,R22,R23,R24
R3->R31,R32,R33,R34 R4->R41,R42,R43,R44 R1 R2
R3 R4
R12 R11 R13 R14 R22
R21 R24
R23 R31 R32 R33 R41 R34 R43 R44
R42
(3)R14,R24,R34,R42,R44各自继续分裂
R14->R141,R142,R143,R144
R24->R241,R242,R243,R244
R34->R341,R342,R343,R344
R42->R421,R422
R44->R441,R442,R443,R444
到此各区域都满足一致性,分裂完毕。
9.11
找出多幅对应像素点灰度值变化在一定阈值范围内的部分为基准图像,可通过检测图像序列相邻两帧之间的变化,保留对应像素点灰度值变化在一定阈值范围内的部分,再与下一帧的图像对比,重复上述过程,最终取得基准图像。
9.12
图像帧与帧之间没有配准,则会出现不同像素点之间进行查分,得到像素值的差值可能都会超过阈值,使得大多数的像素点都被认定为运动目标,造成误差。
R141 R142
R143 R144 R242 R241 R244
R243 R341 R342
R343 R344 R421 R441 R422
R443 R442 R444
第10章
10.2
4链码:01101100303333032322122112
8链码:1212007666765443423
10.6
10.7
4链码:01101100303333032322122112(0) 一阶差分码:10310303130001331303103012 形状数:00013313031030121031030313
10.9
面积A=43
中心
43
184
1
,
=
=∑
∈R
y
x
x
A
x
,
43
191
1
,
=
=∑
∈R
y
x
y
A
y
10.12
膨胀结果如下:
第11章
11.5
基于遗传算法的特征选择主要步骤:
(1)初始特征群体P(0)的生成
令染色体个体的位串长度为n ,根据染色体基因为取1或0决定是否选取相应的特征。
随机地将0或1赋值给染色体个体的各个基因位,得到候选的特征子集,由若干个染色体个体生成了初始特征群体P(0)。
(2)适应度函数的确定
假定染色体个体x 的适应度函数采用基于类内和类间距离的可分离性判据,则 fF(x)=tr(SW(x)-1SB(x))
(3)下一代特征群体P(t+1)的获取
上一代特征群体P(t)经过选择、交叉和变异算子作用后,得到下一代特征群体P(t+1)。
与传统的特征选择方法相比,基于遗传算法的特征选择既能对单一特征逐个地进行判别,又能对一个候选的特征子集进行优劣性能评价,因此,可以保证得到的特征子集是最优的。
11.8
主要步骤:
LLE :
(1) 寻找输入数据集X={x1,x2,…,xN}中每一个样本点xi(i=1,2,…,N)的k 个近邻点,即将相对于xi 距离最近的k 个样本点作为xi 的近邻点(k 为一个预先给定的固定值);
(2) 由X 中每一个样本点xi 的k 个近邻点,计算局部重建权值矩阵W ;
(3)由W 和X 中每一个样本点 的k 个近邻点计算输出数据集Y={y1,y2,…,yN},需要定义损失函数,以使Y 中的每一个样本点在低维空间中保持原有的拓扑结构,并且在映射过程中确保损失函数的值最小。
LE :
(1) 建立最近邻图G ,若输入数据集X 中的两个样本点xi 和xj 互为k 近邻,则在图G 中对应的两个顶点之间用一条边相连接;
(2) 确定权值矩阵W ,若图G 中两个顶点xi 和xj 之间用一条边相连接,则它们之间的权值Wi,j=1,否则,Wi,j=0;
(3) 若图G 是完全连通的,应用 计算特征值与特征向量,令 是根据按有序排列的特征值对
应的特征向量,考虑到00=λ 时,T )1,....,1,1(0=ν,则剔除,依次用后面m 个特征向量作为
特征空间中的m 维映射,yi=( vi,1, vi,2,…, vi,m)T ,其中
),...,2,1,,...,2,1(,m j N i j i ==ν是特征向量i ν的第j 个分量。
ISOMAP :
(1) 建立输入数据集X的邻接图G,即首先计算X中两个样本点xi和xj之间的欧氏距离(i,j=1,2,…,N;i≠j),然后将图G中的每一个顶点用与距离它最近的k个样本点用一条边相连接,用dO(xi,xl)(l=1,2,…,k)作为相邻的两个样本点之间边的权值;
(2) 计算X中任意两个样本点xi和xj之间的最短路径,即在图G中,令顶点xi和xj之间的最短路径为dG(xi,xj),则若两者之间存在一条边,则dG(xi,xj)的初始值设为dO(xi,xj),否则,设为 ;然后,用min{dG(xi,xj),dG(xi,xl)+dG(xl,xj)}依次替代所有的dG(xi,xj) (i,j=1,2,…,N;i j),图G中所有顶点之间最短路径的图距矩阵为DG={dG(xi,xj)};
(3)将MDS算法应用到图距矩阵DG上,当误差值减少到最小时,得到的m维的特征向量就是高维观测空间中的输入数据集X在低维特征空间中的输出数据集Y。
异同点:
LLE算法、LE算法和ISOMAP算法都属于非线性降维方法,在降维后,仍能在低维空间中呈现出输入数据集中样本点之间的内在拓扑结构。
LLE算法是一种局部优化方法,能够较好地保持样本点之间的局部拓扑结构的特性,即高维空间中的近邻点映射到低维流形中也互为近邻点,但由于它是局部最优的,因而发现的低维流形发生了一定程度的扭曲。
LE算法能够较好地保持了输入数据集的整体低维流形,在将互为近邻点的两个样本点映射到低维流形中,为了尽可能接近原有数据集的拓扑结构,反而出现了样本点聚集的现象。
ISOMAP算法是一种全局优化方法,能够完好地保存输入数据集的拓扑结构特性,即在高维空间中存在的两个相距较近的样本点,映射到低维空间中,它们之间的距离仍较近。
第12章
12.3
在训练样本集中,设1ω类有N 1个样本),,1(1)1(N i i =x ,满足0)1(>i T x w ;2ω类有N 2个样本),,1(2)2(N i i =x ,满足0)2(<i T x w 。
为讨论方便,将2ω类中N 2个增1模式向量)2(i x 都换成)2(i x -,则全体训练样本集记作
},,,,,,,{)2()2(2)2(1)1()1(
2)1(121N N E x x x x x x -=
2121 },,,{N N N
N +==x x x
如果1ω和2ω线性可分,必存在权向量w ,使得
),,1( 0N i i T =>x w
线性分类器的学习算法实际上就是确定上式中的权向量w 。
12.10
最大隶属原则、最大关联隶属原则与择近原则。
12.11
若有s n ∈{,,,}12 ,使
r r r r is i i in =max{,,,}12
则认为u i 相对隶属于A s 。
按最大隶属原则,如果元素u i 的隶属向量B i 与完全隶属于A s 的元素u s 0的隶属向量
B s 0的关联度r is 或加权关联度r isw 最大,则认为u i 相对隶属于A s 。
第13章
13.2
利用图像的底层视觉特征,包括颜色、纹理、形状等,进行图像的相似性匹配,输出特征相似的图像作为检索结果。
13.3
基于语义的图像检索将图像内容从传统的仅由视觉特征集合组成延伸至三层结构,即特征层、对象层和场景层,分别对应特征语义、对象空间关系语义和场景语义,完成语义描述,然后利用基于学习的方法,人工交互的方法,和利用外部信息源的方法进行语义抽取,最后度量语义相似性。
13.4
定义了一个语义层次模型,采用一种多示例学习的方法,实现从底层特征到简单语义的映射,以及从简单语义到复合语义的映射。
Wan le。