模式识别考试同一份试卷山东大学
- 格式:doc
- 大小:5.03 MB
- 文档页数:5
大学模式识别考试题及答案详解————————————————————————————————作者:————————————————————————————————日期:一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2)(3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A→01, A→ 0A1 , A→ 1A0 , B→BA , B→ 0}, A)(2)({A}, {0, 1}, {A→0, A→ 0A}, A)(3)({S}, {a, b}, {S → 00S, S → 11S, S → 00, S → 11}, S)(4)({A}, {0, 1}, {A→01, A→ 0A1, A→ 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
大学模式识别考试题及答案详解Document number:PBGCG-0857-BTDO-0089-PTT1998一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A?01, A? 0A1 , A? 1A0 , B?BA , B? 0}, A)(2)({A}, {0, 1}, {A?0, A? 0A}, A)(3)({S}, {a, b}, {S ? 00S, S ? 11S, S ? 00, S ? 11}, S)(4)({A}, {0, 1}, {A?01, A? 0A1, A? 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
大学模式识别考试题及答案详解Last revision on 21 December 2020一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A01, A 0A1 , A 1A0 , B BA , B 0}, A)(2)({A}, {0, 1}, {A0, A 0A}, A)(3)({S}, {a, b}, {S 00S, S 11S, S 00, S 11}, S)(4)({A}, {0, 1}, {A01, A 0A1, A 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
计算机视觉与模式识别考试试题一、选择题1.下列哪个是计算机视觉的核心任务?A. 图像去噪B. 物体分类C. 文字识别D. 光流估计2.在计算机视觉中,以下哪种方法可以用于目标检测?A. 模板匹配B. 直方图均衡化C. 边缘检测D. 彩色空间转换3.图像分割是指将图像分割成哪些部分?A. 目标和背景B. 目标和噪声C. 前景和背景D. 前景和噪声4.在模式识别中,以下哪个是特征提取的常用方法?A. 主成分分析B. 图像增强C. 图像去噪D. 图像重建5.以下哪种方法常用于人脸识别?A. 支持向量机B. 卡方检验C. 高斯模型D. 卷积神经网络二、简答题1.请解释图像对比度是什么,并简要说明如何增加图像对比度。
图像对比度指的是图像中灰度级之间的差异程度,即图像中亮度的变化程度。
增加图像对比度可以通过以下方法实现:- 直方图均衡化:通过将图像的灰度级重新分布,使得灰度级更均匀地覆盖整个灰度范围,从而增加图像的对比度。
- 对比度拉伸:通过线性或非线性变换,将图像的灰度级重新映射到一个更大的范围,从而增强图像的对比度。
- 局部对比度增强:根据图像的局部特性,使用不同的增强方法对不同的区域进行处理,以增加图像的局部对比度。
2.请解释模板匹配算法的原理,并简要说明其在计算机视觉中的应用。
模板匹配算法是一种基于相似度的图像匹配方法,其原理是通过计算图像中不同位置与给定模板之间的相似度,找到与模板最相似的位置。
模板匹配算法的步骤如下:- 定义相似度度量标准:通常使用均方差、相关性等指标来度量图像之间的相似度。
- 将模板与图像进行滑动窗口匹配:在图像中使用一个固定大小的窗口滑动,并计算窗口内的图像与模板之间的相似度。
- 找到最相似的位置:记录每个窗口位置的相似度值,找到相似度最高的位置,即为与模板最匹配的位置。
模板匹配算法在计算机视觉中的应用广泛,例如目标检测、人脸识别、手势识别等领域。
通过与已知模板进行匹配,可以实现对图像中目标物体的识别和定位。
大学模式识别考试题及答案详解Company number:【0089WT-8898YT-W8CCB-BUUT-202108】一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A01, A 0A1 , A 1A0 , B BA , B 0}, A)(2)({A}, {0, 1}, {A0, A 0A}, A)(3)({S}, {a, b}, {S 00S, S 11S, S 00, S 11}, S)(4)({A}, {0, 1}, {A01, A 0A1, A 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
模式识别试卷专业: 班级: 姓名: 学号:一、计算题1、样本n=10,样本空间维数为3,计算线性超平面的二分能力,并指出在3维特征空间线性分类器的))(sgn(),(310∑=+=i i iw x w w x f 的VC 维是多少? 2、已知有两类样本 ω1=(x1,x2)={(1,0,1),(0,1,1)}; ω2=(x3,x4)={(1,1,0),(0,1,0)}试用感知器算法来设计线性分类器3.})5,6()6,5(,)5,4(,)4,5(,)5,5{(1T T T T T w ----------=})5,4()4,5(,)5,6(,)6,5(,)5,5{(2T T T T T w =试使用K-L 变换做一维特征提取。
4. 二维正态分布1(1,0)T u =-,2(1,0)T u =,12()()P P ωω=。
试分别写出以下两种情况的负对数似然比决策规则(负对数似然比定义为()ln[()]h l =-x x ):(1)12I ==ΣΣ(2)1112112⎡⎤⎢⎥=⎢⎥⎢⎥⎢⎥⎣⎦Σ,2112112⎡⎤-⎢⎥=⎢⎥⎢⎥-⎢⎥⎣⎦Σ 5. 设总体分布密度为(,1),N μμ-∞<<+∞,并设12{,,,}N x x x χ= ,分别用最大似然估计和贝叶斯估计计算ˆμ。
已知ˆμ的先验概率分布()~(0,1)p N μ。
二、程序设计题从/download.html 数据中任选一题;要求如下:1、 试卷上写明使用的方法原理,分类结果(错误率),所用方法的优缺点等2、 源程序发送到xudong1118@ (注:源程序不要打印在卷面上)三、综合题1、结合自己的课题方向谈谈模式识别的应用。
大学模式识别考试题及答案详解HUA system office room 【HUA16H-TTMS2A-HUAS8Q8-HUAH1688】一、填空与选择填空(本题答案写在此试卷上,30分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类 (2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2) (3)(4)6、Fisher线性判别函数的求解过程是将N维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A01, A 0A1 , A 1A0 , B BA , B 0}, A)(2)({A}, {0, 1}, {A0, A 0A}, A)(3)({S}, {a, b}, {S 00S, S 11S, S 00, S 11}, S)(4)({A}, {0, 1}, {A01, A 0A1, A 1A0}, A)二、(15分)简答及证明题(1)影响聚类结果的主要因素有那些?(2)证明马氏距离是平移不变的、非奇异线性变换不变的。
答:(1)分类准则,模式相似性测度,特征量的选择,量纲。
(2)证明:(2分)(2分)(1分)设,有非奇异线性变换:(1分)(4分)三、(8分)说明线性判别函数的正负和数值大小在分类中的意义并证明之。
模式识别(山东联盟)知到章节测试答案智慧树2023年最新青岛大学第一章测试1.关于监督模式识别与非监督模式识别的描述正确的是参考答案:非监督模式识别对样本的分类结果是唯一的2.基于数据的方法适用于特征和类别关系不明确的情况参考答案:对3.下列关于模式识别的说法中,正确的是参考答案:模式可以看作对象的组成成分或影响因素间存在的规律性关系4.在模式识别中,样本的特征构成特征空间,特征数量越多越有利于分类参考答案:错5.在监督模式识别中,分类器的形式越复杂,对未知样本的分类精度就越高参考答案:错第二章测试1.下列关于最小风险的贝叶斯决策的说法中正确的有参考答案:最小风险的贝叶斯决策考虑到了不同的错误率所造成的不同损失;最小错误率的贝叶斯决策是最小风险的贝叶斯决策的特例;条件风险反映了对于一个样本x采用某种决策时所带来的损失2.我们在对某一模式x进行分类判别决策时,只需要算出它属于各类的条件风险就可以进行决策了。
参考答案:对3.下面关于贝叶斯分类器的说法中错误的是参考答案:贝叶斯分类器中的判别函数的形式是唯一的4.当各类的协方差矩阵相等时,分类面为超平面,并且与两类的中心连线垂直。
参考答案:错5.当各类的协方差矩阵不等时,决策面是超二次曲面。
参考答案:对第三章测试1.概率密度函数的估计的本质是根据训练数据来估计概率密度函数的形式和参数。
参考答案:对2.参数估计是已知概率密度的形式,而参数未知。
参考答案:对3.概率密度函数的参数估计需要一定数量的训练样本,样本越多,参数估计的结果越准确。
参考答案:对4.下面关于最大似然估计的说法中正确的是参考答案:最大似然估计是在已知概率密度函数的形式,但是参数未知的情况下,利用训练样本来估计未知参数。
;在最大似然估计中要求各个样本必须是独立抽取的。
;在最大似然函数估计中,要估计的参数是一个确定的量。
5.贝叶斯估计中是将未知的参数本身也看作一个随机变量,要做的是根据观测数据对参数的分布进行估计。
《模式识别》试卷( A)一、填空与选择填空(本题答案写在此试卷上,30 分)1、模式识别系统的基本构成单元包括:模式采集、特征提取与选择和模式分类。
2、统计模式识别中描述模式的方法一般使用特真矢量;句法模式识别中模式描述方法一般有串、树、网。
3、聚类分析算法属于(1);判别域代数界面方程法属于(3)。
(1)无监督分类(2)有监督分类(3)统计模式识别方法(4)句法模式识别方法4、若描述模式的特征量为0-1 二值特征量,则一般采用(4)进行相似性度量。
(1)距离测度(2)模糊测度(3)相似测度(4)匹配测度5、下列函数可以作为聚类分析中的准则函数的有(1)(3)(4)。
(1)(2)(3)(4)6、Fisher 线性判别函数的求解过程是将N 维特征矢量投影在(2)中进行。
(1)二维空间(2)一维空间(3)N-1维空间7、下列判别域界面方程法中只适用于线性可分情况的算法有(1);线性可分、不可分都适用的有(3)。
(1)感知器算法(2)H-K算法(3)积累位势函数法8、下列四元组中满足文法定义的有(1)(2)(4)。
(1)({A, B}, {0, 1}, {A 01, A0A1 ,A1A0 , B BA , B0}, A)(2)({A}, {0, 1}, {A 0, A0A}, A)(3)({S}, {a, b}, {S 00S, S11S, S00, S11},S)(4)({A}, {0, 1}, {A 01, A0A1, A1A0}, A)9、影响层次聚类算法结果的主要因素有(计算模式距离的测度、(聚类准则、类间距离门限、预定的类别数目))。
10、欧式距离具有(1、 2);马式距离具有(1、2、3、 4)。
(1)平移不变性( 2)旋转不变性( 3)尺度缩放不变性( 4)不受量纲影响的特性11、线性判别函数的正负和数值大小的几何意义是(正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
(完整word版)模式识别试题答案模式识别非学位课考试试题考试科目:模式识别考试时间考生姓名:考生学号任课教师考试成绩一、简答题(每题6分,12题共72分):1、监督学习和非监督学习有什么区别?参考答案:当训练样本的类别信息已知时进行的分类器训练称为监督学习,或者由教师示范的学习;否则称为非监督学习或者无教师监督的学习。
2、你如何理解特征空间?表示样本有哪些常见方法?参考答案:由利用某些特征描述的所有样本组成的集合称为特征空间或者样本空间,特征空间的维数是描述样本的特征数量。
描述样本的常见方法:矢量、矩阵、列表等。
3、什么是分类器?有哪些常见的分类器?参考答案:将特征空中的样本以某种方式区分开来的算法、结构等。
例如:贝叶斯分类器、神经网络等。
4、进行模式识别在选择特征时应该注意哪些问题?参考答案:特征要能反映样本的本质;特征不能太少,也不能太多;要注意量纲。
5、聚类分析中,有哪些常见的表示样本相似性的方法?参考答案:距离测度、相似测度和匹配测度。
距离测度例如欧氏距离、绝对值距离、明氏距离、马氏距离等。
相似测度有角度相似系数、相关系数、指数相似系数等。
6、你怎么理解聚类准则?参考答案:包括类内聚类准则、类间距离准则、类内类间距离准则、模式与类核的距离的准则函数等。
准则函数就是衡量聚类效果的一种准则,当这种准则满足一定要求时,就可以说聚类达到了预期目的。
不同的准则函数会有不同的聚类结果。
7、一种类的定义是:集合S 中的元素x i 和x j 间的距离d ij 满足下面公式:∑∑∈∈≤-S x S x ij i jh d k k )1(1,d ij ≤ r ,其中k 是S 中元素的个数,称S 对于阈值h ,r 组成一类。
请说明,该定义适合于解决哪一种样本分布的聚类?参考答案:即类内所有个体之间的平均距离小于h ,单个距离最大不超过r ,显然该定义适合团簇集中分布的样本类别。
8、贝叶斯决策理论中,参数估计和非参数估计有什么区别?参考答案:参数估计就是已知样本分布的概型,通过训练样本确定概型中的一些参数;非参数估计就是未知样本分布概型,利用Parzen 窗等方法确定样本的概率密度分布规律。
本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!== 本文为word格式,下载后可方便编辑和修改! ==模式识别期末试卷篇一:【模式识别】期末考试试卷02《模式识别》期末考试试题(A)一、填空题(15个空,每空2分,共30分)1.基于机器学习的模式识别系统通常由两个过程组成, 即()和分类判决。
2.统计模式识别把观察对象表达为一个随机向量(即特征向量), 将()表达为由有穷或无穷个具有相似数值特性的模式组成的集合。
3.特征一般有两种表达方法: (1)将特征表达为();(2)将特征表达为基元。
4.特征提取是指采用变换或映射实现由模式测量空间向()的转变。
5.同一类模式类样本的分布比较集中,没有或临界样本很少,这样的模式类称为()。
6.加权空间的所有()都通过坐标原点。
7.线性多类判别:若每两个模式类间可用判别平面分开,在这种情况下,M类有()个判别函数,存在有不确定区域。
8.当取()损失函数时, 最小风险贝叶斯判决准则等价于最大后验概率判决准则。
9.Neyman-Pearson决策的基本思想是()某一错误率,同时追求另一错误率最小。
10.聚类/集群:用事先不知样本的类别,而利用样本的先验知识来构造分类器属于()学习。
11.相似性测度、()和聚类算法称为聚类分析的三要素。
12.K/C均值算法使用的聚类准则函数是()准则,通过反复迭代优化聚类结果,使所有样本到各自所属类别的中心的距离平方和达到最小。
13.根据神经元的不同连接方式,可将神经网络分为分层网络和相互连接型网络两大类。
其中分层网络可细分为前向网络、具有反馈的前向网络和()三种互连方式。
14.神经网络的特性及能力主要取决于()及学习方法。
15.BP神经网络是采用误差反向传播算法的多层前向网络,其中,神经元的传输函数为S型函数,网络的输入和输出是一种()映射关系。
二、简答题(2题,每小题10分,共20分)1.简述有监督分类方法和无监督分类方法的主要区别。
2006~2007学年第二学期期末考试《模式识别及其应用》试卷(A)标准答案一、结合自己的理解对如下基本概念作出解释(每小题4分, 共20分)(1)模式识别和模式(2)样本的规范化(3)最近邻法(4)非监督参数估计(5)特征的选择与特征提取答:(1)模式识别就是要用机器去完成人类智能中通过视觉听觉触觉等感官去识别外界环境的自然信息的这些工作。
存在于时间和空间中可观察的事物,如果我们可以区别它们是否相同或是相似,都可以称为模式,但模式所指的不是事物本身,而是我们从事物获得的信息, 因此, 模式往往表现为具有时间和空间分布的信息。
(2)如果样本集,,……,时线性可分的,则必存在某个或某些权向量,使得对于任何都有,而对于任何,都有,如果在来自的样本前面加上一个负号,即令,有则,我们称这一过程为样本的规范化。
(3)最近邻法就是对待识别的模式向量,只要比较与所有已知类别的样本之间的欧式距离,并决策与离它最近的样本同类。
(4)非监督参数估计已知总体概率密度函数的形式但未知样本所属类别,要求推断出概率密度函数的某些参数。
(5)特征提取在原始特征的维数很高的情况下,基于某种类别可分离性判据通过变换的方法用低维空间来表示样本,这个过程叫特征提取。
特征选择基于某种类别可分离性判据,从一组特征中挑选出一些最有效的特征以达到降低特征空间维数的目的,称为特征选择。
二、问答题(每小题5分, 共35分)(1)指出在Fisher线性判别中,的比例因子对Fisher判别结果无影响的原因。
(2)对于同一个决策规则判别函数可定义成不同形式,从而有不同的决策面方程,指出决策区域是不变的。
(3)类别可分离性判据应满足的基本条件是什么?(4)应用线性判别函数方法和Bayes决策方法进行模式分类各自的前提是什么?(5)试说明Mahalanobis距离平方的定义,到某点的Mahalanobis距离平方为常数的轨迹的几何意义,它与欧氏距离的区别与联系。
2008年模式识别期末考试试卷
说明:题目没有清晰版,以下内容是来自手抄本,错误在所难免。
1.已知2维空间的三类的三个线性判别函数分别为d1(x)=-x1+x2 ,d2(x)=x1+x2-1 ,
d3(x)=-x2,画出三类判决面的标记出来。
1.The three linear discriminant functions for a three category classifier in 2-d space are respectively d1(x)=-x1+x2 ,d2(x)=x1+x2-1 , d3(x)=-x2 . Sketch the decision boundaries and mark the decisions for the three category.
2.两类训练样本具有相同的密度和相等的先验概率分布,即p1(w1)=p2(w2) ,
w1={(-1,0)T,(0,-1)T,(1,0)T,(0,1)T},
w2={(-2,0)T,(0,-2)T,(2,0)T,(0,2)T},
(a)求两类均值和协方差的最大似然估计矩阵
(b)根据(a)的结果求出贝叶斯分类的判决面方差。
(c)在特征空间中画出分界面,是否线性可分。
2.The following training samples in the two categories have normal densities and equal prior probalilities , ie p(w1)=p(w2),
w1={(-1,0)T,(0,-1)T,(1,0)T,(0,1)T},
w2={(-2,0)T,(0,-2)T,(2,0)T,(0,2)T},
(a)find the maximian-likelihood estimates of the means and the convaiance matrixes of the two
categories.
(b)Base ond above estimates find the decisiong boundary equation of the bayesion classifier.
(c)Sketch the boundary in the feature space and explain whether the samples are linear separable
or not
3.求下列训练样本的类内散布矩阵和它们的迹及
W1:{(1,1)T,(2,2)T}
W2:{(3,2)T,(4,1)T}
W3:{(2,4)T,(3,4)T}
3.For the following training samples ,find the with in-classifier scatter matrix and the between-classifier scatter matrix and their trace and determitants
W1:{(1,1)T,(2,2)T}
W2:{(3,2)T,(4,1)T}
T,(3,4)T
4.perform k-means clustering on the following sample setting {(0,0)T,(5,4)T,(0,1)
T,(2,3)T,(4,5)T
5.运用单样本固定裕量感知准则算法计算下列一维样本的权重向量,线性判别函数和判决
面
5.Find the weight vector ,linear discriminant function and decision boundary for the following 1-D samples ,using the fixed-increment single-sample perception algorithm and letting
a= (0,0)T,W1= (1,2),W2= (5,7),
答案
1. 解: d(x 1)和d(x 2)的判决面为 d(x 1)=d(x 2) ,即 -x 1+x 2=x 1+x2-1 得 x 1=1/2;
d(x 2)和d(x 3)的判决面为 d(x 1)=d(x 2) ,即 x 1+x 2-1=-x2 得 x 2=(1-x 1)/2;
d(x 1)和d(x 3)的判决面为 d(x 1)=d(x 3) ,即 -x 1+x 2=-x 2 得 x 2=x 1/2;
w1 + ; w2 * ; W3
o .
---解完毕
2. (a) 均值的最大似然估计为 11n
k k u x n ∧
==∑ 对W1有 n=4 1(0,0)T u ∧
=
对w2 有n=4 ,2(0,0)T u ∧=
两类的协方差均值1
1()()n T k k k x u x u n ∧∧=∑=--∑,由于两个类的均值向量都为21(0,0)u u u ∧∧∧
===,所以11n T k k k x x n =∑=∑,进过计算得到:10.5000.5⎡⎤∑=⎢⎥⎣⎦,22002⎡⎤∑=⎢⎥⎣⎦ (b )由(a )得贝叶斯分类判决面方程为12()()g x g x =,因为
又知:x=(x 1,x 2)T , p(w1)=p(w2) 所以:
11111122221111()()ln ||()()ln ||2222
T T x u x u x u x u ----∑--∑=--∑--∑ =》 [][]1112122210101111112ln ln 401012
24222x x x x x x x x ⎡⎤⎡⎤⎡⎤⎡⎤--=--⎢⎥⎢⎥⎢⎥⎢⎥⎣⎦⎣⎦⎣⎦⎣⎦ =》222212121111()ln ()ln 42442
x x x x -+-
=-+- =》判决面方程22128ln 23x x +==1.848 (c ) 其中 * 表示的区域为 W1, o 表示的区域为w2
---解完毕
3. 解:第i 个聚类的均值向量为1i i m x n =∑,计算得W1: 133(,)22
T m = ;W2: 273(,)22T m =; W3: 35(,4)2
T m =. 总的均值向量:357(,)23
T m =
第i 个聚类的散步均值为()()T i i i x Di s x m x m ∈=
--∑
计算得W1: 1111112s ⎡⎤=
⎢⎥⎣⎦ ;W2: 2111112s -⎡⎤=⎢⎥-⎣⎦; W3: 1101002s ⎡⎤=⎢⎥⎣⎦
.
总类内散步矩阵 123301022w s s s s ⎡⎤=++=⎢⎥⎣⎦
tr(S W )=(3+2)/2=2.5 21
3||()3222
w s =⨯⨯= 类内散步矩阵 2.5, 1.5 两个不同的值。
类间散步均值
314
0()()...2503T B i i i i s n m m m m =⎡⎤⎢⎥=--==⎢⎥⎣⎦
∑ tr(S B )=4+25/3 =37/3 100||3
B s = 类间散布矩阵的迹和秩是37/3和100/3。
---解完毕
4.解题如下:。