END.
算法 4-1通过对每个样本和各个类的中心来比较, 从而可以找出他的最近的类中心,得到确定的类 别标记。
22:26
14
基于距离的分类方法的直观解释
(a)类定义 (b)待分类样例 (c)分类结果
22:26
15
距离分类例题
C1=(3,3,4,2), C2=(8,5,-1,-7), C3=(-5,-7,6,10); 请用基于距离的算法给以下样本分类: (5,5,0,0) (5,5,-5,-5) (-5,-5,5,5)
性别 身高(米) 类别
1.6 矮
男 2高
女 1.83 高
女 1.88
高
女 1.7
矮
男 1.85 中等
女 1.6 矮
男 1.7 矮
男 2.2 高
男 2.1 高
女 1.8 高
男 1.82 中等
女 1.7 中等
女 1.75 中等
女 1.73 中等
22:26
KNN的例子
只使用身高做特征, K=3,对于样本 <kate,1.8,女>应 属于哪个类别?
(9) END
(10hich the most u ∈N.
22:26
17
姓名 Kristina 女 Jim Maggie Martha Stephanie Bob Kathy Dave Worth Steven Debbie Todd Kim Amy Wynette
马修斯相关性系数定义为
22:26
10
分类模型的评估
ROC曲线通过描述真阳性率(TPR)和假阳性率(FPR)来实 现,其中TPR=TP/(TP+FN), FPR=FP/(FP+TN)。