不平衡数据学习算法在相似性学习中的应用
- 格式:docx
- 大小:37.25 KB
- 文档页数:2
不平衡数据学习算法在相似性学习中的应用
夏佩佩;张莉
【期刊名称】《模式识别与人工智能》
【年(卷),期】2014(000)012
【摘要】In the real_world problems, there is an imbalance in the
paired_samples. The number of the paired_samples in similarity set is much smaller than the number of the paired_samples in dissimilarity set. To solve this problem, two approaches, dissimilar K nearest neighbor and similar K nearest neighbor ( DKNN_SKNN) and dissimilar K nearest neighbor and similar K farthest neighbor ( DKNN_SKFN) , are proposed to construct paired_samples. Thus, the number of paired_samples in similarity learning is effectively decreased, the training process of SVM is accelerated, and the imbalanced data problem is solved to some degree. In the experiments, the proposed approaches are compared with some standard resampling methods. The results show that the proposed approaches have better performance.%在现实问题中,相似性学习的样本对存在不平衡现象,即相似性样本对的数量会远小于不相似性样本对的数量。
针对此问题,文中提出两种样本对构造方法———不相似K近邻-相似K近邻( DKNN_SKNN)和不相似K近邻-相似K远邻( DKNN_SKFN)。
运用这两种方法可有针对性地选择相似性学习样本对,不仅可加快支持向量机的训练过程,而且在一定程度上解决样本对之间的不平衡问题。
在多个数据集上进行文中方法和经典的重采样方法的对比实验,结果表明DKNN_SKNN和DKNN_SKFN具有良好性能。
【总页数】9页(P1138-1146)
【作者】夏佩佩;张莉
【作者单位】苏州大学计算机科学与技术学院苏州215006;苏州大学计算机科学与技术学院苏州215006
【正文语种】中文
【中图分类】TP181
【相关文献】
1.基于相似性自适应学习的遗传算法在无功优化中的应用 [J], 蔺红;晁勤;吐尔逊;樊艳芳
2.一种相似性学习算法及其在人脸识别中的应用 [J], 夏佩佩;张莉
3.改进的RBF学习算法及其相似性应用 [J], 胡斌;宫宁生;郇洪江
4.人脸识别中基于系数相似性的字典学习算法 [J], 施静兰;常侃;张智勇;覃团发
5.学习者兴趣相似性在网络学习推荐中的应用 [J], 王传安;宋雪压;吴长勤
因版权原因,仅展示原文概要,查看原文内容请购买。