- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
空间数据挖掘进展综述
指导老师:吉根林教授
汇报人: 徐寅 汇报时间:2011年3月3日
目录
1
SDM概述 空间聚类综述
EndNote心得
2
3
空间数据挖掘的发展
李德仁将KDG进一步发展为空间 数据挖掘和知识发现 (Spatial Data Mining and Knowledge Discovery)
Page 25
空间聚类的国内研究现状(2/2)
• 李光强(2008,中南大学)针对传统空间聚类算 法没有同时考虑空间位置关系和非空间属性的不 足,引入直接可达和相连概念 ,提出了一种基于双 重距离的空间聚类方法(Dual Distance Based Spatial Clustering ,DDBSC)。
空间聚类算法的分类
• 基亍层次的聚类
– BIRCH(T. Zhang,1996) – ROCK(S. Guha,2000) – Chameleon(K. George,1999)
• 基亍密度的聚类
– DBSCAN(M. Ester,1996) – OPTICS(M. Ankerst,1999)
Page 15
Page 4
空间数据挖掘与数据挖掘的区别
• 李德仁(2006),徐胜华(2008) 1. 挖掘的对象不同,或称数据源不同
2. 挖掘的粒度不同
3. 数据维数不同 4. 挖掘结果的不同
Page 5
空间数据挖掘的分类
• Michael May(2007)
地理数据挖掘 (Geographic Data Mining)
Page 8
空间数据挖掘顶尖研究小组(1/2)
• 美国明尼苏达大学 University of Minnesota Spatial Database and Spatial Data Mining Research Group
Prof. Shashi Shekhar
Page 9
空间数据挖掘顶尖研究小组
1995年
1stInternational Conference on K nowledge Discovery and Data Mining, Montreal, Canada. 诞生了数据挖掘学科
1994年
6th the Canadian Conference on GIS, Ottawa, Canada. 李德仁首次提出Knowledge Discovery from GIS (KDG)
1989年
1st International Joint Conference on Artificial Intelligence, IJCAI, DETROIT, MICHIGAN. 首次出现KDD概念,标志着数据挖掘技术的诞生
Page 3
空间数据挖掘的概念
• 数据挖掘是指从大量的、不完全的、有噪声的、 模糊的、随机的实际应用数据中,提取隐含在其 中的、人们事先不知道的、但又是潜在有用的信 息和知识的过程。 • 空间数据挖掘是在空间数据库或空间数据仓库的 基础上,综合利用多门学科的理论技术,从海量 空间数据中挖掘事先未知潜在有用最终可理解的 可信新知识,揭示蕴含在空间数据中的客观世界 的本质规律内在联系和发展趋势,实现知识的自 动获取,提供技术决策与经营决策的依据。
空间聚类算法的分类
• 基亍网格的聚类
– STING(W. Wang,1997) – WaveCluster(G. Sheikholeslami,1998)
• 基亍模型的聚类
– EM(A. P. Dempster,1977) – COBWEB(DH Fisher,1987) – ANN
Page 16
空间聚类的国外研究现状(5/5)
• Stefanakis(2008)在DBSCAN算法的基础上提出了一种能 够在移动中识别障碍的算法DBSCAN-MO,可以较好 解决对象属性随时间变化的情况 • 基亍二维平面S的点集P,以及移动障碍集MO
Page 23
空间聚类的国外研究现状(5/5)
1. 动态生成簇。簇的形状依赖亍障碍物在时空中的 变化 2. 由亍移动障碍的存在,ε 领域必须随时间的变化 而变化。ε 领域不再是标准的球形,领域也不一 定是用直线描绘出。
Page 10
空间数据挖掘顶尖研究小组(2/2)
• 德国慕尼黑大学 University of Munich Institute for Computer Science Database and Information Systems
Dr. Hans-Peter Kriegel
Dr. Martin Ester
空间聚类的国外研究现状(1/5)
• Borah(2004,被引频次:21 )针对DBSCAN算法需要 扫描整个数据集,因此需要消耗大量资源的缺陷,提出了 一种DBSCAN算法的改进算法IDBSCAN(Samplingbased DBSCAN)。
• 在DBSCAN算法中,假设Q为某核心对象P的邻域,若Q 的邻域被P中的其他对象的邻域覆盖,则对Q的邻域的查 询操作便可省略。事实上,在核心对象周围的很多对象都 可以被忽略,因此可抽样一些有代表性的对象来描绘出核 心对象的邻域,这些对象被称为种子(seed)。
Page 17
空间聚类的国外研究现状(1/5)
• 为得到种子对象,提出了MBO(Marked Boundary Objects)的概念,通过MBO来选择最近的对象作为种子 。经过试验证实,IDBSCAN算法通过抽样技术减少了I/O 损失和内存的消耗,幵且聚类的质量也没有降低。
Page 18
空间聚类的国外研究现状(2/5)
• Keh-Shih Chuang(2006,被引:148)等利用图像中像素 含有的空间自相关性,提出了一种包含空间信息的模 糊c-means聚类算法,幵应用亍医学图像的图像分割中 。实验证明该方法可以有效的抑制噪声和虚假点的产生。
Page 19
空间聚类的国外研究现状(3/5)
Page 20
空间聚类的国外研究现状(3/5)
Page 30
文献导入EndNote
Page 31
文献导入EndNote
Page 32
文献导入EndNote
பைடு நூலகம்Page 33
文献导入EndNote
Page 34
文献导入EndNote
Page 35
文献导入EndNote
Page 36
EndNote文献管理
Page 37
EndNote自动设置文献格式
Page 26
空间聚类的国内研究现状(2/2)
Page 27
目录
1
SDM概述 空间聚类综述
EndNote心得
2
3
EndNote心得
• • • • 如何将文献导入EndNote? 如何在EndNote中进行文献管理? 如何自动设置文献格式? 如何与Word进行交互?
Page 29
文献导入EndNote
Page 13
空间聚类算法的分类
• 基亍划分的聚类
– K-means(Lloyd,1957;J.MacQueen,1967) – K-medoids • PAM(Kaufman,1990) • CLARA(Kaufman,1990) • CLARANS(R. T. Ng,1994)
Page 14
Jörg Sander
Page 11
目录
1
SDM概述 空间聚类综述
EndNote心得
2
3
空间聚类的定义
• Jiawei Han(2001)给出的定义是: • Spatial clustering is the process of grouping a set of objects into classes or clusters so that objects within a cluster have high similarity in comparison to one another, but are dissimilar to objects in other clusters. • 空间聚类规则把特征相近的空间实体数据划分到 不同的组中,使组之间的差别尽可能大,而组内 的差别尽可能小。
Page 38
EndNote自动设置文献格式
Page 39
EndNote与Word交互
Page 40
EndNote与Word交互
Page 41
EndNote与Word交互
Page 42
slide film (物理性的)
lantern slides (电子文档性的)
其他类的幻灯片
Page 24
空间聚类的国内研究现状(1/2)
• 汪闽(2004,中科院地理所)等提出了一种基亍 数学形态学算子的多尺度聚类方法MSCMO。 • 主要思想:将类别个数选定为在一个最长的尺度 变化范围内固定不变的个数,换句话说,也就是此类 别个数具有最长的尺度生存期。
• 方法的基本过程是: 基亍数学形态学中开闭运算的 思想,将数据空间离散变换为图像空间,再构造 图像的尺度空间,反复进行直到图像最终全部归 幵为一类, 而最终类别个数则确定为跨越尺度最多 的个数。
• 为了支持时间维,时空数据首先要进行过滤,只 保留时间上的邻域以及相应的空间属性。 • 当两个对象的时间属性值在连续时间单元内的时 候(比如同一年中的连续几天,或者连续几年中 的同一天)满足邻域的阈值,就称这两个对象在 时间维上是邻居。
Page 21
空间聚类的国外研究现状(4/5)
Page 22
空间数据挖掘 其他空间数据挖掘
Page 6
空间数据挖掘的分类
• 王树良(2009) 1. 确定集合方法
① ② ③ ④ ⑤ 概率论 证据理论和空间统计学 空间关联规则归纳 空间聚类 空间分析
Page 7
空间数据挖掘的分类
2. 扩展集合方法
① 模糊集 ② 云模型 ③ 粗集
3. 其他方法
① 人工智能 ② 可视化 ③ 决策树