当前位置:课程学习>>第十三章 遥感信息提取>>电子教案>>知识点二
1、监督分类的优点
① 可根据实际应用目的和区域有选择的决定分类类别,而避免其他类别的数据冗余。
② 可充分结合分析者的知识与经验控制训练样本的选择,有利于提高分类精度。
③ 可通过检查训练样本来决定训练样本是否被精确分类,从而能避免分类中的严重错误。
④ 避免了非监督分类中对光谱集群组的重新归类。
2、监督分类的缺点
① 由于分析者的主观因素影响,其分类系统的确定,训练样本的选择均不是图像中存在的自然类别,且可能导致多维数据空间中各类别间并非独一无二,而是有重叠。另外,分析者由于其知识与经验的缺陷,也可能导致所选择的训练样本并不能反映图像的真实情形。
② 由于图像中同一类别的光谱差异,导致图像内部方差较大,从而使得所选的训练样本不具有典型性。
③ 由于训练样本的选取与评估,因而使得监督需要花费较多的人力和时间。
④ 监督分类只能根据训练样本识别出已定义的类别,而对于分析者未定义的类别则不能识别。
非监督分类(UnSupervised Classification),也称为聚类分析或点群分析。即在多光谱图像中搜寻、定义其自然相似光谱集群组的过程,其前提是假定影像上同类物体在同样条件下具有相同的光谱信息特征。非监督分类方法不必对影像地物获取先验知识,不需要人工选择训练样本,仅需极少的人工初始输入,依靠影像上不同类地物光谱信息(或纹理信息)进行特征提取,再统计特征的差别来达到分类目的,最后对已分出的各个类别的实际属性进行确认(图1-7)。经过长期发展,目前已形成了近百种不同的非监督分类方法,如分级集群法、动态聚类法等。
图1-7 非监督分类示意
1、分级集群法(Hierarchical Clustering)
物以类聚,人以群分,这就是集群法分类的出发点。在相同条件下,具有相同光谱特征信息的同类物体应聚集在一定的空间位置上,而具有不同光谱特征信息类别的物体则聚集在另一不同的空间位置上。集群是指不同地物由于其辐射特性不同,反映在直方图上会出现很多峰值及其对应的一些众数灰度值,它们在图像上对应的像元分别倾向于聚集在各自不同众数附近的灰度空间形成的很多点群。
分级集群法以“距离”为评价各样本(每个像元)在空间分布相似程度的指标,并以此将它们的分布分割或者合并成不同的集群。每个集群的实际地理意义则需要根据地面调查或者与已知类型的数据比较后方可确定。分级集群法的特点是其所进行的归并分类过程是分级进行,在迭代过程中没有调整类别总数的措施,一旦一个像元被归入到某一类后,就排除了它再被归到其他分支类别中的可能性,这样就存在缺点,即对同一像元,不同的操作次序,可能会得到不同的结果。
通常情况下,分级集群法的过程如下:
① 确定评价各样本相似程度所采用的指标,可以采用遥感图像分类原理中的几种度量距离;
② 初定分类总数N;
③ 计算各样本间的距离,根据距离最近的原则判定样本应归属的类别;
④ 将归并后的类别作为新类,与剩余的类别重新组合,然后再计算并改正其距离,如此重复样本间相似度的评价和归并,直到所有的像素都归并到相应的类别中。
2. 动态聚类法
动态聚类法(Iterative Self-Organizing Data Analysize Technique,ISODATA)是利用聚类分析方法对遥感图像进行分类的一种典型方法。在初始设定基础上,对初始状态给出图像的粗糙分类,然后在分类过程中根据一定原则不断重新计算类别总数和类别中心,使分类结果逐渐趋于合理,直到满足一定条件分类完成,如图1-8所示。其具体分类过程如下:
图1-8 动态聚类法分类过程
① 初始聚类数与聚类中心选择
通常有多种设定初始类别数和类中心的方法,在实际操作中,可根据分类对象和对图像的初步目视分析把初始聚类数设定得大一些,同时引入各种对迭代次数进行控制的参数,在整个迭代过程中应时时调整每个像元的归属类别及类别数。在用计算机编制分类程序时,初始聚类中心可按如下方式确定:
设初始类别为N,这样共有N个初始聚类中心(k=1, 2, …, n),求出图像的均值M和方差a,按式(14-14)可求出初始聚类中心
其中,k为初始类中心编号,n为初始类别总数。
另外,在ISODATA算法中,也可以在分析图像后确定大致类别数,初始类中心点也可以任意选择,这并不会影响分类结果,但会延长计算时间。
② 距离计算与聚类
当选择好合适的距离度量公式后,在动态聚类过程中,计算机每扫描一个像元点,就计算该像元点和初始类中心的特征空间距离,由此判断待分像元之间的相似程度,距离越小,相似性越大,并以此为依据对像元进行分类。
③ 聚类中心修改与迭代
在全部像元按各类中心分类之后,重新计算每一类的新均值,并以此为下一次分类中心,如果两个类别的中心点距离在最小允许值以下,则将该类别取消,并使总类别数减1。当类别数在一定的范围,类别中心间的距离在阈值以上,类别内方差的最大值为总阈值以下时,可以看作动态聚类结束;当不满足动态聚类的结束条件时,要通过类别的合并及分离、调整类别的数目和中心间的距离等,以重新进行组合。