当前位置:课程学习>>第六章 属性数据管理>>电子教案>>知识点一


知识点一:属性表的类型、数据库管理、属性数据的类型


GIS中的属性数据存储在表格中。属性表由行和列组成,每一行代表着一个空间要素,每一列代表空间要素的一个特征,列与行相交显示特定要素的特征值(图6.1)。行有称为记录,列又称为字段。

图6.1包括行和列的要素属性表,每行代表一个空间要素,每列代表空间要素的一个特性或特征。

1.1属性表的类型

GIS中的矢量数据有两种类型属性数据表。第一种称为要素属性表,用来获取几何要素。每个矢量数据集有一个要素属性表。对于地理关系数据模型,要素属性表通过要素ID码把要素与其几何特征相链接。对于面向对象数据模型,要素属性表用一个字段存储要素的几何特征。要素属性表还有默认的字段,用于概括要素的几何特征。例如,线状要素的长度、多边形要素的面积和周长。

如果数据集只有几个属性,要素属性表可能是所需的唯一表格。但是,多数不是这种情况。例如,一个土壤制图单元可能有超过100个的土壤解译、土壤性质和性能数据。在一个要素属性表中存储这些属性数据需要进行许多重复的输人,这个过程既耗时间,又占用计算机存储,而且这样的表格也很难使用与更新。这就是为什么我们需要第二种类型的属性数据表。

第二种属性数据表为非空间数据表,即非空间数据表不直接存储要素的几何特征;但是,在必要的时候,可以用一个字段把非空间数据表与要素属性表链接起来。习惯上,非空间数据表可能为文本文件的形式,如dBASE文件、Excel文件、Access文件,以及Oracle、Informix、SYBASE、SQLServer和IBM DB2等由数据库软件包管理的文件。随着越来越多的组织采用云计算操作,已有了另一个选择:客户端可以通过网络浏览器访问集中式数据库,甚至可以在服务器端处理数据。

1.2数据库管理

要素属性表和非空间数据表的存在意味着GIS需要一个数据库管理系统(DBMS)来管理这些表格。DBMS是能够使我们建立和操作数据库的软件包。它提供数据输入、搜索、存取、操作、输出的工具。大多数商业化的GIS软件包含本地数据库的管理工具。例如,ArcGIS Desktop使用Microsoft Access进行个人Geodatabases管理。

除了GIS方面的应用外,使用数据库管理系统还有其他优点。GIS往往是一个企业范围信息系统的一部分,GIS所需的属性数据可能存在于同一组织中的不同部门。因此,GIS必须在整个信息系统内部运行,并和其他信息技术相互作用。

地理数据库(Geodatabase)作为面向对象数据模型的一个例子,在关系数据库管理系统中实现,并将空间几何数据和属性数据存储在同一个数据库里。它基本与商业或市场上的数据库相同。这使得许多应用者把GIS看作是空间数据库管理系统。

除了管理本地数据库的数据库系统管理工具外,很多GIS软件包也有连接访问远程数据库的能力。这对于经常从中心数据库中查寻存储数据的GIS用户非常重要。例如,在国有森林护林员地区办公室的GIS用户通过这种功能定期检索国家林业总部维护的数据。该情景代表客户-服务器分布式数据库系统。客户(如一个行政区办公室的用户)向服务器发送一个请求,通过服务器检索数据,并在本地计算机上处理数据。

1.3属性数据的类型

属性数据分类的一种方法是通过数据类型。数据类型决定了一个属性在GIS中如何储存。数据类型的信息通常包含在地理空间数据的元数据中。根据GIS软件包的不同,可得到的数据类型也是不同的。通用的数据类型包括数字型、文本型(或字符串)、日期型和二进制块对象型(BLOB)。其中,数字型数据包括整型数据(没有小数数字的数据)和浮点型数据(小数数据)。此外,根据计算机内存的不同,整型数据的长度可短可长,而浮点型数据可以是单精度的,也可以是双精度的。BLOB作为一个长序列的:进制编号,用来储存图像、多媒体图像和空间要素的几何特征。

属性数据分类的另一种方法是测量范围。测量范围的概念根据复杂程度将属性数据分成标称的(nominal)、有序的(ordinal)、区间的(interval)和比率的(ratio)等数据类型(Stevens,1946;Chang,1978)。标称数据是描述不同种类的数据,如土地利用类型或土壤类型。有序数据通过排列关系来区分数据。例如,土壤侵蚀程度可分为严重、中等和轻度侵蚀。区间数据已知数值之间的间隔。例如,70℉比60℉度高出10℉。比率数据除了它是基于有意义的或绝对的零值以外,其他与区间数据相同。如人口密度就是比率数据,因为密度零就是绝对零。测量范围的区别对于统计分析很重要,因为不同类型的测试(参数的和非参数检验)是为不同的数据范围而设计的。对数据显示也很重要,因为选择地图符号的其中一个决定因素是数据显示的测量范围。

栅格的单元值通常分为类别的和数值的,类别数据包括标称的(nominal)和有序的(数据,数值数据包括区间的(interval)和比率的(ratio)数据。数据类型与测量范围明显相关。字符型适合于标称和有序的数据。根据是否包含小数的数字,整型与浮点型都适合于区间和比率数据。但也有例外,例如,研究者可能把地下水污染风险分成高、中、低,同时,用查找表(Look-up table)输人数值数据。在查找表中,1代表低,2代表中,3代表高。这里的数字仅仅是有序的类别数据的数字编码。GIS用户在进行分析前必须注意属性数据的性质。

进入知识点二