···························································· 第3 章 chapter3 地理空间数据 地理空间数据的描述 向量数据的概念 栅格数据的概念 点、线、面、拓扑关系及其栅格像元的概念 向量数据与栅格数据的特点 3.1 地理空间数据的描述 数字地图可以是向量形式或栅格形式的。可以通过几何要素来描述地理空间,或用 遥感采集的栅格像元描述地理空间。地理空间要素具有空间特征、时间特征和属性特 征。空间特征可以用向量模型或栅格模型来描述。 3.1.1 地图的概念 地图是一种地理信息的承载工具,是地理数据的抽象,是一块区域的可视化表示。 地图是3S系统中地理数据与用户感知之间的一种界面元素。地理信息的浏览、查询和 分析及其结果的显示都是通过地图界面表现的。地图是传递空间数据的位置和空间数 据的分布模式的一种可视化形式。 大部分地图是三维空间的几何近似和静态二维表示,但是有些地图是动态的、可交 互的、三维的。 按照功能分,地图可以分为普通地图和专题地图。普通地图用于通用目的。普通地 图上显示多种空间要素,包括边界线、水文、交通、等高线、居民点和土地覆盖等。专题地 图也称为特殊用途的地图,其主要目的是显示某一主题的分布模式,例如某省以县为统 计单位的人口密度分布图。 一幅地图包括图名、地图主体、图例、指北针、比例尺、文字说明和图廓等要素。通过 这些地图要素把空间信息传递给用户。图名蕴含了地图的主题。地图主体是地理数据 在空间布局的图形化表示。通过图例将地图符号与空间数据联系起来,例如全国地图的 图例中,用五角星表示首都,实心圆加外圆圈表示省级行政中心,两个同心圆圈表示地级 5 2 ◆S技术导论 3 行政中心。图廓是一幅地图的范围线。 地图比例尺指地图上的距离与地面距离的比例值,一般用1∶ n 表示。比例尺表示 比例值,适合各种度量单位,度量单位可以是厘米,也可以是米。例如1∶100000,可以 表示地图上1cm 长度相当于实地100000cm,即1000m,或地图上1m 长度相当于实地 100000m 。用公式表示为 比例尺 = 图上距离/实地距离 因此,根据地图上的比例尺,可以量算图上两地之间的实地距离;根据两地的实地距 离和比例尺,可计算两地的图上距离;根据两地的图上距离和实地距离,可以计算比 例尺。 根据地图的用途、所表示地区范围的大小、图幅的大小和表示内容的详略等不同情 况,制图选用的比例尺有大有小。地图比例尺中的分子通常为1;分母越大,比例尺就越 小。通常,比例尺小于1∶10000000 的地图称为小比例尺地图,比例尺为1∶10000000~ 1∶100000 的地图称为中比例尺地图,比例尺大于1∶100000 的地图称为大比例尺地 图。在同样图幅上,比例尺越大,地图所表示的范围越小,反映的内容越详细,精度越高; 比例尺越小,地图所表示的范围越大,反映的内容越简略,精度越低。例如,在小比例尺 地图上,一座城市可能表示为一个点,而同一个城市在大比例尺地图上却表示为一个面。 再如,在大比例尺地图上蜿蜒的河流在小比例尺地图上变得相对平直。 严格地说,只有在表示小范围的大比例尺地图上,由于不考虑地球的曲率,全图比例 尺才是一致的。通常绘注在地图上的比例尺称为主比例尺。在地图投影中确定地球椭 球缩小的比率,用球体半径与地球半径的比值表示,在投影计算中应用主比例尺。由于 地图投影必然产生变形,因此主比例尺只保持在某些点和线上,其他部分的比例尺则大 于或小于主比例尺,故又称局部比例尺。 可以利用GPS 和RS 测量来提高空间数据的准确性,但是准确性与这些测量仪器的 分辨率有关。例如,卫星遥感图像的空间分辨率可能是1m 或100m,GPS 的定位精度可 以是10m 或100m 。 定位准确性是指空间要素位置的准确性。拓扑准确性是指空间要素之间拓扑关系 保持得如何。地图比例尺和数据输入过程在很大程度上决定了空间要素的定位准确性。 拓扑准确性取决于数据输入、GIS 软件的查错能力和GIS 数据制作者的排错能力。 以数字形式表示和存储的地图称为数字地图。与过去静态的纸质地图相比,现在的 数字地图成了动态表达地理信息的一种主要手段。地理信息系统(GIS)的信息表示和表 现基础是数字地图。通常人们看到的地图是以纸张、布或其他物体为载体的,地图内容 绘制或印制在这些载体上;而数字地图是存储在计算机的硬盘、光盘和磁带等介质上的, 地图内容通过数字数据来表示,用计算机软件来管理数字地图,实现数字地图的读取、显 示、检索和分析。数字地图有时也称为电子地图。根据数据格式的不同,数字地图可分 为向量型和栅格型两种。 把普通地图数字化并表示为数字地图后,可以方便地对普通地图的内容进行多种形 式的要素组合、拼接,形成新的地图。地图根据应用需求来过滤信息,仅仅显示那些符合 用途的信息。地图简化了数据,一些复杂数据和数据的内部结构被隐藏起来。地图为数 第◆3 章 地理空间数据5 3 据增加了描述性内容,用标注(label)表示名称,用符号表示地理实体的类别(category)、 类型(type)和其他信息[11]。 总的来说,作为地理信息的表达载体,地图具有以下功能[11]。 (1)可以在地图某一位置上标识地理要素。例如,在地图的任何位置上标识对象的 名字以及其他相关的属性信息。借助GPS数据可以在地图上标明你所处的位置,你就能 看到自己在哪里、行进的速度和方向。 (2)在地图上标识空间分布、关系和趋势。例如,人口统计学家可以比较过去和现在 的城区地图及其人口分布密度;流行病学家通过把疾病暴发地点与周围环境因素相关 联,找出可能的发病原因。 (3)可以在地图上将不同来源的数据集成到同一地理参考坐标系中。例如,市政部 门可以将街道分布图与基础设施布局图结合起来,以调整市政建筑布局;农业科学家可 以把气象卫星影像图与农场和作物分布图结合起来,以提高作物产量。 (4)可以在地图上通过数据的合并或叠加来分析空间问题。例如,政府部门可以通 过合并多层数据找到合适的废弃物处理地点。 (5)可以在地图上确定两地之间的最佳路径。例如,包裹速递公司能够找到最有效 的运输路径,公共交通设计者也能设计出最优的公交路线。 (6)可以在地图上对未来事件进行建模分析。例如,公共事业部门可以模拟新设施 添加后会产生什么样的影响,是否需要进行系统升级;市政规划者也可以模拟一些严重 的意外事故(如有毒物质泄漏等),从而制订相应的疏散方案。 3.1.2 地理信息的表达 1.地理实体的描述 要完整地描述地理实体,需要用空间特征和属性特征进行描述;如果要描述地理实 体的变化,则还需记录地理实体在某一个时间的状态。地理实体在地图中通过地理要素 来表达。因此一般认为,描述地理要素需要用到3个基本特征: (1)空间特征。又称为位置和布局特征,表示地理要素的地理位置、空间布局和分 布。空间特征可以用几何、坐标和栅格数据表示。 (2)属性特征。表示地理要素的属性,例如目标类型、数量和名称等。 (3)时间特征。指地理要素随时间的变化特征。 这3个特征可以通过标识符进行关联。我们用地理空间数据(geospatialdata)描述 地理要素,因此地理空间数据具有空间特征、属性特征和时间特征。地理空间数据又称 为地理参照数据,描述和表示地理要素的位置及特征[12]。 相对于时间来说,空间特征和属性特征常常呈相互独立的变化,即在不同的时间,空 间位置不变,但是属性类型可能已经发生变化,或者相反。许多地理空间数据在一定时 间范围内是缓慢变化的,例如一定地理范围的高程数据。如果忽略时间特征,地理空间 数据包含空间特征和属性特征。另外,有些数据时刻在变,例如天气和气温、移动的车辆 等。因此需要根据具体的应用需求来描述和表达地理信息。 5 4 ◆S技术导论 3 有些属性是自然属性或环境属性,有些属性是社会属性、经济属性和军事属性。有 些属性变化快,有些属性变化慢。有些属性用于标识位置或实体(例如街道、建筑物和山 头的名字), 有些属性表达某个位置的特性(例如高程或温度), 有些属性表达类别(例如 土地类别和道路类别)。对于这些属性,有一种典型的分类:标称属性、序数属性、区间属 性和比率属性,将在第7章详细介绍。这里为了便于理解,先采用ArcGIS 的属性分类方 法,从数据类型的角度把属性分为如下类型[11]: (1)描述性字符串。给出地理要素的名称或者描述要素的种类、状况或类型。 (2)编码值。表示某一类型的要素,例如草地、林地和水域等。它可以用数值或缩略 字符串表示。有时同一个要素在不同的时间具有不同的编码,如上行和下行的火车。 (3)离散数值。表示一些可数的要素,如公路上的车道数。 (4)实数值。表示一些连续的、可量测或计算的数据,如距离、面积或流量。 (5)对象标识符。该属性很少显示出来,有些属性存储在外部数据库中,用对象标识 符作为键值可以访问这些属性。 2. 离散和连续要素 描述地理实体和现象的地理要素可以是离散的或连续的。离散要素是在空间上有 明确边界的一组对象,因此又称为离散对象,例如汽车、建筑物、湖泊和桥梁等。离散要 素的特点是可数性,例如,可以统计一个单位的车辆数或一个城市的桥梁数。可以用点、 线、面要素来表达离散要素。 显然,离散要素不能表达连续变化的地理现象。这就需要用能够表示连续场的连续 要素来表达。连续要素表达连续的观测值,由一系列沿地表连续变化的变量组成,其值 定义在任何可能的位置上。显然,卫星图像是一种连续要素,像元对应于地面的电磁辐 射或反射值。另外,还有其他的连续要素,例如,高程要素是按栅格采样得到的地表相应 点的高度数据;人口密度要素表示单位面积的人口数①;土地类型也可以用连续要素表 示,这时用土地类型编码值表示不规则多边形区域。连续要素也可以表示沿着线(而不 是面)连续变化的测量值,例如道路的交通流量或河流的流量,它们可以按照单位距离进 行统计,用相应的值表示。 3. 向量和栅格数据 离散要素和连续要素是用于表示地理实体和地理现象的方式。但是,这些要素在计 算机中如何表示呢? 向量(vector)数据模型和栅格(raster)数据模型是计算机描述地理 空间要素的两种基本模型。 在向量数据模型中,地理要素的形状和位置是由一组坐标对确定的。一般把地理要 素分为点、线、面3种类型。点类似于像元,但不占有面积,其余两种均由一系列内部相 关联的坐标形成。 在栅格数据模型中,整个地理空间被规则地分为一个个小块(通常为正方形), 用像 ① 当我们的观察细致到具体的人时,场就不存在了。 ◆ 第 3 章 地理空间数据55 元表示。地理实体的位置由占据小块的横排与竖列的位置决定,小块的位置则由其横排 与竖列的数码决定,每个地理实体的形态由栅格或网格中的一组点构成。这种数据结构 可以用于描述遥感图像。 3.3节将详细介绍向量数据模型和栅格数据模型。 2节和3. 4. 地图对地理数据的分层表达 为了清晰地表达地理数据,通常把地理数据抽象为不同的图层(r)进行表现。图 laye 层是地图上地理数据表达的基本单元,是具有某种相同属性的地理现象的图形集合,是 按制图规范表达的一组相关的地理数据,例如道路层、如图3. 河流层和设施层等,1所示。 也可以按照向量、栅格、TIN 表面图层来分类。 图3.地理数据的分层表示 1 图层只是对一系列地理数据的引用,实质上它并不包含地理数据。这样做有以下 好处[11]: (1)对于同一地理数据,可以按照不同的可视化属性或不同绘制方法创建不同的 图层 ( 。 2)对地理数据进行编辑后,相应的图层在下次显示时也会相应地更新。 (3)多个图层可以共享同一地理数据文件而不需要进行副本的复制。图层可以引用 网络上任何位置的可访问数据。 可以把图层理解为地理数据的“地图视图”,能够指定绘图的方法、设置比例尺阈值、 施加显示选择等。 对于同一地理数据集,可以创建多个图层,每一个图层表现其中一个属性值。例如, 已经有湖南省人口、空气质量和平均寿命的数据库,可以在湖南省地图中用不同的图层 分别显示湖南省各地区的人口数量、空气质量和平均寿命。 对于同一地理数据集,在创建图层时,可以在地图上交互选择要素或者使用SQL 语 法构建一个属性查询,只显示数据集中的部分数据。例如,数据集是欧洲国家,则可以选 择只显示那些参加统一货币流通的国家。在图层中使用不同的选择方法,便可以在无须 删除其他要素的前提下,绘制出自己感兴趣的要素。 可以使用任一地图比例尺来绘制地图,但某个图层只显示一定比例尺范围的地图。 还可以为某一图层设置比例尺阈值,超过阈值后用另一个图层替换显示。 5 6 ◆3 S技术导论 3.1.3 几何数据对地理空间的表达 地图是现实地理世界的可视化描述,它按照一定的比例、一定的测量原则有选择地 将复杂的三维现实世界的某些要素投影到二维平面媒介上,并用符号将这些空间要素表 现出来。地图上各种空间要素之间的关系,是按照地图投影的数学规则,使地表各点和 地图平面上的相应各点保持一定的函数关系,从而在地图上准确地表达地表空间各要素 的关系和分布规律,反映它们之间的方向、距离和面积。 在地图学上,把地理空间的实体分为点、线、面3种要素,分别用点状、线状和面状向 量符号来表示。 图3.2是点、线、面向量数据表示地图要素的一个简单例子。图中用圆圈表示城市, 用线表示河流或铁路,用闭合多边形表示湖泊。图中还给出了比例尺和图例。 图3.2 地图要素 对于非连续分布的面状要素的分布范围和质量特征,一般可以用面状符号表示。符 号的轮廓线表示其分布位置和范围,轮廓线内的颜色和网纹或说明符号表示其质量特 征。例如,土地利用图中描述的是一种非连续分布的面状事物,在地图上通常用地类界 与底色表示森林、农作物和果林等土地利用情况。 对于连续分布的面状要素的数量特征及变化趋势,常常可以用一组线状符号表示, 例如等值线,包括等温线、等降水量线、等深线、等高线和等电磁强度线等,其中等高线是 GIS系统中经常用到的一种表示方式。等值线的符号一般是细实线加数字注记,等值线 的数值间隔一般是常数,这样,就可以根据等值线的疏密,判断制图对象的变化趋势或分 布特征。等值线法适合表示地面或空间呈连续分布且逐渐变化的地理要素。 在3.2节中将详细讨论向量数据的性质。 3.1.4 遥感图像对地理空间的表达 遥感就是通过各种设备远距离获取指定目标区域信息的过程,其包括航空和航天遥感。 有两种类型的遥感方式:被动遥感和主动遥感。被动传感器检测被观察目标和周围 区域发射或反射的自然辐射。反射太阳光是被动传感器采集的最常见的辐射源。通常 ◆ 第 3 章 地理空间数据57 采用的被动遥感传感器有胶片摄影机、红外传感器、CCD 传感器和辐射计等。主动传感 器发射能量,扫描目标区域,检测目标的反射或辐射。雷达是主动遥感的例子,可以获取 目标的位置、高度、速度和方向。 通过遥感技术,可以采集广泛、危险或不可达区域的图像数据。在轨平台采集并传 输不同电磁频谱的数据,结合空基和地基遥感数据分析,为用户提供大量的信息,用于监 视各种自然现象及其变化趋势,以及事件发展和运动变化。其典型应用包括监视森林采 伐情况、北极和南极区域冰川对气候变化的影响、海洋深度探测、自然资源管理、土地利 用和保护、国家安全以及军事冲突边界区域的监视等。 卫星遥感可以覆盖全球每一个角落,对任何国家和地区都不存在由于自然或社会因 素所造成的信息获取的空白地区。卫星遥感数据可以及时地提供广大地区的同一时相、 同一波段、同一比例尺、同一精度的遥感信息。航空遥感可以快速获取小范围地区的详 细资料。 遥感图像对地球空间信息的描述主要是通过栅格图像,即不同的颜色或灰度的像素 矩阵来表示的。这是因为地物的结构、成分和分布等的不同,其反射光谱特性和发射光 谱特性也各不相同,传感器记录的各种地物在某一波段的电磁辐射和反射能量也各不相 同,反映在遥感图像上,则表现为不同的颜色或灰度信息。所以,通过遥感图像可以获取 大量的空间地物的特征信息。通过如图3.真实地获得某个城市区 3所示的遥感图像①, 域的地理空间信息。 图3.遥感图像示例 3 需要说明的是,利用遥感图像通常可以获得多层面的信息,对遥感信息的提取一般 需要具有专业知识的人员通过遥感解译才能完成。 遥感图像是栅格数据,其信息的基本单元是像素。像素矩阵表示为一幅图像。每个 像素具有不同的值,反映出传感器对应波谱段电磁辐射的强度。每个像素对应遥感成像 的一个小区域,反映遥感图像的分辨率。每个像素也对应地理空间的一个位置,具有空 间参照坐标。在3. 3节中将详细讨论这些性质。 ① 来源于GoogleMap。 5 8 ◆3 S技术导论 3.2 向量数据模型 向量数据模型用向量形式的几何形状表示地理要素。最基本的几何要素是点、线和 多边形。向量数据模型可以表示几何要素的空间关系,称为拓扑关系。向量数据模型也 可以不表示拓扑关系,这样的模型简单直观。不规则三角网模型是一种常用的向量数据 模型。 3.2.1 地理要素的几何表示 地理要素通常用向量表示,并具有几何形状,即不同的地理要素用不同的几何形状 表示。最基本的几何形状是点、线、面,它们分别表示点状要素、线状要素和面状要素。 1.点 点(point)表达那些很小且不能用线或多边形来表示的地理要素。地面上真正的点 要素很少,一般都占有一定的面积,只是大小不同。这里所谓的点要素,是指那些占有面 积较小,不能按比例尺表示,又要定位的要素。因此,面状要素和点状要素的界限并不严 格。例如居民点、钻井位置、电线杆或建筑物等,在大、中比例尺地图上被表示为面状地 物,在小比例尺地图上则被表示为点状地物。点也可以用来表示那些没有面积属性的特 定区域,如山峰等。 点要素可以用一对(x,y)坐标定位。点的维度为0,其几何特征只有位置值。点也 称为结点(node)或折点(vertex)。点是空间上不可再分的地理要素,可以是具体的,也可 以是抽象的,如地物点、区域内点(表示多边形的属性,存在多边形之内)、样本点、文本位 置点(定位文本标注的位置)或线段网络的折点(多条线段或弧段的折点)等。例如,一种 点要素的向量数据结构如下: 点要素(ID,(x,y)) 在向量数据模型中,除点要素的(x,y)坐标外,还可以存储相关的属性,描述点要素 的类型、制图符号、大小、方向和显示要求等。如果点是文本实体,记录的数据应包括字 符大小、字体、排列方式、比例、方向以及与其他非图形属性的关联方式。 2.线 线(line)用于表达那些长条形的、狭窄的、不能用多边形表示的地理要素,如街道、河 流、溪流、交通线、航线和境界线等,或者是某些表面的切割线,如等高线等。当然,对于 线状和面状实体的区分,也和地图的比例尺有很大的关系。例如河流,在小比例尺的地 图上被表示成线状地物,而在大比例尺的地图上则被表示成面状地物。线的维度是1,典 型地具有长度特征。线也称为边(edge)。 线要素可以定义为直线元素组成的各种线状要素,直线元素由两对以上的(x,y)坐 标定义。最简单的线要素只存储它的起止点坐标。线的形态可以是平滑曲线或折线。 ◆ 第 3 章 地理空间数据59 平滑曲线用数学方程拟合(例如样条函数)。因此,平滑曲线表现出来是弧线。多段线构 成链(chain), 链是 n 个坐标对的集合,这些坐标对可以描述任何连续而又复杂的线状要 素。组成链的线元素越短,(x,坐标数量越多, 一 y) 就越逼近一条复杂线状要素。例如, 种线要素的向量数据结构如下: 线要素(ID,起始点,终止点) ID( 线要素(坐标对序列,…) ID, 其中,标识)是系统排列序号,可以标识线的类型;起始点和终止点可以用点号或直接 用坐标表示。 线要素也可以具有相关的属性数据。例如,线要素输出时可能用实线或虚线描 绘,这类信息属于符号信息,它说明线实体的输出方式。线要素并不是以虚线存储,只 是显示时用虚线输出。与线关联的非几何属性可以直接存储于关系数据表,由ID 关 联查找。 3. 面 面状(area)分布的地理要素很多,例如对湖泊、岛屿和地块等一类现象的描述,在数 据库中由一个封闭曲线加内点来表示。面要素分布方式有多种:有连续分布的,如气温、 地形等;有不连续分布的,如行政区域、街区、森林、油田和农作物等。它们所具有的特征 也不尽相同。有的是性质上的差别,如不同类型的土壤;有的是数量上的差异,如气温的 高低等。因此,表示它们的方法也不相同。面的维度为2,典型地具有面积和周长的特 性。面由闭合的线组成,闭合线也称为多边形(polygon)。例如,一种面要素的向量数据 结构如下: 面要素(弧段ID 序列,…) ID, 面是描述地理空间特征的一类重要数据。在面要素中,具有名称属性和分类属性的 多用多边形表示,如行政区、土地类型、植被分布等;具有标量①属性的有时也用等值线描 述,如地形和降雨量等。 面用多边形表示,并进行向量编码,一方面表示位置,另一方面表示面的拓扑特征。 基于多边形的运算比较复杂,因此多边形向量编码比点和线实体的向量编码要复杂得 多。这些复杂性表现在以下几点: (1)组成地图的每个多边形应有唯一的形状、周长和面积,即地图上的多边形不可能 有相同的形状和大小。 (2)空间分析要求的数据结构应能够记录每个多边形的邻域关系,即面要素可以是 单独的或与其他面要素共享边界。 (3)地图上的多边形并不都是同一等级的多边形,而可能是多边形内嵌套小的多边 形(次一级), 例如湖中的岛屿。这种所谓“岛”或“洞”的结构是多边形关系中较难处理的 问题。 ① 标量指在坐标变换下不变的物理量,即只有数值大小而没有方向的量,如密度、温度、能量、距离等。 6 0 ◆3 S技术导论 4.其他要素 如果要描述三维空间中的现象与物体,就需要用体要素表示立体状实体。体要素具 有长度、宽度、高度和体积等空间属性。 现实世界的各种现象比较复杂,往往由上述不同的空间要素组合而成,复杂实体由 简单实体组合表达,即复杂空间要素由基本要素复合而成。 3.2.2 拓扑关系 1.什么是拓扑 在3S信息系统中,为了有效地管理空间数据,不仅要存储空间要素的位置、形状和 属性,还要存储反映要素之间相互关系的信息。这些关系就是拓扑关系。拓扑关系是指 图形在保持连续状态下变形,但图形关系不变的性质。 拓扑学是几何学的分支,研究在拓扑变换下能够保持不变的几何属性,即拓扑属性。 拓扑结构是明确定义空间关系的一种数学方法。例如橡皮圈,无论其如何拉伸,都是一 个闭合圈,其拓扑性质不变,即几何对象在弯曲或拉伸等变换下仍保持不变。再如,多边 形中有一点A ,那么A 与多边形边界间的空间关系是不会改变的,虽然在拉伸时多边形 的面积会发生变化,因此,多边形内的点具有拓扑属性,而面积不具备拓扑属性。其他拓 扑属性的例子有一条弧段的端点、一个区域边界上的点、一个区域内部或外部的点;非拓 扑属性的例子有两点的距离、区域的周长、从一个点指向另一个点的方向。 拓扑关系能清楚地反映实体之间的逻辑结构关系,它比几何关系具有更大的稳定 性,不随地图投影而变化。存储拓扑关系会增加数据量。那么拓扑关系的作用是什么 呢? 空间数据的拓扑关系在空间信息的管理、利用和分析上具有重要的意义,其作用主 要体现在以下两方面: (1)提高空间数据质量。用拓扑关系约束几何数据的关系,从而发现几何数据的错 误。例如,用拓扑特性发现未正确闭合的多边形、未正确链接的线段。在最短路径分析 中,如果本该链接的路径没有链接,那么最短路径的计算就与实际相差很大,造成重大 失误。 (2)辅助空间数据处理、查询和分析。根据拓扑关系,不需要利用坐标和距离就可以 确定一种空间要素相对于另一种空间要素的空间位置关系。例如,利用拓扑特性,就可 以得到某个方向的交通流量,因为拓扑信息中包含了线段的方向。拓扑数据中也包含了 左多边形和右多边形信息,这有利于分析用户指定道路和方向的左右地域特性。例如, 某条铁路通过哪些地区,某县与哪些县邻接,某高速公路连接哪些地区,供水管网系统中 某段水管破裂时如何找到关闭它的阀门。 拓扑关系在地图上是通过图形来识别和解释的;而在计算机中,则必须按照拓扑结 构加以定义和编码。下面通过一个具体的例子来解释拓扑关系。 第◆61 3 章 地理空间数据 2. 拓扑关系 下面以图3. 4为例说明拓扑关系的定义 和编码。这是一个有向图,包括点和有向线 (又称为弧段), 弧段相交处的点称为结点。 图中, e 为结点,1列出了结点的坐标 a~表3. 值;1~7为弧段,2列出了弧段与对应的 表3. 结点;P1~表示面要素), 3 P4 为多边形( 表3. 列出了多边形与对应的弧段。P0 表示地图 区域外的多边形,称为外多边形或全域多 边形。 下面介绍典型的3种拓扑关系:邻接关 系、关联关系和包含关系。 (1)邻接关系。空间几何元素中同类元素之间的拓扑关系。例如,多边形P1 与P2、 P2 与P3、P1 与P3 之间是邻接关系;结点之间 a 与b、 b 与c、 b 与 d 之间是邻接关系。 (2)关联关系。空间图形中不同几何元素之间的拓扑关系。例如结点 b 与弧段4, 5,6关联;多边形P1 与弧段3,4,5关联。 (3)包含关系。空间图形中同类但不同级几何元素之间的拓扑关系。例如多边形 P3 中包含有多边形P4。在表3.多边形P3 的弧段表示为2,6,5, 3中, 4,0,其中0用于区 分外多边形和内多边形(弧段5表示P4), 表示P4 是P3 中的一个岛,具有包含关系。有 的文献中区分包含关系和层次关系。包含关系指的是面与其他拓扑元素之间的关系。 如果点、线、面在该面内,则称为被该面包含,例如某省包含的湖泊和河流等。层次关系 指相同拓扑元素之间的等级关系,例如国家由省(自治区、直辖市)组成,省(自治区、直辖 市)由市和县组成等。 表3.结点的坐标值 2 表3.多边形与对应的弧段 1 表3.弧段与对应的结点 3 图3.4空间数据的拓扑关系 ID 坐标值弧段始结点终结点多边形弧段 a 1,7 1 a c P1 3,4,5 b 5,8 2 c d P2 1,5,6 c 11,8 3 d a P3 2,4,6 d 5,1 4 b d P4 7 e 7,6 5 a b 6 b c 7 e e 要将结点、弧段和多边形之间的拓扑关系表达出来, 如图3. 可以建立4个关联,5所 示。表3.-5是表示结点与弧段关系的关联矩阵, 4给出了结点弧段关联。表3.矩阵中1 表示弧段出该结点,-1表示弧段入该结点,0表示弧段与该结点无关联。弧段-结点关联 已经由表3.-6所示,-3中 2给出。弧段多边形关联如表3.多边形弧段关联已经在表3. ◆ 62 3 S技术导论 给出。 图3.结点、弧段和多边形关联关系 5 表3.结点弧段关联 4 结点弧段结点弧段 a b c 1,3,5 4,5,6 1,2,6 d e 2,3,4 7 表3.结点弧段关联矩阵 5 结点 弧段 1 2 3 4 5 6 7 a 1 0 -1 0 1 0 0 b 0 0 0 1 -1 1 0 c -1 1 0 0 0 -1 0 d 0 -1 1 -1 0 0 0 e 0 0 0 0 0 0 1 表3.弧段多边形关联 6 弧段左多边形右多边形弧段左多边形右多边形 1 2 3 4 P0 P0 P0 P3 P2 P3 P1 P1 5 6 7 P2 P2 P3 P1 P3 P4 点、线、面基本几何数据之间的关系代表了空间要素之间的空间关系。从空间分析 角度看,点、线、面两两之间存在的空间关系的物理意义如下: (1)点-点。点和点的关系主要有两点(通过某条线)是否相连,两点之间的距离是多 少,如城市中某两个点之间可否有通路,距离是多少。 (2)点-线。点和线的关系主要表现在点和线的关联关系上,如点是否位于线上,点 与线的距离等。 (3)点-面。点和面的关系主要表现在空间包含关系上,如某个仓库是否位于某个县 内,或某个县共有多少个仓库。 (4)线-线。线和线的关系主要表现在线与线是否邻接(或相交), 例如一条河流和铁 路相交,两条公路相交于某点。 (5)线-面。线和面的关系表现为线是否通过面,或线是否包含在面之内,例如一个 地区包含哪些铁路和高速公路。 (6)面-面。面和面的关系主要表现为面的邻接和面的包含关系。 第◆3 章 地理空间数据6 3 3.2.3 非拓扑关系 AutoCAD也是管理图形数据的,其中图形交换文件(DXF)可以记录不同的线符号、 颜色和文本,描述图层,但是不支持拓扑关系。在GIS发展初期,GIS开发者为了把 GIS从CAD中分离出来而引入了拓扑关系。 从前面的叙述看,拓扑的价值在于提升数据编辑质量和空间分析能力。各种GIS开发 出各种互不兼容(专用)的拓扑文件格式。但是并不是所有空间信息应用都要使用拓扑关 系,因此非拓扑格式的文件仍然是一种重要的空间特征数据。例如,ArcGIS中采用的非拓 扑数据格式为shapefile,点就用(x,y)表示,线用一组点表示,面(多边形)用封闭的一组线表 示。相邻多边形存在共享边,可能有重复弧段,但是没有描述几何拓扑关系的数据。 因此,要不要拓扑关系取决于空间信息系统项目的目的。对于某些项目来说,拓扑 功能并非是必要的;而对于另一些项目来说,拓扑功能是必需的。例如,要求发现和查找 几何数据错误,确保线段的正确会合和多边形的正确闭合,就需要拓扑关系。对于需要 拓扑关系的空间分析,也需要拓扑数据结构的支持。 那么,不含拓扑信息的空间特征数据的用途在哪里呢? 非拓扑数据的优势如下: (1)表现速度快。因为非拓扑数据比拓扑数据简单,因此使用非拓扑数据能够比拓 扑数据更快地在计算机屏幕上显示出来。 (2)标准化。由于非拓扑数据格式简单,容易标准化,因此易于在不同空间信息系统 中共享。而各公司有自己定义的拓扑数据结构,因此难以标准化,难以在不同系统中共 享拓扑数据。 非拓扑数据与拓扑数据可以互相转换。非拓扑数据向拓扑数据转换,需要建立拓扑 关系,可以去除重复的弧段;拓扑数据向非拓扑数据转换比较简单,但是如果拓扑存在错 误,就会导致一些要素的丢失,例如一些连接错误的线段在转换过程中可能丢失。 3.2.4 不规则三角网 点、线、面是基本的几何元素。用基本的几何元素难以表示复杂的空间要素。把点、 线、面组合,形成其他几何模型,就可以方便地表达复杂的空间要素。一种复合几何数据 模型就是不规则三角网(TriangulatedIrregularNetwork,TIN)。 1.什么是TIN TIN 是一种用于表示表面(surface)的向量数据结构,例如表示陆地表面、海底等。 它由不规则分布的结点和线组成,结点具有三维坐标(x,y,z),以非重叠三角网形式排 列,如图3.6所示。这里结点又称为顶点,每个三角形的坡度、坡向均一。TIN 通常从数 字高程模型(DigitalElevationModel,DEM)的高程数据中导出。它克服了DEM 高程矩 阵中冗余数据的问题,能够更加有效地用于各类以数字地面模型(DigitalTerrainModel, DTM)为基础的计算。 在地形绘制及其分析中,TIN 的优越之处是变化的分布点,TIN 通过算法确定最需 ◆ 64 3 S技术导论 图3.用TIN 近似表示三维地形 6 要以哪些点精确表示地形,因此数据输入比规则分布的DEM 更灵活,点更少,适合表示 三维地形和三维地形可视化。在表面高度变化不大的地区,网点可以稀少一些;而在表 面高度变化大的地区,需要增加网点密度。即TIN 可根据地形的复杂程度确定采样点的 密度和位置,表示地形特征点和线,从而减少地形较平坦地区的数据冗余。 TIN 表示法利用所有采样点取得的离散数据,按照优化组合的原则,把这些离散点 连接成相互邻接的三角面。在连接时,尽可能地确保每个三角形都是锐角三角形或三边 的长度近似相等。 2.TIN 的数据结构 通常,TIN 的三角网格是基于德劳内(Delaunay)三角测量算法得出的。德劳内 (BorisDelaunay)于1934 年提出了三角测量算法。但是在应用过程中要加以限制,选择 一些点,例如河流、道路、湖泊、水库、山脊、谷底和顶峰作为显著变化点,以精确拟合 地形。 在数学和计算几何上,对于平面上的点集合P,在利用德劳内三角测量算法形成的 任何三角关系中,三角形的外接圆中不包含任何 P 中 的点,即三角形外接圆为空,7所示。如果是在 如图3. 三维空间中,外接圆用外接球代替。读者可以在 Internet上获得德劳内三角测量算法及其源程序。 形成三角关系时,尽量使得三角形的最小角最大 化,避免小三角形。如果点集合都在同一条直线上, 就不能产生德劳内三角形。如果4个点在同一个圆 上,例如一个长方形的4个顶点,那么德劳内三角形不 是唯一的。显然,有两种可能的方式分割长方形为两 个三角形,它们都满足德劳内三角测量算法的条件。 在概念上,TIN 模型类似于多边形网络中的向量 拓扑结构,只是在TIN 中不必规定“ 或“ 的拓扑关系。表3.~表3.7 岛” 洞” 79给出了图3. 中TIN 的一种数据结构表示。它不仅要存储每个结点的坐标和高程,还要存储三角形和 结点及邻接三角形等关系。有许多种表达TIN 拓扑结构的存储方式,一个简单的记录方 式是:对于每一个三角形、边和结点都对应一个记录。每个结点包括3个坐标值的字段, 图3.7德劳内三角关系 第◆3 章 地理空间数据6 5 分别存储x、y、z 坐标,如表3.7所示。三角形的记录包括3个结点和相邻三角形,具有 公共边的三角形被认为是相邻的,如表3.8所示。边的记录包括两个顶点和相邻三角形, 如表3.9所示。 表3.7 结点坐标值 结 点x y z 结 点x y z a xa ya za e xe ye ze b xb yb zb f xf yf zf c xc yc zc g xg yg zg d xd yd zd 表3.8 三角形的记录 三角形结 点相 邻三角形结 点相 邻 T1 a,g,f T5,T2 T4 b,g,d T3,T5,T6 T2 f,g,e T1,T3 T5 a,b,g T4,T1 T3 g,d,e T2,T4 T6 b,c,d T4 表3.9 边的记录 边结 点相 邻边结 点相 邻 1 a,b T5 7 a,g T1,T5 2 b,c T6 8 b,g T4,T5 3 c,d T6 9 b,d T6,T4 4 d,e T3 10 g,d T3,T4 5 e,f T2 11 g,f T1,T2 6 f,a T1 12 g,e T3,T2 这种拓扑网络结构的特点是:对于给定的一个三角形,查询其3个顶点高程和相邻 三角形所用的时间是定长的,在沿直线计算地形剖面线时具有较高的效率。当然,可以 在此结构的基础上增加其他变化,以提高某些特殊运算的效率,例如在结点的数据结构 里增加其关联边的记录。 虽然TIN 的坐标是三维数据(x,y,z),但是也可以用于描述和分析水平(x 和y 平 面)分布及其关系。 3.3 栅格数据模型 栅格数据用像元表示连续空间的空间要素,像元具有行列值(空间位置)和属性值。 常用的栅格数据类型有数字高程数据、卫星影像、数字正射影像、扫描地图和采样格网 等。通过链式编码、四叉树编码和其他压缩编码来表示栅格数据的结构。 3.3.1 地理要素的栅格表示 栅格数据模型(rasterdatamodel)用规则像元(cell)矩阵表示连续空间的空间要素。 6 6 ◆3 S技术导论 栅格数据模型的基本数据单元称为像元,栅格数据结构就是像元矩阵,用每个像元的行 图3.8 像元矩阵 列号确定位置,用每个像元的值表示空间要素 的现象特征,如图3.8所示。 向量数据模型是空间要素边界的建模,而 栅格数据模型是空间格网像元的一致特性建 模。栅格数据适合表示连续变化的空间要素 和现象,包括降雪量、降雨量和地形高程等。 像元数据表示的是二维表面上的地理数 据的离散化数值。在像元数据中,地表被分割 为相互邻接、规则排列的地块,每个地块与一 个像元相对应。因此,栅格数据的比例尺就是 像元的大小与地表相应单元的大小之比。每 个像元的属性是地表相应区域内地理数据的 近似值。 像元矩阵由行列像元排列组成。起始坐标为像元矩阵的左上角。横坐标为x,表示 像元矩阵的列;纵坐标为y,表示像元矩阵的行。如果设起始坐标值为x0 和y0,那么其 空间坐标x 和y 为 x =x0 +nΔx y =y0 +mΔy 式中,m =0,1,2,…,M -1,n=0,1,2,…,N -1,M 和N 为垂直和水平方向的像 元数。像元值用f(x,y)表示。因此,栅格数据可用一个矩阵表示,即 f(0,0) f(0,1) … f(0,N -1) f(1,0) f(1,1) … f(1,N -1) . . . . f(M -1,0) f(M -1,1) … f(M -1,N -1) é . êêêêê ù . úúúúú 基本的点、线、面要素的向量表示和栅格表示的示例如图3.9所示。在栅格表示中: 图3.9 地理要素的表示 ◆ 第 3 章 地理空间数据67 (1)点要素:表示为一个像元。 (2)线要素:表示为连接成串的沿线走向的相邻像元的集合。 (3)面要素:表示为聚集在一起的相邻像元的集合。 以上用栅格数据表示了地理空间现象要素的特性,现在需要对像元定位,将像元的 位置与地理位置对应起来,这就是地理空间参照信息。有了地理空间参照信息,栅格数 据就可以准确地匹配其他相关空间数据,例如把高程栅格数据叠加到地图上,把降雪分 布叠加到某一地区,把电磁信号分布叠加到某个区域。经过与投影坐标系统匹配处理的 栅格数据通常称为地理参照栅格数据[12]。 表示具有空间分布特征的地理要素,不论采用什么编码系统———向量还是栅格数据 结构,都应在统一的坐标系统下,而坐标系统的确定实质是坐标系统原点和坐标轴的 确定。 由于栅格编码一般用于特定区域,原点的选择常具有局部性质,但为了便于区域的 拼接,栅格系统的坐标应与国家基本比例尺地形图一致,并分别采用其纵横坐标轴作为 栅格系统的坐标轴。 坐标的确定与像元尺寸有关。像元大小的选择应能有效地逼近空间对象的分布特 征,又能减小数据的冗余度。像元太大,忽略较小的图斑,有些信息会丢失。空间实体特 征越复杂,像元尺寸就越小,分辨率越高,然而栅格数据量越大,按分辨率的平方指数增 加,计算成本越高,处理速度越慢。如果系统采用的是30m 分辨率的卫星图像,那么选择 一个10m 分辨率的DEM 数据进行栅格化就没有必要。 在投影坐标系统中,坐标的起始位置为左下角,而栅格数据的起始位置为左上角。 因此要把两者对应起来,就需要进行转换。在确定像元矩阵中的某个像元位置时,必须 首先确定其某个角的坐标,例如左下角的坐标, 10 所示。 如图3. 图3.像元的坐标 10 下面用一个例子来说明栅格数据的地理参照。设一个高程栅格数据为1000(行)× 1200(列); 像元为正方形,边长10m 。设该高程矩阵在通用墨卡托(UTM)坐标系统中的左 下角坐标为(其右上角的UTM 坐标为(即 488965,3430122 )。那么, 500965,3440122), 488965+1200×10=500965 3430122+1000×10=3440122 6 8 ◆3 S技术导论 如果像元的行和列分别用m 和n 表示,其起始于栅格的左上角,那么其中任一像元 的左下角坐标为 x =488965+10n, n =0,1,2,…,1199 y =3430122+10× (999-m ), m =0,1,2,…,999 右上角坐标为 x =488965+10× (n +1), n =0,1,2,…,1199 y =3430122+10× (1000-m ), m =0,1,2,…,999 栅格数据的优势如下: (1)数据结构简单。用像元矩阵表示,像元用不同的数值表示。有时它与一个属性 表关联起来。 (2)适合密度统计和空间分析。 (3)用一致的方式存储点、线、多边形和表面。 (4)与向量数据比起来,能够执行更快速的复杂数据叠加。 (5)用相同的基于像元的结构表示所有的要素类型,因此所有要素类型可以同等对 待。这种一致的结构适合把各种地理要素结合在一个科学处理中。例如,可以把表面 (高程)数据与面要素(如森林)、线要素(如河流和道路)和点要数(如井)以同样的分析方 式结合起来,进行查询、重叠或表现。 (6)用有损或无损压缩方式压缩数据集。 栅格数据的不足如下: (1)由于基于像元的要素表示,因此在空间表示中精度不高。 (2)数据集的数据量较大。 3.3.2 栅格数据的类型和结构 用栅格数据模型可以表示各种传感器获取的数据。下面介绍常用的几种数据类型, 并讨论这些数据是如何选取或获取的,即像元值是如何确定的。 1.栅格数据类型 常用的栅格数据类型包括卫星影像、数字高程数据、数字正射影像、数字扫描地图、 数字栅格图和采样数据网格等。 (1)卫星影像:也称为卫星图像,是通过遥感手段获得的一种栅格数据。遥感传感 器在某个特定的时间对一个地面区域的辐射和反射能量进行扫描采样,并按不同的波谱 段获取,以数字形式记录像素值阵列。在第5章将详细介绍遥感图像的概念及其处理 方法。 (2)数字高程数据:数字高程模型(DEM)由等间隔海拔高程数据的排列组成,是一 定范围内规则格网点的平面坐标(x,y)及其高程(z)的数据集,它主要描述区域地貌形 态的空间分布。DEM 是以点为基础的,可以将海拔高程点置于像元中心,把DEM 数据 表示为栅格数据。从DEM 数据也可以生成TIN 数据。DEM 数据可以通过遥感或地面 测量方式获取。 ◆ 第 3 章 地理空间数据69 (3)数字正射影像(DigitalOrthophotoQuadrangle,DOQ):是一种航空摄影照片 或其他遥感成像数据制作而成的数字化影像,由照相机镜头倾斜和地形起伏引起的位移 已经被消除(采用摄影测量学的校正技术)。数字正射影像是基于地理坐标系的,具有经 纬度信息,并且可以与地形图和其他图配准。DOQ 有单色和彩色影像之分,其中单色影 像类似单波段卫星影像,彩色影像是多波段卫星影像。 (4)数字扫描地图:通过扫描仪对地图或其他图件的扫描,可把纸质地图转换为数 字栅格形式的数据。例如,扫描仪扫描专题图的图像数据,得到每个像元的行、列、颜色 (灰度), 定义颜色与属性对应表,用属性代替相应颜色,根据每个像元的行、列和属性,进 行栅格编码并存储,即得到该专题图的栅格数据。如果采用二值扫描,得到的是二值地 图图像。二值地图图像经过向量化,可以生成向量地图,实现栅格数据到向量数据的 转换 ( 。 5)数字栅格图:运用向量数据栅格化技术,例如扫描的方法,把地图转换为数字图 像,把向量数据转换为栅格数据,称为数字栅格图(DigitalRasterGraphic,DRG), 或称 为数字栅格图形、数字栅格地图。这种情况通常是为了有利于某些空间操作,如叠加分 析等,或者是为了更好地输出。 (6)采样数据网格:又称为网格化专题数据,即用网格(grid)数据表示的专题信息。 通过网格采样得到地理环境的属性值,适合表示连续现象,例如温度、降雨量和高程等。 数据高程矩阵就是一种采样数据网格。这里单独列出这种数据类型,是因为一些GIS 系 统软件中特别提到这种类型的栅格数据。 2. 像元值的确定 每个像元有一个值,该值表示某空间位置处空间现象的特征。像元值的确定或获取 有两种方式: (1)通过传感器采集。 (2)通过测量和设置。 通过传感器采集的典型栅格数据就是卫星影像、航空摄影照片或数码照相机照片。 对于卫星影像来说,像元称为像素。像元值也称为光谱值(或表示颜色), 用于表示成像 数据和摄影数据。卫星传感器采集数据时,可以是单波段或多波段的。在单波段采集 中,一个像元对应一个值;在多波段情况下,一个像元将分别对不同的波段采集多个频谱 值。遥感影像存在混合像元问题,如LandsatMSS 卫星影像单个像元对应地表30m× 30m 的矩形区域,影像上记录的光谱数据是像元所对应的地表区域内所有地物类型的光 谱辐射的总体效果。因此,分辨率越高,就能越准确地表示地物要素的特征。 通过测量和设置(实地测量或根据地图上的像元区域得到)的像元值又可以分为类 别值、幅度值和距离值等[12]。类别值可能指的是土地类,例如,1代表城市用地,2代表高 速公路,3代表森林等。幅度值可以表示重要性值、噪声污染度或降雨量。距离值可以表 示高程(表示与海平面的距离)。高程可以转换为坡度或用于执行视线分析或分水岭 分析。 像元值可以是正值或负值、整数或浮点数,甚至用NODATA 值表示缺少数据。整 ◆ 70 3 S技术导论 数一般用于表示类别值。浮点数一般用于表示连续的数值数据。如果使用整数值,那么 适合为栅格数据配置相应的数值属性表,该表中给出像元值对应的含义,例如像元值为6 表示村庄实体,像元值为9表示河流实体,像元值为7表示树林实体。对于浮点数据值, 在数值属性表中一般指定像元值的范围,而不是单个像元值,因为浮点数是连续的,数据 值非常多,一个像元值对应一个特性是不现实的。 像元的大小可能是10m×10m 、30m×30m 或50m×50m,因此一个像元内可能包含 多种空间要素,而像元值常常只能用一个代码值表示。采用测量和设置方式的时候,如 何确定一个像元值呢? 当一个栅格单元内有多个可选属性值时, 11 所示, 如图3.要按以 下准则来确定栅格的像元值。 (1)中心归属法:每个像元的值由该栅格的中心点所在的面域的地物类型或现象特 性来确定。例如,在图3.a) 中心点落在代码为B的地物范围内,按中心归属法的 11(中 , 规则,像元值可据此确定为B 。 (2)长度占优法:每个像元的值由该栅格中线段最长的地物类型或现象特性来确 定。例如,在图3.中,像元值可据此确定为2。 11(b) (3)面积占优法:像元值由该栅格中单元面积最大的地物类型或现象特性来确定。 11( 例如,在图3.a)中,像元值可据此确定为C。面积占优法常用于分类较细、地物类别 斑块较小的情况。 (4)重要性法:根据一个像元内不同地物的重要性,选取最重要的地物的类型作为 栅格单元的属性值。这种方法适用于具有特殊意义而面积较小的地物类型或现象特性, 特别是点、线状地理要素,如城镇、交通枢纽、交通线和河流水系等。例如,在图3.c) 11( 中,D代表草地,3代表铁路,铁路要素比草地要素重要,因此像元值可据此确定为3。 图3.栅格代码的确定 11 3. 栅格数据的结构 上面介绍了单个像元值是如何被确定的。单个像元值确定后,像元矩阵就构成了栅格 数据文件,如图3.每个栅格作为一个像元, 紧密相邻,并由行和列号标 8中所示, 大小均匀、 识其位置,每个像元有一个像元值,表示像元覆盖区域的地物要素或现象特征。这种栅格 结构是最简单、直观的空间数据结构,又称为网格结构或像素结构。 具体的矩阵构成根据栅格数据的特点不同又分为以下的结构方式: (1)单平面结构:用于一个像元只有一个值的情况。像元值按行和列排列,构成一 个像元矩阵平面。 (2)多平面结构:用于一个像元有多个值的情况。按平面的方式依次排列。例如多 光谱卫星影像数据按光谱序列一个平面接一个平面地存储,一个平面表示一个波段的