模式(patern)的原意是模范、模型、典型、样品、图案等。通俗地讲,模式就是事物的 代表。它的表示形式是矢量、符号串、图或数学关系。对一类对象的抽象也称为该类的模 式。模式可以是一个手写的字符、一幅指纹图像、一幅人脸的图像、一段语音信号或者是 一个波形等。 模式识别,即根据对象的特征或属性,利用机器系统运用一定的分析算法认定它的类 别,并使分类识别的结果尽可能真实。随着计算机性能的提高,因特网的迅速发展,模式 识别不仅在传统领域,如文字识别、语音识别、指纹识别、遥感图像、医学等领域应用越来 越深入和广泛,而且涌现了很多新的应用领域,如数据挖掘(datamining)、文档的分类 (documentclasification)、财政金融、股票走势的预测、多媒体数据库的检索、基于生物统 计学(biometrics)的人的身份鉴别,甚至研究识别人的感情等。 目前,模式识别的方法可简单分为两大类:统计模式识别方法和结构模式识别方法, 相应的模式识别系统都是由两个过程(设计和实现)组成。设计”是指用一定数量的样本 (训练集/学习集)进行分类器的设计;“实现”是指用所设计的分类器对待识别的样本进行 1分类决策。目前较常采用的方法是统计模式识别方法。统计模式识别系统主要由图5. 所示的几部分组成。 图5.统计模式识别系统的基本组成 1 (1)信息获取:它是通过传感器,将光或声音等信息转化为电信息。信息可以是二 维的图像,如文字、图像等;可以是一维的波形,如声波、心电图、脑电图;也可以是物理量 与逻辑值。 (2)预处理:包括二值化,图像的平滑、变换、增强、恢复、滤波等,主要指图像处理。 (3)特征抽取和选择:在模式识别中,由第一步信息获取得到的信息量是相当大的, 例如,一幅64×64的图像可以得到4096个数据,一个卫星遥感图像的信息量更大。因 此,需要进行特征的抽取和选择,提取出最能反映分类本质的特征。这种在测量空间的原 始数据通过变换获得在特征空间最能反映分类本质的特征的过程,就是特征提取和选择 第5章模式识别技术的应用23 的过程。 (4)分类器设计:主要功能是通过训练确定判决规则,使得按此类判决规则分类时, 错误率最低,并把这些判决规则建成标准库。 (5)分类决策:在特征空间中对被识别对象进行分类。 研究项目采用的是统计模式识别的方法,具体实现方法如下。 用图像处理和模式识别的观点,识别并定位城市中各种不同的地物,主要地物为道 路、楼房、草地和树木(如果有其他类型地物,可以相应地进行扩充)。 (1)对遥感图像进行辐射量、大气干扰和几何变形的校正、平滑去噪、特征增强等一 系列适当的图像预处理工作。 (2)采用基于区域和颜色值的图像分割方法,将遥感图像中诸象元划分到不同的子 空间中,实现地物空间位置、所属模式的识别,并用轮廓跟踪的方法进行矢量化。 (3)将得到的数据以及属性数据以一定的格式存储,为用计算机绘图软件建立立体 图像作准备。 流程图如图5. 2所示。 图5.统计模式识别流程图 2 5.图像预处理 1 5.1 滤除噪声 1. 由于遥感图像受到光线等自然条件的影响,图像总是存在着噪声;并且图像在传输过 程中,由于传输通道取样系统质量较差或因受各种干扰的影响而造成图像毛糙,因此在进 行矢量化之前,要对图像进行平滑去噪。 局部平均法是常用的一种平滑方法。局部平均法是用某像素邻域内的各点灰度级平 均值来取代该像素原来的灰度级。通常取为 N ×N 窗口,窗口沿水平和垂直两个方向逐 24 数字城市三维再现技术 点移动,从而平滑整幅图像。均值滤波、高斯滤波、中值滤波和边缘保持滤波都属于局部 平均法。 在比较了以上4种滤波效果之后,最终选择中值滤波。它能 有效地消除噪声的同时,还能较好地保持图像的边缘,便于后期的 特征提取,且实现简便,因而得到了广泛的应用。 中值滤波用某像素邻域内各点灰度级的中值来取代该像素原 来的灰度级, 如图5. 图5.3 方形滤波窗口此处所取窗口为3×3 的方形窗口,3所示(黑 点代表像素)。 1.对比度增强 5.2 在图片中经常会出现对比度不够的情况,这可能是由于图片记录装置的动态范围太 小造成,也可能是由于摄像过程中曝光不足所造成。因此需要对摄取来的图像进行对比 度增强。 图像增强是指对图像的某些特征,如边缘、轮廓、对比度等进行强调或尖锐化,以便于 显示、观察或进一步分析与处理。对比度增强是增强技术中比较简便但又十分重要的一 种方法。这种处理是逐点修改输入图像中每一像素的灰度,图像中各像素的位置并不改 变,是一种输入与输出像素间一对一的运算。对比度增强又称点运算,一般用来扩大图像 的灰度范围。 y), y)f(y)] x, 5. 设输入图像的灰度为f(x,输出图像的灰度为g(y), 则对比度增强可表示为 g(x,=T[x,(1) 图像输出与输入灰度之间的映射关系完全由函数 T 确定。 对比度增强通常有线性变换法与直方图均衡法,这里采用直方图均衡法增强图像的 对比度,实现边缘特征的增强,以利于检测。 直方图均衡法是利用图像灰度分布信息,对灰度分布形式作校正来修正图像灰度,最 终达到图像增强的目的。直方图表示数字图像中每一灰度级与其出现的频数(处于该灰 用横坐标rk 纵坐标n( 度级的像素数目)间的统计关系, 表示灰度级, rk )表示rk 出现的 频数,即概率密度函数。直方图能够给出对应图像的概貌性描述,是进行进一步处理的重 要依据。 许多图像的灰度值是非均匀分布的,其中灰度值集中在一个小区间内的图像是很常 见的。如笔者所用的遥感图像的灰度级直方图总是在低值灰度区域数目较大,大部分像 素的灰度级低于平均灰度级。这样,图像上隐含在较暗区域中的细节看不清,也难于分 析。笔者通过构造灰度级变换,改造图像的直方图,使变换后图像的直方图达到一定的 要求。 对遥感图像来说,也就是将较暗区域中的细节尽量地显示清楚。直方图均衡是一种 通过重新均匀地分布各灰度值来增强图像对比度的方法,经过直方图均衡化的图像对二 值化阈值选取十分有利。 直方图均衡的原理如下,先对连续图像进行分析,然后推广到数字图像。 第5章 模式识别技术的应用 25 令变量r 代表欲增强图像中像素的灰度级,假定r 值已经归一化(将原图像灰度范围 [a,b]作线性变换r=(r0-a)/(b-a),使r∈[0,1],即0≤r≤1,r=0代表黑,r=1代表 白)。设变化后新图像灰度级为s,s 与r 的关系为s=T(r),假定: (1)在0≤r≤1区间内,T(r)是单调递增函数,并且满足0≤T(r)≤1; (2)变换r=T -1(s),0≤s≤1,同样满足类似(1)中的条件。 这意味着变换后的灰度仍保持从黑到白的单一变化顺序,且灰度范围与原先的一致, 以避免图像整个变亮或变暗。一幅连续图像中,灰度级r 可看作是区间[0,1]上的随机 变量,可用概率密度函数Pr(r)表示原图像灰度级分布(不均匀分布),Ps(s)表示变换后 图像灰度级概率密度分布(均匀分布)。 综上所述,s=T(r)的关系用图5.4表示,图中同时画出了变换后的灰度直方图。考 虑到灰度变换只影响像素位置分布,并不会增减像素的数目,所以有 ∫rj+Δr rj Pr(r)dr=∫sj+Δs sj Ps(s)ds (5.2) 用矩形法近似求积,可得 Pr(rj)Δr=Ps(sj)Δs (5.3) 令Δr→0,因而Δs→0,下标j 只表示任意点,因而可以去掉,得 Ps(s)=Pr(r)·dr ds (5.4) 图5.4 灰度值均衡示意图 在直方图均衡化时有Ps(s)=1/L,这里L 为均衡化后灰度级变化范围。归一化表 示时L=1,即Ps(s)=1,0≤s≤1,代入上式得到 ds=dT(r)=Pr(r) (5.5) 两边取积分得 s=T(r)=∫r 0 Pr(r)dr (5.6) 上式就是所求的灰度变换公式,可以看出,T (r)是分布函数,它是非负函数,完全满 数字城市三维再26 现技术 足变化函数要求。 在数字图像的情况下,灰度级r 取离散值rk (k=0,1,…,L -1),其中L 为灰度等 级。设n 为图像中像素总数,nk 为第k 个灰度级rk 出现的频数(即像素数目)。于是,第 k 个灰度级出现的概率为 Pr(rk)= nk n (5.7) 其中,0≤rk ≤1,k=0,1,…,L-1。变换式的离散形式表示为 Sk =T(rk)=Σk j=0 nj n =Σk j=0 Pr(rj) (5.8) 在上述变换下,数字图像的直方图,如图5.5所示,将成为均匀分布形状。因此,可根 据原图像的直方图统计量,求得均衡后各像素的灰度级变换值。由上述推理过程可以看 出,直方图均衡化的实质,即为减少图像的灰度级以换取对比度的扩大。 图5.5 均衡前后的直方图 5.2 图像分割和矢量化 5.2.1 图像分割 经过平滑去噪及对比度增强之后,由于不同的地物,如道路、楼房、草地和树木,具有 明显不同的灰度级,因此采用几个典型阈值就可以实现各种不同地物的分割。 将分割后的图像分为几幅子图像,每幅子图像中只有一类地物,如对于某校园的遥感 图像,可分为4幅子图,每个子图像只存储道路、楼房、草地和树木中的一种。然后再将同 类地物图像进行二值化,并对二值化后的图像的边缘轮廓线进行跟踪,存入链表,形成边 缘图。在这个过程中还要选取区域的灰度均值等属性作为整类地物的属性数据,以便以 后的处理。接下来将边界线分段并分出直线和曲线,得到一段数字曲线,从而实现矢 量化。同 时,还需要区分这4幅图中哪一幅是道路图而不是草地图等,采用的方法如下:道 路的两边基本都是平行的,因此根据得到的边界线可用Hough变换检测图像中是否有平 行线。如果有,即可认为该幅子图像存储的就是道路。同样,根据楼房基本都是长方形这 第5章 模式识别技术的应用 27 一特点,也可以把楼房图检测出来,树木则是一个个独立的类圆形,且闭合区域都不是很 大,这样也可以把树木子图检测出来,剩下的就是草地子图。在这个过程中,有些时候曲 线可能不是光滑的,平行线也可能因为某些因素而产生弯曲,因此有时还需要用数据拟合 的方法进行一些必要的处理。 5.2.2 图像二值化 图像二值化是图像处理的一项基本技术。在数字图像处理中,图像二值化可以达到 节省图像资源的目的。 一般使用数字图像多为灰度的,而二值化主要应用于灰度图,通过二值化,灰度图像 中的每个像素将转化为只有“黑”和“白”两种色度。 图像二值化的优点是可以将前景(物件)和背景区分出来,以利于进一步取得物件的 信息。图像二值化是在模式识别技术、医学数据可视化中的切片配准及邮件分拣系统等 工程应用中进行数据预处理的重要技术。 从图像信息含量的角度来说,二值化可看作是一种图像的压缩,压缩后图像的每像素 只占1b,在绝大多数情况下,这种压缩是会丢失有用图像细节信息的,因此,在二值化的 过程中,应尽量保持图像中与应用有关的细节。 二值化的阈值选取有很多方法,主要可分为三类:整体阈值法、局部阈值法、动态阈 值法。整 体阈值法是指在二值化过程中只使用一个固定阈值T 的方法,此法对于质量较好 的图像较为有效,特别是对具有双峰直方图的图像(一个峰对应图像中的背景,另一个峰 对应图像的目标)而言。 局部阈值法是由像素灰度值和此像素领域的局部灰度特性来确定像素的阈值,此法 能适应较为复杂的情况,但它时间开销大,而且在某些情况下会产生一些失真。 动态阈值法的阈值不仅取决于该像素灰度值及其他领域内像素的灰度值,而且还和 此像素的坐标位置有关。 一般来说,整体阈值法对质量较好的图像有效(这些图像的直方图一般有两个峰值), 而局部阈值法则能适应较为复杂的情况。但它们往往忽略了图像的边缘特征,使得原图 像中的一些不同区域在二值化后变成了一块大区域,它们之间的分界结消失,而在颗粒分 析等应用中,这是不允许的。 研究项目所用的图像二值化根据下列的阈值进行处理: ft(i,j)= 1, f(i,j)≥t 0, f(i,j)<t { (5.9) 通常,最后的二值图像中,值为1的部分表示图形,值为0的部分表示背景。在图像 灰度值的直方图中,把灰度值的集合用t 分为两组,基于两组间的最佳分离而决定参数t 的方法,称为阈值选择法。 二值化的方法很多,针对一张灰度图像,笔者比较了非零像素置一法、固定阈值法、双 固定阈值法、均值二值化、根据直方图选择阈值法、判断分析法、P 参数法和迭代二值化 2 8 数字城市三维再现技术 等方法。最终采用了迭代二值化法,因为它既能较好地检测出目标图像的边缘信息,又不 需要人工参与,满足系统实时的要求。 1. 非零像素置一法 非零像素置一法的原理非常简单,即把灰度图像中灰度值非0的所有像素变为1,其 他为0。这种方法仅在背景像素多为0时才有效。 2. 固定阈值法 人工选择一个阈值t,灰度值小于该阈值的像素变为0,大于或等于该阈值的像素变 为1。根据不同阈值的选取,图像会发生很大的变化,这种方法是依赖于手动调试的。 3. 双固定阈值法 人工设定两个阈值t1,t1<t2), 则变为0(或1), 大于或等 t2(如果像素灰度值小于t1, 于t1 而小于t2 变为1(或0), 大于或等于t2 则变为0(或1), 取0-1-0还是1-0-1视具体 情况而定。 4. 均值二值化 均值二值化是求出图像所有像素的灰度平均值,将该平均值作为二值化的阈值,将图 像进行二值化,所以称为均值二值化。该方法有可能在图中明暗变化剧烈的地方出现一 些严重的失真。 5. 根据直方图选择阈值法 根据直方图中显示的图像信息(波峰波谷等)人工选择阈值,将图像进行二值化。度 量直方图在灰度值 i 处的平衡性。对于伪凹面,它通常位于直方图的某一侧,其值比较 小。因此,略去值较小时(-h(的极大值,其余极大值所对应的灰度值可以选作阈值。 i)i) 这不一定是最优的,也可以考虑采用在这些极大值附近的其他灰度值 。 6. 判断分析法 判断分析法是一种自动选择阈值的方法。它从图像灰度值直方图中,把灰度值的集 合用初始阈值 t 分成两类,然后根据两类的平均值方差(类间方差)和各类的方差(类内方 差)之比最大,来确定最终阈值t。 设图像具有 L 级的灰度值,初始阈值为k,把具有 k 以上灰度值的像素和具有比它小 的值的像素数分为两类:类1和类2。类1的像素数设为W1(k), 平均灰度值为M1( k), 方差为σ1(类2的像素数设为W2(平均灰度值为M2(方差为σ2(全体像素 k); k), k), k), 的平均值定为MT,则类内方差由下式计算: σ2=W1σ2σ2(10) W1+W22 5. 类间方差由下式计算: 第5章模式识别技术的应用29 22 σ22+W2(( B=W1(M1-MT )M2-MT )M1-M2)5. B/最好使σ2=W1W2(11) 为了使σ2σ2W 最大,B 最大,也就是最好令 k 变化,从而求出使σB 为最大的 k 值。 7. P 参数法 P 参数法阈值的选取需要人工指定一个百分数,这个百分数表示应划分出的目标子 图像占整幅图像的面积比例,通常称为 P 参数。 设应划分出目标图像的面积大致等于S0,它与图像总面积 S 的比率为P=S0/S,则 以灰度值 t 以上的像素对全体像素的比率为 P 求出阈值t。 P 参数法经常用于工程图纸和文本图像等能够对应分离出的对象图形的面积进行 某种程度的预测的场合。 8. 迭代二值化 迭代法既能较好地分割出目标子图像,又能自动地实现。实现算法如下。 (1)求出图像中的最小和最大灰度值Zl 和Zk ,令阈值初值 T0= Zl+Zk (5. 2 12) (2)根据阈值Tk (初始值为T0)将图像分割成目标和背景两部分,求出两部分的平 均灰度值ZO 和ZB: i,i, Σz(j)×N (j) i, ZO=z(j)<Tk Σ i,(5.13) N (j) z(j)<Tk i, i,i, Σz(j)×N (j) i,ZB=z(j)>Tk 5. Σ N (j) (14)i, z(j)>Tk i, 其中,i,i, N (是(点的权重系数, i, 1. z(是图像上(点的灰度值,i,i,一般 N ( 0。 j) j) j) j) j)= (3)求出新的阈值: Tk+1= ZO+ZB (5. 2 15) (4)如果Tk =Tk+1,则结束,否则 K ← K +1,转第(2)步。 另外,由于遥感图像中经常会出现一些小的图斑,影响最终的矢量化效果,因此对于 二值化后的图像要进行小图斑的消除。可采用十字形算子对图像进行先膨胀后腐蚀的方 法,以去除这些小图斑。也可先对二值图像进行区域标记,然后将面积(用像素个数计算) 小于指定阈值 S 的黑区域去除。 二值图像区域标记就是对相同连接成分的所有像素分配相同的标号,对不同的连接 成分分配不同的标号。直观地说,在标记前图像是二值的,像素灰度值是0(黑)或255 30 数字城市三维再现技术 (白), 标记之后每个黑像素的值是所属区域的标号(1,2,3,…L), 其中 L 是图像中黑区域 的数目。笔者所用的递归算法如下: (1)扫描图像,找到没有标记的黑点,给它分配一个新的标记L; (2)递归分配标记 L 给该点的邻点(此处采用8邻点); (3)如果不存在没标记的点,则退出,算法结束,否则转(1)。 区域标记完成之后,将面积小于阈值 S 的黑色小区域消除(面积用像素个数计算)。 笔者选择的固定阈值为5。