本章要点 . 什么是小波变换?它与短时傅里叶变换有何联系和区别? . 短时傅里叶变换的基本原理是什么?它与滤波器组有何联系? . 什么是 Haar 小波变换?如何实现 Haar 小波变换? . 离散小波变换与滤波器组有何联系? . 什么是小波提升变换?提升变换有哪些优势? 5.1 小波的由来 小波(wavelet)一词源自法语“ondelette”,直译即“很小的波形”。该名称最初由法国 地球物理学家 Morlet 命名。20 世纪 80 年代,Morlet 在分析人造地震数据时遇到了一个 问题。人造地震数据是典型的非平稳信号,如图 5.1 所示,信号在起始时刻剧烈震荡,随后 快速衰减。传统的傅里叶变换只能提供信号的频率信息,无法准确给出某个频率发生的时 刻;而短时傅里叶变换(short-time Fourier transform,STFT)虽然能够刻画局部时频信 息,但由于时频分辨率固定,依然具有局限性。Morlet 借鉴 Gabor 变换à的思想,在窗函 数中引入一个尺度因子,从而得到一种具有尺度伸缩且震荡衰减的基函数,如图 5.2所示, 即 Morlet 小波。然而该方法缺乏良好的重构性质,遭受了一些学者的质疑。在其好友数学 家 Grossman 的帮助下,两人将分析方法完善,诞生了小波分析的雏形。 随后,在 Meyer,Mallat,Daubechies 等学者的工作推动之下,小波分析快速发展起 来。特别是多分辨分析(multiresolution analysis,MRA)理论的建立,使得小波变换具有 离散化算法,并同工程中广泛使用的滤波器组联系起来,促进了小波变换在工程中的应用。 小波分析融合了应用数学、物理学、电子工程、计算机科学、信息科学等学科知识,成为 一门新兴的学科分支,在学科发展史上具有里程碑式的意义。 à Gabor 变换是指高斯窗的短时傅里叶变换,该变换由 Gabor 于 1946 年提出。 图 5.1 人造地震数据 图 5.2 Morlet 小波 概括来讲,小波变换可分为连续小波变换(continous wavelet transform,CWT)和离 散小波变换(discrete wavelet transform,DWT),两者的区别在于参数是否连续。连续小 波变换定义为 Wf(s, u) = ∫∞ .∞ f(t) 1 √s ψ. t . u s dt (5.1.1) 式中,ψ(t) 即为小波函数,. 表示复共轭,s > 0 为尺度因子,u 为平移因子,两者均为 实数。 连续小波变换将信号映射为二维时间-尺度平面。当尺度因子较大时,反映的是信号的 整体信息;反之,当尺度因子较小时,则能够刻画信号的局部信息。这种尺度伸缩性质是 小波变换最具特色之处。恰是因为如此,小波变换被形象地称为“数学显微镜”。 实际应用中通常需要将尺度因子和平移因子离散化,若以二进制对尺度因子进行离散 化,即 s = 1/2j , j ∈ Z,同时平移因子 k 为整数,则得到离散小波变换: Wf(j, k) = ∫∞ .∞ f(t)√2jψ.(2jt . k)dt (5.1.2) 本书主要讨论离散小波变换。稍后会看到,离散小波变换与滤波器组具有密切联系,它 可以通过两通道滤波器组来实现。 5.2 短时傅里叶变换与滤波器组 5.2.1 短时傅里叶变换的概念 在介绍小波变换之前,首先回顾短时傅里叶变换,并通过滤波器组的观点阐释短时傅 里叶变换的实现过程。 短时傅里叶变换的基本思想是在傅里叶变换的基础上,引入一个(时间)窗函数,使 得变换能够刻画信号的时频局部特征。设信号为 f(t),窗函数为 g(t),短时傅里叶变换定 129 义为 Sf(ω, u) = ∫R f(t)e.jωtg.(t . u)dt = .f(t), ejωtg(t . u). (5.2.1) 式中,ω 为频率变量à;u 为窗函数的中心位置。由此可见,短时傅里叶变换将信号映射为 二维时频平面,从而能够提供信号在某段时间或某个时刻的频率信息。 窗函数的选取对短时傅里叶变换至关重要。假设对信号 f(t) 在时刻 t = τ 附近的频率 感兴趣,最简单的方法是取矩形窗函数: gτ (t) =8> <> : 1 |Iτ | , t ∈ Iτ 0, 其他 (5.2.2) 式中,Iτ 为以 τ 为中心的有限区间,|Iτ | 为区间长度。此时,短时傅里叶变换即是对 Iτ 这 段时间内的信号作傅里叶变换: Sf(ω, τ ) = 1 |Iτ | ∫Iτ f(t)e.jωtdt 显然,|Iτ | 越小越能反映信号的局部信息。当 |Iτ | → 0 时,gτ (t) → δ(t . τ )。利用 δ-函数 的筛选性质可知 Sf(ω, τ ) = ∫R f(t)δ(t . τ )e.jωtdt = f(τ )e.jωτ 由此可见,当窗函数为 δ-函数时,时间分辨率极高,但失去了频率分辨能力。 进一步分析,窗函数可视为对原始信号在某个时段内的加权。为了突出信号的时间局 部性,一个自然的想法是窗函数在中心时刻 t = τ 的权值应当最大,而随着距中心位置的 距离增大,权值逐渐衰减乃至趋向于零。显然,由于矩形窗函数的权重是相等的,因此局 部刻画能力有限。Gabor 在 1946 年提出了利用具有无穷光滑(可微)的高斯函数作为窗 函数: gσ(t) = 1 √2πσ exp. t2 2σ2 (5.2.3) 以高斯函数为窗函数的短时傅里叶变换又称为 Gabor 变换。由于时域的高斯函数在频域依 然为高斯函数,即 1 √2πσ exp. t2 2σ2 F ←→ exp. σ2ω2 2 因此采用高斯窗函数在时域和频域均具有较好的局部刻画能力。 à 为了便于书写,本章频率变量均采用 ω 表示,对其物理意义(真实频率或归一化频率)可结合变换定义来理解。 130 此外,B 样条(B-spline)函数也可用于窗函数。m 阶 B 样条函数定义为 Nm(t) = Nm.1(t) . N1(t) (5.2.4) 其中,N1(t) 为 1 阶 B 样条: N1(t) =8<: 1, 0 < t < 1 0, 其他 (5.2.5) m 阶 B 样条是 m.1 阶分段光滑的(存在 m.1 阶导数),且具有紧支集 [0,m]à,图 5.3画 出了 3 阶以内的 B 样条函数。 图 5.3 B 样条函数 根据傅里叶变换的卷积定理: f(t)g(t) F ←→ 1 2π . f(ω) . .g(ω) (5.2.6) 这里用“ . ”表示信号的傅里叶变换。可见,加窗信号的频谱相当于对原始信号的频谱进 行了“加权组合”。我们希望加窗信号的频谱与原始信号的频谱尽可能接近。这意味着 .g(ω) 的频宽应尽可能窄,最理想情况为 δ(ω),此时两者完全相同。然而根据傅里叶变换的尺度 性质: gs(t) = 1 √s g t s F ←→ .gs(ω) = √s.g(sω) (5.2.7) 频宽变小意味着时宽变大,故失去了时域局部刻画能力。反之,时宽变小则频宽变大,加 窗信号的频谱变得更加模糊。以矩形窗函数为例,如图 5.4 所示,设时宽为 2T,它对应的 à 称集合 {t : f(t) .= 0} 为函数 f 的支撑集(support)。如果该集合是闭的,则称为紧(compact)支集。 131 频域为 sinc 函数,频宽(主瓣宽度)为 2π/T,显然两者成反比。这说明,时宽与频宽存 在制约关系。 图 5.4 时宽与频宽的关系 也可从时频分析的角度来描述时频制约关系。设窗函数与其傅里叶变换 g F ←→ .g,定义 时域和频域的中心位置分别为 t0 = 1 ∥g∥2 ∫∞ .∞ t|g(t)|2dt (5.2.8) ω0 = 1 2π∥.g∥2 ∫∞ .∞ ω|.g(ω)|2dω (5.2.9) 时宽和频宽分别为 σt = 1 ∥g∥2 ∫∞ .∞ (t . t0)2|g(t)|2dt1/2 (5.2.10) σω = 1 2π∥.g∥2 ∫∞ .∞ (ω . ω0)2|.g(ω)|2dω1/2 (5.2.11) 根据不确定性原理(uncertainty principle)[81],时宽与频宽的乘积具有如下关系: σtσω . 1 2 (5.2.12) 当且仅当 f 为高斯函数时,上式取等号。这说明两者不可能同时充分地小。 综合上述分析可知,对于短时傅里叶变换,一旦窗函数取定,其时宽与频宽也就固定 下来,因此时频分辨率也是固定的。然而实际中更希望时频分辨率是可调节的。具体来说, 通常信号的高频信息主要体现在变化比较剧烈的部分,这时希望时宽窄一些,以便刻画这 种短时间内的突变信息;而信号的低频信息主要蕴含在变化比较平缓的部分,这时时宽可 132 以宽一些,以反映信号整体的信息。短时傅里叶变换不具备这种特性。而小波变换通过引 入一个尺度因子,使得变换具有尺度伸缩的功能,这样就克服了短时傅里叶变换的不足。根 据连续小波定义式(5.1.1) 及时频尺度性质,小波在低频(大尺度)部分时宽较大、频宽较 窄,而在高频(小尺度)部分恰好反之。图 5.5 画出了四类不同表示在时频平面上的划分, 其中图 5.5(a),图 5.5(b)分别为时域和频域表示,两者不具备时频局部化能力。短时傅 里叶变换的时频单元是固定的,如图 5.5(c)所示。而小波变换的时频单元随尺度伸缩变 化,如图 5.5(d)所示,因而更适合分析非平稳信号。有关时频分析的更多内容不在本书 的讨论范围之内,感兴趣的读者可参阅相关论著[81-82]。 图 5.5 四种表示的时频单元 5.2.2 短时傅里叶变换与分析滤波器组 本节分析短时傅里叶变换与滤波器组的关系。已知离散时间信号为 x[n],定义离散时 间短时傅里叶变换(DT-STFT)为: X(ejω,mD) =Xn x[n]w.[n . mD]e.jnω (5.2.13) 式中,ω 为归一化角频率;w[n.mD] 是以 t = mDT 为中心的窗函数à。由于窗函数一般 为实的,故共轭可以省略。为了保证时域采样信息不丢失,通常假设窗函数的宽度 L . D, à 这里 t = mDT 以连续时间为单位,其中 T 为采样间隔。但对于离散时间信号,也可以忽略采样间隔。 133 即相邻窗函数允许有重叠部分。图 5.6 给出了当窗函数为三角窗,且 L = D 时的示意图。 图 5.6 三角窗示意图 离散时间短时傅里叶变换的实现过程可以从滤波器组的角度来阐释,其中包括低通滤 波与带通滤波两种实现过程。下面进行详细介绍。 1. 低通滤波实现 为了便于分析,不妨先将 ω 取值固定,记 ω = ωk,假设窗函数为实的,将式(5.2.13)重 新整理为 X(ejωk ,mD) =Xn ..x[n]e.jnωkw[n . mD] (5.2.14) 记 sk[n] = x[n]e.jnωk,则 sk[n] 是 x[n] 的复指数调制,两者的频谱关系为 Sk(ejω) = X(ej(ω+ωk)) 若 X(ejω) 的中心频率为零,则 Sk(ejω) 相当于将前者搬移到中心频率位于 ω = .ωk 的 位置。 继续将式(5.2.14)改写为 X(ejωk ,mD) =Xn sk[n] ˉ w[mD . n] = (sk . ˉ w)[mD] (5.2.15) 式中, ˉ w[n] = w[.n]。 式(5.2.15)可以理解为信号 sk[n] 与 ˉ w[n] 进行卷积,随后再进行 D 倍抽取,过程如 图 5.7 所示。 图 5.7 短时傅里叶变换的低通滤波实现过程 下面分析式(5.2.15)的物理意义。根据卷积定理, sk[n] . ˉ w[n] DTFT ←...→ Sk(ejω) ˉW (ejω) 134 假设 ˉ w[n] 关于 n = 0 对称(如图 5.6 所示的三角窗),则 ˉW (ejω) 亦关于 ω = 0 对称,其 作用类似于低通滤波器。Sk(ejω) 与 ˉW (ejω) 相乘即滤出 Sk(ejω) 在 ω = 0 附近的频率成 分。又由于 Sk(ejω) = X(ej(ω+ωk)),实际上滤出的是 X(ejω) 在 ω = ωk 附近的频率成分。 图 5.8 给出了上述过程的示意图。 图 5.8 低通滤波实现过程示意图 上述分析过程对任意取值的 ω 都成立。由于离散时间短时傅里叶变换的频谱是以 2π 为周期的,故通常只需考虑一个周期即可。现不妨取 ωk = 2πk/D(0 . k . D . 1),此时 短时傅里叶变换恰好构成一个 D 通道的均匀滤波器组,结构如图 5.9所示,其中每条支路 滤出的是信号 x[n] 在 t = mDT,ω = ωk 附近的频率成分。由此可见,短时傅里叶变换具 有频谱分析的作用,又称为频谱分析器。 图 5.9 短时傅里叶变换分析滤波器组(低通滤波实现) 2. 带通滤波实现 短时傅里叶变换还可以通过带通滤波的方式来实现。与上面的分析类似,令 ω = ωk, 将式(5.2.13)整理为如下形式: 135 X(ejωk ,mD) =Xn x[n]w[n . mD]e.jnωk = e.jmDωkXn x[n]w[n . mD]e.j(n.mD)ωk = e.jmDωkXn x[n] ˉ w[mD . n]ej(mD.n)ωk = e.jmDωk (x . rk)[mD] (5.2.16) 式中,rk[n] = ˉ w[n]ejnωk = w[.n]ejnωk。 式(5.2.16)的实现过程如图 5.10 所示,下面分析其物理意义。假设 ˉ w[n] 依然为低通滤 波器,则 rk[n] 为带通滤波器,中心频率位于 ωk。信号 x[n] 经过带通滤波再经 e.jnωk 调 制,即将频谱中心移至原点,该过程如图 5.11 所示。对比低通滤波的结果可知,两种实现 过程完全等价。 图 5.10 短时傅里叶变换的带通滤波实现过程 图 5.11 带通滤波实现过程示意图 进一步,若取 ωk = 2πk/D(k = 0, 1, · · · ,D . 1),则上述过程构成一个 D 通道均匀滤 波器组,结构如图 5.12 所示。 综合上述分析可知,无论是低通滤波实现还是带通滤波实现,其中关键在于将短时傅 里叶变换式转化为卷积的形式,即式(5.2.15)或式(5.2.16)。相应地, ˉ w[n] 可视为低通滤波 器,而 rk[n] 则视为带通滤波器。两种实现方式本质上都是提取信号在 t = mDT,ω = ωk 136 附近的频率成分。而随着 m 与 k 的变化,X(ejωk ,mD) 形成了一幅二维时频谱,如图 5.13 所示。 图 5.12 短时傅里叶变换分析滤波器组(带通滤波实现) 图 5.13 短时傅里叶变换时频谱 5.2.3 逆短时傅里叶变换与综合滤波器组 本节讨论信号重构过程。假设窗函数为实的,记加窗信号 xm[n] := x[n]w[n.mD],注 意到它与时频谱的关系为:xm[n] DTFT ←...→ X(ejω,mD),根据逆离散时间傅里叶变换可知 xm[n] = 1 2π ∫2π X(ejω,mD)ejnωdω (5.2.17) 因此接下来的问题便是如何根据加窗信号 xm[n] 重构原始信号 x[n]。注意到 Xm xm[n]wa[n . mD] =Xm x[n]wa+1[n . mD] = x[n]Xm wa+1[n . mD] (5.2.18) 式中,a 为任意常数。 若 Xm wa+1[n . mD] .= 0 (5.2.19) 137