本章要点 
. 什么是小波变换?它与短时傅里叶变换有何联系和区别? 
. 短时傅里叶变换的基本原理是什么?它与滤波器组有何联系? 
. 什么是 Haar 小波变换?如何实现 Haar 小波变换? 
. 离散小波变换与滤波器组有何联系? 
. 什么是小波提升变换?提升变换有哪些优势? 
5.1 小波的由来 
小波(wavelet)一词源自法语“ondelette”,直译即“很小的波形”。该名称最初由法国 
地球物理学家 Morlet 命名。20 世纪 80 年代,Morlet 在分析人造地震数据时遇到了一个 
问题。人造地震数据是典型的非平稳信号,如图 5.1 所示,信号在起始时刻剧烈震荡,随后 
快速衰减。传统的傅里叶变换只能提供信号的频率信息,无法准确给出某个频率发生的时 
刻;而短时傅里叶变换(short-time Fourier transform,STFT)虽然能够刻画局部时频信 
息,但由于时频分辨率固定,依然具有局限性。Morlet 借鉴 Gabor 变换à的思想,在窗函 
数中引入一个尺度因子,从而得到一种具有尺度伸缩且震荡衰减的基函数,如图 5.2所示, 
即 Morlet 小波。然而该方法缺乏良好的重构性质,遭受了一些学者的质疑。在其好友数学 
家 Grossman 的帮助下,两人将分析方法完善,诞生了小波分析的雏形。 
随后,在 Meyer,Mallat,Daubechies 等学者的工作推动之下,小波分析快速发展起 
来。特别是多分辨分析(multiresolution analysis,MRA)理论的建立,使得小波变换具有 
离散化算法,并同工程中广泛使用的滤波器组联系起来,促进了小波变换在工程中的应用。 
小波分析融合了应用数学、物理学、电子工程、计算机科学、信息科学等学科知识,成为 
一门新兴的学科分支,在学科发展史上具有里程碑式的意义。 
à Gabor 变换是指高斯窗的短时傅里叶变换,该变换由 Gabor 于 1946 年提出。
图 5.1 人造地震数据 图 5.2 Morlet 小波 
概括来讲,小波变换可分为连续小波变换(continous wavelet transform,CWT)和离 
散小波变换(discrete wavelet transform,DWT),两者的区别在于参数是否连续。连续小 
波变换定义为 
Wf(s, u) = ∫∞
.∞ 
f(t) 
1 
√s
ψ. t . u 
s dt (5.1.1) 
式中,ψ(t) 即为小波函数,. 表示复共轭,s > 0 为尺度因子,u 为平移因子,两者均为 
实数。
连续小波变换将信号映射为二维时间-尺度平面。当尺度因子较大时,反映的是信号的 
整体信息;反之,当尺度因子较小时,则能够刻画信号的局部信息。这种尺度伸缩性质是 
小波变换最具特色之处。恰是因为如此,小波变换被形象地称为“数学显微镜”。 
实际应用中通常需要将尺度因子和平移因子离散化,若以二进制对尺度因子进行离散 
化,即 s = 1/2j , j ∈ Z,同时平移因子 k 为整数,则得到离散小波变换: 
Wf(j, k) = ∫∞
.∞ 
f(t)√2jψ.(2jt . k)dt (5.1.2) 
本书主要讨论离散小波变换。稍后会看到,离散小波变换与滤波器组具有密切联系,它 
可以通过两通道滤波器组来实现。 
5.2 短时傅里叶变换与滤波器组 
5.2.1 短时傅里叶变换的概念 
在介绍小波变换之前,首先回顾短时傅里叶变换,并通过滤波器组的观点阐释短时傅 
里叶变换的实现过程。 
短时傅里叶变换的基本思想是在傅里叶变换的基础上,引入一个(时间)窗函数,使 
得变换能够刻画信号的时频局部特征。设信号为 f(t),窗函数为 g(t),短时傅里叶变换定 
129
义为 
Sf(ω, u) = ∫R 
f(t)e.jωtg.(t . u)dt = .f(t), ejωtg(t . u). (5.2.1) 
式中,ω 为频率变量à;u 为窗函数的中心位置。由此可见,短时傅里叶变换将信号映射为 
二维时频平面,从而能够提供信号在某段时间或某个时刻的频率信息。 
窗函数的选取对短时傅里叶变换至关重要。假设对信号 f(t) 在时刻 t = τ 附近的频率 
感兴趣,最简单的方法是取矩形窗函数: 
gτ (t) =8>
<>
: 
1 
|Iτ |
, t ∈ Iτ 
0, 其他 
(5.2.2) 
式中,Iτ 为以 τ 为中心的有限区间,|Iτ | 为区间长度。此时,短时傅里叶变换即是对 Iτ 这 
段时间内的信号作傅里叶变换:
Sf(ω, τ ) = 
1 
|Iτ | ∫Iτ 
f(t)e.jωtdt 
显然,|Iτ | 越小越能反映信号的局部信息。当 |Iτ | → 0 时,gτ (t) → δ(t . τ )。利用 δ-函数 
的筛选性质可知 
Sf(ω, τ ) = ∫R 
f(t)δ(t . τ )e.jωtdt = f(τ )e.jωτ 
由此可见,当窗函数为 δ-函数时,时间分辨率极高,但失去了频率分辨能力。 
进一步分析,窗函数可视为对原始信号在某个时段内的加权。为了突出信号的时间局 
部性,一个自然的想法是窗函数在中心时刻 t = τ 的权值应当最大,而随着距中心位置的 
距离增大,权值逐渐衰减乃至趋向于零。显然,由于矩形窗函数的权重是相等的,因此局 
部刻画能力有限。Gabor 在 1946 年提出了利用具有无穷光滑(可微)的高斯函数作为窗 
函数: 
gσ(t) = 
1 
√2πσ 
exp. 
t2 
2σ2 (5.2.3) 
以高斯函数为窗函数的短时傅里叶变换又称为 Gabor 变换。由于时域的高斯函数在频域依 
然为高斯函数,即 
1 
√2πσ 
exp. 
t2 
2σ2 F ←→ exp.
σ2ω2 
2  
因此采用高斯窗函数在时域和频域均具有较好的局部刻画能力。 
à 为了便于书写,本章频率变量均采用 ω 表示,对其物理意义(真实频率或归一化频率)可结合变换定义来理解。 
130
此外,B 样条(B-spline)函数也可用于窗函数。m 阶 B 样条函数定义为 
Nm(t) = Nm.1(t) . N1(t) (5.2.4) 
其中,N1(t) 为 1 阶 B 样条: 
N1(t) =8<:
1, 0 < t < 1 
0, 其他 
(5.2.5) 
m 阶 B 样条是 m.1 阶分段光滑的(存在 m.1 阶导数),且具有紧支集 [0,m]à,图 5.3画 
出了 3 阶以内的 B 样条函数。 
图 5.3 B 样条函数 
根据傅里叶变换的卷积定理: 
f(t)g(t) F ←→ 
1 
2π 
. f(ω) . .g(ω) (5.2.6) 
这里用“ . ”表示信号的傅里叶变换。可见,加窗信号的频谱相当于对原始信号的频谱进 
行了“加权组合”。我们希望加窗信号的频谱与原始信号的频谱尽可能接近。这意味着 .g(ω) 
的频宽应尽可能窄,最理想情况为 δ(ω),此时两者完全相同。然而根据傅里叶变换的尺度 
性质: 
gs(t) = 
1 
√s
g t
s F ←→ .gs(ω) = √s.g(sω) (5.2.7) 
频宽变小意味着时宽变大,故失去了时域局部刻画能力。反之,时宽变小则频宽变大,加 
窗信号的频谱变得更加模糊。以矩形窗函数为例,如图 5.4 所示,设时宽为 2T,它对应的 
à 称集合 {t : f(t) .= 0} 为函数 f 的支撑集(support)。如果该集合是闭的,则称为紧(compact)支集。 
131
频域为 sinc 函数,频宽(主瓣宽度)为 2π/T,显然两者成反比。这说明,时宽与频宽存 
在制约关系。 
图 5.4 时宽与频宽的关系 
也可从时频分析的角度来描述时频制约关系。设窗函数与其傅里叶变换 g F ←→ .g,定义 
时域和频域的中心位置分别为 
t0 = 
1 
∥g∥2 ∫∞
.∞ 
t|g(t)|2dt (5.2.8) 
ω0 = 
1 
2π∥.g∥2 ∫∞
.∞ 
ω|.g(ω)|2dω (5.2.9) 
时宽和频宽分别为 
σt =  1 
∥g∥2 ∫∞
.∞
(t . t0)2|g(t)|2dt1/2 
(5.2.10) 
σω =  1 
2π∥.g∥2 ∫∞
.∞
(ω . ω0)2|.g(ω)|2dω1/2 
(5.2.11) 
根据不确定性原理(uncertainty principle)[81],时宽与频宽的乘积具有如下关系: 
σtσω . 1
2 
(5.2.12) 
当且仅当 f 为高斯函数时,上式取等号。这说明两者不可能同时充分地小。 
综合上述分析可知,对于短时傅里叶变换,一旦窗函数取定,其时宽与频宽也就固定 
下来,因此时频分辨率也是固定的。然而实际中更希望时频分辨率是可调节的。具体来说, 
通常信号的高频信息主要体现在变化比较剧烈的部分,这时希望时宽窄一些,以便刻画这 
种短时间内的突变信息;而信号的低频信息主要蕴含在变化比较平缓的部分,这时时宽可 
132
以宽一些,以反映信号整体的信息。短时傅里叶变换不具备这种特性。而小波变换通过引 
入一个尺度因子,使得变换具有尺度伸缩的功能,这样就克服了短时傅里叶变换的不足。根 
据连续小波定义式(5.1.1) 及时频尺度性质,小波在低频(大尺度)部分时宽较大、频宽较 
窄,而在高频(小尺度)部分恰好反之。图 5.5 画出了四类不同表示在时频平面上的划分, 
其中图 5.5(a),图 5.5(b)分别为时域和频域表示,两者不具备时频局部化能力。短时傅 
里叶变换的时频单元是固定的,如图 5.5(c)所示。而小波变换的时频单元随尺度伸缩变 
化,如图 5.5(d)所示,因而更适合分析非平稳信号。有关时频分析的更多内容不在本书 
的讨论范围之内,感兴趣的读者可参阅相关论著[81-82]。 
图 5.5 四种表示的时频单元 
5.2.2 短时傅里叶变换与分析滤波器组 
本节分析短时傅里叶变换与滤波器组的关系。已知离散时间信号为 x[n],定义离散时 
间短时傅里叶变换(DT-STFT)为: 
X(ejω,mD) =Xn 
x[n]w.[n . mD]e.jnω (5.2.13) 
式中,ω 为归一化角频率;w[n.mD] 是以 t = mDT 为中心的窗函数à。由于窗函数一般 
为实的,故共轭可以省略。为了保证时域采样信息不丢失,通常假设窗函数的宽度 L . D, 
à 这里 t = mDT 以连续时间为单位,其中 T 为采样间隔。但对于离散时间信号,也可以忽略采样间隔。 
133
即相邻窗函数允许有重叠部分。图 5.6 给出了当窗函数为三角窗,且 L = D 时的示意图。 
图 5.6 三角窗示意图 
离散时间短时傅里叶变换的实现过程可以从滤波器组的角度来阐释,其中包括低通滤 
波与带通滤波两种实现过程。下面进行详细介绍。 
1. 低通滤波实现 
为了便于分析,不妨先将 ω 取值固定,记 ω = ωk,假设窗函数为实的,将式(5.2.13)重 
新整理为 
X(ejωk ,mD) =Xn ..x[n]e.jnωkw[n . mD] (5.2.14) 
记 sk[n] = x[n]e.jnωk,则 sk[n] 是 x[n] 的复指数调制,两者的频谱关系为 
Sk(ejω) = X(ej(ω+ωk)) 
若 X(ejω) 的中心频率为零,则 Sk(ejω) 相当于将前者搬移到中心频率位于 ω = .ωk 的 
位置。
继续将式(5.2.14)改写为 
X(ejωk ,mD) =Xn 
sk[n] ˉ w[mD . n] = (sk . ˉ w)[mD] (5.2.15) 
式中, ˉ w[n] = w[.n]。 
式(5.2.15)可以理解为信号 sk[n] 与 ˉ w[n] 进行卷积,随后再进行 D 倍抽取,过程如 
图 5.7 所示。 
图 5.7 短时傅里叶变换的低通滤波实现过程 
下面分析式(5.2.15)的物理意义。根据卷积定理, 
sk[n] . ˉ w[n] 
DTFT 
←...→ Sk(ejω) ˉW
(ejω) 
134
假设 ˉ w[n] 关于 n = 0 对称(如图 5.6 所示的三角窗),则 ˉW
(ejω) 亦关于 ω = 0 对称,其 
作用类似于低通滤波器。Sk(ejω) 与 ˉW
(ejω) 相乘即滤出 Sk(ejω) 在 ω = 0 附近的频率成 
分。又由于 Sk(ejω) = X(ej(ω+ωk)),实际上滤出的是 X(ejω) 在 ω = ωk 附近的频率成分。 
图 5.8 给出了上述过程的示意图。 
图 5.8 低通滤波实现过程示意图 
上述分析过程对任意取值的 ω 都成立。由于离散时间短时傅里叶变换的频谱是以 2π 
为周期的,故通常只需考虑一个周期即可。现不妨取 ωk = 2πk/D(0 . k . D . 1),此时 
短时傅里叶变换恰好构成一个 D 通道的均匀滤波器组,结构如图 5.9所示,其中每条支路 
滤出的是信号 x[n] 在 t = mDT,ω = ωk 附近的频率成分。由此可见,短时傅里叶变换具 
有频谱分析的作用,又称为频谱分析器。 
图 5.9 短时傅里叶变换分析滤波器组(低通滤波实现) 
2. 带通滤波实现 
短时傅里叶变换还可以通过带通滤波的方式来实现。与上面的分析类似,令 ω = ωk, 
将式(5.2.13)整理为如下形式: 
135
X(ejωk ,mD) =Xn 
x[n]w[n . mD]e.jnωk 
= e.jmDωkXn 
x[n]w[n . mD]e.j(n.mD)ωk 
= e.jmDωkXn 
x[n] ˉ w[mD . n]ej(mD.n)ωk 
= e.jmDωk (x . rk)[mD] (5.2.16) 
式中,rk[n] = ˉ w[n]ejnωk = w[.n]ejnωk。 
式(5.2.16)的实现过程如图 5.10 所示,下面分析其物理意义。假设 ˉ w[n] 依然为低通滤 
波器,则 rk[n] 为带通滤波器,中心频率位于 ωk。信号 x[n] 经过带通滤波再经 e.jnωk 调 
制,即将频谱中心移至原点,该过程如图 5.11 所示。对比低通滤波的结果可知,两种实现 
过程完全等价。 
图 5.10 短时傅里叶变换的带通滤波实现过程 
图 5.11 带通滤波实现过程示意图 
进一步,若取 ωk = 2πk/D(k = 0, 1, · · · ,D . 1),则上述过程构成一个 D 通道均匀滤 
波器组,结构如图 5.12 所示。 
综合上述分析可知,无论是低通滤波实现还是带通滤波实现,其中关键在于将短时傅 
里叶变换式转化为卷积的形式,即式(5.2.15)或式(5.2.16)。相应地, ˉ w[n] 可视为低通滤波 
器,而 rk[n] 则视为带通滤波器。两种实现方式本质上都是提取信号在 t = mDT,ω = ωk 
136
附近的频率成分。而随着 m 与 k 的变化,X(ejωk ,mD) 形成了一幅二维时频谱,如图 5.13 
所示。 
图 5.12 短时傅里叶变换分析滤波器组(带通滤波实现) 
图 5.13 短时傅里叶变换时频谱 
5.2.3 逆短时傅里叶变换与综合滤波器组 
本节讨论信号重构过程。假设窗函数为实的,记加窗信号 xm[n] := x[n]w[n.mD],注 
意到它与时频谱的关系为:xm[n] 
DTFT 
←...→ X(ejω,mD),根据逆离散时间傅里叶变换可知 
xm[n] = 
1 
2π ∫2π 
X(ejω,mD)ejnωdω (5.2.17) 
因此接下来的问题便是如何根据加窗信号 xm[n] 重构原始信号 x[n]。注意到 
Xm 
xm[n]wa[n . mD] =Xm 
x[n]wa+1[n . mD] = x[n]Xm 
wa+1[n . mD] (5.2.18) 
式中,a 为任意常数。 
若 
Xm 
wa+1[n . mD] .= 0 (5.2.19) 
137