第5章〓信源编码


前面介绍了信源熵和信息率失真函数的概念，了解了传送信源信息只需具有信源极限熵或信息率失真函数大小的信息率。但是实际通信系统中，用于传送信源信息的信息率远大于此，那么能否达到或接近像信源熵或信息率失真函数这样的最小信息率，就是编码定理要回答的问题之一。编码分为信源编码和信道编码，其中信源编码又分为无失真和限失真。由于这些定理都要求符号数很大，才能使信息率接近规定的值，因而称这些定理为极限定理。一般称无失真信源编码定理为第一极限定理，称信道编码定理(包括离散和连续信道)为第二极限定理，称限失真信源编码定理为第三极限定理。完善这些定理是香农信息论的主要内容。下面分别讨论这三大定理。

信源符号之间分布不均匀，且存在相关性，使信源存在冗余度，信源编码的主要任务是减少冗余，提高编码效率。具体来说，就是针对信源输出符号序列的统计特性，寻找一定的方法，将信源输出符号序列变换为最短的码字序列。信源编码的基本途径有两个： 使序列中的各个符号尽可能互相独立，即解除相关性； 使编码中各个符号出现的概率尽可能相等，即概率均匀化。

信源编码的基础是信息论中的两个编码定理： 无失真编码定理和限失真编码定理。前者是可逆编码的基础。可逆是指当信源符号转换为代码后，可由代码无失真地恢复原信源符号。当已知信源符号的概率特性时，可计算它的符号熵，即每个信源符号载有的信息量。编码定理不但证明了必定存在一种编码方法，使代码的平均长度可任意接近且不能低于符号熵，而且阐明了实现该目标的途径，就是使概率与码长匹配。无失真编码或可逆编码只适用于离散信源。对于连续信源，编成代码后无法无失真地恢复原来的连续值，因为连续信源输出符号的取值可有无限多个。此时只能根据率失真编码定理在失真受限的情况下进行限失真编码。信源编码定理出现后，编码方法趋于合理化。本章讨论离散信源编码，首先从无失真编码定理出发讨论香农码，其次介绍限失真编码定理，最后简单介绍一些常用的信源编码方法。


5．1编码的概念



将信源消息分为若干组，即符号序列xi，xi=(xi1,xi2,…,xil,…,xiL)，序列中的每个符号取自符号集A，xiL∈A={a1,a2,…,ai,…,an}。而每个符号序列xi依照固定的码表映射为一个码字yi，这样的码称为分组码，有时也称块码，如图51所示，只有分组码才有对应的码表，而非分组码不存在码表。

如果信源输出的符号序列长度L=1，



图51信源编码器示意图


信源概率空间为

XP=a1a2…anp(a1)p(a2)…p(an)


需要传输这样的信源符号，常用的一种信道是二元信道，它的信道基本符号集为{0，1}。若将信源X通过这样的二元信道传输，就必须将信源符号ai变换为由0、1符号组成的码符号序列，这个过程就是信源编码。可用不同的码符号序列，如表51所示。



表51码符号序列



信源符号ai
符号出现概率p(ai)
码1
码2
码3
码4
码5

a11/2000011
a21/40111101001
a31/8100000100001
a41/811110110000001



一般情况下，码可分为两类： 一类是固定长度的码，码中所有码字的长度相同，如表51中的码1就是定长码； 另一类是可变长度的码，码中码字的长度不同，如表51中码1之外的其他码都是变长码。

采用分组编码方法，需要分组码具有某些属性，以保证接收端能够迅速准确地将码译出。下面首先讨论分组码的一些直观属性。

1) 奇异码和非奇异码

若信源符号和码字是一一对应的，则该码为非奇异码，反之为奇异码。例如，表51中的码2为奇异码，码3为非奇异码。


2) 唯一可译码

任意有限长的码元序列，只能被唯一地分割为一个个的码字，称为唯一可译码。例如，{0，10，11}是一种唯一可译码。因为任意一串有限长码序列，如100111000，只能被分割为10，0，11，10，0，0，任何其他分割法都会产生一些非定义的码字。显然，奇异码不是唯一可译码，而非奇异码中有非唯一可译码和唯一可译码。表51中的码4是唯一可译码，而码3不是唯一可译码。例如，10000100是由码3的(10，0，0，01，00)产生的码流，译码时可有多种分割方法，如10，0，00，10，0，此时就产生了歧义。

3) 非即时码和即时码

唯一可译码又分为非即时码和即时码。如果接收端收到一个完整的码字后，不能立即译码，还需等下一个码字开始接收后才能判断是否可以译码，则这样的码称为非即时码。表51中码4是非即时码，而码5是即时码。码5中只要收到符号1就表示该码字已完整，可以立即译码。即时码又称非延长码，任意一个码字都不是其他码字的前缀部分，有时称为异前缀码。在延长码中，有的码是唯一可译的，主要取决于码的总体结构，例如，表51中码4的延长码就是唯一可译的。

综上所述，可对码进行如下分类：






通常可用码树表示各码字的构成。m进制的码树如图52所示。图52(a)是二进制码树，图52(b)是三进制码树。其中A点是树根，分为m个树枝，称为m进制码树。树枝的尽头是节点，中间节点生出树枝，终端节点安排码字。码树中自根部经过一个分枝到达m个节点，称为一级节点。二级节点的可能个数为m2，一般r级节点有mr个。图52(a)的码树是4节，有24=16个可能的终端节点。若将从每个节点发出的m个分枝分别标以0，1，…，m-1，则每个r级节点需用r个m元数字表示。如果指定某个r级节点为终端节点，表示一个信源符号，则该节点就不再延伸，相应的码字为从树根到此端点的分枝标号序列，其长度为r。这样构造的码满足即时码的条件。因为从树根到每个终端节点的路径均不相同，故一定满足对前缀的限制。如果有q个信源符号，就要在码树上选择q个终端节点，用相应的m元基本符号表示这些码字。由这样的方法构造的码称为树码，若树码的各个分支都延伸到最后一级端点，此时共有mr个码字，这样的码树称为满树，如图52(a)所示。否则称为非满树，如图52(b)所示，这时的码字就不是定长的了。总结上述码树与码字的对应关系，可得到如图53所示的关系图。




图52码树图





图53码树与码字对应的关系


用树的概念可导出唯一可译码存在的充分和必要条件，各码字的长度Ki应符合克劳夫特不等式(Kraft’s inequality)，即

∑ni=1m-Ki≤1(511)


其中，m是进制数，n是信源符号数。

上述不等式是唯一可译码存在的充要条件，必要性表现在如果是唯一可译码，则必定满足该不等式，如表51中的码1、码4和码5等都满足不等式； 充分性表现在如果满足该不等式，则这种码长的唯一可译码一定存在，但并不代表所有满足不等式的码一定是唯一可译码。所以说，该不等式是唯一可译码存在的充要条件，而不是唯一可译码的充要条件。

例51用二进制对符号集{a1，a2，a3，a4}进行编码，对应的码长分别为K1=1，K2=2，K3=2，K4=3，应用式(511)判断

∑4i=12-Ki=2-1+2-2+2-2+2-3=98>1



图54树码

因此不存在满足这种Ki的唯一可译码。可以用树码进行检查，由图54所示，要形成上述码字，必然在中间节点放置码字，若符号a1用“0”码，符号a2用“10”码，符号a3用“11”码，则符号a4只能是符号a2或a3编码的延长码。




如果将各码字长度改为K1=1，K2=2，K3=3，K4=3，则此时

∑4i=12-Ki=2-1+2-2+2-3+2-3=1


这种Ki的唯一可译码是存在的，如{0，10，110，111}。但是必须注意，克劳夫特不等式只用于说明唯一可译码是否存在，并不能作为唯一可译码的判据。如码字{0，10，010，111}，虽然满足克劳夫特不等式，但不是唯一可译码。

5．2无失真信源编码定理

若信源输出符号序列的长度L≥1，即

X=(X1,X2,…,Xl,…,XL)，Xl∈A={a1，a2，…，ai，…，an}


变换为由KL个符号组成的码序列(有时也称作码字，以下均用码字来表示)。

Y=(Y1,Y2,…,Yk,…,YKL)，Yk∈B={b1，b2，…，bj，…，bm}


变换的要求是能够无失真或无差错地由Y恢复X，也就是能正确地进行反变换或译码，同时希望传送Y时所需的信息率最小。由于Yk可取m种可能值，即平均每个符号输出的最大信息量为logm，KL长码字的最大信息量为KLlogm。用该码字表示L长的信源序列，则送出一个信源符号所需的二进制码字长度平均为=KLLlogm=1LlogM，其中M=mKL是Y所能编成的码字个数。所谓信息率最小，就是找到一种编码方式，使KLLlogm最小。然而上述最小信息率为多少，才能得到无失真的译码？若小于这个信息率是否还能无失真地译码？这就是无失真信源编码定理要研究的内容。无失真信源编码定理包括定长编码定理和变长编码定理，下面分别加以讨论。

5.2.1定长编码

在定长编码中，各码字长度Ki为定值，且Ki=KL。编码的目的是寻找最小KL值。要实现无失真的信源编码，不但要求信源符号Xi，i=1，2，…，q与码字Yi，i=1，2，…，q是一一对应的，而且要求由码字组成的码符号序列的逆变换也是唯一的。也就是说，由一个码表编出的任意一串有限长的码符号序列只能被唯一地译成对应的信源符号序列。

定长编码定理： 由L个符号组成的每个符号的熵为HL(X)的无记忆平稳信源符号序列X1,X2,…,Xl,…,XL，可用KL个符号Y1，Y2，…，Yk，…，YKL(每个符号有m种可能值)进行定长编码。对于任意ε>0，δ>0，只要

KLLlogm≥HL(X)+ε(521)


则当L足够大时，必可使译码差错小于δ； 反之，当

KLLlogm≤HL(X)-2ε(522)


时，译码差错一定为有限值，而当L足够大时，译码几乎必定出错。

这个定理的前半部分是正定理，后半部分为逆定理。定理证明略。

上述编码定理说明，当编码器容许的输出信息率，即每个信源符号必须输出的平均码长是

=KLLlogm(523)


时，只要>HL(X)，这种编码器可以做到几乎无失真，也就是接收端的译码差错概率接近零，条件是所取的符号数L足够大。

将上述定理的条件式(521)改写为

KLlogm>LHL(X)=H(X)(524)


上式大于号左边为KL长码字所能携带的最大信息量，右边为L长信源序列携带的信息量。于是上述定理表明，只要码字所能携带的信息量大于信源序列输出的信息量，就可以使传输几乎无失真，当然条件是L足够大。

反之，当<HL(X)时，不可能构成无失真的编码，也就是不可能做一种编码器，使接收端译码时差错概率趋于零。当=HL(X)时，为临界状态，可能无失真，也可能有失真。

例如，某信源有8种等概率符号，L=1，信源序列熵达到最大值

H1(X)=log28=3bit/符号


即该信源符号肯定可以用3bit的信息率进行无失真的编码。这就是说，如果采用二进制符号作为码字输出符号，Yk∈{0，1}，用3个bit就可以表示一个符号，即=3bit/符号=H1(X)。当信源符号输出概率不相等时，如p(ai)={0.4，0.18，0.1，0.1，0.07，0.06，0.05，0.04}，则此时H1(X)=2.55bit/符号，小于3bit。按常理，8种符号一定要用3bit(23=8)组成的码字表示才能区别开来，而用=HL(X)=2.55bit/符号表示时只有22.55=5.856种可能码字，还有部分符号没有对应的码字，信源一旦出现这些符号，就只能用其他码字替代，因而引起差错。差错发生的可能性取决于这些符号出现的概率。当L足够大时，有些符号序列发生的概率变得很小，使差错概率变得足够小。

设xi=(xi1,xi2,…,xil,…,xiL)是信源序列的样本矢量，xil∈{a1,a2,…,ai,…,an}，则共有nL种样本，将其分为两个互补的集Aε和ACε，集Aε中的元素(样本矢量)有与之对应的不同码字，而集ACε中的元素没有对应的输出码字，因而译码时会出现差错。如果允许一定的差错δ，则编码时只需对属于Aε中的Mε个样本矢量赋以相应的不同码字，即输出码字的总个数mK只要大于Mε就可以了。

在这种编码方式下，差错概率Pe即为集ACε中元素发生的概率p(ACε)，此时要求p(ACε)≤δ，因而ACε集中的样本都应是小概率事件。当L增大时，虽然样本数也随之增多，但小概率事件的概率更小，有望使p(ACε)更小。根据切比雪夫不等式可推得(推导从略，见参考文献［1］)

Pe≤σ2(X)Lε2(525)


式中，σ2(X)=E{［I(xi)-H(X)］2}为信源序列的自信息方差，ε为一正数。当σ2(X)和ε2均为定值时，只要L足够大，Pe可以小于任一正数δ，即σ2(X)Lε2≤δ，也就是当信源序列长度L满足

L≥σ2(X)ε2δ(526)


时，就能满足差错率要求。

说得具体一些，就是给定ε和δ后，式(526)规定了L的大小，计算所有可能的信源序列样本矢量的概率p(xi)，按概率大小排列，选用概率较大的xi作为Aε中的元素，直到p(Aε)≥1-δ，使p(ACε)≤δ。Aε中的元素分别用不同的码字表示，就完成了编码过程。如果取足够小的δ，就可几乎无差错地译码，而所需的信息率就不会超过HL(X)+ε。

在连续信源的情况下，由于信源的信息量趋于无限大，显然不能用离散符号序列Y完成无失真编码，而只能进行限失真编码。

定义

η=HL(X)


为编码效率，即信源的平均符号熵为HL(X)，采用平均符号码长编码所得的效率。编码效率总是小于1，且最佳编码效率为

η=HL(X)HL(X)+ε,ε>0(527)


编码定理从理论上阐明了编码效率接近1的理想编码器的存在性，使输出符号的信息率与信源熵之比接近1，即

HL(X)KLLlogm→1(528)


但要在实际中实现，必须取无限长(L→∞)的信源符号进行统一编码。这样做实际上是不可能的，因L非常大，无法实现。下面用例子来说明。

例52设离散无记忆信源概率空间为


XP=a1a2a3a4a5a6a7a80.40.180.10.10.070.060.050.04


信源熵为

H(X)=-∑8i=1pilogpi=2.55bit/符号


对信源符号采用定长二元编码，要求编码效率为η=90％，若取L=1，则可算出

=2.55÷90%=2.8bit/符号，22.88=6.96种


即每个符号用2.8bit进行定长二元编码，共有6.96种可能性，即使按7种可能性来算，信源符号中也有一种符号没有对应的码字，取概率最小的a8，差错概率为0.04，显然太大。现采用式(527)，有

η=H(X)H(X)+ε=0.90


可以得到ε=0.28

信源序列的自信息方差为

σ2(X)=D［I(xi)］=∑8i=1pi(logpi)2-［H(X)］2=1.32(bit)2


若要求译码错误概率δ≤10-6，由式(526)得

L≥σ2(X)ε2δ=1.320.282×10-6=1.68×107


由此可见，在对编码效率和译码错误概率的要求不太苛刻的情况下，需要L=1.68×107个信源符号一起进行编码，这对存储或处理技术的要求太高，目前还无法实现。

如果用3bit对上述信源的8个符号进行定长二元编码，L=1，则=H(X)+ε=3，可求得ε=0.45。此时译码无差错，即δ=0。在这种情况下，式(526)就不适用了。但此时编码效率只有η=2.553=85%。因此一般来说，当L有限时，高传输效率的定长码往往要引入一定的失真和错误，它不像变长码那样可实现无失真编码。

5.2.2变长编码

在变长编码中，码长Ki是变化的，可根据信源各个符号的统计特性，如概率大的符号用短码，例52中的a1、a2可用1bit或2bit，而概率小的a7、a8可用较长的码，这样在大量信源符号编成码后，平均每个信源符号所需的输出符号数就可以降低，从而提高编码效率。下面分别给出单个符号(L=1)和符号序列的变长编码定理。

单个符号变长编码定理： 若离散无记忆信源的符号熵为H(X)，每个信源符号用m进制码元进行变长编码，一定存在一种无失真编码方法，其码字平均长度满足下列不等式

H(X)logm≤<H(X)logm+1(529)


离散平稳无记忆序列变长编码定理： 对于平均符号熵为HL(X)的离散平稳无记忆信源，必存在一种无失真编码方法，使平均码长满足不等式

HL(X)≤<HL(X)+ε(5210)


其中，ε为任意小的正数。

可由式(529)推出式(5210)。设用m进制码元作变长编码，序列长度为L个信源符号，则由式(529)可以得到，序列平均码字长度L(单位： m进制符号/信源序列)满足下列不等式： 

LHL(X)logm≤L<LHL(X)logm+1


由于二进制平均码长为

=LLlogm


因此HL(X)≤<HL(X)+logmL


当L足够大时，可使logmL<ε，这就得到了式(5210)。

用变长编码可实现相当高的编码效率，一般要求的符号长度L可比定长编码小得多。由式(5210)可得编码效率的下界： 

η=HL(X)>HL(X)HL(X)+logmL(5211)


例如用二进制，m=2，log2m=1，仍用前面的例52，H(X)=2.55bit/符号，若要求η>90％，则

2.552.55+1L=0.9,L=10.28≈4


就可以了。

另外，由信源平均符号熵HL(X)与平均符号码长之比可以得到平均每个二元码符号所含的信息量，定义为信息传输效率R，单位是bit/二元码符号，即

R=HL(X)(5212)


例53设离散无记忆信源的概率空间为

XP=a1a23414


其信源熵为

H(X)=14log4+34log43=0.811bit/符号


用二元定长编码(0，1)构造一个即时码： a1→0,a2→1。这时平均码长

=1二元码符号/信源符号


编码效率

η=H(X)=0.811


信息传输效率

R=0.811bit/二元码符号


再对长度为2的信源序列进行变长编码(编码方法后面介绍)，其即时码如表52所示。



表52L=2时信源序列的变长编码




序列
序 列 概 率
即时码
a1a19/160
a1a23/1610
a2a13/16110
a2a21/16111


这个码的码字平均长度

2=916×1+316×2+316×3+116×3=2716二元码符号/信源序列


每一单个符号的平均码长

=22=2732二元码符号/信源符号

其编码效率

η2=32×0.81127≈0.961


信息传输效率

R2=0.961bit/二元码符号


可见编码复杂了一些，但信息传输效率有了提高。

用同样的方法可进一步增加信源序列的长度，L=3或L=4，对这些信源序列X进行编码，并求出其编码效率分别为

η3=0.985η4=0.991


这时信息传输效率分别为

R3=0.985bit/二元码符号

R4=0.991bit/二元码符号


如果对这一信源采用定长二元码编码，要求编码效率达到96％，允许译码错误概率δ≤10-5，则根据式(528)，自信息的方差

σ2(X)=∑2i=1pi(logpi)2-［H(X)］2=0.4715(bit)2


所需要的信源序列长度

L≥0.4715(0.811)2·(0.96)20.042×10-5≈4.13×107


很明显，定长码需要的信源序列长，导致码表较大，且总存在译码差错。而变长码要求编码效率达到96％时，只需L=2。因此用变长码编码时，L不需要很大就可达到相当高的编码效率，而且可实现无失真编码。随着信源序列长度的增加，编码的效率越来越接近1，编码后的信息传输效率R也越来越接近无噪无损二元对称信道的信道容量C=1bit/二元码符号，实现信源与信道匹配，使信道得到充分利用。

由变长编码定理可以看出，要使信源编码后的平均码长最短，就要求信源中每个符号的码长与其概率相匹配，即概率大的信息符号编以短的码字，概率小的信息符号编以长的码字。由于符号的自信息量I(xi)就是基于概率计算得到的该符号含有的信息量，因此，将式(529)中的信源熵和平均码长替换为每个信源符号的自信息量I(xi)和码长Ki，就可得到一种构造最佳码长的编码方法，称为香农编码。

香农第一定理指出，选择每个码字的长度Ki满足下式： 

I(xi)≤Ki<I(xi)+1,i


就可以得到这种码。其编码方法如下。

(1) 将信源消息符号按其出现的概率大小依次排列为

p1≥p2≥…≥pn


(2) 确定满足下列不等式的整数码长Ki： 

-log2(pi)≤Ki<-log2(pi)+1


(3) 为了编成唯一可译码，计算第i个消息的累积概率： 

Pi=∑i-1k=1p(ak)


(4) 将累积概率Pi变换为二进制数。



(5) 取Pi二进制数的小数点后Ki位，即为该消息符号的二进制码字。

如图55所示，香农编码可以这样理解，累积概率Pi将区间［0，1)分割为许多小区间，每个小区间的长度等于各符号的概率pi，小区间内的任一点可用于代表该符号。


图55区间分割




例54设信源共7个符号，其概率和累积概率如表53所示。以i=4为例，有

-log20.17≤K4<-log20.17+1
2.56≤K4<3.56,K4=3


累积概率P4=0.57，变换成二进制为0.1001…，由于K4=3，所以信源符号a4的编码码字为100。其他符号的码字可用同样方法求得，如表53所示。该信源共有5个3位的码字，各码字之间至少有一位数字不同，故是唯一可译码。同时可以看出，这7个码字都不是延长码，都属于即时码。


表53香农码编码过程





信源消息符号ai
符号概率p(ai)
累积概率Pi
-logp(ai)
码字长度Ki
码字

a10.2002.323000
a20.190.22.393001
a30.180.392.473011
a40.170.572.563100
a50.150.742.743101
a60.100.893.3441110
a70.010.996.6471111110


这里L=1，m=2，所以信源符号的平均码长

=∑7i=1p(ai)Ki=3.14码元/符号


平均信息传输效率

R=H(X)=2.613.14≈0.831bit/码元


这种码的编码效率为83.1%，是比较低的。

例55设信源有3个符号，概率分布为(0.5，0.4，0.1)，根据香农编码方法求出各个符号的码长为(1，2，4)，码字为(0，10，1110)。事实上，观察信源的概率分布可构造出一个码长更短的码(0，10，11)，显然也是唯一可译码。

所以从上述两个例子可以看出，香农编码法冗余度稍大，编码效率较低，实用性不强，但它是依据编码定理而来，因此具有重要的理论意义。按照信源编码定理，若对信源序列进行编码，当序列长度L→∞时，平均码长会趋于信源熵。

5．3限失真信源编码定理

将编码器看作信道，信源编码模型如图56所示。无失真信源编码对应无损确定信道，有失真信源编码对应有噪信道。对于无失真信源编码，信道的输入符号个数与输出符号个数相等，呈一一对应关系，信道的损失熵H(X|Y)和噪声熵H(Y|X)均为零，信道的信息传输率R等于信源熵H(X)，因此，从信息处理的角度看，无失真信源编码是保熵的，只是对冗余度进行压缩，因为冗余度是对信号携带信息能力的一种浪费。



图56信源编码模型

有失真信源编码的中心任务是： 在允许的失真范围内将编码后的信息率压缩到最小。有失真信源编码的失真范围受限，所以又称限失真信源编码； 编码后的信息率得到压缩，因此属熵压缩编码。之所以引入有失真的熵压缩编码，原因如下。

(1) 保熵编码并非总是必需的。有些情况下，信宿不需要或无能力接收信源发出的全部信息，例如，人眼接收视觉信号和人耳接收听觉信号就属于这种情况，这时就没必要进行无失真的保熵编码。

(2) 保熵编码并非总是可能的。例如，对连续信号进行数字处理时，由于不可能从根本上去除量化误差，因此不可能实现保熵编码。

(3) 降低信息率有利于传输和处理，因此有必要进行熵压缩编码。例如，连续信源的绝对熵为无穷大，若用离散码元表示，需要用无限长的码元串，传输无限长的码元串势必造成无限延时，这种通信就无任何实际意义了。所以，对于连续信源而言，熵压缩编码是绝对必需的。有失真的熵压缩编码主要针对连续信源，但其理论同样适用于离散信源。

在第4章中，信息率失真函数给出了失真小于D时必需的最小信息率R(D)，只要信息率大于R(D)，一定可以找到一种编码，使译码后的失真小于D。

限失真信源编码定理： 设离散无记忆信源X的信息率失真函数为R(D)，则当信息率R>R(D)时，只要信源序列长度L足够长，一定存在一种编码方法，其译码失真小于或等于D+ε，其中ε为任意小的正数。反之，若R<R(D)，则无论采用什么编码方法，其译码失真都大于D。

如果是二元信源，则对于任意小的ε>0，每个信源符号的平均码长满足

R(D)≤<R(D)+ε


上述定理指出，在失真限度内存在使信息率任意接近R(D)的编码方法。然而，要使信息率小于R(D)，平均失真一定大于失真限度D。

对于连续平稳无记忆信源，虽然无法进行无失真编码，在限失真情况下，有与上述定理一样的编码定理。

上述定理只能说明最佳编码是存在的，而具体编码构造方法尚未明确，因而不能像无损编码那样从证明过程中引出概率匹配的编码方法。一般只能从优化的思路求最佳编码。实际上迄今尚无合适的编码实现方法可接近R(D)这个界。

5．4常用信源编码方法简介

前面已经介绍了信源编码的两大定理，需要根据信源的具体特点选择实用的编码方法。在编码理论指导下，先后出现了许多性能优良的编码方法，根据信源的性质进行分类，可分为信源统计特性已知或未知、无失真或限定失真、无记忆或有记忆信源的编码； 按编码方法进行分类，可分为分组码或非分组码、等长码或变长码等。然而最常见的是讨论统计特性已知条件下离散、平稳、无失真信源的编码，消除这类信源冗余度的主要方法有统计匹配编码和解除相关性编码。例如，香农码、哈夫曼码属于不等长度分组码，算术编码属于非分组码，预测编码和变换编码是以解除相关性为主的编码。对统计特性未知的信源编码称为通用编码，如LZ编码。对限定失真的信源编码则以信息率失真R(D)函数为基础，最典型的是矢量量化编码。在此简要介绍部分编码方法的基本原理。


5.4.1哈夫曼编码

哈夫曼编码是分组编码，完全根据信源各字符出现的概率来构造码字。其基本原理是基于码树的编码思想，所有可能的输入符号对应哈夫曼树上的一个节点，节点的位置就是该符号的哈夫曼编码。为构造唯一可译码，这些节点都是哈夫曼树上的终极节点，不再延伸，不会出现前缀码。先以二进制为例，具体编码方法如下。

(1) 将信源消息符号按其出现的概率大小依次排列为

p1≥p2≥…≥pn


(2) 取两个概率最小的字母分别配以0和1两个码元，并将这两个概率相加作为一个新字母的概率，与未分配二进制符号的字母一起重新排队。

(3) 对重排后的两个概率最小的符号，重复步骤(2)的过程。

(4) 不断重复上述过程，直到最后两个符号配以0和1为止。

(5) 从最后一级开始，向前返回得到各个信源符号对应的码元序列，即相应的码字。


例56对例54中的信源进行哈夫曼编码，编码过程如表54所示。


表54哈夫曼码编码过程





该哈夫曼码的平均码长

=∑7i=1p(ai)Ki=2.72码元/符号


编码效率

η=H(X)=2.612.72≈96%


由此可见，与例54中的香农编码相比，哈夫曼码的平均码长较小，编码效率高，信息传输速率大，所以在压缩信源信息率的实用设备中，哈夫曼编码比较常用。

以上介绍的编码方法输出的是二进制哈夫曼码，如果要求编出N进制哈夫曼码，则应在每次最小概率合并时取N个符号。另外，为得到最短平均码长，尽量减少赋长码的信源符号，有时在编码前需要对信源符号进行添加，使信源的符号数量满足M(N-1)+1，其中M为正整数。添加的信源符号的概率为0。这样多次合并后就能充分利用短码，以降低平均码长。例如，要将信源XP=a1a2a3a4p1p2p3p4编为三进制哈夫曼码，如果直接编码，则形成的码长为(1,2,2,2)。如果先对信源添加1个符号，变为XP=a1a2a3a4a5p1p2p3p40，则编码形成的码长为(1,1,2,2)。

哈夫曼编码方法得到的码并非唯一的，原因如下。

（1） 每次对信源符号进行缩减时，赋予信源最后两个概率最小的符号，可任意用0和1，所以可以得到不同的哈夫曼码，但不影响码字的长度。

（2） 对信源符号进行缩减时，当两个概率最小的符号合并后的概率与其他信源符号的概率相同时，两者在缩减信源中进行概率排序，其位置放置次序可以是任意的，故会得到不同的哈夫曼码。此时将影响码字的长度，一般将合并的概率放在上面，这样可获得较小的码方差。

例57设有离散无记忆信源

XP=a1a2a3a4a50.40.20.20.10.1


可有两种哈夫曼编码方法，如表55和表56所示，码树如图57(a)和图57(b)所示。

表55哈夫曼编码方法一






表56哈夫曼编码方法二








图57哈夫曼码树


表55和表56给出的哈夫曼码的平均码长相等，即

=∑7i=1p(ai)Ki=2.2码元/符号


编码效率也相等，即

η=H(X)=96.5%


但是两种码的质量不完全相同，可用码方差表示，即

σ2l=E［(Ki-)2］=∑qi=1p(ai)(Ki-)2


表55中哈夫曼码的方差为σ2l1=1.36，
表56中哈夫曼码的方差为σ2l2=0.16。

因此可见，第二种哈夫曼编码方法得到的码方差小许多，故第二种哈夫曼码的质量更高。

由上述例子可看出，进行哈夫曼编码时，为得到码方差最小的码，应使合并的信源符号位于缩减信源序列尽可能高的位置，以减少再次合并的次数，充分利用短码。

哈夫曼码用概率匹配方法进行信源编码。它有两个明显特点： 一是哈夫曼码的编码方法保证概率大的符号对应短码，概率小的符号对应长码，充分利用短码； 二是缩减信源的最后两个码字总是最后一位不同，从而保证哈夫曼码为即时码。

哈夫曼变长码的效率是相当高的，它可以单个信源符号编码或用L较小的信源序列编码，编码器的设计也简单得多。但是应当注意，要实现较高的效率仍然需要按长序列计算，这样才能降低平均码字长度。

例58信源输出两个符号，概率分布为P=(0.9，0.1)，信源熵H(X)=H(0.9)=0469。采用二进制哈夫曼编码。

L=1，1=1bit/符号； 

L=2，P′=(0.81,0.09,0.09,0.01)，2=0.645bit/符号； 

L=3，3=0.533bit/符号； 

L=4，4=0.493bit/符号。

随着序列长度L的增加，平均码长迅速降低，接近信源熵值。

如图56所示的信源编码器，其输入X是由信源以均匀速率输出的码元，如果采用定长编码，则其输出Y也是均匀速率的码元。但如果采用变长编码，其输出Y就会是速率不等的码元。为了充分利用信道的传输能力，都要求以均匀速率的码元进入信道，因此需要设置一个存储设备，用于缓冲码字长度的差异。显然存储器的容量也是衡量编码器质量的一个主要参数，这也是码方差小的码质量高的原因。设每秒发送一个信源符号，经信源编码器后，输出的码字有的只有1个码元，有的却有多个，若希望平均每秒输出个码元以压缩信息率，就必须先将编成的码字存储起来，再按的信息率输出，才能从长远来计算，使输出和输入保持平衡。当存储量不够大时，可能有时取空，有时溢出。例如，信源常发出短码时，就会出现取空，就是说还没有存入就要输出； 常发出长码时，就会溢出，也就是存入太多，以致存满还未取出就要再存入。所以应估计所需的存储器容量，才能使上述现象发生的概率小至可接受。

设T秒内输出N个信源符号，信源输出符号速率S=N/T，若符号的平均码长为，则信道传输速率

Rt=S(541)


时可以满足条件。

N个码字的长度分别为Ki，i=1，2，…，N，即在此期间输入存储器∑Kibit，输出至信道RtTbit，则存储器内还剩Ubit，即

U=∑Ni=1Ki-RtT(542)


已知Ki为随机变量，其均值和方差分别为

=E［Ki］=∑mj=1pjKj(543)
σ2=E［K2i］-2=∑mj=1pjK2j-2(544)


式中,m是信源符号集的元数。当N足够大时，U是许多同分布的随机变量之和。由概率论可知，它将近似于正态变量，其均值和方差分别为

E［U］=N-RtT=(S-Rt)T
σ2u=Nσ2


令V=U-E［U］σu(545)

它是标准正态变量，可得下列概率： 

P(V>A)=P(V<-A)=φ(-A)(546)

式中,φ(-A)是误差函数，可查表得其数值。

如果式(541)成立，则E［U］=0。设起始时存储器处半满状态，而存储器容量为2Aσu，可由式(546)求得溢出概率和取空概率。因V>A，即U>Aσu，存储器将溢出； 而V<-A，即U<-Aσu，存储器取空。这就是说，如果要求这些概率都小于φ(-A)，存储器容量应大于2Aσu。例如，要求溢出概率和取空概率都小于0.001，查表得A应为3.08，则存储器容量C应为

C>6.16Nσ(547)


当式(541)不成立时，存储器容量还要增加，起始时存储器也不应处于半满状态。例如，若Rt>S，则平均来说，输出大于输入，易被取空，起始状态可超过半满； 反之，若Rt<S，则易于溢出，可不到半满。

由式(547)可知，时间T越大，N越大，要求的存储器容量也越大。当容量设定后，随着时间的增长，存储器溢出和取空的概率都增大。当T很大时，几乎一定会溢出或取空，造成损失，即使式(541)成立，也是如此。由此可见，对于无限长的信息，很难采用变长码而不出现差错。一般来说，变长码只适用于有限长的信息传输，即送出一段信息后，信源能停止输出，例如，传真机送出一张纸上的信息后停止。对于长信息，实际使用时可将长信息分段发送，也可检测存储器的状态，发现将要溢出就停止信源输出，发现将要取空就插入空闲标志在信道上传送，或加快信源输出。

认为变长编码可以无失真地译码，这是理想情况下。如果这种变长码由信道传送时，有某一个符号错了，因为一个码字前面有某个码元错了，就可能误认为是另一个码字而点断，结果后面一系列的码字也会译错，这常称为差错的扩散。当然也可以采用某些措施，使错了一段以后，能恢复正常的码字分离和译码，这一般要求传输过程中的差错很少，或者加纠错用的监督码位，但是这样又会增加信息率。

此外，当信源有记忆时，用单个符号编制变长码不可能使编码效率接近1，因为信息率只能接近一维熵H1，而H∞一定小于H1。此时仍需要多个符号一起编码，才能进一步提高编码效率。但会导致码表长、存储器多。

哈夫曼码在实际中已有所应用，但它仍存在一些分组码具有的缺点。例如，概率特性必须精确地测定，以此编制码表，若略有变化，还需更换码表。因而在实际编码过程中，需要对原始数据扫描两遍，第一遍用于统计原始数据中各字符出现的概率，创建码表存放起来，第二遍则在扫描的同时依据码表进行编码，才能传输信息。如果将这种编码用于网络通信，两遍扫描会导致较长的延时； 如果用于数据压缩，则会降低速度。因此出现了自适应哈夫曼编码方法，其码表不是事先构造的，而是随着编码的进行动态地构造、调整，所以码表不仅取决于信源的特性，还与编码、解码过程相关。

另外，对于二元信源，常需多个符号合起来编码，才能取得好的效果，但当合并的符号数不大时，编码效率提高不明显，尤其是对于相关信源，不能令人满意，而合并的符号数增大时，码表中的码字数很多，设备将越来越复杂。在大多数情况下，哈夫曼编码用于无失真编码，但也可以用于有失真情况。例如，在符号数很多且有部分符号的概率非常小时，为减小码表，可将这些小概率符号合并对应同一个码字，解码时出现的错误概率即为这些符号概率之和。


5.4.2算术编码

以上讨论的编码方法都建立在符号和码字相对应的基础上，这种编码通常称为块码或分组码。若对信源单符号进行编码，符号间的相关性就无法考虑； 若将m个符号合起来编码，一是会增加设备复杂度，二是m+1个符号间及组间符号的相关性仍然无法考虑，无法充分满足信源编码的匹配原则，编码效率有所降低。

为克服这种局限性，就要跳出分组码的范畴，研究非分组码的编码方法。算术码即为其中之一，其编码的基本思路是，将需要编码的全部数据看作某一L长序列，所有可能出现的L长序列的概率映射到［0，1］区间上，将［0，1］区间分为许多小段，每段的长度等于某一序列的概率。再在段内取一个二进制小数用作码字，其长度可与该序列的概率匹配，以实现高效率编码。这种方法与香农编码法类似，只是它们考虑的信源序列对象不同，算术码中的信源序列长度要长得多，或许是欲编码的整个数据文件，而香农码中的序列长度为1。

如果信源符号集为A={a1，a2，…，an}，L长信源序列xi=(xi1,xi2,…xil,…xiL)，xil∈A，则共有nL种可能序列。由于考虑的是全序列，因而序列长度L很大。实用中很难得到对应序列的概率，只能从已知的信源符号概率P=［p(a1)，p(a2)，…，p(an)］=［p1，p2，…，pr，…，pn］中递推得到。定义各符号的累积概率为

Pr=∑r-1i=1pi(548)


显然，由上式可得P1=0，P2=p1，P3=p1+p2，…，
而且

pr=Pr+1-Pr(549)



图58符号的区间表示形式

由于Pr+1和Pr都是小于1的正数，可用［0，1］区间上的两个点表示，因此pr就是这两点间小区间的长度，如图58所示。不同的符号有不同的小区间，它们互不重叠，所以可将这种小区间内的任一个点作为该符号的代码。以后将计算该代码所需的长度，使之与其概率匹配。



例如序列S=011，这种3个二元符号的序列可按自然二进制数排列，000，001，010，…，则S的累积概率为




P(S)=p(000)+p(001)+p(010)(5410)


如果S后面接一个“0”，则其累积概率为

P(S,0)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)
=p(000)+p(001)+p(010)=P(S)


因为两个四元符号的最后一位是“0”和“1”时，根据归一律，它们的概率和应等于前3位的概率，即p(0000)+p(0001)=p(000)等。

如果S后面接一个“1”，则其累积概率为

P(S,1)=p(0000)+p(0001)+p(0010)+p(0011)+p(0100)+p(0101)+p(0110)
=P(S)+p(0110)
=P(S)+p(S)p0


由于单符号的累积概率为P0=0，P1=p0，所以上面两式可统一写作

P(S,r)=P(S)+p(S)Pr,r=0,1


上式很容易推广至多元序列(m>2)，即可得一般的递推公式

P(S,ar)=P(S)+p(S)Pr(5411)

及序列的概率公式

p(S,ar)=p(S)pr


对于有相关性的序列，上面的两个递推公式也是适用的，只是上式中的单符号概率应变为条件概率。用递推公式可逐位计算序列的累积概率，而不用像式(5410)那样列举所有排在前面的序列概率。

从以上关于累积概率P(S)的计算中可看出，P(S)将区间［0，1)分割为许多小区间，每个小区间的长度等于各序列的概率p(S)，而该小区间内的任一点可用于代表该序列，现在讨论如何选择这个点。令

L=log1p(S)(5412)


其中 代表大于或等于的最小整数。将累积概率P(S)写为二进位的小数，取其前L位，以后如果有尾数，就进位到第L位，这样得到一个数C。例如，P(S)=0.10110001，p(S)=1/17，则L=5，得C=0.10111。这个C就可作为S的码字。因为C不小于P(S)，至少等于P(S)。又由式(5412)可知p(S)≥2-L。令(S+1)为按顺序正好在S后面的一个序列，则

P(S+1)=P(S)+p(S)≥P(S)+2-L>C


当P(S)在第L位以后且没有尾数时，P(S)就是C，上式成立； 如果有尾数，该尾数就是上式的左右两侧之差，所以上式也成立。由此可见，C必在P(S+1)和P(S)之间，也就是在长度为p(S)的小区间(左闭右开的区间)内，因而是可以唯一译码。这样构成的码字，编码效率很高，已可达到概率匹配，尤其是当序列很长时。由式(5412)可见，对于长序列，p(S)必然很小，L与概率倒数的对数已几乎相等，也就是取整数造成的差别很小，平均代码长度接近S的熵值。

实际应用中，采用累积概率P(S)表示码字C(S)，符号概率p(S)表示状态区间A(S)，则有

C(S,r)=C(S)+A(S)PrA(S,r)=A(S)pr(5413)


对于二进制符号组成的序列，r=0，1。

实际编码过程如下。先置定两个存储器，起始时可令

A(φ)=1，C(φ)=0


其中,φ代表空集，即起始时码字为0，状态区间为1。每输入一个信源符号，存储器C和A就按照式(5413)更新一次，直至信源符号输入完毕，就可将存储器C的内容作为该序列的码字输出。由于C(S)是递增的，而增量A(S)Pr随着序列的增长而减小，因为状态区间A(S)越来越小，与信源单符号的累积概率Pr的乘积就越来越小。所以C的前面几位一般已固定，在以后的计算中不会被更新，因而可以边计算边输出，只需保留后面几位用作更新。

译码也可逐位进行，与编码过程相似。

例59有4个符号a、b、c、d构成的简单序列S=abda，各符号及其对应概率如表57所示。


表57各符号及其对应概率




符号
符号概率pi
符号累积概率Pj
a0.100(1/2)0.000
b0.010(1/4)0.100
c0.001(1/8)0.110
d0.001(1/8)0.111



算术编解码过程如下。

设起始状态为空序列φ，则A(φ)=1，C(φ)=0。

递推得 

C(φa)=C(φ)+A(φ)Pa=0+1×0=0A(φa)=A(φ)pa=1×0.1=0.1
C(a,b)=C(a)+A(a)Pb=0+0.1×0.1=0.01A(a,b)=A(a)pb=0.1×0.01=0.001
C(a,b,d)=C(a,b)+A(a,b)Pd=0.01+0.001×0.111=0.010111A(a,b,d)=A(a,b)pd=0.001×0.001=0.000001
C(a,b,d,a)=C(a,b,d)+A(a,b,d)Pa=0.010111+0.000001×0=0.010111A(a,b,d,a)=A(a,b,d)pa=0.000001×0.1=0.0000001


计算该序列的编码码长，根据式(5412)，有

L=log1A(a,b,d,a)=7


得码长为7，取C(a，b，d，a)小数点后7位，即为编码后的码字0101110。上述编码过程如图59所示，可用对单位区间的划分来描述。




图59算术码编码过程


该信源的熵

H(X)=-12log12-14log14-2×18log18=1.75bit/符号


编码效率

η=1.757/4=100%



译码可通过比较上述编码后的数值大小进行，即判断码字C(S)落在哪个区间，就可以得出一个相应的符号序列。据递推公式的相反过程译出每个符号。步骤如下。

（1） C(a,b,d,a)=0.0101110<0.1∈［0,0.1］，第1个符号为a。

（2） 放大至［0,1］(×p-1a)，得C(a,b,d,a)×21=0.10111∈［0.1,0.110］，第2个符号为b。

（3） 去掉累积概率Pb，得0.10111-0.1=0.00111。

（4） 放大至［0,1］(×p-1b)： 0.00111×22=0.111 ∈［0.111,1］，第3个符号为d。

（5） 去掉累积概率Pd，得0.111-0.111=0。

（6） 放大至［0,1］(×p-1d)，得0×23=0 ∈［0,0.1］，第4个符号为a。

实际的编译码过程比较复杂，但原理相同。从性能上看算术编码具有许多优点，特别是所需的参数很少，不像哈夫曼编码那样需要很大的码表。由于二元信源的编码实现比较简单，我国最早将其应用于报纸传真的压缩设备，获得了良好的效果。从理论上说，只要已知信源符号集及其符号概率，算术编码的平均码长可以接近符号熵。因而在实际编码时，需要预先对信源输入符号的概率进行估计，估计的精准程度将直接影响编码性能。但是事先知道精确的信源符号概率是很难的，而且是不切实际的。算术编码可以是静态的或自适应的。在静态算术编码中，信源符号的概率是固定的。而对于一些信源概率未知或非平稳的情况，常设计为自适应算术编码，在编码的过程中根据信源符号出现的频繁程度动态地修正符号概率。

5.4.3矢量量化编码

连续信源进行编码的主要方法是量化，即将连续的样值x离散化为yi，i=1,2,…,n。n是量化级数，yi是某些实数。这样就把连续值转化为了n个实数，可用0，1，…，n－1共n个数字表示。离散信源也会涉及量化问题，比如，当提供的量化级数少于原来的量化级数时，需要对该信源信号进行再次量化。在上述这些量化中，由于x是一个标量，因此称为标量量化。矢量量化就是使若干个标量数据组形成一个矢量，然后在矢量空间进行整体量化，从而压缩数据。量化会引入失真，所以矢量量化是一种限失真编码，量化时必须使这些失真最小。正如前面的编码定理中看到的，将离散信源的多个符号联合编码可提高效率。连续信源也是如此，当把多个信源符号联合起来形成多维矢量，再对矢量进行标量量化时，可以充分利用各分量间的统计依赖性，同样的失真下，量化级数可进一步减少，码率可进一步压缩。在维数足够高时，矢量量化编码可以任意接近率失真理论给出的极限。

矢量量化编码的原理是，输入k维随机矢量Xi=(xi1,xi2,…,xik)，通过一个矢量量化器Q(X)，映射为对应的k维输出矢量Yi=(yi1,yi2,…,yik)。Y={Y1,Y2,…,YN}，有N种矢量组成的集合Y称为码书或码本。它实际上是一个长度为N的表，表中的每个分量Yi都是一个k维矢量，称为码字或码矢。码书中码字的数量称为码书的尺寸。矢量编码的过程就是在码书Y 中搜索一个与输入矢量Xi最接近的码字Yi，Yi就是Xi的矢量量化值。传输时，只需传输码字Yi的下标i。在接收端解码器中，有一个与发送端相同的码书Y，根据接收的标号i可简单地用查表法找到对应的矢量Yi作为Xi的近似。当码书尺寸为N时，传输矢量下标所需的比特数为log2N，平均传输矢量中一维信号所需的比特数为（1/k）log2N。若k=16，N=256，则比特率为0.5bit/维。

从编码原理中可以看出，矢量量化编码的关键技术是码书设计和码字搜索。

1. 码书设计

矢量量化的码书设计是将k维空间无遗漏地划分为N个互不相交的子空间S1,S2, …,SN，并在每个子空间中找出一个最佳矢量Yi作为输出码字。码书的优化直接影响压缩效率和数据恢复质量。在接收端以量化值Yi再现Xi，必然存在失真，需要满足d(Xi,Yi)=min d(Xi,Yj),j=1,2,…,N，其中d(Xi,Yi)是输入矢量Xi与码字Yi之间的失真测度。一般可以采用均方误差衡量失真测度，即

dXi,Yi=∑kj=1(xij-yij)2


整个信号的平均失真为

D=EdX,Yi=∑Ni=1EdX,Yi,X∈Si


D为每个子空间失真的统计平均，可作为衡量恢复信号质量的指标。解码失真的大小主要由码书的质量决定。码书设计的过程就是寻求将M个训练矢量分为N（N<M）类的一种最佳方案（使均方误差最小），而将各类质心矢量作为码书的码字。然而，在N和M比较大的情况下，搜索全部码书是不可能的。为克服这个困难，各种现有的码书设计方法都采取搜索部分码书的方法得到局部最优或接近全局最优的码书。所以研究码书设计算法的目的是寻求有效的算法尽可能找到全局最优或接近全局最优的码书，以提高码书的性能，并尽可能降低计算复杂度。

LBG算法是一种直观且有效的矢量量化码书设计算法，是由Linde、Buzo和Gray于1980年首先提出的。该算法基于最佳矢量量化器设计的最佳划分和最佳码书两个必要条件，是最佳标量量化在矢量空间的推广，其物理概念清晰，算法理论严密，算法实现容易。后来人们又针对该算法的一些缺点进行改进，提出了许多性能更优的设计算法，至今应用广泛。

2. 码字搜索

矢量量化的码字搜索算法是在码书已经存在的情况下，对于某个输入矢量，在码书中搜索与该输入矢量之间失真最小的码字。矢量量化中最常用的搜索方法是全搜索算法和树搜索算法。全搜索算法与码书生成算法基本相同。如果采用平方误差作为失真测度，对于k维矢量，每次失真计算需要k次乘法、2k－1次加法，因而为了对矢量进行穷尽搜索编码需要Nk次乘法、N(2k－1)次加法和N－1次比较。计算复杂度由码书尺寸和矢量维数决定。对于大尺寸码书和高维矢量，计算复杂度会很大。研究码字搜索算法的主要目的是寻找快速有效的算法以减少计算复杂度，并尽量使算法易于通过硬件实现。

随着算法研究的进展及超大规模集成电路技术的飞速发展，矢量量化编码器在语音编码、语音识别与合成、图像压缩等领域得到了大量应用。实验证明，即使各信源符号相互独立，多维量化常可压缩信息率，这就使人们对矢量量化感兴趣，成为当前连续信源编码的一个热点。可是当维数较大时，矢量量化尚无解析方法，只能求助于数值计算； 而且联合概率密度也不易测定，还需采用训练序列等方法。一般来说，高维矢量联合很复杂，虽已有不少方法，但实用时尚有不少困难，有待进一步研究。

5.4.4预测编码

前面介绍的编码方法都是考虑独立的信源序列。哈夫曼码对于独立多值信源符号很有效，算术码对于独立二元信源序列很有效，对于相关信源虽然可采用条件概率来编码而实现高效率，但复杂度较高，往往使之难以实现。由信息论可知，对于相关性很强的信源，条件熵可远小于无条件熵，因此人们常采用尽量解除相关性的方法，使信源输出转化为独立序列，以利于进一步压缩码率。

常用的解除相关性的两种方法是预测和变换。它们既适用于离散信源，也可用于连续信源。其实两者都是序列的变换。一般来说，预测有可能完全解除序列的相关性，但必须确知序列的概率特性； 变换一般只解除矢量内部的相关性，但它可有许多可供选择的变换矩阵，以适应不同信源特性。这在信源概率特性未确知或非平稳时可能有利。

本节介绍预测的一般理论和方法。

预测是从已收到的符号中提取关于未收到符号的信息，从而预测其最可能的值，并对它与实际值之差进行编码，达到进一步压缩码率的目的。由此可见，预测编码是利用信源的相关性来压缩码率，对于独立信源，就没有预测可能。

预测的理论基础主要是估计理论。估计就是将实验数据组成一个统计量作为某一物理量的估值或预测值。最常见的估计是利用某一物理量被干扰时测定的实验值，这些值是随机变量的样值，可根据随机量的概率分布得到一个统计量作为估值。若估值的数学期望等于原来的物理量，就称这种估计为无偏估计； 若估值与原物理量之间的均方误差最小，就称之为最佳估计。用于预测时，这种估计就成为最小均方误差的预测，所以认为这种预测是最佳的。

实现最佳预测需要找到计算预测值的预测函数。设有信源序列x1，x2，…，xr，xr+1，…。r阶预测就是由x1，x2，…，xr预测xr+1。可令预测值为

x′r+1=f(x1,x2,…，xr)

其中，f是待定的预测函数。要使预测值具有最小均方误差，必须确知r＋1个变量（x1，x2，…，xr，xr+1）的联合概率密度函数，这在一般情况下是困难的。因而常用线性预测的方法达到次最佳的效果。线性预测是预测函数为各已知信源符号的线性函数，即xr+1的预测值

x′r+1=f(x1,x2,…,xr)=∑rs=1asxs（5414）

并求均方误差

D=E(x′r+1-xr+1)2（5415）

最小时的各as值。可将式（5414）代入式（5415），对各as取偏导并置零，得到

Das=-Err+1-∑rs=1asxsxs=0（5416）

只需已知信源各符号之间的相关函数即可进行运算。

最简单的预测是令

x′r+1=xr（5417）

这可称为零阶预测，常用的差值预测就属这类。高阶线性预测已在语音编码，尤其是声码器中广泛应用。如果信源是非平稳或非概率性的，无法获得确切和恒定的相关函数，不能构成线性预测函数，可采用自适应预测的方法。一种常用的自适应预测方法是设预测函数是前几个符号值的线性组合，即令预测函数为

x′=∑rs=1asxt-r-1-s（5418）

再用已知信源序列确定各系数as，使对该序列造成的均方误差D最小。此时的各系数as并不能保证对该信源发出的所有序列都适用，只有在平稳序列情况下，这种预测的均方误差可逼近线性预测时的最小值。随着序列的延长，各系数as可根据以后的n个符号值计算，因而将随序列的延长而变化，也就是可不断适应序列的变化，适用于缓变的非平稳信源序列。

利用预测值来编码的方法可分为两类： 一类是用实际值与预测值之差进行编码，也称为差值编码。常用于相关性强的连续信源，也可用于离散信源。在连续信源的情况下，就是对此差值量化或取一组差值进行矢量量化。由于相关性很强的信源可较精确地预测待编码的值，差值的方差将远小于原来的值，所以在同样的失真要求下，量化级数可明显减少，从而显著压缩码率。对于离散信源也有类似的情况。

另一类是根据差值的大小，决定是否需传送该信源符号。例如，可规定某一可容许值ε，当差值小于它时可不传送。对于连续函数或相关性很强的信源序列，常有一串很长的符号可以不传送，只需传送这串符号的个数，这样能大幅压缩码率。这类方法一般按信宿的要求设计，也就是失真应能满足信宿需求。

5.4.5变换编码

变换是一个广泛的概念。在通信系统中，常希望对信号进行变换以达到某一目的。信源编码实际上是一种变换，使之能在信道中更有效地传送。这里讨论的变换是数学意义上的一一对应变换。变换编码就是变换后的信号的样值能更有效地编码，也就是通过变换消除或减弱信源符号间的相关性，再将变换后的样值进行标量量化，或采用对于独立信源符号的编码方法，以达到压缩码率的目的。

首先讨论变换的一般原理，即连续函数的变换。

设有函数f(t)，0<t<T

∫T0f2(t)dt<∞（5419）

该函数是希尔伯特空间L2（0，T）的一个矢量，其维数是可数无限，它的坐标系可用一完备正交函数系表征。

设有一个完备正交归一函数系(i，t)，i＝0，1，2，…。正交性就是

∫T0(i,t)(j,t)dt=0,i≠j（5420）

归一性就是

∫T02(i,t)dt=1（5421）

则可将f(t)展开为

f(t)=∑∞i=0ai(i,t)（5422）

其中，ai是待定系数，可用有限项逼近时的均方误差最小准则求得，即

Dn=∫T0f(t)-∑n-1i=0ai(i,t)2dt（5423）
Dnai=∫T0-2f(t)-∑n-1i=0ai(i,t)(i,t)dt

利用函数(i，t)的正交归一性及式（5422）、式（5423），可得

ai=∫T0f(t)(i,t)dt（5424）

如果limn→∞Dn→0

则称上述正交函数系是完备的，此时式（5423）才成立； 否则就是不完备的，式（5424）也就不成立。

与欧氏空间类比，式（5423）实际上是将函数矢量分解为各坐标分量，式（5424）相当于内积运算，将函数f(t)投影到(i，t)上。

上述变换可将函数f(t)变换为一系列离散的系数ai，已给这些系数，就可用式（5423）恢复函数f(t)而不产生误差，所以这种变换是可逆的。如果只取有限个系数，恢复时就会产生误差。

我们熟悉的傅氏变换具有正交归一性函数系，但从消除相关性的意义上说，傅氏变换不是一种很好的变换。要有效地消除相关性，正交函数系必须根据信源的相关函数选择。

按均方误差最小准则推算，有一种正交变换称为KL变换（KarhunenLoeve transform），可使变换后的随机变量之间互不相关。一般认为，KL变换是压缩编码的最佳变换，评价其他变换时，常与其进行比较。KL变换的最大缺点是计算复杂，除了测定相关函数和求解积分方程外，变换时的运算也十分复杂，尚无快速算法可用。

以上变换在时间上连续的信源输出x(t)中取一段(0,T)进行积分运算，得到一系列系数ai，i＝0，1，2，…，截取有限个n，即i＝0，1，2，…，n－1，并对各ai进行量化，达到信源编码的目的。这种方法在实际编码时较少应用，因为积分运算一般是比较困难的，而且除了量化各系数时会引入失真外，截取有限个系数也会引入失真。要保持失真在某一限度内，可能量化级数要有一定的增加，使码率有所上升。

另一种方法是先对信源输出x(t)取样，得到一系列离散值x(i)，i=0，1，2，…，然后取N个样值形成一个N维矢量，对该矢量用矩阵进行变换，成为另一域内的N维矢量，以消除或减弱矢量内各分量的相关性。再对后一个分量进行标量量化或对矢量进行矢量量化以完成信源编码。此时的变换已不用积分运算而是矩阵运算。若变换所用的矩阵选择恰当，就可达到压缩码率的目的。用矩阵来变换常称为离散变换。

其实取样也是一种将连续函数变换为时间上离散的一系列值的变换。此时变换所用的正交函数是单元脉冲函数δ(t－i，τ)，i＝0，1，…，τ是取样间隔。单元脉冲函数系的正交性和完备性是明显的，但这里已不是截取一段（0，T）信源输出，而是连续进行取样运算。要使变换能一一对应，即能无失真地恢复原来的连续函数，信源输出必须是限频的。若其最高频率是fm，则取样间隔τ必须小于1/2fm，才能使变换可逆，否则将引入失真。实际连续信源常是限频的，尤其是对于信宿来说，频率大于一定值的含量，信宿已不感兴趣或已不能感受，语音和图像对人耳与人眼都会出现这种情况，所以常能满足限频的要求。这样既能避免积分运算，也不会引入额外失真，因此实际上常采用离散变换。

还有很多离散变换，如正反变换矩阵都相同的离散哈尔变换和离散沃尔什变换； 由有限维正交矢量系导出的广泛用于电视信号编码的斜变换和多重变换； 可将信号分割为多个窄带以消除或减弱信号样值间相关性的子带编码和小波变换等。在实际应用中，需要根据信源特性选择变换方法以达到消除相关性、压缩码率的目的。另外，还可以根据一些参数比较各种变换方法间的性能优劣，如反映编码效率的编码增益、


视频编码

反映编码质量的块效应系数等。当信源的统计特性很难确知时，可用各种变换分别对信源进行变换编码，然后用实验或计算机仿真进行参数计算。


本章小结


本章从信源编码的模型出发，介绍了信源编码的目的，引出了信息传输速率和编码效率的概念，重点论述了无失真信源编码定理，从而引出了几种最佳编码方法，并简单介绍了限失真编码定理。

编码的定义： 分组码、变长码、非奇异码、唯一可译码、即时码、非延长码。

唯一可译码存在的充分和必要条件，克劳夫特不等式： ∑ni=1m-Ki≤1

编码效率： η=HL(X)

无失真信源编码定理(香农第一编码定理)： 

定长编码定理： KLLlogm≥HL(X)+ε

变长编码定理： LHL(X)logm≤L<LHL(X)logm+1

限失真信源编码定理(香农第三编码定理)： R(D)≤<R(D)+ε

简介几种常用信源编码方法： 香农编码、哈夫曼（Huffman）编码、算术编码、矢量量化编码、预测编码、变换编码。

习题

51将某六进制信源进行二进制编码如表58所示，试问： 

表58习题51表

消息
概率
C1
C2
C3
C4
C5
C6
u11/2000000101
u21/4001011010000001
u31/160100111101101001100
u41/16011011111101100010101
u51/1610001111111101001110110
u61/161010111111111101111110111



(1) 这些码中哪些是唯一可译码？

(2) 哪些码是非延长码(即时码)？

(3) 对所有唯一可译码求出其平均码长和编码效率。

52已知信源的各个消息分别为字母A、B、C、D，现用二进制码元对消息字母进行信源编码，A→(x0,y0)，B→(x0,y1)，C→(x1,y0)，D→(x1,y1)，每个二进制码元的长度为5ms。

(1) 若各个字母等概率出现，计算无扰离散信道上的平均信息传输速率。

(2) 若各个字母的出现概率分别为P(A)=1/5，P(B)=1/4，P(C)=1/4，P(D)=3/10，计算无扰离散信道上的平均信息传输速率。

(3) 若字母消息改用四进制码元作为信源编码，码元幅度分别为0、1V、2V、3V，码元长度为10ms，计算(1)、(2)两种情况下的平均信息传输速率。

53设信道的基本符号集合A={a1，a2，a3，a4，a5}，其时间长度分别为t1=1，t2=2，t3=3，t4=4，t5=5(个码元时间)。将这样的信道基本符号编成消息序列，且不能出现(a1,a1)，(a2,a2)，(a1,a2)，(a2,a1)4种符号相连的情况。

(1) 若信源的消息集合为{x1，x2，…，x7}，它们出现的概率分别为P(x1)=1/2，P(x2)=1/4，P(x3)=1/8，P(x4)=1/16，P(x5)=1/32，P(x6)=P(x7)=1/64。试按最佳编码原则利用上述信道传输这些消息时的信息传输速率。

(2) 求上述信源编码的编码效率。

54若消息符号、对应概率分布和二进制编码如下： 

消息符号： u0u1u2u3

概率： 1/2 1/4 1/8 1/8

编码： 010110111

(1) 求消息符号熵。

(2) 求每个消息符号所需的平均二进制码个数。

(3) 若各消息符号间相互独立，求编码后对应的二进制码序列中出现“0”和“1”的无条件概率p0和p1，以及相邻码间的条件概率p(1|1)、p(0|1)、p(1|0)和p(0|0)。

55某信源有8个符号{u1，u2，…，u8}，概率分别为1/2、1/4、1/8、1/16、1/32、1/64、1/128、1/128，编成这样的码： 000，001，010，011，100，101，110，111。

(1) 求信源的符号熵H(U)。

(2) 求出现一个“1”或一个“0”的概率。

(3) 求这种码的编码效率。

(4) 求相应的香农码。

(5) 求该码的编码效率。

56设无记忆二元信源的概率为p0=0.005，p1=0.995。信源输出N=100的二元序列。在长为N=100的信源序列中只对含有3个或小于3个“0”的各信源序列构成一一对应的一组定长码。

(1) 求码字所需的最小长度。

(2) 考虑没有给予编码的信源序列出现的概率，该定长码引起的错误概率是多少？

57已知符号集合{x1，x2，x3，…}为无限离散消息集合，它们出现的概率分别为p(x1)=1/2，p(x2)=1/4，…，p(xi)=1/2i，…。

(1) 用香农编码方法写出各个符号消息的码字。

(2) 计算码字的平均信息传输速率。

(3) 计算信源编码效率。

58某信源有6个符号，概率分别为3/8、1/6、1/8、1/8、1/8、1/12，试求三进制码元(0，1，2)的哈夫曼码，并求出编码效率。

59若某一信源有N个符号，并且每个符号均等概率出现，对此信源用哈夫曼二元编码，当N=2i和N=2i+1(i为正整数)时，每个码字的长度是多少？平均码长是多少？

510设有离散无记忆信源P(X)={0.37，0.25，0.18，0.10，0.07，0.03}。

(1) 求该信源符号熵H(X)。

(2) 用哈夫曼编码编成二元变长码，计算其编码效率。

(3) 要求译码错误小于10-3，采用定长二元码要达到(2)中哈夫曼编码的效率，需要多少个信源符号一起编？

511信源符号X有6种字母，概率分别为0.32，0.22，0.18，0.16，0.08，0.04。

(1) 求符号熵H(X)。

(2) 用香农编码编成二进制变长码，计算其编码效率。

(3) 用哈夫曼编码编成二进制变长码，计算其编码效率。

(4) 用哈夫曼编码编成三进制变长码，计算其编码效率。

(5) 若用逐个信源符号来编定长二进制码，要求不出译码差错，求所需要的每个符号的平均信息率和编码效率。

(6) 当译码差错小于10-3的定长二进制码达到(3)中哈夫曼的效率时，需要多少个信源符号一起编？

512已知一信源包含8个消息符号，其出现的概率为P(X)={0.1，0.18，0.4，0.05，0.06，0.1，0.07，0.04}。

(1) 该信源每秒发出1个符号，求该信源的熵及信息传输速率。

(2) 对这8个符号进行哈夫曼编码，写出相应码字，并求出编码效率。

(3) 采用香农编码，写出相应码字，并求出编码效率。

513某信源有9个符号，概率分别为1/4、1/4、1/8、1/8、1/16、1/16、1/16、1/32、1/32，用三进制符号(a，b，c)编码。

(1) 编出哈夫曼码，并求出编码效率。

(2) 若要求符号c后不能紧跟另一个c，编出一种有效码，其编码效率是多少？

514一信源可能发出的数字有1、2、3、4、5、6、7，对应的概率分别为p(1)=p(2)=1/3，p(3)=p(4)=1/9，p(5)=p(6)=p(7)=1/27，在二进制或三进制无噪信道中传输，二进制信道中传输一个码字需要1.8元，三进制信道中传输一个码字需要2.7元。

(1) 编出二进制符号的哈夫曼码，求其编码效率。

(2) 编出三进制符号的哈夫曼码，求其编码效率。

(3) 根据(1)和(2)的结果，确定在哪种信道中传输花费较小。

515有二元独立序列，已知p0=0.9，p1=0.1，求此序列的符号熵。当用哈夫曼编码时，用3个二元符号合成一个新符号，求这种符号的平均代码长度和编码效率。设输入二元符号的速率为每秒100个，要求3分钟内溢出和取空的概率均小于0.01，求所需的信道码率(bit/s)和存储器容量(比特数)。若规定信道码率为50bit/s，存储器容量将如何选择？

516离散无记忆信源发出a、b两种符号，其概率分布为1/4、3/4。若信源输出的序列为babba，对其进行算术编码并计算编码效率。

517在电视信号中，亮度信号的黑色电平为0，白色电平为L。用均匀分割量化其样值，要求峰功率信扰比大于50dB，求每样值所需的量化比特数。