第3章泛函分析及变分法 前面介绍的数学知识是学习图像处理的基础,同时也是大学教育中工科数学的必修内容。如果是仅仅作为数字图像处理学习入门的先修课程基本已经足够。但数字图像处理技术是一门发展非常迅速的学科,一些新方法新理论不断涌现。因此,要想把数字图像处理作为一门学问深入研究,显然仅仅掌握前面的数学知识仍然远远不够。本章主要介绍更进一步的数学知识,这些内容主要围绕泛函分析和变法等主题展开。这些知识与前面的内容相比更加艰深和抽象。对于本章内容的学习,侧重点应该更多地放在有关概念的理解上,而非是深究每一条定理该如何证明。当然本部分内容仍然与前面的内容紧密相连,所以读者务必在牢固掌握之前内容的基础上再进行本章的学习。 3.1勒贝格积分理论 前面介绍过积分的概念,彼时所讨论的积分首先是由黎曼(Riemann)严格定义的,因此之前所研究的积分通常称为黎曼积分,简称R积分。黎曼积分在数学、自然科学或者工程科学中具有非常重要的作用,正如前面所介绍的那样,诸如弧长、面积、体积、做功、通量等概念都可以借助黎曼积分表达。然而,随着现代数学和自然科学的发展,黎曼积分的缺陷也逐渐显现。这时勒贝格(Lebesgue)积分便应运而生了。在介绍勒贝格积分的概念之前,有必要介绍点集的勒贝格测度与可测函数的基本理论,这些内容是建立勒贝格积分的必要前提。 3.1.1点集的勒贝格测度 点集的测度是区间长度概念的推广。设E为直线R上任意一个点集,用mE表示E的测度。如果E是直线上的区间(a,b),或者E=[a,b]、(a,b]、[a,b),那么自然会想到可以定义该区间的长度b-a为它的测度,即mE=b-a。如果E是直线上的开集,那么可以根据开集构造定理定义它的测度。 定义设G为直线上的有界开集,定义G的测度为它的一切构成区间的长度之和。也就是说,若 G=∪k(αk,βk) 其中,(αk,βk)是G的构成区间,则 mG=∑k(βk-αk) 如果G的构成区间只有n个,那么上式右端是有限项(n项)之和,即 mG=∑nk=1(βk-αk) 如果G的构成区间是可数多个,那么上式右端是一个无穷级数 mG=∑+∞k=1(βk-αk) 由于G是有界开集,因此必然存在开区间(a,b),使G(a,b),所以对于任何有限的n,有 ∪nk=1(αk,βk)(a,b) 从而有 ∑nk=1(βk-αk)≤b-a 令n→+∞,得 mG=∑+∞k=1(βk-αk)≤b-a<+∞ 这表明无穷级数是收敛的,所以上述定义是有意义的。 定义设F为直线上的有界闭集,F(a,b),则G=(a,b)-F是有界开集,定义F的测度为 mF=(b,a)-mG 需要说明的是,由属于集A但不属于集B的元素的全体构成的集合称为A与B的差集,记为A-B。可以证明,闭集F的测度mF与区间(a,b)的选择无关。 在直线上,除去开集和闭集之外,还存在大量的既不开也不闭的集合,例如有理数的点集与无理数的点集等。那么又该如何定义它们的测度呢?已知圆的面积既可用其外切正多边形的面积从外面逼近,也可以用其内接正多边形的面积从里面逼近,而且用这两种方法所得的结果也应相等。在做微积分时,也是用这种思想定义任意曲边梯形的面积的。不妨从这个角度定义一般的有界点集的测度。 定义设E为直线上的任意一个有界点集,称所有包含E的开集测度的下确界为集E的外侧度,记作m*E,则 m*E=inf{mG|GE,G为开集} 而把所有包含于E的闭集测度的上确界称为集E的内测度,记作m*E,则 m*E=sup{mF|FE,F为闭集} 显然,m*E≤m*E。事实上,由FEG可知 m*E=sup{mF|FE,F为闭集}≤mG 从而有 m*E≤inf{mG|GE,G为开集}=m*E 定义设E为直线上的有界点集,若m*E=m*E,则称E为勒贝格可测集,简称为L可测集,它的外侧度与内测度的共同值称为E的勒贝格测度,简称为E的L测度,记作mE,则 mE=m*E=m*E 本节后续提及的可测集与测度均为L可测集与L测度。 直线上的区间,有界开集与有界闭集都是L可测的,而且它们的勒贝格测度与前面定义的测度相同。不仅如此,L可测集还包含更广泛的集类。 点集的测度既然是区间长度概念的推广,那么它理应保持区间长度的一些基本属性。设X=[0,1]为基本集,那么它的任意子区间I的长度mI显然具有下列基本性质。 (1) 非负性: mI≥0; (2) 有限可加性: 设I1和I2是区间[a,b]的两个子区间,若I1∩I2=,则m(I1∪I2)=mI1+mI2。 在直观上,有限可加性表达了“总量等于各分量之和”这个简单的公理,但这个公理的更完整表述应该是: 设{In}是X=[a,b]中可列个子区间,n=1,2,…,并且Ii∩Ij=,i≠j,则 m∪+∞n=1In=∑+∞n=1mIn 称该性质为可列可加性(或完全可加性)。 区间长度mI还有很多其他的性质,但非负性与可列可加性是其中最基本最重要的定理,称为测度公理。由定义可知,点集的勒贝格测度mE是非负的,通过下面的定理可知点集的勒贝格测度同样具有可列可加性。 定理设X=(a,b)为基本集,E、E1和E2为X的子集。 (1) 若E可测,则其补集XE也可测; (2) 若E1和E2可测,则E1∪E2、E1∩E2、E1-E2均可测,又若E1∩E2=,则有 m(E1∪E2)=mE1+mE2 定理 (1) 单调性: 若E1和E2可测,且E1E2,则mE1≤mE2; (2) 可列可加性: 若{Ek}是一个可测集列,k=1,2,…,则 E=∪+∞k=1Ek 也可测; 如果Ek两两互不相交,则 mE=∑+∞k=1mEk (3) 若{Ek}是一个可测集列,k=1,2,…,则 ∪+∞k=1XEk 也可测。 下面简单证明前两条性质。 证明 (1) 由E1E2可知E2=(E2-E1)∪E1,且(E2-E1)∩E1=,根据前面给出的定理可知E2-E1可测,且 mE2=m(E2-E1)+mE1 或者 m(E2-E1)=mE2-mE1 而m(E2-E1)≥0,所以mE1≤mE2。 (2) 假设Ek两两互不相交,则同样根据前面给出的定理可知,它们的有限并集也可测,并且 m∪nk=1Ek=∑nk=1mEk 根据内测度的定义以及上确界的意义,对于任意的ε>0,必然存在闭集 F∪nk=1Ek 使得 mF>m*∪nk=1Ek-ε=m∪nk=1Ek-ε 又因为FE,故 m*E≥mF>∑nk=1mEk-ε 在上式中,先令ε→0,再令n→+∞,得 m*E≥∑+∞k=1mEk 类似地,根据外侧度的定义,还可以得到 m*E≤∑+∞k=1mEk 于是有 m*E≤∑+∞k=1mEk≤m*E 但是m*E≤m*E,于是可得m*E=m*E。因此集E可测,且 mE=∑+∞k=1mEk 此外,如果Ek中有彼此相交的情况,由 E=∪+∞k=1Ek=E1∪(E2-E1)∪(E3-(E1∪E2))∪… ∪(En-(E1∪E2∪…∪En-1))∪… 即可将E分解为互不相交的可测集的并,于是根据上面已经证明的定理,即知E可测。 对开集与闭集进行至多可列次的交、并运算所得到的集,通常称为博雷尔(Borel)集。凡博雷尔集都是勒贝格可测集。因此,勒贝格可测集类是相当广泛的集类,而且通常大多数集合都是勒贝格可测的。但是,也的确有勒贝格不可测集的例子存在,本书对此不做过深涉及。 例如,区间[0,1]中的有理点集是L可测的,并且它的测度为0。因为单点集是L可测的,并且测度为0,而有理点集可以看作是可列个单点集的并,所以根据可列可加性就得到上述结论。由此还可以知道,区间[0,1]中的无理点集的测度是1。用类似的方法还可以证明,任何可数集的测度都为0,但其逆命题不一定成立。测度为0的集也称为零测集,还可以证明零测集的任何子集都是零测集。 定理设X=(a,b)是基本集,{Ek}是其中的可测集列。 (1) 若{Ek}是渐张的,即E1E2…Ek…,则 E=∪+∞k=1Ek 是可测集,并且 mE=limk→+∞mEk (2) 若{Ek}是渐缩的,即E1E2…Ek…,则 E=∩+∞k=1Ek 是可测集,并且 mE=limk→+∞mEk 设E是直线上的一个无界点集,如果它与任何开区间的交是可测的,那么称E为可测集,并且定义E的测度为 mE=limα→+∞m[(-α,α)∩E] 需要注意是,无界点集的测度可能是有限值,也可能是无穷大。利用这个定义可以将有界可测集的性质推广到无界可测集。而且仿照上述建立直线点集的测度理论的过程还可以建立平面点集甚至高维空间中点集的勒贝格测度理论。具体过程这里不再赘述。 3.1.2可测函数及其性质 定义设E为直线上的可测集(有界或无界),f(x)是定义在E上的实值函数。如果对于任何实数α,集合E(f≥α)={x|f(x)≥α,x∈E}都是勒贝格可测的,那么称f(x)是E上的勒贝格可测函数,简称可测函数。 定理函数f(x)在可测集E上可测的充要条件是: 对于任何实数α和β,集合 E(α≤f<β)={x|α≤f(x)<β,x∈E} 是勒贝格可测的。 证明首先证明必要性。设f(x)为E上的可测函数,由于 E(α≤f<β)=E(f≥α)-E(f≥β) 而E(f≥α)与E(f≥β)都是可测集,所以E(α≤f<β)也是可测集。 再证明其充分性。假设对于任何实数α和β,E(α≤f<β)是可测集,而且可以证明 E(f≥α)=∪∞n=1E(α≤f<α+n) 并且每个E(α≤f<α+n)都是可测集,于是E(f≥α)也是可测集,所以f(x)为E上的可测函数。 定理函数f(x)在可测集E上可测的充要条件是下列条件之一成立。 (1) E(f>α)={x|f(x)>α,x∈E}是可测集; (2) E(f≤α)={x|f(x)≤α,x∈E}是可测集; (3) E(f<α)={x|f(x)<α,x∈E}是可测集; (4) 对于直线上的任何开集G,它的原象f-1(x)是可测集,其中,α是任意实数。 例如,可以证明区间[0,1]上的狄利克雷函数 D(x)=1,x为[0,1]中的有理数 0,x为[0,1]中的无理数 是可测函数。 事实上,对于任何实数α,由于 E(D≥α)=,α>1 [0,1]中的有理点集,0<α≤1 [0,1]中的实数集合,α≤0 是可测集,因此D(x)是[0,1]上的可测函数。 在集合论中,指示函数(indicator function),或称特征函数(characteristic function),是定义在集合χ上的函数,它用以表示集合χ中的一个元素是否属于χ的某一子集A。如果函数值等于1,那么表示被考查的元素都在A中。反之如果函数值为0,则表示被考查的元素都在χ中,但不在A中。例如,设E为直线上的任意一点集,而且E是可测集,则集E的特征函数 χE(x)=1,x∈E 0,xE 是E上的可测函数,证明方法与前面分析狄利克雷函数的可测性的方法类似。 定理设f(x)与g(x)都是可测集E上的可测函数,那么kf(x)、f(x)±g(x)、f(x)·g(x)、f(x)/g(x)以及|f(x)|都是E上的可测函数。其中,k是常数,g(x)≠0。 3.1.3勒贝格积分的定义 定义设mE<+∞,f(x)是E上的有界可测函数,并且αn 由此对于每一个[f(x)]n而言,它都被控制在了[0,n]之间,即{[f(x)]n}是E上的有界可测函数列,而前面的定理表明“当mE<+∞时,则E上的任何有界可测函数f(x)是勒贝格可积的”。因此,对于每个n,都有 ∫E[f(x)]ndm 都存在。又因为[f(x)]1≤[f(x)]2≤…≤[f(x)]n≤…,所以极限 limn→+∞∫E[f(x)]ndm 也存在(可以取有限或无限值)。如果极限值是有限的,则称f(x)在E上勒贝格可积,并且积分值为 ∫Ef(x)dm=limn→+∞∫E[f(x)]ndm 如果极限值是无限的,则称f(x)在E上有积分。 更进一步,假定f(x)是E上的任意可测函数,那么定义 f+(x)=f(x),f(x)≥0 0,f(x)<0,f-(x)=-f(x),f(x)≤0 0,f(x)>0 并分别称它们为f(x)的正部和负部,则 f(x)=f+(x)-f-(x),f+(x)≥0,f-(x)≥0 如若下面两个积分不同时为+∞,则 ∫Ef+(x)dm,∫Ef-(x)dm 定义f(x)在E上的勒贝格积分为 ∫Ef(x)dm=∫Ef+(x)dm-∫Ef-(x)dm 若上式右端的两个积分都是有限的,则称f(x)在E上的勒贝格可积。否则,称f(x)在E上有积分。 下面再考虑E为任意可测集,f(x)为E上的可测函数时的情况。若f(x)是全直线R=(-∞,+∞)上的可测函数,极限 limn→+∞∫(-n,n)|f(x)|dm 存在且有限,则称f(x)在实数轴R上勒贝格可积,并且定义f(x)在R上的勒贝格积分为 ∫Rf(x)dm=limn→+∞∫(-n,n)f(x)dm 如果E是R上的任意可测集(mE可以为+∞),则f(x)在E上的勒贝格积分定义为 ∫Ef(x)dm=∫Rf(x)χE(x)dm 其中,χE(x)是E的特征函数。 至此,便完成了勒贝格积分的推广。 需要注意的是,存在勒贝格可积但黎曼不可积的函数。而且还可以证明,在有限区间[a,b]上黎曼可积的函数必定勒贝格可积,并且积分值相等。所以,勒贝格可积函数类比黎曼可积函数类广泛得多。而且前面给出的关于有界可测函数勒贝格积分的性质定理及推论对任意可测集上的任意可测函数的勒贝格积分也成立。 定理(绝对可积性)设f(x)是可测集E上的可测函数,则f(x)在E上勒贝格可积的充要条件是|f(x)|在E上可积,并且有 ∫Ef(x)dm≤∫E|f(x)|dm 定理(绝对连续性)设f(x)是可测集E上勒贝格可积,则对于任意的ε>0,存在δ>0及子集eE,使得当me<δ时, ∫ef(x)dm<ε 证明令g(x)=|f(x)|,则由绝对可积性定理即知g(x)可积。又由前面给出的 ∫Ef(x)dm=limn→+∞∫E[f(x)]ndm 可知对任意的ε>0,存在自然数N,使得下面的式子成立: ∫E(g(x)-[g(x)]N)dm<ε2 令δ=ε/2N,则当eE,且me<δ时, ∫ef(x)dm≤∫Eg(x)dm=∫E(g(x)-[g(x)]N)dm+∫E[g(x)]Ndm <ε2+N·me<ε 所以,定理得证。 定理(可列可加性)设f(x)是可测集E上勒贝格可积,且有 E=∪+∞k=1Ek 其中,Ek为互不相交的可测集,则 ∫Ef(x)dm=∑+∞k=1∫Ekf(x)dm 证明令 Rn=E-∪nk=1Ek 则由测度的可列可加性可得当n→+∞时 mRn=mE-∑nk=1mEk→0 根据积分的有限可加性,有 ∫Ef(x)dm-∑nk=1∫Ekf(x)dm=∫Rnf(x)dm 因此,再利用积分的绝对连续性即得 limn→+∞∫Rnf(x)dm=0 至此,便证明了可列可加性。 3.1.4积分序列极限定理 勒贝格积分的另一个显著优点就是,积分与极限运算交换次序所要求的条件与黎曼积分相比要弱很多,因而使用起来比较灵便。本节介绍几个常用的极限定理。 定理(勒贝格控制收敛定理)设mE<+∞,{fn(x)}是E上的可测函数列,并且几乎处处有 limn→+∞fn(x)=f(x) 若存在一个E上的勒贝格积分函数g(x),使得在E上几乎处处有 |fn(x)|≤g(x),n=1,2,… 则在E上勒贝格可积,并且 ∫Ef(x)dm=limn→+∞∫Efn(x)dm 推论(勒贝格有界收敛定理)在与上述定理相同的条件下,若存在常数M,使在E上几乎处处有 |fn(x)|≤M,n=1,2,… 则f(x)在E上勒贝格可积,并且 ∫Ef(x)dm=limn→+∞∫Efn(x)dm 显然,只要在前面的定理中取g(x)=M即可得到此推论。 定理设mE<+∞,f(x)与un(x)都是E上的非负可测函数,n=1,2,…,且几乎处处有 f(x)=∑+∞n=1un(x) 则 ∫Ef(x)dm=∑+∞n=1∫Eun(x)dm 证明由于f(x)在E非负可测,故积分∫Ef(x)dm有意义。又因为对于任意的正整数N,有 ∫Ef(x)dm≥∫E∑Nn=1un(x)dm=∑Nn=1∫Eun(x)dm 所以可得 ∫Ef(x)dm≥∑+∞n=1∫Eun(x)dm 如果上式右端等于无穷大则定理显然成立。现在假设 ∑+∞n=1∫Eun(x)dm<+∞ 令 SN(x)=∑Nn=1un(x) 则对于任意正整数k,必有 limN→+∞[SN(x)]k=[f(x)]k,x∈E 事实上,设x0∈E,若f(x0)≤k,则更有SN(x0)≤k,按照[SN(x)]k的定义,有 limN→+∞[SN(x0)]k=limN→+∞SN(x0)=f(x0)=[f(x0)]k 若f(x0)>k,则存在N0,使得N>N0时,SN(x0)>k,于是当N>N0时,[SN(x0)]k=k,从而 limN→+∞[SN(x0)]k=k=[f(x0)]k 因为[SN(x)]k≤k,根据勒贝格有界收敛定理 limN→+∞∫E[SN(x)]kdm=∫E[f(x)]kdm 又因为 ∫E[SN(x)]kdm≤∫ESN(x)dm 所以 ∑+∞n=1∫Eun(x)dm=limN→+∞∑Nn=1∫Eun(x)dm=limN→+∞∫ESN(x)dm ≥limN→+∞∫E[SN(x)]kdm=∫E[f(x)]kdm 令k→+∞,得 ∑+∞n=1∫Eun(x)dm≥∫Ef(x)dm 综上即得下式,所以结论得证。 ∫Ef(x)dm=∑+∞n=1∫Eun(x)dm 定理设mE<+∞,{fn(x)}是E上的非负可测函数列,并且 f1(x)≤f2(x)≤…≤fn(x)≤… 而函数列{fn(x)}逐点收敛于函数f(x),即 limn→+∞fn(x)=f(x),a.e.a.e.为almost everywhere的缩写。 则 ∫Ef(x)dm=limn→+∞∫Efn(x)dm 该定理或许是最重要的勒贝格单调收敛定理,又称为莱维(Beppo Levi)定理。 证明设f0(x)=0,令un(x)=fn(x)-fn-1(x),n=1,2,…,则un(x)≥0,且 ∑+∞n=1un(x)=∑+∞n=1[fn(x)-fn-1(x)]=limn→+∞fn(x)=f(x),a.e. 由前面刚刚证明过的定理可得 ∫Ef(x)dm=∑+∞n=1∫Eun(x)dm=∑∞n=1∫E[fn(x)-fn-1(x)]dm =limn→+∞∑nk=1∫E[fk(x)-fk-1(x)]dm =limn→+∞∫E∑nk=1[fk(x)-fk-1(x)]dm=limn→+∞∫Efn(x)dm 定理得证。 3.2泛函与抽象空间 牛顿说: “把简单的问题看得复杂,可以发现新领域; 把复杂的问题看得简单,可以发现新规律。”而从历史的角度看,一个学科的发展也是如此。随着学科的发展,最开始的一个主干方向会不断衍生出各自相对独立的分支,这也就是所谓“把简单的问题看得复杂”的过程。然而,一旦学科发展到一定程度之后,某些分支学科又开始被抽象综合起来,这也就是所谓“把复杂的问题看得简单”的过程。例如,在很长一段时间里,物理学家都把电和磁看成是两种独立的物理现象在研究,当学科研究积累到一定程度时,麦克斯韦就创立了电磁学,从而完成了物理学中的一次大综合。而在数学发展的历史中,几何与代数也曾经在很长的一段时间里是彼此独立的。直到笛卡儿引入了直角坐标系的概念之后,人们才开始建立了一种代数与几何之间的联系,也就是所谓的解析几何。泛函分析也是对以往许多数学问题或者领域进行高度抽象和综合的结果,其主要研究对象之一是抽象空间。其实在学习线性代数的过程中,人们已经建立了一种从矩阵到线性方程组之间的一种联系。而在泛函分析中,实数系、矩阵、多项式以及函数族这些看似关联不大的概念都可以抽成空间。由于泛函分析是一门比较晦涩抽象的学问,应该注意联系以往学习中比较熟悉的一些已知的、具体的概念,从而帮助理解那些全新的、抽象的概念。需要说明的是,本部分内容的重点在于有关定义或者概念的介绍,希望能够努力领会这些定义或者概念。 3.2.1线性空间 线性空间是最基本的一种抽象空间。实数的全体R1,二维平面向量的全体R2,三维空间向量的全体R3,以及所有次数不大于n的实系数多项式的全体等,都是线性空间的实例。 定义设E为非空集合,如果对于E中任意两个元素x和y,均对应于E中的一个元素,称为x与y之和,记为x+y; 对于E中任意一个元素x和任意一个实数λ,均对应于E中的一个元素,称为x与λ的数乘,记为λx; 并且上述两种运算满足下列运算规律(x、y、z为E中任意一个元素,λ与μ为任意实数)。 (1) x+y=y+x; (2) x+(y+z)=(x+y)+z; (3) E中存在唯一的零元素θ(有时也记为0),它满足θ+x=x,并且对任意x均存在唯一的负元素-x∈E,它满足x+(-x)=θ; (4) λ(μx)=(λμ)x; (5) 1x=x,0x=0; (6) λ(x+y)=λx+λy; (7) (λ+μ)x=λx+μx。 称E是实线性空间。由于本章内容只考虑实数的情况,因此也可以将E简称为线性空间。从定义中可见,线性空间的核心思想就在于引入加法和乘法两种代数运算基础上同时保证封闭性。 根据上述定义可以证明下列结论成立。 (1) 所有次数不大于n的实系数多项式所构成的结合Pn是线性空间。 (2) 所有在区间[a,b]上连续的实函数所构成的集合C[a,b]是线性空间。 (3) 所有在区间[a,b]上具有连续的k阶导数的实函数所构成的集合Ck[a,b]是线性空间。 与线性代数中类似,可以在线性空间中引入线性相关、线性无关以及基的概念。设x1,x2,…,xn是线性空间E中的n个元素,其中n≥1,如果存在不全为零的常数λ1,λ2,…,λn,使得 λ1x1+λ2x2+…+λnxn=θ 则称x1,x2,…,xn是线性相关的。反之,若由λ1x1+λ2x2+…+λnxn=θ的成立可导出λ1=λ2=…=λn=0,则称x1,x2,…,xn是线性无关的。回忆线性代数中关于线性相关的解释,向量组x1,x2,…,xn线性相关的充分必要条件是其中至少有一个向量可以由其余n-1个向量线性表示。尽管上述结论表明向量组中的线性相关性与其中某一个向量可用其他向量线性表示之间的联系。但是,它并没有断言究竟是哪一个向量可以由其他向量线性表示。关于这个问题可以用下面这个结论来回答。如果向量组e1,e2,…,en,x线性相关,而向量组e1,e2,…,en线性无关,那么向量x就可以由向量组e1,e2,…,en线性表示,而且表示形式唯一。 基于上述讨论,便可引出基的概念。如果线性空间E中存在n个线性无关的元素e1,e2,…,en,使得E中任意一个元素x均可以表示成 x=∑ni=1ξiei 那么,称{e1,e2,…,en}为空间E的一组基。并且称n为空间E的维数,记为dimE=n。而E称为有限维(n维)线性空间。不是有限维的线性空间称为无穷维线性空间。可见,Pn是有限维的,而C[a,b]和Ck[a,b]都是无穷维的。 3.2.2距离空间 尽管在线性空间上已经可以完成简单的线性运算,但这仍然不能满足需求。为了保证数学刻画的精确性,还必须引入距离的概念。本章是从极限开始讲起的,它是微积分的必备要素之一,而极限的概念显然也是基于距离上无限接近的角度描述的。 定义设X是非空集合,若对于X中任意两个元素x和y,均有一个实数与之对应,此实数记为d(x,y),满足: (1) 非负性: d(x,y)≥0; 而d(x,y)=0的充分条件是x=y; (2) 对称性: d(x,y)=d(y,x); (3) 三角不等式: d(x,y)≤d(x,z)+d(z,y)。 其中,z是X中的任意元素。称d(x,y)为x和y的距离,并称X是以d为距离的距离空间。 例如,通常n维向量空间Rn,其中任意两个元素x=[ξi]ni=1和y=[ηi]ni=1的距离定义为 d2(x,y)=∑ni=1|ξi-ηi|212 因此,Rn就是以上式为距离的距离空间。同样,在Rn中还可以引入距离 d1(x,y)=∑ni=1|ξi-ηi| 或 dp(x,y)=∑ni=1|ξi-ηi|p1p,p>1 或 d+∞(x,y)=max1≤i≤n|ξi-ηi| 可见,在同一个空间内可以通过不同方式引入距离。而且在同一空间中引入不同的距离后,就认为是得到了不同的距离空间。因此,常用符号(X,d)表示距离空间,如(Rn,d1),(Rn,dp)等。 同样,还可以考虑定义在区间[a,b]上的连续函数的全体C[a,b],其中任意两个元素x(t)与y(t)间的距离可定义为 d(x,y)=maxa≤t≤b|x(t)-y(t)| 现在思考以上述距离定义为基础的连续函数空间是否是一个距离空间。显然,定义中的前两个条件很容易满足。下面简单地证明。 |x(t)-y(t)|≤|x(t)-z(t)|+|z(t)-y(t)| ≤maxa≤t≤b|x(t)-z(t)|+maxa≤t≤b|z(t)-y(t)|=d(x,z)+d(z,y) 对所有的t∈[a,b]成立,且上式右端与t无关,因此有 d(x,y)=maxa≤t≤b|x(t)-y(t)|≤d(x,z)+d(z,y) 在文章的最开始讨论过极限的有关内容。现在考虑如何在距离空间中定义极限。设{xn}+∞n=1是距离空间(X,d)中的元素序列,如果(X,d)中的元素x满足 limn→+∞d(xn,x)=0 则称{xn}是收敛序列,x称为它的极限,记作xn→x。 而且易得,如果序列{xn}有极限,则极限是唯一的。实际上,如果x与y都是{xn}的极限,则在式0≤d(x,y)≤d(x,xn)+d(xn,y)中令n→+∞,即可得出d(x,y)=0,从而x=y。 可以看出,在n维空间Rn中,不论距离是d1、d2、dp(p>1)或d+∞,序列{xn}的收敛都是指按(每个)坐标收敛。而连续函数空间C[a,b]中序列{xn(t)}的收敛就是前面讲过的一致收敛。 下面再引入球形邻域的概念: 设r为某一正数,集合 Sr(x0)={x∈X; d(x,x0)0,bi>0(i=1,2,…,n),p>1,则 ∑ni=1(ai+bi)p1p≤∑ni=1api1p+∑ni=1bpi1p 证明 ∑ni=1(ai+bi)p=∑ni=1ai(ai+bi)p-1+∑ni=1bi(ai+bi)p-1 对上式右端两个和数分别应用赫尔德不等式,得到 ∑ni=1(ai+bi)p≤∑ni=1api1p∑ni=1(ai+bi)(p-1)p′1p′+∑ni=1bpi1p∑ni=1(ai+bi)(p-1)p′1p′ =∑ni=1api1p+∑ni=1bpi1p∑ni=1(ai+bi)(p-1)p′1p′ 由于1/p+1/p′=1,所以上述不等式可以改写为 ∑ni=1(ai+bi)p≤∑ni=1api1p+∑ni=1bpi1p∑ni=1(ai+bi)p1p′ 然后,用最后一个因式作除式,等式两边同时做除法,即得到欲证明的不等式。 基于前面三个范数的定义,可知空间Rn是按范数式‖·‖2、‖·‖p和‖·‖+∞的线性赋范空间。为了区别,通常把这三种线性赋范空分别记为l2n、lpn和l+∞n。由此可见,同一线性空间中可以引入多种范数。 连续函数空间C[a,b]中元素x(t)的范数可以定义为 ‖x(t)‖=maxa≤t≤b|x(t)| 因此,C[a,b]是按上述范数式的线性赋范空间,仍将它记为C[a,b]。此外,还可以定义x(t)的范数表达式为(p≥1) ‖x(t)‖p=∫ba|x(t)|pdt1p 它称为p范数。此时,所对应的线性赋范空间记为L~p[a,b]。‖·‖p可以成为范数的原因同样是由前面讲过的闵可夫斯基不等式保证,但此时的闵可夫斯基不等式需将原来求和号改为积分符号,即 ∫ba|x(t)+y(t)|pdt1p≤∫ba|x(t)|pdt1p+∫ba|y(t)|pdt1p 可见,线性赋范空间同时也是距离空间,因为可以定义d(x,y)=‖x-y‖。于是,线性赋范空间中的序列{xn}收敛于x就是指‖xn-x‖→0,(n→+∞)。例如,空间C[a,b]的收敛性是一致收敛,而L~p[a,b]中序列xn(t)收敛于x(t)是p幂平均收敛 ∫ba|xn(t)-x(t)|pdt→0 在线性赋范空间中的收敛性: ‖xn-x‖→0又称为依范数收敛。 设X1和X2都是线性赋范空间。记有次序的元素对{x1,x2}(其中x1∈X1,x2∈X2)的全体所构成的集合为X1×X2。定义{x1,x2}+{y1,y2}={x1+y1,x2+y2},λ{x1,x2}={λx1,λx2}及‖{x1,x2}‖=‖x1‖+‖x2‖,则X1×X2是线性赋范空间。它称为空间X1和X2的乘积空间。 接下来,介绍几条关于范数和依范数收敛的基本性质(这些性质在介绍极限时也有提及): (1) 范数‖x‖关于变元x是连续的,即当xn→x时,‖xn‖→‖x‖; (2) 若xn→x,yn→y,则xn+yn→x+y; (3) 若xn→x,且数列an→a,则anxn→ax; (4) 收敛序列必为有界序列,即若xn→x,则{‖xn‖}是有界序列。 3.2.4巴拿赫空间 定义设X为线性赋范空间,{xn}+∞n=1是空间X中的无穷序列。如果对于任给的ε>0,总存在自然数N,使得当n>N时,对于任意给定的自然p,均有‖xn+p-xn‖<ε,则称序列{xn}是X中的基本序列(或称柯西序列)。 显然,X中的任何收敛序列都是基本序列。为了证明该结论不妨设xn→x,即任意给定的ε>0,总存在自然数N,使得当n>N时,有‖xn-x‖<ε/2成立。于是对于任意的自然数p,同时还有‖xn+p-x‖<ε/2。根据三角不等式,有‖xn+p-xn‖≤‖xn+p-x‖+‖xn-x‖<ε。然而,基本序列却不一定收敛。 定义如果线性赋范空间X中的任何基本序列都收敛于属于X的元素,则称X为完备的线性赋范空间,或称为巴拿赫(Banach)空间。 下面考虑L~2[-1,1]是不是巴拿赫空间。为此,不妨考查空间L~2[-1,1]中的序列 xn(t)=-1,t∈[-1,-1/n] nt,t∈[-1/n,1/n] +1,t∈[1/n,1] 显然xn(t)都是连续函数,且|xn(t)|≤1,因此‖xn+p(t)-xn(t)‖≤2,从而当n→+∞时,则 ‖xn+p(t)-xn(t)‖2=∫1-1|xn+p(t)-xn(t)|2dt =∫1n-1n|xn+p(t)-xn(t)|2dt≤4∫1n-1ndt=8n→0 这表明{xn(t)}是空间L~2[-1,1]中的基本序列。但同时当n→+∞时,xn(t)的极限函数是间断函数。换言之,xn(t)的极限函数不属于空间L~2[-1,1]。因此,序列{xn(t)}是空间L~2[-1,1]中没有极限,或者说{xn(t)}不是该空间中的收敛序列。既然线性赋范空间中的存在不收敛于该空间中元素的基本序列,那么空间L~2[-1,1]就不是巴拿赫空间。一般地,L~p[a,b],其中p≥1,都不是巴拿赫空间。 但是空间C[a,b]是巴拿赫空间。为了说明这一点,不妨设{xn(t)}是C[a,b]中的基本序列,即任意给定的ε>0,总存在自然数N,使得当n>N时,对于任意的自然数p均有 maxa≤t≤b|xn+p(t)-xn(t)|<ε 根据前面介绍的函数序列一致收敛的柯西准则可知,{xn(t)}是一致收敛序列。由于每个函数xn(t)在[a,b]上都连续,因此它的极限函数在[a,b]上连续,即该极限函数属于空间C[a,b]。类似地,Ck[a,b]也是完备的。 关于有限维空间的完备性,有如下一般化结论: 任意一个有限维线性赋范空间必为巴拿赫空间。而且由此还可以得到一个推论: 任意一个线性赋范空间的有限维子空间都是闭子空间。 于是也得到了无穷维空间与有限维空间的一个重要差别: 无穷维空间可以不完备,而有限维空间一定完备。 回忆本章前面关于函数项级数的内容,现在研究巴拿赫空间中的级数。 定理巴拿赫空间中的级数∑+∞k=1xk收敛的充分必要条件是: 对于任意给定的ε>0,总存在自然数N,当n>N时,对任何自然数p,均有 ∑n+pk=nxk<ε 定义若数值级数∑+∞k=1‖xk‖收敛,则称级数∑+∞k=1xk绝对收敛。 回想一下前面介绍过的魏尔斯特拉斯判别法(又称M判别法): 如果函数项级数∑+∞n=1un(x)在区间I上满足条件,x∈I,|un(x)|≤Mn(n=1,2,…),并且正向级数∑+∞n=1Mn收敛,则函数项级数∑+∞n=1un(x)在区间I上一致收敛。 此处便得到了一个更加泛化的表述(只要把其中的|un(x)|≤Mn替换成‖fn(x)‖≤Mn): 如果函数序列{fn: X→Y}的陪域陪域又称上域或到达域,给定一个函数f: A→B,集合B称为是f的陪域。一般来说,值域只是陪域的一个子集。是一个巴拿赫空间(Y,‖·‖),x∈X,存在‖fn(x)‖≤Mn(n=1,2,…),并且正向级数∑+∞n=1Mn收敛,即∑+∞n=1Mn<+∞,则函数项级数∑+∞n=1fn(x)一致收敛。 证明考虑级数的部分和序列sn=∑ni=1fi,并取任意p,n∈N,其中p≤q,那么对于任意x∈X,有 ‖sq(x)-sp(x)‖=∑qk=p+1fk(x)≤∑qk=p+1‖fk(x)‖≤∑qk=p+1Mk 因为正向级数∑+∞n=1Mn收敛,根据数项级数的柯西收敛定理,对于任意给定的ε>0,总存在自然数N,使得当p>N,以及x∈X,有 ∑qk=p+1fk(x)≤∑qk=p+1Mk<ε 而本节前面介绍过的定理也给出了巴拿赫空间中的级数收敛的充分必要条件,由此该定理得证。 从这个证明过程中,还得到了M判别法在巴拿赫空间中的一种更简单的表述: 若级数∑+∞k=1xk是巴拿赫空间中的绝对收敛级数,则∑+∞k=1xk收敛。或表述为: 当空间是巴拿赫空间时,若其中的级数绝对收敛,则该级数一定收敛。注意,该定理在描述时并没有强调一致收敛,这是因为一致收敛时针对函数项级数而言的,此处所得到的泛化结果是对巴拿赫空间中的元素来说的,即并不要求其中的元素一定是函数,所以也就不再强调一致收敛了。 这是因为,如果级数∑+∞k=1xk是巴拿赫空间中的绝对收敛,那么根据定义,就意味着数值级数∑+∞k=1‖xk‖收敛。同样根据数项级数的柯西收敛定理,可知对于任意给定的ε>0,总存在自然数N,使得当n>N,对于任何自然数p,均有 ∑pk=n+1‖xk‖<ε 又因为 ∑pk=n+1xk≤∑pk=n+1‖xk‖ 即 ∑pk=n+1xk<ε 由此定理得证。 最后,考虑上述定理的逆命题。 定理如果线性赋范空间X中的任意绝对收敛级数都是收敛的,则X是巴拿赫空间。 证明设{xn}是X中的基本序列,则显然它是有界序列‖xn‖≤c,且可以选出某一个子序列{xnk},使得 ‖xnk-xnk+1‖<12k,k≥2 于是,级数 xn1+(xn2-xn1)+…+(xnk-xnk+1)+… 绝对收敛。这是因为级数c+∑+∞k=1(1/2k)收敛。根据定理假设,上述级数收敛。设其部分和为sk,则sk→x∈X。但是sk=xnk,于是序列{xn}有一子序列{xnk}收敛于x∈X(当k→+∞时)。因此,对于任意给定的ε>0,总存在自然数N1,当nk>N1时,有 ‖xnk-x‖<ε2 又因{xn}是基本序列,因此存在自然数N(不妨设N>N1),当n和nk>N时,有 ‖xn-xnk‖<ε2 于是, ‖xn-x‖≤‖xn-xnk‖+‖xnk-x‖<ε 这也就表明xn→x,定理得证。 通过前面的介绍,应该知道n维空间中任意一个元素x均可表示为其中某一组基{e1,e2,…,en}的线性组合 x=∑ni=1ξiei 这组基的元素正好是n个。现在要在无穷维空间中讨论类似的问题。 以空间lp+∞(p≥1)为例,令ek=[0,…,0,1,0,…],其第k个分量为1,其余为0,则显然lp+∞中任一元素x=[ξ1,ξ2,…]可唯一地表示为 x=∑+∞k=1ξkek 因此,元素组{ek}+∞k=1可以作为空间lp+∞的一组基,但这组基的元素个数不是有限的。一个无穷集合,如果它的全部元素可以安装某种规则与自然数集合{1,2,…}建立一一对应关系,就称此无穷集合为可数集(或称可列集)。显然有限个可数集的和集仍然是可数集,甚至“可数”个可数集的和集也是可数集。所以,全部有理系数的多项式所构成的集合P0是可数集。 显然,空间lp+∞的基{e1,e2,…}是一个可数集,这样的基称为可数基。由此,可以进行下面的讨论。 定义设M是线性赋范空间X的子集,如果对于任意的元素x∈X及正数ε,均可在M中找到一个元素m。使得‖x-m‖<ε,则称M在X中稠密。 稠密性有下列等价定义: (1) X中的任一球形邻域内必含有M的点; (2) 任取x∈X,则必有序列{xn}M,使得xn→x; (3) M在X中稠密的另一个充分必要条件是X。 定义如果线性赋范空间X中存在可数的稠密子集,则称空间X是可分的。 例如,实数集lp1是可分的,因为所有有理数在其中是稠密的,而有理数集是可数集。进而,n维空间lpn(1≤p<+∞)也是可分的,因为坐标为有理数的点的全体构成其中的一个可数稠密子集。 定理具有可数集的巴拿赫空间是可分的。 空间的完备性是实数域的基本属性的抽象和推广。完备的线性赋范空间具有许多类似实数域的优良性质,其关键是可以在其中顺利地进行极限运算。而且,不完备的空间也可以在一定的意义下进行完备化。连续函数空间L~p[a,b]的完备化空间记作Lp[a,b],称为p次勒贝格可积函数空间。鉴于本书后续内容中会对此稍有涉及,因此这里需要指出,当p=1时,空间L1[a,b]的元素称为勒贝格可积函数。空间L1[a,b]中的元素是“可积”的函数,其积分是关于上限的连续函数; 另外,L1[a,b]中两个函数x(t)和y(t)相等是指 ∫ba|x(t)-y(t)|dt=0 此时,如果x(t)和y(t)仅在个别点(例如有限个点或者一个可数点集)上取值不等,并不影响上式成立,因此常称x(t)和y(t)是“几乎处处”相等的。关于空间Lp[a,b],其元素是p次可积的 ∫ba|x(t)|pdt<+∞ 例如,空间L2[a,b]表示平方可积函数的全体。物理上,平方可积函数可以表示能量有限的信号。此外,有关系L1[a,b]L2[a,b],这由下式得知 ∫ba|x(t)|dt=∫ba|x(t)|·1dt≤∫ba|x(t)|2dt12∫ba12dt12 ≤b-a∫ba|x(t)|2dt12 其中用到了赫尔德不等式。一般地,如果p′0 因而对于任意n,有 x-∑ni=1(x,ei)ei2=‖x‖2-∑+∞i=1|(x,ei)|2≥a2 即 x≠∑ni=1(x,ei)ei 这与假设条件矛盾,因此命题得证。 (3)(4),对任意x∈H,帕塞瓦尔等式成立,则由前面介绍过的定理得出 ‖x-xn‖2=x-∑ni=1(x,ei)ei2=‖x‖2-∑ni=1|(x,ei)|2 根据帕塞瓦尔等式,可知 limn→+∞x-∑ni=1(x,ei)ei2=limn→+∞‖x‖2-∑ni=1|(x,ei)|2=0 即证明了 x=∑+∞i=1(x,ei)ei (4)(1),对任意x∈H,有 x=∑+∞i=1(x,ei)ei 并设x⊥ei(i=1,2,…),显然有x=θ,因此{en}为H中的完全的标准正交系。 3.2.7索伯列夫空间 把区间[a,b]上一阶连续可微函数的全体所构成的集合记为H~1[a,b]。显然,在通常的函数加法,乘法意义下,H~1[a,b]是线性空间。对于任意的u(t),v(t)∈H~1[a,b],定义其内积为 (u,v)=∫bau(t)v(t)dt+∫bau′(t)v′(t)dt 则不难验证它满足关于内积的四条公理,因而H~1[a,b]是内积空间,相应的范数为 ‖u‖=∫ba[u(t)]2dt+∫ba[u′(t)]2dt1/2 空间H~1[a,b]在上述范数意义下的完备化空间记为H1(a,b),它称为索伯列夫(Sobolev)空间。 设序列{un(t)}H~1[a,b]是上述范数意义下的基本序列,即当n,m→+∞时 ‖un-um‖2=∫ba[un(t)-um(t)]2dt+∫ba[u′n(t)-u′m(t)]2dt→0 如果{un(t)}和{u^n(t)}是H~1[a,b]中的两个基本列,且满足当n→+∞时,‖un(t)-u^n(t)‖→0,则认为它们属于同一类。上述条件也等价于 ∫ba[un(t)-um(t)]2dt→0 ∫ba[u′n(t)-u′m(t)]2dt→0 根据空间L2[a,b]的完备性,存在u(t)∈L2[a,b]及w(t)∈L2[a,b],使得当n→+∞时,在L2范数的意义下,un(t)→u(t),u′n(t)→w(t)。对如此所确定的函数u(t)和w(t),称w(t)是u(t)在索伯列夫意义下的广义导数,并记成u′(t)=w(t)。显然,如果u(t),v(t)∈H1(a,b),则au(t)+bv(t)∈H1(a,b)且(au+bv)′(t)=au′(t)+bv′(t); 而常数的广义导数为零。 由广义导数的定义可以看出,这种导数不是关于函数的个别点处局部性质反映,因为它是通过在整个区间上积分的极限确定的,而积分是一种关于函数的整体性质的概念。但也应该指出,广义导数其实是对通常意义下导数概念的推广。如果函数本身是通常意义下可微的,则其导函数与广义导数是一致的。 类似地,记H~2[a,b]为[a,b]上二阶连续可微函数的全体,其内积定义为 (u,v)=∫bauvdt+∫bau′v′dt+∫bau″v″dt 则H~2[a,b]的完备化空间相应地记为H2[a,b],也称为索伯列夫空间,空间H2[a,b]中的元素u(t)具有一阶和二阶广义导数,且u′(t),u″(t)∈L2[a,b],即它们都是勒贝格平方可积的。因此,可定义一般的索伯列夫空间Hk[a,b]。而且上述这些定义还可以推广到多维的情形,这里不再深究,有兴趣的读者可以参阅泛函分析方面的资料。 3.3从泛函到变分法 作为数学分析的一个分支,变分法(calculus of variations)在物理学、经济学以及信息技术等诸多领域都有着广泛而重要的应用。变分法是研究依赖于某些未知函数的积分型泛函极值的普遍方法。换句话说,求泛函极值的方法就是变分法。 3.3.1理解泛函的概念 变分法是现代泛函分析理论的重要组成部分,但变分法却是先于泛函理论建立的。因此,即使不过深地涉及泛函分析的相关内容,也可展开对变分法的学习。而在前面介绍的有关抽象空间的内容上来讨论泛函的概念将是非常方便的。 定义设X和Y是两个给定的线性赋范空间,并有集合DX。若对于D中的每一个元素x,均对应于Y中的一个确定的元素y,就说这种对应关系确定了一个算子。算子通常用大写字母T,A,…表示,记为y=Tx或y=T(x)。y称为x的象,x称为y的原象。集合D称为算子T的定义域,常记为D(T); 而集合R(T)={y∈Y; y=Tx,x∈D(T)}称为算子T的值域。对于算子T,常用下述记号T: X Y,读作“T是由X到Y的算子”。但应注意这种表示方法并不意味着D(T)=X及R(T)=Y。 当X和Y都是实数域时,T就是微积分中的函数。因此,算子是函数概念的推广,但是算子这个概念要比函数更抽象,也更复杂。 设X为实(或复)线性赋范空间,则由X到实(或复)数域的算子称为泛函。例如,若x(t)是任意一个可积函数x(t)∈L2[a,b],则其积分 f(x)=∫bax(t)dt 就是一个定义在L1[a,b]上的泛函,而且是线性的 f(αx+βy)=α∫bax(t)dt+β∫bay(t)dt=αf(x)+βf(x) 还是有界的 |f(x)|≤∫ba|x(t)|dt=‖x‖ 需要说明的是,此处所讨论的仅限于实数范围内的泛函。 如果把上述泛函定义中的线性赋范空间局限于函数空间,那么也可以从另外一个角度来理解此处所要讨论的泛函。 把具有某种共同性质的函数构成的集合称为函数类,记作F。对于函数类F中的每一个函数y(x),在R中变量J都有一个确定的数值按照一定的规律与之相对应,则J称为函数y(x)的泛函,记作J=J[y(x)]或者J=J[y]。函数y(x)称为泛函J的宗量。函数类F称为泛函J的定义域。可以这样理解,泛函是以函数类为定义域的实值函数。为了与普通函数相区别,泛函所依赖的函数用方括号括起来。 由泛函的定义可知,泛函的值是数,其自变量是函数,而函数的值与其自变量都是数,所以泛函是变量与函数的对应关系,它是一种广义上的函数。而函数是变量与变量的对应关系,这是泛函与函数的基本区别。此外还应当意识到,泛函的值既不取决于自变量x的某个值,也不取决于函数y(x)的某个值,而是取决于函数类F中y与x的函数关系。 由于一元函数在几何上是由曲线来表示的,因此它的泛函也可以称为是曲线函数。类似地,二元函数在几何上的表现形式通常都是曲面,因此它的泛函也可以称为是曲面函数。如果x是多维域(x1,x2,…,xn)上的变量时,以上定义的泛函也适用。此时,泛函记为J=J[u(x1,x2,…,xn)]。同时也可以定义依赖于多个未知函数的泛函,记为J=J[y1(x),y2(x),…,ym(x)]。其中,y1(x),y2(x),…,ym(x)都是独立变化的。还有泛函记为J=J[y1(x1,x2,…,xn),y2(x1,x2,…,xn),…,ym(x1,x2,…,xn)],同样要求y1(x1,x2,…,xn),y2(x1,x2,…,xn),…,ym(x1,x2,…,xn)也都是独立变化的。这就表示该泛函的定义依赖于多个未知函数,且每个未知函数又依赖于多维变量。 设已知函数F(x,y(x),y′(x))是由定义在区间[x0,x1]上的三个独立变量x,y(x),y′(x)所共同确定的,并且是二阶连续可微的,则泛函 J[y(x)]=∫x1x0F(x,y(x),y′(x))dx 称为最简单的积分型泛函,或简称为最简泛函。被积函数F称为泛函的核。 同理,还可以定义变量函数为二元函数u(x,y)时的泛函为 J[y]=SF(x,y,u,ux,uy)dxdy 其中,ux=u/x,uy=u/y。 此处所讨论的部分主要是古典变分法的内容。它所研究的主要问题可以归结为: 在适当的函数类中选择一个函数使得类似于上述形式的积分取得最值。而解决这一问题又归结为求解欧拉拉格朗日方程。这看起来并非一个多么复杂的问题,而且方法似乎也平常无奇。但依靠这种方法却惊异地发现原来自然世界中许多千差万别的问题居然能够使用统一的数学程序来求解,而且奇妙的变分原理还可以用来解释无数的自然规律。在3.3.2节中,将从最简泛函开始导出欧拉拉格朗日方程。 3.3.2变分的概念 已知一个函数在某一点处取极值,那么函数在该点处的导数(如果存在)必为零。那么要考虑一个泛函的极值问题,就不妨参照函数求极值的思想引入一个类似的概念,为此需引入变分的概念,这也是得出欧拉拉格朗日方程的关键所在。 对于任意定值x∈[x0,x1],可取函数y(x)与另一个可取函数y0(x)之差称为函数y(x)在y0(x)处的变分,记作δy,δ称为变分符号,此时有 δy=y(x)-y0(x)=εη(x) 其中,ε是一个参数,η(x)为x的任意函数。由于可取函数都通过区间的端点,即它们在区间的端点值都相等,因此在区间的端点,任意函数η(x)满足 η(x0)=η(x1)=0 因为可取函数y(x)是泛函J[y(x)]的宗量,故也可以这样定义变分: 泛函的宗量y(x)与另一宗量y0(x)之差y(x)-y0(x)称为宗量y(x)在y0(x)处的变分。 上述变分的定义也可以推广到多元函数的情形。 显然,函数y(x)的变分δy是x的函数。注意,函数变分δy与函数增量Δy的区别。函数的变分δy是两个不同函数y(x)与y0(x)在自变量x取固定值时的差αη(x),函数发生了改变; 函数的增量Δy是由于自变量x取了一个增量而使得函数y(x)产生的增量,函数仍然是原来的函数。 如果函数y(x)与另一函数y0(x)都可导,则函数的变分δy有如下性质 δy′=y′(x)-y′0(x)=[y(x)-y0(x)]′=(δy)′ 由此得到变分符号δ与导数符号之间的关系 δdydx=ddxδy 即函数导数的变分等于函数变分的导数。换言之,求变分与求导数这两种运算次序可以交换。在进行变分法的推导时要经常用到变分的这个性质。上面这些性质也可推广到高阶导数的变分情形,具体情况这里不再赘述。 上面介绍了函数的变分,下面来考虑泛函的变分。例如,对于泛函 J[y]=∫bay2(x)dx 的增量,可以表示为 ΔJ=J[y1(x)]-J[y2(x)]=Q[y(x)+δy]-J[y(x)] =∫ba[y(x)+δy]2dx-∫bay2(x)dx =∫ba[y2(x)+2y(x)δy+(δy)2]dx-∫bay2(x)dx =∫ba2y(x)δydx+∫ba(δy)2dx 其中,δy=y1(x)-y(x)。 可见,此泛函J的增量ΔJ由两项相加而得。将第一项记为 ∫ba2y(x)δydx=T[y(x),δy] 当函数y(x)固定时,T[y(x),δy]是关于δy的线性泛函。这是因为对任何常数C而言,有 T[y(x),Cδy]=∫ba2y(x)Cδydx=C∫ba2y(x)δydx=CT[y(x),δy] 且 T[y(x),δy1+δy2]=∫ba2y(x)(δy1+δy2)dx =∫ba2y(x)δy1dx+∫ba2y(x)δy2dx =T[y(x),δy1]+T[y(x),δy2] 再来考查第二项,此处δy=y1(x)-y(x),其中y(x)是已经给定的函数,y1(x)是任意取的函数,y(x)和y1(x)均属于C[a,b] 若 maxa≤x≤b|y1(x)-y(x)|=max|δy|→0 由 ∫ba(δy)2dx≤maxa≤x≤b(δy)2(b-a) 可知 ∫ba(δy)2dxmax|δy|→0 上式表明,当max|δy|→0时,分子是比分母更高阶的无穷小量,不妨记为 ∫ba(δy)2dx=0(δy) 于是ΔJ=T[y(x),δy]+0(δy)。这其实表明,原泛函的增量可以分解为两个部分,第一部分是δy的线性泛函,第二部分是比δy更高阶的无穷小量。回想函数微分的概念,函数的微分其实是函数增量的线性主要部分。换言之,微分就是当自变量的变化非常小时,用来近似等于因变量的一个量。上述对函数增量及微分关系的分析其实在提示人们,是否可以用泛函增量中的线性主要部分来近似等于泛函的增量。其实这种所谓的泛函增量中的线性主要部分就是下面定义中所给出的泛函的变分。 定义对于泛函J[y(x)],给y(x)以增量δy,即y(x)的变分,则泛函J有增量ΔJ=J[y(x)+δy]-J[y(x)]。如果ΔJ可以表示为ΔJ=T[(x),δy]+β[(x),δy]。其中,当y(x)给定时,T[y(x),δy]对δy来说是线性泛函,而当max|δy|→0时,有 β[(x),δy]max|δy|→0 那么,T[y(x),δy]称为泛函的变分,记作δJ。可见,泛函J[y(x)]的变分δJ本质上来讲就是J的增量的线性主要部分。 3.3.3变分法的基本方程 导致变分法创立的著名问题是由瑞士数学家约翰·伯努利于1696年提出的所谓最速降线(brachistorone)问题。牛顿、莱布尼茨、约翰·伯努利以及他的学生洛必达各自采用不同的方法都成功地解决了这一问题,尽管他们采用的方法各不相同,但最终殊途同归,所得答案都是一致的。后来,欧拉也对最速降线问题进行了研究。1734年,欧拉给出了更为广泛的最速降线问题的解答。但欧拉对自己当时所采用的方法不甚满意,进而开始寻求解决这类问题的一种普适方法。而在此过程中,欧拉便建立了变分法。1736年,欧拉在其著作中给出了变分法中的基本方程,这正是后来变分法所依托的重要基础。欧拉在推导该基本方程时采用的方法非常复杂,而拉格朗日则给出了一个非常简洁的方法,并于1755年在信中将该方法告知了欧拉。后来人们便称这个基本方程为欧拉拉格朗日方程(EulerLagrange equation)。 在推导出欧拉拉格朗日方程之前,先给出一个预备定理,也被称为是变分学引理。 引理如果函数y=f(x)在[a,b]上连续,又 ∫baf(x)η(x)dx=0 对任何具有如下性质的函数η(x)成立,这些性质是: (1) η(x)在[a,b]上有连续导数; (2) η(a)=0=η(b); (3) |η(x)|<ε,其中ε是任意给定的正数。 那么,函数f(x)在[a,b]上恒为0。 这里不对该定理进行详细证明,有兴趣的读者可以参阅变分法或数学分析方面的相关资料以了解更多。但同时可以对上述预备定理进行推广,即如果把三个条件中的第一条改为: η(x)在[a,b]上有n阶连续导数。其中,n为任何给定的非负整数,而且规定η(x)的零阶导函数就是其本身。那么原命题中的结论仍然成立。特别地,当n=1时,所描述的就是原来的预备定理。 至此准备工作已经基本就绪,接下来便可以开始考虑最简泛函的极值问题了。首先,可以利用类似函数极值的概念定义泛函的极值。当变量函数为y(x)时,泛函J[y]取极小值的含义就是: 对于极值函数y(x)及其附近的变量函数y(x)+δy(x),恒有 J[y+δy]≥J[y] 所谓函数y(x)+δy(x)在另一个函数y(x)的附近,指的是: 首先,|δy(x)|<ε; 其次,有时还要求|(δy)′(x)|<ε。 接下来,可以仿照函数极值必要条件的导出办法,导出泛函取极值的必要条件。不妨不失普遍性地假定,所考虑的变量函数均通过固定的两个端点y(x0)=a,y(x1)=b,即δy(x0)=0,δy(x1)=0。 考虑泛函的差值 J[y+δy]-J[y]=∫x1x0F(x,y+δy,y′+(δy)′)dx-∫x1x0F(x,y,y′)dx 当函数的变分δy(x)足够小时,可以将第一项的被积函数在极值函数的附近进行泰勒展开,于是有 F(x,y+δy,y′+δy′)≈F(x,y,y′)+Fy·δy+Fy′·(δy)′ 由于舍弃掉了二次项及以上高次项,所以这里用的是约等号。由上式也可推出 J[y+δy]-J[y]=∫x1x0Fy·δy+Fy′·(δy)′dx 上式就称为是J[y]的一阶变分,记为δJ[y]。泛函J[y]取极值的必要条件是泛函的一阶变分为0,即 δJ[y]≡∫x1x0Fy·δy+Fy′·(δy)′dx=0 应用分部积分,同时代入边界条件,就有 δJ[y]=∫x1x0Fy·δydx+∫x1x0Fy′·(δy)′dx =∫x1x0Fy·δydx+Fy′δyx1x0-∫x1x0δy·ddxFy′dx=∫x1x0δy·Fy-ddxFy′dx 由于δy的任意性,结合前面给出的预备定理,就可以得到 Fy-ddxFy′=0 上述这个方程称为欧拉拉格朗日方程,而在力学中则被称为拉格朗日方程。变分法的关键定理是欧拉拉格朗日方程。它对应于泛函的临界点,它是泛函取极小值的必要条件的微分形式。值得指出的是,欧拉拉格朗日方程只是泛函有极值的必要条件,并不是充分条件。 同理可得二维情况下泛函极值问题的欧拉拉格朗日方程为 Fu-ddxFux-ddyFuy=0 定理设F(x,y,y′)是三个变量的连续函数,且当点(x,y)在平面上的某个有界域B内,而y′取任何值时,F(x,y,y′)及其直到二阶的偏导数(指对变量x,y及y′的偏导数)均连续。若满足: (1) y(x)∈C1[a,b]; (2) y(a)=y0,y(b)=y1; (3) y(x)曲线位于平面上的有界区域B内的函数集合中,泛函J[y(x)]在某一条确定的曲线y(x)上取极值,且此曲线y(x)在[a,b]有二阶连续导数,那么函数y(x)满足微分方程 Fy-ddxFy′=0 最后,尝试利用已经得到的欧拉拉格朗日方程来解决著名的最速降线问题。该问题的描述 图31最速降线问题 是这样的: 设平面V与地面垂直,A和B是此平面上任取的两点,A点的位置高于B点。质点M在重力作用下沿着曲线AB由A点降落到B点。现在问AB是什么曲线时,总时间最短?设质点在A点处的初速度为零,而且A点不位于B点的正上方。 解取坐标系如图31所示,并记质点的质量为m,速度为v,又时间为t,则质点下落时动能的增加就等于势能的减少,则mv2/2=mgyv=2gy。曲线y=y(x)的弧长微分是dS=1+y′2dx,又有v=dS/dt,所以得到 dt=dS/v=(1+y′2)/2gydx 于是得到质点滑落的总时长为 T=∫x10(1+y′2)/2gydx=J[y(x)]/2g 由此可见,只需求出函数y=y(x),使泛函 J[y(x)]=∫x10(1+y′2)/ydx 在此曲线y(x)上取得极小值即可。现在设法写出欧拉拉格朗日方程,因为有 F(x,y,y′)=(1+y′2)/y 于是得到 Fy=1+y′2-12y-32 Fy′=y′y(1+y′2) 所以得到欧拉拉格朗日方程方程 1+y′2-12y-32=ddxy′y(1+y′2) 下面求解此方程。为了便于更加直观地理解计算过程,不妨将等式右边的F/y′用f代替。注意,f是关于y和y′的一个多元复合函数,而y和y′又分别都是关于x的函数。所以,在计算的时候还需用到复合函数的链式求导法则。于是,可得方程的右边为 dfdx=fy·dydx+fy′·dy′dx=yFy′·dydx+y′Fy′·dy′dx 于是上面得到的欧拉拉格朗日方程可以写为 Fy-Fy′yy′-Fy′y′y″=0 而且上式等价于 ddx(F-y′Fy′)=0 这是因为 ddx(F-y′Fy′)=Fyy′+Fy′y″-y″Fy′-y′(Fy′yy′-Fy′y′y″) =y′(Fy-Fy′yy′-Fy′y′y″)=0 将 ddx(F-y′Fy′)=0 做一次积分得到(其中,C表示任意常数) F-y′Fy′=C 将F的表达式代入上式,得 [y(1+y′2)]-12=C 即y(1+y′2)=D,D为任意常数。 令y′=tanθ,则y=D/(1+tan2θ)=Dcos2θ=D(1+cos2θ)/2,dy=-Dsin2θdθ。又有 dx=dyy′=--Dsin2θdθtanθ=--2Dsinθcosθdθtanθ=-D(1+cos2θ)dθ 于是有(其中,E是任意常数) x=-Dθ-D2sin2θ+E y=D2(1+cos2θ) 这就是最速降线问题的欧拉拉格朗日方程的解。如果令2θ=π-φ,则上式化为 x=D2(φ-sinφ)-π2D+E y=D2(1-cosφ) 又当φ=0时,取x=0=y,于是 x=D2(φ-sinφ) y=D2(1-cosφ) 最终得到,最速降线问题的解是一条旋轮线(也称摆线)。推荐对旋轮线感兴趣的读者参阅文献[11]以了解更多。 最后,讨论其他一些特殊形式变分问题的欧拉方程。 定理使泛函(其中,F是具有三阶连续可微的函数,y是具有四阶连续可微的函数) J[y(x)]=∫x1x0F(x,y,y′,y″)dx 取极值且满足固定边界条件y(x0)=y0,y(x1)=y1,y′(x0)=y′0,y′(x1)=y1的极值曲线y=y(x)必满足微分方程 Fy-ddxFy′+d2dx2Fy″=0 上式称为欧拉泊松方程。 特别地,对含有未知函数的n阶导数,或未知函数有两个或两个以上的固定边界变分问题,若被积函数F足够光滑,则可得到如下推论。 推论使依赖于未知函数y(x)的n阶导数的泛函 J[y(x)]=∫x1x0F(x,y,y′,…,y(n))dx 取极值且满足固定边界条件 y(i)(x0)=y(k)0,y(i)(x1)=y(k)i,k=0,1,2,…,n-1 的极值曲线y=y(x)必满足欧拉泊松方程 Fy-ddxFy′+d2dx2Fy″-…+(-1)ndndxnF(n)y=0 其中,F具有n+2阶连续导数,y具有2n阶连续导数,这是2n阶微分方程,它的通解中含有2n个待定常数,可由2n个边界条件来确定。 定理设D是平面区域,(x,y)∈D,u(x,y)∈C2(D),使泛函 J[u(x,y)]=DF(x,y,u,ux,uy)dxdy 取极值且在区域D的边界L上满足边界条件,极值函数u=u(x,y)必满足偏微分方程 Fu-xFux-yFuy=0 这个方程称为奥斯特洛格拉茨基方程,简称奥氏方程。它是欧拉方程的进一步发展。 例3.1已知(x,y)∈D,求下述泛函的奥氏方程。 J[u(x,y)]=Dux2+uy2dxdy 根据前面给出的公式,不难写出奥氏方程为 2ux2+2uy2=0 这也是二维拉普拉斯方程。 例3.2已知(x,y)∈D,写出泛函 J[u(x,y)]=Dux2+uy2+2uf(x,y)dxdy 的奥氏方程。其中,在区域D的边界上u与f(x,y)均为已知。 根据前面给出的公式,不难写出奥氏方程为 2ux2+2uy2=f(x,y) 这就是人们所熟知的泊松方程。 1777年,拉格朗日研究万有引力作用下的物体运动时指出: 在引力体系中,每一质点的质量mk除以它们到任意观察点P的距离rk,并且把这些商加在一起,其总和 ∑nk=1mkrk=V(x,y,z) 就是P点的势函数,势函数对空间坐标的偏导数正比于在P点的质点所受总引力的相应分力。在1782年,拉普拉斯证明了引力场的势函数满足偏微分方程 2Vx2+2Vy2+2Vz2=0 该方程叫做势方程,后来通称为拉普拉斯方程。1813年,泊松撰文指出,如果观察点P在充满引力物质的区域内部,则拉普拉斯方程应修改为 2Vx2+2Vy2+2Vz2=-4πρ 该方程叫做泊松方程。其中,ρ为引力物质的密度。 3.3.4理解哈密尔顿原理 3.3.3节从最简泛函开始导出了变分法的基本方程为欧拉拉格朗日方程。但仍然不禁要问为什么要以形如最简泛函那样的一种表达式来作为问题的开始?事实上,数学中的很多问题都不是凭空而来的,每一个看似高深的数学问题背后往往都有一个具体的实际问题作为支撑。数学问题也仅仅是实际问题抽象化的结果。在这一节中,将从物理问题的角度阐释变分法的发展与应用。 当牛顿建立了以三大定律及万有引力定律为基础的力学理论之后,无数的自然现象都得到了定量的说明。这部分知识在中学物理中都已经涵盖,大学物理也仅从微积分的角度对这部分内容进行了更为细致的阐述。貌似经典物理学所讨论的内容已经相当完善。然而科学发展的脚步并未因此而停滞。后来,拉格朗日提出了一个变分原理,从这个原理出发,运用变分法,不仅能够十分方便地解决力学问题,而且还能够推导出力学中的主要定律。这些成果后来都收录在他的著作《分析力学》一书中。拉格朗日还创立了拉格朗日运动方程,比牛顿的运动方程适应的范围更广泛,用起来也更加方便。 下面就来导出描写质点运动的拉格朗日方程。先设质点只有一个广义坐标x。因为,质点的位置由广义坐标x(t)决定,即位置是时间的函数。于是,动能T和位能U是x和x′(距离对时间的导数其实就是速度)的函数。把T-U叫做拉格朗日函数,记为 T-U=L=L(t,x,x′) 于是,质点的作用量定义为 S=∫t1t2L(t,x,x′)dt 根据之前的推导,因为S取极值,所以真实轨迹x(t)满足 Lx-ddtLx′=0 这就是力学中著名的拉格朗日方程。同样,若质点系的位置由广义坐标x1,x2,…,xk决定,且xi(t1)及xi(t2)均已给定。其中,i=1,2,…,k,即在t=t1及t=t2两时刻,体系的位置均已给定。当质点系由t1时刻的位置变到t2时刻的位置时,作用量 S=∫t1t2L(t,x1,x2…,xk,x′1,x′2,…,x′k)dt 取极值。这种形如 J[y1(x),y2(x),…,yk(x)]=∫baF[x,y1,y2,…,yn,y′1,y′2,…,y′n]dt 的泛函,其对应的欧拉拉格朗日方程为(具体证明过程略) Fyi-ddxFy′i=0,i=1,2,…,n 由此可知,真实轨迹xi(t),i=1,2,…,k,满足 Lxi-ddtLx′i=0,i=1,2,…,k 这就是质点系的拉格朗日方程组。它是在广义坐标系中质点系的运动方程,表达了质点系运动的一般规律。 此后,哈密尔顿又发展了拉格朗日的理论,他在1834年提出了一个著名的原理,即哈密尔顿原理,其内容为在质点(甚至是质点系或物体)的一切可能的运动中,真实的运动应当使得积分 S=∫t2t1(T-U)dt 取极值。其中,T和U分别是动能和位能,t1和t2是两个任意取的时刻。 这个原理后来成为了力学中的基本原理。以它为基础,可以导出牛顿三大定律以及能量、动量和动量矩守恒定律。 哈密尔顿原理的精确表述是: 假定在t=t1及t=t2时刻质点的位置已分别确定在A点和B点,那么质点运动的真实轨道及速度,使积分 S=∫t2t1(T-U)dt=∫t2t1Ldt 取极值,即 δS=δ∫t2t1(T-U)dt=δ∫t2t1Ldt=0 图32两点间的距离 其中,S是作用量,而T和U分别表示质点的动能和位能,L=T-U称为拉格朗日函数。 接下来,尝试利用哈密尔顿原理及变分法来证明欧几里得平面上两点之间直线距离最短这个命题。 解建立如图32所示的坐标系。则曲线AB的长度可以用弧长积分表示为 J[x(t)]=∫t2t11+x′2(t)dt 因为F(t,x,x′)=1+x′2(t),于是Fx=0,又 Fx′=x′1+x′2 所以得到欧拉拉格朗日方程为 ddxx′1+x′2=0 其中,C是任意常数 x′1+x′2=C 由此解得(其中,C2≠1) x′=±C1-C2 即x′=D,D为任意常数。由此式便可看出x(t)是一条直线。结论得证。 3.3.5等式约束下的变分 在许多极值或最优化问题中,往往要求极值点或最优解满足一定的约束条件。这些所谓的约束条件可能是用等式表示的,也可能是用不等式表示的。这里主要关注采用等式约束的形式。因此,首先介绍著名的拉格朗日乘子法。 定理(拉格朗日乘子法)设泛函f在x0∈X的邻域内连续可微,x0是Φ的正则点。如果x0是泛函f在约束条件Φ(x)=0下的极值点,则存在有界线性泛函z*0∈Z*,使得拉格朗日函数 L(x)=f(x)+z*0Φ(x) 以x0为驻点,即 f′(x0)+z*0Φ′(x0)=0 其中,上式左端的第2项应该理解为两个有界线性算子的复合(乘积)。 例如,在约束条件 Φ1(x1,x2,…,xn)=0 Φ2(x1,x2,…,xn)=0  Φk(x1,x2,…,xn)=0 下求F=F(x1,x2,…,xn)的极值,其中k0的n个非负实数,它们的乘积P的最大值为多少? 考虑采用拉格朗日乘子法求n元函数P=x1x2…xn对如下条件的极大值,条件为这n个非负实数的和等于C,即x1+x2+…+xn=C,xi≥0,i=1,2,…,n。于是构造如下函数 L=x1x2…xn+λ(x1+x2+…+xn-C) 其中,λ是拉格朗日乘子,然后分别对x1,x2,…,xn求偏导数,然后令其结果等于0,构成如下方程组 Lx1=x2x3…xn+λ=0 Lx2=x1x3…xn+λ=0  Lxn=x1x2…xn-1+λ=0 求解方程组,可得x1=x2=…=xn=C/n。因为根据题目的描述,P的极小值是等于0的,而当xi满足上述条件时显然P是不等于0的,所以可知此时函数取极大值,这个极大值就等于 Pmax=Cn·Cn…Cn=Cnn 即 x1+x2+…+xnnn≥x1x2…xn 对两边同时开根号,显然有下式成立,所以原不等式得证。 x1+x2+…+xnn≥nx1x2…xn 下面就参照上述函数条件极值问题的解决思路处理泛函在约束条件Φi(x,y1,y2,…,yn)=0作用下的极值问题,其中i=1,2,…,k。 定理泛函 J=∫x2x1F(x,y1,y2,…,yn,y′1,y′2,…,y′n)dx 在约束条件Φi(x,y1,y2,…,yn)=0,i=1,2,…,k,k0,则f(x)/g(x)也是有界变差的。 定理设f(x)是[a,b]上的有限函数,又ax0 f(x0-0)=limx→x0f(x),x0} Ω(-a^,x0)=Ω∩{x∈Rn|〈x-x0,-a^〉>0} 那么,对于BV函数u的定义域Ω∈Rn中的每一点x0,下面的两个断言中仅有一个是正确的 limx→x0 x∈Ω(a^,x0)u(x)=limx→x0 x∈Ω(-a^,x0)u(x) limx→x0 x∈Ω(a^,x0)u(x)≠limx→x0 x∈Ω(-a^,x0)u(x) 或者x0属于含有零个n-1维的豪斯多夫测度(Hausdorff measure)的Ω一个子集。如下的量 limx→x0 x∈Ω(a^,x0)u(x)=ua^(x0),limx→x0 x∈Ω(-a^,x0)u(x)=u-a^(x0) 就被称为是BV函数u在点x0处的近似极限。 其次,V(·,Ω)在BV(Ω)上是下半连续的。泛函V(·,Ω): BV(Ω)→R+是下半连续的,为了说明这一点,选取一个BV函数的柯西序列{un}收敛于u∈L1loc(Ω),其中n∈N。因为所有序列中的函数以及它们的极限函数都是可积的,并且根据下限的定义,对于∈C1C(Ω,Rn),‖‖L+∞(Ω)≤1有 limn→+∞infV(un,Ω)≥limn→+∞inf∫Ωun(x)divdx≥∫Ωlimn→+∞un(x)divdx=∫Ωu(x)divdx 现在考虑在函数∈C1C(Ω,Rn)的集合上的上确界,可知‖‖L+∞(Ω)≤1,那么有下列不等式成立 limn→+∞infV(un,Ω)≥V(u,Ω) 这也就是下半连续的准确定义。 其次,有界变差函数空间BV(Ω)是一个巴拿赫空间。根据定义,BV(Ω)是L1(Ω)的一个子集,而线性性质可以从积分的线性属性中得到,即 ∫Ω[u(x)+v(x)]div(x)dx=∫Ωu(x)div(x)dx+∫Ωv(x)div(x)dx =-∫Ω〈(x),Du(x)〉-∫Ω〈(x),Dv(x)〉 =-∫Ω〈(x),[Du(x)+Dv(x)]〉 对于所有的∈C1C(Ω,Rn)成立。因此,对于所有的u,v∈BV(Ω),有u+v∈BV(Ω)成立。并且对于所有的c∈R,还有下式成立 ∫Ωc·u(x)div(x)dx=c∫Ωu(x)div(x)dx=-c∫Ω〈(x),Du(x)〉 因此,对于所有的u∈BV(Ω),以及c∈R,有cu∈BV(Ω)成立。上述这些被证明的向量空间属性表明BV(Ω)是L1(Ω)的一个向量子空间。 现在考虑函数‖‖BV: BV(Ω)→R+,它的定义形式如下 ‖u‖BV:=‖u‖L1+V(u,Ω) 其中,‖‖L1是通常的L1(Ω)的范数,很容易证明它是在BV(Ω)上的一个范数。为了说明BV(Ω)是一个巴拿赫空间,考虑在BV(Ω)中的一个柯西序列{un},其中n∈N。根据定义它也是L1(Ω)中的一个柯西序列,它在L1(Ω)中有一个极限u存在。因为un在BV(Ω)中对于每一个n来说都是有界的,那么‖u‖BV<+∞。根据变差V(·,Ω)的下半连续性,所以u是一个BV函数。最后,再由下半连续性,选择一个任意小的正数ε,则有 ‖uj-uk‖BV<ε,j,k≥N∈NV(uk-u,Ω)≤limj→+∞infV(uk-uj)≤ε 此外,BV(Ω)是不可分的。为了说明这一点,考虑下面这个位于空间BV([0,1])中的例子,对于每一个0<α<1,定义 χα=χ[α,1]=0,x[α,1] 1,x∈[α,1] 为左闭区间[α,1]上的指示函数。选取α,β∈[0,1],且α≠β,那么则有下述关系成立 ‖χα-χβ‖BV=2+|α-β| 现在为了证明BV([0,1])的每一个稠密子集都不可能是可数的,不妨从下面这个角度考察。对于每一个α∈[0,1],可以构建一些球 Bα={ψ∈BV([0,1]); ‖χα-ψ‖BV≤1} 显然,这些球是两两不相交的,而且它们还是一个集的加标族,其指标集是[0,1]。这其实暗示这个族具有连续统的势。如此一来,因为BV([0,1])的任意稠密子集必须至少有一点在这个族的每个成员里,它的势至少为连续统的势,因此不可能是一个可数集。这个例子可以很显然地扩展到高维的情况,而且因为仅仅涉及局部属性,所以它也表明同样的性质对于BVloc也是成立的。 上述描述中涉及一些集合论的内容,在此稍作说明。以集合为元素的集合称为集族(collection of sets),记为A。设A是一个非空集族,A的指标函数(indexing function)是从某一个集合J到A的一个满射f,其中J称为指标集(index set),族A连同指标函数f一起称为一个集的加标族(indexed family of sets)或加标集族。给定α∈J,集合f(α)记成符号Aα。该加标集族本身则记作{Aα}α∈J,读作“α取遍J时,所有Aα的族”。当指标集自明时,则简单地记为{Aα}。 而且,BV(Ω)是一个巴拿赫代数。这个性质从BV(Ω)不仅是一个巴拿赫空间还是一个结合代数(associative algebra)这个事实就可直接得到。结合代数是指一个向量空间,其允许向量有具分配律和结合律的乘法。因此,它是一个特殊的代数。这也暗示如果{vn}和{un}是BV函数的柯西序列而且分别收敛到BV(Ω)中的函数v和u,那么 vun→n→+∞vu vnu→n→+∞vuvu∈BV(Ω) 因此,两个函数的普通逐点乘积在空间BV(Ω)中关于每个参数都是连续的。这就使得该函数空间成为一个巴拿赫代数。关于逐点乘积这个概念,此处稍作说明。如果f和g都是函数f,g: X→Y,那么对于每个X中的x,逐点乘积(f·g): X→Y就被定义成(f·g)(x)=f(x)·g(x)。前面所说的参数就是指这里的x,也就是说(f·g)(x)在BV(Ω)中是连续的。 索伯列夫空间W1,1(Ω)是BV(Ω)的一个真子集。事实上,对于每个在空间W1,1(Ω)中的u,可以选择一个测度μ:=uL,其中L是在Ω上的勒贝格测度。如此,即有下列等式成立 ∫udiv=-∫dμ=-∫u,∈C1C 因为它只不过是弱微分的定义,所以等式是成立的。弱微分(weak derivative)是一个函数的微分(强微分)概念的推广,它可以作用于那些勒贝格可积的函数,而不必预设函数的可微性(事实上大部分可以弱微分的函数并不可微)。 很容易找到一个不是W1,1的BV函数的例子,在一维情况下,任何带有非平凡跳跃(nontrivial jump)的阶梯函数都是。回忆函数间断点的分类。通常当人们说到函数间断点的类型时,如果按照间断点处的左右极限是否存在来划分,那么可以分为第一类间断点和第二类间断点。其中,如果间断点处的左右极限都存在,这个间断点就是第一类间断点。第一类间断点又分为可去间断点和跳跃间断点两种。如果间断点处的左右极限至少有一个不存在,那么则称该点为函数的第二类间断点。从另外一个角度也可以分成平凡间断点和非平凡间断点。其中,前面提及的可去间断点又称为平凡间断点。当函数在间断点处的极限存在,但此极限不等于该点处的函数值时,这就是一个可去间断点。显然,非平凡间断点包含了跳跃间断点和第二类间断点。如果函数在间断点处的左右极限存在,但是左右极限却不相等,则该间断点就是一个跳跃间断点。如果非平凡间断点特指跳跃间断点,有时也说非平凡跳跃间断点(nontrivial jump discontinuity)。阶梯函数是具有非平凡跳跃间断点的典型例子。 本章参考文献 [1]钱伟长.变分法及有限元[M].北京: 科学出版社,1980. [2]龚怀云,寿纪麟,王绵森.应用泛函分析[M].西安: 西安交通大学出版社,1985. [3]柳重堪.应用泛函分析[M].北京: 国防工业出版社,1986. [4]刘诗俊.变分法、有限元法和外推法[M].北京: 中国铁道出版社,1986. [5]老大中.变分法基础[M].2版.北京: 国防工业出版社,2007. [6]贾正华.Gram矩阵及其行列式[J].安庆师范学院学报(自然科学版).1998(3). [7]邓志颖,潘建辉.巴拿赫不动点定理及其应用[J].高等数学研究.2013(4). [8]佘守宪,唐莹.浅析物理学中的旋轮线(摆线)[J].大学物理.2001(6). [9]克莱鲍尔.数学分析[M].庄亚栋,译.上海: 上海科学技术出版社,1981. [10]那汤松.实变函数论[M].5版.徐瑞云,译.北京: 高等教育出版社,2010.