第3章 CHAPTER 3 孤立者对群体公共品博弈 动力学的影响 3.1引言 借助演化博弈论这一思路和方法对复杂网络或复杂群体中个体策略演化的研究有助于人们了解实际系统中的人类或生物群体中的策略选择,尤其是合作行为的演化,从而对自私或损害公共利益的行为加以约束和调节。合作广泛地存在于生物和社会系统之中。对合作行为的研究是演化博弈理论的核心问题,目前,合作机制的研究仍是一个十分严峻的挑战,来自各个学科的众多学者就此展开了大量研究[140145]。 本章将从群体合作这一角度出发,在公共品博弈模型(public goods games,PGG)的基础上,分别研究三种机制: ①加入第三种策略(孤立者); ②对背叛个体的收益设定阈值; ③对背叛和合作个体均设置收益阈值,研究对群体合作演化产生的影响。结果表明,通过引入相应的孤立策略个体,公共品博弈模型下的群体均衡状态能够摆脱原来的完全背叛,从而为群体中合作行为的演化提供一定契机。另外,通过对背叛者的收益设置阈值,相比不考虑阈值的公共品博弈,可以使合作行为在群体中得到促进。进一步的结果表明,如果对背叛和合作收益均设定阈值,相比仅限制背叛收益的情况,更有利于合作在群体中的演化。 本章接下来的内容安排如下: 3.2介绍阈值公共品博弈模型; 3.3节对两种策略共存时的群体演化进行动力学分析; 3.4节对三种策略(合作、背叛、孤立)共存时群体的演化情况进行分析; 3.5节主要讨论公共品博弈下群体演化的仿真结果。 3.2阈值公共品博弈模型 3.2.1公共品博弈模型 这里采用公共品博弈模型来刻画社会困境。在一个典型的公共品博弈中,就存在由多个个体共同参与博弈的决策过程,其中每个个体面临两种策略选择: 合作和背叛[32]。举例来说,某地区或社区要对某项大型公共设施进行投资建设,公民可自行决定是否注入资金,这样就产生两种不同的策略选择: 投资—合作(cooperation,C),不投资—背叛(defection,D)。合作意味着投资,同时付出相应的成本c,背叛个体则无须付出成本。 集体共同进行决策后,无论采取合作或背叛,每人都会获得同等数目的分红: rcnc/N,其中,nc代表合作者数目,r表示公共品收益放大系数,即投资回报会在原来的基础上翻r倍。N表示群体中总的个体数。那么在经典PGG下群体中个体策略以及所对应的收益如下: Pc=rcncN-cPd=rcncN(3.1) 显然,背叛者获得的收益一定大于合作者,于是所有个体均选择背叛将是群体唯一的纳什均衡态。根据上述收益的表达式,当r越大,投资公共福利所带来的吸引力就会变得更大,因此增加r的值会引导群体中更多的个体参与投资(合作者的数目增多)。而增加合作者的投资数额c只会让更多的人选择不参与投资(背叛数目增加)。相关的研究结果表明[56,58],在这种多人公共品博弈模型条件下,参与博弈的个体总数N同样会对博弈结果产生不可忽视的影响。 3.2.2含孤立者的阈值公共品博弈 本章将在原有的典型公共品博弈模型的基础上加入第三种博弈策略——孤立者(loner,L)。也就是说,社区中可能还会含有这样的一些人,他们既不参与投资,但也不会像背叛者那样从公共投资中获取回报,或者说,他们并不参与博弈,只获得一个基础的固定收益,记作σ。此外还考虑带有阈值的公共品博弈模型,此模型的建立是基于一些学术网站中学术论文的下载量或是针对一般公共用地的使用权限来制定的。在这样的情况下,搭便车行为偶尔可被允许,但必须对参与搭便车的次数或人数加以限制。 下面对这种含有孤立者并考虑博弈阈值的公共品博弈模型进行详细介绍。首先,给定一个含有三种策略的公共品博弈模型,假设群体中共有N个个体,并且N>1,这些个体中共包含有nc个合作者,nd个背叛者,以及nl个孤立者。阈值用参数T来表示,当群体中的合作个体数目超过指定阈值T时,背叛者将会面临一个收入限额,并且1≤T≤N。合作者、背叛者以及孤立者的收益如表3.1所示。 表3.1含孤立者的阈值公共品博弈模型 策略nc≤Tnc>T 合作策略rcncnc+nd-crcncnc+nd-c 背叛策略rcncnc+ndrcTnc+nd 孤立策略σσ 表3.1中,参数c表示合作者付出的代价。为简单且不失一般性,在后续的讨论中,均假设c=1。显然,根据群体当前的合作策略个体数目,个体收益的获取共对应两种不同的情况。首先,当nc的取值不超过收益阈值T时,以上三种策略相应的收益分别对应如下: Pc=rncnc+nd-1 Pd=rncnc+nd Pl=σ(3.2) 其中,Pc、Pd和Pl分别表示合作、背叛、孤立策略的收益。如果合作者数目超过阈值T,那么这三种策略所对应的收益如下: Pc=rncnc+nd-1 Pd=rTnc+nd Pl=σ(3.3) 3.2.3复制动力学方程 接下来将借助复制动力学方程对上述阈值公共品博弈模型下的群体进行动力学分析。给定某个无限大均匀混合群体,假定所有个体均参与表3.1中的三策略阈值公共品博弈。这里考虑连续时间系统模型,分别用变量x、y和z表示群体中合作、背叛和孤立策略的比例,含有三种策略系统的动力学方程为 x·=x(Pc-)y·=y(Pd-)z·=z(Pl-)(3.4) 式中,Pi,i∈(C,D,L)用来表示策略C、D、L的收益。群体的平均收益为=xPc+yPd+zP。 3.2.4收益计算 接下来将根据个体的不同策略选择以及选择相应策略后获得的收益列出系统的复制动力学方程表达式。实际上,式(3.2)和式(3.3)列举的是一组个体在参与公共品博弈时取得的收益。本节将给出参与群体博弈的不同策略在复制动力学下的收益表达式。 为了计算上述三种策略参与群体博弈时的收益表达式,在整个无限大群体的内部,随机取出相应策略的个体,构成含有N个个体的样本组群体,接下来导出含有N个个体的群组中不同策略的收益表达式。对于在这N个个体之中的任意一个个体i,其所面对的规模为N-1的群体中存在S-1个博弈参与者(合作和背叛策略个体的统称,假定孤立者不参加博弈)的概率为 N-1S-1(1-z)S-1zN-S(3.5) 上述概率的计算与所选中的个体当前的策略无关,即无论个体i的当前策略是合作或者背叛均有此结果。这里特别需要注意的是,如果群体中除当前被选中的个体i以外不存在任何的参与者(合作和背叛策略),那么当前个体i的策略将在随后的演化过程中演变为孤立策略。 接下来计算对某个参与者,它所面对的这S-1个博弈者中,存在m个合作者以及S-1-m个背叛者的概率,即 S-1mxx+ymyx+yS-1-m(3.6) 根据收益式(3.2)和式(3.3)可得,在由S(S=2,…,N)个合作和背叛策略构成的子群组中,合作者的收益为 Pcs=∑S-1m=0S-1mr(m+1)Sxx+ymyx+yS-1-m- ∑S-1m=0S-1mxx+ymyx+yS-1-m(3.7) 上式中的收益Pcs可以简化为 Pcs=r(S-1)Sxx+y+rS-1(3.8) 于是,整个群体中的合作者平均收益Pc计算如下: Pc=σzN-1+∑NS=2N-1S-1(1-z)S-1zN-SPcs(3.9) 且上式可进一步改写为 Pc=σzN-1+Nrx+r(1-zN)N(1-z)-rx(1-zN)N(1-z)2+(1-r)zN-1-1(3.10) 如前面所提到的,合作者的代价c的取值为c=1。所有孤立者都不会参与博弈,而同时获得一个固定的收益σ,并且如果仅有一个个体参与博弈,那么此个体也将会变为孤立者,这样的情况发生的概率是zN-1,因此孤立策略的收益计算为Pl=σzN-1。 下面计算背叛者的收益,在含有N个个体的这组样本群体中,为了清楚起见,将背叛者的收益分为Pd1、Pd2、Pd3三部分。首先,当群体中仅含有一个背叛者时,有 Pd1=σzN-1(3.11) 在共计S-1个参与者中,分为两种不同的情况。当S-1≤T时,所有个体均参与普通的公共品博弈。此时背叛者的收益记为Pd2,取值为 Pd2=∑T+1S=2N-1S-1(1-z)S-1zN-S×∑S-1m=0S-1mrmSxx+ymyx+yS-1-m(3.12) 上式可改写为 Pd2=rxx+y∑TS=0N-1S-1(1-z)SzN-S-1SS+1(3.13) 如果继续令 N-1T+111-z∫z0tN-T-2(1-t)T+1dt-zNN(1-z) =∑TS=0N-1S1S+1(1-z)SzN-S-1(3.14) 和 ∑TS=0N-1S(1-z)SzN-S-1 =(T+1)N-1T+1∫z0tN-T-2(1-t)Tdt(3.15) 得到如下关系: Pd2=rxx+yN-1T+1∫z0tN-T-2(1-t)T(T+1)-1-t1-zdt+ rxzNN(1-z)2(3.16) 对于另一种情况,如果S-1>T,那么背叛者的收益为 Pd3=∑NS=T+2N-1S-1(1-z)S-1zN-S× ∑Tm=0S-1mrmSxx+ymyx+yS-1-m+ ∑S-1m=T+1S-1mrTSxx+ymyx+yS-1-m(3.17) 通过将上式改写为如下形式: Pd3=∑NS=T+2N-1S-1(1-z)S-1zN-S× ∑S-1m=0S-1mrmSxx+ymyx+yS-1-m- ∑S-1m=T+1S-1mr(m-T)Sxx+ymyx+yS-1-m(3.18) 可得到关系 Pd3<∑NS=T+2N-1S-1(1-z)S-1zN-S× ∑S-1m=0S-1mrTSxx+ymyx+yS-1-m =∑N-1S=T+1N-1S(1-z)SzN-S-1rTS+1(3.19) 结合上述三种情况,得到在含有N个个体的样本组群体中,背叛者的收益Pd取值为 Pd=Pd1+Pd2+Pd3 =σzN-1+rxx+y1-1-zNN(1-z)-∑N-1S=T+1N-1S(1-z)SzN-S-1× ∑Sm=T+1Smr(m-T)S+1xx+ymyx+yS-m(3.20) 3.3两种策略共存 对3.2节中的复制动力学方程进行分析就可以得到博弈系统的策略演化情况。在演化博弈论的框架下,某种策略优于另一种策略的判断标准主要是不同的策略在进行群体博弈时所取得的收益。本节讨论仅含有3种不同策略(合作和背叛,合作和孤立,背叛和孤立)时群体的演化情况。 3.3.1合作策略(C)和背叛策略(D)共存 假定群体中仅含有两种不同的策略,即合作(C)和背叛(D),也就是三种策略博弈中CD共存的情况。令这三种策略个体的比例分别为z=0以及x+y=1,那么策略C和策略D的收益差值计算如下: Pc-Pd=rN∑N-1m=T+1N-1m(m-T)xmyN-1-m+rN-1(3.21) 将上式改写为 Pc-Pd=rN-1+rT(N-T-1)NN-1T∫x0tT-1(1-t)N-T-2(x-t)dt(3.22) 在变量满足0<x<1及0<y<1时,表达式(Pc-Pd)/r>0一定成立,也就意味着收益差Pc-Pd将会随着放大系数r的增大而增大。此结论符合一般的对于公共品博弈的结果的预判,即越高的收益回报率r会诱使越来越多的人参与群体投资(合作),这将利于群体合作。根据式(2.23)得到 (Pc-Pd)x=rT(N-T-1)NN-1T∫x0tT-1(1-t)N-T-2dt(3.23) 以及 2(Pc-Pd)x2=rT(N-T-1)NN-1TxT-1(1-x)N-T-2(3.24) 定理3.1系统内部平衡点x*∈(0,1)存在,当且仅当 r>NN-T 成立。 证明当x∈(0,1)以及(Pc-Pd)/x>0时,Pc-Pd的取值会随着群体中合作者的比例x的增加而增加。当x∈(0,1),显然Pc-Pd=0没有实根或至多含有一个不稳定的根。此外,由2(Pc-Pd)/x2>0,收益差Pc-Pd将在x=1时取得其最大值。 □ 根据式(3.20)和式(3.21),得到如下关系: Pc-Pdx=0=rN-1<0,Pc-Pdx=1=r-1-rTN 接下来还需要进一步分析如下两种不同的情况。 情况1博弈参数满足条件r≤NN-T。 在这一条件下,关系式Pc-Pdx=1≤0表明方程Pc-Pd=0在开区间x∈(0,1)内无根,那么给定任何的初始情况,系统都将演化到完全背叛的状态(y=1)。 情况2博弈参数满足条件r>NN-T。 这时有Pc-Pdx=1>0,表明在开区间x∈(0,1)有且仅有一个内部平衡点x*∈(0,1)。于是得到结论,当群体中初始合作者的比例不超过x*时,系统状态会演化至完全背叛。若群体中合作者的比例高于x*,系统将会演化至完全合作的状态。 下面给出关于以上两种情况的系统平衡点的数值仿真结果。如图3.1所示,公共品博弈满足N=10,r=4,c=1,收益差Pc-Pd随阈值T增大而减小。方程Pc-Pd=0的根的个数与收益阈值T的取值密切相关: T=2(绿色),T=4(蓝色)和T=6(红色)时方程仅存在一个根; 若收益阈值T取值继续增大,则方程Pc-Pd=0没有根,对应系统将不存内部平衡点。当阈值取T=2,T=4和T=6时,相应的博弈参数取值满足条件r>N/(N-T),此时系统仅包含唯一的内部平衡点x*∈(0,1),且这一内部平衡点x*不稳定。如果将相应的阈值增加至T=8时,r=4<N/(N-T)=5,那么方程Pc-Pd=0在开区间x∈(0,1)内部无根,也就是系统中的所有个体均会演化至完全背叛的状态。 3.1彩图 图3.1合作(C)和背叛(D)策略参与的阈值公共品博弈 3.3.2背叛策略(D)和孤立策略(L)共存 将三种策略的比例分别设置为x=0,y+z=1,讨论群体中仅含有背叛策略(D)和孤立策略(L)时的情况。在这一情况下,背叛策略的收益计算为Pd=σzN-1,其中参数σ是指孤立者的自给自足收益。于是背叛个体和孤立个体的收益关系满足条件Pd≤Pl。只要群体中不存在任何的合作个体,也就是说仅策略D和L共存,在这种情况下,鉴于条件Pl-Pd≥0满足,显然孤立者能够得到比背叛者更多的优势,整个群体就会演化至所有个体均采取孤立策略的状态。根据此结论进一步了解到,尽管背叛策略个体能够入侵合作策略群体,但面对孤立策略时将会展现出劣势的一面,很容易被孤立策略个体所取代。 公共品博弈的结果主要受到三种参数的影响,分别是T、r和σ。对应图3.2中各参数取值情况: 图(a)T=2,r=3,σ=1; 图(b)T=2,r=1.5,σ=1; 图(c)T=3,r=3,σ=1; 图(d)T=2,r=3,σ=2。空心点表示不稳定的平衡点,实心点则代表稳定的平衡点。在图(a)和图(c)中,相应的参数关系满足条件r>1+σ,图(b)满足r<1+σ,图(d)满足关系r=1+σ。如图3.2所示,孤立策略对抑制群体背叛起到了十分关键的作用,引入孤立策略将使群体的状态不会再陷入完全背叛的状态,从而给合作策略的演化提供便利条件。但如果孤立策略本身就能够获得足够多的收益(σ足够大),就会给合作策略带来不利的影响,会使得整个群体陷入完全孤立的状态。 3.2彩图 图3.2阈值公共品博弈下的群体策略演化 3.3.3合作策略(C)和孤立策略(L)共存 接下来继续讨论孤立策略的引入对群体中合作策略演化的影响。假设群体中不存在背叛策略,令y=0,x+z=1。得到合作与孤立策略的收益差Pc-Pl=r-1-σ,那么这种由孤立策略和合作策略所构成的群体在特定的参数条件下就会存在一些内部平衡点,群体博弈结果将主要由参数r和σ来决定。接下来分别就以下三种情况逐一进行分析。 情况1放大系数r和孤立者收益σ的关系满足条件r>1+σ。 在这一条件下,显然有Pc-Pl>0,给定系统任意的初始条件(起始于C和L共存状态),完全合作是群体博弈唯一稳定的平衡点。仿真示例如图3.2(a)和(d)所示,引入孤立策略L会显著抑制群体中背叛策略的演化,从而为合作策略的演化提供条件。由此可得,孤立策略可被视为促进群体合作的催化剂,加入后能够使整个群体状态由原来的背叛占主导演化为合作占主导的情况。 情况2放大系数r和孤立者收益σ的关系满足条件r=1+σ。 如果参数关系满足r=1+σ,相当于孤立策略与合作策略获得相等的收益,即Pc=Pl,于是边界CL上的每一点都是稳定的,均对应着系统的稳定状态。如图3.2(d)所示,只要参数满足条件r=1+σ,无论初始策略的分布如何,群体的状态均能演化至策略C和L共存的情况。由此可见,边界CL上的所有点构成系统平衡点的集合,边界平衡点x=1和点z=1以及满足x+z=1的所有点均是系统可能的稳定平衡点。 情况3放大系数r和孤立者收益σ的关系满足条件r<1+σ。 若r<1+σ,那么就有Pl>Pc,这一结论表明,当孤立者收益σ足够大时,孤立者在整个群体中的占比就能够得到保证。然而从另一个角度来讲,虽然孤立能够入侵背叛,达到抑制群体背叛的效果,但是当孤立者的固定收益σ取值过大时,仍会导致群体状态往非合作的方向偏移。对于这一情况下群体策略演化的仿真,详见图3.2(b),此时平衡点z=1(完全孤立)对应系统唯一的稳定状态。 虽然在经典的公共品博弈模型下,背叛策略总是占主导,但是通过引入第三种策略——孤立,就会使群体的状态从完全背叛脱离,从而给群体合作带来更多机会。这里导出了对合作最有利的博弈参数设定(r>1+σ),此时孤立策略可被看作促进群体合作的催化剂。另外,当r<1+σ,过高的孤立策略收益会使群体向完全孤立演化,反而会不利于合作。 3.4三种策略共存 本节将对三种策略(合作、背叛、孤立)共演化的情况进行分析。根据复制动力学方程(3.4)可得,某一策略在群体中的演化情况将极大地取决于这种策略的收益。于是策略在参与群体博弈时所获得的收益就将作为研究博弈系统中策略演化的最重要的依据。因此,在分析公共品博弈情况下的三种策略共演化之前,首先需要对不同策略的博弈收益进行分析和讨论。对于背叛者的收益,由式(3.19)可得 Pd3<∑N-1S=T+1N-1S(1-z)SzN-S-1rTS+1(3.25) 于是就有如下的结论: Pd=Pd1+Pd2+Pd3 <σzN-1+∑N-1S=T+1N-1S(1-z)SzN-S-1rTS+1+ rxx+y∑TS=0N-1S(1-z)SzN-S-1SS+1(3.26) 根据式(3.20),若m≥T+1,则有 Pd<σzN-1+rxx+y1-1-zNN(1-z)(3.27) 若令 y1=rxx+y∑N-1S=0N-1S(1-z)SzN-S-1SS+1(3.28) 和 y2=∑N-1S=T+1N-1S(1-z)SzN-S-1rTS+1+ rxx+y∑TS=0N-1S (1-z)SzN-S-1SS+1(3.29) 借助等式 rxx+y∑N-1S=0N-1S(1-z)SzN-S-1SS+1=rxx+y1-1-zNN(1-z)(3.30) 进而可得到如下的结论: Pd<min{y1+σzN-1,y2+σzN-1}(3.31) 那么对上述不等式做分类讨论,就有以下两种不同的情况。 情况1如果不等式条件T<Sx/(x+y)成立,那么将存在y1>y2以及Pd<y2+σzN-1的情况。 情况2若不等式条件T>Sx/(x+y)成立,那么将导致y1<y2以及Pd<y1+σzN-1。 给定以上两个条件,显然无论收益阈值T取何值,背叛策略的收益Pd都会被某个上界阈值所限制,并且此上界与T的取值密切相关。 3.4.1阈值T的影响 由上述分析可知,对背叛策略设置的收益阈值会对整个群体中的策略演化产生一定的影响。给定含有三种不同策略的阈值公共品博弈模型,阈值T的影响是不可忽视的。根据T的定义可知,阈值T与合作者数目之间存在着直接的联系,并会对背叛策略的收益起到一定约束作用。 定理3.2在复制动力学方程(3.4)作用下,阈值T越大,则合作策略与背叛策略相应收益的差值Pc-Pd反而越小。 证明根据式(3.9)和式(3.20)可得 Pc-Pd=r(1-zN)N(1-z)-(r-1)zN-1+(T)(3.32) 其中, (T)=∑N-1S=T+1N-1S(1-z)SzN-S-1× ∑Sm=T+1Smr(m-T)S+1xx+ymyx+yS-m(3.33) 为简单且不失一般性,这里假定T=k-1,其中k是正整数并且满足1<k<N-1。当T=k-1时,有 (k-1)=∑N-1S=kN-1S(1-z)SzN-S-1× ∑Sm=kSmr(m-k+1)S+1xx+ymyx+yS-m(3.34) 然后通过变形得到 (k-1)=∑N-1S=k+1N-1S(1-z)SzN-S-1× ∑Sm=kSmr(m-k+1)S+1xx+ymyx+yS-m+ N-1k(1-z)kzN-k-1rk+1xx+ymyx+yk-m(3.35) 当T=k时,可得到 (k)=∑N-1S=k+1N-1S(1-z)SzN-S-1× ∑Sm=k+1Smr(m-k)S+1xx+ymyx+yS-m(3.36) 通过令 φ1=∑Sm=kSmr(m-k+1)S+1xx+ymyx+yS-m(3.37) 并将上式展开得到 φ1=∑Sm=k+1Smr(m-k+1)S+1xx+ymyx+yS-m+ SkrS+1xx+ykyx+yS-k(3.38) 和 φ2=∑Sm=k+1Smr(m-k)S+1xx+ymyx+yS-m(3.39) 显然有φ1>φ2。接下来比较φ(k-1)和φ(k)的取值。 φ(k-1)=∑N-1S=k+1N-1S(1-z)SzN-S-1×φ1+ N-1k(1-z)kzN-k-1rk+1xx+ymyx+yk-m(3.40) 和 (k)=∑N-1S=k+1N-1S(1-z)SzN-S-1×φ2(3.41) 于是就推得不等式关系(k-1)>(k)。换句话说,提高阈值T,例如令T=k,就会降低合作与背叛策略的收益差Pc-Pd,从而在某种程度上促进背叛策略在群体中的演化。 □ 3.4.2内部平衡点 3.4.1节中已经讨论了边界CD、CL和DL上的系统平衡点情况。接下来,将讨论含有三种策略的公共品博弈的内部平衡点的存在性。为了简化计算过程,定义f=x/(x+y),这是合作个体在所有参与者(合作者与背叛者)之中所占的比例。接下来,对合作策略的收益进行如下化简: Pc=(σ-r+1)zN-1+r(1-f)(1-zN)N(1-z)+rf-1(3.42) 假设等式Pc=Pl=σ成立,也就是说 (σ-r+1)zN-1+r(1-f)(1-zN)N(1-z)+rf-1=σ(3.43) 将上式进一步按照zN-1=F1/F2的方式进行改写,其中, F1=N(σ+1-rf)(1-z)+r(f-1)(3.44) 和 F2=N(1-z)(σ-r+1)-r(1-f)z(3.45) 对比F1和F2的值,则有 F1-F2=(N-1)(1-z)(1-f)>0(3.46) 接下来将分三种情况对群体中策略的演化进行进一步的讨论。 (1) F1>F2>0,于是得到zN>1。显然与变量z的范围z∈[0,1]不相符,那么Pc≠Pl。在这种情况下,系统不存在任何的内部平衡点。 (2) F1>0>F2,于是就有zN<0,同样与变量z的范围z∈[0,1]不符合,那么方程Pc=Pl=0无根,同样系统也不会存在任何的内部平衡点。 (3) 假设0>F1>F2,系统可能会存在内部平衡点。 综上所述,以下条件满足时群体将不存在任何的内部平衡点: F1=N(σ+1-rf)(1-z)+r(1-f)>0(3.47) 将上式改写为 r<N(σ+1)(1-z)Nf(1-z)+(1-f)=N(σ+1)Nf+(1-f)(1-z)(3.48) 又因为 1-f1-z=y(x+y)2≤1(3.49) 于是就可以得到相应的结论F1>0和r<N(σ+1)/(N+1)。在这样的参数设定条件下,内部平衡点不存在[图3.2(b)]。实际上,当满足σ>(r-1)f时,函数F1的取值满足 F1=N(σ+1-rf)(1-z)+r(1-f)>(1-f)[N(1-z)+r]>0 也就是说,当σ>(r-1)f时,在由三种策略构成的群体中一定不会存在内部平衡点,于是可以将r<σ/f+1视为系统不存在内部平衡点的一个充分条件。特别地,如果公共品博弈的放大倍数r取值非常小,从而导致群体中含有较少的合作个体,那么f=x/(x+y)的取值将会非常小,相应地不等式右侧的值σ/f+1则会变大。于是有如下参数变化过程: 当r的取值降得非常低时,不等式关系r<σ/f+1就会更容易被满足,与此同时较小的r会导致更大的σ/f+1,从而进一步印证了不等式关系r<σ/f+1。因此能够肯定,当r取值很小时,系统相对更不可能存在内部的平衡点,相应系统的状态也就更可能会演化到一些边界上的平衡点。 毫无疑问,直接讨论r和σ/f+1之间的关系是有些困难的,这是因为,受到系统状态演化的影响,变量f=x/(x+y)的取值往往难以确定。实际上,关于内部平衡点,可用如下更简洁的充分条件来代替: 当满足条件r≤σ+1,复制动力学方程无解,系统不存在内部平衡点。接下来将重点分析r>σ+1情况下系统的平衡点数目,并就系统内部平衡点的稳定性进行分析。代入关系式f=x/(x+y),得到系统的复制动力学方程 x·=x[(1-x)Pc-yPd-zPl]y·=y[-xPc+(1-y)Pd-zPl]z·=z[-xPc-yPd+(1-z)Pl](3.50) 上式可化简为 x·=f(1-z){[1-f(1-z)]Pc-(1-f)(1-z)Pd-zσ} z·=z[-f(1-z)Pc-(1-f)(1-z)Pd+(1-z)σ](3.51) 式中,f=x/(x+y)。计算得到式(3.51)的雅可比矩阵为 J=J11J12J21J22(3.52) 矩阵J中的元素J11,J12,J21和J22的取值分别为 J11=[(1-z)-2f(1-z)2]Pc+f(1-z)[1-f(1-z)]Pcf- (1-2f)(1-z)2Pd-f(1-f)(1-z)2Pdf-z(1-z)σ J12=[-f+2f2(1-z)]Pc+f(1-z)[1-f(1-z)]Pcz+ 2f(1-f)(1-z)Pd-f(1-f)(1-z)2Pdz-f(1-2z)σ J21=z(1-z)Pd-Pc-fPcf-(1-f)Pdf J22=-f(1-2z)Pc-fz(1-z)Pcz-(1-f)(1-2z)Pd- (1-f)(1-z)zPdz+(1-2z)σ 其中, Pcf=r-r(1-zN)N(1-z), Pcz=(σ-r+1)(N-1)zN-2+r(1-f)N×1-zN-1[N-(N-1)z](1-z)2 借助表达式 ∑Sm=T+1Smr(m-T)S+1fm(1-f)S-m =rT(S-T)S+1ST∫f0tT-1(1-t)S-T-1(f-t)dt(3.53) 就可以得到 Pdf=r1-1-zNN(1-z)-∑N-1S=T+1N-1S(1-z)SzN-S-1× rT(S-T)S+1ST∫f0tT-1(1-t)S-T-1dt(3.54) 以及 Pdz=σ(N-1)zN-2-rfN1-zN-1[N-(N-1)z](1-z)2- ∑N-1S=T+1N-1S(1-z)S-1zN-S-2[(N-1)(1-z)-S]× rT(S-T)S+1ST∫f0tT-1(1-t)S-T-1(f-t)dt(3.55) 根据上述推导过程,能够得到雅可比矩阵式(3.52)中各项元素的值。为证实系统内部平衡点的存在性,接下来将给出具体的例子,找出系统在特定参数下的一个内部平衡点,并就其稳定性进行分析。 根据以上分析结果,若条件r>σ+1满足(图3.3),那么系统就可能含有内部平衡点。图3.3中空心点表示不稳定的平衡点,实心点则代表稳定的平衡点。(a)、(b)两图所对应的系统的演化均含有一个不稳定的内部平衡点,稳定平衡点x=1,不稳定的边界点y=1和z=1。 3.3彩图 图3.3三策略阈值公共品博弈在博弈参数满足r>σ+1条件下的内部平衡点以及策略演化情况 图(a)所对应的参数取值为N=5,T=3,r=4,σ=0.5,在这一参数条件下系统的内部平衡点为(x0,y0,z0)=(0.135,0.66,0.205),并且有Pc=Pd=Pl,此时此点(x0,y0,z0)是系统唯一的内部平衡点,并且点(x0,y0,z0)对应的雅可比矩阵为 J=J11J12J21J22=0.085420.126339-0.4871-4.571×10-3 假设上述雅可比矩阵J的特征值分别为λ1和λ2,那么可得到λ1+λ2=J11+J22>0以及λ1λ2=|J|>0,于是有λ1>0和λ2>0。 同样,对于图(b),给定公共品博弈的参数条件为N=10,T=6,r=4,σ=0.5,博弈系统存在唯一的内部平衡点(x0,y0,z0)=(0.06,0.31,0.63),代入可得到雅可比矩阵的各元素取值 J=J11J12J21J22=0.1156-9.855×10-3-0.689-0.0332 进一步计算特征值可得到λ1+λ2=J11+J22>0,λ1λ2=|J|<0。相应的雅可比矩阵的特征值为一正一负,显然系统的内部平衡点(x0,y0,z0)=(0.06,0.31,0.63)不稳定。 3.5仿真结果汇总 接下来将结合具体的仿真图例对含有阈值的三策略公共品博弈的博弈结果进行归纳总结。图例中空心点表示不稳定的平衡点,实心点代表稳定的平衡点。根据博弈参数之间的大小关系,共包含如下6种不同的情况。 情况1当NN-T<r<σ+1。 在策略的三角形图上,CD边界上仅存在一个不稳定的边界平衡点。该平衡点满足的条件是x+y=1,这意味着策略和背叛策略在系统中共存。在这一博弈情境下,给定参数条件r<σ+1满足,孤立策略将会成为系统唯一的全局吸引点。具体的仿真图例详见图3.4(a),图中,个体受到较大的孤立者收益(σ>r-1)的吸引,从而使得整个群体中的个体最终纷纷选择不参与博弈而直接采取孤立策略L。图中各参数为T=2,r=2.2,σ=1.5。 情况2当r<NN-T且r<σ+1。 当满足参数条件r<N/(N-T)时,在策略的三角形图上,CD边界上一定不存在这样的边界平衡点。该平衡点满足的条件是x+y=1,这意味着策略和背叛策略在系统中共存。既然同时满足条件r<σ+1,同上述情况1,此时系统一定不存在内部的平衡点,同时完全孤立仍然是系统唯一的全局吸引点。这种情况所对应的仿真图例参见图3.4(b),当个体受到较大的孤立策略收益(σ>r-1)的吸引时,群体状态将向完全孤立演化,最终整个群体将被孤立策略所主导。图中各参数为T=3,r=2.2,σ=1.5。图(a)和(b)中博弈参数均满足条件r<σ+1,此时孤立策略是群体唯一的平衡点。 3.4彩图 图3.4无限大均匀混合群体中的三策略公共品博弈(N=5) 情况3当σ+1<r<NN-T。 当参数满足条件r<N/(N-T)时,在策略的三角形图的CD边界上不存在使得系统演化至合作策略和背叛策略共存的边界平衡点。同时,还会得到边界平衡点x=1不稳定,而边界点y=1稳定。也就是说,当群体中仅含有合作和背叛两种策略时,背叛策略占有绝对的优势。但是如果引入第三种孤立策略L,背叛将不会成为群体唯一的稳定状态。在背叛策略与孤立策略共存时(DL构成的边界),边界平衡点y=1是不稳定的,而边界平衡点z=1稳定。这就说明,孤立策略会取代背叛策略而成为群体中唯一的主导策略。 然而对于由CL构成的边界,合作策略能够获得比孤立策略更高的收益(σ+1<r)。于是当合作与孤立策略共存时,合作又可以替代孤立而成为全局唯一的稳定平衡点。由此可见,公共品博弈条件下的策略演化将会沿着闭环C→D→L→C的方向进行,这将十分有利于群体合作的演化。这一情况所对应的仿真图例详见图3.4(c),其中彩色实心圆点表示在DL边界上,孤立策略是稳定的,同时在CL边界上,合作策略稳定。图中各参数为T=3,r=2,σ=0.5。 情况4当r>NN-T和r>σ+1。 若群体中仅含有C和D两种策略,对应于三角形图的CD边界,一定存在平衡点x+y=1使得合作策略和背叛策略共存。这是一个不稳定的平衡点,但又有边界平衡点x=1稳定,而边界平衡点y=1不稳定。也就是说,当群体中仅含有合作和背叛策略时,若群体初始的合作率低于某一定值,那么系统将会演化至完全背叛,否则会演化到完全合作的状态。 在此基础上引入第三种孤立策略L,因为r>σ+1,群体中合作策略显然会优于孤立策略,那么在整个系统中,合作就会占据绝对的优势。这一情况所对应的系统的仿真图例详见图3.4(d),由于参数设定满足条件r=σ+1,那么CL边界上所有的点均稳定,然而对于CD边界,完全背叛是群体的唯一稳定状态(r<N/(N-T))。图中各参数为T=3,r=2,σ=1。 情况5当r=σ+1<NN-T。 如果系统可提供的策略只有C和D两种,那么在CD边界上不存在满足x+y=1的边界平衡点。如前所述,在这样的平衡点上合作策略和背叛策略共存。同时系统内部也一定不存在内部平衡点。对于由CL所组成的边界,有r=σ+1,因此,CL边界上的点构成系统边界平衡点的集合。这一情况所对应的仿真图例详见图3.4(e),相应的博弈参数同时满足条件r>σ+1和r>N/(N-T),于是完全合作是群体唯一稳定的平衡点,在这里孤立策略相当于催化剂的角色,并起到抑制群体背叛和促进合作的作用。图中各参数为T=2,r=3,σ=0.5。 情况6当r=σ+1>NN-T。 在这一情况下,我们能够确定的是: 系统一定不存在内部平衡点。与上述的情况5有所不同,在CD边界上存在满足条件x+y=1的边界平衡点,而且它是不稳定的。另外,对于CL所组成的边界,均有r=σ+1,所以此边界上的所有点都是平衡点。这一情况所对应的仿真图例详见图3.4(f),参数设定满足r=σ+1,那么对于边界CL而言,上面所有的点均稳定。图中各参数为T=3,r=3,σ=2。 根据以上6种情况,能够得到如下结论,即无论是对背叛者收益设定阈值还是引入第三种策略(孤立者),群体合作率会因此而有所提升。虽然加入阈值T对合作策略有利,但是如果阈值T的取值过大,反而可能会不利于合作策略在群体中的演化。这里与一般的公共品博弈中结论类似的是,公共品博弈参数r的取值越大,则对合作策略就更加有利。 此外,孤立者的固定收益σ也会对最终的博弈结果产生一定的影响。在某个背叛策略占主导的群体中,尽管加入孤立者会有效抑制背叛,从而在某种程度上促进合作,但σ的取值过大就会导致孤立策略占主导,也会对群体合作产生不利的影响。上述结论主要是对背叛者的收益设置阈值的公共品博弈模型进行研究而得到群体策略演化情况。接下来将考虑另一种博弈模型,即对所有参与者收益设置阈值(合作和背叛个体都会承受收益阈值的限制),分别分析在这样的模型设定下的合作策略的演化以及对比这两种阈值模型之间的相同和不同点。 3.6本章小结 在探索群体合作演变的多元路径时,孤立者策略的引入显得尤为重要而有启示性。首先,它构建了一个更加多元和灵活的公共品博弈模型,从而为研究群体合作提供了新的维度和深度。在这里,我们更为详细地分析了孤立者角色的重要性和价值。 “孤立者”策略的引入是一项创新性的举措,它不仅为博弈论添加了一种新的维度,而且也是对现实社会复杂性的一种有力模拟。在实际的社会动态中,存在着一群既不赞同合作也不倾向于背叛的个体,他们保持一定的距离和中立态度。这类个体有时被视为观望者,他们的行动和选择常常是基于更为复杂和多元的判断和考量。他们可能在观察、分析,或者等待更有利的时机来做出选择。因此,孤立者角色的引入使我们的模型更贴近真实世界的复杂性和多元性,能够更精准地描绘出群体中的个体策略选择和行为模式。 其次,孤立者角色充当了一种重要的社会缓冲器。他们可以减少合作者和背叛者之间的直接冲突,降低社会紧张和对立。他们的存在可以抑制背叛行为的扩散,为合作者提供一个相对安稳的环境。他们可能通过某种方式影响或激励更多的人选择合作,从而有助于实现群体的长期稳定和和谐。通过深化对孤立者策略的研究,我们能更好地理解其在社会动态中的作用和影响,为我们提供更多有关如何促进和维护群体合作的见解和启示。 再次,孤立者的存在显著地丰富了公共品博弈的策略空间和动力学模型。此策略注入了新的活力与多样性,使得研究者能够通过一个全新的角度来解读和探讨博弈模型中的复杂问题。此种角色不仅仅是策略的增补,它犹如一把钥匙,为我们打开了一扇通往更加细腻和多元化策略互动世界的门户。 孤立者策略的引入,首先可以有效地丰富和扩展群体中的多元策略交互与竞争关系。它打破了简单的二分格局,带来了更多层次和维度的交互,使得我们能够更加细致和全面地捕捉和理解群体行为的复杂性和多元性。这不仅可以帮助我们深入剖析各种策略之间的微妙关系和互动,还可以为我们提供更多灵活和多元的策略选择和应用。 同时,孤立者策略的引入为我们打开了一个崭新的视角和途径,以深入分析和解决博弈模型中存在的复杂问题。通过这一独特的策略,我们能够更为明确地揭示和理解群体内的策略选择和行为动机,为研究者呈现出更为丰富多元的研究路径和视角。在博弈理论的世界中,孤立者策略成为一种新的工具,允许我们透过新的视角来理解和分析个体在群体中的行为和决策。这不仅能够揭示更为微妙的行为动机和策略交互,还可以帮助我们建立更为全面和深入的理论模型和分析框架。 此外,孤立者策略也能够为我们提供有关如何设计和实施有效的博弈策略和机制的深刻见解和实用建议。它可以促使我们重新考虑和调整现有的策略和机制,以更好地适应和促进群体内的合作与和谐。这种策略能够协助我们在促进群体的长期稳定和和谐方面,开拓更为创新和有效的途径。 进一步地,孤立者策略的引入也提出了新的研究问题和挑战,促使我们需进一步深化我们对此策略的理解和探索。首先,我们面临着需要更为精细地理解和描述孤立者在群体中的具体行为和动机的挑战。这涉及如何准确地描绘和分析孤立者的心理驱动力和行为模式,以及他们与合作者和背叛者之间的复杂互动和影响。其次,我们也需要深入研究和理解孤立者是如何影响群体合作的动力学和稳定性的,这包括他们是如何通过独特行为和策略来影响群体中的合作氛围和稳定性的,以及他们的存在是如何可能导致群体动力学的变化和调整的。为了更好地理解这些影响,我们需要构建更为复杂和精细的模型来模拟和分析群体内的多元策略交互和动力学演变。最后,我们也需要探索如何构建和设计更有利于合作的博弈策略和机制。这意味着我们需要在理论和实践层面探索和开发更为有力和高效的策略和机制,以促进和维护群体中的合作和和谐。这可能涉及开发新的理论框架和工具,以更好地捕捉和理解群体中的合作动力和挑战。 综上所述,孤立者策略的引入为我们提供了一个新的、丰富的和有力的工具来研究和促进群体合作的演变。它不仅丰富了我们对公共品博弈模型的理论和实践认识,也为探索和解决实际中的合作问题提供了新的视角和方法。我们期待通过深化对孤立者策略的研究和探索,能够为理解和促进群体中的合作和和谐关系做出更多的贡献。