第5章迁移工作流多服务主体
收益分配方法

5.概述
1 

由于单个服务主体的能力和资源是有限的,迁移工作
流的服务主体基于业务熟人网络内的主动服务可以看作
多智能主体合作求解的一种形式,即业务熟人网络中的服
务主体合作是采用的动态联盟的组织策略,旨在将信息、
服务和资源等方面的合作转化成竞争优势,并最终物化为
收益。但有了收益就不可避免地面临收益分配问题,联盟
收益分配的结果是否公平合理会直接影响到盟员合作的
积极性,从而影响收益的进一步生成。迁移工作流中每个
服务主体在执行主动服务的过程中在保证最大化的合作
效用的同时,都有一个明确的目标,即通过策略或选择行
动优化自己的收益期望值。因此,建立良好的收益分配方
法关系到业务熟人网络是否能够稳定有效的运行并最终
实现迁移工作流目标,是迁移工作流实现主动服务必须解
决的关键问题之一。

·92· 


第5章迁移工作流多服务主体收益分配方法

本章主要研究迁移工作流业务熟人网络内多服务主

体的收益分配策略,提出了一种简单而有效的实时收益补

偿的协调方法,先将参与迁移工作流主动服务的多服务主

体分配收益的问题形式化为一个多人的动态合作博弈,再

通过随着时间而转变的动态合作博弈获取收益协调补偿

信息。

本章首先介绍了基于动态合作博弈的收益分配研究, 
然后定义了多服务主体收益分配模型,提出多服务主体收
益分配的动态优化策略及算法,实验结果表明采用动态合
作博弈的方法确定收益的协调补偿,避免多服务主体退出
熟人网络的行为直至主动服务圆满结束,达到多赢的帕累
托最优局面。

5.基于动态合作博弈的收益分配研究
2 

业务熟人网络收益合理分配是维持和巩固业务熟人
网络参与者合作关系的根本保证。业务熟人网络管理的
重点就是建立并维护业务熟人网络合作伙伴关系,使合作
成员协调一致,各尽所能地发挥自己的优势,在为用户提
供满意的资源或服务的同时,尽可能地降低动态熟人网络
运营成本,实现业务熟人网络整体收益最大化的目标。而
业务熟人网络中的参与者是一个独立的实体,它有自己完
整的组织机构,是一个理性的组织,每个成员都有自己的

·93· 


面向目标的迁移工作流主动服务方法

利益目标,都想获得尽可能多的利益,当然它更不愿意自
己的利益受到损害,这就涉及业务熟人网络收益如何在熟
人间进行公平、合理分配的问题。如果收益分配公平、合
理,就会使现有的业务熟人网络合作关系得到巩固和加
强;反之,如果收益分配不够公平、合理,就会损害业务熟
人网络组织机构间的合作关系,影响业务熟人网络的整体
效率和绩效,甚至会导致整个业务熟人网络瓦解。因此
, 
业务熟人网络组织机构合作收益的公平、合理的分配是维
持和巩固业务熟人网络合作伙伴关系的根本保证。

参与业务熟人网络有两个条件:一是业务熟人网络
获得的整体收益要远大于未参与业务熟人网络之前所有
服务主体独自获得的收益之和;二是参与业务熟人网络之
后,每个熟人所获得的收益要大于他没有参与业务熟人网
络时所获得的收益。

正是上述两个条件得到满足后,服务主体才愿意加入
到业务熟人网络中,并且愿意维持这种合作伙伴关系。如
果业务熟人网络中某个熟人获得的收益少于参加业务熟
人网络之前所获得的收益,或他认为业务熟人网络的收益
分配不公平,那么,这个熟人就会不再愿意与其他熟人进
行合作,或者退出业务熟人网络,或者破坏业务熟人网络
, 
这就会降低业务熟人网络合作的效率,损害整个业务熟人
网络的收益。相反,如果他觉得业务熟人网络上的收益分
配公平合理,即使短期内他获得的收益不高于未加入业务

·94
· 


第5章迁移工作流多服务主体收益分配方法

熟人网络之前所获得的收益,他也会愿意与其他熟人进行
合作,与其他熟人采取一致的行动。

博弈论研究的内容主要是决策主体的行为发生直接
相互作用时的决策及均衡问题,它的应用范围已延伸至政
治、经济和军事等各个学科,获得了极大的成功。20世纪
80年代以来,博弈论逐渐成为管理科学研究的一个重要
工具,在“机制设计”委(“) 托-代理”“契约理论”等方面得到
了广泛的应用。

合作博弈的基本形式是联盟型博弈,它隐含的假设是
存在一个在参与者之间可以自由转移的交换媒介,每个参
与者的效用在其中是线性的。

Shapley用公理化的方法,基于合作伙伴的贡献给出
了联盟分配解Shapley值的概念,构建了联盟分配的核
心,核心是不被其他任何分配优超的分配全体组成的
集合。

VonNeumann和Morgenster引入了稳定集的概念, 
稳定集内部不存在优超关系,对任意一个其他分配总能在
稳定集中找到一个优超于它的。

Aumann和Maschler通过引入异议(objetion)和反异
议(one-bjcin) -brgiigse作

cutroeto给出了AM谈判集(aannt) 
为合作博弈的分配解,即没有一个合理理由反对的解。
Zhou基于联盟结构提出了L-z谈判集,解决了A-M 
谈判集过于庞大的问题。
·95· 


面向目标的迁移工作流主动服务方法

Davis和Maschler基于超出额(一个成员没有其他合
作情况下所能得到的最大额外收入)定义了核仁(kernel)
, 
并证明了核仁是谈判集的子集。

Schmeidler通过考虑超出额在欧氏空间里的字典编
纂式排序(eiorphcodr)
, 
使最不满意的联盟怨言最

lxcgaire
小而引入了核子(nucleofus)作为合作博弈的分配解,直观
来讲,Shapley值相当于数集的平均值而核子类似于中位
数。关键的是,核子是非空的,核子是核仁的子集,核子仅
包含一个点。如果核仁和核心(core)都是非空的,那么
它们的交集也是非空的。

Maschler和Tijs分别给出了σ值和τ值的概念,实际
上是稳定集上界和下界的一种妥协值。

Aumann对效用可转移的情况进行了推广,给出了效
用不可转移联盟博弈中核心的概念和刻画,公理化了
N 
罚
博弈,延拓了Shapley值并证明了延拓值的唯一性。

Aumann和Shapley把公理化值的概念推广了到非原
子博弈中。

从以上文献的研究现状可以看出,收益分配是联盟研
究中一个比较重要的问题,不少学者进行了许多卓有成效
的工作。同时,动态联盟强调盟员之间的合作,而每个盟
员都是有其自身利益的独立主体,合作博弈值理论在动态
联盟收益分配的研究中可以解决许多问题。但是目前利
用合作博弈论来解决业务熟人网络收益分配还有待进一

·96
· 


第5章迁移工作流多服务主体收益分配方法

步深入,本章将合作博弈论与业务熟人网络合作问题紧密
结合,对业务熟人网络收益问题进行分析和研究,为合理
度量与评价熟人在业务熟人网络中的贡献、制定公平的收
益分配方案提供基础。

5.多服务主体收益分配模型
3 

本节将建立多服务主体收益分配模型,该模型适应于
迁移工作流动态环境中多服务主体在熟人网络内的合作, 
能够促进多服务主体在合作中协同效应,发挥各方的特长
和优势,为迁移实例提供主动服务,创造共赢的结果。

在多服务主体收益分配模型中,服务主体效用相对越
大,获得的收益相对越高。在本模型中有
k 
个服务主体参
与熟人网络并分享熟人网络的收益,这些服务主体需要采
用一定的策略获得收益才能完成目标,故实现目标的服务
主体执行状态是沿着一定轨迹的迁移。根据经典的最优
控制问题相关理论,下面给出一般的(连续时间)多服务主
体收益分配的模型。

定义5-
1 
多服务主体收益分配的模型mspa是一个
四元组(
N 
,v,)。其中,
N 
表示迁移工作流中有限的

S,
x 
服务主体集合;
S 
表示业务熟人集合;
v 
表示一个定义在
集合
N 
的函数,函数
v 
对域
N 
当中的非空子集———业务
熟人集合
S 
都有一个赋值,其值为一个实数, v>

用<
N 
,
·97· 


表示支付可转移的联盟型博弈;支付向量x=(x1,x2,…, 
xi,…,xn)代表总收益的划分,而向量中的xi 是参与者i 
所分得的支付。
每位参与业务熟人网络内服务主体是理性的,一个为
所有服务主体所接受的支付向量必须符合整体理性和个
体理性,给出定义如下。
定义5-2 整体理性是指所有服务主体的收益分配的
和等于业务熟人网络的总收益,即
Σi∈N
xi =v(N ) 
定义5-3 个体理性是指每个服务主体参加业务熟人
网络所得收益都比“各自为政”时高,即
xi ≥v({i}) 
定义如下参数: 
(1)Rn 为n 维欧氏空间,任何x(t)∈Rn 称为状态
变量;
(2)Rm 为m 维欧氏空间,任何u(t)∈Rm 称为控制
变量;
(3)g:[t0,T]×Rn×Rm →Rn; 
(4)f:[t0,T]×Rn×Rm →R; 
(5)h[xi(T)]:给定的函数h 是关于终端状态x(T) 
的末值函数。
所以服务主体i 得到的收益值是: 
·98· 
面向目标的迁移工作流主动服务方法

∫T 
t0
gi[xi(t),ui(t)]dt+h[xi(T)] i ∈ [1,2,…,k] 
(5-1) 
主体i 的收益都与主体状态有着密切关系,受控于状
态方程: 
x·i(t)=f[t,xi(t),ui(t)] (5-2) 
系统的初始条件是x·i(t0)=x0,x·(·)称之为主体可允许
的状态轨迹。
假设在业务熟人网络完成特定目标的主动服务过程
中收益是可以转移的,对不同服务主体的收益进行比较。
在每个时间点t,服务主体i 都会收到瞬时收益gi[xi(t), 
ui(t)],而在主动服务过程结束的时间T,主体i 得到终点
收益h[xi(T)]。主体i 的瞬时收益和终点收益与状态变
量成正比关系,即状态变量xi(t)越大,瞬时收益gi[xi(t), 
ui(t)]和终点收益h[xi(T)]的值越大。
例如,在迁移工作流系统中的k 个服务主体的业务熟
人网络中,xi(t)是服务主体i 的服务资源存储量,假定服
务主体所提供的服务资源按一定的速度消耗pi(t),且按
一定的速度建设服务资源ui(t),则服务主体服务状态满
足下述方程: 
x·i(t)=-pi(t)+ui(t) i ∈ [1,2,…,k](5-3) 
作为服务主体i,无法改变pi(t),但可以控制ui(t)。
设服务主体i 提供的服务每单位为a 元,建设服务资源为
·99· 
第5章 迁移工作流多服务主体收益分配方法

面向目标的迁移工作流主动服务方法

h[T)] 
为主体对
T 
时刻的终点收益,计算出主体
i 
在结束时间的
潜在净收益值。则在时间区间[中主体
i 
的实际收

每单位
b 
元,维护服务资源为每单位
c 
元,xi(表示

t0,T] 
益为: 

∫
T 
(api(bt)-xi(dxi(T)] 

t)-ui(ct))t+h[

t0

(5-4) 

5.多服务主体收益分配的动态优化策略
4 

5.1 
多服务主体收益分配中的马尔可夫完美均衡
4.
在多服务主体收益分配过程中,每个服务主体在熟人
网络内其他服务主体的状态基础上确定自己的最优状态。
也就是说,每个服务主体的状态都受到熟人网络中其他服
务主体状态的影响。这种控制和决策行为正是博弈论要
研究的问题,其结果是一个马尔可夫完美均衡:服务主体
将来的状态与过去的状态无关,只依赖现在的状态。同
时,每个服务主体以各自预期利润的最大化为目标,这个
服务主体的策略是纳什均衡,其策略函数满足马尔可夫
性质。

从时间t到t+Δt,其中,Δt是很小的时间增量,收益函
数从v(x,变到v(x+Δt+Δt)。根据动态规划的最优

t) x,
性原理,服务主体的目标函数的变化由两部分组成:第一部
·100· 


分是时间从t 到t+Δt 的变化引起的增值变化,这个变化量
在式(5-1)中表示为gi[xi(t),ui(t)]从t 到t+Δt 的积分
值;第二部分是收益函数在时间t+Δt 的值v(x+Δx,t+ 
Δt)。多服务主体收益优化问题是在一定状态进展变化下, 
尽可能使这两部分之和取最大值。用方程式表示为: 
v(x,t)=max{Σi∈K∫t+Δt 
t gi[xi(t),ui(t)]dt+ 
v[x(t+Δt),t+Δt]} + 
Σi∈K
h[xi(Δt)] (5-5) 
其中,Δt 表示时间t 的一个微小增量。
由于g 是连续的,因此式(5-5)中的积分近似于gi 
[xi(t),ui(t)]Δt,从而有
v(x,t)=max{Σi∈K
gi[xi(t),ui(t)]Δt+ 
v[x(t+Δt),t+Δt]} + 
Σi∈K
h[xi(Δt)] (5-6) 
假定收益函数v 关于自变量是连续可微函数,于是可
将v 展开成泰勒级数,即
v[x(t+Δt),t+Δt]=v(x,t)+ [vx(x,t)x·i(t)+ 
vi(x,t)Δt] (5-7) 
其中,vx(x,t)和vi(x,t)是v(x,t)分别关于x 和t 
的偏导数。
·101· 
第5章 迁移工作流多服务主体收益分配方法