第5章迁移工作流多服务主体 收益分配方法 5.概述 1 由于单个服务主体的能力和资源是有限的,迁移工作 流的服务主体基于业务熟人网络内的主动服务可以看作 多智能主体合作求解的一种形式,即业务熟人网络中的服 务主体合作是采用的动态联盟的组织策略,旨在将信息、 服务和资源等方面的合作转化成竞争优势,并最终物化为 收益。但有了收益就不可避免地面临收益分配问题,联盟 收益分配的结果是否公平合理会直接影响到盟员合作的 积极性,从而影响收益的进一步生成。迁移工作流中每个 服务主体在执行主动服务的过程中在保证最大化的合作 效用的同时,都有一个明确的目标,即通过策略或选择行 动优化自己的收益期望值。因此,建立良好的收益分配方 法关系到业务熟人网络是否能够稳定有效的运行并最终 实现迁移工作流目标,是迁移工作流实现主动服务必须解 决的关键问题之一。 ·92· 第5章迁移工作流多服务主体收益分配方法 本章主要研究迁移工作流业务熟人网络内多服务主 体的收益分配策略,提出了一种简单而有效的实时收益补 偿的协调方法,先将参与迁移工作流主动服务的多服务主 体分配收益的问题形式化为一个多人的动态合作博弈,再 通过随着时间而转变的动态合作博弈获取收益协调补偿 信息。 本章首先介绍了基于动态合作博弈的收益分配研究, 然后定义了多服务主体收益分配模型,提出多服务主体收 益分配的动态优化策略及算法,实验结果表明采用动态合 作博弈的方法确定收益的协调补偿,避免多服务主体退出 熟人网络的行为直至主动服务圆满结束,达到多赢的帕累 托最优局面。 5.基于动态合作博弈的收益分配研究 2 业务熟人网络收益合理分配是维持和巩固业务熟人 网络参与者合作关系的根本保证。业务熟人网络管理的 重点就是建立并维护业务熟人网络合作伙伴关系,使合作 成员协调一致,各尽所能地发挥自己的优势,在为用户提 供满意的资源或服务的同时,尽可能地降低动态熟人网络 运营成本,实现业务熟人网络整体收益最大化的目标。而 业务熟人网络中的参与者是一个独立的实体,它有自己完 整的组织机构,是一个理性的组织,每个成员都有自己的 ·93· 面向目标的迁移工作流主动服务方法 利益目标,都想获得尽可能多的利益,当然它更不愿意自 己的利益受到损害,这就涉及业务熟人网络收益如何在熟 人间进行公平、合理分配的问题。如果收益分配公平、合 理,就会使现有的业务熟人网络合作关系得到巩固和加 强;反之,如果收益分配不够公平、合理,就会损害业务熟 人网络组织机构间的合作关系,影响业务熟人网络的整体 效率和绩效,甚至会导致整个业务熟人网络瓦解。因此 , 业务熟人网络组织机构合作收益的公平、合理的分配是维 持和巩固业务熟人网络合作伙伴关系的根本保证。 参与业务熟人网络有两个条件:一是业务熟人网络 获得的整体收益要远大于未参与业务熟人网络之前所有 服务主体独自获得的收益之和;二是参与业务熟人网络之 后,每个熟人所获得的收益要大于他没有参与业务熟人网 络时所获得的收益。 正是上述两个条件得到满足后,服务主体才愿意加入 到业务熟人网络中,并且愿意维持这种合作伙伴关系。如 果业务熟人网络中某个熟人获得的收益少于参加业务熟 人网络之前所获得的收益,或他认为业务熟人网络的收益 分配不公平,那么,这个熟人就会不再愿意与其他熟人进 行合作,或者退出业务熟人网络,或者破坏业务熟人网络 , 这就会降低业务熟人网络合作的效率,损害整个业务熟人 网络的收益。相反,如果他觉得业务熟人网络上的收益分 配公平合理,即使短期内他获得的收益不高于未加入业务 ·94 · 第5章迁移工作流多服务主体收益分配方法 熟人网络之前所获得的收益,他也会愿意与其他熟人进行 合作,与其他熟人采取一致的行动。 博弈论研究的内容主要是决策主体的行为发生直接 相互作用时的决策及均衡问题,它的应用范围已延伸至政 治、经济和军事等各个学科,获得了极大的成功。20世纪 80年代以来,博弈论逐渐成为管理科学研究的一个重要 工具,在“机制设计”委(“) 托-代理”“契约理论”等方面得到 了广泛的应用。 合作博弈的基本形式是联盟型博弈,它隐含的假设是 存在一个在参与者之间可以自由转移的交换媒介,每个参 与者的效用在其中是线性的。 Shapley用公理化的方法,基于合作伙伴的贡献给出 了联盟分配解Shapley值的概念,构建了联盟分配的核 心,核心是不被其他任何分配优超的分配全体组成的 集合。 VonNeumann和Morgenster引入了稳定集的概念, 稳定集内部不存在优超关系,对任意一个其他分配总能在 稳定集中找到一个优超于它的。 Aumann和Maschler通过引入异议(objetion)和反异 议(one-bjcin) -brgiigse作 cutroeto给出了AM谈判集(aannt) 为合作博弈的分配解,即没有一个合理理由反对的解。 Zhou基于联盟结构提出了L-z谈判集,解决了A-M 谈判集过于庞大的问题。 ·95· 面向目标的迁移工作流主动服务方法 Davis和Maschler基于超出额(一个成员没有其他合 作情况下所能得到的最大额外收入)定义了核仁(kernel) , 并证明了核仁是谈判集的子集。 Schmeidler通过考虑超出额在欧氏空间里的字典编 纂式排序(eiorphcodr) , 使最不满意的联盟怨言最 lxcgaire 小而引入了核子(nucleofus)作为合作博弈的分配解,直观 来讲,Shapley值相当于数集的平均值而核子类似于中位 数。关键的是,核子是非空的,核子是核仁的子集,核子仅 包含一个点。如果核仁和核心(core)都是非空的,那么 它们的交集也是非空的。 Maschler和Tijs分别给出了σ值和τ值的概念,实际 上是稳定集上界和下界的一种妥协值。 Aumann对效用可转移的情况进行了推广,给出了效 用不可转移联盟博弈中核心的概念和刻画,公理化了 N 罚 博弈,延拓了Shapley值并证明了延拓值的唯一性。 Aumann和Shapley把公理化值的概念推广了到非原 子博弈中。 从以上文献的研究现状可以看出,收益分配是联盟研 究中一个比较重要的问题,不少学者进行了许多卓有成效 的工作。同时,动态联盟强调盟员之间的合作,而每个盟 员都是有其自身利益的独立主体,合作博弈值理论在动态 联盟收益分配的研究中可以解决许多问题。但是目前利 用合作博弈论来解决业务熟人网络收益分配还有待进一 ·96 · 第5章迁移工作流多服务主体收益分配方法 步深入,本章将合作博弈论与业务熟人网络合作问题紧密 结合,对业务熟人网络收益问题进行分析和研究,为合理 度量与评价熟人在业务熟人网络中的贡献、制定公平的收 益分配方案提供基础。 5.多服务主体收益分配模型 3 本节将建立多服务主体收益分配模型,该模型适应于 迁移工作流动态环境中多服务主体在熟人网络内的合作, 能够促进多服务主体在合作中协同效应,发挥各方的特长 和优势,为迁移实例提供主动服务,创造共赢的结果。 在多服务主体收益分配模型中,服务主体效用相对越 大,获得的收益相对越高。在本模型中有 k 个服务主体参 与熟人网络并分享熟人网络的收益,这些服务主体需要采 用一定的策略获得收益才能完成目标,故实现目标的服务 主体执行状态是沿着一定轨迹的迁移。根据经典的最优 控制问题相关理论,下面给出一般的(连续时间)多服务主 体收益分配的模型。 定义5- 1 多服务主体收益分配的模型mspa是一个 四元组( N ,v,)。其中, N 表示迁移工作流中有限的 S, x 服务主体集合; S 表示业务熟人集合; v 表示一个定义在 集合 N 的函数,函数 v 对域 N 当中的非空子集———业务 熟人集合 S 都有一个赋值,其值为一个实数, v> 用< N , ·97· 表示支付可转移的联盟型博弈;支付向量x=(x1,x2,…, xi,…,xn)代表总收益的划分,而向量中的xi 是参与者i 所分得的支付。 每位参与业务熟人网络内服务主体是理性的,一个为 所有服务主体所接受的支付向量必须符合整体理性和个 体理性,给出定义如下。 定义5-2 整体理性是指所有服务主体的收益分配的 和等于业务熟人网络的总收益,即 Σi∈N xi =v(N ) 定义5-3 个体理性是指每个服务主体参加业务熟人 网络所得收益都比“各自为政”时高,即 xi ≥v({i}) 定义如下参数: (1)Rn 为n 维欧氏空间,任何x(t)∈Rn 称为状态 变量; (2)Rm 为m 维欧氏空间,任何u(t)∈Rm 称为控制 变量; (3)g:[t0,T]×Rn×Rm →Rn; (4)f:[t0,T]×Rn×Rm →R; (5)h[xi(T)]:给定的函数h 是关于终端状态x(T) 的末值函数。 所以服务主体i 得到的收益值是: ·98· 面向目标的迁移工作流主动服务方法 ∫T t0 gi[xi(t),ui(t)]dt+h[xi(T)] i ∈ [1,2,…,k] (5-1) 主体i 的收益都与主体状态有着密切关系,受控于状 态方程: x·i(t)=f[t,xi(t),ui(t)] (5-2) 系统的初始条件是x·i(t0)=x0,x·(·)称之为主体可允许 的状态轨迹。 假设在业务熟人网络完成特定目标的主动服务过程 中收益是可以转移的,对不同服务主体的收益进行比较。 在每个时间点t,服务主体i 都会收到瞬时收益gi[xi(t), ui(t)],而在主动服务过程结束的时间T,主体i 得到终点 收益h[xi(T)]。主体i 的瞬时收益和终点收益与状态变 量成正比关系,即状态变量xi(t)越大,瞬时收益gi[xi(t), ui(t)]和终点收益h[xi(T)]的值越大。 例如,在迁移工作流系统中的k 个服务主体的业务熟 人网络中,xi(t)是服务主体i 的服务资源存储量,假定服 务主体所提供的服务资源按一定的速度消耗pi(t),且按 一定的速度建设服务资源ui(t),则服务主体服务状态满 足下述方程: x·i(t)=-pi(t)+ui(t) i ∈ [1,2,…,k](5-3) 作为服务主体i,无法改变pi(t),但可以控制ui(t)。 设服务主体i 提供的服务每单位为a 元,建设服务资源为 ·99· 第5章 迁移工作流多服务主体收益分配方法 面向目标的迁移工作流主动服务方法 h[T)] 为主体对 T 时刻的终点收益,计算出主体 i 在结束时间的 潜在净收益值。则在时间区间[中主体 i 的实际收 每单位 b 元,维护服务资源为每单位 c 元,xi(表示 t0,T] 益为: ∫ T (api(bt)-xi(dxi(T)] t)-ui(ct))t+h[ t0 (5-4) 5.多服务主体收益分配的动态优化策略 4 5.1 多服务主体收益分配中的马尔可夫完美均衡 4. 在多服务主体收益分配过程中,每个服务主体在熟人 网络内其他服务主体的状态基础上确定自己的最优状态。 也就是说,每个服务主体的状态都受到熟人网络中其他服 务主体状态的影响。这种控制和决策行为正是博弈论要 研究的问题,其结果是一个马尔可夫完美均衡:服务主体 将来的状态与过去的状态无关,只依赖现在的状态。同 时,每个服务主体以各自预期利润的最大化为目标,这个 服务主体的策略是纳什均衡,其策略函数满足马尔可夫 性质。 从时间t到t+Δt,其中,Δt是很小的时间增量,收益函 数从v(x,变到v(x+Δt+Δt)。根据动态规划的最优 t) x, 性原理,服务主体的目标函数的变化由两部分组成:第一部 ·100· 分是时间从t 到t+Δt 的变化引起的增值变化,这个变化量 在式(5-1)中表示为gi[xi(t),ui(t)]从t 到t+Δt 的积分 值;第二部分是收益函数在时间t+Δt 的值v(x+Δx,t+ Δt)。多服务主体收益优化问题是在一定状态进展变化下, 尽可能使这两部分之和取最大值。用方程式表示为: v(x,t)=max{Σi∈K∫t+Δt t gi[xi(t),ui(t)]dt+ v[x(t+Δt),t+Δt]} + Σi∈K h[xi(Δt)] (5-5) 其中,Δt 表示时间t 的一个微小增量。 由于g 是连续的,因此式(5-5)中的积分近似于gi [xi(t),ui(t)]Δt,从而有 v(x,t)=max{Σi∈K gi[xi(t),ui(t)]Δt+ v[x(t+Δt),t+Δt]} + Σi∈K h[xi(Δt)] (5-6) 假定收益函数v 关于自变量是连续可微函数,于是可 将v 展开成泰勒级数,即 v[x(t+Δt),t+Δt]=v(x,t)+ [vx(x,t)x·i(t)+ vi(x,t)Δt] (5-7) 其中,vx(x,t)和vi(x,t)是v(x,t)分别关于x 和t 的偏导数。 ·101· 第5章 迁移工作流多服务主体收益分配方法