课程首页 学习指南 师资队伍 网上课堂 学习资源 教学录像 学科研究 测试训练 学习论坛
 
 

欢迎进入华中师范大学信息管理系的信息经济学网络课程!

 
 
当前栏目:学习资源>参考论文>委托——代理人理论>
 

连环“委托—代理”博弈模型

高鸿桢,徐明生 

【原文出处】厦门大学学报(哲学社会科学版)

【原刊期号】2000年第2(总第142)

【原刊页号】9498      

【作者简介】高鸿桢,徐明生厦门大学计划统计系,福建厦门361005

【中文摘要】在委托—代理关系中,代理人经常凭借信息优势采取对委托人不利的行动。而在连环“委托—代理”模型中,委托人的收益不仅取决于他自己的代理人的行动,而且还取决于其他代理人的行动。连环“委托—代理”博弈模型表明:“颤抖手精炼均衡”有可能阻止委托人不希望的均衡结果的出现。

【关 词】连环委托—代理;博弈模型;颤抖手精炼均衡中

 

引言

一个“连环委托—代理问题”是指有两个或两个以上的“委托人—代理人”对,每个委托人的收益可以用他自己的代理人的行动和所有其他代理人的行动的函数表示,同时,他们的收益还取决于一个共同随机变量——这就是所谓的“连环”的含义。这个共同的随机变量对于所有代理人来说是事前知道的,而对于委托人来说却是不可观察的。更进一步,我们假设委托人之间相互不知对方的收益,因此,我们讨论的框架与一个委托人对多个代理人的情形不同。连环委托—代理问题常存在于相互竞争的团体之间的博弈中。[1]例如,几个经营相同险种的保险公司,各个公司的利润不仅取决自己公司的员工的努力水平,还取决于其他公司员工的努力水平(当其他公司业务员工作都很卖力,而自己公司的业务员却偷懒时,该公司利润相对就低;反之,公司的利润相对就高)

本文所选用模型是一个有两个委托人和两个代理人的博弈模型。其中,委托人无法观察到任何一个代理人选择的努力水平,不过他们各自能知道自己的收益,同时,委托人的收益是由两个代理人的努力水平和一个只能由代理人观察到的外生变量共同决定的。我们用从这些经济模型产生的博弈的“颤抖手精炼均衡”[2-3]来说明如何减少委托人不希望的均衡结果的出现。当然,这就要满足激励机制的两种约束:第一是满足个人理性约束,即代理人按激励机制行事的效用不低于他不按激励机制行事的效用,这也是代理人的参与约束。第二是满足激励相容约束:若α1是委托人希望代理人采取的行动,而α2是代理人可采取的另外一个行动,但委托人不可能直接观测到代理人到底采取何种行动,则只有在代理人采取α1的效用大于采取α2的效用时,代理人才会自觉采取α1。即任何委托人希望的行动α都只能通过代理人的效用最大化行为实现。

在连环委托—代理问题中,由于只有代理人能观测到实际的外生变量,因此,代理人就可能凭借信息优势选择不利于委托人而使自己效用较大的行动。这样,在外生变量本来是对委托人有利情况下(或者说在“好”的自然状态下),若代理人们能有效合谋,他们就可能都不努力工作,而使委托人的收益等同于“坏”的自然状态,而他们却可以不受惩罚,增加自己的效用。本文就是讨论在一定的条件下,如何避免这种情况的发生。

 

模型及其分析

设各委托人的收益仅取决于“自然状态”和代理人的行动选择。也就是说,如果委托人是企业所有者,我们就将诸如原料价格、生产函数、市场需求和国家产业政策等经济变量概括到“自然状态”之中。一般说,我们可以考虑有n种自然状态的情况。记自然状态集S={1,2,...,sn},其中si(=1,...,)是一种自然状态,sn对于所有委托人来说是最有利的自然状态,sn-1次之,依此类推,1是对委托人最为不利的自然状态。虽然委托人知道这个信息,但实际上究竟哪个si发生则只有代理人能够观测到。本文只考虑n=2的情况,即s1是“坏”自然状态,2是“好”自然状态。

在了解s后,每个代理人j从有限集合E={1,2,...,em}中选择自己的努力水平ej,同样委托人不知道代理人的实际选择。不过每个委托人j可以观察到各自的收益πj,其中πj取决于他的代理人j的努力水平ej、自然状态s和其他委托人的代理人的努力水平e-j。这些收益函数是各委托人和代理人的“共同知识”。我们说这是个“连环委托—代理问题”,是由于某个委托人的收益(或利润)不仅取决于他自己的代理人的行为和自然状态,还取决于所有其他代理人的行为。

对于每一个代理人来说,他可以努力工作,也可以不努力工作。当他努力工作时可以得到委托人给他的报酬wj;当他不努力工作时可能有额外的收益,例如可以从事第二职业而得到另一份收入或得到闲暇的乐趣等,我们将这部分效用记为lj,设各代理人的效用仅由wj和lj决定,且是可加的,

Vj=Uj(wj)+lj

其中,V是代理人j的总效用,()是由报酬w产生的效用。另外,一个代理人的保留效用以下列约束条件概括:

            Vj(wj,lj)≥ Vj=Uj( wj)

其中,Vj是代理人j的总效用,Uj(wj)是由报酬wj产生的效用。另外,一个代理人的保留效用以下列约束条件概括:

           Vj(wj,lj)≥j=Uj()

为了使代理人接受雇佣合同,委托人应保证,即使在最坏的自然状态下,若代理人努力工作,代理人至少能得到的报酬为wj(我们简单定义Vj= Uj= Uj( wj)+0)。若事后发现代理人不努力工作,则根据合同,委托人给他施加一定的惩罚(如扣薪水,甚至扣代理人交的保证金,直至开除),从而使代理人的效用U=-(>0,M越大表示对代理人的惩罚越重)

为了说明颤抖手精炼均衡的价值,我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策略有:α1(积极工作)和α2(偷懒);代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略,在自然状态s1和s2,每个委托人的收益如下:

    状态s1()            状态s2() 

  β1   β2                   β1    β2 

α1(1,2) (1,2)              α1(1,2) (1,2) 

α2(1,2) (1,2)              α2(1,2) (1,2)

其中,0<aj<bj<cj<dj<ej,=1,2。这意味着当自然状态“坏”时,每个代理人都必须采用积极的策略才可能使自己的委托人得到中等以上的收益(即不小于cj);而当自然状态“好”时,两代理人都选“偷懒”也可使各自的委托人得到cj的收益。现在设代理人j(=1,2)在他的委托人的利润不小于cj单位时,都得到 Uj;否则所得为-M。假设代理人j选择“积极”策略时,就没有额外收益,而选择“偷懒”时,可有li>0单位的额外收益。因此,代理人的收益,可用如下标准形的二人非零和博弈给出:

状态s1()   

α1  β1 ( 1, 2)    β2 ( 1-)

α2        (-, 2)            (-,-) 

 状态s2()

α1  β1 ( 1, 2)    β2 ( 1,-)

α2        (-, 2)            ( 1+1, 2+2)

  这样,在好的环境s2,代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( 1, 2)(α2,β2)对应收益对( 1,+1, 2+2);而在坏的状态s1,代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( 1, 2)。观察上述博弈,我们发现在状态s2,(α1,β1)更加有效率(使每个委托人的收益都较大),然而两个代理人却更喜欢均衡(α2,β2),因为这个均衡使他们的效用从( 1, 2)升至( 1,+1, 2+2)。但是,如果这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡,代理人就可能不再偏爱均衡(α2,β2)。“颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进。颤抖手精炼均衡的基本思想是:在任何一个博弈中,每个局中人都有一定的犯错误的可能性(类似一个人用手抓东西时,颤抖,他就抓不住他想抓的东西)。一个策略对是一个颤抖手精炼均衡时,它必须具有如下性质:各局中人i要采用的策略,不仅在其他局中人不犯错误时是最优的,而且在其他局中人偶尔犯错误(概率很小,但大于0)时还是最优的。可以看出,颤抖手精炼均衡是一种较稳定的均衡。因为上述模型中代理人间博弈是典型的二人非零和博弈,本文重新定义二人非零和博弈的颤抖手精炼均衡。

定义:设在二人非零和博弈中,纳什均衡( , )是颤抖手精炼均衡,如果对于局中人12,分别存在一个严格的混合策略序列{()}{()},=1,2,...,使得: 

 (1)limi→+()= ,limi→+()=Y  

 (2)对于每一个i,X 是对Y()的最优反应,即 

 E( ,())≥E(,()), X∈∑1;·

 

 

 

三、启示

    在一个关于“连环委托—代理问题”的简单模型中,选择颤抖手精炼均衡与标准形非合作博弈中的其他纳什均衡相比,可能取得更大效率。在本文命题1的证明中所含的主要思想有个有趣的经济学解释,当代理人发现了对于其他代理人的偏离的混合策略的最优反应时,他们可能认为别人的行为会是“非理性”的,这种非理性可能表现为代理人为了获得成就感而努力工作,因为按马斯洛的需求层次理论,人有追求自我实现的最高需求。这可能表现为有的代理人把提高委托人的利益视为己任,具有高度的责任感,“以厂为家”把企业的利益当作自己的利益,虽然概率很小,但是有可能的,这对委托人有利。管理者的某些策略会增加员工们判断别人行为的不确定性。例如,禁止本公司员工与竞争对手的员工结盟或讨论工作,这样做除了可以防止本公司的员工跳槽和泄漏公司商业秘密外,还会增加员工们对对方行为判断的不确定性,减少合谋。而公司特有的不确定性只有本公司员工可观测到,这个普遍的现象也可以导致同样希望的结果。而要充分发挥这种效果,很重要的一点就是应该加强公司内部和外部的竞争。在公司内部,引入劳动市场竞争,如优秀的下属可代替表现不佳的上司,而偷懒的员工应被

解雇等,形成一种有激励的用人制度。在公司外部,进一步完善市场经济运行机制,促进市场的公平、有效竞争。充分发挥人才市场的优胜劣汰机制,在国企改革中,改变当前我国国有企业经理(厂长)由上级主管部门任命的组织制度,实行公开招聘、竞争上岗和择优录用,使企企业经理(厂长)由上级主管部门任命的组织制度,实行公开招聘、竞争上岗和择优录用,使企业家成为真正的企业家,而不再是所谓有行政级别的“官”,以形成一个对经营者的有效激励和制约机制。而对公司的一般员工,各公司应有自主的人事任免权。总之,提倡竞争可以激励代理人努力工作,减少道德风险。在证明过程中,我们可以看到在“好”的自然状态下,代理人工作不积极的一个很重要原因是:努力工作只能提高委托人的利润,而对他自己却没有什么好处,不会提高他的效用。相反,偷懒却可以增加他的额外收益,从而增加他的效用。可见,代理人的支薪制(即固定薪水)不能克服利益不相同、责任不对称的难题,而委托人与代理人共同分享剩余的分享制则是企业内部机制的最佳的制度安排。[4]因此,在国企改革中,让国企经营者参与分享企业成绩,如在企业业绩良好的情况下,给经营者高额奖金或让经营者持有企业的股份,使他的报酬随企业业绩同向变动。至于企业员工,也可以让他们内部持股,或在业绩好时,多给他们发奖金。在此,要让奖金成为名符其实的“奖金”,改变过去吃大锅饭现象,改变职工干多干少一个样的状况,真正实现“多劳多得,少劳少得”的按劳取酬制度。另外,除了激励机制外,加强对代理人的监督也是解决道德风险问题的一个重要途径。如果委托人能提高发现代理人欺骗的概率,那么代理人也会自觉减少采取对于委托人不利的行动,即会自觉努力工作。

 

【参考文献】

[1]YingyiQian.IncentivesandcontrolinSocialistecomomic,Cambridge:HarvardVni.1990.

[2]张维迎.博弈论与信息经济学[].上海:上海三联书店,上海人民出版社,1995.

[3]高鸿桢.管理运筹学[].南昌:江西人民出版社,1994.

[4]翁君奕.支薪制与分享制:现代企业组织形式的比较[].经济社会体制比较 1996,(5).

 
 
版权所有:华中师范大学信息管理系
通讯地址:湖北省武汉市珞喻路152号 邮政编码:430079
Email:Guixuewe@ccnu.edu.cn