连环“委托—代理”博弈模型

高鸿桢,徐明生

【原文出处】厦门大学学报(哲学社会科学版)

【原刊期号】2000年第2期(总第142期)

【原刊页号】94～98页　　　　　　

【作者简介】高鸿桢,徐明生：厦门大学计划统计系,福建厦门361005

【中文摘要】在委托—代理关系中,代理人经常凭借信息优势采取对委托人不利的行动。而在连环“委托—代理”模型中,委托人的收益不仅取决于他自己的代理人的行动,而且还取决于其他代理人的行动。连环“委托—代理”博弈模型表明:“颤抖手精炼均衡”有可能阻止委托人不希望的均衡结果的出现。

【关键词】连环委托—代理;博弈模型;颤抖手精炼均衡中

【正文】

引言

一个“连环委托—代理问题”是指有两个或两个以上的“委托人—代理人”对,每个委托人的收益可以用他自己的代理人的行动和所有其他代理人的行动的函数表示,同时,他们的收益还取决于一个共同随机变量———这就是所谓的“连环”的含义。这个共同的随机变量对于所有代理人来说是事前知道的,而对于委托人来说却是不可观察的。更进一步,我们假设委托人之间相互不知对方的收益,因此,我们讨论的框架与一个委托人对多个代理人的情形不同。连环委托—代理问题常存在于相互竞争的团体之间的博弈中。[1]例如,几个经营相同险种的保险公司,各个公司的利润不仅取决自己公司的员工的努力水平,还取决于其他公司员工的努力水平(当其他公司业务员工作都很卖力,而自己公司的业务员却偷懒时,该公司利润相对就低;反之,公司的利润相对就高)。

本文所选用模型是一个有两个委托人和两个代理人的博弈模型。其中,委托人无法观察到任何一个代理人选择的努力水平,不过他们各自能知道自己的收益,同时,委托人的收益是由两个代理人的努力水平和一个只能由代理人观察到的外生变量共同决定的。我们用从这些经济模型产生的博弈的“颤抖手精炼均衡”[2-3]来说明如何减少委托人不希望的均衡结果的出现。当然,这就要满足激励机制的两种约束:第一是满足个人理性约束,即代理人按激励机制行事的效用不低于他不按激励机制行事的效用,这也是代理人的参与约束。第二是满足激励相容约束:若α1是委托人希望代理人采取的行动,而α2是代理人可采取的另外一个行动,但委托人不可能直接观测到代理人到底采取何种行动,则只有在代理人采取α1的效用大于采取α2的效用时,代理人才会自觉采取α1。即任何委托人希望的行动α都只能通过代理人的效用最大化行为实现。

在连环委托—代理问题中,由于只有代理人能观测到实际的外生变量,因此,代理人就可能凭借信息优势选择不利于委托人而使自己效用较大的行动。这样,在外生变量本来是对委托人有利情况下(或者说在“好”的自然状态下),若代理人们能有效合谋,他们就可能都不努力工作,而使委托人的收益等同于“坏”的自然状态,而他们却可以不受惩罚,增加自己的效用。本文就是讨论在一定的条件下,如何避免这种情况的发生。

模型及其分析

设各委托人的收益仅取决于“自然状态”和代理人的行动选择。也就是说,如果委托人是企业所有者,我们就将诸如原料价格、生产函数、市场需求和国家产业政策等经济变量概括到“自然状态”之中。一般说,我们可以考虑有ｎ种自然状态的情况。记自然状态集Ｓ={ｓ1,ｓ2,...,ｓｎ},其中ｓｉ(ｉ=1,...,ｎ)是一种自然状态,ｓｎ对于所有委托人来说是最有利的自然状态,ｓｎ-1次之,依此类推,ｓ1是对委托人最为不利的自然状态。虽然委托人知道这个信息,但实际上究竟哪个ｓｉ发生则只有代理人能够观测到。本文只考虑ｎ=2的情况,即ｓ1是“坏”自然状态,ｓ2是“好”自然状态。

在了解ｓ后,每个代理人ｊ从有限集合Ｅ={ｅ1,ｅ2,...,ｅｍ}中选择自己的努力水平ｅｊ,同样委托人不知道代理人的实际选择。不过每个委托人ｊ可以观察到各自的收益πｊ,其中πｊ取决于他的代理人ｊ的努力水平ｅｊ、自然状态ｓ和其他委托人的代理人的努力水平ｅ-ｊ。这些收益函数是各委托人和代理人的“共同知识”。我们说这是个“连环委托—代理问题”,是由于某个委托人的收益(或利润)不仅取决于他自己的代理人的行为和自然状态,还取决于所有其他代理人的行为。

对于每一个代理人来说,他可以努力工作,也可以不努力工作。当他努力工作时可以得到委托人给他的报酬ｗｊ;当他不努力工作时可能有额外的收益,例如可以从事第二职业而得到另一份收入或得到闲暇的乐趣等,我们将这部分效用记为ｌｊ,设各代理人的效用仅由ｗｊ和ｌｊ决定,且是可加的,即

Ｖｊ=Ｕｊ(ｗｊ)+ｌｊ

其中,Ｖ是代理人ｊ的总效用,Ｕ(ｗ)是由报酬ｗ产生的效用。另外,一个代理人的保留效用以下列约束条件概括:

Ｖｊ(ｗｊ,ｌｊ)≥ Ｖｊ=Ｕｊ( ｗｊ)

其中,Ｖｊ是代理人ｊ的总效用,Ｕｊ(ｗｊ)是由报酬ｗｊ产生的效用。另外,一个代理人的保留效用以下列约束条件概括:

Ｖｊ(ｗｊ,ｌｊ)≥ｊ=Ｕｊ(ｊ)

为了使代理人接受雇佣合同,委托人应保证,即使在最坏的自然状态下,若代理人努力工作,代理人至少能得到的报酬为ｗｊ(我们简单定义Ｖｊ= Ｕｊ= Ｕｊ( ｗｊ)+0)。若事后发现代理人不努力工作,则根据合同,委托人给他施加一定的惩罚(如扣薪水,甚至扣代理人交的保证金,直至开除),从而使代理人的效用Ｕ=-Ｍ(Ｍ>0,Ｍ越大表示对代理人的惩罚越重)。

为了说明颤抖手精炼均衡的价值,我们考虑一个具有两个“委托人—代理人”对和两种自然状态的对称支付模型。设代理人1的策略有:α1(积极工作)和α2(偷懒);代理人2的策略同样有β1(积极工作)和β2(偷懒)。相应于两个代理人的策略,在自然状态ｓ1和ｓ2下,每个委托人的收益如下:

　　状态ｓ1(坏)　　　　　　　　　　　　状态ｓ2(好)　

　　β1　　　β2　　　　 β1　　　　β2　

α1(ｃ1,ｃ2)　(ｄ1,ａ2) α1(ｄ1,ｄ2)　(ｅ1,ｂ2)　

α2(ａ1,ｄ2)　(ｂ1,ｂ2) α2(ｂ1,ｅ2)　(ｃ1,ｃ2)

其中,0<ａｊ<ｂｊ<ｃｊ<ｄｊ<ｅｊ,ｊ=1,2。这意味着当自然状态“坏”时,每个代理人都必须采用积极”的策略才可能使自己的委托人得到中等以上的收益(即不小于ｃｊ);而当自然状态“好”时,两代理人都选“偷懒”也可使各自的委托人得到ｃｊ的收益。现在设代理人ｊ(ｊ=1,2)在他的委托人的利润不小于ｃｊ单位时,都得到Ｕｊ;否则所得为-Ｍ。假设代理人ｊ选择“积极”策略时,就没有额外收益,而选择“偷懒”时,可有ｌｉ>0单位的额外收益。因此,代理人的收益,可用如下标准形的二人非零和博弈给出:

状态ｓ1(坏)　　　

α1　　β1　( Ｕ1, Ｕ2)　　　　β2　( Ｕ1-Ｍ)

α2　 (-Ｍ, Ｕ2)　　 (-Ｍ,-Ｍ)　

　状态ｓ2(好)

α1　　β1　( Ｕ1, Ｕ2)　　　　β2　( Ｕ1,-Ｍ)

α2　 (-Ｍ, Ｕ2)　　 ( Ｕ1+ｌ1, Ｕ2+ｌ2)

　　这样,在好的环境ｓ2中,代理人之间的博弈有2个纳什均衡:(α1,β1)对应收益对( Ｕ1, Ｕ2)和(α2,β2)对应收益对( Ｕ1,+ｌ1, Ｕ2+ｌ2);而在坏的状态ｓ1中,代理人间的博弈只有一个非合作均衡(α1,β1)对应收益对( Ｕ1, Ｕ2)。观察上述博弈,我们发现在状态ｓ2中,(α1,β1)更加有效率(使每个委托人的收益都较大),然而两个代理人却更喜欢均衡(α2,β2),因为这个均衡使他们的效用从( Ｕ1, Ｕ2)升至( Ｕ1,+ｌ1, Ｕ2+ｌ2)。但是,如果这两个纳什均衡中只有(α1,β1)是颤抖手精炼均衡,代理人就可能不再偏爱均衡(α2,β2)。“颤抖手精炼均衡”概念是泽尔腾提出的对纳什均衡的一个改进。颤抖手精炼均衡的基本思想是:在任何一个博弈中,每个局中人都有一定的犯错误的可能性(类似一个人用手抓东西时,手一颤抖,他就抓不住他想抓的东西)。一个策略对是一个颤抖手精炼均衡时,它必须具有如下性质:各局中人ｉ要采用的策略,不仅在其他局中人不犯错误时是最优的,而且在其他局中人偶尔犯错误(概率很小,但大于0)时还是最优的。可以看出,颤抖手精炼均衡是一种较稳定的均衡。因为上述模型中代理人间博弈是典型的二人非零和博弈,本文重新定义二人非零和博弈的颤抖手精炼均衡。

定义:设在二人非零和博弈中,纳什均衡(Ｘ ,Ｙ )是颤抖手精炼均衡,如果对于局中人1、2,分别存在一个严格的混合策略序列{Ｘ(ｉ)}和{Ｙ(ｉ)},ｉ=1,2,...,使得:　

　(1)ｌｉｍ_ｉ→+∞Ｘ^(ｉ)=Ｘ ,ｌｉｍ_ｉ→+∞Ｙ^(ｉ)=Ｙ　

　(2)对于每一个ｉ,Ｘ是对Ｙ(ｉ)的最优反应,即　

　Ｅ_Ａ(Ｘ ,Ｙ^(ｉ))≥Ｅ_Ａ(Ｘ,Ｙ^(ｉ)), Ｘ∈∑₁;·

三、启示

在一个关于“连环委托—代理问题”的简单模型中,选择颤抖手精炼均衡与标准形非合作博弈中的其他纳什均衡相比,可能取得更大效率。在本文命题1的证明中所含的主要思想有个有趣的经济学解释,当代理人发现了对于其他代理人的偏离的混合策略的最优反应时,他们可能认为别人的行为会是“非理性”的,这种非理性可能表现为代理人为了获得成就感而努力工作,因为按马斯洛的需求层次理论,人有追求自我实现的最高需求。这可能表现为有的代理人把提高委托人的利益视为己任,具有高度的责任感,“以厂为家”把企业的利益当作自己的利益,虽然概率很小,但是有可能的,这对委托人有利。管理者的某些策略会增加员工们判断别人行为的不确定性。例如,禁止本公司员工与竞争对手的员工结盟或讨论工作,这样做除了可以防止本公司的员工跳槽和泄漏公司商业秘密外,还会增加员工们对对方行为判断的不确定性,减少合谋。而公司特有的不确定性只有本公司员工可观测到,这个普遍的现象也可以导致同样希望的结果。而要充分发挥这种效果,很重要的一点就是应该加强公司内部和外部的竞争。在公司内部,引入劳动市场竞争,如优秀的下属可代替表现不佳的上司,而偷懒的员工应被

解雇等,形成一种有激励的用人制度。在公司外部,进一步完善市场经济运行机制,促进市场的公平、有效竞争。充分发挥人才市场的优胜劣汰机制,在国企改革中,改变当前我国国有企业经理(厂长)由上级主管部门任命的组织制度,实行公开招聘、竞争上岗和择优录用,使企企业经理(厂长)由上级主管部门任命的组织制度,实行公开招聘、竞争上岗和择优录用,使企业家成为真正的企业家,而不再是所谓有行政级别的“官”,以形成一个对经营者的有效激励和制约机制。而对公司的一般员工,各公司应有自主的人事任免权。总之,提倡竞争可以激励代理人努力工作,减少道德风险。在证明过程中,我们可以看到在“好”的自然状态下,代理人工作不积极的一个很重要原因是:努力工作只能提高委托人的利润,而对他自己却没有什么好处,不会提高他的效用。相反,偷懒却可以增加他的额外收益,从而增加他的效用。可见,代理人的支薪制(即固定薪水)不能克服利益不相同、责任不对称的难题,而委托人与代理人共同分享剩余的分享制则是企业内部机制的最佳的制度安排。[4]因此,在国企改革中,让国企经营者参与分享企业成绩,如在企业业绩良好的情况下,给经营者高额奖金或让经营者持有企业的股份,使他的报酬随企业业绩同向变动。至于企业员工,也可以让他们内部持股,或在业绩好时,多给他们发奖金。在此,要让奖金成为名符其实的“奖金”,改变过去吃大锅饭现象,改变职工干多干少一个样的状况,真正实现“多劳多得,少劳少得”的按劳取酬制度。另外,除了激励机制外,加强对代理人的监督也是解决道德风险问题的一个重要途径。如果委托人能提高发现代理人欺骗的概率,那么代理人也会自觉减少采取对于委托人不利的行动,即会自觉努力工作。

【参考文献】

[1]ＹｉｎｇｙｉＱｉａｎ.ＩｎｃｅｎｔｉｖｅｓａｎｄｃｏｎｔｒｏｌｉｎＳｏｃｉａｌｉｓｔｅｃｏｍｏｍｉｃ,Ｃａｍｂｒｉｄｇｅ:ＨａｒｖａｒｄＶｎｉ.1990.

[2]张维迎.博弈论与信息经济学[Ｍ].上海:上海三联书店,上海人民出版社,1995.

[3]高鸿桢.管理运筹学[Ｍ].南昌:江西人民出版社,1994.

[4]翁君奕.支薪制与分享制:现代企业组织形式的比较[Ｊ].经济社会体制比较 1996,(5).