博弈与社会
上QQ阅读APP看书,第一时间看更新

第4章 导论:个体理性与社会最优(4)

2.2工具理性假设

这里,我们要重点要讨论假设1,即工具理性假设。理性人是一个什么概念呢?简单来说,首先,我们说理性人要有一个明确的(well-defined)偏好。然后在给定约束条件下,该人总是追求自我偏好满足的最大化。这就是我们对理性人最简单的定义,有时候我们叫做最大化问题。简言之,就是假设人在每一项活动中都追求自身偏好满足的最大化。需要说明的是,“偏好”在经济学里面是一个内涵非常广泛的概念,甚至任何行为我们都可以解释为在追求自己偏好的最大化。比如自杀行为。一个人觉得活着不如死了好,所以他就会自杀。同样地,一个人总是帮助别人这样的利他主义行为也可以解释为个人在追求自身偏好的最大化行为,只不过他的偏好是那种“幸福着别人的幸福,痛苦着别人的痛苦”的较为高尚的偏好。所以说,理性人并不意味着这个人是自私自利的,只关心自己,不关心别人。从这个角度来说,理性人假设是一个由很窄到很宽泛(thin to thick)的假设。正因为太宽泛了,什么都是可以解释的,但这样一来,就会缺乏预测能力,这是理性假设面临的一个大问题。

前面提到偏好是给定的。但是,一个重要的问题是偏好是如何形成的。一些偏好可能跟人小时候的习惯有关。比如北方人喜欢吃面食,南方人喜欢吃米饭。还有一些偏好,可能一开始并不是偏好,只是约束条件,但经过一段时间后,逐渐由约束转变成偏好。一些社会规范可以内在化为个人偏好,这一点对理解人的行为非常重要。比如社会提倡不吃野生保护动物。一开始你不去吃可能并不是因为你不喜欢吃,而是因为觉得吃了有些内疚。但随着时间的推移,你就可能真的不喜欢做这类事情了。人的一些宗教行为可以从这个角度解释。所以偏好的形成是一个很复杂的过程。

前面还提到偏好是“明确的”。所谓“明确的”是指偏好具有如下两个基本特性:一是完备性假设,也就是说行为主体对任何两个选择之间的喜爱程度是可以进行比较的。比如,给定两个水果,苹果和梨,你知道自己更喜欢哪一个。二是传递性假设:如果你认为A比B好,你也认为B比C好,那么,你肯定认为A比C好。这就是偏好的传递性,实际上是要求一个人的偏好要前后一致。需要说明的是,关于偏好的这些假设都是针对个体的偏好;对于集体来说,上述假设往往不满足。比如传递性假设,在一个社会中,如果在A与B之间选择,多数人可能同意A;如果在B与C之间选择,多数人可能选择B;但是在A与C之间选择的时候,多数人可能同意C。

如果一个人的偏好满足了我们上面提到的假设,我们就说该人具有明确的偏好,从而可以认为该人为理性人。为了使用数学工具研究理性人的行为,经济学家又对理性人的偏好添加了一些假设。其中最重要的一个假设是偏好的连续性,它假定物品消费给你带来的满足程度不会有跳跃,或者说不会有大喜大悲。如果一个人的偏好满足了这一假设后,我们就可以用函数来刻画一个人的选择和他的满足程度之间的关系。这一函数被称为效用函数。

我们知道有一些偏好是不满足连续性假设的。比如,有一种偏好被经济学家叫做“词典序偏好”(lexicographic preference)。词典序偏好是说一个人对于不同事物的偏好排序就像英文词典中的单词排序一样,总是把一种事物排在另一种事物前面。比如某个人有两个商品组合可供选择,这两个商品组合都是由酒和面包组成的。如果该人对酒和面包有词典序偏好,也就是说,只要两个商品组合中有一个组合里面的酒多,哪怕只多一点点,他也要酒多的那个商品组合;只有两个组合中酒一样多时,他才会选择面包多的那一个组合。他按照自己偏好对商品组合的排序就像英文词典中对单词的排序,字母A开头的单词一定是排在B开头的单词的前边。英文是全排序的,中文没有办法全部排序,所以“词典序偏好”中的“词典”是指英文词典。对于这类词典序偏好,因为它不满足连续性假设,我们就没有办法用效用函数来刻画它。

对于存在效用函数的偏好,我们可以定义一个无差异曲线(indifference curve)来表示它。所谓无差异是指不同的“商品组合”给消费者所带来的满足程度是一样的。无差异曲线则代表所有这些商品组合的集合。X表示梨,Y表示桃子,则图中平面上的每一点都表示不同数量的梨和桃子的商品组合。而连接A、B两点的曲线就是一条无差异曲线,在这条线上每一点所带来的效用水平都是相等的。比如,A点表示3个梨和5个桃子的组合,B点表示8个梨和2个桃子的组合,它们在同一条线上表示它们给这个消费者所带来的效用水平相等。我们这里用商品作为选择对象是为了方便叙述,事实上,无差异曲线可以应用于任何连续性的选择对象,如一个人选择配偶时既考虑对方的长相又考虑对方的品德,我们可以画出他在长相和品德空间的无差异曲线。位置更高的无差异曲线则代表更高的效用水平。

研究人的行为除了需要知道他的偏好外,还需要知道他面临的约束条件。一般来说,除了我们前面提到的财富约束外,还有其他约束条件:首先是技术性约束。比如我们每天的工作或学习时间不可以超过24小时,我们的消费需要有健康的身体等。其次是制度上的约束。比如产权制度规定你所消费的商品不可以偷抢,只能花钱购买。最后,信息的约束也是一种非常重要的约束。比如当我们面对不同的商品组合时,由于不知道质量等信息,就会难以选择。

个人的最优选择是由偏好和约束条件共同决定的。现实中人们的选择不一样,既可能是因为偏好不一样所致,也可能是因为约束条件不一样造成。在我看来,现实中人们偏好之间的差异小于人们面临的约束条件的差异,人们之间不同的选择往往是约束条件不同所致。比如,有人买大房子、开豪华车,有人买小房子、开经济车,主要原因不是他们的偏好不同,而是由于收入不同。当然,也可能是偏好不同,比如有的人更在乎保护环境,喜欢勤俭节约。有好多人只买环保的混合动力汽车,不是收入问题,而是理念(偏好)问题。

法律和社会规范等游戏规则对个人的选择影响,既可以通过约束条件发挥作用,也可以通过偏好发挥作用,视情况而定。比如说,一个人遵守法律只是由于害怕违法后受到法律的惩罚,法律对他就只是个约束条件。但如果一个人养成了守法的习惯,干了违法的事会感到内疚、痛苦,我们可以说守法是他的偏好。Basu(1998,2000)区分了三种不同的社会规范:约束理性的规范(rationality-limiting norm)、改变偏好的规范(preference-changing norm)和均衡选择规范(equilibrium-selection norm)。这个分类也可以套用于法律:约束理性的法律、改变偏好的法律、均衡选择的法律。我们将会在第十三章讨论到这个问题。

如果一个人的偏好可以用一个效用函数表达,再进一步明确了约束条件,个人的最优选择就变成在满足约束条件的情况下最大化自己偏好的问题,我们就可以运用数学上的最优化方法来计算一个人的最优行为了。优化方面的基本知识可以在微积分中学到,复杂一些的需要涉及动态控制等方面的知识。最优选择是边际效用等于边际成本之处决定的。在经济学上,如果自变量代表商品数量,因变量代表效用水平,边际效用是指消费的商品数量增加一点的话,效用水平所增加的量;边际成本则是指消费的商品的数量增加所带来的成本增加量(表现为由于其他消费品的减少而牺牲的效用)。经济学中的边际概念就是数学上的微分概念。根据微积分的知识,我们知道最优的商品消费数量一定使得边际效用和边际成本相等。

上面讲的都是确定环境下的个人选择。其实我们大量的选择都是在不确定的环境下进行的,即选择与结果之间并没有一一的对应关系。比如说你投资股票,其实你并不知道未来的收益是多少。对于不确定环境下人们的选择,经济学家常用的分析工具是预期效用理论(expected utility theory)。预期效用理论的开创者是冯·诺依曼和摩根斯坦因(von Neumann and Morgenstern,1944)。有关预期效用理论的基本介绍可以参阅任何一本中级微观经济学教科书。预期效用是指某一选择在不同事件下得到的效用水平的加权,权数是事件出现的概率。我们这里用一个例子来说明。比如,你准备出门,但一会儿有可能下雨,假定可能性为50%,现在需要决定带不带伞。如果带伞,若下雨,你得到的效用是u1,若不下雨,你得到的效用是u2;如果不带伞,若下雨,你得到的效用是u3,若不下雨,你得到的效用是u4。预期效用理论是指在这种情况下,你决定带不带伞取决于两种选择下的预期效用的比较。带伞的预期效用为0.5×u1+0.5×u2,不带伞的预期效用为0.5×u3+0.5×u4。如果0.5×u1+0.5×u2大于0.5×u3+0.5×u4,则应该带伞,否则应选择不带伞。

不确定情况下的选择涉及人们对待风险的态度。我们知道,对于给定的不确定性,有的人喜欢冒险,愿意接受不确定性的挑战;有的人则保守一些,不愿意承担风险;有的人则介于二者之间。比如,现在有两种选择:一是你没有任何风险得到确定的100元钱;二是你根据抛硬币的结果来得到收入,如果正面朝上,你得到200元钱,如果反面朝上,你得到的是0。抛硬币的收入是一种不确定的收入,其预期收入也为100元。喜欢冒险的人会选择抛硬币,在经济学中称他们为风险爱好者(risk lover);保守一些的人则会选择没有风险的100元,被称为是风险回避者(risk averser);如果某一个人对这两个选择是无所谓的话,我们说这个人是风险中性的(risk neutral)。需要指出的是,尽管预期效用理论仍然是经济学和博弈论分析不确定情况下决策的标准理论,但大量实验证明,这一理论并不总能给出准确的预测。从20世纪70年代开始,心理学家Kahneman、Tversky等人发展出了前景理论(Prospect Theory)挑战传统的预期效用理论(Kahneman and Tversky,1979),Daniel Kahneman曾获得2002年诺贝尔经济学奖(Tversky不幸于1996年去世)。关于这一理论的经典文献,见Kahneman and Tversky(2000)编辑的文集Choices,Values and Frames。

2.3有限理性

以上是经济学中对理性的界定和描述,被称为完全理性假设。我们可以看到,完全理性是一个非常理想化的假设,它对人的认知能力和决策能力有很高的要求。但在现实中,人的行为并不是完全理性的。因此,人们很自然地对理性人假设提出批评。这些批评可以归结为三个方面。对理性人假设的以下三点批评是Jolls,Sunstein,Thaler(1998)概括的。

第一个是有限理性。诺贝尔经济学奖得主西蒙(Herbert Simon)创造了一个有限理性(bounded rationality)的概念来描述人的行为。他认为,人的大脑加工能力、记忆能力均有限,所以人不可能是完全理性的,只能是有限理性。所以,我们可以观察到人们经常模仿别人的所作所为,以致出现盲从和迷信等现象。

第二个是有限毅力(bounded willpower)。完全理性意味着人们能在眼前利益与长远利益之间进行精确的计算,但现实中人们做一些事情经常是由于毅力不够,抵挡不住眼前诱惑所致。比如说很多人戒烟不成功,减肥不成功,原因就在于缺乏足够的毅力。吸毒者也知道吸毒对自己身体不好,但是就是经不住短期的诱惑。再比如,对于一个完全理性的人,花钱消费时刷信用卡付费和现金支付应该完全一样的,但实际上不一样,刷卡往往会让人们更倾向于接受较高的价格以及多消费。麻省理工大学的Drazen Prelec和Duncan Simester(2001)两位教授做过一项拍卖实验,出价最高的人可以获得一张球赛门票。他们将参加实验的学生完全随机地分为两组,要求其中一组参与者必须用现金付款,另外一组参与者必须用信用卡付款。实验结果表明,用信用卡付款的那组人的平均出价是用现金付款的那组人的两倍!