欢迎访问爱发表,线上期刊服务咨询

博弈理论论文8篇

时间:2023-04-23 15:13:59

绪论:在寻找写作灵感吗?爱发表网为您精选了8篇博弈理论论文,愿这些内容能够启迪您的思维,激发您的创作热情,欢迎您的阅读与分享!

博弈理论论文

篇1

分析的兴起与70年代,起始于1978年出版的G.A.科亨的《卡尔•马克思的历史理论:一个辩护》一书。在80年代形成一种学术思潮,影响至今。严格的说,“分析的”不是一个学派或者流派,因为它没有通常能够成为学派的基本的立论特征,比如,相互认可的基本特征,原理,主要观点等,它是一个开放的系统,松散的互相讨论、学者之间的观点并不是互相认同,那为什么称之为一个学派呢?原因有两个,以使他们的研究方法都有英美分析哲学的底子,采取的用分析的方法重新研究的经典原著,分析哲学20世纪起源于英国,1905年罗素《论指标》,其产生是自然科学升入发展,数理逻辑影响空前的催化下形成的一种哲学思潮,强调分析方法的重要性,分解分析法,就是把整体分解为各个部分或组成要素,形式分析法,分析科学预言,命题,推理形式结构,意义分析法,分析词语,命题的意义,特别是分析元逻辑,元科学语言的意义。与的结合,有利于理论的精确化,清晰,严密。其二他们声称以为研究对象,追求的是重构一种既是科学的又是革命的理论,科学的意义是指,符合20世纪的哲学标准,机构严谨,话语明确,革命的意义是说,一种有关解放的理论。分析的者基本上可以分为两类,一些注重理论的诠释和概念化,拒绝或批判各种形式的方法论主义和个人主义的微观基础,一些强调以理性选择为方法论原则探讨理论的微观基础,既反对整体主义也对基础注意持某种否定态度,而且从实践和理论角度来看,分析的决不是一套和信心年集中在一起的紧凑实体,不存在一种分析的理论,也不存在一种分析的研究方式,分析的马克思只是将不同的观点和研究路径结合到了一起。分析的其研究对象可分为三部分,一部分是方法论问题,二是经验理论部门,主要是历史唯物主义和资本主义的经济分析,三是规范理论部分,主要是对异化,剥削等伦理问题的分析。

分析的的最早代表人物是柯亨,埃尔斯特,罗默等。分析的者各自取得了一定的成就,柯亨在历史唯物主义解释中取得了影响,罗默是最具创造性和独创性的人物,他的关于资本主义和积极剥削的博弈理影响很大,埃尔斯特的研究成果总体上对马克思的否定多于重构,他对方法论的研究影响颇大,赖特将它的阶级理论与在几个国家进行的经验调研结合起来,提供了一种对实际现存于资本主义中的阶级和剥削模式的剖析,他还发起并参与了名为“真正的乌托邦”的对社会主义建设前景的研究,范帕里斯将环境主义与相结合,他的基本收入理论影响广泛,布伦纳对不同的前资本主义欧洲经济中阶级结构的变动提供了一种历史的说明,重新开展了关于从封建主义相资本主义过渡的特征的争论,鲍尔斯以有关不完善的劳动契约的思想,考察了工厂中阶级斗争的必然性。巴洛汉研究了第三世界的半封建关系和新生的资本主义,他还与罗默一起研究了有关市场社会主义设计的问题。做出了自己的贡献。最近的,金里卡也对分析的做出了自己的经典评价。通过一个体系在考察分析的有关剥削和异化理论,对强制性的转移剩余价值就是剥削这一个观点的坚持,事实上,这是一种对自我所有权的自由至上主义的关注,金里卡对正义、平等这些伦理与哲学概念也作出了重新解构与诠释,用自己特有的方法给出了自己的答案,可以说对政治哲学发生了重要影响。在这里尤其是有关对剥削和异化的分析,对这些规范理论的伦理性分析,确实需要我们认真地把握。

二、对剥削理论地分析

1、经典克思主义者的观点

马克思的剥削理论是以劳动价值论为基础进行展开的。马克思从商品一因素到生产商品劳动的二重性。再到只有劳动力创造价值和剩余价值,建立了科学的劳动价值论。而马克思的剥削理论又是基于其劳动价值理论之上的,即剥削也就是对被剥削者在剩余劳动时间里所创造的剩余价值的一种剥夺。剥削特指资本家从工人的劳动中榨取的价值(以产品的形式),超过了对工人劳动力的报酬(以工资的形式)。资本家就是工人的剥削者,资本家只是在能够榨取公认的“剩余价值”的前提下才会雇用工人,因此,这种通过剥削把剩余价值从工人转向资本家的做法存在于所有的劳资关系中,劳资关系本质上是一种剥削关系。马克思对剥削的概念采取了这种技术性的定义。并且者都把对剩余价值的榨取当作不正以的证据,事实上,当作不正义的范例。的剥削观是否还有道德意义,例如,是否涉及着对他人的不公平利用,技术意义上的剥削是一种不正义,对此的传统论正是这样的。

a只有劳动才创造价值

b资本家获得了产品的一部分价值

c劳动者所获得的价值少于他所创造的价值

d资本家获得了劳动者所创造的价值的一部分

e劳动者被资本家剥削

马克思通过劳动价值论对剥削下的技术性定义,并且左证了这是一种不正义的范例。随着时代的变化,也遭来了广泛的质疑。

2、当代分析对剥削理论的质疑与重构

当代分析对剥削理论的质疑与重构主要来自两个方面。

首先,是对劳动价值论的质疑,按照劳动价值论,产品的价值由生产该产品所需的劳动量来决定,但如柯亨所指出的那样,劳动价值论事实上正好与a相反,因为,按照劳动价值论的说法,产品的价值由当下所需的生产这种产品的劳动量所决定,而不由再生中实际投入的劳动量所决定,如果技术革新使得当下生产某种产品只需要过去一般的劳动量,劳动价值论就说,对于已经在过去生产出来的产品而言,即使投入其中的劳动量没有什么变化,该产品的价值也只有以前的一半,如果劳动价值论是正确的话,工人实际投入的劳动就不是价值的决定因素。重要的不是工人创造了价值,而是他们创造了具有价值的东西,使得剥削的指控得以成立的,不是资本家占有了工人生产的一部分价值,而是占有了工人生产的东西所具有的价值的一部分,创造具有价值的产品不同于创造那些产品的价值,而前者才真正构成了对剥削的指控,就算不是工人创造了产品的价值。因此,恰当的论证是这样的:

aa只有劳动这才是创造产品的人,而产品才具有价值

bb资本家获得了产品的一部分价值

cc劳动者所获得的价值要少于他所创造的产品具有的价值

dd资本家获得了劳动者所创造的产品的价值的一部分

ee劳动者被资本家所剥削

当然这种论证还是不能解决关于正义的问题,因为存在着主动将自己的劳动力贡献出来的问题,后来将这种剥削关系加上了强迫这一限制性条件,工人为资本家工作必须是强迫的结果,对剩余价值的强迫转移是一种剥削。但是这种限定也出现了问题,他把严格意义上讲并非出自强迫的劳资关系排除到了剥削范围之外,同时剩余价值的强迫转移在很多情况下也可能是正当的。最重要的是,按照这种强迫的观点,保护儿童和妇女的强制性征税也是一种剥削。剥削理论产生了不可逾越的问题。这引起了第二次的修正。是不是剥削取决于对剩余价值的具体处理是否符合更大的分配正义的模式,存在着使剥削成为不正义的更深的不正义,对生产资料的不平等占有。

第二、对剩余价值强迫转移的修正,正如罗默后来对剥削的定义,不是基于剩余价值的转移,而是基于对生产资料的不平等拥有,按照他的观点,某人是否遭到了剥削,取决于在一种假像的分配平等条件下他的境遇是否会更好,那种假像的条件意味着,某人可以带走自己的劳动力和人均拥有的外部资源而推出现行的分配条件,如果我们把不同的经济群体当作由现行财产关系确定规则的游戏的参与者。那么,某个群体一旦满足了下述条件就被视为遭到了剥削,如果该群体的成员带着人均拥有的外部资源推出了这个游戏并开始自己的游戏之后其处境反而更好,按照罗默的看法,如果退出资本主义的游戏,在岗工人和下岗工人的处境都会变得更好。因此遭到了剥削。剥削是资本主义制度下分配不正义的最常见的结果,在这里就直接解决了强迫与正义的问题,这样的解释允许我们处理劳资关系之外的分配不正义,这些都源于对资源的不公平占有。但是问题也是显而易见的。

3、金里卡的质疑与意见

首先罗默扩大了剥削的范围,并使之覆盖所有形式的分配不平等,我们需要基础性的原则去证明人们对自身和外部资源拥有的权利和资格,只有从在先的和更宽泛的关于不平等分配的原则,才能推导出剥削的观点,金指出剥削不过是分配不正以的诸多形式中的一种;金对罗默混淆了平等与剥削也提出了批评,如果不平等需要某种更深入的平等原则加以裁决,这就是要使拥有资源的途径化的伦理命令,剥削在平等理论中就不再占有道德关注的中心地位;关于私有财产的不平等占有,金里卡认为并不一定导致剥削,如果能够在罗尔斯“持有财产的民主”得那样制度中产生,如果人们能够意识到选择的后果,如果人们的不同偏好是在正义的条件下形成的,事实上也是这样的,相反,对生产资料的社会化也许会引起剥削,使资源平等也许不会产生剥削,而使资源社会化也许会产生剥削,这取决于人们的偏好和境遇;最重要的是,金里卡通过一种整体的有关对正义地分析,表达了与罗尔斯等自由主义的平等主义的正义观相一致的部分,而不是仅仅简单的一种摆设。

三、对异化理论的分析

1、经典克思主义者的观点

马克思对资本主义的批判不仅仅是对剥削的关注,而且诉求这对异化的完善论式的关注,这种完善论的观点不仅强调,私有财产的问题在于存在剥削,而且因为剥削的受益者遭到了异化而无法发展他们作为人的本质能力。马克思对异化理论的分析主要包括四个方面,第一,劳动产品的异化,即劳动生产出来劳动产品成为奴役和统治劳动者的异己力量。“劳动者生产的财富越多,他的产品的力量和数量越大,他就越贫穷。”(《1844年经济学哲学手稿》第44页)在资本主义社会劳动表现为劳动者的非现实化,对象化表现为对象的丧失和为对象所奴役,占有表现为异化、外化。于是劳动者在劳动中的力量越多,他亲手创造的与自身相对立的异己的对象世界的力量便越强大,他本身、他的内部世界便越贫乏,归他所有的东西便越少。第二,劳动活动的异化,即劳动者的劳动成为一种被迫的强制劳动“‘对劳动者来说,劳动是外在的东西,也就是说是不属于他的本质的东西,因此,劳动者在劳动中不是肯定自己,而是否定自己,并不感到幸福,而是感到不幸并不是自由地发挥自己的肉体力量和精神力量,而是使自己的肉体受到损伤,精神受到摧残。”(《1844.年经济学哲学手稿》第45页)第三,人的本质的异化,即把作为人的本质的自由自觉改造世界的活动“变成与人异类的本质,变成他的个人生存的手段”(《1844年经济学哲学手稿》第51页)。人是类存在物,这不仅是说人无论在实践上还是在理论上都把类作为自己的对象,而且是说人把自己也当作活生生的类,当作普遍的因而也是自由的存在物对待这种自由的存在物同自然也是和谐统一的。异化劳动从人那里把自然异化出去。第四,人与人的异化,即劳动产品为他人所占有。马克思指出,外在于人并奴役人的劳动和劳动产品所归属的那个异己存在物只能是人本身。通过异化劳动,“人不仅生产出自己同作为异己的、与之相对的力量的生产对象和生产行为的关系.而目_也生产出其它人同他的生广“和他的产品的关系,以及他本身同这些其它人的关系”(《1844年经济学哲学手稿》第51页)。

2、当代分析对剥削理论的质疑与重构

虽然马克思的异化理论为禁止私有财产提供了很好的辩护。但是劳动的异化与否却并非唯一的价值准绳。如果我愿意通过异化劳动而获得闲暇。同时有些人对消费价值的关注,使得他们宁愿去获得异化劳动,而非异化劳动也不是天赐馅饼,需要动用资源去获得。同时非异化劳动也是对友谊是一种威胁,这种对生产的关注,却是忽视了友谊和消费的价值。它并不是一种至高无上的利益。同时,自由合作的生产,才能使我们成为认这个观点并不能成立,人们会赋予劳动的不同的价值,只要提供一种机会平等的条件和财产的公平划分,异化劳动可以提高人们的生活福祉,完善论并不完全是正确的。

另外一些分析者则作了另外一种角度的修正,他们并没有就如何分配资源给与完善论的启示,他们预见说,人们将会珍视非异化劳动到这样一种程度,以至于他们绝不同意用闲暇时间或家庭生活的增加来对异化进行弥补。

3、金里卡的质疑与意见

对于这种预见,金里卡认为,通过禁止非异化劳动而干涉人们的选择是没有道理的,对有意思的工作进行分配也是没有道理的,因为每个人的偏好并不一样,不应该不恰当的把某些个人的偏好放到特殊的地位,而是对个体带入市场交换的资源进行修正性分配。个体在拥有平等资源份额的情况下,自由的决定什么是愿意从事的有价值的事情,这会引起一系列关于公平分配的问题,者必须要尝试着给出自己独特的答案。

篇2

关键词 博弈理论 图书馆员的特征 图书馆员排班 完全信息动态博弈

分类号 G251.6

Use Game Theory to Solve Library Staff Scheduling Problem

He Haizhao, Xu Ying

Abstract This paper designs the variable-sum game model according to the characteristic of librarian. In this model librarians are simply classified into two types, one need work time, another need impartiality. Based on the game theory, it will form four kinds of game’s income. The overall revenue and two sides benefit will be the largest in the complete information dynamic game when both requirements are satisfied.

Keywords Game theory. Characteristic of librarian. Librarian scheduling. Complete information dynamic game.

图书馆员在图书馆开放时轮流上班,会因馆员上班时间段不同有较大差异。这种差异的公平合理性是影响图书馆员们工作行为与工作绩效的重要因素,因为节假日与晚上是所有图书馆员的非意愿上班时段。据调查,现代图书馆的工作环境与内容已具备良好的吸引力,但许多有才华能力、热爱阅读、乐于奉献与交流的人不愿意成为图书馆员,并不仅仅因为图书馆工作枯燥单调、为他人做嫁衣等,工作时间也是重要原因之一。实际工作中,馆员的排班时间表由该组织的领导做决定,组织领导对组织内成员存在亲疏关系,会直接影响组织员工的工作行为与工作绩效[1]。本文试应用博弈理论解决馆员的排班问题,消除组织领导对组织成员亲疏关系在排班中产生的影响,从而保持团队凝聚力。

1 研究背景

通过文献调查,发现其他需排班的行业如机场、医院、火车站等对排班问题已有大量的研究成果,唯有图书馆行业对馆员的排班问题鲜见研究成果,仅有魏红翠的《基于排队论方法的图书馆人员排班问题的优化模型》一文研究了图书馆员排班问题[2]。该文将图书馆员的排班问题用排队理论进行阐述研究,分为读者需求第一及图书馆员时间意愿需求第一两种排队模型,发现图书馆员的排班问题处于两难境地。追求读者需求第一而又考虑馆员的需求,一直为管理者的理想值,因为馆员的工作状态决定服务质量。图书馆员时间意愿需求第一模型是非读者至上型,这种模式与图书馆发展规律相违背,演化的结果是读者疏离图书馆,这与笔者工作中观察到的现象相符。本文试图在排班过程中根据馆员客观存在竞争的事实,用博弈理论科学地阐释馆员的排班问题,以促使馆员从竞争动机演化成合作动机,主动适应图书馆职业要求特性,使所有馆员的个人时间与工作时间达到平衡、个人时间与他人时间达到平衡,不因组织领导个人因素而影响服务质量。

博弈论又常称为对策论,是研究具有斗争或竞争性质现象的数理方法。个人、队组或组织,在确定的环境条件与规则下,可从各自允许选择的行为或策略中选择最佳方案并加以实施,最终取得相应收益的过程。博弈问题分为以下几种情况,详见图1。

根据博弈中各博弈方得益之和,常将博弈问题分为三类:零和博弈、常和博弈和变和博弈。变和博弈的结果是博弈方总体效益大小的区别,即博弈方之间可以通过相互配合获得更大的各博弈方总体利益[3]。本文建立的博弈模型即变和博弈,整体收益值还能体现是否有利于工作。

图1 博弈问题分类图(按博弈过程分类)

2 基于博弈理论的排班问题

调查数据显示,高校图书馆中女性馆员约占69.7%,公共图书馆约为64.1%[4]。女性馆员有自己的心理特征,如心思细腻、小气、容易嫉妒、爱攀比等。工作一方面给予她们金钱收益,另一方面给予她们心理收益,即工作的满意度[5]。排班问题中一般不考虑金钱收益问题。为了简化博弈论模型,各博弈方的收益以女性馆员的工作满意度来衡量。公平度与满意度成正相关关系,自身感觉越公平,满意度就越高[6]。由于图书馆的开放服务特性,存在馆员上班时间段不一样,同一岗位不同时间段工作量不一样的客观现实,馆员认为自身在工作中受到不公平待遇,多源自上班时间段的安排。为了消除上述情况带来的负面作用,图书馆界一直采取倡导职业精神,建立图书馆文化,营造和谐的人际环境等方法加以解决[7]。笔者试利用博弈理论,通过制定规则,消除人为竞争因素,让馆员由同质竞争走向合作,客观上实现集体利益与个人利益的双赢。

本文建立的博弈模型中,认为馆员们是完全理性人,他们以个体利益最大化为目标,且有准确判断选择能力,也不会“犯错误”。实际工作中,图书馆员们的年龄、家庭环境、学历、职业追求、个人能力、性格、身体状况等方面的客观差异,使她们对上班时间的需求不一样。根据广西科技大学图书馆与杭州电子科技大学图书馆中多年的排班工作经验,排班时馆员可以分成两种类型区别对待。一种馆员对上班时间有刚性需求,如孩子年龄小,孩子面临升学,爱人工作时间不固定,家里老人身体不好需要照顾等情况引发的客观性需求;一种馆员为公平性刚性需求,她们在意工作安排的公平性,如在非意愿时间段内大家上班时间长短是否一致,晚上上班次数是否一致等。这两种类型的需求之间存在着博弈。

博弈模型中,我们将上班时间点刚性需求类型,取名为time类,简称为T类;公平性刚性需求类型,取名为just类,简称J类。公平性刚性需求是一个模糊自身感受值,会随着信息不对称性的高低而增强或者减弱。博弈双方对排班时间表的满意度为各方的收益值。排班时有两种博弈过程,一种是T类与J类同时做出自己的决策,这是静态信息博弈;一种是T类与J类不同时做出自己的上班时间段安排,后者能看到前者的上班时间安排,从而调整自己的策略,这是动态信息博弈。排班时,双方进行沟通,如告知对方自己某些时间点需照顾家里而不能来上班,我将非常感激你对我的照顾;或者向对方提议这次排班你照顾我,下次我将照顾你;或者向对方示好并为之付出感情或物质等等,此种为完全信息博弈。排班时无信息交流与沟通,双方互相不知对方的行为与决策,为非完全信息博弈。

(1)完全信息静态博弈:各博弈方同时决策,并且所有博弈方对各方得益都了解的博弈。博弈双方的收益如表1所示。

表1 完全信息静态博弈

该模型在排班决策时双方互相交流沟通,清楚对方的收益值。由于时间具有客观上的唯一排他性,当博弈双方同时做出决策,不可能满足双方需求,但此时双方没有损失,所以收益值都为零;当只满足馆员中一方的要求而未同时满足另一方的要求时会激化排班矛盾,降低双方的收益。如要求被满足方,一方面因为满足要求而有收益值,另一方面由于这种模型方式中,双方有过信息交流与沟通,互相清楚收益,所以结果将影响同事之间的工作合作,从而降低满足方的博弈收益值,假设为6。未能满足要求的博弈方,也因为双方排班策略收益清楚,这种结果将激化排班矛盾,所以未能满足要求方的收益值设为-2。当双方需求都不被满足时,女人的心理特质将使双方对排班不满升级,这种决策结果都会减低博弈双方的收益值,假设为-4。

(2)不完全信息静态博弈:博弈双方同时进行排班策略选择决策,但双方互相不清楚对方收益。因为时间具有客观方面的唯一排它性,当博弈双方同时做出决策时,不可能同时满足双方需求,但此时双方没有损失,所以收益值都为零。当只满足一方的意愿要求时,因为是同时做出策略,互相不清楚收益,所以没有激化排班矛盾,这样被满足要求的博弈方的收益值没有被降低,假设为7。当博弈的另一方,也即要求未被满足方,因为是同时做出博弈决策,未激化排班矛盾,所以未被满足要求方收益为0。当博弈双方要求都不被满足时,这种方式没有激化排班矛盾,这时双方收益值为不满足情况下的最高收益,设为-2。博弈双方的收益如表2所示。

表2 不完全信息静态博弈

(3)不完全信息动态博弈:参与者对其他参与人的战略空间和战略组合下的策略与收益没有完全了解,但行动有先后顺序,后动者可以观察到前者的行动,了解前者行动的所有信息。

表3 不完全信息动态博弈

双方先后进行排班策略选择,但双方的意愿需求互相隐瞒,相互间不完全了解对方的具体收益值。博弈双方中后动的一方虽能了解先动者做出的决策,但因为双方策略未做沟通与调整,先动的一方设定满足自己策略后,后动的一方不满足对方的要求但满足自己的要求,这样不可能实现同时能够满足双方需求,所以收益值都为零。因为是先后做出的策略选择,双方需求没有充分沟通,这种单独满足个人要求的自私行为将激化同事之间的矛盾,从而降低双方的收益值,满足方假设为6,不满足方设为-4。当双方需求都不被满足时会激化排班矛盾,这种决策行为减低了博弈双方的收益值,假设为-4。

(4)完全信息动态博弈:博弈模型中的各方先后做出决策,所有博弈方决策时都互相了解各方的收益。

表4 完全信息动态博弈[8]

这种方式下,后选择策略的馆员能根据对方的策略进行调整。博弈双方有信息交流沟通,双方收益互相透明,所有人都发挥主观能动性,决策前积极商量调整需求,从而让双方都满足需求。当所有方意愿都被满足后,双方会因为这种决策过程增进双方的团结合作度而获得较高的心理收益,这样提高了收益值,假设为8。因为先后做出的策略选择,双方需求又有沟通,这种单独满足个人要求的自私行为将激化同事之间的矛盾,从而降低双方的收益值。博弈方中被满足方的收益假设为6,不满足方设为-4。当双方需求都不被满足时,这种决策过程将急剧地增加排班矛盾,从而减低了博弈双方的收益值,假设为-4。

博弈理论的核心是通过博弈收益改变博弈方的动机。综上所述,管理者制定排班博弈规则后,消除信息不对称性,使两方进行博弈决策,客观地将她们的竞争动机演化成合作动机,从而达到个体与总体收益值中的最优。

3 博弈理论在排班中的实际应用

以广西科技大学图书馆阅览部为例。排班人员组成:共17个人,其中只有1名男性;平均年龄全馆最大,年龄分布段为25岁到53岁;学历层次为全馆最低,60%为大专及以下学历,40%为本科学历;其中有13名馆员是带有安置工作性质的博士后或教授家属。工作内容与情况:保证19个不需刷卡可带包进入的阅览室每周开放80个小时以上;一年内除法定节假日外需天天开放的新报刊阅览室;阅览室内书刊类型复杂且管理方式各异,馆员的日常工作主要为新刊记到、旧刊装订上架,阅览室清洁,复印并收费,图书上架与整架,读者咨询等工作。排班工作难点:(1)图书馆开放时间需要4名馆员同时值班,4个岗位的工作量大小差别很大;(2)阅览部的馆员工作为轮休制,很难见面,客观上沟通交流困难;(3)阅览部的馆员大部分为家属,工作中小矛盾容易被外部环境放大;(4)图书馆无物业管理公司,需要图书馆员带领勤工助学学生负责阅览室的清洁工作,而各阅览室人流量不一样;(5)阅览室管理工作时间段忙闲不均,忙碌的时间段大约是开学后三周、期中考试时两周、期未放假前二周。综上原因,每到新学期预计排班时,部门内乱成了一团,小道消息满天飞。馆员们找部主任要求照顾、找馆领导哭诉;内部分成五六个小团体,部门内人员不团结。

应用博弈理论排班时,部主任先制定排班规则,以利达到完全信息动态博弈中双方需求都得到满足的最佳情况。如规定某些特殊时间段大家协调不了时采取抓阄的方式做决定;将男同志与部主任这种明显合作意愿强的人分离出来,不让他们成为博弈方。第一次博弈排班时,因为信息的不对称性,大家对各岗位工作量的差异性不清楚或者故意隐藏个人私有信息以便混水摸鱼,都不公开自己的时间需求。在信息不明确的情况下,博弈模型成为不完全信息静态博弈,其中所有人需求都没被满足,收益都很低。第二次博弈排班时,馆员们就分成了两拨,一拨是刚性需求T方,将自身的客观事实理由完全公开,要求获得同事照顾,一拨是无时间要求。博弈过程中先满足T方的馆员,其博弈结果是完全信息动态博弈模型中,时间T方满足而J方不被满足的收益。因为J方碍于情面,不能明确地向同事表露她们的公平要求。第三次博弈排班时,所有馆员都主动要求参予排班,主动消除信息不对称性,时间刚性需求的T方与事实中存在的J方进行博弈,大家互相合作,很快达到了双方需求都被满足的情况。这样的排班方式实行两年后,阅览部馆员由矛盾的不和谐群体变成工作中积极主动的团结群体。究其根源,博弈排班方法科学地促成馆员们由竞争动机演化成为合作动机,发挥了馆员们主观能动性。另外在此过程中还促进了馆员们的沟通协作,提高了个人沟通协作与科学安排时间的能力。博弈式的排班过程中,男馆员的加入更容易满足完全信息动态博弈情况下的T与J方需求。因为,男馆员们的合作动机更强,他们很乐意与女馆员们合作。不过在某些特殊情况下,如所有馆员都为时间刚需方,则要采取重复博弈以达到平衡,每次博弈时只满足一方的需求,下一次博弈满足另外一方的需求,这样总体收益、各方收益也将同处于一个较高的水平。

篇3

Abstract: The incentive problems have been the focus of the company. Company incentive problems can fully mobilize the enthusiasm of the staff, and improve the effectiveness of the company. This paper analyzed company incentive problems, based on perspective of game theory, from three aspects of the owners and operators, managers and employees, and the employees, with the use of the Prisoner's Dilemma model, Kreps-Wilson reputation model and Pig Game model, and made reasonable countermeasures accordingly. Meanwhile, it provided the reference for studying the problem for other researchers.

关键词: 博弈论;激励;探析

Key words: game theory;incentive;exploration

中图分类号:F272 文献标识码:A 文章编号:1006-4311(2012)31-0140-02

0 引言

本文基于博弈论的视角,围绕所有者与经营者,经理与员工,员工与员工三个层面分析其博弈关系,从而抓住公司激励问题的本质,据此提出合理化对策建议。这种研究视角能为公司管理者和学者提供参考。

1 所有者与经营者的博弈

1.1 囚徒困境模型分析 假设所有者和经营者都有两种选择:“合作”,“不合作”;只要一方提高合作的程度,对企业的总绩效提高都是有利的,如表1所示。所有者选择“合作”,即所有者认可经营者,相信经营者会尽全力工作为公司创造最大价值;经营者选择“合作”,即经营者会把公司当作自己的公司,尽全力为公司创造价值。所有者和经营者选择“不合作”,即双方都按契约办事,所有者对经营者没有额外的激励,经营者的努力水平也不会超过所有者的激励水平。当双方都选择“不合作”,公司会失去契约之外的发展机会,双方也失去各自发展受益,双方只获得3个单位的收益,不能达到双方都选择“合作”的5个单位收益,这是纳什均衡,双方博弈进入“囚徒困境”。

如果要改善这种状态,那么所有者与经营者必须提高合作水平。由于博弈双方会按照“社会习俗”选择策略,习俗会迫使博弈双方选择与习俗相适应的策略。所有者对经营者的激励不单纯是一个“最优激励契约”的问题,在不完全契约之外,所有者对经营者的激励离不开社会习俗的影响,创造使所有者与经营者愿意合作的社会习俗或能提高双方利益的机制是走出囚徒困境的有效手段。

1.2 基于克瑞普斯—威尔森声誉模型的激励对策 克瑞普斯—威尔森声誉模型表明,只要消费者经常地重复购买垄断厂商的产品或服务,就会导致厂商树立一种高质量的声誉以吸引消费者,即利用重复博弈原理,进入艾克斯罗德实验,达到走出囚徒困境的目的。

从克瑞普斯—威尔森声誉模型可以看出,职业经理人为了获得长期收益,应该树立良好的声誉。然而,职业经理人本质上是不合作的,他总想在一定的条件下使自身利益最大化。但如果博弈重复的次数足够多,这时职业经理人侵占企业所有者的剩余就可能受到企业所有者的干预,从而未来收益的损失就超过短期侵占剩余的所得。所以,职业经理人通过使所有者收益最大化,提高企业效率,建立一个良好的声誉,就是职业经理人在特定条件约束下的最佳选择。因此,理论上可以说,在一定时期内,职业经理人的绩效应该是好的。只有在博弈结束时,如退休、调动、免职或对企业失去信心时,职业经理人就会考虑到短期收益很大而未来收益很小,就会把自己过去树立起来的良好声誉用尽,大量侵占所有者的剩余。但是,不到博弈的最后关头,职业经理人轻易不会做这种选择。

所以,建立职业经理人声誉管理机制,发挥声誉对职业经理人的激励约束作用,是十分必要的。一是应该尽快制定一套合理的薪酬激励机制,提高长期薪酬的占比。具体操作可以从降低固定报酬比例、加大浮动报酬的比例开始。在企业的分配制度中,年薪制实际上已成为固定报酬,应该增加与企业绩效相关的浮动报酬在报酬中所占的比例,加大长期激励,比如采用以期权、股权等长期报酬激励为内容的激励手段。二是企业应该建立合理的业绩考核评价体系。对职业经理人的业绩进行考核,可以每年根据独立评估机构对经理人的评估结果,决定下年度是晋升还是降级,业绩好则晋升或者增加报酬,业绩差则降级甚至解聘。三是建立职业经理人声誉评价体系,推动经理人市场的建立。政府、企业和劳动力市场应该设立独立评估的中间机构,对职业经理人进行有效的评估,并且定期公布评估结果,给企业提供参考,建立一套完善的职业经理人声誉体系,并逐步建立经理人市场机制。

2 经理与员工的博弈

经理与员工的激励博弈,也是从囚徒困境到重复博弈,与上文所有者、经营者之间的激励博弈分析相似,在此不做赘述。针对重复博弈下需要达到的均衡结果,提出的建议有:一是善意地对待员工。企业善待员工,员工就会感受到精神上的鼓舞,进而有利于企业内部的和谐,有利于企业团队精神和凝聚力的形成。二是制定长期的企业激励制度。长期的激励制度能让员工有持续努力工作的动力。三是正负激励相结合。这符合针锋相对策略中“对合作欢迎,对背叛不姑息”的做法,采取适当负激励措施,如淘汰激励、降职、罚款和开除激励等。四是准确、及时、到位的回应。对于创了业绩的员工,企业一定要给予准确、及时、到位的奖励,这一方面激励获奖员工继续努力,另一方面也带动其他员工积极表现争取以后得奖。对于犯错误的员工,企业也要在第一时间对其做出合理的惩罚,以儆效尤。

3 员工与员工的博弈

3.1 智猪博弈模型分析 员工与员工之间,同样也存在着博弈关系。基于员工彼此之间职位高低,职业技能,人际关系等因素的不同,这种博弈关系往往是一种非均衡的博弈关系。如不同职位的员工之间,就存在着不平等的博弈——部门经理可以独吞其管辖员工的成绩得到升迁,而原本成绩斐然的底层员工却被埋没;同等职位的员工之间也有可能存在不均衡关系——人际关系好的员工往往可以得到领导的庇护及赏识;即使是同一团队中的员工也存在着由于工作能力不同而出现的“搭便车”式的不均衡博弈关系。由此可知,大多数员工之间存在的是“智猪博弈”式的博弈关系。大猪与小猪式的博弈关系,由于员工之间的强势与弱势地位而形成。这种强势与弱势的不平衡,往往造成员工中的弱势方倒向“小猪”式的等待作为最佳策略。从而导致,大猪疲于奔命,小猪坐享其成,企业的资源不但无法优化配置,而且大量浪费。最终,大猪小猪都疲惫饥饿。企业效益也随之减少。

3.2 员工与员工激励对策 一是薪酬激励要具有公平性、竞争性和公开性。公平性是指依据业绩状况,只要是做出贡献的员工就应该激励,而不能偏袒和照顾某些人,任其“搭便车”。竞争性是指企业的薪酬标准应该是有吸引力的,在企业外部和内部都形成竞争的压力,刺激员工积极向上。公开性是指薪酬的发放应该是公开和透明的,按照职位等级、技能等级、工龄等级和绩效水平公开各种等级的薪资范围,使员工能够把报酬与绩效联系起来。二是建立合理的业绩考核标准和监督机制。业绩考核是奖惩的依据,考核必须要合理、公正,否则就会造成员工间的不平衡。健全和客观的监督机制更是合理业绩考核的保障。三是实施因人而异的激励措施。企业的激励制度应该能够满足员工的需求,企业应根据每个人的特点,有针对性的实施激励。

4 结语

激励问题是公司的一个焦点问题,解决该问题是一个复杂的过程,需要在实践中不断改进。虽然博弈论是一种科学的分析方法,但是运用博弈分析方法探析公司激励问题是不够的。因为激励机制涉及到人复杂过程,需要考虑员工需求、心理等多方面因素。因此尽可能多角度,多种方法研究公司激励问题,才能为激励制度科学化提供正确的理论依据,有效解决公司激励问题,提高公司人力资源管理水平。

参考文献:

[1][美]加里·德斯勒.人力资源管理[M].北京:中国人民大学出版社,1996.

[2]洪怡恬.博弈分析在人力资源管理中的应用[J].宁波广播电视大学学报,2005(3).

篇4

博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。

2.博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述

G={P,A,S,I,U}

P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。

A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。

S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。

I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。

U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。

还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。

篇5

互联技术的发展,使社会舆论环境发生了深刻的变化,当前对网络舆情的研究逐渐得到相关学者的关注和重视w具体来说,国内主要研究集中在以下三个方面:1)网络舆情发展的一般性理论:主要研究网络舆情的概念、功能、传播途径、形态特征等理论问题121.2)网络舆情监测、预警和控制.如曾润喜提出了网络舆情预警的系统构成、指标体系和运行机制M.黄晓斌提出了网络舆情信息挖掘分析模型’并以实例说明文本挖掘在网络舆情分析中的应用[4].齐佳音利用系统动力学建模,分析了突发事件发展和网络舆情的作用机制臥史波提出了网络舆情群体极化的动力机制与调控策略吒余廉借鉴传染病模型SIR分析了非常规事件下的群体行为171?3)网络舆情对不同领域的影响?中国上市公司舆情中心分析了负面舆情与上市公司市值的波动.周如俊认为,新时期思想政治教育工作要研究网络舆情的特点,形成上思想政治教育的强势国外在网络舆情方面的研究.也有许多成果.如Wu等的研究表明.舆论的形成与社会网络的结构有关丨91.在舆论演化方面,最经典的模型有两个:一个是“Sznajd模型”,另一个是“有限信任模型”."Sznajd模型”借用铁磁体中的磁性粒子等概念为理论基础,利用蒙特卡罗等仿真方法对封闭社区的舆论演进过程进行了研究,提出舆论最终的演化结果只有两种:全部赞同、全部反对和赞同与反对各占一半P叱模型比较简单,不足之处在于磁性粒子的性质过于简单,个体的观点与交互方式与实际差别较大.“有限信任模型”提出当两个人观点相近时,才会相互影响,当两人观点差距太大时,不会相互影响I1、模型的优点是采用了信用阈值来限制个体间的交互,比较真实的反映了现实中的交互过程.国内外在网络舆情控制方面,传统研究思路都是将非线性不规则的网络传播系统化约为线性系统,以获得确定的结果'12'.相关的技术主要包括监测、预警、应急处理等,涉及诸如话题检测与跟踪、Web信息挖掘…丨、文本倾向性分析丨15]、基于云计算的网络舆情预警[161、迁移元胞自动机网络演化模型[17]和网络事件的案例库建设和案例分析等.通常使用的控制手段主要有接种疫苗和隔离接种疫苗的具体方法包括对非法网络传播进行事后追惩,加强站的自我审查,网络实名制等来约束自我的行为.隔离的具体方法是在网络中安插把关人,加强对网络传播内容的日常监控,对敏感话题进行屏蔽或删除,也有一些部门采用雇佣网络水军,对信息进行大面积覆盖等.隔离、屏蔽等管理技术在实践中得到了较广泛的应用,但是这些管理方式有剥夺公民表达自由之嫌,“只知打压甚至封堵,无疑会使‘通,没有了‘通,,只剩下一条无法跨越的‘沟’"[20].当前应用博弈论研究网络舆情的学者较多,一般集中在研究传播机制方面的问题.王杨等人提出了基于博弈论的真情传播模型(POBGT)l21],模型能够从动态和交互两方面描述传播过程,最终能够形成稳定的状态.刘锦德等认为,网络舆情传播过程是以大部分人对事实不了解为前提的.指出羊群行为的集聚产生受多种因素影响,主要与采取分析策略的交互利益、成本系数以及记忆长度有关[221.以上这些研究成果深刻地分析了网络舆情的基本理论和监测、预测以及一些相关的调控策略,但是,多数研究都把民视为一个整体,并且大多从网络事件_、网络结构、传播规律等角度进行研究,很少从线下形成网络舆情的民个体入手,深入研究民如何在网络上聚集形成网络舆情的机制,更没有把根源事件的发展和舆情的演化联系起来,仅着眼网络结构等传播过程中的各种影响,强调舆情应对中的各种技巧,以至于忽略了舆情发展的根本动力.大都就舆情研究舆情,而未深入到社会政治生活具体目标设定、政府行政目的、行政方式和民众行为逻辑的深度,因而也在一定程度影响了应对对策的恰当性和有效性1231,从而无法提出切实有效的网络舆情疏导策略,反而使网络舆情愈演愈烈.现实中网络舆情是一个群集演进过程.而集群演进过程是一个很难进行实证研究的问题[271.本文将民作为个体,以群集动力学为基础,基于博弈论来深入分析网络舆情的聚集过程,结合舆情产生的根源事件发展变化,最终给出网络舆情疏导模型.

2网络舆情群集动力学过程分析

2.1网络舆情民特征分析

复杂性理论将人群看做由许多相互作用的个体组成的“复杂的社会经济系统”,并借用物理学、数学以及计算机科学中的概念性工具对社会现象进行分析[24],民作为独立的智能体在网络环境中,与其它民共享信息.民能够感知它所处的环境和其它民,感知和其它民行为的挤压、碰撞、推动、吸引、排斥等相互作用.根据复杂性理论,对网络舆情中每个民自身的运动能力可以从外部感知、内部状态和行为产生系统等3个基本方面描述.定义1外部感知每个民具有发现事件及感应外部环境刺激的能力,同时环境中的其它民会对民的感知能力产生影响.夕卜部感知可以用以下公式表示:S=So+5feel(1)其中S表示舆情环境中民对某事件的感受,So表示民个体对事件的感受,5fee,表示舆情环境中其它民对该民感受的影响,n表示民数量,j=nSfeei=(2)3=1定义2内部状态根据马斯洛的需求层次理论,人的需求产生动机,动机导致人的行动,即:Need^Motivation^Action,同样在网络舆情形成与发展过程中,每个民的表达都源于内部动机,动机来自民的需求,需求源自民的感受.用iV表示民的需求,G(S)表示为S的分段增函数,马斯洛将需求分为五个层次,设况=(1,2,3,4,5),不同的需求层次表现为不同的内部状态,即凡可以分为五个层次:凡=G(S)(3)内部状态可以表现为忍耐程度P,时间用t来表示.P=P(Nt)/t(4)其中巧况)为凡的减函数.此外,用M表示民动机,H(Nt)表示Nt的增函数.M=H{Nl)/t(5)当实际发生的事件发展速度达不到期望速度时,随着时间的增长,个体的忍耐度会下降,动机也会下降.当忍耐度下降较快时,民呈现“好斗”趋势,产生灌水、谩骂行为;当动机下降较快时,民表现为放弃行为.定义3行为产生系统网络舆情中个体是自驱动的,在自身行为规则的作用下,可以对周围实体和环境的刺激做出本能的反应,产生自驱动力和期望速度,根据每一时间步上每一个体的外部感知和内部状态,行为产生系统为个体产生一个行为,且对内部状态进行修正.用F⑴表示民受力状态:F(t)=a[(M-P)dt+/i[(Mfeei)df(6)JoJo其中表示某时刻民感受到的外力.亡表示时间,a和/X为常数.当F(t)>0时,民为活动状态;当F(t)<0时,民为沉默状态.为分析方便,假设"=0、1、一1,分别表示外力与自驱动力无关、同向和反向的关系.可以看出,即使当内部动机为0时,也可能受外部影响而持续活动.此外,用民在受力变化下会更新运动状态:V{t+1)=V{t)+uAF(t)(7)其中乂⑷表示tB寸刻民的运动速度,AF⑴表示民的受力变化情况,uj为一常数,表示民加速度系数.公式7刻画了民的行为更新机制.

2.2网络舆情群集特征分析

网络上民聚集成群会产生群集现象.群体流动动力来自于民的合力,整个群体对外界环境呈反沉默螺旋特征:1)群体中存在异向群集,也存在异质群集.群体中的个体运动力(包括力的大小和方向矢量)熵最小时,群体合力最大,反之合力最小.2)民个体需求得到满足,个体动力消失>最终导致群体动力消失,同时,群体有可能提高或者降低个体的需求.3)网络舆情群集方向取决所有民合力.

2.3网络舆情群集动力学模型构建与分析

从混沌学的观点看,在舆情爆发前民众心态是个混沌系统,处于相对稳定状态.当突发事件使民众对自己的生存与发展状况感到深度优虑和不安全,相对稳定的混沌态心理被打破,事件就成为舆情的初始触发条件在网络中,以舆情话题涉及民个体的聚集和互动为环境背景,以民参与舆情的可察网络空间为边界,结合定义1、定义2、定义3,经过分析,得出以下结论.命题1当民所处外界环境与民需求期望有偏差时,即A_A#0,网络中进行诉求的民个体,以追求成为某种话题的舆论领导者位置为手段(虽然未必获得领导者位置),期望获得舆情的直接或者间接最大利益,达到个体需求得到满足的目的.如图1所示,个体需求所处等级越低,内在动力就越大,F1>F2>F3>F4>F5且容忍度越低,P1<P2<P3<Pi<P5.F表示内在动力、P表示两民容忍度,朽至F5,P1至P5分别对应需求从低到高5个层次的内在动力和容忍度.命题2民个体动力大小、方向可变.民个体动力受自身可见范围内所有其它个体合力的影响,即:F合=+外;ff=-l或丑=1或i7=0(8)为方便分析,假设个体动力方向只有同向H=1、反向H=-1和无关H=0三种情况.相关研究发现,当获得新的信息或者受到社会压力的影响,群体成员评估信息的正确性主要是通过参照他人达成的,这就是社会群体中普遍存在的“从众效应”命题3民个体运动状态随时间变化不断更新.即公式(7)所示:V(t+1)=V(t)+u;AF(t),随着时间的变化,民个体的受力不同,因此对舆情事件的反应状态不同.命题4民个体在网络舆情中影响力不同.结合网络传播的特点,民的影响力不同,邻居节点多的民、处于领导者位置的民以及把关人位置的民影响力相对更大.个体选择往往依赖于群体中的“领导意见”1251.命题5民个体具有聚集特性.民个体是处于外界环境的力场之中,个体尽量与邻居个体靠得近一些,避免被孤立(如图2).个需求层次关系图图2S集特性民个体聚集的目的是为了获得群集力,抗外界力场.只有舆情中民个体观点被邻居感受到,才能聚集成为更大影响力的群体,甚至使民个体达到成为领导者的目标.民聚集过程如图3所示.从图3可以看出,当发起人个体强大到足以对抗外力,能够独立达到期望的情况下,不会发生群集行为,而个体无法对抗外力或者无法独立达到期望的情况下,个体会产生对群集现象的需求.聚集过程可以分为以下5种情况:其中6>0表示个体的安全承受力,a>0表示容忍度,a〈b.对于个体来说,G表示群体聚集并趋向极端化的现象,即群体期望将比个体期望更具有冒险性.D表示对聚集呈排斥状态,但不反对他人行为,—G表示聚集并趋向沉默螺旋,即外力过大时,群体期望甚至比个体期望更低时,表现为沉默螺旋.公式(9)中第一^式子表示事件超过个体容忍度,政策管理相对宽松时,将会发生聚集?公式(9)中第二个式子表示内力过大,即使政策高压管理,仍将会有聚集的需求.式子三表示事件超出个体容忍范围,但由于内在动力没有比外力高到一定程度,不但不会发生聚集,反而排斥聚集.第四个式子表示高压政策下,由于内在动力不足,即使事件超过了个体容忍度,也不会发生聚集.式子五表示事件在个体容忍范围内,不会发生聚集.命题6民个体之间具有排斥性.民为了避免与周围民个体同化,希望保持个14.舆情中观点力求个性和新意,否则无法达到自己为领导者的目标,从而无法获得最大的群集动力如图4.社会学研究发现,个体从众行为会产生群体极化,同时人们也有独立作出判断的意愿,以及过于自信的行为倾向[261.命题7民观点匹配,网络舆情中个体保持观点上的同步,当民观点的熵越小时,获取的群集合力才会越大,因此,个体获得群集力的过程中,要以使群集观点熵减为手段如图5.根据物理学的力与作用力原理,在复杂系统中,熵越小,群集力的互相抵消就会相对变小?命题8民群集也是个体,是由民个体形成的更有影响力的个体.因为发生群体极化时,可以把统一发声的民群体,看做是一个独立的个体,并且是比民个体更有影响力的个体.命题9民群集是有生命周期的,生命周期发展过程如图6.由于民在舆论环境中感受不同,敏感者(某事件处在需求层次较低层的个体)将在被动的情况下,率先提倡聚集,以期获得群集动力.而非敏感者(某事件处于需求层次较高层次的个体)看到一个话题,是否参与,取决于该话题的引力和阻力.由于个体视野问题,集群越大的话题,越容易被个体所发现?因此发展也越快.群集的发展和生命周期取决于该话题对民的引力和民外界力场的阻力.

3基于群集动力的舆情演化博弈分析

根据网络舆情的群集动力学过程的分析,可以对社会网络中的民个体作出如下假设.假设1在一个话题事件发生时(话题已经存在),群体中有随机的两个人A和B,有可能从话题中实现个人期望,话题对A有固定影响,对B可能有影响,每个人都对该事件有自己的观点A(0,1).假设2在信息不充分情况下,A和B会根据对方进行决策(信任时羊群效应,不信任时不跟随),其中A选择增加投入,以使话题对B引力大于斥力的概率为P,选择默认的概率为1-P.假设3如果对A采取投入策略,B采取的策略是参与,那么A获得固定收益(无论参与与否,话题通过外界环境变化带来的固定影响)以外,还会得到额外收益Re,即群集力(正负不一定).同时付出成本C,B的收益为Rb,如果B选择不跟随,A的收益为当A采取默认时,B采取参与的策略,A的收益是i?A,而B将损失RB-d,d表示参与话题对B的阻力减去动力之差产生的损失.假设4假设Re=x/d,C=d/y(效益、投入和阻力产生的损失之间的关系,cc、y为常数,d+0),由于阻力越大,^将越大,因此,这里也可以看成效益、投入与外在阻力的关系.构建博弈树如图7所示.在上述假设条件下,计算A的期望收益和平均收益,U~+Re—C)*g+(RA—C)*(1—^)=RA+RE*Q~C,由假设4上式可转化为:Ra-\-q(x/d)一d/y,U⑷狐二RAi?7(^4)平均=p(U(A)&x)+(1—p)(U(A)^)=Ra-\-p(qx/d—d/y).当投入效益和默认效益不相等时,得益差的会模仿效益好的策略,则投入策略与默认策略的人的比例是时间的函数,分别表示为P⑴和1-P⑷.投入策略的动态变化速度可以用如下复制动态方程表示:dp/dt=p(U(A)^-C/⑷平均)=p(l-p){qx/d—d/y).稳定性分析,令dp/di=0,当qxld=d/y时,d=时,为一稳定点,且d随g变化,0<g<1,范围是[-_,_],由假设3可知:d=(、-Fn)*6,6为力差与损失之间的系数,则由公式9可知:^fqxy/e>b或者(一VP^/0<~b(此处(_v^/0只表示F外一F内)或者0<v^/0<a,因此,柞-&>&和(F外-凡<-b以及0<-<a时,为稳定状态(可以求得q的阈值).所以,而且稳定点和民个体在舆情力场中受力情况、个体的容忍度和个体的安全承受能力有关.p=0,p=l两点是否为稳定点,取决于P在这两点附近时qx/d-d/y是否大于0.相位图分析如图8所示.A根据力的变化,使办/出=0的点中,斜率为负的点是稳定点.可以注意到,0、1两点位稳定点仅是其中的一种特殊情况,图8只画出了一种‘情况.结论1当A最为犹豫时{p=0.5),B是否参与对A的决策影响最大,力场中力的调整对A的影响最大.结论2由于g和d是变化的,不是B只要参与就可以影响A的决策,只有q在一定范围内才可以影响A,这个范围和民个体的安全承受力、忍耐度有关系.结论3A的决策与B的观点有一定关系,但不存在直接关系,而是和力场中的力有关系,存在B和A的观点对立,但增大了对A的助力情况(例如一些网络炒作等现象).同理,计算B的情况:U(B)^=RbP+(Rb-d)*(1—p)=Rb—d(l-p),U(B)称^=0,C/(S)平均二g(ii;s_d(l_;p)),则dg/di=q{U{B)m-U(B)^)=q(l-q)(RB-d{l-p)).稳定性分析,令dg/dt=0,当办_<1-p)=0B寸为一稳定点,d=Rb/(1—p),(此处RB也在随V变化)由假设3可知:d=-F内)*e,6为力差与损失之间的系数,则由公式9可知:Rb/{9{1-p)):^或者RB/、Q(l—V))<-b(此处RB/(e(l-p))只表示—F内)或者0<Rb/(0(1-p))<a时为稳定状态,可以求出(rb-ea)/ea<p<(rb-eb)/eb时,a的决策才会影响b的决策.g=o、g=i两点是否为稳定点,取决于q在这两点附近时Rb~d(l-p)是否大于0.对B的相位图与A类似,不再赘述.结论4当B最为犹豫时(p=0.5),A是否参与对B的决策影响最大,力场中力的调整对B影响最大.结论5A的话题参与情况在一定范围时,是可以对B的决策产生影响的,但脱离这个范围时,将没有影响,不是A参与比例越大,影响就越大,这个范围和民个体的安全承受力、忍耐度有关系.这和传统的羊群效应理论有差异.例如网络水军提出的主题,对非水军民来说,不一定引发羊群效应,反而可能脱离话题.结论6在一个话题中,当A选择增加投入策略人过多时.达到一定范围,B将达到稳定状态,只有从该话题中发掘新的相关话题,才能吸引B选择参与策略,这是蝴蝶效应的原因.

4仿真

由于A、B情况类似,仅对上述博弈中的A进行仿真,用Netlogo创建民个体在社会网络中的博弈环境,同时考虑民个体策略会受到外力的影响,观察在不同外力影响下演化过程中不同策略转化形成的轨迹.具体仿真如下:民Agent300个,初始策略为参与舆情比率p为0.35,初始策略为不参与舆情的比率1-p为0.65,Agent的个数和初始比率可以为其它值.为考虑:1)—F内)>b和(巧卜-F内)<-6以及0<(&-<a情况,设民所受外力取均值0,标准差0.06,仿真200步(都可为其它值):由图9可以看出,A在p=0.35时达到了稳定状态,所以0和1不一定是稳定点,主要看舆情场中力的平循况.2)(F^—F内)〉a>0情况下,即设力取均值0.3,标准差0.06,仿真200步:publicopiniondevl.ppublicopitdoi由图10可以看出,力在一定范围内时,A会采取投入策略,如果力场变化不大,甚至可以达到1,即群体极化的稳定状态.3)考虑-a<(4-<0情况下,即设力取均值-0.3,标准差0.06,仿真200步:由图11可以看出,在外力较大(与内在动力差值较小)的情况下,A会采取不投入策略,如果力场变化不大,甚至达到0的稳定点.4)其它不变,力均值取0.3,力口大标准差,标准差取0.9仿真200步:由图12可以看出,力场的变化标准差大的时候,A在达到稳定点之前会经历更多的策略选择波动.5)其余不变,均值取-0.3,标准差取0.9仿真200步:由图13,可以看出A对力场均值变化的影响,当合力呈负的范围时,A采取不投入策略,甚至达到0的稳定状态.

5网络舆情疏导分析

网络舆情中的民个体,经过碰撞、聚集,形成各种观点为核心的小团体,这些小团体再相互影响,决定网络舆情的总体群集力的大小和方向.如图14所示,在集群中各种力的熵小时力的绝对值大,熵大时,力的绝对值小.就像船上的人有不同的目的(乌合之众),但为了暂时的一致目标聚集在一起(甚至目的不同,比如小偷乘船目的只是为了偷钱),舆情主体事件成了船一样的载体.舆情的发展从熵值最大到最小形成诉求,经过问题解决,产生新的争议,又从熵值最小到最大,之后经过平衡处理,熵值又发展到最小,形成新的看法.根据视野,每个民个体只能受到网络视野内的力的影响.群体由于信息量大,视野也大.同时视野的大小对个体的决策有重要影响.一个事件解决之后,仍有有需求的民还会找其他的事件,来实现自己的舆情收益.从上面分析可以看出,疏导舆情可以从个体的动力,个体受到的阻力,个体观察到的其它人参与的概率来入手,其中力场的调整是舆情得以平息的关键.在建筑学中,对于封闭场所疏散时间和人流流量之间的关系,Togawa提出了如下数学模型1271,将其引入舆情疏导问题中,改变其中各变量的涵义,P为事件群集合力,n为地方各级管理部门,Qi表示各级管理部门积累的群集动力,Q中央管理部门对群集力的处理平均速度,T0为事件开始到需要中央管理部门插手的时间.为验证疏导模型有效性,对管理部门实施疏导和管理部门不参与疏导两种情况下,对上述博弈A的动态策略选择进行仿真.考虑现实意义,令RA=3,Re=1,C=1(可以为其它值)仿真1000步如图15.可以看出,在没有管理部门以动态惩罚手段参与.群集外力没有变化的情况下,仅凭舆情利益双方博弈,策略选择出现无限振荡,且振幅越来越大,无法达到均衡稳定.如果管理部门根据舆情相关民的参与概率,凭借法律对相关者进行动态惩罚,即惩罚力度随参与概率的大小而变化.仿真中假设C=2+p*2(可为其它形式),图16中可以看到,随着博弈次数和时间的增加.舆情参与民采取参与的概率将逐渐收敛,稳定在纳什均衡点.如图17,降低管理部门的动态惩罚力度.假设C=2+p*1.5,随着博弈的深入,依然能够趋向稳定点,但明显疏导效率低于图16情况.结论7从仿真中可以看出,网络舆情要疏导的是人群产生的群集动力,而不是单一解决某一事件,即使单一事件被解决.民还会寻找类似事件来实现其需求,即民在舆情博弈中表现出无限震荡现象.结论8高效的疏导是实现民博弈均衡的重要条件.无效率的地方各级管理部门将会导致集群流向中央管理部门,造成上访事件,无法或者达不到期望速度的将会增大不耐烦程度.导致发生.结论9上述疏导模型是舆情发生时的应急疏导方式,在舆情尚未形成时,保证民所感受力场在一定范围内的平衡.增大民的忍受度,降低安全承受能力.是预防网络舆情爆发的有效途径.

篇6

博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。

博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。

2.博弈论的基本原理和方法

文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述

G={P,A,S,I,U}

P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。

A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。

S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。

I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。

U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。

还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。

不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。

3、博弈论与电力市场

博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。

正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。

博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。

博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。

4、博弈论在电力市场中的应用

4.1自备电厂与公用电网之间的交易

开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。

文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。

文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。

4.2区域间输电交易分析

互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。

4.3转运市场中电网的固定成本分摊问题

运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。

4.4基于Pool或PX模式的多边贸易市场

电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。

在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。

文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。

该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。

对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。

4.5用博弈论解释和实现算法

文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。

作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。

鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。

用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。

篇7

[关键词]进化 博弈 文献综述

一、进化博弈的基本理论

进化博弈论的研究起源于生物学领域,其目的是为了解决动物和植物的冲突及合作,为达尔文的自然选择过程提供数理基础。进化博弈理论结合经典博弈理论及生态理论研究成果,以有限理性的参与人群体为研究对象,利用动态分析方法把影响参与人行为的各种因素纳入其模型之中,并以系统论的观点来考察群体行为的进化趋势。正是基于其在生物物种与种群的竞争进化演变规律分析中的成功,众多学者纷纷将其概念和前提加以修正,将其广泛应用于经济领域、社会领域来解释并预测人的群体决策行为。

二、进化博弈理论的应用研究

1.社会行为领域

Conlisk利用带滞后项及随机项的离散时间动态来分析参与人是否总是行为的最优者。它假定有“最优化”及“模仿”两个纯策略,其中非最优化者有一个二次损失函数,在此基础上,他寻求一个满足非最优化者损失函数等于最优化者正的常数成本的均衡群体比率,从而得出结论:当群体中几乎都是最优化者时,模仿比最优化策略更合算,因此,群体中非最优化者在群体中最优化者所占比例并不渐进地收敛于1。Peyton Young认为现实中每个参与人都是在前人给定的经验知识基础上选择策略,个人选择策略是一个适应性的学习过程。个体在做出选择时,尽管参与人存在一定的惯性及犯错误的可能性,经过行为的长期进化,这个适应性学习过程也会收敛于一个有效率的传统或合约。Sandholm对个体行为偏好的进化进行了动态分析。Juang从进化的视角研究了规则的进化与均衡的选择问题。Nyborg和Rege探讨了有关吸烟行为的社会规范的深化,并运用挪威的经验数据对结论进行了检验。

2.制度的演化

青木昌彦等运用进化博弈理论分析了社会经济体制的变迁。他们认为:任何一种经济体制的产生都具有一定的惯性,并随着经济所处的外部环境与所积累的内部环境的变化一起逐渐地进化。吴炯、彭飞以进化博弈的复制动态方法为工具解释了公司治理结构演进过程中的“两极化”现象。邱中华等通过演化博弈模型考察委托人和人在委托过程中行为策略的自发演化过程,发现这一博弈过程的所有均衡都是鞍点,从而得出委托人和人之间的监察博弈没有进化稳定策略。Kandori和Rafael运用进化博弈理论研究了两种具有网络外部性的技术之间竞争的博弈过程,提出了解决“花车效应”问题的对策,论证了后发技术取代主导技术的可能性。

3.经济行为的演化

Routledge基于Grossman和Stiglitz提出的经济模型,探讨了金融市场上个体行为人是如何通过适应性和进化学习来发现内生变化并运用这种内生关系的一种学习模型。他通过模仿过程和经验过程来对个体的投资行为建模,而不是运用传统上的显性最优化方法放松关于知识和理性的假设。Cowen和Kroszner利用进化博弈理论研究了在自由竞争易货贸易经济中,在存在交易成本的情况下,交易媒介的选择问题。罗发友等对集群内企业技术创新行为构建了鹰鸽博弈、鹰鸽反击者博弈和鹰鸽应变者博弈三个模型,并得出集群内企业创新行为不存在纯策略进化稳定均衡,但存在混合策略进化稳定均衡和行为策略进化稳定均衡,反映了集群内企业创新行为的协同竞争性以及这种协同竞争创新行为的进化稳定特性。

三、借鉴意义

1.进化博弈论从有限理性人出发,强调系统达到均衡的过程而非均衡本身。进化博弈理论是完全摒弃传统理论中非现实的“理性人”假设,直接从有限理性参与人群体出发而提出的一种全新的动态分析方法,该方法认为经济系统达到均衡需要一个长期的渐进过程,均衡结果依赖于达到均衡的过程。

2.进化博弈论纳入了系统到达均衡的时间因素,有利于决策者控制系统向目标的进化。进化博弈理论的动态分析方法中一个显著特征就是把参与人的决策过程时间及因素互动的时间纳入到其基本模型之中,强调系统达到均衡的过程。这样有利于决策者控制经济系统使之朝向既定的目标前进,也有利于决策者寻找能够最大限度地促进系统向意愿均衡转化的因素,使系统尽快达到有效率的均衡。

3.进化博弈理论引入突变因素较好的解决了多重均衡的选择问题,即系统最终会趋于哪一个均衡依赖于系统的初始状态。进化博弈理论的基本均衡概念――进化稳定均衡,描述了当经济系统一旦进入到某一均衡的吸引域内,系统就会对其他的突变策略具有一定程度的抵抗力。

参考文献:

[1] J. Conlisk. Costly Optimizers Versus Cheap Imitators. Journal of Economic Behavior and Organization. 1980 (1)

[2]H. P. Young. Individual Learning and Social Rational. European Economic Review. 1998

[3] 青木昌彦 奥野正宽:经济体制的比较制度分析.中国发展出版社,1999

[4]邱中华 金翔:基于进化博弈论研究的一类监察博弈. 南京邮电大学学报(自然科学版),2006,26

篇8

在永久心脏起搏器术后可能会出现一些并发症。这是患者最担心又最缺乏知识的一部份,如何让患者了解并预防这些并发症,最大限度地降低各种伤害,是医学护理人员必须掌握并向患者宣教的保健知识。现将永久性性心脏起搏器术后医学护理措施介绍如下:

1临床资料与方法

1.1一般资料

我科2009年6月—2011年5月共安置起搏器31例,其中男18例,女13例,年龄最小21岁,最大77岁,平均年龄54.3岁;文化程度:文盲2例,高中以下学历例17例,大专学历8例,本科以上学历4例;其中病态窦房结综合征12例,Ⅱ度房室传导阻滞15例,Ⅲ度房室传导阻滞4例;病史最短5个月,最长17年,平均4.7年。

1.2方法

1.2.1起搏器介绍

采用的起搏器类型:其中R波抑制型心室起搏器(VVI)16例,全自动型起搏器(DDD)9例,P波抑制型心房起搏器(AAI)2例,频率应答心房同步心室抑制型起搏器(VDDR)1例,频率应答R波抑制型心室起搏器(VVIR)1例,频率应答全自动型起搏器(DDDR)1例,心房同步心室抑制型起搏器(VDD)1例。安置永久性起搏器静脉选用:其中头静脉19例,锁骨下静脉7例,其他静脉5例。

1.2.2永久性性心脏起搏器术后医学护理措施

1.2.2.1心理医学护理

久性性心脏起搏器术后的患者最担心的就是术后并发症的发生和起搏器故障停止工作。针对这种情况要做好病人的心理安慰,用通俗易懂的语言向患者耐心地讲解永久性起搏器的工作原理,起搏器的常见故障的表现和处理措施,术后并发症的表现和处理措施,让患者能科学、正确的看待永久性性心脏起搏器植入术,能以积极、乐观的态度积极配合医务人员。

1.2.2.2加强监测,观察生命体征及起搏器工作情况

久性性心脏起搏器术后严密监测患者的体温、呼吸、脉搏、血压和意识状态变化,尤其要注意监测心电图的变化。同时要观察起搏器工作情况,做到故障早发现,早处理,尽量把对患者的影响降到最小。

1.2.2.3久性性心脏起搏器术后并发症的医学护理

1.2.2.3.1久性性心脏起搏器术后24h内禁止翻身,绝对卧床。术后7天内患侧肢体制动,并注意观察,及时发现患者的异常情况,并给予积极处理,如患者出现肩部肌肉抽动,可能为导线脱离,此时应立即给予处理。在术后进行功能锻炼时要遵循循序渐进的原则,避免剧烈过激的动作。指导患者发现有敷料脱落或碰湿要及时更换;不穿过紧的内衣,保持局部皮肤清洁,出现局部红肿痛,甚至皮肤溃破,应积极给予处理[2】。

1.2.2.3.3.2术后教会患者自探脉搏监测脉搏应该在同一种身体状态下进行。监测脉搏应该坚持,尤其在安置初期及电池寿命将至时,初期探测脉搏可了解起搏情况,末期探测则可及早发现电池剩余能量。一般来说,每日正确探测脉搏,连续7天以上,每日脉搏比以前少7次或以上,应及时处理。

1.2.2.3.3.3一般在久性性心脏起搏器术后头晕乏力等症状会随之改善或消失,但术后如果这些症状仍持续存在,尤其是发生在心室起搏的患者身上,应确诊是否为人工心脏起搏器综合症[3]。一旦确诊症状明显则需要更换房室顺序或心房同步起搏器。安置起搏器术后是否应该继续服药取决于患者原有疾病的病情发展。如果患者原来伴有其他心脏疾患或心功能较差,应该坚持服药,这样可以降低起搏器本身对心功能的影响。

1.2.2.3.3.4应说服患者,消除其顾虑,在术后早期进行功能锻炼,这样有利于局部血液循环,有利于切口愈合。功能锻炼应该在拆线后即可进行,锻炼应遵循循序渐进的原则。早期功能锻炼可能会有轻微的切口疼痛,这属正常现象,叮嘱患者在出院回家后仍应坚持下去。

1.2.2..4饮食医学护理

保持良好的生活规律、心情开朗、保持情绪稳定,同时要戒掉烟酒,吃饭不宜过饱[4]。应予易消化、高维生素、高蛋白、粗纤维素的低脂饮食,避免食入产气食物,防止便秘。

1.2.2.5出院指导

1.2.2.5.1随身携带起搏器担保卡担保卡上有您的姓名、地址、电话、心脏起搏器型号、起搏方式、起搏频率、植入日期及手术医生联系方式等,如遇到紧急情况时便于别人帮助。术后早期您不能做过量的体力活动,以感觉舒服、不过度疲劳为限制[5]。如散步、骑自行车、游泳、轻微的家务劳动。避免剧烈运动和用患侧肢体做暴力活动,以免猛烈拉动导线,造成导线折断。洗澡水温不要太高或时间不要太长,以免引起心跳加快。术前没有其他器质性疾病的患者,术后可胜任一般的工作。但有些磁场大的环境可能会干扰起搏器的正常工作,如感到轻微的发热或心跳加速,请立即将设备关闭,心脏起搏器即可恢复正常工作。

1.2.2.5.2电吹风及电剃须刀不会影响心脏起搏器,但不要频繁地起闭开关,更不能放置于心脏起搏器之上。电烤箱、吸尘器、电熨斗、电风扇、电视机、电冰箱、洗衣机、食品加工器等也不会影响心脏起搏器,但要确保无漏电,以免有触电危险。在使用电磁炉和老式微波炉时应保持1米的距离,以免电磁辐射干扰心脏起搏器工作。不要把移动电话放在心脏起搏器同侧衣袋内通话时应尽量用心脏起搏器对侧的耳朵通话,与心脏起搏器的距离应保持在15cm之外,避免话机对心脏起搏器造成影响。避免接近强磁场和强电场、电台、电视发射站、雷达探测站、发电机、变压器等均有强磁场和强电场,应绝对禁止接近。安装心脏起搏器后患者可以乘坐飞机,只要在机场向安检员出示起搏器识别卡,就不需要再从金属探测器走过,可以安全过关。

1.2.2.5.3每天起床后立即触摸检查自己的脉搏。每次数1分钟,如白天检查应先静坐5分钟后使心率慢下来,再触摸脉搏。活动后自身脉率可能较心脏起搏器基础频率增高。如脉率低于起搏器基础频率,应及时与医生取得联系。

1.2.2.5.4在安装心脏起搏器术后必须长期观察和随访,这样对健康和生命才有保障。出院后半年内每1-3个月,到医院随访一次测起搏器功能,情况稳定后每半年随访1次。接近起搏器使用年限,应缩短随访时间。

2结果

31例患者中有2例出现并发症,其中1例出现心律失常、1例出现皮肤感染。1例心律失常是由于电极移位造成的,1例出现皮肤感染是由于患者高龄皮下组织菲薄合并有糖尿病导致的。2例并发症经过积极处理后都痊愈出院。

3讨论

随着电子信息技术的发展和医学的不断进步,一系列高科技成果应用于心脏起搏工程,起搏器技术不断更新,作为起搏器中的一种——永久性性心脏起搏器临床上主要用于所有需长时间起搏的缓慢性心律失常病人。永久心脏起搏器植入已成为一种常规治疗技术,现在越来越多的患者接受了这一治疗手段。

永久性心脏起搏器术后常见并发症:(1)心律失常:心律失常特别容易发生于安置久性性心脏起搏器的早期,常见原因多是由于起搏器故障、心内膜感染、电极移位等。由于心脏起搏器受外界电磁场干扰而出现心室或心房触发型起搏器误被外界信号触发而引起心动过速。(2)电极移位及导线断裂:电极移位及导线断裂多发生于久性性心脏起搏器术后七天内,其中术后第一天最容易发生。原因常见于改变、电极在心腔内张力过大、右心室过大、活动牵拉等。另外由于人在行走时上肢经常做摆动动作,这样可能会导致导线绝缘层破损或导线断裂,局部漏电,使心脏起搏器起搏失效。(3)起搏阈值增高:安置久性性心脏起搏器术后7—14天阈值可增高2倍左右,四周后可稳定在初始阈值的2倍,称生理性阈值升高。若在此期后阈值仍很高,则多为不正常,原因常见于电极与心内膜接触不良和电极位置不佳。(4)感染及皮肤坏死:全身感染比较少见,局部感染多由于瘦弱及高龄病人因皮下组织菲薄,起搏器磨破皮肤而感染,或是由于埋藏囊腔脓肿形成、炎症感染、积血引起。皮肤坏死多发生于消瘦的病人,且多发生在术后早期。原因多由于皮囊张力扩大,起搏器系统埋藏过浅引起。(5)起搏系统故障:起搏系统连接故障、电池不足、绝缘损害、线路不良、电极移位等故障,都会引起起搏失效或心律失常。(6)心功能减退:永久性心脏起搏器术后的患者如果本身就心功能比较差,安装起搏器只能解决心脏传导的问题,而无法解决心功能的问题,同时还会引起心功能减退进一步加重的可能。(7)人工心脏起搏器综合症:永久性心脏起搏器术后的患者可能会出现人工心脏起搏器综合症,见于心室起搏的患者,由于房室收缩不同步,患者出现头胀、心慌、头昏、血管搏动等症状。(8)肢体功能障碍:久性性心脏起搏器术后的患者由于切口处疼痛或对起搏器不习惯等原因,患者多过度约束肢体活动,久之会引起关节韧带粘连,肌肉废用性萎缩,从而导致肢体功能障碍。