关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 2 n' N. G7 w6 q
! X# G( r" _2 p) w1 t
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' V7 Y( U+ h( [, {% y
  以下三个定义:- F* L- D' R7 _
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( u( k' u. c" ^: a+ [* H/ R
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! K( x8 @4 z; I8 J  所谓的双方优势策略则是指双方利益总和最大的策略。  
- L# y+ }' q# r0 S# _& n: d; V( s[编辑本段]严格优势策略举例分析0 l% _2 z" U. T: j3 j5 H% q" ~
  一、经典的囚徒困境 - t) [! O% _  n0 p0 o
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
* I6 ?  {# a+ A. R! F3 _' Y  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% Q7 s6 ~1 M( I6 i& O  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 s/ ]/ M3 L* M8 m  \& G
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& U; N, k; R, v" |: B% y6 u9 B: Y  若二人都互相检举(互相“背叛”),则二人同样判监2年。0 i" u% S5 k' }7 D% R! U
  + |/ {) I, a, Z& ]
用表格概述如下:
  y# k% v7 _5 A5 y
% ?" B+ D: k. F' Z, |, u/ u( M    甲沉默(合作)  甲认罪(背叛)  
. q, C" @( N& b7 H  c1 M乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
6 e2 D( f+ V. O$ \) |乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
" u! R7 e5 l+ S" N% F* ]7 j4 b/ u: P( c% \& d8 e) p0 d
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 g: Z9 y5 B) I$ D7 f6 p
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( f" k% Z- @) {4 t- O7 v0 n* n
  若对方沉默、背叛会让我获释,所以会选择背叛。 + _  E( V4 x0 E8 m! Q9 d/ I4 U( S, q% }
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ {9 P3 o  ^- D, Z
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) Y( w# b; \6 W3 E, z  P6 J: F
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. ?2 D. u5 U3 t2 L  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( @4 U) G& g( l& f5 Q: b
[编辑本段]二、智猪博弈理论
+ ~6 V$ W) f5 ]! h  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! c9 I* m$ \  V/ A
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 J( Q0 t' W9 C. `5 p  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% \: e% P7 G8 y  C. a  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& t, j# X$ s3 P9 W- q  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。   [! i1 W# ?* |
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
# p( n( z' r. R+ p* y7 Y: v% U; r  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 z# \$ R) B5 h( ?$ ~6 T
  
: A4 n  o6 j5 Z三、关于企业价格策略; I; j9 ?* |9 A# x
- j0 M) z, X& k
  . A+ k7 G: ]/ V2 d
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* E9 D1 p) L8 K. h  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 _3 T% I% E$ N
  以下三个定义:+ M0 B1 h) P5 Y, @
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 A7 d) ~! W0 ^' B: t% H& d2 B  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# I7 |0 @7 Z6 b  所谓的双方优势策略则是指双方利益总和最大的策略。  
7 k* O" e+ T: O[编辑本段]严格优势策略举例分析/ f& m$ s! e9 B& |: E0 u! R
  一、经典的囚徒困境 % s3 Y6 r* z/ i9 r, {" ^2 V; c
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " x, o; f3 ]' l5 Q" t0 D
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : {. P4 }- k1 B; q8 L. ]/ \- C4 }+ w
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 [$ ^4 {6 A+ x
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 % I  E, t9 Y" S$ G6 b& ]
  若二人都互相检举(互相“背叛”),则二人同样判监2年。" r+ ~! }. R% j7 b# @5 ^! O
  
* F0 @2 z$ O! D9 `2 r用表格概述如下:0 _8 v( E8 b# L2 R# q* B

' I3 H! W. \% A& y& A    甲沉默(合作)  甲认罪(背叛)  & o2 r' n) ?+ N9 a8 n
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ) R: P9 c# T0 ~8 Z5 a( e
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
4 e' v/ c* M( N* h7 [. A, H6 l* O/ N1 Z1 l& v, H4 ^
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 x8 G5 [+ R8 s# t# }  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 9 ?8 Q" x/ ~* [$ B$ l% z( Q0 d
  若对方沉默、背叛会让我获释,所以会选择背叛。 $ ^* I& J% Y. g8 y- e, _* S. H. |
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 ~6 s% a; x- L8 y
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 s4 ]9 g1 `" s' |$ x
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 W) f* u9 y& y" H/ @4 P9 ?  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, a+ a* K) c+ P; }: ]9 |
[编辑本段]二、智猪博弈理论
6 D* m! P& G/ v3 ~6 i# G* N  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; |! C' `- b6 h% m0 d
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- O( c+ T  `" ?8 q, d  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % ]$ E( N- ~' v9 t+ o9 J
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! \# i! l8 W  i  r; Y% B' x5 h( F/ ^  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ g6 Z3 H! c; X
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 \5 \2 `! y- h1 z2 ~4 U) C3 t
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! K2 G0 @: j- O9 o4 ^
  
+ j$ m9 B6 U- J- a9 n4 X  k4 i/ N三、关于企业价格策略# W. }# A4 l! }9 Z1 P+ N9 J1 C

. m  n* s: t# F5 u5 O: K' E  - S' i4 e& @7 W5 s- m
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* z$ j! C& {& _6 Q0 H9 H) t. ]" q  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& W$ m, @4 q  N) f9 a" c  以下三个定义:, h# `! z" J% C  C# I) L* _
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' x; I- R* |, d2 `7 \
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' w5 Y. @8 m& f, c( q% @/ N6 j. S
  所谓的双方优势策略则是指双方利益总和最大的策略。  # ]# x6 P5 \/ g' u4 g) a; Q8 c
[编辑本段]严格优势策略举例分析
9 ~, ^9 s$ {# F5 L6 q  一、经典的囚徒困境 ( z" D' m# R! }
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & {, |9 a+ {8 `' }" `
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( A9 X- m" b) a  V% O' H  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 m8 c6 A& T& P! I% m$ d7 @$ z9 @
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! p$ s" }, ]: v+ q  o( H
  若二人都互相检举(互相“背叛”),则二人同样判监2年。1 ]4 ?( H9 \( X- D
  
( y5 E/ @! @0 M% a0 k- ?用表格概述如下:
" W- B" f" l9 W' r$ ]/ o
6 ]: W# ^; E6 `$ ?$ ?% m* O6 N    甲沉默(合作)  甲认罪(背叛)  ! G! o( x! `/ a4 W: C' n, ^
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
2 B" p  P& s( T* M+ [乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年    Q8 {3 W& x* u% j1 d% E
. X$ K: Z& D/ i2 S
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) z- a+ ]& X: c. g. o' p
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" Z8 Z  F4 C- ~* [+ z2 C1 r. q  若对方沉默、背叛会让我获释,所以会选择背叛。
2 k7 I2 u1 Z! x$ a* a0 s  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) u  v! o- z! h9 _
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# \1 T4 F  d8 L' Q5 o  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ ?  J% p$ n( o  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* z1 f! t7 z* H- J8 E[编辑本段]二、智猪博弈理论) M1 F, E* T5 P4 F6 j7 d! B: p
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% S4 y8 m" V; _7 L# b: H; w  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 N, q4 F  W. c7 ~+ r0 B* G
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 K( h' X9 v8 l- Q+ N" c% Q
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
  `( m" r2 m/ A* x: b* R  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; j; j0 g- N+ N, [  F- V
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 s. c, T0 m$ ~: D0 B7 i; \# y
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# m! m$ l% e& \: r  
) D" z( d9 d+ s- i6 [' I三、关于企业价格策略
% o4 p" o( }+ Q# a+ Y8 m# S3 d
+ s4 l9 e9 a  E% `  Y  ' u+ M9 r6 u9 B  Z. j
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 e# E3 r- p; Q' S0 ]
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. u, n7 G' u) W7 Y
  以下三个定义:
2 ^$ z3 i; D* Z% J, [4 x& x0 ^  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
  D4 n8 t& m# s/ k& J  j  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% ]* }; S+ o; b- U  所谓的双方优势策略则是指双方利益总和最大的策略。  
$ T) e% {1 j" _9 Z. _( q* J[编辑本段]严格优势策略举例分析( P  ~0 U, G/ _# Q% ^' m) o
  一、经典的囚徒困境
. @' ?8 h" Z, D2 i8 {# k2 S5 i  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 K) X- H8 X3 z+ V$ d  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
- g" }$ V3 @9 ?- U  ]) U8 x! x  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 F9 ?/ i6 y9 G9 `7 j  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
  ]  n/ k* D+ F% M  若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 Q- l4 E1 h3 U: s  
! \' W3 r5 u% N, F( B用表格概述如下:9 v) \7 n& j) G! M/ }, E4 Y9 f

* y. U: P) P) I    甲沉默(合作)  甲认罪(背叛)  & b4 R: V& b- x+ U
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
+ ^9 X. i& V0 |& I* P5 u乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
$ x5 y# M  }& R
& J# Z( t" c& ?; E- j  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; q) _+ M; P* K0 r
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" E; i$ {0 `; p8 @  若对方沉默、背叛会让我获释,所以会选择背叛。
( Q; S3 H; a$ ]$ ~, g  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + i/ z( `  l' l+ G/ ?, _
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. _. N7 k) g# _  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; q% V8 K; \4 L; g4 d  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" P! U3 W; A2 b  M5 ^[编辑本段]二、智猪博弈理论& u. [& ?* ^: T& h! b3 O
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 s; K8 \( l$ r  H. y  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # \: B8 a3 g  @& i9 d. L4 R5 g
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 * d8 u. r# w1 l1 F  h
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。   Q/ q! u+ P: D/ J  f& ]$ k  V
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 ?& U' R& B- E2 M7 Y, c" R1 r$ O  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ `2 U; S. F# B, x2 w4 B) p  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 w) k* N3 ]2 \5 l3 g5 F
  ; A. g% }, M4 U& ?- t' m
三、关于企业价格策略& X% P5 v# R8 \3 V/ ~7 P

& l1 u+ a8 {) u9 M$ t8 o  
& b9 {' F' ?- n; q  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' {3 {7 s6 p/ D- }
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )