本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 2 n' N. G7 w6 q
! X# G( r" _2 p) w1 t
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);' V7 Y( U+ h( [, {% y
以下三个定义:- F* L- D' R7 _
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ( u( k' u. c" ^: a+ [* H/ R
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
! K( x8 @4 z; I8 J 所谓的双方优势策略则是指双方利益总和最大的策略。
- L# y+ }' q# r0 S# _& n: d; V( s[编辑本段]严格优势策略举例分析0 l% _2 z" U. T: j3 j5 H% q" ~
一、经典的囚徒困境 - t) [! O% _ n0 p0 o
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
* I6 ? {# a+ A. R! F3 _' Y 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
% Q7 s6 ~1 M( I6 i& O 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 2 s/ ]/ M3 L* M8 m \& G
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
& U; N, k; R, v" |: B% y6 u9 B: Y 若二人都互相检举(互相“背叛”),则二人同样判监2年。0 i" u% S5 k' }7 D% R! U
+ |/ {) I, a, Z& ]
用表格概述如下:
y# k% v7 _5 A5 y
% ?" B+ D: k. F' Z, |, u/ u( M 甲沉默(合作) 甲认罪(背叛)
. q, C" @( N& b7 H c1 M乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
6 e2 D( f+ V. O$ \) |乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" u! R7 e5 l+ S" N% F* ]7 j4 b/ u: P( c% \& d8 e) p0 d
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 8 g: Z9 y5 B) I$ D7 f6 p
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( f" k% Z- @) {4 t- O7 v0 n* n
若对方沉默、背叛会让我获释,所以会选择背叛。 + _ E( V4 x0 E8 m! Q9 d/ I4 U( S, q% }
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 $ {9 P3 o ^- D, Z
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ) Y( w# b; \6 W3 E, z P6 J: F
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
. ?2 D. u5 U3 t2 L 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。( @4 U) G& g( l& f5 Q: b
[编辑本段]二、智猪博弈理论
+ ~6 V$ W) f5 ]! h 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! c9 I* m$ \ V/ A
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
8 J( Q0 t' W9 C. `5 p 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
% \: e% P7 G8 y C. a 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
& t, j# X$ s3 P9 W- q “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 [! i1 W# ?* |
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
# p( n( z' r. R+ p* y7 Y: v% U; r 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。8 z# \$ R) B5 h( ?$ ~6 T
: A4 n o6 j5 Z三、关于企业价格策略; I; j9 ?* |9 A# x
- j0 M) z, X& k
. A+ k7 G: ]/ V2 d
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* E9 D1 p) L8 K. h 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);9 _3 T% I% E$ N
以下三个定义:+ M0 B1 h) P5 Y, @
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
7 A7 d) ~! W0 ^' B: t% H& d2 B 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
# I7 |0 @7 Z6 b 所谓的双方优势策略则是指双方利益总和最大的策略。
7 k* O" e+ T: O[编辑本段]严格优势策略举例分析/ f& m$ s! e9 B& |: E0 u! R
一、经典的囚徒困境 % s3 Y6 r* z/ i9 r, {" ^2 V; c
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: " x, o; f3 ]' l5 Q" t0 D
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: : {. P4 }- k1 B; q8 L. ]/ \- C4 }+ w
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 7 [$ ^4 {6 A+ x
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 % I E, t9 Y" S$ G6 b& ]
若二人都互相检举(互相“背叛”),则二人同样判监2年。" r+ ~! }. R% j7 b# @5 ^! O
* F0 @2 z$ O! D9 `2 r用表格概述如下:0 _8 v( E8 b# L2 R# q* B
' I3 H! W. \% A& y& A 甲沉默(合作) 甲认罪(背叛) & o2 r' n) ?+ N9 a8 n
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 ) R: P9 c# T0 ~8 Z5 a( e
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
4 e' v/ c* M( N* h7 [. A, H6 l* O/ N1 Z1 l& v, H4 ^
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
9 x8 G5 [+ R8 s# t# } 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 9 ?8 Q" x/ ~* [$ B$ l% z( Q0 d
若对方沉默、背叛会让我获释,所以会选择背叛。 $ ^* I& J% Y. g8 y- e, _* S. H. |
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 ~6 s% a; x- L8 y
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 s4 ]9 g1 `" s' |$ x
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 W) f* u9 y& y" H/ @4 P9 ? 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。, a+ a* K) c+ P; }: ]9 |
[编辑本段]二、智猪博弈理论
6 D* m! P& G/ v3 ~6 i# G* N 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; |! C' `- b6 h% m0 d
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
- O( c+ T `" ?8 q, d 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 % ]$ E( N- ~' v9 t+ o9 J
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! \# i! l8 W i r; Y% B' x5 h( F/ ^ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 $ g6 Z3 H! c; X
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 6 \5 \2 `! y- h1 z2 ~4 U) C3 t
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! K2 G0 @: j- O9 o4 ^
+ j$ m9 B6 U- J- a9 n4 X k4 i/ N三、关于企业价格策略# W. }# A4 l! }9 Z1 P+ N9 J1 C
. m n* s: t# F5 u5 O: K' E - S' i4 e& @7 W5 s- m
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
* z$ j! C& {& _6 Q0 H9 H) t. ]" q 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
& W$ m, @4 q N) f9 a" c 以下三个定义:, h# `! z" J% C C# I) L* _
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' x; I- R* |, d2 `7 \
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ' w5 Y. @8 m& f, c( q% @/ N6 j. S
所谓的双方优势策略则是指双方利益总和最大的策略。 # ]# x6 P5 \/ g' u4 g) a; Q8 c
[编辑本段]严格优势策略举例分析
9 ~, ^9 s$ {# F5 L6 q 一、经典的囚徒困境 ( z" D' m# R! }
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: & {, |9 a+ {8 `' }" `
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
( A9 X- m" b) a V% O' H 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 9 m8 c6 A& T& P! I% m$ d7 @$ z9 @
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ! p$ s" }, ]: v+ q o( H
若二人都互相检举(互相“背叛”),则二人同样判监2年。1 ]4 ?( H9 \( X- D
( y5 E/ @! @0 M% a0 k- ?用表格概述如下:
" W- B" f" l9 W' r$ ]/ o
6 ]: W# ^; E6 `$ ?$ ?% m* O6 N 甲沉默(合作) 甲认罪(背叛) ! G! o( x! `/ a4 W: C' n, ^
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
2 B" p P& s( T* M+ [乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 Q8 {3 W& x* u% j1 d% E
. X$ K: Z& D/ i2 S
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) z- a+ ]& X: c. g. o' p
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" Z8 Z F4 C- ~* [+ z2 C1 r. q 若对方沉默、背叛会让我获释,所以会选择背叛。
2 k7 I2 u1 Z! x$ a* a0 s 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ) u v! o- z! h9 _
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
# \1 T4 F d8 L' Q5 o 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
+ ? J% p$ n( o 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* z1 f! t7 z* H- J8 E[编辑本段]二、智猪博弈理论) M1 F, E* T5 P4 F6 j7 d! B: p
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
% S4 y8 m" V; _7 L# b: H; w 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 9 N, q4 F W. c7 ~+ r0 B* G
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 K( h' X9 v8 l- Q+ N" c% Q
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
`( m" r2 m/ A* x: b* R “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ; j; j0 g- N+ N, [ F- V
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 s. c, T0 m$ ~: D0 B7 i; \# y
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
# m! m$ l% e& \: r
) D" z( d9 d+ s- i6 [' I三、关于企业价格策略
% o4 p" o( }+ Q# a+ Y8 m# S3 d
+ s4 l9 e9 a E% ` Y ' u+ M9 r6 u9 B Z. j
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 8 e# E3 r- p; Q' S0 ]
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);. u, n7 G' u) W7 Y
以下三个定义:
2 ^$ z3 i; D* Z% J, [4 x& x0 ^ 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
D4 n8 t& m# s/ k& J j 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
% ]* }; S+ o; b- U 所谓的双方优势策略则是指双方利益总和最大的策略。
$ T) e% {1 j" _9 Z. _( q* J[编辑本段]严格优势策略举例分析( P ~0 U, G/ _# Q% ^' m) o
一、经典的囚徒困境
. @' ?8 h" Z, D2 i8 {# k2 S5 i 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
9 K) X- H8 X3 z+ V$ d 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
- g" }$ V3 @9 ?- U ]) U8 x! x 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 F9 ?/ i6 y9 G9 `7 j 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
] n/ k* D+ F% M 若二人都互相检举(互相“背叛”),则二人同样判监2年。
9 Q- l4 E1 h3 U: s
! \' W3 r5 u% N, F( B用表格概述如下:9 v) \7 n& j) G! M/ }, E4 Y9 f
* y. U: P) P) I 甲沉默(合作) 甲认罪(背叛) & b4 R: V& b- x+ U
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年
+ ^9 X. i& V0 |& I* P5 u乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
$ x5 y# M }& R
& J# Z( t" c& ?; E- j 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ; q) _+ M; P* K0 r
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
" E; i$ {0 `; p8 @ 若对方沉默、背叛会让我获释,所以会选择背叛。
( Q; S3 H; a$ ]$ ~, g 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 + i/ z( ` l' l+ G/ ?, _
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
. _. N7 k) g# _ 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
; q% V8 K; \4 L; g4 d 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
" P! U3 W; A2 b M5 ^[编辑本段]二、智猪博弈理论& u. [& ?* ^: T& h! b3 O
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
6 s; K8 \( l$ r H. y 该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 # \: B8 a3 g @& i9 d. L4 R5 g
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 * d8 u. r# w1 l1 F h
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 Q/ q! u+ P: D/ J f& ]$ k V
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 ?& U' R& B- E2 M7 Y, c" R1 r$ O 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
+ `2 U; S. F# B, x2 w4 B) p 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。4 w) k* N3 ]2 \5 l3 g5 F
; A. g% }, M4 U& ?- t' m
三、关于企业价格策略& X% P5 v# R8 \3 V/ ~7 P
& l1 u+ a8 {) u9 M$ t8 o
& b9 {' F' ?- n; q 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? ' {3 {7 s6 p/ D- }
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |